智財技轉處 | 廣義最大事後頻譜震幅預估器之語音增強方法

:::

廣義最大事後頻譜震幅預估器之語音增強方法

更新時間： 2021-02-02 10:50:12

分享到：

廣義最大事後頻譜震幅預估器之語音增強方法

摘要

本發明提供一種廣義最大事後頻譜振幅預估器之語音增強方法，目的為將帶有雜訊的語音訊號去除雜訊部分，增強語音訊號品質。提出之方法先定義一代價函數(cost function)，代價函數中引入一比例因子(scaling factor)，此比例因子由語料的訊雜比(signal-to-noise ratio，SNR)動態決定；利用對此代價函數最佳化，得到一頻譜增益函數；將所決定之比例因子帶入增益函數可以得到一增益值，語音訊號之振幅與增益值相乘得到增益後之語音訊號振幅；結合增益後之語音訊號振幅與語音訊號相位部分，得到增強後的語音訊號。比例因子的決定方法，乃藉由訓練語料，找出在某一事後訊雜比(a posteriori SNR)下最佳的比例因子。對測試語料增強時，先求出該語料之事後訊雜比，進而得出最佳的比例因子。

技術優勢

相較於傳統的方法，所提出的廣義最大事後頻譜振幅預估器之語音增強方法在低訊雜比的情況下可得到較佳的語音增強效果，在高訊雜比的情況下亦可避免過多的失真量。

本院覽號

32A-1010907

智財權狀態

TW I517144

應用範圍

音訊增強、雜訊過濾器及助聽器等相關產品

創作人

曹昱、蘇煜程

聯絡人

對本技術有興趣，請於本處網頁廠商選項下(廠商需求與諮詢)網頁填寫資料，承辦人將跟您聯絡。

檔案下載

廣義最大事後頻譜震幅預估器之語音增強方法