電子所務圖書館網站地圖所長信箱English中國科學院
 
首頁機構概況科研成果研究隊伍國際交流科技合作研究生教育創新文化黨群園地科學傳播信息公開
  綜合新聞  
  圖片新聞  
  科研動態  
  學術活動  
  媒體報道  
您現在的位置:首頁 > 新聞動態 > 科研動態
一種基于獨立成分分析的低複雜度盲源分離方法
2019/11/28 | 作者:中科院噪声与振动重点实验室 康坊 | 【 【打印】【關閉】

  在電話通信、智能交互等應用場景中,目標說話人的語音信號通常會受到噪聲或其他說話人幹擾,從而影響語音質量和語音識別率,這就是著名的“雞尾酒會問題”。有效解決這個問題的方法之一是通過盲源分離從僅有的混合觀測信號中分離出原始聲源,但此計算方法複雜度高,給實際應用帶來了較大的困難。

  为降低盲源分离方法的计算复杂度,中科院噪声与振动重点实验室的康坊与其导师杨飞然研究员、杨军研究员提出了一種基于獨立成分分析的低複雜度盲源分離方法,在保证分离性能不受影响的情况下,极大地降低了计算复杂度。

  相關研究成果近期發表于國際學術期刊 Speech Communication

  人們將獨立成分分析應用于每一個頻點的混合信號進行聲源分離。獨立成分分析方法固有的順序模糊性導致頻間信號順序混疊,分離後的信號需要進行順序調整,但複雜的排序機制極大地增加了整體的計算複雜度。

  本工作中,研究人員利用聲源自身存在的頻間依賴性,對不同頻率間的分離信號做相關性分析來解決順序模糊性問題。首先采用非叠代的方法對分離信號進行相鄰頻點排序,爲防止錯排結果傳播,對可信度低的頻點參照局部中心點進行順序調整。局部排序的結果爲全局聚類校正提供一個較優的初始化,僅需少量的叠代次數便可達到收斂效果。

  實驗結果表明,本方法的計算複雜度要遠低于具有相同分離性能的其他分離方法。

  這種低複雜度的盲源分離方法可用于語音交互、電話通信以及助聽器設備等應用場景,提高語音質量和語音可懂度。

  本研究得到國家重點研發計劃(項目編2017YFC0804900),中國科學院青年创新促进会(2018027),中國科學院声学研究所青年英才计划项目(QNYC201812)和中國科學院先导专项项目(XDC02020400)資助。

  

  圖1 計算複雜度對比(圖/中科院聲學所)

  

  圖2 不同混響時間下的分離性能對比(左)平均輸出信幹比與(右)平均PESQ得分(圖/中科院聲學所)

  關鍵詞:

  頻域盲源分離;順序模糊性問題;局部排序;全局校正;計算複雜度

  參考文獻:

  KANG Fang, YANG Feiran, YANG Jun. A low-complexity permutation alignment method for frequency-domain blind source separation. Speech Communication. 2019, 115: 88-94. DOI: 10.1016/j.specom.2019.11.002.

  論文鏈接

  https://doi.org/10.1016/j.specom.2019.11.002

 
  相關新聞
Copyright 2003-2016 中國科學院声学所 版权所有 备案序号:京ICP備16057196號 京公網安備110402500001號
地址:北京市海淀区北四环西路21号中國科學院声学研究所  邮编:100190
E-mail:ioa@mail.ioa.ac.cn