人工智能與機(jī)器學(xué)習(xí)在聲學(xué)信號處理中的應(yīng)用
AI and Machine Learning in Acoustic Signal Processing
客座編輯:陳婧, 北京大學(xué)智能學(xué)院研究員、博士生導(dǎo)師;盧晶,南京大學(xué)聲科學(xué)與工程系副系主任、教授、博士生導(dǎo)師;錢彥,上海交通大學(xué)計算機(jī)科學(xué)與工程系教授,博士生導(dǎo)師;牛海強(qiáng),中國科學(xué)院聲學(xué)研究所研究員,博士生導(dǎo)師;Alan Hunter, 英國巴斯大學(xué)工程學(xué)院機(jī)械工程系副教授;Timothy Rogers,英國謝菲爾德大學(xué)高級講師
期刊名稱:npj Acoustics
截止日期:2025.10.3
客座編輯
陳婧, 北京大學(xué)智能學(xué)院研究員、博士生導(dǎo)師
陳婧于2009年獲北京大學(xué)智能科學(xué)系信號與信息處理專業(yè)博士學(xué)位。2009年到2012年,她在英國劍橋大學(xué)從事博士后研究。她于2013年加入北京大學(xué)智能科學(xué)系,任百人計劃研究員。她的主要研究領(lǐng)域包括聽覺和語音感知、聽覺計算模型、語音信號處理以及通過腦-機(jī)接口進(jìn)行語音神經(jīng)解碼。
盧晶,南京大學(xué)聲科學(xué)與工程系副系主任、教授、博士生導(dǎo)師
盧晶博士現(xiàn)任南京大學(xué)聲學(xué)研究所副系主任、教授和南京大學(xué)地平線智能音頻聯(lián)合實驗室主任。他是npj Acoustics的編委會成員,中國聲學(xué)學(xué)會常務(wù)理事,中國聲學(xué)學(xué)會/中國電子學(xué)會聲頻工程分會副主任委員,美國聲學(xué)學(xué)會(ASA)語音通信(Speech Communication)、信號處理(Signal Processing)和工程聲學(xué)(Engineering Acoustics)技術(shù)委員會委員。他曾十余次擔(dān)任聲學(xué)領(lǐng)域頂尖國際會議(ASA、ICA、InterNoise、ICSV)國際科學(xué)委員和分會主席。他的主要研究方向包括音頻信號處理、沉浸式音頻、聲學(xué)換能器以及音頻處理系統(tǒng)的實時實現(xiàn)。他主持了20多個政府和行業(yè)項目,并發(fā)表了300多篇期刊和會議論文,其中包括聲學(xué)領(lǐng)域頂刊美國聲學(xué)學(xué)報(J. Acoust. Soc. Am.)論文30余篇。他獲得授權(quán)發(fā)明專利超過40項,研究成果已在工業(yè)界得到廣泛應(yīng)用。
錢彥,上海交通大學(xué)計算機(jī)科學(xué)與工程系教授,博士生導(dǎo)師
錢彥博士于2007年獲得中國華中科技大學(xué)電子與信息工程系學(xué)士學(xué)位,并于2012年獲得中國北京清華大學(xué)電子工程系博士學(xué)位。自2013年以來,他一直在中國上海交通大學(xué)計算機(jī)科學(xué)與工程系工作,目前擔(dān)任全職教授。2015年至2016年,他在英國劍橋大學(xué)工程系擔(dān)任副研究員。他在語音和語言處理領(lǐng)域的同行評審期刊和會議上發(fā)表或共同發(fā)表了300多篇論文,包括T-ASLP、Speech Communication、ICASSP、INTERSPEECH和ASRU。申請80余項中美專利,6次帶隊獲得國際評測冠軍。他目前的研究興趣包括語音和音頻信號處理、自動語音識別和翻譯、說話人和語種識別、語音抗噪與分離、音樂生成與理解、語音情感感知、多模態(tài)和跨模態(tài)信息處理、自然語言理解、深度學(xué)習(xí)建模,多媒體信號處理等。他曾獲得中國多個頂級學(xué)術(shù)獎項,包括教育部長江學(xué)者計劃和國家優(yōu)秀青年基金。
牛海強(qiáng),中國科學(xué)院聲學(xué)研究所研究員,博士生導(dǎo)師
牛海強(qiáng)博士是中國科學(xué)院聲學(xué)研究所聲學(xué)國家重點實驗室的全職教授。他目前擔(dān)任《美國聲學(xué)學(xué)會期刊》(JASA)的副編輯。同時,他還是Chinese Physics Letters (CPL)、Chinese Physics B (CPB)、《物理學(xué)報》、《物理》的 四刊聯(lián)合青年編委、《聲學(xué)學(xué)報》青年編委。此外,他還是中國科學(xué)院青年創(chuàng)新促進(jìn)會的成員。2015年至2017年,他在美國加州大學(xué)圣地亞哥分校Scripps海洋研究所擔(dān)任博士后研究員。他于2018年成為副教授,并于2021年晉升為全職教授。他的研究興趣包括機(jī)器學(xué)習(xí)在海洋聲學(xué)中的應(yīng)用、稀疏貝葉斯學(xué)習(xí)在聲學(xué)信號處理中的應(yīng)用、地聲反演和海洋聲學(xué)層析成像。
Alan Hunter, 英國巴斯大學(xué)工程學(xué)院機(jī)械工程系副教授
Alan Hunter 博士于2001年和2006年分別獲得新西蘭坎特伯雷大學(xué)的電氣與電子工程榮譽(yù)學(xué)士學(xué)位和博士學(xué)位。2007年至2010年,他在英國布里斯托大學(xué)擔(dān)任研究助理,2010年至2014年,他在荷蘭海牙的 TNO(荷蘭應(yīng)用科學(xué)研究組織)擔(dān)任國防科學(xué)家。2014年,他加入了英國巴斯大學(xué)工程學(xué)院,目前擔(dān)任機(jī)械工程系的副教授和副系主任。自2017年以來,他還擔(dān)任挪威奧斯陸大學(xué)信息學(xué)系的兼職副教授。他的研究興趣包括水下聲學(xué)、信號處理、成像和機(jī)器智能。他特別關(guān)注使用聲納和海洋機(jī)器人進(jìn)行水下遙感的應(yīng)用。Alan博士是電氣電子工程師學(xué)會(IEEE)的高級會員,并擔(dān)任《IEEE 海洋工程期刊》的副編輯。
Timothy Rogers,英國謝菲爾德大學(xué)動力學(xué)研究組高級講師
Timothy Rogers 博士是謝菲爾德大學(xué)動力學(xué)研究組的高級講師。他的研究興趣是數(shù)據(jù)驅(qū)動分析與工程動力學(xué)的交叉領(lǐng)域。他感興趣的問題包括機(jī)器學(xué)習(xí)、尤其是貝葉斯方法,在信號處理、系統(tǒng)識別和工程系統(tǒng)監(jiān)測中的應(yīng)用。他的研究旨在將能從工程洞察和理解中獲取的最大價值,與能夠從數(shù)據(jù)中學(xué)習(xí)的模型的靈活性相結(jié)合。在這個過程中,他不僅關(guān)注所開發(fā)模型的預(yù)測準(zhǔn)確性,還關(guān)注所返回解決方案在物理意義上的可解釋性。
專題征稿
人工智能與機(jī)器學(xué)習(xí)在聲學(xué)信號處理中的應(yīng)用
AI and Machine Learning in Acoustic Signal Processing
近年來,人工智能(AI)、機(jī)器學(xué)習(xí)(ML)與聲學(xué)信號處理的交叉領(lǐng)域迅速發(fā)展,提供了新的方法來分析、解釋和增強(qiáng)聲音。將 AI 和 ML 技術(shù)整合到聲學(xué)信號處理中的潛力,將有力促進(jìn)從語音識別、音頻內(nèi)容分析、環(huán)境聲音監(jiān)測和生物醫(yī)學(xué)診斷等眾多應(yīng)用。本特刊旨在探討這個領(lǐng)域的最新發(fā)展和突破,為研究人員和從業(yè)者提供一個展示他們前沿進(jìn)展的平臺。
本特刊的主要目標(biāo)是探索如何利用 AI 和 ML 技術(shù)來應(yīng)對聲學(xué)信號處理中的復(fù)雜性。應(yīng)用AI和ML的優(yōu)勢在于能夠有效處理大量數(shù)據(jù)、實時適應(yīng)新模式以及提高信號分析和增強(qiáng)任務(wù)的準(zhǔn)確性和效率。本特刊希望吸引推動理論研究和實用解決方案的論文,提供可在實際應(yīng)用中實施的新工具。我們歡迎如下投稿主題:
聲學(xué)場景分析:開發(fā)用于識別和分類各種聲學(xué)環(huán)境的算法,這對于智能監(jiān)控、城市噪聲監(jiān)測和上下文感知系統(tǒng)等應(yīng)用至關(guān)重要。
信號增強(qiáng):特別關(guān)注基于 AI 的降噪、去混響和信號清晰度改善技術(shù)。這些方法在通信、助聽器、水下通信以及在各種噪聲環(huán)境中微弱水下信號檢測等場景中至關(guān)重要。
聲源定位與分離:AI/ ML 模型在多聲源環(huán)境中檢測、定位和隔離目標(biāo)聲源。應(yīng)用包括會議系統(tǒng)中的說話者分離、提高娛樂系統(tǒng)中的音頻質(zhì)量、增強(qiáng)自主系統(tǒng)中的環(huán)境感知,以及提高水下聲源定位/檢測的準(zhǔn)確性和分辨率。
語音與音頻處理:將深度學(xué)習(xí)模型應(yīng)用于語音識別(ASR)、音頻生成、語音轉(zhuǎn)換、情感識別、語音翻譯等任務(wù)。這些任務(wù)對于開發(fā)更自然和直觀的人機(jī)交互系統(tǒng)至關(guān)重要。
音樂信號處理:研發(fā)用于訪問、分析、操作和創(chuàng)作音樂的 AI 模型,例如音樂信息檢索、音樂生成、音樂合成、計算機(jī)伴奏和機(jī)器音樂演奏。
環(huán)境與生物醫(yī)學(xué)聲學(xué):這些領(lǐng)域中的 AI 應(yīng)用涉及利用聲學(xué)信號進(jìn)行野生動物監(jiān)測、檢測環(huán)境變化以及醫(yī)學(xué)診斷。例如,處理水下聲學(xué)信號用于海洋生物學(xué)和環(huán)境監(jiān)測,分析心臟或肺部聲音用于診斷,超聲信號處理用于醫(yī)學(xué)成像。
聲學(xué)檢測方法:用于其他物體檢測的新方法。例如,在聲學(xué)數(shù)據(jù)中檢測異常、時間序列分類、裂縫/缺陷定位。
我們鼓勵能展示跨學(xué)科方法或 AI/ML 與聲學(xué)信號處理融合的研究,歡迎能突出新方法、新應(yīng)用和塑造聲學(xué)信號處理未來新興趨勢的投稿。