什么是麥克風(fēng)陣列
麥克風(fēng)陣列是由一定數(shù)目的麥克風(fēng)組成,對(duì)聲場(chǎng)的空間特性進(jìn)行采樣并濾波的系統(tǒng)。
目前常用的麥克風(fēng)陣列可以按布局形狀分為:線性陣列,平面陣列,以及立體陣列。其幾何構(gòu)型是按設(shè)計(jì)已知,所有麥克風(fēng)的頻率響應(yīng)一致,麥克風(fēng)的采樣時(shí)鐘也是同步的。
麥克風(fēng)陣列的作用
麥克風(fēng)陣列一般用于:
聲源定位,包括角度和距離的測(cè)量
抑制背景噪聲、干擾、混響、回聲
信號(hào)提取
信號(hào)分離
聲源定位技術(shù)
利用麥克風(fēng)陣列計(jì)算聲源距離陣列的角度和距離,實(shí)現(xiàn)對(duì)目標(biāo)聲源的跟蹤。
基于TDOA(Time Difference Of Arrival,到達(dá)時(shí)間差)的聲源定位技術(shù)。估計(jì)信號(hào)到達(dá)兩兩麥克風(fēng)之間的時(shí)間差,從而得到聲源位置坐標(biāo)的方程組。然后求解方程組即可得到聲源的精確方位坐標(biāo)。
信號(hào)的提取與分離
通過(guò)波束形成技術(shù),在期望方向上有效地形成一個(gè)波束,僅拾取波束內(nèi)的信號(hào),從而達(dá)到同時(shí)提取聲源和抑制噪聲的目的。
語(yǔ)音去混響
混響(Reverberation)是指聲波在室內(nèi)傳播時(shí),被墻壁、天花板、地板等障礙物形成反射聲,并和直達(dá)聲形成疊加的現(xiàn)象。
混響的作用
混響是聲學(xué)中最重要的現(xiàn)象之一
合適的混響會(huì)使得聲音圓潤(rùn)動(dòng)聽(tīng)、富有感染力。
混響時(shí)間太長(zhǎng)會(huì)使得聲音含糊不清,聽(tīng)不清楚。
混響是建筑聲學(xué)中要重點(diǎn)考慮的問(wèn)題
演講廳要短一些的混響時(shí)間,比如北京學(xué)術(shù)報(bào)告廳混響時(shí)間為1s
交響樂(lè)則需要長(zhǎng)一些的混響時(shí)間,比如上海音樂(lè)廳混響時(shí)間為1.5s,維也納音樂(lè)廳為2.05s
過(guò)大的混響會(huì)帶來(lái)音素的交疊掩蔽現(xiàn)象,嚴(yán)重影響語(yǔ)音識(shí)別效果,尤其是遠(yuǎn)距離語(yǔ)音識(shí)別。
目前主流采用麥克風(fēng)陣列+深度學(xué)習(xí)的方式來(lái)進(jìn)行去混響。
線性麥克風(fēng)陣列
加性麥克風(fēng)陣列( Additive Microphone Array)
陣列的輸出是各陣元的加權(quán)和
最優(yōu)波束方向可調(diào)
結(jié)構(gòu)簡(jiǎn)單、方便布局
適用于車(chē)載、家電等場(chǎng)合
差分麥克風(fēng)陣列( Differential Microphone Array )
陣列的輸出是兩兩麥克風(fēng)之間的加權(quán)相減
最優(yōu)波束方向只能在末端方向
適用于耳機(jī)通話等場(chǎng)合
平面麥克風(fēng)陣列
平面麥克風(fēng)陣列(Planar Microphone Array )
實(shí)現(xiàn)平面360度等效拾音
麥克風(fēng)個(gè)數(shù)越多,空間劃分越精細(xì),語(yǔ)音增強(qiáng)和降噪效果越好
廣泛用于智能音箱和交互機(jī)器人上
立體麥克風(fēng)陣列
立體陣列麥克風(fēng)(3-D Microphone Array )
真正實(shí)現(xiàn)全空間360度無(wú)損拾音
解決了平面陣高俯仰角信號(hào)響應(yīng)差的問(wèn)題
麥克風(fēng)陣列發(fā)展趨勢(shì)
多傳感器的融合。聲學(xué)麥克風(fēng),光學(xué)麥克風(fēng),骨傳導(dǎo)麥克風(fēng)的多模態(tài)降噪。提高信噪比,以及適應(yīng)不同的環(huán)境。
分布式麥克風(fēng)陣列。客廳,臥室,廚房,餐廳,手持各類(lèi)麥克風(fēng)的數(shù)據(jù)實(shí)時(shí)融合處理。在更大范圍內(nèi)實(shí)現(xiàn)真正的全方位拾音。
基于深度學(xué)習(xí)的麥克風(fēng)陣列。用多麥克風(fēng)+神經(jīng)網(wǎng)絡(luò),來(lái)取代雙耳結(jié)構(gòu)+大腦信號(hào)處理機(jī)制。
最終目標(biāo):達(dá)到人類(lèi)聽(tīng)力水平;用兩個(gè)麥克風(fēng)讓機(jī)器能聽(tīng)清10米-20米的聲音;實(shí)現(xiàn)雞尾酒會(huì)效應(yīng)。
本地和云端識(shí)別緊耦合,配合使用也是一個(gè)大的趨勢(shì)。
|