開(kāi)放式音頻系統(tǒng)引入AI大模型,藍(lán)牙音頻SOC邁向高端化

隨著技術(shù)的迭代以及市場(chǎng)需求的興起,智能眼鏡作為一種新型智能穿戴設(shè)備,可以通過(guò)獨(dú)立的操作系統(tǒng),安裝各種應(yīng)用程序,并通過(guò)語(yǔ)音、手勢(shì),或者與智能手表、智能手機(jī)的聯(lián)動(dòng),實(shí)現(xiàn)多種功能,如今正逐漸成為市場(chǎng)的焦點(diǎn)。

本文來(lái)自電子發(fā)燒友網(wǎng),作者/莫婷婷。

隨著技術(shù)的迭代以及市場(chǎng)需求的興起,智能眼鏡作為一種新型智能穿戴設(shè)備,可以通過(guò)獨(dú)立的操作系統(tǒng),安裝各種應(yīng)用程序,并通過(guò)語(yǔ)音、手勢(shì),或者與智能手表、智能手機(jī)的聯(lián)動(dòng),實(shí)現(xiàn)多種功能,如今正逐漸成為市場(chǎng)的焦點(diǎn)。

不過(guò)智能眼鏡設(shè)備不能忽視的挑戰(zhàn)是其開(kāi)放式音頻系統(tǒng),音頻作為智能眼鏡最基礎(chǔ)的功能,在完成多種交互體驗(yàn)之外,如何實(shí)現(xiàn)更好的音頻體驗(yàn),也是需要不斷突破的技術(shù)難題。

AI技術(shù)加持,推進(jìn)藍(lán)牙音頻SOC的高端化

OWS耳機(jī)、智能音頻眼鏡等產(chǎn)品,對(duì)開(kāi)放式的音頻系統(tǒng)提出了更高的要求。面對(duì)開(kāi)放式的音頻系統(tǒng),主控芯片的技術(shù)瓶頸、難點(diǎn)是在哪里?

物奇微藍(lán)牙產(chǎn)品線(xiàn)銷(xiāo)售負(fù)責(zé)人陳武清在接受電子發(fā)燒友網(wǎng)采訪(fǎng)時(shí)表示,開(kāi)放式的音頻系統(tǒng)有著三大挑戰(zhàn),一是低頻泄露問(wèn)題,二是大回聲結(jié)構(gòu)下的通話(huà)效果和運(yùn)動(dòng)風(fēng)噪場(chǎng)景下的通話(huà)質(zhì)量問(wèn)題,三是輕巧舒適結(jié)構(gòu)狀態(tài)小尺寸的設(shè)計(jì)對(duì)電池的要求的低功耗。

為了符合人體工學(xué)的設(shè)計(jì),大多數(shù)OWS耳機(jī)都采用U型聲學(xué)腔體結(jié)構(gòu),內(nèi)部搭載了發(fā)聲單元,例如SoundPEATS的GoFree2,以及beyerdynamic拜雅的VERIO 200都搭載了超大16.2mm動(dòng)圈單元。較大的動(dòng)圈單元在低頻響應(yīng)和聲壓級(jí)上有更好的表現(xiàn),但依舊解決不了低頻泄露、通話(huà)效果、降風(fēng)噪等方面的挑戰(zhàn)。

陳武清提到,開(kāi)放式耳機(jī)的通話(huà)大回聲結(jié)構(gòu)存在mic-spk間距短,聲隔離弱、信回比低的問(wèn)題,相對(duì)入耳式,有效回波損耗(ERL)小近20dB、通話(huà)回聲雙講效果差。

同樣有著開(kāi)放式音頻系統(tǒng)的智能眼鏡,在音頻系統(tǒng)存在的挑戰(zhàn)不比OWS耳機(jī)小。一般而言,OWS耳機(jī)會(huì)通過(guò)不同的人體工學(xué)結(jié)構(gòu)設(shè)計(jì),讓前出聲孔靠近耳道,改善開(kāi)放式音頻系統(tǒng)的音量、低音體驗(yàn)等問(wèn)題,這些不同的人體工學(xué)設(shè)計(jì)雖然治標(biāo)不治本,但都能夠在一定程度上提升音頻體驗(yàn)。而智能眼鏡的音頻系統(tǒng)在鏡腿的位置,難以通過(guò)上述方式進(jìn)行改善。

隨著技術(shù)的發(fā)展,AI已經(jīng)成為提升開(kāi)放式音頻系統(tǒng)音頻體驗(yàn)的關(guān)鍵技術(shù)之一。據(jù)了解,物奇的多模態(tài)AI能力已經(jīng)落地多個(gè)領(lǐng)域,其中邊緣計(jì)算AI處理技術(shù)已經(jīng)引入藍(lán)牙音頻SOC中。

為了提升開(kāi)放式音頻系統(tǒng)的通話(huà)質(zhì)量,物奇基于先進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)40G的大量數(shù)據(jù)訓(xùn)練大模型,加上LMS+KLM雙濾波結(jié)構(gòu),線(xiàn)性回聲抑制能力達(dá)30dB,非線(xiàn)性殘余回聲引入AI處理。在降風(fēng)噪等方面,通過(guò)多麥技術(shù)、神經(jīng)網(wǎng)絡(luò)算法的加持,通過(guò)大量風(fēng)噪數(shù)據(jù)訓(xùn)練AI模型,達(dá)到了風(fēng)噪殘留少、語(yǔ)音穩(wěn)定,損傷小,可辨度高的效果。

相較以往只是在算法上做處理,加入邊緣計(jì)算AI處理技術(shù)能夠?qū)崿F(xiàn)更清晰的通話(huà)質(zhì)量,在很大程度上提升了開(kāi)放式音頻系統(tǒng)的音頻體驗(yàn)。

在功耗方面,智能眼鏡的藍(lán)牙芯片、傳感器、麥克風(fēng)等元器件基本放在鏡腿的位置,受限于空間的限制,一般只能采用容量較小的電池,因此續(xù)航性能較差,此時(shí)需要藍(lán)牙芯片也要有強(qiáng)大的低功耗性能。

物奇的藍(lán)牙芯片在提升續(xù)航方面帶來(lái)創(chuàng)新和突破。率先采用RISC-V+DSP的設(shè)計(jì)架構(gòu),以及多模塊化處理的軟件SDK。以O(shè)WS的應(yīng)用為例,物奇可以在芯片級(jí)功耗只有3.xmA的情況下,增加了針對(duì)OWS形態(tài)必須增加的低頻補(bǔ)償/虛擬低音/動(dòng)態(tài)EQ和多MIC AI的ENC等算法,讓功耗維持在4.xmA的低功耗水平,“在45mAh的電池容量下,聽(tīng)音樂(lè)可以使用10小時(shí)”。

在芯片廠商的技術(shù)迭代下,AI技術(shù)在音頻處理上的應(yīng)用取得了新的進(jìn)展,AI技術(shù)引入藍(lán)牙音頻SOC,成為藍(lán)牙音頻SOC走向高端的象征之一,由此也將推動(dòng)音頻市場(chǎng)的創(chuàng)新和進(jìn)步。

音頻眼鏡將在音頻設(shè)備市場(chǎng)上逐漸起量

今年一季度,全球個(gè)人智能音頻設(shè)備市場(chǎng)迎來(lái)6%的同比增長(zhǎng),出貨量超過(guò)9000萬(wàn)臺(tái)。在TWS耳機(jī)、無(wú)線(xiàn)頸掛式、無(wú)線(xiàn)頭戴式三大類(lèi)產(chǎn)品中,TWS耳機(jī)品類(lèi)已經(jīng)出現(xiàn)增長(zhǎng)乏力,筆者認(rèn)為,接下來(lái)OWS耳機(jī)、智能音頻眼鏡將成為智能音頻設(shè)備市場(chǎng)中增長(zhǎng)明顯的細(xì)分品類(lèi)。

如果從智能眼鏡這個(gè)大品類(lèi)來(lái)看,智能音頻眼鏡這一品類(lèi)也會(huì)首先在市場(chǎng)上起量。陳武清認(rèn)為在AI/智能音頻/AR智能眼鏡三大品類(lèi)中,智能音頻眼鏡會(huì)率先起量,其次是AI眼鏡,最終朝著包含音頻/視頻/內(nèi)容為一體的AR智能眼鏡方向演進(jìn)。

“智能音頻眼鏡會(huì)先開(kāi)始起量,在當(dāng)前技術(shù)背景下優(yōu)先解決輕巧和輕度語(yǔ)音處理的問(wèn)題,其次通過(guò)技術(shù)的演進(jìn)延伸到可以具備AI語(yǔ)音處理能力的AI眼鏡,再繼續(xù)演進(jìn)到包含音視頻及內(nèi)容為一體的AR智能眼鏡,需要解決痛點(diǎn)非常多。”

陳武清表示,對(duì)于芯片而言,主芯片平臺(tái)需要高集成度以及豐富的外設(shè)接口和AI處理能力,在各種各樣的語(yǔ)音/視頻處理算法的加持下,維持高算力下的低功耗要求。

從長(zhǎng)期的演進(jìn)來(lái)看,信息/數(shù)據(jù)經(jīng)過(guò)終端的基礎(chǔ)處理后,會(huì)到云端做進(jìn)一步的處理,因此設(shè)備在終端的處理會(huì)越來(lái)越多,同時(shí)在云端處理的需求也會(huì)增長(zhǎng)。隨著智能眼鏡需要處理的場(chǎng)景越來(lái)越多,云端也需要有更強(qiáng)的能力去應(yīng)對(duì)這些處理任務(wù)。但在這之前,終端設(shè)備的主芯片平臺(tái)需要更加強(qiáng)大應(yīng)對(duì)更復(fù)雜的終端處理任務(wù),芯片廠商也需要持續(xù)迭代產(chǎn)品推出更具競(jìng)爭(zhēng)力的芯片。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論