備受公安、金融領(lǐng)域青睞的聲紋識(shí)別,到底是一種怎樣的技術(shù)?

聲紋識(shí)別相對(duì)其他生物特征識(shí)別有什么優(yōu)劣勢(shì),除了聲紋識(shí)別以外,常見的生物特征有指紋、掌紋、人臉、虹膜、視網(wǎng)膜等。生物特征代表了每個(gè)人固有的特點(diǎn),它具有普遍性、唯一性、穩(wěn)定性和不易復(fù)制性等。

本文來自微信公眾號(hào)“AF智慧城市網(wǎng)”。

除了物理環(huán)境無(wú)障礙改造,在語(yǔ)音識(shí)別技術(shù)愈加成熟的今天,越來越多的目光聚焦在聲紋識(shí)別技術(shù)上。“聲紋識(shí)別是機(jī)器通過提取語(yǔ)音信號(hào)中能表征說話人身份的個(gè)性特征,對(duì)說話人進(jìn)行身份識(shí)別的技術(shù),屬于生物特征識(shí)別技術(shù)的一種。”清華大學(xué)人工智能研究院聽覺智能研究中心主任鄭方說,在所有生物特征里,聲紋是唯一兼具生理特征特點(diǎn)的行為特征,可以做到高可變性與唯一性的完美統(tǒng)一,這就使得聲紋天然就具備了不易丟失、不懼泄露、不易纂改的屬性,以及很強(qiáng)的防攻擊能力,在金融服務(wù)領(lǐng)域具有顯著的優(yōu)勢(shì)。

聲紋驗(yàn)證可以通過識(shí)別聲音特征來辨別真實(shí)用戶和仿冒者,有效防范金融欺詐和非法交易的風(fēng)險(xiǎn)。此外,用戶只需說出隨機(jī)動(dòng)態(tài)碼即可完成驗(yàn)證,節(jié)省交易時(shí)間。鄭方特別提到,相較于其他生物識(shí)別技術(shù),如指紋或面部識(shí)別,聲紋識(shí)別的錯(cuò)誤率更低,可減少識(shí)別錯(cuò)誤帶來的資金損失風(fēng)險(xiǎn)。

什么是聲紋識(shí)別技術(shù)?

聲紋識(shí)別,生物識(shí)別技術(shù)的一種,也稱為說話人識(shí)別,是一種通過聲音判別說話人身份的技術(shù)。所謂聲紋(Voiceprint),是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜。人類語(yǔ)言的產(chǎn)生是人體語(yǔ)言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過程,人在講話時(shí)使用的發(fā)聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個(gè)人的差異很大,所以任何兩個(gè)人的聲紋圖譜都有差異。每個(gè)人的語(yǔ)音聲學(xué)特征既有相對(duì)穩(wěn)定性,又有變異性,不是絕對(duì)的、一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。盡管如此,由于每個(gè)人的發(fā)音器官都不盡相同,因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。

其關(guān)鍵技術(shù)有以下兩點(diǎn):

1、語(yǔ)音特征參數(shù)提取技術(shù)

簡(jiǎn)單來講就是要從講話人的語(yǔ)音中提取出特定器官結(jié)構(gòu)、行為習(xí)慣的特征參數(shù)。這項(xiàng)參數(shù)的特點(diǎn)是較為穩(wěn)定,不會(huì)隨時(shí)間或環(huán)境的變化發(fā)生太明顯的改變,且不易模仿、具備較強(qiáng)的抗噪性。這點(diǎn)其實(shí)很好理解,每個(gè)人由于語(yǔ)音器官的差異導(dǎo)致了不同的發(fā)音習(xí)慣,其語(yǔ)音特征是難以被輕易模仿的。

2、模式匹配識(shí)別判斷技術(shù)

該技術(shù)實(shí)施的第一步是要獲取跟講話人個(gè)性相關(guān)的特征參數(shù),再根據(jù)一定的準(zhǔn)則,將未識(shí)別的特征參數(shù)與模型庫(kù)中訓(xùn)練好的模型進(jìn)行特征匹配,最終根據(jù)相似度得出最匹配的結(jié)果并進(jìn)行輸出。其中在模型匹配中常用到的幾種模型有矢量化模型、隨機(jī)模型、神經(jīng)網(wǎng)絡(luò)模型等。

得益于人工智能機(jī)器學(xué)習(xí)技術(shù)的成熟,以及傳感器、麥克風(fēng)、通信信道等技術(shù)的進(jìn)步,聲紋識(shí)別雖然不能確保100%識(shí)別出欺詐,但成功率仍然較高。

聲紋識(shí)別的優(yōu)勢(shì)與劣勢(shì)

聲紋識(shí)別相對(duì)其他生物特征識(shí)別有什么優(yōu)劣勢(shì),除了聲紋識(shí)別以外,常見的生物特征有指紋、掌紋、人臉、虹膜、視網(wǎng)膜等。生物特征代表了每個(gè)人固有的特點(diǎn),它具有普遍性、唯一性、穩(wěn)定性和不易復(fù)制性等。

與其他這些生物特征相比,聲紋主要有以下三方面的優(yōu)勢(shì):

1、非接觸、易接受:

聲紋由于其非接觸性是可以用于遠(yuǎn)程領(lǐng)域的生物識(shí)別技術(shù)。另外蘊(yùn)含聲紋特征的語(yǔ)音獲取方便、自然。在采集過程中涉及到的用戶個(gè)人隱私信息較少,因此更容易被使用者接受。

2、成本低:

語(yǔ)音采集裝置成本低廉,使用簡(jiǎn)單,一個(gè)麥克風(fēng)即可,在使用通訊設(shè)備(如電話、手機(jī))時(shí)更無(wú)需額外的錄音設(shè)備。

3、偽造難:

聲紋信息必須是活體采集,可使聲紋口令動(dòng)態(tài)變化而無(wú)需擔(dān)心密碼遺忘、丟失和竊取問題,防止錄音假冒。

當(dāng)然,聲紋也有其自身的劣勢(shì),聲紋特征的穩(wěn)定性不夠,受附著語(yǔ)音長(zhǎng)短、內(nèi)容、采集信道及環(huán)境、包括說話人自身身體情況影響,自動(dòng)識(shí)別效果不及指紋等生物特征。

聲紋識(shí)別應(yīng)用于哪些領(lǐng)域?

目前來說,聲紋識(shí)別技術(shù)在公安和金融領(lǐng)域比較受青睞。

公安領(lǐng)域:聲紋識(shí)別可以用于重點(diǎn)人員布控、偵查破案、反電信欺詐、治安防控、司法鑒定、審訊室建設(shè)、網(wǎng)絡(luò)身份認(rèn)證等。

1)重點(diǎn)人員布控——建立重點(diǎn)人員聲紋數(shù)據(jù)庫(kù),在110接警、重點(diǎn)區(qū)域范圍、重大活動(dòng)期間等,一旦發(fā)現(xiàn)重點(diǎn)人員、黑名單人員聲紋信息,即進(jìn)行預(yù)警,有效進(jìn)行事前預(yù)防。在建立重點(diǎn)人員聲紋數(shù)據(jù)庫(kù)時(shí),需要先對(duì)聲紋進(jìn)行采集,目前在公安領(lǐng)域主要是標(biāo)準(zhǔn)聲紋采集。

2)偵查破案——利用聲紋識(shí)別技術(shù)海量篩查優(yōu)勢(shì),進(jìn)行“案查人”、“人查案”、“案查案”與“人查人”等多種排查方式,縮小偵查范圍,提高辦案效率,公安領(lǐng)域要求聲紋數(shù)據(jù)庫(kù)的聲紋比對(duì)系統(tǒng)能夠提供1:N大庫(kù)檢索比對(duì),同時(shí)要支持千萬(wàn)庫(kù)容建設(shè)。

3)反電信詐騙——利用聲紋鑒定技術(shù)對(duì)電信詐騙等案件中的涉案語(yǔ)音進(jìn)行個(gè)體、團(tuán)伙的識(shí)別,確定犯罪嫌疑人身份,為偵查破案、案件訴訟提供技術(shù)支撐。

4)治安防控——利用“語(yǔ)種識(shí)別”、“內(nèi)容識(shí)別”、“聲紋特征識(shí)別”等聲紋綜合分析技術(shù),對(duì)重點(diǎn)人員進(jìn)行布控,一旦出現(xiàn)立即進(jìn)行關(guān)注控制。

5)身份認(rèn)證——在監(jiān)獄親情電話應(yīng)用中,通過采集犯人家屬的聲紋信息,可有效鑒別家屬身份的合法性。在司法社區(qū)矯正應(yīng)用中,通過識(shí)別定位手機(jī)位置和呼叫對(duì)象說話聲音的個(gè)人特征,系統(tǒng)就可以快速的自動(dòng)判斷被監(jiān)控人是否在規(guī)定的時(shí)間出現(xiàn)在規(guī)定的場(chǎng)所,有效地解決人機(jī)分離問題。

金融領(lǐng)域:聲紋識(shí)別技術(shù)主要可以用于以下幾個(gè)場(chǎng)景:

1)登錄、支付場(chǎng)景——采用聲紋識(shí)別技術(shù),自動(dòng)匹配用戶個(gè)人身份信息,完成登陸、支付的身份驗(yàn)證,一般采用文本相關(guān)的方式,既8位隨機(jī)動(dòng)態(tài)數(shù)字串或者固定文本。

2)業(yè)務(wù)核身——采用聲紋識(shí)別技術(shù),在業(yè)務(wù)溝通中完成用戶身份核驗(yàn),在自動(dòng)匹配業(yè)務(wù)辦理的信息,進(jìn)行比對(duì),完成業(yè)務(wù)辦理的身份核驗(yàn),一般采用文本無(wú)關(guān)方式,如開卡開戶。

3)信貸場(chǎng)景——采用聲紋識(shí)別技術(shù),在信審環(huán)節(jié)對(duì)用戶身份進(jìn)行識(shí)別,并查驗(yàn)是否為黑中介(黑名單用戶),完成信審身份審核,采用文本無(wú)關(guān)的方式。

4)金融反洗錢——采用聲紋識(shí)別技術(shù),在判定出疑似洗錢行為后對(duì)用戶進(jìn)行電話遠(yuǎn)程身份驗(yàn)證以及自動(dòng)對(duì)用戶信息核對(duì),完成可疑用戶身份核驗(yàn),采用文本無(wú)關(guān)的方式。

其實(shí)聲紋識(shí)別技術(shù)現(xiàn)在很廣泛的應(yīng)用公安司法、軍隊(duì)國(guó)防領(lǐng)域中,我國(guó)的天網(wǎng)系統(tǒng)里也有著聲紋識(shí)別的存在,這極大的保障了我們?nèi)粘I钪械陌踩?/p>

結(jié)語(yǔ)

從近幾年情形可以看出,相比于指紋識(shí)別、人臉識(shí)別等生物識(shí)別技術(shù),聲紋識(shí)別是“低調(diào)”的,但市場(chǎng)需求的確存在,且市場(chǎng)熱度也有上升趨勢(shì)。

同時(shí),聲紋識(shí)別技術(shù)目前已經(jīng)發(fā)展較為成熟,識(shí)別準(zhǔn)確率也相對(duì)較高,應(yīng)用范圍較為廣泛、識(shí)別技術(shù)水平相對(duì)成熟,因其經(jīng)濟(jì)性、可操作性等優(yōu)勢(shì),在將來會(huì)在更多的領(lǐng)域中、獲得更為廣泛的應(yīng)用。聲紋識(shí)別或是未來提升安防解決方案的重要手段,將快速實(shí)現(xiàn)商業(yè)化部署,前景十分廣闊。

文章來源:智慧城市網(wǎng),科普時(shí)報(bào),智安物聯(lián)網(wǎng)

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論