語音識別芯片的原理
嵌(qian)入(ru)式(shi)語音(yin)識別系(xi)統都(dou)采用(yong)了模(mo)式(shi)匹配的(de)原(yuan)理(li)。錄入(ru)的(de)語音(yin)信號首(shou)先經(jing)過預(yu)處理(li),包括(kuo)語音(yin)信號的(de)采樣(yang)、反混疊濾波、語音(yin)增強,接下(xia)來是(shi)特(te)(te)征(zheng)(zheng)提(ti)取,用(yong)以從語音(yin)信號波形(xing)中(zhong)提(ti)取一(yi)(yi)組或幾組能(neng)夠描述語音(yin)信號特(te)(te)征(zheng)(zheng)的(de)參數。特(te)(te)征(zheng)(zheng)提(ti)取之后(hou)的(de)數據一(yi)(yi)般分(fen)為兩個(ge)步驟,第一(yi)(yi)步是(shi)系(xi)統“學習”或“訓練”階段,這一階段的任務是構建參考模式庫,詞表中每個詞對應一個參考模式,它由這個詞重復發音多遍,再經特征提取和某種訓練中得到。第二是“識別”或“測試”階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
語音識別芯片分類
按照使用者的限制而言,語音識別芯片可以分為特(te)定人語音(yin)識別芯片和非特(te)定人語音(yin)識別芯片。
特定人語音識別
特(te)定(ding)人語(yu)音識(shi)(shi)(shi)別芯片是針對指定(ding)人的語(yu)音識(shi)(shi)(shi)別,其他人的話不(bu)識(shi)(shi)(shi)別,須(xu)先把使用者的語(yu)音參考樣本存入當成比對的資(zi)料庫,即(ji)特(te)定(ding)人語(yu)音識(shi)(shi)(shi)別在使用前必須(xu)要進行語(yu)音訓練,一般按(an)照(zhao)機器提示訓練2遍語音詞條即(ji)可使用。
非特定人語音識別
非特(te)定人(ren)語(yu)音識別(bie)(bie)是不(bu)用針對指(zhi)定的(de)人(ren)的(de)識別(bie)(bie)技(ji)術,不(bu)分年齡、性(xing)別(bie)(bie),只要說相同語(yu)言就可(ke)以(yi),應(ying)用模式是在產品定型前按照確定的(de)十幾個語(yu)音交互(hu)詞條,采集200人左右(you)的聲(sheng)音樣本(ben),經過(guo)PC算(suan)法處理(li)得到交互詞(ci)條的語音模(mo)型(xing)和特征數(shu)據庫,然(ran)后燒錄到芯片(pian)上。應(ying)用這種芯片(pian)的機(ji)器(智能(neng)娃娃、電(dian)子寵物、兒童(tong)電(dian)腦)就具有交互功(gong)能(neng)了。
非特(te)定(ding)人語(yu)音(yin)識(shi)(shi)別應用(yong)有(you)的是基于音(yin)素(su)的算(suan)法,這(zhe)種模(mo)式下不需要采集很多(duo)人的聲(sheng)音(yin)樣本就可以做交互識(shi)(shi)別,但是缺點是識(shi)(shi)別率不高,識(shi)(shi)別性能不穩定(ding)。
按照說話方式的連續(xu)性(xing),語(yu)音識別芯片又(you)可分為非(fei)連續(xu)語(yu)音識別和連續(xu)語(yu)音識別。
非連續語音識別
對(dui)于非(fei)連續語音來說(shuo),識別(bie)所說(shuo)的(de)每(mei)一個字必須(xu)分(fen)開辨認,要求說(shuo)完每(mei)個字后都要停頓(dun)。
連續語音識別
連(lian)續語音識別可以一般(ban)自然流利的說話(hua)方式來進行人性化的語音識別,但由于關系到相連(lian)音的問(wen)題,很(hen)難達到好的辨認效果。
申明:以上內容源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,請注意甄別內容來源的真實性和權威性。