語音識別芯片的原理
嵌(qian)入(ru)式語(yu)音(yin)識別(bie)系(xi)(xi)統都(dou)采用(yong)了模式匹配的原理。錄入(ru)的語(yu)音(yin)信(xin)號首先經(jing)過預處理,包(bao)括語(yu)音(yin)信(xin)號的采樣、反(fan)混(hun)疊濾波、語(yu)音(yin)增強,接(jie)下來(lai)是特(te)征提(ti)(ti)取(qu)(qu),用(yong)以從語(yu)音(yin)信(xin)號波形中提(ti)(ti)取(qu)(qu)一(yi)組或(huo)幾組能夠描(miao)述(shu)語(yu)音(yin)信(xin)號特(te)征的參(can)數。特(te)征提(ti)(ti)取(qu)(qu)之后(hou)的數據一(yi)般分為兩(liang)個(ge)步(bu)驟,第一(yi)步(bu)是系(xi)(xi)統“學習”或“訓練”階段,這一階段的任務是構建參考模式庫,詞表中每個詞對應一個參考模式,它由這個詞重復發音多遍,再經特征提取和某種訓練中得到。第二是“識別”或“測試”階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
語音識別芯片分類
按照使用者的限制而言,語音識別芯片可以分(fen)為特定人語音識(shi)別芯片和(he)非特定人語音識(shi)別芯片。
特定人語音識別
特定(ding)人(ren)語音(yin)(yin)識別(bie)芯片是(shi)針(zhen)對指(zhi)定(ding)人(ren)的語音(yin)(yin)識別(bie),其他人(ren)的話不識別(bie),須(xu)先把(ba)使用(yong)者(zhe)的語音(yin)(yin)參考樣本(ben)存(cun)入當成比(bi)對的資料庫,即特定(ding)人(ren)語音(yin)(yin)識別(bie)在使用(yong)前必須(xu)要進行(xing)語音(yin)(yin)訓練(lian)(lian),一般按照(zhao)機(ji)器提(ti)示(shi)訓練(lian)(lian)2遍語音詞條即可使(shi)用。
非特定人語音識別
非特定人(ren)語(yu)音識別(bie)(bie)是不用針對指定的(de)(de)人(ren)的(de)(de)識別(bie)(bie)技術,不分年齡(ling)、性別(bie)(bie),只要說(shuo)相同(tong)語(yu)言就可(ke)以,應用模式是在產品定型前按照(zhao)確定的(de)(de)十幾個語(yu)音交互詞條,采集(ji)200人左右的聲音樣本,經過PC算(suan)法處理得到(dao)交互(hu)詞條的語音(yin)模型和特征數據庫,然后燒錄(lu)到(dao)芯(xin)片(pian)上。應用這種芯(xin)片(pian)的機器(qi)(智(zhi)能(neng)娃娃、電(dian)子寵物、兒(er)童(tong)電(dian)腦(nao))就(jiu)具有(you)交互(hu)功能(neng)了。
非特定人語(yu)音識(shi)別(bie)應用有的(de)是基于音素(su)的(de)算法,這種模式下不(bu)需要采集很多人的(de)聲音樣本(ben)就可(ke)以做交互識(shi)別(bie),但是缺(que)點(dian)是識(shi)別(bie)率不(bu)高,識(shi)別(bie)性(xing)能不(bu)穩定。
按(an)照說(shuo)話方(fang)式的連續(xu)(xu)性,語(yu)音(yin)(yin)識別芯片又可(ke)分為非連續(xu)(xu)語(yu)音(yin)(yin)識別和連續(xu)(xu)語(yu)音(yin)(yin)識別。
非連續語音識別
對(dui)于非連(lian)續語音(yin)來說,識(shi)別(bie)所說的(de)每一個字(zi)必(bi)須分(fen)開(kai)辨認,要求說完每個字(zi)后都要停頓。
連續語音識別
連(lian)續語(yu)音(yin)(yin)識別可以一般自然流利的說話方式(shi)來(lai)進(jin)行人性化的語(yu)音(yin)(yin)識別,但(dan)由于關系到(dao)相連(lian)音(yin)(yin)的問題,很難達到(dao)好的辨認效果(guo)。
申明:以上內容源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,請注意甄別內容來源的真實性和權威性。