語音識別芯片的原理
嵌入(ru)式語(yu)(yu)音(yin)識別系統都采用了模式匹配的原理(li)(li)。錄入(ru)的語(yu)(yu)音(yin)信(xin)號首先經過預處(chu)理(li)(li),包括語(yu)(yu)音(yin)信(xin)號的采樣、反混疊濾波、語(yu)(yu)音(yin)增(zeng)強,接(jie)下來是特(te)征提取(qu)(qu),用以從(cong)語(yu)(yu)音(yin)信(xin)號波形中提取(qu)(qu)一組(zu)或幾組(zu)能夠(gou)描(miao)述語(yu)(yu)音(yin)信(xin)號特(te)征的參數。特(te)征提取(qu)(qu)之(zhi)后(hou)的數據一般分為兩(liang)個(ge)步(bu)驟,第一步(bu)是系統“學習”或“訓練”階段,這一階段的任務是構建參考模式庫,詞表中每個詞對應一個參考模式,它由這個詞重復發音多遍,再經特征提取和某種訓練中得到。第二是“識別”或“測試”階段,按照一定的準則求取待測語音特征參數和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
語音識別芯片分類
按照使用者的限制而言,語音識別芯片可(ke)以分為特(te)定人語音識(shi)別芯片和(he)非特(te)定人語音識(shi)別芯片。
特定人語音識別
特(te)定(ding)(ding)人語音(yin)識別(bie)(bie)芯片是針(zhen)對(dui)指定(ding)(ding)人的語音(yin)識別(bie)(bie),其(qi)他人的話不識別(bie)(bie),須(xu)(xu)先(xian)把使(shi)用(yong)(yong)者的語音(yin)參考樣本存入當成比(bi)對(dui)的資料庫,即特(te)定(ding)(ding)人語音(yin)識別(bie)(bie)在使(shi)用(yong)(yong)前必須(xu)(xu)要(yao)進(jin)行語音(yin)訓練,一般(ban)按照機器提示(shi)訓練2遍(bian)語音詞(ci)條即可使用。
非特定人語音識別
非(fei)特定(ding)人(ren)語(yu)音識別(bie)是(shi)(shi)不(bu)用針對指定(ding)的(de)人(ren)的(de)識別(bie)技術,不(bu)分年齡(ling)、性別(bie),只(zhi)要說相同(tong)語(yu)言就可以,應用模式(shi)是(shi)(shi)在(zai)產品定(ding)型前按照確定(ding)的(de)十幾(ji)個語(yu)音交(jiao)互(hu)詞條(tiao),采集200人左右的聲(sheng)音(yin)樣本(ben),經過(guo)PC算(suan)法處理得到(dao)交(jiao)(jiao)互(hu)詞(ci)條的語音模(mo)型和(he)特征數據庫,然(ran)后燒錄到(dao)芯片(pian)(pian)上。應用這種芯片(pian)(pian)的機器(qi)(智能(neng)娃(wa)娃(wa)、電(dian)(dian)子寵(chong)物(wu)、兒童電(dian)(dian)腦)就具(ju)有交(jiao)(jiao)互(hu)功(gong)能(neng)了。
非特定人語音識別應(ying)用有的(de)(de)是基于音素的(de)(de)算法,這(zhe)種模式下不需要采集很(hen)多人的(de)(de)聲音樣本就可以做交互識別,但是缺點(dian)是識別率不高,識別性能(neng)不穩(wen)定。
按照說話方式的連續性,語音識別(bie)芯(xin)片又(you)可分為非連續語音識別(bie)和連續語音識別(bie)。
非連續語音識別
對于非連續語音來說(shuo),識別所說(shuo)的每一個(ge)字(zi)必須分(fen)開辨(bian)認(ren),要求(qiu)說(shuo)完(wan)每個(ge)字(zi)后(hou)都要停頓。
連續語音識別
連(lian)續(xu)語(yu)音(yin)識別(bie)可以(yi)一般自然(ran)流利的(de)說話方式來進行人性化的(de)語(yu)音(yin)識別(bie),但由于(yu)關系到(dao)相連(lian)音(yin)的(de)問題,很難達到(dao)好的(de)辨認(ren)效果。
申明:以上內容源于程序系統索引或網民分享提供,僅供您參考使用,不代表本網站的研究觀點,請注意甄別內容來源的真實性和權威性。