數碼錄音筆工作原理
數(shu)碼錄音筆通過(guo)對(dui)聲音的模擬(ni)信(xin)號(hao)(hao)的采樣(yang)、編碼,將模擬(ni)信(xin)號(hao)(hao)通過(guo)數(shu)模轉換(huan)器轉換(huan)為數(shu)字信(xin)號(hao)(hao),并進行(xing)壓縮后進行(xing)存儲。
智能錄音筆工作原理
語音交(jiao)互,只需要短(duan)短(duan)幾秒鐘便可翻譯出文(wen)字。所謂語音轉換成(cheng)文(wen)字用到了語音交(jiao)互中一(yi)項ASR技(ji)術。
建立(li)聲(sheng)學模(mo)(mo)型(xing)(xing):由于每個(ge)人發音、語調(diao)、語速等各不相(xiang)同(tong),需要將(jiang)同(tong)一(yi)個(ge)單(dan)詞或漢字(zi)讓不同(tong)用戶(hu)錄取,以(yi)便機器識別(bie)更多的人。聲(sheng)學模(mo)(mo)型(xing)(xing)建立(li)過程需要錄入(ru)大量的原始用戶(hu)聲(sheng)音,以(yi)從(cong)中提取特征建立(li)聲(sheng)學模(mo)(mo)型(xing)(xing)數(shu)據庫。
建立語(yu)言模(mo)型(xing)(xing):同聲(sheng)學模(mo)型(xing)(xing),也(ye)需要大(da)量(liang)文(wen)字信(xin)息的儲存。語(yu)言模(mo)型(xing)(xing)可(ke)以對(dui)聲(sheng)學模(mo)型(xing)(xing)進(jin)行(xing)匹配與調(diao)整,讓(rang)正確率盡可(ke)能提(ti)高(gao),語(yu)句更加(jia)通順。
語(yu)音(yin)識別:有前(qian)兩(liang)步作(zuo)為(wei)基礎的(de)情(qing)況下,最(zui)終(zhong)形成(cheng)的(de)數據庫存儲在設備(bei)本地或云端,再進行(xing)實時語(yu)音(yin)識別。將用(yong)戶的(de)語(yu)音(yin)輸入進行(xing)編碼和特(te)(te)征提取,將提取到的(de)特(te)(te)征拿到聲學模(mo)型庫中(zhong)去(qu)(qu)查詢,得(de)到單個的(de)單詞或漢字(zi)(zi);然后再拿到語(yu)言模(mo)型庫中(zhong)去(qu)(qu)查詢,得(de)到最(zui)匹配(pei)的(de)單詞或漢字(zi)(zi)。