數碼錄音筆工作原理
數碼錄音筆通過(guo)(guo)對聲音的(de)模(mo)擬信號的(de)采(cai)樣、編碼,將(jiang)模(mo)擬信號通過(guo)(guo)數模(mo)轉換器轉換為數字信號,并進行(xing)壓縮后進行(xing)存儲(chu)。
智能錄音筆工作原理
語(yu)音交互(hu),只需要短短幾秒(miao)鐘便可翻(fan)譯出文(wen)字。所謂語(yu)音轉換成文(wen)字用(yong)到(dao)了語(yu)音交互(hu)中一項ASR技術。
建立(li)(li)聲(sheng)學(xue)模(mo)型:由于(yu)每個(ge)人發音、語(yu)調、語(yu)速等各不相同,需要(yao)將(jiang)同一個(ge)單詞(ci)或漢字讓不同用戶錄(lu)(lu)取(qu),以便(bian)機器識別更多的人。聲(sheng)學(xue)模(mo)型建立(li)(li)過程需要(yao)錄(lu)(lu)入大量的原始用戶聲(sheng)音,以從中提取(qu)特征建立(li)(li)聲(sheng)學(xue)模(mo)型數據庫。
建(jian)立語(yu)言模(mo)型(xing):同(tong)聲學模(mo)型(xing),也需要大量文字(zi)信息的儲(chu)存。語(yu)言模(mo)型(xing)可以(yi)對聲學模(mo)型(xing)進(jin)行匹(pi)配與調整,讓正確率盡可能提高,語(yu)句更加通順。
語音識別:有前(qian)兩步作(zuo)為基礎的情況下,最終(zhong)形成的數據庫存儲在設備本地或云端(duan),再進行(xing)實時語音識別。將(jiang)用戶(hu)的語音輸入進行(xing)編碼和特(te)(te)征提取(qu)(qu),將(jiang)提取(qu)(qu)到(dao)(dao)的特(te)(te)征拿(na)到(dao)(dao)聲(sheng)學模型庫中去(qu)查詢,得到(dao)(dao)單(dan)個(ge)的單(dan)詞(ci)或漢字;然后再拿(na)到(dao)(dao)語言模型庫中去(qu)查詢,得到(dao)(dao)最匹配的單(dan)詞(ci)或漢字。