數碼錄音筆工作原理
數碼(ma)錄音筆通過對聲(sheng)音的(de)模(mo)擬信號(hao)的(de)采樣、編碼(ma),將模(mo)擬信號(hao)通過數模(mo)轉換器轉換為數字(zi)信號(hao),并(bing)進行(xing)壓縮后進行(xing)存儲。
智能錄音筆工作原理
語(yu)(yu)音(yin)交互,只(zhi)需要短短幾(ji)秒(miao)鐘便(bian)可翻譯出文字。所(suo)謂語(yu)(yu)音(yin)轉換成文字用(yong)到了語(yu)(yu)音(yin)交互中(zhong)一項ASR技術。
建立聲學(xue)模型(xing):由于每個人發音、語(yu)調、語(yu)速等各不相同(tong),需要將同(tong)一(yi)個單詞(ci)或漢(han)字讓不同(tong)用(yong)戶錄取,以便(bian)機(ji)器識別(bie)更(geng)多(duo)的(de)人。聲學(xue)模型(xing)建立過程需要錄入大量的(de)原始用(yong)戶聲音,以從中提(ti)取特征(zheng)建立聲學(xue)模型(xing)數據庫。
建立語(yu)(yu)(yu)言(yan)模(mo)型(xing):同(tong)聲學模(mo)型(xing),也(ye)需要大量文字(zi)信息(xi)的儲存。語(yu)(yu)(yu)言(yan)模(mo)型(xing)可以對(dui)聲學模(mo)型(xing)進(jin)行匹配與調整,讓正確率盡(jin)可能提高,語(yu)(yu)(yu)句更加通順。
語(yu)(yu)音識別:有前兩步作為基礎(chu)的(de)(de)情況(kuang)下,最終形成的(de)(de)數據庫存儲在設(she)備(bei)本地或云端,再進行(xing)實(shi)時語(yu)(yu)音識別。將用(yong)戶的(de)(de)語(yu)(yu)音輸入進行(xing)編碼和特征提(ti)取,將提(ti)取到的(de)(de)特征拿到聲學(xue)模(mo)型(xing)庫中去查(cha)詢(xun),得(de)到單(dan)(dan)個的(de)(de)單(dan)(dan)詞或漢(han)字;然后(hou)再拿到語(yu)(yu)言模(mo)型(xing)庫中去查(cha)詢(xun),得(de)到最匹配的(de)(de)單(dan)(dan)詞或漢(han)字。