發(fa)布語(yu)音(yin)合成(cheng)(cheng)(cheng)技術(shu)KAN-TTS,基于(yu)KAN-TTS技術(shu)的合成(cheng)(cheng)(cheng)語(yu)音(yin)可將該數據提高到(dao)97%以(yi)上。融合了(le)端到(dao)端TTS技術(shu)和傳統TTS技術(shu),從(cong)多個(ge)方(fang)面(mian)改(gai)進了(le)語(yu)音(yin)合成(cheng)(cheng)(cheng)。普通用戶定制“AI聲音(yin)”的門檻更低了(le)。
發布(bu)語音(yin)合(he)成技術(shu)KAN-TTS,據介紹,該技術可(ke)大(da)幅提(ti)高合(he)成(cheng)語音(yin)與真人發聲的相似度,并將語音(yin)合(he)成(cheng)定制成(cheng)本降低10倍以上(shang)。
KAN-TTS技術由達摩(mo)院機器智能實驗室自主研(yan)發。阿里方(fang)面稱,基于KAN-TTS技術的合成(cheng)語音可將該數據提高到97%以(yi)上(shang)。
據(ju)悉,KAN-TTS深度融合了端到端TTS技術(shu)和傳統TTS技術,從多個(ge)方面改進了語(yu)音(yin)(yin)合(he)成。傳統語(yu)音(yin)(yin)合(he)成定(ding)制(zhi)需(xu)要10小時(shi)以上的數據錄(lu)制(zhi)和標注,對錄(lu)音(yin)人和錄(lu)音(yin)環境要求很(hen)高(gao)。從啟動定制(zhi)到(dao)最終交付,項(xiang)目周期長(chang)成本高(gao)。
而阿(a)里(li)利(li)用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合的(de)方法(fa),將語音合成(cheng)定制周期壓縮3倍以上。也就是說,用1小(xiao)時有效錄音(yin)數(shu)據(ju)和不到兩個(ge)月制作(zuo)周期,就能完成(cheng)一次(ci)標準TTS定制。
此外,這使得普通用戶定(ding)制“AI聲音(yin)”的(de)門檻更低。只需手機(ji)錄(lu)音(yin)十分鐘,就能獲得與(yu)錄(lu)制聲音(yin)高度相(xiang)似的(de)合成語音(yin)。
阿里巴巴集團正式(shi)在香港交(jiao)易所掛牌上(shang)市(shi),成為首個同(tong)時在美股和(he)港股上(shang)市(shi)的中國互(hu)聯網公司(si)。這個行...
杭(hang)州2022年第19屆亞運(yun)會(hui)組(zu)委會(hui)宣布(bu),阿(a)里(li)巴巴成為(wei)杭(hang)州亞運(yun)會(hui)官方(fang)合作伙伴。作為(wei)創新技術(shu),...
阿(a)里(li)巴巴集團正(zheng)式在港交所掛牌上市,開盤187港元,阿(a)里(li)巴巴此次發(fa)行5億股(gu)(gu)新股(gu)(gu),另有(you)7500...
收(shou)購(gou)是企業資本經營(ying)的(de)一種形式(shi),是一個(ge)公(gong)司(si)通(tong)過(guo)產權交易取得其(qi)他(ta)公(gong)司(si)一定(ding)程度的(de)控制權,以(yi)實現一...