發(fa)布(bu)語音合(he)成(cheng)技(ji)術KAN-TTS,基(ji)于KAN-TTS技(ji)術的合(he)成(cheng)語音可將該數據提(ti)高到97%以上。融合(he)了端(duan)到端(duan)TTS技(ji)術和傳(chuan)統(tong)TTS技(ji)術,從多個方(fang)面(mian)改進(jin)了語音合(he)成(cheng)。普(pu)通(tong)用戶(hu)定(ding)制(zhi)“AI聲音”的門(men)檻更低了。
發布語音(yin)合成技術KAN-TTS,據介紹,該技術可大幅提高(gao)合成語(yu)音(yin)與真人發聲的相似度,并將語(yu)音(yin)合成定制成本(ben)降(jiang)低10倍(bei)以(yi)上(shang)。
KAN-TTS技術由達(da)摩院機器(qi)智能實驗室自主研發。阿里(li)方面稱,基于KAN-TTS技術的合成語音可將該數據提高(gao)到(dao)97%以上。
據(ju)悉,KAN-TTS深度融(rong)合(he)了端(duan)到端(duan)TTS技術(shu)和傳統TTS技(ji)術,從多個(ge)方面改進了(le)語(yu)音合成(cheng)。傳(chuan)統語(yu)音合成(cheng)定制需要10小時以上(shang)的數據錄制和標注(zhu),對錄音(yin)人和錄音(yin)環境要求很高(gao)。從啟動定制到最終交付(fu),項(xiang)目周期(qi)長成(cheng)本高(gao)。
而阿里利(li)用(yong)Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相(xiang)結合的方法,將語音合成定制(zhi)周期壓縮3倍以上。也就是說,用1小時有效錄音數(shu)據和不到兩個月制作(zuo)周期,就(jiu)能完成一次標準TTS定制。
此外,這使得普通用戶定制(zhi)“AI聲(sheng)音”的(de)門檻(jian)更低。只需(xu)手機錄音十分(fen)鐘(zhong),就能(neng)獲(huo)得(de)與錄制聲(sheng)音高度(du)相(xiang)似(si)的(de)合成語(yu)音。
阿里巴(ba)巴(ba)集團正式在(zai)香港交(jiao)易所(suo)掛牌上(shang)市,成為首個(ge)同時在(zai)美股和港股上(shang)市的中國互聯網公司(si)。這(zhe)個(ge)行(xing)...
杭州2022年第19屆亞運會(hui)(hui)組委會(hui)(hui)宣布,阿里巴巴成為杭州亞運會(hui)(hui)官方合作伙伴。作為創新(xin)技術(shu),...
阿(a)里巴巴集(ji)團(tuan)正式(shi)在港(gang)交所掛牌上(shang)市(shi),開盤(pan)187港(gang)元,阿(a)里巴巴此次發行5億(yi)股新股,另(ling)有(you)7500...
收購是企業資本經營的一種形式,是一個公(gong)司通過(guo)產權(quan)交易取得其他公(gong)司一定程度的控制權(quan),以實現一...