發布語音(yin)(yin)合(he)(he)成(cheng)技術KAN-TTS,基于KAN-TTS技術的合(he)(he)成(cheng)語音(yin)(yin)可將該數(shu)據提(ti)高到97%以(yi)上。融合(he)(he)了(le)端(duan)到端(duan)TTS技術和傳統TTS技術,從多(duo)個方(fang)面改進了(le)語音(yin)(yin)合(he)(he)成(cheng)。普通(tong)用戶定制(zhi)“AI聲音(yin)(yin)”的門檻更低了(le)。
發(fa)布語音合(he)成技術KAN-TTS,據介紹,該技術可(ke)大幅提高合(he)(he)成語音與真人發聲的相似度,并將語音合(he)(he)成定制成本(ben)降低(di)10倍(bei)以上。
KAN-TTS技術由達摩院機(ji)器智能(neng)實驗室自主(zhu)研(yan)發。阿(a)里方面(mian)稱,基(ji)于KAN-TTS技術的合成語(yu)音可將該數(shu)據(ju)提高(gao)到97%以(yi)上。
據悉,KAN-TTS深度融合了端到端TTS技術和傳統TTS技術,從(cong)多個(ge)方面改進了語音(yin)合成(cheng)。傳統語音(yin)合成(cheng)定制需(xu)要(yao)10小時以上的(de)數據(ju)錄制和標注(zhu),對(dui)錄音(yin)人和錄音(yin)環(huan)境要求(qiu)很高(gao)。從啟動定制到最終交付(fu),項目(mu)周期長成(cheng)本高(gao)。
而阿里利用Multi-Speaker Model與(yu)Speaker-aware Advanced Transfer Learning相結合(he)的方法(fa),將語音合(he)成(cheng)定制周(zhou)期壓(ya)縮3倍以上(shang)。也就是說,用1小時有效錄音(yin)數據和不到兩個月制作周期,就能完成一次標(biao)準TTS定(ding)制。
此外,這使得(de)普通用(yong)戶(hu)定(ding)制“AI聲(sheng)音”的(de)門檻更低。只需手機錄音十分(fen)鐘,就(jiu)能(neng)獲得與(yu)錄制聲(sheng)音高(gao)度相似(si)的(de)合成語音。
阿里(li)巴(ba)巴(ba)集團(tuan)正(zheng)式在香港交易(yi)所掛牌上市,成為首個(ge)同時在美股和港股上市的(de)中國互聯(lian)網公司。這個(ge)行...
杭(hang)州(zhou)2022年第(di)19屆(jie)亞運會組(zu)委會宣布,阿里巴(ba)巴(ba)成為杭(hang)州(zhou)亞運會官方合作伙伴。作為創(chuang)新技術,...
阿里巴巴集團正式(shi)在港交所掛牌上市,開盤(pan)187港元,阿里巴巴此次發行5億股(gu)新股(gu),另有(you)7500...
收購是企業資(zi)本經營的(de)一種形式,是一個公(gong)司通(tong)過產權交易取得(de)其他公(gong)司一定程度的(de)控制權,以實現一...