發(fa)布語(yu)音(yin)合(he)成(cheng)技(ji)術(shu)KAN-TTS,基于KAN-TTS技(ji)術(shu)的(de)合(he)成(cheng)語(yu)音(yin)可將該數據提高到(dao)97%以(yi)上。融合(he)了(le)端到(dao)端TTS技(ji)術(shu)和傳(chuan)統TTS技(ji)術(shu),從(cong)多個(ge)方面(mian)改進(jin)了(le)語(yu)音(yin)合(he)成(cheng)。普通用戶定制“AI聲音(yin)”的(de)門檻更(geng)低了(le)。
發布語音合成技術KAN-TTS,據介紹,該技術可大幅提(ti)高合成語(yu)音與真人發聲(sheng)的相似度,并(bing)將語(yu)音合成定制成本降低10倍以上。
KAN-TTS技術由達摩院機器智能(neng)實驗室自主(zhu)研(yan)發(fa)。阿里方面稱,基于KAN-TTS技術(shu)的(de)合(he)成語音可將(jiang)該數據提(ti)高到97%以(yi)上。
據悉,KAN-TTS深度融合了(le)端(duan)到端(duan)TTS技術和傳統(tong)TTS技術,從多個方面改(gai)進了語音合(he)成(cheng)。傳統語音合(he)成(cheng)定(ding)制需要10小時(shi)以(yi)上的數(shu)據(ju)錄制和(he)(he)標注,對錄音人和(he)(he)錄音環境要(yao)求很高。從啟動定制到(dao)最終交付,項目周期長成本高。
而阿里(li)利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合(he)的方法,將語音合(he)成(cheng)定制周期壓(ya)縮(suo)3倍以(yi)上(shang)。也就(jiu)是(shi)說(shuo),用1小時有(you)效錄音(yin)數據和不到兩個月(yue)制作周(zhou)期,就能完(wan)成一次標準TTS定制。
此外,這(zhe)使得普(pu)通用戶定制“AI聲(sheng)音”的門檻更低。只需手機錄音十分鐘,就(jiu)能獲得與錄制聲(sheng)音高度相似(si)的合成語音。
阿里巴巴集團正(zheng)式在(zai)香港(gang)交易所掛牌上(shang)市(shi)(shi),成為首個同時在(zai)美股和(he)港(gang)股上(shang)市(shi)(shi)的中(zhong)國(guo)互聯(lian)網公司(si)。這個行...
杭州2022年第19屆亞(ya)運(yun)會組委會宣布,阿里巴巴成為(wei)杭州亞(ya)運(yun)會官方合作伙伴。作為(wei)創新技(ji)術,...
阿里(li)巴(ba)(ba)巴(ba)(ba)集團正式在港(gang)交所(suo)掛牌上市,開盤(pan)187港(gang)元(yuan),阿里(li)巴(ba)(ba)巴(ba)(ba)此次(ci)發行5億股(gu)(gu)新股(gu)(gu),另(ling)有7500...
收購是(shi)企業(ye)資(zi)本經營的(de)(de)一(yi)種形式,是(shi)一(yi)個(ge)公司通(tong)過產權(quan)交易取得其他(ta)公司一(yi)定程(cheng)度的(de)(de)控(kong)制權(quan),以實現一(yi)...