胡(hu)郁認為跟百度阿里等公(gong)司相比,科大訊飛(fei)的(de)(de)“互聯(lian)網”味道要稍(shao)微淡一(yi)些。他(ta)表(biao)示我(wo)國的(de)(de)產業和媒體對人(ren)工智(zhi)能的(de)(de)關注(zhu)太(tai)娛(yu)樂(le)太(tai)實(shi)用,真正(zheng)的(de)(de)創新是(shi)從(cong)理論出(chu)發(fa)(fa),從(cong)哲學角(jiao)度發(fa)(fa)展(zhan)出(chu)來的(de)(de),我(wo)們對科技的(de)(de)本質關注(zhu)太(tai)少。科大訊飛(fei)目前(qian)的(de)(de)主要優勢是(shi)語音識別領(ling)域,因為人(ren)工智(zhi)能,電信(xin)詐(zha)騙損失減少了(le)5個億。
相比于傳統的高新技術,中國是有優勢的。
第一(yi)(yi)個是(shi)經過這么多年(nian)(nian)核(he)心技術(shu)的(de)發展(zhan),特別是(shi)中(zhong)國(guo)863計劃以后,大(da)家會注意(yi)到(dao),在(zai)(zai)這一(yi)(yi)次的(de)人工智(zhi)能(neng)浪(lang)潮(chao)中(zhong),國(guo)內的(de)企業和(he)國(guo)外企業相比一(yi)(yi)點沒(mei)有落后。如果說(shuo),在(zai)(zai)5、60年(nian)(nian)代和(he)7、80年(nian)(nian)代那兩次(人工智(zhi)能(neng)發展(zhan)期),中(zhong)國(guo)企業還沒(mei)有辦法和(he)外國(guo)企業在(zai)(zai)技術(shu)上相比的(de)話(hua),那在(zai)(zai)這次(發展(zhan)浪(lang)潮(chao)里),我們(men)完全走在(zai)(zai)了前面。
第二個方面是在于,任何機器的交互離不開產業環境和商業生態。這個(ge)產業環(huan)境和商(shang)業生態,在7、80年代之前是什么?是電(dian)子產品。
大(da)家都(dou)知道,中國的(de)(de)(de)電子產品(pin)(pin)在(zai)7、80年代(dai)才剛剛起(qi)步,完全不(bu)具備在(zai)全球市場(chang)競爭(zheng)的(de)(de)(de)能力。但是在(zai)現在(zai),我們的(de)(de)(de)依賴(lai)的(de)(de)(de)是什么產品(pin)(pin)?是智能手機,是互聯網(wang)產品(pin)(pin)和移動互聯網(wang)產品(pin)(pin)。而在(zai)這方面,整(zheng)個中國不(bu)僅是從事語音技術的(de)(de)(de)公司對此(ci)有依賴(lai),相關的(de)(de)(de)商業公司也是,比如(ru)網(wang)上購票,還(huan)有各種的(de)(de)(de)O2O。
作(zuo)為一種連接型(xing)的技(ji)術(shu),把人和機器連接在(zai)一起(qi)之后,語(yu)音技(ji)術(shu)如果想在(zai)物聯網(wang)里面(mian)占(zhan)領很(hen)多市場,就必須和這些后臺的服務連接起(qi)來。所以說(shuo)從(cong)整個(ge)商業和技(ji)術(shu)環境上(shang)來講(jiang),中國現在(zai)應該說(shuo)也是很(hen)好,因(yin)為我們的互聯網(wang)公司(si)和美國方(fang)面(mian)來講(jiang),已經是一個(ge)同臺競技(ji),甚至均分天(tian)下的態勢。
在這點(dian)上,我覺得這為我們(men)在將來,在物聯網時代用(yong)語(yu)音交(jiao)互作為人機交(jiao)互的主要手段,并引(yin)發(fa)相應(ying)的商業模式,提(ti)供了很好的基礎。
而第三點,大家會注意到,無論是什么操作系統,PC的也好,手機的也好,雖然這些操作系統可能是美國的公司做的,比如說微軟、谷歌,但是要注意到,輸入法這個部分,都是中國公司占主導地位。
為(wei)什么?因為(wei)它和語(yu)言(yan)(yan)(yan)有關。一(yi)個(ge)簡單(dan)的(de)(de)鍵盤(pan)輸入法,就因為(wei)語(yu)言(yan)(yan)(yan)之(zhi)間的(de)(de)差異導致這(zhe)(zhe)么大的(de)(de)差異。那(nei)么大家可以想象一(yi)下,一(yi)個(ge)包括了(le)語(yu)音(yin)識別、語(yu)音(yin)合成(cheng)、自然語(yu)言(yan)(yan)(yan)理(li)解的(de)(de)語(yu)音(yin)系統,語(yu)言(yan)(yan)(yan)之(zhi)間的(de)(de)壁壘會(hui)有多(duo)高。中國公司在(zai)這(zhe)(zhe)方面會(hui)完(wan)全具有優勢。
所以(yi)說(shuo)從(cong)這三個方面來(lai)(lai)講,我(wo)們在將來(lai)(lai)的物聯網時代里(li)面,無論是(shi)從(cong)技術本身,還是(shi)從(cong)語(yu)言(yan)的差(cha)異化(hua)本身,還是(shi)從(cong)商業的生態和環境本身,我(wo)們現(xian)在都和國(guo)外(wai)公司完全處于同(tong)一個水(shui)平。所以(yi)在這一波浪潮(chao)中(zhong),我(wo)們有(you)信心中(zhong)國(guo)會成長出一批國(guo)際(ji)水(shui)準的公司出來(lai)(lai)。
不(bu)可否認,我們對(dui)人(ren)工智(zhi)能(neng)的了解(jie),不(bu)要(yao)說產業(ye)界,就是媒體,其(qi)實對(dui)人(ren)工智(zhi)能(neng)更多的認識是落(luo)在應用(yong)特(te)性(xing)和(he)娛樂特(te)性(xing)上。而美國(guo)的很多人(ren),是真正從(cong)理論(lun)的角度,進行非常深入的探討。
如(ru)果我(wo)們(men)只(zhi)談論(lun)應(ying)用和(he)娛樂(le)層(ceng)面上的(de)東西(xi)的(de)話,我(wo)們(men)是(shi)得不了圖靈獎的(de),也(ye)得不了諾貝爾(er)獎,也(ye)不能創造信息論(lun)這些東西(xi)。美國所謂(wei)原(yuan)創性的(de)研究,是(shi)從理(li)論(lun)的(de)根基出發(fa),建立一套(tao)完(wan)整的(de)思(si)維方式。而有(you)許多(duo)理(li)論(lun)研究的(de)東西(xi)是(shi)不會產業化的(de),沒有(you)產業化價(jia)值的(de)。它(ta)只(zhi)是(shi)一種哲學化的(de)思(si)考,而這些東西(xi)我(wo)們(men)沒有(you)關心。
哲學會產生真正的創新。創新(xin)(xin)有(you)很多(duo)種(zhong),有(you)一種(zhong)是在最(zui)原始(shi)的(de)技術(shu)上(shang)創新(xin)(xin)。而我們講的(de)很多(duo)其實是在應用層(ceng)面(mian)上(shang)創新(xin)(xin),或(huo)者在技術(shu)層(ceng)面(mian)上(shang)創新(xin)(xin),但不是在科學的(de)層(ceng)面(mian)上(shang)去(qu)發現(xian)和創新(xin)(xin)。
所以在這個層面上來講,我覺得國內應該從兩個方面,恰恰是我們的研究的部分,我們的研究院所,我們的高校,可能應該更加著重于在理論方面的深入。而我們的(de)產(chan)業界(jie),不應(ying)該(gai)僅僅去應(ying)用它,而且應(ying)該(gai)在技(ji)術方面去做(zuo)大規模的(de)整合和創新(xin)。
因為人(ren)工(gong)智能(neng)就(jiu)像航空(kong)發動機(ji)一(yi)樣,里面有(you)非常(chang)非常(chang)多(duo)的(de)零件,有(you)視覺(jue)的(de),有(you)聽覺(jue)的(de)。你(ni)要(yao)把它們綜合在(zai)(zai)(zai)一(yi)起,而(er)且每一(yi)個(ge)都要(yao)做(zuo)到世界上(shang)最好。我覺(jue)得現在(zai)(zai)(zai)學術界可能(neng)因為要(yao)和(he)產業(ye)界對接,做(zuo)了很多(duo)技(ji)術層(ceng)面上(shang),和(he)應用(yong)相關的(de)創新(xin)。而(er)產業(ye)界還沒(mei)有(you)能(neng)力,來做(zuo)整(zheng)體性、系統(tong)性創新(xin)的(de)工(gong)作,比較少。所以我覺(jue)得這就(jiu)是(shi)我們和(he)美國相比有(you)差異的(de)所在(zai)(zai)(zai)。
我(wo)覺得我(wo)們在學術上,理論的(de)深(shen)度,和(he)愿意去花長時(shi)間究本質的(de)工作(zuo)還是太少,還應該增(zeng)強。
智(zhi)能(neng)語音是訊(xun)飛整個(ge)人工(gong)智(zhi)能(neng)戰(zhan)略中(zhong)的(de)一部分。而訊(xun)飛人工(gong)智(zhi)能(neng)戰(zhan)略的(de)核心,是基于語音和(he)語言(yan)的(de)認知智(zhi)能(neng)。
什么是認知智能?比如在(zai)醫療的過(guo)程中,我們(men)需要通(tong)過(guo)病例幫(bang)助(zhu)醫生(sheng)分析病人可能(neng)會得什么病,吃(chi)什么藥,這就是一種(zhong)認知智能(neng)。包括在(zai)教育里面,我們(men)通(tong)過(guo)手(shou)寫的試(shi)卷來(lai)(lai)判(pan)斷學(xue)生(sheng)的得分,并給(gei)出改(gai)進的意見。這些都是和(he)語(yu)言,和(he)人的概念和(he)推理有關的。除(chu)了交互之外(wai),它們(men)能(neng)給(gei)我們(men)的生(sheng)活帶來(lai)(lai)更多改(gai)進。
我再舉一個例子,和我們的安全有關。在7、8月份,電話詐騙非常猖獗,特別是臨開學的那段時間。有很多上學的同學不是因為詐騙,做出了很多不理性的事情么?安徽省8月份電話詐騙的發生次數下降了60%,而(er)(er)同期全(quan)國其他地區增(zeng)長(chang)了58%。為(wei)(wei)什么能做到這點?因(yin)為(wei)(wei)我(wo)們(men)在(zai)安徽省所有的(de)電話里(li)面(mian)做了一個(ge)監控系(xi)統,它(ta)可以對(dui)通話內容進行(xing)分析(xi),對(dui)那些詐騙(pian)性質行(xing)為(wei)(wei)自(zi)動作出(chu)提醒,而(er)(er)這個(ge)過程是(shi)完全(quan)自(zi)動化(hua)的(de)。這樣就為(wei)(wei)安徽省避免了5個(ge)億以上的(de)可能的(de)損(sun)失(shi)。
我相信大家也注意到了,我們演講的時候會有一個同步實時顯示文字的(de)技術。就(jiu)(jiu)(jiu)是說我在(zai)上面講話的(de)同時,文字(zi)出(chu)(chu)來(lai)了(le),對(dui)你(ni)們(記者)來(lai)說是最有用的(de)。這(zhe)個產品馬上就(jiu)(jiu)(jiu)要(yao)開發出(chu)(chu)來(lai)了(le),最理想的(de)狀(zhuang)態就(jiu)(jiu)(jiu)是我在(zai)這(zhe)邊說話,你(ni)們的(de)屏幕(mu)上就(jiu)(jiu)(jiu)能實(shi)時顯示出(chu)(chu)來(lai)我講的(de)內容。
在去年的(de)發(fa)布(bu)會上,我們發(fa)布(bu)了這(zhe)個功(gong)能以后。大(da)家可(ke)以看(kan)到(dao),今(jin)年阿(a)里和(he)搜(sou)狗都(dou)展示了同樣的(de)技術。這(zhe)也代表了一個發(fa)展方向(xiang)。這(zhe)個方向(xiang)可(ke)能和(he)語音交互是沒有關系的(de),但和(he)語音(技術)有關系。
首先iPhone我們是搞不定的,除非破解它。iPhone本身(shen)就(jiu)是一個垂直的(de)生態(tai)。而且這個問題不僅(jin)僅(jin)是在(zai)中國,美國也(ye)是。但是iPhone自己的(de)語音技術很差,導致(zhi)它的(de)用戶體驗相對于(yu)其(qi)他公(gong)司、產(chan)品會有劣勢(shi)。
但對Android來講(jiang),情(qing)況是(shi)(shi)不一樣的。因為(wei)谷歌也知(zhi)道(dao)Android有全球(qiu)不通(tong)用的地方。比(bi)如說(shuo)審美、風(feng)格,比(bi)如說(shuo)語言相關的部分(fen):輸入法、交互。這就造成(cheng)了Android系(xi)統在(zai)設計的時候(hou)就是(shi)(shi)一個比(bi)較(jiao)開放的系(xi)統。
這就造成了第三方UI其實接管了中間層的(de)(de)(de)一些(xie)功能,也(ye)導致了這些(xie)領域是可以(yi)進(jin)入的(de)(de)(de)。而(er)且現在很(hen)多(duo)的(de)(de)(de)智(zhi)能硬件,其實用的(de)(de)(de)都是Android的(de)(de)(de)操作系統(tong)。
我相信在將來(lai)的發(fa)展中,世界上會存在兩種公司(si)(si)。一種公司(si)(si)是(shi)垂直產(chan)品型公司(si)(si),比如(ru)說做手機(ji),就一直做手機(ji),手機(ji)技術不可能給別(bie)人(ren)用。世界上看起來(lai),最多有8到9家這樣的手機(ji)公司(si)(si),加起來(lai)產(chan)量(liang)可能到全球的90%-到95%以上。
另外還有些(xie)公(gong)司(si),像谷(gu)歌這樣,就(jiu)是平臺(tai)型的(de)公(gong)司(si)。我提供一些(xie)基礎性的(de)工作,給各個廠商都能用。但(dan)是做了平臺(tai)之后就(jiu)要面(mian)臨控制權大小的(de)問(wen)題。有可能控制權不在(zai)自己(ji)手(shou)(shou)上,而在(zai)手(shou)(shou)機廠商手(shou)(shou)上。
所以在未來的發展過程里,訊飛要做的不僅僅是手機,而是我剛才說的(de)各個(ge)(ge)(ge)領(ling)域。這(zhe)(zhe)些領(ling)域里,有(you)的(de)是幾家大公(gong)(gong)司(si)聯合壟斷了市場(chang),有(you)的(de)領(ling)域會(hui)是成千上萬個(ge)(ge)(ge)公(gong)(gong)司(si)來(lai)分享市場(chang)。比如說玩具、機(ji)(ji)器人,就是后面的(de)這(zhe)(zhe)種(zhong)(zhong)。而且我相信現(xian)在這(zhe)(zhe)么多(duo)機(ji)(ji)器人公(gong)(gong)司(si),到最后也不會(hui)合并成大的(de)公(gong)(gong)司(si),因(yin)為用戶(hu)需要多(duo)樣性(xing)(xing)的(de)個(ge)(ge)(ge)性(xing)(xing)化(hua)產(chan)(chan)品(pin)。而手機(ji)(ji)這(zhe)(zhe)種(zhong)(zhong)產(chan)(chan)品(pin),雖(sui)然有(you)差(cha)異,但還是個(ge)(ge)(ge)工具性(xing)(xing)質的(de)產(chan)(chan)品(pin)。
所以訊飛會成為一個平臺型的公司,不僅幫(bang)平(ping)臺上的(de)公司提供核心技術,甚至(zhi)可以幫(bang)它們整(zheng)合各種各樣的(de)資源。我(wo)覺得我(wo)們是用這樣一個思路(lu)來發展的(de)。
場(chang)景的(de)問(wen)題(ti)其(qi)實(shi)和(he)剛才的(de)問(wen)題(ti),就(jiu)是內(nei)容方(fang)面(mian)是非常有關(guan)系的(de)。我(wo)們人(ren)在處(chu)理一(yi)件事(shi)的(de)時(shi)候(hou),你可(ke)以想象下你在訂一(yi)張(zhang)票(piao),你所要(yao)和(he)別人(ren)交談的(de)內(nei)容,嘴里面(mian)發出的(de)指令,其(qi)實(shi)相對來(lai)講不是開放的(de)集(ji)合,是封(feng)閉的(de)集(ji)合。
這里最難的問題就是怎么把它豐富起來,怎么讓它多覆蓋(些場景)。我們現在的做法就是一個點一個點去做。每(mei)做完一個點就(jiu)(jiu)拿到實際里(li)去用。越(yue)(yue)來(lai)(lai)越(yue)(yue)多的人用了之后(hou),語言的覆蓋性就(jiu)(jiu)會越(yue)(yue)來(lai)(lai)越(yue)(yue)好,這個場景的問題就(jiu)(jiu)解決了。
那在這(zhe)(zhe)個(ge)過(guo)程里怎(zen)么(me)(me)加(jia)速這(zhe)(zhe)個(ge)問題(ti)呢?我(wo)(wo)(wo)們(men)怎(zen)么(me)(me)在做(zuo)一(yi)些(xie)場景(jing)的(de)(de)(de)時(shi)候(hou),其他場景(jing)也能(neng)變快呢?這(zhe)(zhe)就(jiu)(jiu)是我(wo)(wo)(wo)們(men)為(wei)什么(me)(me)要做(zuo)那些(xie)高考(kao)答題(ti)機(ji)器人(ren)的(de)(de)(de)原因(yin)。它能(neng)學(xue)會系統學(xue)習的(de)(de)(de)方法,當我(wo)(wo)(wo)們(men)做(zuo)了一(yi)兩個(ge)場景(jing)之后(hou),就(jiu)(jiu)能(neng)轉移到其他很多場景(jing)上。這(zhe)(zhe)樣(yang)能(neng)使我(wo)(wo)(wo)們(men)的(de)(de)(de)覆蓋快速增(zeng)加(jia)。我(wo)(wo)(wo)們(men)通過(guo)這(zhe)(zhe)樣(yang)的(de)(de)(de)方式(shi)來(lai)解決(jue)這(zhe)(zhe)樣(yang)的(de)(de)(de)問題(ti)。
當(dang)然(ran)擔心,但擔心了也沒(mei)用。
任(ren)何一個(ge)新技術出(chu)來(lai)的時候都會魚龍混雜。人類有夸大預期的本性在里面(mian),是(shi)(shi)人類的社會特性決定的。認(ren)識到這個(ge)規律之后就(jiu)不會覺得這事是(shi)(shi)什么壞事。我(wo)們能做的就(jiu)是(shi)(shi)在局部(bu)上防(fang)止(zhi)過熱。
所以我們應該考慮的是如何利用這種周期性的狂熱來合理布局。從投資(zi)(zi)人(ren)(ren)角(jiao)度(du)來說,投資(zi)(zi)人(ren)(ren)很容(rong)易找到(dao)錢,但投資(zi)(zi)人(ren)(ren)可(ke)以利用這(zhe)種(zhong)環境去找最(zui)有價(jia)值的(de)公(gong)司來投資(zi)(zi)。所以只能說改(gai)(gai)變你能改(gai)(gai)變的(de),接受你不能改(gai)(gai)變的(de)。
我覺得在人工智能領域里有兩個領域是有價值的。一個是人工智能核心技術研究,他們不一定有經驗去進行商業化,我們可以投資他,提供經驗。另外是如何利用人工智能技術來解決現實問題,這通常(chang)在大的公(gong)司里面(mian),他們都有很大的產(chan)業(ye)基(ji)礎,只要把新技術嫁接進(jin)來。
大部分的(de)公(gong)司(si)并不會因(yin)為人工智(zhi)能出(chu)現而進(jin)行重組和重構。比如農業,人工智(zhi)能只是一(yi)個改進(jin)的(de)工具,所以(yi)在這些領域里,原有(you)的(de)大公(gong)司(si)依然(ran)占有(you)優勢。所以(yi)更有(you)價(jia)值的(de)是去(qu)尋找(zhao)哪(na)些懂(dong)得怎么利用人工智(zhi)能的(de)人來投資。
比較公司要看戰略,我不是特別(bie)了解百度的戰略,因(yin)為每年百度的重點不一(yi)(yi)樣(yang)。但是過去三(san)年里面我們一(yi)(yi)直在做運(yun)算(suan)智(zhi)能(neng)、感知智(zhi)能(neng)和認知智(zhi)能(neng),而(er)且會定期公(gong)(gong)(gong)布進(jin)展,有(you)清晰(xi)的商業模式。這是我們和互聯網(wang)公(gong)(gong)(gong)司(si)的不同,是專注科技(ji)創(chuang)新的公(gong)(gong)(gong)司(si)。科技(ji)創(chuang)新公(gong)(gong)(gong)司(si)更(geng)像(xiang)是爬山(shan)的公(gong)(gong)(gong)司(si),一(yi)(yi)步一(yi)(yi)步去爬到頂峰。
但互聯網(wang)有很(hen)多(duo)機會(hui),所以很(hen)多(duo)公司都是(shi)(shi)沖浪(lang)型的,需要不(bu)停地抓住下(xia)一(yi)個浪(lang)潮,如果不(bu)是(shi)(shi),就換了(le)。
我們還是堅持做人工智能,堅信交(jiao)互(hu)(hu)革命(ming)那天會到來。所以一個公司要(yao)有清(qing)晰(xi)地(di)戰略,而(er)且要(yao)把戰略傳達(da)給別人。我們戰略十分清(qing)晰(xi):我們是一個技術(shu)創新性公司,解決人機(ji)交(jiao)互(hu)(hu)這(zhe)個問題。
在(zai)行業(ye)里面,我們用我們的(de)人(ren)工智(zhi)能技術(shu)幫(bang)助醫院、學校、司(si)法(fa)、金(jin)融(rong)機構去改善他(ta)們的(de)問(wen)題。這里面有很多“臟(zang)活(huo)(huo)累活(huo)(huo)”,要做很多結合型的(de)工作。互(hu)聯網公司(si)追求收益,毛利要非常(chang)高。而且有很多“臟(zang)活(huo)(huo)”不一(yi)定愿意去干。但(dan)在(zai)產業(ye)互(hu)聯網階段,和傳統(tong)領域結合,是少不了(le)這一(yi)步的(de)。
當(dang)然不(bu)是說一味去做(zuo)基(ji)礎性的工(gong)作。上面要有(you)頂(ding)天立地(di)的東西,但是不(bu)能因為(wei)有(you)這個(ge)就不(bu)能彎腰了,絕對不(bu)是這個(ge)概念。
所以我覺得中國需要更多爬山型的公司,無(wu)論(lun)外面怎(zen)么(me)變化。外面無(wu)論(lun)是(shi)(shi)互(hu)聯網時(shi)(shi)代也好(hao),移動互(hu)聯網時(shi)(shi)代也好(hao),物(wu)聯網時(shi)(shi)代也好(hao),這(zhe)都(dou)是(shi)(shi)外圍環境的變化。但是(shi)(shi)公司征服一個領域(yu),具有爬山的本質是(shi)(shi)必(bi)不可(ke)少的。