胡郁(yu)認為跟百度阿里等(deng)公司相比,科(ke)大(da)訊(xun)飛的(de)(de)“互聯網”味道要稍(shao)微淡一些。他表示我國的(de)(de)產業(ye)和媒(mei)體對人(ren)工智能(neng)(neng)的(de)(de)關注(zhu)太(tai)娛樂太(tai)實用,真(zhen)正(zheng)的(de)(de)創新是從理(li)論出(chu)發(fa),從哲(zhe)學角(jiao)度發(fa)展出(chu)來的(de)(de),我們(men)對科(ke)技(ji)的(de)(de)本質關注(zhu)太(tai)少(shao)。科(ke)大(da)訊(xun)飛目前的(de)(de)主要優勢是語音識別(bie)領域,因(yin)為人(ren)工智能(neng)(neng),電信詐騙(pian)損失減少(shao)了5個(ge)億(yi)。
相比于傳統的高新技術,中國是有優勢的。
第一(yi)個是(shi)經過這么(me)多年核(he)心技術(shu)的發展,特別是(shi)中國863計劃以后,大(da)家(jia)會注意到,在(zai)這一(yi)次的人(ren)工智(zhi)能(neng)浪潮(chao)中,國內的企業和(he)國外(wai)企業相(xiang)比一(yi)點沒有落后。如果說,在(zai)5、60年代(dai)和(he)7、80年代(dai)那兩次(人(ren)工智(zhi)能(neng)發展期),中國企業還沒有辦(ban)法和(he)外(wai)國企業在(zai)技術(shu)上相(xiang)比的話,那在(zai)這次(發展浪潮(chao)里(li)),我們完全(quan)走(zou)在(zai)了(le)前(qian)面。
第二個方面是在于,任何機器的交互離不開產業環境和商業生態。這個產業(ye)環境和(he)商業(ye)生態,在7、80年代之前是什(shen)么(me)?是電子產品。
大(da)家都知(zhi)道,中國的(de)電子(zi)產(chan)品在(zai)7、80年代(dai)才剛剛起(qi)步(bu),完全不具備在(zai)全球市(shi)場競爭的(de)能(neng)力。但是(shi)(shi)(shi)(shi)在(zai)現在(zai),我們的(de)依(yi)賴(lai)的(de)是(shi)(shi)(shi)(shi)什么產(chan)品?是(shi)(shi)(shi)(shi)智能(neng)手(shou)機,是(shi)(shi)(shi)(shi)互聯網產(chan)品和移動互聯網產(chan)品。而在(zai)這(zhe)方面,整個(ge)中國不僅是(shi)(shi)(shi)(shi)從事語(yu)音(yin)技術的(de)公司對此有依(yi)賴(lai),相關(guan)的(de)商業公司也是(shi)(shi)(shi)(shi),比如(ru)網上購票(piao),還有各種(zhong)的(de)O2O。
作(zuo)為(wei)一種連(lian)(lian)接(jie)(jie)型的(de)技(ji)(ji)術,把人和機器連(lian)(lian)接(jie)(jie)在(zai)一起(qi)之后,語音技(ji)(ji)術如果(guo)想在(zai)物聯網里面占領很(hen)多市場(chang),就必須(xu)和這些(xie)后臺(tai)的(de)服務連(lian)(lian)接(jie)(jie)起(qi)來。所以說從整個商業和技(ji)(ji)術環境上來講(jiang),中國現在(zai)應(ying)該說也是很(hen)好(hao),因為(wei)我們的(de)互聯網公(gong)司和美國方面來講(jiang),已(yi)經(jing)是一個同臺(tai)競技(ji)(ji),甚至均分天下的(de)態勢。
在這(zhe)點上,我覺(jue)得這(zhe)為(wei)(wei)我們(men)在將來,在物聯網時(shi)代用(yong)語音(yin)交互(hu)作為(wei)(wei)人機(ji)交互(hu)的主要手段(duan),并引發相應(ying)的商業模式,提供(gong)了很好的基(ji)礎。
而第三點,大家會注意到,無論是什么操作系統,PC的也好,手機的也好,雖然這些操作系統可能是美國的公司做的,比如說微軟、谷歌,但是要注意到,輸入法這個部分,都是中國公司占主導地位。
為什么?因為它和語(yu)(yu)(yu)言(yan)有關。一個簡單的(de)鍵盤輸入(ru)法,就因為語(yu)(yu)(yu)言(yan)之(zhi)間的(de)差(cha)異導致這么大的(de)差(cha)異。那(nei)么大家(jia)可(ke)以(yi)想象(xiang)一下,一個包括了(le)語(yu)(yu)(yu)音(yin)識別、語(yu)(yu)(yu)音(yin)合成(cheng)、自然語(yu)(yu)(yu)言(yan)理解的(de)語(yu)(yu)(yu)音(yin)系統,語(yu)(yu)(yu)言(yan)之(zhi)間的(de)壁壘會有多高。中國公司在這方面會完全具有優勢。
所以(yi)說從(cong)(cong)這三個(ge)方(fang)面來(lai)講,我(wo)們在(zai)(zai)將來(lai)的(de)物聯網時(shi)代里面,無論是從(cong)(cong)技術本身,還是從(cong)(cong)語言的(de)差異化本身,還是從(cong)(cong)商(shang)業的(de)生態(tai)和環(huan)境本身,我(wo)們現(xian)在(zai)(zai)都和國外公司(si)完全處(chu)于同一個(ge)水平。所以(yi)在(zai)(zai)這一波(bo)浪潮中,我(wo)們有信心中國會成長出一批國際水準的(de)公司(si)出來(lai)。
不可否認,我們對(dui)(dui)人工智能(neng)的(de)了解,不要說產業界,就是媒(mei)體,其實對(dui)(dui)人工智能(neng)更多(duo)的(de)認識(shi)是落(luo)在應(ying)用特(te)性和娛樂特(te)性上。而(er)美國的(de)很多(duo)人,是真正(zheng)從理論的(de)角(jiao)度,進行非(fei)常(chang)深入(ru)的(de)探討。
如(ru)果我(wo)(wo)們只(zhi)談論(lun)(lun)應用和娛(yu)樂層(ceng)面上的(de)東(dong)西(xi)(xi)的(de)話,我(wo)(wo)們是(shi)(shi)得不了圖(tu)靈獎的(de),也(ye)得不了諾貝爾獎,也(ye)不能(neng)創造信息(xi)論(lun)(lun)這(zhe)些東(dong)西(xi)(xi)。美國(guo)所謂原創性的(de)研究,是(shi)(shi)從理論(lun)(lun)的(de)根基出發,建立一套完整的(de)思維方式。而(er)(er)有(you)許(xu)多(duo)理論(lun)(lun)研究的(de)東(dong)西(xi)(xi)是(shi)(shi)不會產業化(hua)的(de),沒(mei)有(you)產業化(hua)價值的(de)。它只(zhi)是(shi)(shi)一種哲學化(hua)的(de)思考,而(er)(er)這(zhe)些東(dong)西(xi)(xi)我(wo)(wo)們沒(mei)有(you)關心。
哲學會產生真正的創新。創(chuang)新有很多(duo)種,有一種是(shi)在(zai)最原始(shi)的(de)技術上創(chuang)新。而我(wo)們(men)講的(de)很多(duo)其實是(shi)在(zai)應用(yong)層(ceng)面上創(chuang)新,或(huo)者(zhe)在(zai)技術層(ceng)面上創(chuang)新,但不(bu)是(shi)在(zai)科學(xue)的(de)層(ceng)面上去(qu)發現和創(chuang)新。
所以在這個層面上來講,我覺得國內應該從兩個方面,恰恰是我們的研究的部分,我們的研究院所,我們的高校,可能應該更加著重于在理論方面的深入。而(er)我們(men)的產(chan)業(ye)界,不(bu)應該僅僅去應用它,而(er)且(qie)應該在技術方(fang)面去做大規模的整合和創(chuang)新(xin)。
因為人(ren)工智能(neng)就(jiu)(jiu)像航(hang)空(kong)發動機一(yi)(yi)樣,里面有(you)非(fei)常(chang)非(fei)常(chang)多的零件(jian),有(you)視(shi)覺(jue)的,有(you)聽覺(jue)的。你要(yao)把它們(men)(men)綜合在(zai)一(yi)(yi)起,而且每一(yi)(yi)個都要(yao)做(zuo)到世界(jie)(jie)上(shang)最好。我(wo)覺(jue)得(de)現(xian)在(zai)學術(shu)界(jie)(jie)可能(neng)因為要(yao)和(he)產業界(jie)(jie)對接(jie),做(zuo)了很(hen)多技術(shu)層面上(shang),和(he)應用相關的創(chuang)新。而產業界(jie)(jie)還(huan)沒有(you)能(neng)力,來做(zuo)整(zheng)體(ti)性、系(xi)統性創(chuang)新的工作,比較(jiao)少(shao)。所以我(wo)覺(jue)得(de)這就(jiu)(jiu)是我(wo)們(men)(men)和(he)美國相比有(you)差異的所在(zai)。
我(wo)覺得我(wo)們在學術上(shang),理論的(de)深(shen)度,和愿意去花(hua)長(chang)時間究本質的(de)工作還是太少(shao),還應該增強。
智(zhi)能語(yu)音是(shi)訊飛(fei)整個人工智(zhi)能戰略中的一部分(fen)。而訊飛(fei)人工智(zhi)能戰略的核心(xin),是(shi)基于語(yu)音和語(yu)言(yan)的認知(zhi)智(zhi)能。
什么是認知智能?比(bi)如在醫療的(de)過(guo)程(cheng)中,我(wo)(wo)們需(xu)要通過(guo)病(bing)例(li)幫助醫生分析病(bing)人(ren)可能(neng)會(hui)得什么病(bing),吃什么藥,這就是一種認(ren)知智能(neng)。包括在教育(yu)里面,我(wo)(wo)們通過(guo)手寫的(de)試卷來判斷學生的(de)得分,并給出改進的(de)意見。這些都是和(he)語言(yan),和(he)人(ren)的(de)概念和(he)推理有關(guan)的(de)。除了交互之外,它們能(neng)給我(wo)(wo)們的(de)生活(huo)帶來更多改進。
我再舉一個例子,和我們的安全有關。在7、8月份,電話詐騙非常猖獗,特別是臨開學的那段時間。有很多上學的同學不是因為詐騙,做出了很多不理性的事情么?安徽省8月份電話詐騙的發生次數下降了60%,而同期全(quan)國(guo)其他地(di)區增長了58%。為(wei)(wei)什(shen)么能做到這(zhe)點(dian)?因為(wei)(wei)我們在(zai)安(an)徽省所有的電話(hua)里面(mian)做了一個監(jian)控系統,它可(ke)以(yi)(yi)對通(tong)話(hua)內容進行(xing)分析,對那些詐騙(pian)性(xing)質行(xing)為(wei)(wei)自(zi)動作出提(ti)醒,而這(zhe)個過程是完全(quan)自(zi)動化的。這(zhe)樣(yang)就為(wei)(wei)安(an)徽省避免了5個億(yi)以(yi)(yi)上的可(ke)能的損失(shi)。
我相信大家也注意到了,我們演講的時候會有一個同步實時顯示文字的(de)(de)技術。就是說我(wo)在(zai)上面講(jiang)話(hua)的(de)(de)同時(shi)(shi),文(wen)字出(chu)來了,對你們(記(ji)者(zhe))來說是最有用的(de)(de)。這個產品馬上就要開發出(chu)來了,最理想的(de)(de)狀態就是我(wo)在(zai)這邊說話(hua),你們的(de)(de)屏幕(mu)上就能實時(shi)(shi)顯(xian)示出(chu)來我(wo)講(jiang)的(de)(de)內容。
在去年(nian)的發布(bu)會(hui)上,我們發布(bu)了(le)(le)這(zhe)個(ge)功能以后。大家(jia)可以看(kan)到,今年(nian)阿里和(he)搜狗(gou)都(dou)展示了(le)(le)同樣的技術(shu)。這(zhe)也(ye)代表了(le)(le)一個(ge)發展方向(xiang)。這(zhe)個(ge)方向(xiang)可能和(he)語音(yin)交互是沒(mei)有(you)關系的,但和(he)語音(yin)(技術(shu))有(you)關系。
首先iPhone我們是搞不定的,除(chu)非破解它。iPhone本身就是(shi)一(yi)個垂(chui)直的(de)生態。而且這(zhe)個問題不(bu)僅(jin)僅(jin)是(shi)在中(zhong)國,美國也是(shi)。但(dan)是(shi)iPhone自己的(de)語音技術很差,導致它的(de)用戶(hu)體(ti)驗相(xiang)對于其他公司、產品會有(you)劣勢。
但對(dui)Android來講,情(qing)況(kuang)是不一樣(yang)的(de)。因(yin)為谷歌也知道Android有(you)全球不通用的(de)地方。比(bi)如說(shuo)審美、風格,比(bi)如說(shuo)語言相(xiang)關的(de)部分:輸入法(fa)、交(jiao)互。這(zhe)就(jiu)造成了Android系統在設計的(de)時(shi)候就(jiu)是一個比(bi)較開放的(de)系統。
這(zhe)(zhe)就造(zao)成了第三方UI其實接(jie)管了中間(jian)層(ceng)的一些(xie)功(gong)能,也導(dao)致了這(zhe)(zhe)些(xie)領(ling)域是可以進(jin)入的。而且現(xian)在(zai)很多的智(zhi)能硬(ying)件,其實用的都是Android的操作系統。
我相信在(zai)將來(lai)的(de)發(fa)展中(zhong),世界上會存(cun)在(zai)兩種公(gong)司。一種公(gong)司是垂直產品型(xing)公(gong)司,比如說做手機,就一直做手機,手機技術不(bu)可能給(gei)別人用。世界上看起(qi)來(lai),最多有8到9家這樣(yang)的(de)手機公(gong)司,加起(qi)來(lai)產量可能到全球的(de)90%-到95%以上。
另外還有些(xie)公司,像谷歌這樣,就(jiu)是平(ping)臺型的公司。我提供一些(xie)基礎(chu)性的工作,給各個(ge)廠(chang)商(shang)都(dou)能(neng)用。但是做了(le)平(ping)臺之后就(jiu)要(yao)面臨控(kong)制(zhi)權大(da)小的問題。有可能(neng)控(kong)制(zhi)權不在(zai)自己手上,而在(zai)手機廠(chang)商(shang)手上。
所以在未來的發展過程里,訊飛要做的不僅僅是手機,而(er)是(shi)(shi)我(wo)剛才說的(de)各(ge)個(ge)(ge)領(ling)域。這(zhe)(zhe)些領(ling)域里,有的(de)是(shi)(shi)幾家大(da)公司(si)(si)聯合(he)壟斷了市場,有的(de)領(ling)域會是(shi)(shi)成千(qian)上萬個(ge)(ge)公司(si)(si)來分享市場。比如說玩(wan)具(ju)、機器人(ren),就是(shi)(shi)后(hou)面的(de)這(zhe)(zhe)種。而(er)且我(wo)相信現在這(zhe)(zhe)么多機器人(ren)公司(si)(si),到最(zui)后(hou)也(ye)不會合(he)并成大(da)的(de)公司(si)(si),因為用(yong)戶需(xu)要(yao)多樣性的(de)個(ge)(ge)性化(hua)產(chan)品。而(er)手機這(zhe)(zhe)種產(chan)品,雖然有差(cha)異,但還是(shi)(shi)個(ge)(ge)工具(ju)性質的(de)產(chan)品。
所以訊飛會成為一個平臺型的公司,不僅(jin)幫平臺上的(de)公司提供核心技術,甚(shen)至可以(yi)幫它們整合各(ge)種各(ge)樣的(de)資源。我(wo)覺得我(wo)們是用(yong)這樣一個(ge)思路來發(fa)展的(de)。
場(chang)景的(de)(de)問題其(qi)實和剛才的(de)(de)問題,就是(shi)內(nei)容方面是(shi)非常有關系的(de)(de)。我們人在處理一(yi)件事的(de)(de)時候,你可(ke)以想象下(xia)你在訂(ding)一(yi)張票(piao),你所要和別人交談的(de)(de)內(nei)容,嘴里面發出的(de)(de)指令,其(qi)實相對來講不是(shi)開放的(de)(de)集(ji)合,是(shi)封閉的(de)(de)集(ji)合。
這里最難的問題就是怎么把它豐富起來,怎么讓它多覆蓋(些場景)。我們現在的做法就是一個點一個點去做。每做完(wan)一(yi)個點就拿到實際里去用(yong)。越來(lai)(lai)越多的人用(yong)了之后,語言的覆蓋性就會(hui)越來(lai)(lai)越好(hao),這個場景的問題就解決了。
那在這(zhe)(zhe)個(ge)(ge)(ge)過(guo)程里怎么加速這(zhe)(zhe)個(ge)(ge)(ge)問題(ti)呢(ni)?我(wo)們怎么在做一些(xie)場(chang)(chang)景(jing)的(de)(de)時候,其(qi)他(ta)場(chang)(chang)景(jing)也能(neng)變快(kuai)呢(ni)?這(zhe)(zhe)就是(shi)我(wo)們為(wei)什(shen)么要做那些(xie)高考(kao)答題(ti)機器(qi)人(ren)的(de)(de)原因。它能(neng)學會系統學習(xi)的(de)(de)方法,當我(wo)們做了一兩個(ge)(ge)(ge)場(chang)(chang)景(jing)之后,就能(neng)轉移到(dao)其(qi)他(ta)很多場(chang)(chang)景(jing)上。這(zhe)(zhe)樣(yang)(yang)能(neng)使我(wo)們的(de)(de)覆蓋快(kuai)速增加。我(wo)們通過(guo)這(zhe)(zhe)樣(yang)(yang)的(de)(de)方式來解決這(zhe)(zhe)樣(yang)(yang)的(de)(de)問題(ti)。
當然擔(dan)心,但擔(dan)心了也沒用。
任何一個(ge)新技(ji)術出來的時候都會魚龍混雜。人(ren)類有夸大預期的本性(xing)在里(li)面(mian),是人(ren)類的社會特性(xing)決定的。認識到這(zhe)個(ge)規律之后就不會覺得這(zhe)事(shi)是什(shen)么壞事(shi)。我們能(neng)做的就是在局部(bu)上防止過熱。
所以我們應該考慮的是如何利用這種周期性的狂熱來合理布局。從投資(zi)人角度來(lai)說(shuo),投資(zi)人很容易找到錢(qian),但投資(zi)人可以利用(yong)這種(zhong)環(huan)境去(qu)找最有價值的公司(si)來(lai)投資(zi)。所以只能說(shuo)改變你(ni)能改變的,接(jie)受(shou)你(ni)不能改變的。
我覺得在人工智能領域里有兩個領域是有價值的。一個是人工智能核心技術研究,他們不一定有經驗去進行商業化,我們可以投資他,提供經驗。另外是如何利用人工智能技術來解決現實問題,這(zhe)通常在大的(de)(de)公(gong)司里面,他(ta)們都有(you)很大的(de)(de)產業基(ji)礎,只要把新技(ji)術嫁接進來。
大部分(fen)的(de)公(gong)司并不(bu)會(hui)因為人工智能出(chu)現而(er)進(jin)行重組和重構。比(bi)如(ru)農(nong)業,人工智能只是一個改進(jin)的(de)工具,所以在(zai)這些(xie)領域里,原有(you)的(de)大公(gong)司依然占(zhan)有(you)優勢。所以更有(you)價值的(de)是去尋找哪些(xie)懂得怎么利用(yong)人工智能的(de)人來投資。
比較公司要看戰略,我不(bu)是特別了解百(bai)度的(de)戰略,因(yin)為每年百(bai)度的(de)重點不(bu)一樣。但是過(guo)去三(san)年里面我們一直在做運算智能(neng)、感知(zhi)智能(neng)和(he)認知(zhi)智能(neng),而(er)且會定(ding)期(qi)公(gong)(gong)布進展,有清晰的(de)商業模式。這是我們和(he)互聯網公(gong)(gong)司的(de)不(bu)同,是專注科(ke)技(ji)創新的(de)公(gong)(gong)司。科(ke)技(ji)創新公(gong)(gong)司更像是爬山的(de)公(gong)(gong)司,一步一步去爬到頂峰。
但互(hu)聯網有(you)很多機會,所以很多公司都是沖浪型的,需要不停(ting)地抓住下一(yi)個浪潮,如果不是,就換了。
我們還是堅持做人工智能,堅信交(jiao)互革命(ming)那天(tian)會(hui)到來。所以一(yi)個公司(si)要(yao)有清晰地戰(zhan)略,而且要(yao)把戰(zhan)略傳達給別人。我們(men)戰(zhan)略十分清晰:我們(men)是一(yi)個技(ji)術創新(xin)性公司(si),解決人機(ji)交(jiao)互這個問題。
在(zai)行(xing)業(ye)里面(mian),我們用我們的(de)人工智能技術(shu)幫助醫(yi)院(yuan)、學校、司法、金融機(ji)構去(qu)改善他們的(de)問題。這(zhe)里面(mian)有很多“臟活累活”,要(yao)做很多結合型的(de)工作。互(hu)聯網公(gong)司追求收益,毛利要(yao)非常高(gao)。而且(qie)有很多“臟活”不一定(ding)愿意去(qu)干。但在(zai)產業(ye)互(hu)聯網階段,和傳統領域結合,是少不了這(zhe)一步(bu)的(de)。
當然不(bu)是(shi)說(shuo)一味去做基礎性的(de)工作(zuo)。上面要有頂(ding)天立地的(de)東西,但是(shi)不(bu)能因(yin)為(wei)有這個就不(bu)能彎腰了,絕對(dui)不(bu)是(shi)這個概念。
所以我覺得中國需要更多爬山型的公司,無論(lun)外面怎么變(bian)化。外面無論(lun)是(shi)(shi)互(hu)聯網時(shi)代也好(hao),移動互(hu)聯網時(shi)代也好(hao),物聯網時(shi)代也好(hao),這都(dou)是(shi)(shi)外圍環境的變(bian)化。但(dan)是(shi)(shi)公司征服一(yi)個領域,具(ju)有爬山的本質(zhi)是(shi)(shi)必不可(ke)少的。