胡郁認為跟百度阿里(li)等公司(si)相(xiang)比,科大訊飛的(de)“互聯網(wang)”味(wei)道要稍微淡一些。他表示我(wo)國(guo)的(de)產業和媒體對人(ren)工(gong)智能的(de)關注(zhu)太(tai)娛樂(le)太(tai)實用(yong),真正的(de)創新(xin)是從(cong)理論出發(fa),從(cong)哲學角度發(fa)展出來的(de),我(wo)們對科技的(de)本質(zhi)關注(zhu)太(tai)少(shao)。科大訊飛目前的(de)主要優勢(shi)是語(yu)音識別領域,因為人(ren)工(gong)智能,電信詐騙(pian)損失減少(shao)了5個(ge)億。
相比于傳統的高新技術,中國是有優勢的。
第一個是(shi)(shi)經過這(zhe)么(me)多年(nian)核心(xin)技術的(de)發展,特(te)別是(shi)(shi)中(zhong)國(guo)863計(ji)劃以(yi)后,大家會注(zhu)意到,在(zai)這(zhe)一次的(de)人工智能浪(lang)潮中(zhong),國(guo)內的(de)企(qi)業和(he)國(guo)外企(qi)業相比(bi)一點(dian)沒(mei)有落后。如果(guo)說,在(zai)5、60年(nian)代和(he)7、80年(nian)代那兩次(人工智能發展期),中(zhong)國(guo)企(qi)業還沒(mei)有辦法和(he)外國(guo)企(qi)業在(zai)技術上相比(bi)的(de)話(hua),那在(zai)這(zhe)次(發展浪(lang)潮里),我們完全走在(zai)了前面。
第二個方面是在于,任何機器的交互離不開產業環境和商業生態。這個產(chan)業環境(jing)和商業生態(tai),在(zai)7、80年(nian)代之(zhi)前(qian)是(shi)什么?是(shi)電子產(chan)品。
大家(jia)都知(zhi)道(dao),中國(guo)的(de)(de)電子產(chan)品(pin)在(zai)(zai)7、80年代(dai)才剛(gang)剛(gang)起步,完全不具備在(zai)(zai)全球市場競爭的(de)(de)能力。但是(shi)(shi)在(zai)(zai)現在(zai)(zai),我們(men)的(de)(de)依賴(lai)的(de)(de)是(shi)(shi)什么產(chan)品(pin)?是(shi)(shi)智能手機,是(shi)(shi)互聯網(wang)產(chan)品(pin)和移(yi)動互聯網(wang)產(chan)品(pin)。而(er)在(zai)(zai)這方面(mian),整個中國(guo)不僅是(shi)(shi)從(cong)事語(yu)音技術的(de)(de)公(gong)司對(dui)此有依賴(lai),相關的(de)(de)商業公(gong)司也是(shi)(shi),比(bi)如網(wang)上購票,還有各種的(de)(de)O2O。
作為一(yi)種(zhong)連接(jie)(jie)型的技(ji)(ji)術,把人和機(ji)器連接(jie)(jie)在一(yi)起之(zhi)后,語音(yin)技(ji)(ji)術如果想在物聯網里面占(zhan)領很多市場(chang),就(jiu)必(bi)須(xu)和這些(xie)后臺的服務(wu)連接(jie)(jie)起來。所以(yi)說從整個(ge)商業和技(ji)(ji)術環(huan)境上來講,中國(guo)現在應該說也是(shi)很好,因為我們的互聯網公司和美國(guo)方面來講,已經是(shi)一(yi)個(ge)同臺競技(ji)(ji),甚至均分天下的態勢(shi)。
在(zai)這(zhe)點上,我(wo)覺得這(zhe)為我(wo)們在(zai)將來(lai),在(zai)物(wu)聯網時(shi)代用語音交(jiao)互(hu)作為人(ren)機(ji)交(jiao)互(hu)的(de)(de)主要手段,并引發相應的(de)(de)商業模式,提供(gong)了很好的(de)(de)基礎(chu)。
而第三點,大家會注意到,無論是什么操作系統,PC的也好,手機的也好,雖然這些操作系統可能是美國的公司做的,比如說微軟、谷歌,但是要注意到,輸入法這個部分,都是中國公司占主導地位。
為什么?因為它和語(yu)(yu)(yu)言(yan)有(you)關(guan)。一個簡單的(de)(de)(de)鍵盤輸入法,就因為語(yu)(yu)(yu)言(yan)之間的(de)(de)(de)差異導致(zhi)這(zhe)么大的(de)(de)(de)差異。那么大家可以想象一下,一個包(bao)括了語(yu)(yu)(yu)音(yin)識別、語(yu)(yu)(yu)音(yin)合成、自然(ran)語(yu)(yu)(yu)言(yan)理解的(de)(de)(de)語(yu)(yu)(yu)音(yin)系統,語(yu)(yu)(yu)言(yan)之間的(de)(de)(de)壁壘會有(you)多高。中國公司在這(zhe)方面會完全具有(you)優(you)勢。
所以(yi)說(shuo)從這三個(ge)(ge)方(fang)面來(lai)講,我(wo)們在(zai)(zai)將來(lai)的物(wu)聯網時代里(li)面,無論(lun)是從技術本(ben)身,還(huan)是從語言的差異化本(ben)身,還(huan)是從商業(ye)的生(sheng)態(tai)和環境本(ben)身,我(wo)們現在(zai)(zai)都和國外公司(si)(si)完全處于同一(yi)個(ge)(ge)水平。所以(yi)在(zai)(zai)這一(yi)波浪潮(chao)中,我(wo)們有信心中國會成長出(chu)一(yi)批國際(ji)水準的公司(si)(si)出(chu)來(lai)。
不可否認(ren)(ren),我們對(dui)(dui)人工智能的(de)了解(jie),不要說產業界,就是媒體,其(qi)實(shi)對(dui)(dui)人工智能更多的(de)認(ren)(ren)識是落在應用特性(xing)和娛(yu)樂特性(xing)上。而美國的(de)很多人,是真正(zheng)從理論的(de)角度,進行非(fei)常深入的(de)探討。
如果我(wo)們(men)(men)(men)只談論(lun)應(ying)用和娛樂層面上的東(dong)西(xi)的話,我(wo)們(men)(men)(men)是得不了(le)圖(tu)靈獎(jiang)的,也得不了(le)諾貝爾獎(jiang),也不能創造信息論(lun)這些東(dong)西(xi)。美國所謂原創性的研(yan)究(jiu),是從(cong)理論(lun)的根基出(chu)發,建立一套完(wan)整的思維方式(shi)。而有許多理論(lun)研(yan)究(jiu)的東(dong)西(xi)是不會產(chan)業化(hua)的,沒有產(chan)業化(hua)價(jia)值(zhi)的。它只是一種哲學化(hua)的思考,而這些東(dong)西(xi)我(wo)們(men)(men)(men)沒有關(guan)心。
哲學會產生真正的創新。創新(xin)有(you)很多(duo)種,有(you)一種是在(zai)最原(yuan)始的技術上(shang)(shang)創新(xin)。而(er)我們講的很多(duo)其實是在(zai)應用層(ceng)面(mian)上(shang)(shang)創新(xin),或者在(zai)技術層(ceng)面(mian)上(shang)(shang)創新(xin),但不是在(zai)科學的層(ceng)面(mian)上(shang)(shang)去發現(xian)和創新(xin)。
所以在這個層面上來講,我覺得國內應該從兩個方面,恰恰是我們的研究的部分,我們的研究院所,我們的高校,可能應該更加著重于在理論方面的深入。而我們(men)的(de)產業界,不應該僅僅去(qu)應用它,而且應該在技術(shu)方面去(qu)做大(da)規模的(de)整合(he)和創新。
因(yin)為人工智能(neng)就(jiu)像航(hang)空發動機一(yi)樣,里面有非(fei)常非(fei)常多的(de)(de)零件,有視覺的(de)(de),有聽覺的(de)(de)。你要(yao)把它們綜(zong)合在一(yi)起,而(er)(er)且每一(yi)個都要(yao)做到世(shi)界(jie)(jie)上最好。我(wo)(wo)覺得現在學術界(jie)(jie)可(ke)能(neng)因(yin)為要(yao)和產業(ye)界(jie)(jie)對(dui)接,做了很多技(ji)術層面上,和應(ying)用相關的(de)(de)創新(xin)(xin)。而(er)(er)產業(ye)界(jie)(jie)還沒(mei)有能(neng)力,來做整體性(xing)、系統(tong)性(xing)創新(xin)(xin)的(de)(de)工作,比(bi)較少。所以我(wo)(wo)覺得這就(jiu)是我(wo)(wo)們和美(mei)國相比(bi)有差異的(de)(de)所在。
我覺得我們在學(xue)術上,理論的深度,和愿意去花長時間究本質的工作還(huan)(huan)是太少,還(huan)(huan)應(ying)該增強(qiang)。
智能(neng)語音是(shi)訊飛整個人工智能(neng)戰(zhan)略中的一部分。而訊飛人工智能(neng)戰(zhan)略的核心,是(shi)基于語音和(he)語言的認(ren)知智能(neng)。
什么是認知智能?比(bi)如在醫療的(de)(de)過(guo)程中,我(wo)們(men)需要通過(guo)病(bing)例幫助醫生(sheng)分(fen)(fen)析病(bing)人可(ke)能會(hui)得什么(me)病(bing),吃什么(me)藥,這(zhe)就(jiu)是一種認知智能。包括在教育里面,我(wo)們(men)通過(guo)手寫的(de)(de)試(shi)卷來(lai)(lai)判斷學生(sheng)的(de)(de)得分(fen)(fen),并給(gei)(gei)出改進的(de)(de)意見。這(zhe)些都是和(he)語言(yan),和(he)人的(de)(de)概念和(he)推理有關的(de)(de)。除了交(jiao)互(hu)之外(wai),它們(men)能給(gei)(gei)我(wo)們(men)的(de)(de)生(sheng)活帶來(lai)(lai)更多改進。
我再舉一個例子,和我們的安全有關。在7、8月份,電話詐騙非常猖獗,特別是臨開學的那段時間。有很多上學的同學不是因為詐騙,做出了很多不理性的事情么?安徽省8月份電話詐騙的發生次數下降了60%,而同期(qi)全國(guo)其他地區增長了(le)58%。為(wei)什(shen)么能做(zuo)(zuo)到(dao)這點?因為(wei)我們(men)在(zai)安徽省所有的電(dian)話里面做(zuo)(zuo)了(le)一個監(jian)控系統,它可以(yi)(yi)對通話內容進行分析,對那些(xie)詐騙性(xing)質行為(wei)自(zi)動作出提醒,而這個過(guo)程是(shi)完全自(zi)動化的。這樣就為(wei)安徽省避免了(le)5個億以(yi)(yi)上的可能的損失(shi)。
我相信大家也注意到了,我們演講的時候會有一個同步實時顯示文字的(de)技(ji)術(shu)。就(jiu)是說(shuo)我在上(shang)面講話的(de)同時,文字出(chu)來(lai)了(le),對你(ni)(ni)們(記者)來(lai)說(shuo)是最(zui)有用的(de)。這(zhe)個產品馬(ma)上(shang)就(jiu)要(yao)開發出(chu)來(lai)了(le),最(zui)理想的(de)狀(zhuang)態就(jiu)是我在這(zhe)邊說(shuo)話,你(ni)(ni)們的(de)屏幕上(shang)就(jiu)能實時顯示出(chu)來(lai)我講的(de)內容。
在去年(nian)的發(fa)(fa)布會(hui)上,我(wo)們發(fa)(fa)布了這個功(gong)能以后。大家(jia)可以看到,今年(nian)阿里(li)和(he)(he)搜(sou)狗(gou)都展示了同(tong)樣的技(ji)術。這也(ye)代表了一個發(fa)(fa)展方(fang)(fang)向。這個方(fang)(fang)向可能和(he)(he)語音交互是沒有(you)關(guan)系(xi)(xi)的,但和(he)(he)語音(技(ji)術)有(you)關(guan)系(xi)(xi)。
首先iPhone我們是搞不定的,除非破解它。iPhone本身就是一個垂直的生態。而且這(zhe)個問(wen)題不(bu)僅僅是在中國,美國也是。但是iPhone自己(ji)的語音技術(shu)很差,導致它的用(yong)戶(hu)體驗相對于其(qi)他(ta)公(gong)司、產品(pin)會有劣勢。
但對Android來講,情況是不一樣(yang)的(de)。因為谷歌(ge)也知道Android有全(quan)球不通用的(de)地方。比如說(shuo)審美、風(feng)格,比如說(shuo)語(yu)言相關的(de)部(bu)分:輸入(ru)法、交互。這就(jiu)造成了Android系統(tong)(tong)在設(she)計的(de)時候就(jiu)是一個比較開(kai)放的(de)系統(tong)(tong)。
這就造成了(le)第(di)三方UI其實(shi)接管了(le)中間層(ceng)的(de)一些(xie)功能(neng),也導致了(le)這些(xie)領域是可以進(jin)入的(de)。而且現(xian)在很(hen)多的(de)智(zhi)能(neng)硬件(jian),其實(shi)用的(de)都是Android的(de)操作(zuo)系統。
我相信在將來(lai)的(de)發展(zhan)中,世(shi)(shi)界(jie)上會存在兩種公司(si)。一(yi)(yi)種公司(si)是垂直產品型(xing)公司(si),比(bi)如說做手(shou)(shou)(shou)機(ji),就一(yi)(yi)直做手(shou)(shou)(shou)機(ji),手(shou)(shou)(shou)機(ji)技術不可(ke)能給別人(ren)用。世(shi)(shi)界(jie)上看起來(lai),最多(duo)有(you)8到9家這樣的(de)手(shou)(shou)(shou)機(ji)公司(si),加起來(lai)產量可(ke)能到全球的(de)90%-到95%以上。
另(ling)外(wai)還有些公(gong)司,像谷歌這樣,就是平臺型的公(gong)司。我提供一些基礎性(xing)的工作,給各個(ge)廠商都(dou)能用(yong)。但是做了平臺之(zhi)后就要面(mian)臨控(kong)制(zhi)權大小的問題。有可能控(kong)制(zhi)權不在自己(ji)手(shou)上(shang),而(er)在手(shou)機廠商手(shou)上(shang)。
所以在未來的發展過程里,訊飛要做的不僅僅是手機,而是(shi)我(wo)剛才說(shuo)的(de)(de)各個(ge)領域(yu)。這(zhe)些領域(yu)里,有的(de)(de)是(shi)幾家大公司聯合壟斷了(le)市(shi)場,有的(de)(de)領域(yu)會(hui)是(shi)成千上(shang)萬(wan)個(ge)公司來(lai)分(fen)享(xiang)市(shi)場。比如說(shuo)玩具(ju)(ju)、機器人,就是(shi)后(hou)面的(de)(de)這(zhe)種。而且我(wo)相信(xin)現在這(zhe)么多機器人公司,到最后(hou)也不會(hui)合并(bing)成大的(de)(de)公司,因(yin)為用戶需要多樣性(xing)的(de)(de)個(ge)性(xing)化產品。而手機這(zhe)種產品,雖然(ran)有差異,但還是(shi)個(ge)工具(ju)(ju)性(xing)質的(de)(de)產品。
所以訊飛會成為一個平臺型的公司,不(bu)僅幫(bang)平臺上的公司提供(gong)核心技術,甚至可以幫(bang)它們整合(he)各(ge)種各(ge)樣(yang)的資(zi)源。我覺得我們是用這樣(yang)一個思路來發(fa)展的。
場景的(de)(de)(de)問(wen)題(ti)其實(shi)和剛才的(de)(de)(de)問(wen)題(ti),就是(shi)(shi)內容(rong)方面是(shi)(shi)非(fei)常(chang)有關系的(de)(de)(de)。我們人(ren)在處理一件事的(de)(de)(de)時(shi)候,你(ni)可以想(xiang)象下你(ni)在訂(ding)一張票,你(ni)所(suo)要和別(bie)人(ren)交談的(de)(de)(de)內容(rong),嘴(zui)里面發出的(de)(de)(de)指令(ling),其實(shi)相(xiang)對來講不(bu)是(shi)(shi)開放的(de)(de)(de)集合,是(shi)(shi)封(feng)閉的(de)(de)(de)集合。
這里最難的問題就是怎么把它豐富起來,怎么讓它多覆蓋(些場景)。我們現在的做法就是一個點一個點去做。每做完一(yi)個(ge)點就(jiu)(jiu)拿到實際里去用。越來越多(duo)的人用了(le)之后,語(yu)言的覆(fu)蓋(gai)性就(jiu)(jiu)會越來越好,這個(ge)場景(jing)的問題就(jiu)(jiu)解決了(le)。
那(nei)在這(zhe)個過(guo)程里怎么(me)加(jia)速這(zhe)個問題(ti)(ti)呢(ni)?我(wo)們(men)(men)怎么(me)在做一(yi)些(xie)場景(jing)的(de)時候,其他(ta)場景(jing)也能(neng)(neng)變快呢(ni)?這(zhe)就是我(wo)們(men)(men)為什么(me)要做那(nei)些(xie)高考答題(ti)(ti)機(ji)器(qi)人的(de)原因。它(ta)能(neng)(neng)學(xue)會系統學(xue)習(xi)的(de)方法(fa),當(dang)我(wo)們(men)(men)做了一(yi)兩(liang)個場景(jing)之后,就能(neng)(neng)轉移到其他(ta)很多場景(jing)上。這(zhe)樣(yang)能(neng)(neng)使我(wo)們(men)(men)的(de)覆蓋(gai)快速增加(jia)。我(wo)們(men)(men)通過(guo)這(zhe)樣(yang)的(de)方式來解決(jue)這(zhe)樣(yang)的(de)問題(ti)(ti)。
當然擔(dan)心(xin),但(dan)擔(dan)心(xin)了也(ye)沒用。
任何一個新(xin)技(ji)術(shu)出來的(de)時(shi)候都會(hui)魚龍混雜。人(ren)類有夸(kua)大預期的(de)本性在(zai)里面(mian),是人(ren)類的(de)社(she)會(hui)特(te)性決定(ding)的(de)。認識到這個規(gui)律之(zhi)后就(jiu)不會(hui)覺得這事是什(shen)么壞事。我們能做的(de)就(jiu)是在(zai)局部上防止(zhi)過熱(re)。
所以我們應該考慮的是如何利用這種周期性的狂熱來合理布局。從投資(zi)人(ren)角(jiao)度(du)來(lai)說,投資(zi)人(ren)很容易找(zhao)到錢,但投資(zi)人(ren)可以利(li)用這(zhe)種環境去找(zhao)最有(you)價值(zhi)的(de)公司來(lai)投資(zi)。所以只能說改變(bian)(bian)你能改變(bian)(bian)的(de),接受你不能改變(bian)(bian)的(de)。
我覺得在人工智能領域里有兩個領域是有價值的。一個是人工智能核心技術研究,他們不一定有經驗去進行商業化,我們可以投資他,提供經驗。另外是如何利用人工智能技術來解決現實問題,這通常在(zai)大的(de)公司里面,他們(men)都有很大的(de)產業基礎,只要把新(xin)技術嫁接進來。
大部分的公(gong)司(si)并不會因為(wei)人工(gong)(gong)智能(neng)(neng)出現而(er)進行(xing)重(zhong)(zhong)組(zu)和重(zhong)(zhong)構(gou)。比如農(nong)業(ye),人工(gong)(gong)智能(neng)(neng)只(zhi)是一個改進的工(gong)(gong)具(ju),所以(yi)(yi)在這些領(ling)域里,原有的大公(gong)司(si)依(yi)然(ran)占有優(you)勢。所以(yi)(yi)更(geng)有價值的是去尋找哪些懂得怎么利用人工(gong)(gong)智能(neng)(neng)的人來投資。
比較公司要看戰略,我(wo)不(bu)是(shi)(shi)特別了解百度(du)的(de)戰(zhan)略(lve),因為每年(nian)百度(du)的(de)重點不(bu)一樣。但是(shi)(shi)過去(qu)三年(nian)里面(mian)我(wo)們一直(zhi)在做運算智(zhi)能、感知(zhi)智(zhi)能和認知(zhi)智(zhi)能,而且會定期公(gong)布進展,有清晰的(de)商業(ye)模式。這(zhe)是(shi)(shi)我(wo)們和互聯網公(gong)司的(de)不(bu)同(tong),是(shi)(shi)專注科技創(chuang)新的(de)公(gong)司。科技創(chuang)新公(gong)司更像是(shi)(shi)爬山的(de)公(gong)司,一步一步去(qu)爬到(dao)頂峰。
但互聯網(wang)有很多(duo)機會,所(suo)以很多(duo)公司都是沖浪(lang)型的,需要不停地抓住(zhu)下一個(ge)浪(lang)潮,如果不是,就換了。
我們還是堅持做人工智能,堅信交互革命(ming)那(nei)天會(hui)到來。所以一(yi)個(ge)公司(si)要有(you)清晰(xi)地(di)戰略,而(er)且要把(ba)戰略傳達給別(bie)人。我們戰略十分(fen)清晰(xi):我們是一(yi)個(ge)技術創新性公司(si),解決人機交互這(zhe)個(ge)問題。
在(zai)(zai)行業(ye)里面,我們(men)用我們(men)的人(ren)工智能技術幫助醫院、學(xue)校、司法(fa)、金融機構去(qu)改(gai)善他們(men)的問題。這(zhe)里面有(you)很多(duo)(duo)“臟活(huo)累活(huo)”,要(yao)做很多(duo)(duo)結合(he)型的工作(zuo)。互聯網(wang)公司追求收(shou)益,毛利(li)要(yao)非常(chang)高。而且有(you)很多(duo)(duo)“臟活(huo)”不一定愿(yuan)意去(qu)干。但在(zai)(zai)產業(ye)互聯網(wang)階段,和傳統領域結合(he),是少不了這(zhe)一步的。
當然不是(shi)說一(yi)味去(qu)做基礎性的工作。上面要有頂天(tian)立地的東(dong)西,但是(shi)不能因(yin)為有這(zhe)個就不能彎腰了(le),絕對不是(shi)這(zhe)個概念。
所以我覺得中國需要更多爬山型的公司,無論外(wai)面怎(zen)么變化。外(wai)面無論是互聯(lian)網時(shi)代也好(hao)(hao),移動(dong)互聯(lian)網時(shi)代也好(hao)(hao),物聯(lian)網時(shi)代也好(hao)(hao),這都是外(wai)圍環境的變化。但是公司征(zheng)服一個領域,具(ju)有爬山的本質是必不可少的。