胡郁認為(wei)跟百度(du)阿里等公司相比,科(ke)(ke)大(da)訊飛的(de)(de)(de)“互(hu)聯網”味道要稍微淡一些。他表示我國(guo)的(de)(de)(de)產業和媒體對(dui)人(ren)(ren)工智(zhi)能的(de)(de)(de)關(guan)注太娛樂太實用,真正(zheng)的(de)(de)(de)創新是從(cong)理論(lun)出(chu)發(fa),從(cong)哲學角(jiao)度發(fa)展出(chu)來的(de)(de)(de),我們對(dui)科(ke)(ke)技的(de)(de)(de)本質(zhi)關(guan)注太少。科(ke)(ke)大(da)訊飛目(mu)前(qian)的(de)(de)(de)主(zhu)要優(you)勢(shi)是語音識別領(ling)域,因為(wei)人(ren)(ren)工智(zhi)能,電信詐(zha)騙損失減(jian)少了(le)5個億。
相比于傳統的高新技術,中國是有優勢的。
第一個是經過這么多年(nian)核心技(ji)術的發(fa)展,特別是中國(guo)(guo)863計劃以后(hou),大家會注意到,在這一次的人工智能浪潮中,國(guo)(guo)內的企(qi)業(ye)和國(guo)(guo)外(wai)企(qi)業(ye)相比一點沒(mei)有落后(hou)。如(ru)果(guo)說,在5、60年(nian)代和7、80年(nian)代那兩次(人工智能發(fa)展期),中國(guo)(guo)企(qi)業(ye)還沒(mei)有辦法和外(wai)國(guo)(guo)企(qi)業(ye)在技(ji)術上(shang)相比的話,那在這次(發(fa)展浪潮里),我們完(wan)全走在了前(qian)面(mian)。
第二個方面是在于,任何機器的交互離不開產業環境和商業生態。這個產業環境和商業生態,在7、80年(nian)代(dai)之前是(shi)什(shen)么?是(shi)電(dian)子產品。
大家(jia)都知道,中國(guo)的電(dian)子產(chan)品(pin)在(zai)7、80年代才剛剛起步,完全不具備(bei)在(zai)全球市場競(jing)爭的能力(li)。但是(shi)(shi)在(zai)現在(zai),我們的依賴(lai)的是(shi)(shi)什(shen)么產(chan)品(pin)?是(shi)(shi)智能手機,是(shi)(shi)互(hu)聯網產(chan)品(pin)和(he)移(yi)動互(hu)聯網產(chan)品(pin)。而在(zai)這方面,整個中國(guo)不僅是(shi)(shi)從事語音技術的公司對此(ci)有依賴(lai),相關的商業公司也(ye)是(shi)(shi),比如網上購票,還有各種的O2O。
作為(wei)一(yi)種連接(jie)型的技術,把(ba)人和(he)(he)機器(qi)連接(jie)在一(yi)起之(zhi)后(hou),語音技術如果(guo)想在物聯網(wang)里面占領很多(duo)市場,就必(bi)須(xu)和(he)(he)這些后(hou)臺的服務連接(jie)起來。所(suo)以說從(cong)整個(ge)商(shang)業(ye)和(he)(he)技術環境上來講,中國現在應該說也是(shi)很好,因為(wei)我們的互(hu)聯網(wang)公(gong)司和(he)(he)美國方面來講,已經是(shi)一(yi)個(ge)同臺競技,甚至均分天下的態(tai)勢。
在(zai)(zai)這點(dian)上(shang),我覺得這為(wei)我們(men)在(zai)(zai)將來,在(zai)(zai)物聯網時代用語音交互作(zuo)為(wei)人機交互的主要手段(duan),并(bing)引發(fa)相(xiang)應的商(shang)業模式,提供了很好的基礎。
而第三點,大家會注意到,無論是什么操作系統,PC的也好,手機的也好,雖然這些操作系統可能是美國的公司做的,比如說微軟、谷歌,但是要注意到,輸入法這個部分,都是中國公司占主導地位。
為(wei)什么?因為(wei)它(ta)和語(yu)(yu)言有關。一個簡單(dan)的鍵盤輸入法,就因為(wei)語(yu)(yu)言之間(jian)的差異(yi)導致這么大的差異(yi)。那(nei)么大家可以想象一下,一個包括了語(yu)(yu)音識別、語(yu)(yu)音合成、自然語(yu)(yu)言理解的語(yu)(yu)音系統,語(yu)(yu)言之間(jian)的壁(bi)壘會(hui)有多高。中國公司在這方面(mian)會(hui)完全具有優勢。
所以說從這(zhe)三個(ge)方面(mian)來講,我(wo)們(men)在將來的物聯網時代里面(mian),無論是(shi)從技(ji)術本(ben)身(shen),還是(shi)從語(yu)言的差異化本(ben)身(shen),還是(shi)從商業的生態和環境本(ben)身(shen),我(wo)們(men)現(xian)在都和國(guo)外公司完全處于同一個(ge)水(shui)平。所以在這(zhe)一波浪潮中(zhong),我(wo)們(men)有信心中(zhong)國(guo)會成長出一批國(guo)際水(shui)準的公司出來。
不可否認,我們(men)對(dui)人工智能(neng)的(de)了解(jie),不要說產(chan)業界,就是(shi)媒體,其實對(dui)人工智能(neng)更(geng)多的(de)認識是(shi)落在應用特性和娛樂特性上。而美國的(de)很多人,是(shi)真正從理論的(de)角(jiao)度,進行非常深入(ru)的(de)探討。
如果我們(men)(men)只(zhi)談論應(ying)用和(he)娛(yu)樂層(ceng)面上的(de)(de)東(dong)西的(de)(de)話,我們(men)(men)是(shi)得(de)不(bu)了圖靈獎的(de)(de),也得(de)不(bu)了諾(nuo)貝爾(er)獎,也不(bu)能創造(zao)信息(xi)論這些東(dong)西。美國所謂原創性的(de)(de)研究(jiu),是(shi)從(cong)理論的(de)(de)根基出發,建(jian)立一(yi)套完整的(de)(de)思(si)維(wei)方式(shi)。而有(you)(you)許多(duo)理論研究(jiu)的(de)(de)東(dong)西是(shi)不(bu)會(hui)產(chan)業化(hua)的(de)(de),沒有(you)(you)產(chan)業化(hua)價值(zhi)的(de)(de)。它只(zhi)是(shi)一(yi)種哲學化(hua)的(de)(de)思(si)考(kao),而這些東(dong)西我們(men)(men)沒有(you)(you)關(guan)心。
哲學會產生真正的創新。創(chuang)新(xin)(xin)有(you)很(hen)(hen)多(duo)種,有(you)一種是(shi)在(zai)最(zui)原始(shi)的(de)技術(shu)上(shang)創(chuang)新(xin)(xin)。而(er)我們講的(de)很(hen)(hen)多(duo)其實是(shi)在(zai)應(ying)用層(ceng)面上(shang)創(chuang)新(xin)(xin),或者在(zai)技術(shu)層(ceng)面上(shang)創(chuang)新(xin)(xin),但不(bu)是(shi)在(zai)科(ke)學(xue)的(de)層(ceng)面上(shang)去發現和創(chuang)新(xin)(xin)。
所以在這個層面上來講,我覺得國內應該從兩個方面,恰恰是我們的研究的部分,我們的研究院所,我們的高校,可能應該更加著重于在理論方面的深入。而我們的產業界,不應(ying)該(gai)僅(jin)僅(jin)去(qu)應(ying)用它,而且(qie)應(ying)該(gai)在(zai)技(ji)術方面去(qu)做大規模的整(zheng)合和創新。
因為人工(gong)智(zhi)能就像(xiang)航空(kong)發動機一(yi)樣,里面(mian)有(you)非(fei)常(chang)非(fei)常(chang)多的(de)(de)零件(jian),有(you)視(shi)覺(jue)的(de)(de),有(you)聽覺(jue)的(de)(de)。你要把它(ta)們(men)綜合在一(yi)起,而(er)且每一(yi)個都要做到世界(jie)上最(zui)好。我(wo)覺(jue)得(de)現在學術界(jie)可能因為要和產業界(jie)對接,做了很多技術層(ceng)面(mian)上,和應用相(xiang)(xiang)關的(de)(de)創新(xin)。而(er)產業界(jie)還沒有(you)能力(li),來做整(zheng)體(ti)性、系統(tong)性創新(xin)的(de)(de)工(gong)作,比(bi)較少。所(suo)以我(wo)覺(jue)得(de)這就是我(wo)們(men)和美國相(xiang)(xiang)比(bi)有(you)差(cha)異的(de)(de)所(suo)在。
我覺得我們在學術(shu)上,理(li)論的深度,和(he)愿(yuan)意去花長時間究本質的工作還是太少,還應(ying)該增強。
智能(neng)(neng)語音是訊飛整(zheng)個人(ren)工智能(neng)(neng)戰(zhan)略(lve)中的一(yi)部(bu)分。而訊飛人(ren)工智能(neng)(neng)戰(zhan)略(lve)的核心,是基于(yu)語音和語言的認知智能(neng)(neng)。
什么是認知智能?比如(ru)在醫療的過(guo)程中,我們(men)需(xu)要通過(guo)病(bing)例幫助醫生(sheng)(sheng)分(fen)析(xi)病(bing)人可能會得什么(me)病(bing),吃什么(me)藥(yao),這就是一種(zhong)認知智能。包括在教育里面,我們(men)通過(guo)手(shou)寫的試卷(juan)來判斷學生(sheng)(sheng)的得分(fen),并給出改進的意見。這些都(dou)是和(he)語言(yan),和(he)人的概(gai)念(nian)和(he)推(tui)理有關的。除了(le)交互之外,它(ta)們(men)能給我們(men)的生(sheng)(sheng)活帶來更多改進。
我再舉一個例子,和我們的安全有關。在7、8月份,電話詐騙非常猖獗,特別是臨開學的那段時間。有很多上學的同學不是因為詐騙,做出了很多不理性的事情么?安徽省8月份電話詐騙的發生次數下降了60%,而同期全(quan)國其他地區增長了(le)58%。為(wei)什(shen)么能做到(dao)這點?因為(wei)我(wo)們在安(an)徽(hui)(hui)省所(suo)有的(de)電(dian)話(hua)里面做了(le)一個(ge)(ge)監控系(xi)統,它可(ke)以對通話(hua)內(nei)容進行分(fen)析,對那些詐騙性質行為(wei)自(zi)動(dong)作出提醒,而這個(ge)(ge)過程是(shi)完全(quan)自(zi)動(dong)化的(de)。這樣(yang)就為(wei)安(an)徽(hui)(hui)省避免了(le)5個(ge)(ge)億以上的(de)可(ke)能的(de)損失。
我相信大家也注意到了,我們演講的時候會有一個同步實時顯示文字的(de)技(ji)術。就是說(shuo)(shuo)我在上(shang)面講話(hua)的(de)同時,文字出來了,對你(ni)們(men)(記者)來說(shuo)(shuo)是最有用的(de)。這個產品馬上(shang)就要開發出來了,最理想的(de)狀態(tai)就是我在這邊說(shuo)(shuo)話(hua),你(ni)們(men)的(de)屏幕上(shang)就能實時顯(xian)示出來我講的(de)內容。
在去(qu)年的發布會上,我們發布了這(zhe)個功能(neng)以后。大家可以看到,今年阿里和(he)搜狗都展示了同樣(yang)的技(ji)術(shu)。這(zhe)也代表了一個發展方向(xiang)。這(zhe)個方向(xiang)可能(neng)和(he)語(yu)音交互(hu)是沒有關(guan)系(xi)的,但和(he)語(yu)音(技(ji)術(shu))有關(guan)系(xi)。
首先iPhone我們是搞不定的,除(chu)非破(po)解它(ta)(ta)。iPhone本身就是(shi)(shi)一(yi)個垂直的生態(tai)。而且這個問題不(bu)僅(jin)僅(jin)是(shi)(shi)在中國,美國也是(shi)(shi)。但(dan)是(shi)(shi)iPhone自己的語(yu)音技術很差,導致它(ta)(ta)的用(yong)戶體驗相對于其他公司(si)、產品會有(you)劣勢。
但對(dui)Android來講,情(qing)況(kuang)是不一樣(yang)的(de)。因為(wei)谷歌也知道Android有全球不通用的(de)地(di)方(fang)。比如說審美、風(feng)格,比如說語言相(xiang)關的(de)部分(fen):輸(shu)入法、交互。這就(jiu)造成了Android系統(tong)在設(she)計的(de)時(shi)候就(jiu)是一個比較開放的(de)系統(tong)。
這就(jiu)造成(cheng)了(le)第三方UI其(qi)(qi)實(shi)接(jie)管了(le)中間層的一些(xie)功能,也導(dao)致(zhi)了(le)這些(xie)領(ling)域是可以進(jin)入的。而(er)且(qie)現(xian)在很多的智(zhi)能硬件,其(qi)(qi)實(shi)用的都是Android的操作系統(tong)。
我相信在(zai)將來的發展中,世界上會存在(zai)兩種公(gong)司(si)。一種公(gong)司(si)是(shi)垂直產品型(xing)公(gong)司(si),比如說做手機(ji),就一直做手機(ji),手機(ji)技術不可(ke)能給(gei)別(bie)人用。世界上看(kan)起來,最多有8到9家(jia)這(zhe)樣(yang)的手機(ji)公(gong)司(si),加起來產量(liang)可(ke)能到全球的90%-到95%以上。
另(ling)外還(huan)有(you)些公司(si),像(xiang)谷歌(ge)這樣,就是平臺型的公司(si)。我提供一些基礎性的工作,給各個(ge)廠商都能(neng)用。但是做(zuo)了平臺之后就要(yao)面臨控制權大(da)小(xiao)的問題。有(you)可(ke)能(neng)控制權不(bu)在(zai)自己手(shou)上(shang),而在(zai)手(shou)機廠商手(shou)上(shang)。
所以在未來的發展過程里,訊飛要做的不僅僅是手機,而是(shi)我剛才說的(de)(de)(de)各個(ge)領(ling)域(yu)。這些領(ling)域(yu)里,有(you)的(de)(de)(de)是(shi)幾(ji)家大公(gong)司聯合壟斷了市(shi)(shi)場(chang),有(you)的(de)(de)(de)領(ling)域(yu)會是(shi)成千上萬個(ge)公(gong)司來分享市(shi)(shi)場(chang)。比如說玩具、機(ji)器人,就是(shi)后面(mian)的(de)(de)(de)這種。而且(qie)我相信現在(zai)這么多機(ji)器人公(gong)司,到(dao)最后也不會合并成大的(de)(de)(de)公(gong)司,因為用戶需要(yao)多樣性(xing)的(de)(de)(de)個(ge)性(xing)化產(chan)品。而手機(ji)這種產(chan)品,雖然有(you)差異,但(dan)還是(shi)個(ge)工具性(xing)質的(de)(de)(de)產(chan)品。
所以訊飛會成為一個平臺型的公司,不僅幫平臺上(shang)的公司提供(gong)核心(xin)技術,甚(shen)至可以(yi)幫它們(men)(men)整(zheng)合各(ge)種(zhong)各(ge)樣的資源。我覺得我們(men)(men)是(shi)用這樣一(yi)個思(si)路(lu)來(lai)發展(zhan)的。
場(chang)景的(de)問題其實(shi)(shi)和(he)剛才的(de)問題,就(jiu)是內容方(fang)面(mian)是非常有(you)關(guan)系的(de)。我們人(ren)在(zai)(zai)處(chu)理(li)一(yi)件(jian)事的(de)時(shi)候,你可(ke)以想象下你在(zai)(zai)訂一(yi)張票,你所要和(he)別人(ren)交談的(de)內容,嘴里(li)面(mian)發出的(de)指令,其實(shi)(shi)相對(dui)來(lai)講不是開放的(de)集合,是封(feng)閉的(de)集合。
這里最難的問題就是怎么把它豐富起來,怎么讓它多覆蓋(些場景)。我們現在的做法就是一個點一個點去做。每做完一個點就拿到實際里(li)去用(yong)。越來(lai)越多的人用(yong)了(le)之后,語言的覆蓋(gai)性就會越來(lai)越好(hao),這個場景的問題就解決了(le)。
那在(zai)這(zhe)個(ge)(ge)過程里怎么(me)加(jia)(jia)速(su)(su)這(zhe)個(ge)(ge)問題呢?我(wo)(wo)們(men)怎么(me)在(zai)做一(yi)些(xie)場景(jing)的(de)時(shi)候,其他(ta)場景(jing)也能(neng)變(bian)快(kuai)呢?這(zhe)就是我(wo)(wo)們(men)為(wei)什么(me)要做那些(xie)高(gao)考(kao)答題機器人(ren)的(de)原因。它能(neng)學會系統(tong)學習(xi)的(de)方法,當(dang)我(wo)(wo)們(men)做了一(yi)兩(liang)個(ge)(ge)場景(jing)之后(hou),就能(neng)轉(zhuan)移到其他(ta)很(hen)多場景(jing)上。這(zhe)樣(yang)能(neng)使我(wo)(wo)們(men)的(de)覆(fu)蓋(gai)快(kuai)速(su)(su)增加(jia)(jia)。我(wo)(wo)們(men)通過這(zhe)樣(yang)的(de)方式(shi)來(lai)解決這(zhe)樣(yang)的(de)問題。
當然擔(dan)心,但擔(dan)心了也沒用。
任(ren)何(he)一個新(xin)技術(shu)出來的時候(hou)都會魚龍(long)混雜。人(ren)類(lei)有夸大預(yu)期的本性在里面(mian),是(shi)人(ren)類(lei)的社(she)會特性決(jue)定的。認識到這(zhe)個規律之后(hou)就不會覺得這(zhe)事是(shi)什么壞事。我們(men)能做的就是(shi)在局部上防止過熱。
所以我們應該考慮的是如何利用這種周期性的狂熱來合理布局。從投資(zi)(zi)人(ren)(ren)角度來說,投資(zi)(zi)人(ren)(ren)很容易找到錢,但投資(zi)(zi)人(ren)(ren)可以利用這種環(huan)境去(qu)找最有價(jia)值的公司來投資(zi)(zi)。所以只能說改變你能改變的,接受(shou)你不能改變的。
我覺得在人工智能領域里有兩個領域是有價值的。一個是人工智能核心技術研究,他們不一定有經驗去進行商業化,我們可以投資他,提供經驗。另外是如何利用人工智能技術來解決現實問題,這通常在大的公司里面,他們都有很大的產(chan)業基(ji)礎,只要(yao)把(ba)新技(ji)術嫁接進來。
大部分的(de)公司(si)并不(bu)會因為人工智(zhi)(zhi)能出現而進行重(zhong)組和重(zhong)構。比如農業,人工智(zhi)(zhi)能只(zhi)是一個改(gai)進的(de)工具,所以(yi)在這些領域里,原有的(de)大公司(si)依然占有優勢(shi)。所以(yi)更(geng)有價值的(de)是去(qu)尋找哪些懂得怎么利(li)用人工智(zhi)(zhi)能的(de)人來投資(zi)。
比較公司要看戰略,我不(bu)是(shi)特(te)別了解百度的(de)戰(zhan)略,因為每年百度的(de)重(zhong)點不(bu)一(yi)樣。但是(shi)過(guo)去三年里面(mian)我們一(yi)直(zhi)在做運算智(zhi)(zhi)能(neng)、感知智(zhi)(zhi)能(neng)和(he)認(ren)知智(zhi)(zhi)能(neng),而且會定期公布進展,有清晰(xi)的(de)商業(ye)模(mo)式。這(zhe)是(shi)我們和(he)互聯網公司的(de)不(bu)同,是(shi)專注科技創新(xin)的(de)公司。科技創新(xin)公司更像(xiang)是(shi)爬山的(de)公司,一(yi)步(bu)一(yi)步(bu)去爬到頂(ding)峰。
但互聯網有很(hen)(hen)多(duo)機會,所以很(hen)(hen)多(duo)公司都是(shi)沖浪(lang)(lang)型的,需要不停地抓住下一個浪(lang)(lang)潮,如果不是(shi),就換了(le)。
我們還是堅持做人工智能,堅信交互革(ge)命那(nei)天會到來。所以一個(ge)公司要有(you)清(qing)晰地戰(zhan)略(lve),而(er)且要把戰(zhan)略(lve)傳達給(gei)別人(ren)。我(wo)們戰(zhan)略(lve)十分清(qing)晰:我(wo)們是一個(ge)技術創新性公司,解(jie)決(jue)人(ren)機交互這個(ge)問題。
在行業里面,我們用我們的人(ren)工智能技術(shu)幫助醫院、學(xue)校、司法、金融機構去(qu)改(gai)善他們的問(wen)題。這(zhe)里面有很多“臟(zang)(zang)活(huo)累(lei)活(huo)”,要做(zuo)很多結合(he)型的工作。互聯(lian)網公司追求收益(yi),毛利要非常(chang)高(gao)。而且(qie)有很多“臟(zang)(zang)活(huo)”不一定(ding)愿意去(qu)干。但在產(chan)業互聯(lian)網階段,和傳統(tong)領域(yu)結合(he),是少不了這(zhe)一步的。
當(dang)然(ran)不是說一味去做基(ji)礎性的工作。上面(mian)要(yao)有頂天立地的東西,但是不能因為有這個就不能彎腰了,絕(jue)對(dui)不是這個概(gai)念。
所以我覺得中國需要更多爬山型的公司,無論(lun)(lun)外(wai)面(mian)怎么變(bian)化。外(wai)面(mian)無論(lun)(lun)是互聯(lian)網(wang)時代(dai)也(ye)好(hao),移動互聯(lian)網(wang)時代(dai)也(ye)好(hao),物聯(lian)網(wang)時代(dai)也(ye)好(hao),這都(dou)是外(wai)圍環(huan)境的變(bian)化。但是公司征服一個(ge)領域,具有爬山的本質是必不可少的。