近期(qi),無論國外還是(shi)國內,智能(neng)語音助手都是(shi)一(yi)個相當火(huo)熱的話題。
在國外(wai),谷歌的Google Home 和(he)亞馬遜(xun)(xun)Echo的斗爭十分激烈,一(yi)方(fang)面不斷(duan)升(sheng)級語音助手服務(wu)(wu),另一(yi)方(fang)面不斷(duan)向第三方(fang)開放其(qi)(qi)語音助手平臺。如4月15日亞馬遜(xun)(xun)向第三方(fang)授權(quan)其(qi)(qi)Echo的關鍵語音技術(shu);再(zai)如4月20日Google Home 推出其(qi)(qi)智能(neng)(neng)音箱可(ke)同(tong)時(shi)支持6人(ren)使用,提(ti)供個性(xing)化服務(wu)(wu) 。此外(wai),4月23日奔(ben)馳也將其(qi)(qi)新車接入Alexa和(he)Google Assistant,提(ti)升(sheng)其(qi)(qi)車載系統(tong)和(he)對智能(neng)(neng)家居等(deng)的遠距離控制。
而在國內(nei),4月14日,樂視推(tui)出(chu)其語(yu)音(yin)(yin)助手“樂樂”來實現對(dui)手機APP的語(yu)音(yin)(yin)操作。4月18日人工智(zhi)能公司出(chu)門(men)問問推(tui)出(chu)其語(yu)音(yin)(yin)助理“問問”和(he)智(zhi)能音(yin)(yin)箱Tichome,并向第(di)三方開放語(yu)音(yin)(yin)平臺(tai)。4月25日,騰訊推(tui)出(chu)語(yu)音(yin)(yin)助手“騰訊叮當”,又一巨(ju)頭入(ru)局智(zhi)能交(jiao)互(hu)領域(yu)。
隨著人工智能(neng)和智能(neng)家居的(de)(de)(de)發展,以音(yin)箱或手(shou)機等為(wei)硬件(jian)的(de)(de)(de)語(yu)音(yin)助手(shou)可能(neng)將(jiang)成為(wei)家庭(ting)的(de)(de)(de)交互入口,而這背(bei)后(hou)是(shi)整個智能(neng)家居產(chan)業鏈和廣闊的(de)(de)(de)市場。誰將(jiang)掌握這個控制中心,誰就贏得了(le)未來。
一、智能語音助手大盤點
目前(qian),語音(yin)助手的硬件載體已經開始從智(zhi)能手機(ji)向音(yin)箱、汽車、機(ji)器人等蔓延。預計這(zhe)一趨(qu)勢會愈演愈烈,語音(yin)助手將會連(lian)接更多的設備(bei),從而(er)成為智(zhi)能生活(huo)的核心(xin)(xin)控制(zhi)中(zhong)心(xin)(xin)之一。
盡(jin)管(guan)當下市場上有許多語(yu)音助(zhu)手(shou),但由于(yu)語(yu)音技(ji)術的研(yan)發周期(qi)長,投入大,行(xing)業進(jin)入壁壘較高(gao),全(quan)球范圍內(nei)應用(yong)成熟的語(yu)音助(zhu)手(shou)并(bing)不多。知名(ming)度(du)較高(gao)的有國(guo)外(wai)谷歌的Google Home、亞馬遜的Alexa、蘋果的Siri、微軟的Cortana小娜,以(yi)及尚未謀面的三星Bixby。國(guo)內(nei)知名(ming)度(du)較高(gao)的有百度(du)的度(du)秘(mi)和科大訊(xun)飛的靈犀語(yu)音助(zhu)手(shou)。
BAT三巨頭在語音助手領域再相遇(yu)
就在近日騰(teng)(teng)訊(xun)也推出其語音(yin)助(zhu)手(shou)“騰(teng)(teng)訊(xun)叮(ding)當(dang)”,騰(teng)(teng)訊(xun)表示(shi),其最(zui)新人(ren)工智能助(zhu)手(shou)騰(teng)(teng)訊(xun)叮(ding)當(dang)在功(gong)能上與亞(ya)馬遜(xun)Alexa相(xiang)似。而(er)到此,加上百度的度秘和(he)阿里iDST的語音(yin)助(zhu)手(shou),BAT三巨頭都進入了智能語音(yin)助(zhu)手(shou)領(ling)域,可見他們對(dui)于語音(yin)交互這一大“入口”的認同。
度(du)(du)秘(mi)是李彥宏在(zai)(zai)2015年(nian)百(bai)度(du)(du)世(shi)界大(da)會上(shang)推(tui)出的機器人助理。依托(tuo)百(bai)度(du)(du)的搜索和(he)(he)智(zhi)能(neng)(neng)交互技術,度(du)(du)秘(mi)可以通(tong)過對話,進而在(zai)(zai)索引現(xian)實的服(fu)(fu)務(wu)和(he)(he)信息(xi)的基(ji)礎上(shang),為(wei)用戶提(ti)供服(fu)(fu)務(wu)。度(du)(du)秘(mi)主要的能(neng)(neng)力集(ji)(ji)中在(zai)(zai)美食推(tui)薦、電影推(tui)薦和(he)(he)生活服(fu)(fu)務(wu)推(tui)薦。度(du)(du)秘(mi)服(fu)(fu)務(wu)更多的集(ji)(ji)中在(zai)(zai)消費上(shang),它連接的是廣(guang)泛的現(xian)實行業,涵(han)蓋吃、住、行、玩等(deng)(deng)方面,這更多的是依托(tuo)百(bai)度(du)(du)搜索能(neng)(neng)力、百(bai)度(du)(du)地圖(tu)、百(bai)度(du)(du)糯(nuo)米等(deng)(deng)O2O類(lei)的服(fu)(fu)務(wu)。
但目前的度(du)秘需要下(xia)載手機百度(du)客(ke)戶端才能(neng)使用,也(ye)沒有語音服務和日常生活提醒等(deng)功(gong)能(neng)。度(du)秘的交互性(xing)(xing)和趣味性(xing)(xing)并(bing)不強,打開方式(shi)也(ye)略顯麻煩。
阿里(li)的(de)(de)語(yu)音(yin)(yin)助手是由iDST部門(men)開發的(de)(de),提供實時智能(neng)(neng)語(yu)音(yin)(yin)識別技(ji)術(shu),可實現(xian)語(yu)音(yin)(yin)操(cao)控、語(yu)音(yin)(yin)搜索、購物等功(gong)能(neng)(neng)。iDST部門(men)的(de)(de)語(yu)音(yin)(yin)識別技(ji)術(shu)主要致力(li)于兩個方面,一是建立自(zi)然語(yu)音(yin)(yin)交互(hu)(hu)(hu)平臺,連(lian)接更多的(de)(de)終端,獲取(qu)互(hu)(hu)(hu)聯網上的(de)(de)各種服務(wu);二(er)是通過輸(shu)出語(yu)音(yin)(yin)能(neng)(neng)力(li),幫(bang)助合作伙伴去做具體業務(wu)。依(yi)托(tuo)系統,加上阿里(li)在新聞、飲食(shi)、地(di)圖、娛樂等領域的(de)(de)布(bu)局,阿里(li)語(yu)音(yin)(yin)助手可獲得(de)強大的(de)(de)數據資源、數據處理能(neng)(neng)力(li),以及多元的(de)(de)服務(wu)。而(er)未(wei)來其將成為阿里(li)商業的(de)(de)交互(hu)(hu)(hu)中心(xin),連(lian)接人與商品和(he)服務(wu),提升購物交易的(de)(de)便(bian)捷化(hua)。
至于(yu)剛(gang)剛(gang)推出的(de)騰(teng)訊叮當,根(gen)據(ju)騰(teng)訊科技(ji)報道,目前騰(teng)訊叮當涵蓋的(de)服務(wu)很廣(guang)泛(fan),已(yi)經覆(fu)蓋新聞、體(ti)育賽事、票(piao)務(wu)、快遞、音樂、股票(piao)、文(wen)學、基于(yu)LBS的(de)附近資源(yuan)等領(ling)域。如用戶對(dui)著騰(teng)訊叮當說“查詢天氣”它就會提供當天和以后三(san)天的(de)預報。問及足球比(bi)賽結果(guo)時,它也(ye)會在1秒內(nei)給(gei)出針(zhen)對(dui)性的(de)答復。
可以(yi)看(kan)出(chu)三家的(de)語音助手服(fu)務有(you)重合,也有(you)自己的(de)特色。如度秘在搜索和生活消費(fei)上更有(you)優(you)勢,阿里語音助手在購物、商務服(fu)務上更有(you)優(you)勢,而騰訊將在泛娛樂上更有(you)優(you)勢。
通過(guo)BAT三(san)家的(de)(de)布局,可(ke)以看(kan)出,他們在(zai)打造(zao)一個人(ren)機交(jiao)互的(de)(de)入口,無論是(shi)在(zai)家庭中,還是(shi)在(zai)個人(ren)的(de)(de)工作(zuo)生(sheng)活中。通過(guo)語音助手來鏈接(jie)其(qi)生(sheng)態中的(de)(de)更(geng)多產(chan)品,來為(wei)消(xiao)費者提供整合性的(de)(de)服務。而在(zai)技術相差(cha)不大的(de)(de)當(dang)(dang)下,誰的(de)(de)連(lian)接(jie)能力更(geng)強,誰的(de)(de)生(sheng)態更(geng)廣(guang),無疑更(geng)有利于占領當(dang)(dang)下的(de)(de)市場。
三星Bixby與蘋果Siri 將有一戰?
早在2011年,蘋果就(jiu)在其(qi)iPhone4S上推(tui)出了(le)智能(neng)(neng)(neng)語音(yin)助(zhu)手(shou)——Siri,隨后(hou)語音(yin)助(zhu)手(shou)也逐(zhu)漸進入(ru)大家(jia)視野。隨著Siri的(de)不斷(duan)升級,儼然成為(wei)一(yi)個(ge)生活管家(jia)。Siri可(ke)以為(wei)你查閱信息(xi),充(chong)當時間助(zhu)手(shou)、郵件助(zhu)手(shou),進行歌曲(qu)識別(bie),還是算數高手(shou),還可(ke)以為(wei)你提供生活消費娛樂等(deng)服務。此外,隨著蘋果Homekit智能(neng)(neng)(neng)家(jia)居平臺的(de)搭建(jian),Siri作為(wei)語音(yin)助(zhu)手(shou)將在智能(neng)(neng)(neng)家(jia)居中發(fa)揮更(geng)大作用。
然而,在今年3月29日的(de)(de)三星(xing)S8發布會上,三星(xing)推出(chu)了(le)其(qi)AI語(yu)音助手Bixby。在三星(xing)S8發布會上,為了(le)和Siri區別開,也為了(le)體現Bixby人工智能特性,三星(xing)重點強調(diao)了(le)Bixby的(de)(de)內容理解能力和學習能力。
內容(rong)理解能力體(ti)現(xian)在當(dang)你告訴Bixby把截圖發送給(gei)(gei)朋友時,如(ru)果有(you)多個(ge)友人重名,Bixby不會因為不知道發給(gei)(gei)誰而(er)(er)崩潰,而(er)(er)是會主動(dong)詢(xun)問你到底要(yao)發給(gei)(gei)誰。而(er)(er)在學習能力上,Bixby主要(yao)通過(guo)積累用(yong)(yong)戶的使用(yong)(yong)習慣來構建用(yong)(yong)戶的日常(chang)使用(yong)(yong)模式。比如(ru)你每天定點用(yong)(yong)Uber打車(che),如(ru)果今天你忘了(le),那么(me)Bixby很可(ke)能會通過(guo)長期觀察你的日常(chang)而(er)(er)提(ti)前幫你在Uber上叫(jiao)車(che)。
此(ci)外,三星還可通(tong)過Bixby接入Sumsung Connect來(lai)控(kong)制三星系的智(zhi)能家電,以期(qi)在智(zhi)能家居中(zhong)發揮更大的作用。然而,可惜(xi)的是(shi)Bixby因(yin)(yin)為種(zhong)種(zhong)原(yuan)因(yin)(yin)并未上(shang)市(shi),也不(bu)被裝入三星S8中(zhong),而很可能載入三星今年下半年的Note8中(zhong)。
有趣的(de)是(shi),為(wei)Bixby提供技術支持(chi)的(de)是(shi)三星去年收購的(de)Viv Labs實驗室(shi),沒(mei)錯就是(shi)蘋(pin)(pin)果(guo)Siri締造者Adam Cheyer、Dag Kittlaus 和 Chris Brigham離開蘋(pin)(pin)果(guo)后聯合(he)成(cheng)立的(de)創業公司(si)!作為(wei)智(zhi)能手(shou)機(ji)市(shi)場的(de)兩個(ge)霸主,三星與(yu)蘋(pin)(pin)果(guo)也在(zai)不(bu)斷暗自較勁。三星遲遲不(bu)推出Bixby,是(shi)否(fou)(fou)為(wei)了憋大(da)招?是(shi)否(fou)(fou)為(wei)了與(yu)蘋(pin)(pin)果(guo)在(zai)語(yu)音助手(shou)領域展(zhan)開一戰?一切(qie)只能等待。
亞馬遜Alexa與Google Assistant的相愛相殺
亞馬遜(xun)的Echo和谷歌的Google Home是(shi)在智(zhi)能家居中相(xiang)對(dui)比(bi)較成熟的兩款產品。目(mu)前兩款產品都已(yi)具備超(chao)過5000項的技(ji)能。
亞(ya)(ya)馬遜于2014年推出智(zhi)能(neng)音箱Echo,搭載Alexa語音助手(shou),隨著不斷升(sheng)級,Echo已成為(wei)家(jia)庭的(de)(de)(de)(de)(de)交互入(ru)口。除了日常生(sheng)活化的(de)(de)(de)(de)(de)服務(wu)外(wai),Echo的(de)(de)(de)(de)(de)主要功能(neng)集中在語音購物和(he)對智(zhi)能(neng)家(jia)居的(de)(de)(de)(de)(de)控制上。而(er)這也(ye)正是亞(ya)(ya)馬遜的(de)(de)(de)(de)(de)野心(xin),建立下一代計算平臺(tai),并稱為(wei)家(jia)庭交互的(de)(de)(de)(de)(de)入(ru)口。
通過亞馬遜Alexa與智能家居設(she)備的(de)(de)(de)連接,你(ni)就可(ke)以(yi)(yi)輕松(song)的(de)(de)(de)控制家庭環境,如(ru)開(kai)關燈、開(kai)關窗簾、開(kai)關電視等(deng)。其(qi)獨(du)特的(de)(de)(de)麥(mai)(mai)克(ke)風,可(ke)以(yi)(yi)實(shi)現(xian)較遠距(ju)離(li)的(de)(de)(de)聲音接收。據知乎用戶反饋(kui),相比Siri需要(yao)掏出手機,按鈕觸發,并且距(ju)離(li)較遠就無法聽到;Echo的(de)(de)(de)麥(mai)(mai)克(ke)風設(she)計的(de)(de)(de)很贊,可(ke)以(yi)(yi)實(shi)現(xian)遠距(ju)離(li)的(de)(de)(de)聲音接收,且不(bu)需要(yao)按鈕觸發,它(ta)會是你(ni)的(de)(de)(de)第二(er)老婆!
而Google Home出(chu)(chu)現的較晚,它于(yu)2016年(nian)5月(yue)份才推(tui)出(chu)(chu),之后便一(yi)直追(zhui)趕亞馬遜的Echo的步伐。此(ci)外,Google Home的功能(neng)(neng)和Echo相差不(bu)大,主要用(yong)于(yu)個人(ren)生(sheng)活和智能(neng)(neng)家居的控(kong)制。Google Home的優勢(shi)在于(yu)其搜索優勢(shi)和功能(neng)(neng)更加齊全,而Echo的優勢(shi)在于(yu)購物和更多(duo)的第三(san)方接入,以(yi)及先發入場優勢(shi)。
有趣(qu)的(de)(de)是(shi)(shi),兩款智能家居(ju)設備,兩個語(yu)(yu)音(yin)助(zhu)手(shou),從出生時仿(fang)佛就是(shi)(shi)宿敵。亞馬遜(xun)于(yu)2015年6月(yue)向(xiang)第(di)(di)三(san)方(fang)(fang)開(kai)放(fang)其Alexa語(yu)(yu)音(yin)技術(shu),而不必通過(guo)智能音(yin)箱Echo;而谷歌(ge)(ge)在2016年12月(yue)才向(xiang)第(di)(di)三(san)方(fang)(fang)開(kai)放(fang),為的(de)(de)是(shi)(shi)于(yu)亞馬遜(xun)展開(kai)競爭(zheng)。而在今(jin)年,雙(shuang)方(fang)(fang)在技術(shu)和連(lian)接(jie)(jie)上的(de)(de)競爭(zheng)更加(jia)白熱化(hua)。一方(fang)(fang)面,雙(shuang)方(fang)(fang)不斷通過(guo)各自語(yu)(yu)音(yin)助(zhu)手(shou)整合和連(lian)接(jie)(jie)更多的(de)(de)設備與(yu)服務,亞馬遜(xun)甚(shen)至向(xiang)第(di)(di)三(san)方(fang)(fang)開(kai)放(fang)了Alexa核心的(de)(de)麥克風語(yu)(yu)音(yin)技術(shu);另一方(fang)(fang)面,谷歌(ge)(ge)也在技術(shu)上有所突破,實現一臺設備的(de)(de)多人使用,目前(qian)可支持6人。
而這(zhe)背后正是家庭(ting)入口的爭奪,誰搶占了這(zhe)個(ge)入口,就可以(yi)掌(zhang)控所有信息的輸(shu)入,以(yi)及(ji)數(shu)據(ju)流和(he)消費流,其市場規(gui)模和(he)潛(qian)力難以(yi)想(xiang)象。
二、智能語音助手的技術邏輯
1950年(nian),計算機(ji)(ji)科學家阿(a)蘭·圖靈就在其論文(wen)《計算機(ji)(ji)與智能(neng)》中提出了(le)著(zhu)名的(de)“圖靈測試”,這是(shi)最早探討(tao)機(ji)(ji)器智能(neng)與人機(ji)(ji)交互(hu)的(de)代(dai)表(biao)。
在(zai)1952年,貝爾實驗室研制出(chu)首(shou)個利用(yong)分離技(ji)術的實用(yong)語音識(shi)別設備,能識(shi)別出(chu)10個英(ying)語數字發(fa)音。
從1950年(nian)開(kai)始至今,語音識(shi)別(bie)(bie)技(ji)術(shu)經歷了(le)由(you)小詞匯、孤立詞匯的識(shi)別(bie)(bie),到大詞匯量、特定聲音識(shi)別(bie)(bie)的飛躍發展。然而(er),語音識(shi)別(bie)(bie)技(ji)術(shu)只是(shi)智(zhi)能語音助手實現工作的第一(yi)步。
總的(de)來(lai)(lai)說,語音助手實(shi)現(xian)(xian)其工作(zuo)大體要經過三(san)步:其一是(shi)前端(duan)的(de)語音識別,即將聲音轉換成(cheng)文字;其二是(shi)自然語言(yan)的(de)理解(jie),將文字解(jie)讀成(cheng)行(xing)(xing)為(wei);其三(san)是(shi)通(tong)過開放API接(jie)口等技術來(lai)(lai)實(shi)現(xian)(xian)行(xing)(xing)為(wei)等操作(zuo)。
因此,語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)助(zhu)手能否提供強大的(de)服務,主要取決(jue)于其(qi)技(ji)術和連接整合能力。在(zai)技(ji)術上(shang),主要使(shi)用(yong)云計(ji)(ji)算、語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)識(shi)(shi)別(bie)、語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)合成(cheng)(cheng)等AI技(ji)術。即在(zai)前端(duan)面(mian)向用(yong)戶時,主要需要語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)識(shi)(shi)別(bie)、語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)合成(cheng)(cheng)技(ji)術。在(zai)語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)識(shi)(shi)別(bie)時,系統需要把語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)轉化成(cheng)(cheng)文字,這就需要強大的(de)語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)庫作(zuo)為支撐(cheng),就需要云計(ji)(ji)算技(ji)術。而語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)合成(cheng)(cheng)則是將(jiang)反饋的(de)文字結果轉化成(cheng)(cheng)語(yu)(yu)音(yin)(yin)(yin)(yin)(yin)輸出。
在后端則是人工智能技(ji)術(shu)的使(shi)用(yong)。面對(dui)用(yong)戶(hu)(hu)的眾多請求(qiu),語音助(zhu)手(shou)需要通過機(ji)器(qi)學(xue)習(xi)(深度(du)神經(jing)網(wang)絡)來(lai)不斷自我學(xue)習(xi),了解用(yong)戶(hu)(hu)的說話方(fang)式和愛好需求(qiu),進而輸出(chu)個性化的服務。
而其連(lian)接(jie)整合能力(li)就是(shi)指,語(yu)音(yin)(yin)助(zhu)手將越(yue)來越(yue)多的設備和(he)服務接(jie)入,從(cong)而構建自身(shen)生(sheng)態的能力(li)。尤其是(shi)在智能家(jia)庭中,用戶最終獲得的是(shi)體驗和(he)服務,單一(yi)(yi)(yi)設備單一(yi)(yi)(yi)APP控(kong)制不是(shi)智能家(jia)居(ju)的追求,智能家(jia)居(ju)需要的是(shi)形成(cheng)一(yi)(yi)(yi)個生(sheng)態,形成(cheng)一(yi)(yi)(yi)個閉環(huan),從(cong)而通過一(yi)(yi)(yi)個入口來更便捷的控(kong)制所有設備。而這(zhe)需要語(yu)音(yin)(yin)助(zhu)手平臺(tai)一(yi)(yi)(yi)方面(mian)開放其語(yu)音(yin)(yin)助(zhu)手,另一(yi)(yi)(yi)方面(mian)也(ye)要加強商務合作,來聚(ju)合服務。
三、智能語音市場將達百億
據工業(ye)和(he)信息化部電子(zi)科技信息情報研(yan)究(jiu)所數據顯示,2012年以(yi)來,全(quan)球(qiu)智能(neng)語(yu)音(yin)(yin)產(chan)(chan)業(ye)規(gui)(gui)模(mo)持續快(kuai)速(su)增(zeng)長。2013年,全(quan)球(qiu)智能(neng)語(yu)音(yin)(yin)產(chan)(chan)業(ye)規(gui)(gui)模(mo)整(zheng)體達(da)33.7億(yi)美元,同比增(zeng)長38.1%;2014年較(jiao)2013年同比增(zeng)長41.0%,產(chan)(chan)業(ye)規(gui)(gui)模(mo)大幅(fu)提升。預計到2017年,全(quan)球(qiu)智能(neng)語(yu)音(yin)(yin)規(gui)(gui)模(mo)將(jiang)達(da)112.4億(yi)美元,復合增(zeng)長率(lv)達(da)35.1%。
據(ju)了解(jie),語(yu)音(yin)技(ji)術(shu)以(yi)其廣闊的(de)產(chan)業應(ying)用席卷人(ren)們的(de)日常(chang)生活(huo)和工作(zuo),其產(chan)業規模大幅提升主(zhu)要(yao)得益(yi)于三方(fang)面。第(di)一是(shi)(shi)大數據(ju)、云計算等技(ji)術(shu)的(de)發展使得智(zhi)能(neng)語(yu)音(yin)技(ji)術(shu)的(de)應(ying)用不(bu)斷成(cheng)熟;第(di)二是(shi)(shi)各國政府、相關行業及(ji)資本的(de)持續關注推(tui)動語(yu)音(yin)技(ji)術(shu)的(de)研發和產(chan)業化(hua);第(di)三是(shi)(shi)隨著移動互(hu)聯網技(ji)術(shu)的(de)發展,智(zhi)能(neng)語(yu)音(yin)技(ji)術(shu)正在快速(su)成(cheng)為人(ren)們日常(chang)生活(huo)的(de)組(zu)成(cheng)部分,并顯著改變(bian)消費者的(de)交互(hu)方(fang)式。
但智(zhi)能語音市場(chang)在帶(dai)來高價值的(de)(de)同時,也將導致行業(ye)的(de)(de)壟斷。據MBA報告,智(zhi)能語音產(chan)業(ye)是(shi)技術(shu)(shu)先導型的(de)(de)新興產(chan)業(ye),存(cun)在核心技術(shu)(shu)壁(bi)壘(lei)、行業(ye)應用壁(bi)壘(lei)和語音資(zi)源壁(bi)壘(lei),具(ju)有(you)顯著的(de)(de)“馬太效(xiao)應”。從(cong)全球范圍來看,僅有(you)少數廠(chang)商在語音市場(chang)具(ju)有(you)競爭力,一類(lei)是(shi)傳統(tong)語音技術(shu)(shu)廠(chang)商,擁有(you)長期技術(shu)(shu)和用戶積累,如美國的(de)(de)Nuance公司,但近(jin)年逐漸衰落,而讓位給(gei)互(hu)聯網巨頭。另一類(lei)是(shi)以IBM、微軟、谷(gu)歌、蘋果等(deng)為代表的(de)(de)IT巨頭,憑借在互(hu)聯網端的(de)(de)優勢迅速搶(qiang)占語音信(xin)息流入口。
資料顯示,早在(zai)2009年,Nuance公司占(zhan)(zhan)有全球語音識別(bie)市(shi)場(chang)約69%的(de)市(shi)場(chang)份(fen)額(e)(e)。在(zai)2012年,Nuance的(de)市(shi)場(chang)份(fen)額(e)(e)下(xia)降(jiang)到62%,Nuance、谷(gu)歌(ge)、微軟、蘋果(guo)、IBM、科大(da)訊飛五家(jia)企(qi)業(ye)(ye)占(zhan)(zhan)據市(shi)場(chang)份(fen)額(e)(e)超95%。2013年,Nuance市(shi)場(chang)份(fen)額(e)(e)下(xia)降(jiang)到51%,而谷(gu)歌(ge)依靠其在(zai)互聯(lian)網和移動互聯(lian)網領域的(de)優勢,市(shi)場(chang)份(fen)額(e)(e)由16.9%上升至28%;蘋果(guo)、微軟、科大(da)訊飛以4.7%、4.4%、4.3%的(de)市(shi)場(chang)份(fen)額(e)(e)分列第(di)三、第(di)四、第(di)五位。可見智(zhi)能(neng)語音行(xing)業(ye)(ye)的(de)寡頭(tou)壟斷特征十分明顯。
此外,隨著智(zhi)能(neng)(neng)家(jia)(jia)居(ju)(ju)已從概念向商(shang)業化階段發展,語(yu)音控(kong)制和(he)(he)交互(hu)將是(shi)智(zhi)能(neng)(neng)家(jia)(jia)庭的一大趨勢(shi)。根(gen)據(ju)市場(chang)研究公司Juniper發布(bu)的數(shu)據(ju),2018年(nian)全球智(zhi)能(neng)(neng)家(jia)(jia)居(ju)(ju)市場(chang)規模將達710億美元。以蘋果、三(san)星、海爾(er)為(wei)代表(biao)的消費電子廠(chang)商(shang)和(he)(he)以谷歌、小米、樂視等為(wei)代表(biao)的互(hu)聯網企(qi)業開始紛紛推出智(zhi)能(neng)(neng)家(jia)(jia)電產品,為(wei)智(zhi)能(neng)(neng)家(jia)(jia)居(ju)(ju)市場(chang)打(da)前(qian)站。而(er)智(zhi)能(neng)(neng)家(jia)(jia)居(ju)(ju)的發展也將帶動(dong)智(zhi)能(neng)(neng)語(yu)音服務的快(kuai)速增(zeng)長(chang)。
由于(yu)智能語(yu)音助手將會是(shi)家庭(ting)的(de)(de)中(zhong)(zhong)心入口,占據了這個入口,就占據了家庭(ting)服(fu)務(wu)的(de)(de)大部分,接入其中(zhong)(zhong)的(de)(de)服(fu)務(wu)將會獲(huo)得更多的(de)(de)市場(chang)份額。另(ling)一方面(mian),語(yu)音助手也將獲(huo)得海量的(de)(de)家庭(ting)數據信息,這些海量、動(dong)態(tai)的(de)(de)數據可以(yi)用(yong)來優(you)化算法的(de)(de)迭代,也可以(yi)用(yong)于(yu)其他云服(fu)務(wu),產生(sheng)更高的(de)(de)價值(zhi)。
結語:助力智能化生活
在(zai)(zai)人類(lei)文(wen)(wen)明的(de)(de)技術史中,由于通信(xin)的(de)(de)需要,我們(men)(men)創造了文(wen)(wen)字,它是(shi)我們(men)(men)在(zai)(zai)歷史長(chang)河中由于自身局限不得(de)不做的(de)(de)選擇。而今(jin)天我們(men)(men)由于技術的(de)(de)進步,將擺脫文(wen)(wen)字的(de)(de)束縛(fu),再(zai)次選擇口(kou)語(yu)作(zuo)為我們(men)(men)的(de)(de)通訊(xun)方式(shi),讓(rang)我們(men)(men)的(de)(de)生活(huo)更加(jia)便捷、高效化。或(huo)許(xu)這也是(shi)蘋果(guo)、亞馬遜當初選擇語(yu)音這種(zhong)最原始的(de)(de)方式(shi)作(zuo)為交互入口(kou)的(de)(de)原因。
試(shi)想一下,在不遠將來(lai)的(de)(de)一個(ge)早晨,你(ni)(ni)從(cong)睡夢中醒來(lai),輕輕喚醒你(ni)(ni)的(de)(de)語音助(zhu)手。它為(wei)你(ni)(ni)打開(kai)窗簾,為(wei)你(ni)(ni)播報(bao)今(jin)天的(de)(de)天氣,建議你(ni)(ni)穿什么樣(yang)的(de)(de)衣服(fu)。同(tong)時(shi)喚醒廚房,預熱(re)你(ni)(ni)事先(xian)準(zhun)備(bei)好的(de)(de)早餐(can)(can)。在你(ni)(ni)吃早餐(can)(can)時(shi),你(ni)(ni)的(de)(de)語音助(zhu)手為(wei)你(ni)(ni)播報(bao)昨(zuo)晚和今(jin)日的(de)(de)要聞。當你(ni)(ni)感(gan)覺室內的(de)(de)光線略暗時(shi),它為(wei)你(ni)(ni)調節室內燈光。它會根據空氣質量(liang)來(lai)決(jue)定是否開(kai)窗以及啟動空氣凈(jing)化器。并在你(ni)(ni)出門時(shi),為(wei)你(ni)(ni)安排好上班的(de)(de)行程以及交通方式。而這只在不遠的(de)(de)未來(lai)。
隨著人工智能的(de)(de)發展,智能語音(yin)助手(shou)將會(hui)更(geng)加智能,融入我們(men)的(de)(de)家庭(ting)和我們(men)的(de)(de)生(sheng)活。盡(jin)管(guan)也會(hui)面(mian)臨種種隱私、數據泄露和營銷行為,但(dan)它們(men)將便捷(jie)和高效化我們(men)的(de)(de)生(sheng)活。我們(men)將獲(huo)得更(geng)多控制(zhi),解(jie)放雙手(shou),從而(er)將時間精力(li)用到更(geng)有意義、更(geng)有價值的(de)(de)事情上(shang)。