近(jin)期,無論國外還(huan)是國內,智能(neng)語(yu)音助手都是一個(ge)相當火熱(re)的(de)話題。
在國外,谷歌的Google Home 和亞馬遜(xun)Echo的斗(dou)爭十分激烈,一方面不(bu)斷(duan)升級語音(yin)助(zhu)手(shou)服(fu)務,另一方面不(bu)斷(duan)向(xiang)第(di)三方開(kai)放其語音(yin)助(zhu)手(shou)平臺。如4月15日亞馬遜(xun)向(xiang)第(di)三方授權其Echo的關鍵語音(yin)技術;再如4月20日Google Home 推(tui)出其智能(neng)音(yin)箱可同時支持6人使用,提供個性化服(fu)務 。此外,4月23日奔馳也將其新(xin)車(che)接入Alexa和Google Assistant,提升其車(che)載系統和對智能(neng)家居等的遠距離控制。
而(er)在國內,4月(yue)14日,樂(le)視(shi)推出其語(yu)(yu)(yu)音(yin)助手(shou)“樂(le)樂(le)”來實現對手(shou)機APP的語(yu)(yu)(yu)音(yin)操作。4月(yue)18日人工智能公司(si)出門問問推出其語(yu)(yu)(yu)音(yin)助理“問問”和智能音(yin)箱Tichome,并向第(di)三方開放語(yu)(yu)(yu)音(yin)平(ping)臺。4月(yue)25日,騰(teng)訊推出語(yu)(yu)(yu)音(yin)助手(shou)“騰(teng)訊叮(ding)當”,又(you)一巨(ju)頭入局(ju)智能交互領域(yu)。
隨著(zhu)人(ren)工智能(neng)和智能(neng)家(jia)居(ju)的發(fa)展,以音箱或手機等為(wei)硬(ying)件的語音助(zhu)手可能(neng)將成為(wei)家(jia)庭(ting)的交互入口,而(er)這背后是整個智能(neng)家(jia)居(ju)產(chan)業(ye)鏈(lian)和廣闊的市場(chang)。誰將掌握這個控制中心,誰就贏得(de)了未(wei)來。
一、智能語音助手大盤點
目前,語音助手(shou)的硬件載體(ti)已經(jing)開始(shi)從智能手(shou)機(ji)向(xiang)音箱、汽車、機(ji)器人等(deng)蔓延。預計這一趨(qu)勢會(hui)愈演愈烈,語音助手(shou)將會(hui)連接更多的設(she)備,從而成為智能生活的核心控制中(zhong)心之一。
盡管(guan)當(dang)下市場上有許多(duo)語音(yin)助(zhu)(zhu)(zhu)手,但由于語音(yin)技術的(de)(de)(de)(de)研發周(zhou)期長,投(tou)入大(da),行業進入壁壘(lei)較高(gao),全球范圍內應用成(cheng)熟的(de)(de)(de)(de)語音(yin)助(zhu)(zhu)(zhu)手并不多(duo)。知名度較高(gao)的(de)(de)(de)(de)有國外谷歌的(de)(de)(de)(de)Google Home、亞馬遜的(de)(de)(de)(de)Alexa、蘋果的(de)(de)(de)(de)Siri、微軟的(de)(de)(de)(de)Cortana小娜,以及(ji)尚未(wei)謀(mou)面的(de)(de)(de)(de)三星(xing)Bixby。國內知名度較高(gao)的(de)(de)(de)(de)有百(bai)度的(de)(de)(de)(de)度秘和(he)科(ke)大(da)訊飛(fei)的(de)(de)(de)(de)靈犀(xi)語音(yin)助(zhu)(zhu)(zhu)手。
BAT三巨頭在語音助手領(ling)域(yu)再相遇(yu)
就在近日(ri)騰訊(xun)也推(tui)出其語(yu)(yu)音助(zhu)手(shou)“騰訊(xun)叮當”,騰訊(xun)表示,其最新人工智(zhi)能(neng)助(zhu)手(shou)騰訊(xun)叮當在功(gong)能(neng)上(shang)(shang)與亞馬遜Alexa相似。而到此,加(jia)上(shang)(shang)百度的度秘(mi)和阿(a)里iDST的語(yu)(yu)音助(zhu)手(shou),BAT三巨頭(tou)都進(jin)入了智(zhi)能(neng)語(yu)(yu)音助(zhu)手(shou)領(ling)域,可見他(ta)們對于語(yu)(yu)音交互這一大“入口”的認同。
度(du)秘(mi)是(shi)李彥(yan)宏在(zai)2015年百度(du)世界大會上推出的(de)(de)機器人助(zhu)理。依托(tuo)百度(du)的(de)(de)搜(sou)索和(he)智能交互(hu)技術(shu),度(du)秘(mi)可以(yi)通過對話,進而在(zai)索引現實的(de)(de)服(fu)務(wu)(wu)(wu)和(he)信息(xi)的(de)(de)基礎上,為用戶提供服(fu)務(wu)(wu)(wu)。度(du)秘(mi)主要的(de)(de)能力集中在(zai)美食推薦(jian)、電影推薦(jian)和(he)生活服(fu)務(wu)(wu)(wu)推薦(jian)。度(du)秘(mi)服(fu)務(wu)(wu)(wu)更多的(de)(de)集中在(zai)消費上,它連接的(de)(de)是(shi)廣泛的(de)(de)現實行業,涵(han)蓋吃(chi)、住、行、玩等方面,這更多的(de)(de)是(shi)依托(tuo)百度(du)搜(sou)索能力、百度(du)地圖、百度(du)糯(nuo)米等O2O類的(de)(de)服(fu)務(wu)(wu)(wu)。
但目前的(de)度(du)秘需(xu)要下載手機百度(du)客戶端才能(neng)(neng)使用,也沒有(you)語音服務和日(ri)常生活(huo)提(ti)醒等功能(neng)(neng)。度(du)秘的(de)交(jiao)互(hu)性和趣味性并不強,打開方式也略(lve)顯麻煩(fan)。
阿(a)(a)里(li)的(de)(de)(de)語(yu)音(yin)(yin)(yin)助手是由iDST部門(men)開發的(de)(de)(de),提供實時智(zhi)能(neng)語(yu)音(yin)(yin)(yin)識別技(ji)術,可實現語(yu)音(yin)(yin)(yin)操控、語(yu)音(yin)(yin)(yin)搜索、購物等(deng)功(gong)能(neng)。iDST部門(men)的(de)(de)(de)語(yu)音(yin)(yin)(yin)識別技(ji)術主(zhu)要致力(li)于兩個(ge)方(fang)面(mian),一是建立(li)自然(ran)語(yu)音(yin)(yin)(yin)交(jiao)互(hu)平臺,連接(jie)更多(duo)的(de)(de)(de)終端,獲(huo)(huo)取互(hu)聯(lian)網上的(de)(de)(de)各種(zhong)服務(wu);二是通過輸出語(yu)音(yin)(yin)(yin)能(neng)力(li),幫助合作伙伴去做具體(ti)業務(wu)。依托(tuo)系統,加(jia)上阿(a)(a)里(li)在新聞、飲(yin)食(shi)、地圖(tu)、娛樂等(deng)領域的(de)(de)(de)布局,阿(a)(a)里(li)語(yu)音(yin)(yin)(yin)助手可獲(huo)(huo)得強大的(de)(de)(de)數據資源、數據處(chu)理能(neng)力(li),以及(ji)多(duo)元(yuan)的(de)(de)(de)服務(wu)。而(er)未來其將成為阿(a)(a)里(li)商業的(de)(de)(de)交(jiao)互(hu)中心,連接(jie)人與商品和服務(wu),提升購物交(jiao)易(yi)的(de)(de)(de)便捷化(hua)。
至(zhi)于剛剛推(tui)出(chu)的騰訊叮當,根據騰訊科技報道,目前騰訊叮當涵蓋(gai)的服務很廣泛,已經覆蓋(gai)新聞、體(ti)育(yu)賽事、票(piao)務、快遞(di)、音(yin)樂、股(gu)票(piao)、文學、基于LBS的附近(jin)資(zi)源等領域(yu)。如(ru)用(yong)戶對著騰訊叮當說“查(cha)詢天(tian)氣(qi)”它就會(hui)提供當天(tian)和以后(hou)三(san)天(tian)的預報。問及足球比賽結果(guo)時,它也(ye)會(hui)在1秒內給出(chu)針對性的答復(fu)。
可(ke)以看出三家的語(yu)音(yin)(yin)助(zhu)手(shou)服(fu)務有(you)重合,也有(you)自己的特色。如度秘在搜(sou)索和生(sheng)活消費上(shang)更(geng)有(you)優勢,阿里語(yu)音(yin)(yin)助(zhu)手(shou)在購物、商務服(fu)務上(shang)更(geng)有(you)優勢,而騰訊(xun)將在泛娛樂上(shang)更(geng)有(you)優勢。
通過(guo)BAT三(san)家(jia)的(de)(de)布局,可以看出,他們在打造一個人機交互(hu)的(de)(de)入口,無(wu)(wu)論是在家(jia)庭中,還是在個人的(de)(de)工作生活(huo)中。通過(guo)語(yu)音助(zhu)手來鏈(lian)接其生態(tai)中的(de)(de)更多產(chan)品,來為消費者提供(gong)整(zheng)合(he)性的(de)(de)服(fu)務(wu)。而在技術相差不大(da)的(de)(de)當(dang)下,誰的(de)(de)連(lian)接能力(li)更強,誰的(de)(de)生態(tai)更廣,無(wu)(wu)疑更有(you)利于占(zhan)領當(dang)下的(de)(de)市場(chang)。
三星Bixby與蘋果Siri 將有一戰?
早(zao)在(zai)2011年,蘋果就(jiu)在(zai)其iPhone4S上推出了智(zhi)能(neng)(neng)語(yu)音助(zhu)手(shou)(shou)——Siri,隨(sui)后語(yu)音助(zhu)手(shou)(shou)也逐漸進入大家(jia)視野。隨(sui)著Siri的不斷升級,儼然成為(wei)一個生活管家(jia)。Siri可(ke)以(yi)為(wei)你查閱信息,充當時(shi)間助(zhu)手(shou)(shou)、郵件助(zhu)手(shou)(shou),進行(xing)歌曲識別,還是算數高手(shou)(shou),還可(ke)以(yi)為(wei)你提供生活消費(fei)娛樂等服務。此外,隨(sui)著蘋果Homekit智(zhi)能(neng)(neng)家(jia)居平(ping)臺的搭(da)建(jian),Siri作為(wei)語(yu)音助(zhu)手(shou)(shou)將在(zai)智(zhi)能(neng)(neng)家(jia)居中發(fa)揮更大作用。
然而,在今(jin)年(nian)3月29日的三星S8發布(bu)會上(shang),三星推出了(le)(le)其AI語音助手Bixby。在三星S8發布(bu)會上(shang),為了(le)(le)和(he)Siri區別開,也為了(le)(le)體現Bixby人工智能(neng)特性,三星重點強調了(le)(le)Bixby的內(nei)容理解能(neng)力(li)和(he)學習能(neng)力(li)。
內容理解(jie)能(neng)(neng)力體現在(zai)(zai)當(dang)你告訴Bixby把截圖發送給朋友時,如果有多個友人重名,Bixby不會因為不知道發給誰(shui)而崩潰,而是會主(zhu)動詢(xun)問(wen)你到底要發給誰(shui)。而在(zai)(zai)學習(xi)能(neng)(neng)力上(shang),Bixby主(zhu)要通(tong)過(guo)積累用(yong)(yong)戶(hu)的(de)(de)使(shi)用(yong)(yong)習(xi)慣來(lai)構(gou)建用(yong)(yong)戶(hu)的(de)(de)日常(chang)使(shi)用(yong)(yong)模(mo)式。比如你每(mei)天定點(dian)用(yong)(yong)Uber打車(che),如果今天你忘了,那么Bixby很(hen)可能(neng)(neng)會通(tong)過(guo)長期觀(guan)察你的(de)(de)日常(chang)而提前幫(bang)你在(zai)(zai)Uber上(shang)叫(jiao)車(che)。
此外,三(san)星還可通過(guo)Bixby接入Sumsung Connect來控制三(san)星系的智(zhi)能家電,以期在智(zhi)能家居中(zhong)(zhong)發揮更大的作(zuo)用。然而,可惜的是Bixby因(yin)為種種原因(yin)并未上市(shi),也(ye)不被裝入三(san)星S8中(zhong)(zhong),而很可能載入三(san)星今年下半年的Note8中(zhong)(zhong)。
有趣的(de)是(shi)(shi),為(wei)Bixby提(ti)供技術(shu)支持的(de)是(shi)(shi)三(san)星(xing)去(qu)年(nian)收購的(de)Viv Labs實驗室,沒錯(cuo)就(jiu)是(shi)(shi)蘋(pin)(pin)果(guo)Siri締造者Adam Cheyer、Dag Kittlaus 和 Chris Brigham離開蘋(pin)(pin)果(guo)后聯(lian)合成(cheng)立(li)的(de)創業公(gong)司(si)!作(zuo)為(wei)智能(neng)手機(ji)市場的(de)兩個霸主,三(san)星(xing)與(yu)蘋(pin)(pin)果(guo)也在(zai)不(bu)斷暗自較勁。三(san)星(xing)遲(chi)遲(chi)不(bu)推(tui)出(chu)Bixby,是(shi)(shi)否(fou)為(wei)了憋大招(zhao)?是(shi)(shi)否(fou)為(wei)了與(yu)蘋(pin)(pin)果(guo)在(zai)語音助手領域展開一戰?一切只能(neng)等待。
亞馬遜Alexa與Google Assistant的相愛相殺
亞馬(ma)遜的Echo和谷歌的Google Home是在智能(neng)家居中相(xiang)對(dui)比較成熟的兩款產品。目前兩款產品都已具(ju)備超過5000項(xiang)的技能(neng)。
亞馬(ma)遜(xun)于2014年推出智能(neng)音箱(xiang)Echo,搭載(zai)Alexa語(yu)音助手,隨著不(bu)斷升級,Echo已成為(wei)(wei)家(jia)庭(ting)的(de)(de)(de)交(jiao)互入(ru)口(kou)。除了日常(chang)生活(huo)化(hua)的(de)(de)(de)服務(wu)外(wai),Echo的(de)(de)(de)主要功能(neng)集中在語(yu)音購物和對智能(neng)家(jia)居的(de)(de)(de)控(kong)制(zhi)上。而這也正是亞馬(ma)遜(xun)的(de)(de)(de)野(ye)心,建立下一代計算平臺,并(bing)稱為(wei)(wei)家(jia)庭(ting)交(jiao)互的(de)(de)(de)入(ru)口(kou)。
通(tong)過(guo)亞馬遜Alexa與智(zhi)能家居設備(bei)的(de)連接,你就(jiu)可以輕(qing)松的(de)控(kong)制家庭(ting)環境(jing),如開關燈、開關窗(chuang)簾、開關電視等。其獨特(te)的(de)麥(mai)克風,可以實現較遠(yuan)距(ju)離(li)的(de)聲音(yin)接收。據(ju)知乎用戶反饋(kui),相比Siri需(xu)要(yao)掏出手機,按鈕觸發,并且(qie)距(ju)離(li)較遠(yuan)就(jiu)無法聽到;Echo的(de)麥(mai)克風設計的(de)很贊,可以實現遠(yuan)距(ju)離(li)的(de)聲音(yin)接收,且(qie)不需(xu)要(yao)按鈕觸發,它會(hui)是你的(de)第(di)二老婆(po)!
而Google Home出(chu)現的(de)(de)(de)(de)較晚(wan),它于(yu)(yu)2016年5月份才推出(chu),之后(hou)便一直追(zhui)趕亞馬遜的(de)(de)(de)(de)Echo的(de)(de)(de)(de)步伐。此(ci)外(wai),Google Home的(de)(de)(de)(de)功能和(he)Echo相差(cha)不大,主要用(yong)于(yu)(yu)個人生活和(he)智(zhi)能家居的(de)(de)(de)(de)控制。Google Home的(de)(de)(de)(de)優(you)勢在于(yu)(yu)其搜索優(you)勢和(he)功能更加齊全,而Echo的(de)(de)(de)(de)優(you)勢在于(yu)(yu)購(gou)物(wu)和(he)更多(duo)的(de)(de)(de)(de)第三方接入(ru),以及先(xian)發入(ru)場(chang)優(you)勢。
有趣(qu)的(de)(de)(de)是(shi),兩款智(zhi)能家(jia)居設(she)備(bei),兩個語(yu)(yu)(yu)音(yin)助手,從(cong)出生時仿佛就是(shi)宿敵。亞馬遜(xun)(xun)(xun)于2015年(nian)(nian)6月(yue)(yue)向第(di)三方(fang)(fang)(fang)開放(fang)其Alexa語(yu)(yu)(yu)音(yin)技術,而不(bu)必(bi)通過(guo)智(zhi)能音(yin)箱(xiang)Echo;而谷歌在2016年(nian)(nian)12月(yue)(yue)才向第(di)三方(fang)(fang)(fang)開放(fang),為的(de)(de)(de)是(shi)于亞馬遜(xun)(xun)(xun)展開競爭。而在今年(nian)(nian),雙(shuang)方(fang)(fang)(fang)在技術和(he)連接上的(de)(de)(de)競爭更(geng)(geng)加白熱化。一方(fang)(fang)(fang)面,雙(shuang)方(fang)(fang)(fang)不(bu)斷通過(guo)各自語(yu)(yu)(yu)音(yin)助手整合和(he)連接更(geng)(geng)多的(de)(de)(de)設(she)備(bei)與服務(wu),亞馬遜(xun)(xun)(xun)甚(shen)至向第(di)三方(fang)(fang)(fang)開放(fang)了Alexa核(he)心的(de)(de)(de)麥克風語(yu)(yu)(yu)音(yin)技術;另一方(fang)(fang)(fang)面,谷歌也在技術上有所(suo)突(tu)破,實現(xian)一臺設(she)備(bei)的(de)(de)(de)多人使用,目前可支持6人。
而(er)這(zhe)背后(hou)正是家庭入(ru)口的(de)爭奪,誰搶占了這(zhe)個入(ru)口,就可(ke)以掌控所有信(xin)息的(de)輸入(ru),以及數據流和(he)(he)消費流,其市場規模和(he)(he)潛力難以想象。
二、智能語音助手的技術邏輯
1950年(nian),計算機(ji)科學家阿(a)蘭·圖靈就在其論文《計算機(ji)與智能》中提出了(le)著名(ming)的(de)“圖靈測試”,這是最(zui)早(zao)探討機(ji)器智能與人(ren)機(ji)交互的(de)代表。
在1952年,貝(bei)爾實驗(yan)室研制出(chu)首個(ge)利(li)用分離技術的實用語音(yin)(yin)識別設備,能識別出(chu)10個(ge)英(ying)語數(shu)字發音(yin)(yin)。
從1950年(nian)開始至今,語(yu)(yu)(yu)音識(shi)別技術(shu)經(jing)歷了由小(xiao)詞(ci)(ci)匯(hui)、孤立詞(ci)(ci)匯(hui)的(de)識(shi)別,到大詞(ci)(ci)匯(hui)量、特定(ding)聲音識(shi)別的(de)飛躍發展。然而,語(yu)(yu)(yu)音識(shi)別技術(shu)只是智(zhi)能語(yu)(yu)(yu)音助手實現工作(zuo)的(de)第一步。
總的(de)來(lai)說,語(yu)音助手實現其(qi)(qi)工作(zuo)大體(ti)要經過(guo)三(san)步(bu):其(qi)(qi)一是前(qian)端的(de)語(yu)音識(shi)別,即(ji)將聲音轉換(huan)成文字(zi);其(qi)(qi)二是自然語(yu)言(yan)的(de)理解,將文字(zi)解讀成行(xing)為;其(qi)(qi)三(san)是通過(guo)開放API接(jie)口等技術來(lai)實現行(xing)為等操作(zuo)。
因此,語(yu)(yu)(yu)音(yin)助手(shou)能否提(ti)供(gong)強大(da)的服務,主要(yao)(yao)(yao)(yao)取決于其技術(shu)和(he)連接整(zheng)合(he)能力。在技術(shu)上,主要(yao)(yao)(yao)(yao)使用(yong)云(yun)計(ji)算、語(yu)(yu)(yu)音(yin)識別、語(yu)(yu)(yu)音(yin)合(he)成等(deng)AI技術(shu)。即(ji)在前端(duan)面(mian)向(xiang)用(yong)戶時,主要(yao)(yao)(yao)(yao)需要(yao)(yao)(yao)(yao)語(yu)(yu)(yu)音(yin)識別、語(yu)(yu)(yu)音(yin)合(he)成技術(shu)。在語(yu)(yu)(yu)音(yin)識別時,系統(tong)需要(yao)(yao)(yao)(yao)把語(yu)(yu)(yu)音(yin)轉化(hua)成文字,這就(jiu)需要(yao)(yao)(yao)(yao)強大(da)的語(yu)(yu)(yu)音(yin)庫(ku)作為支撐,就(jiu)需要(yao)(yao)(yao)(yao)云(yun)計(ji)算技術(shu)。而語(yu)(yu)(yu)音(yin)合(he)成則是(shi)將反(fan)饋的文字結果(guo)轉化(hua)成語(yu)(yu)(yu)音(yin)輸(shu)出。
在后(hou)端則是人工智能(neng)技術的(de)使用。面對用戶的(de)眾多請求,語(yu)音(yin)助手(shou)需要通過機器學習(深度神經網絡)來(lai)不斷自我學習,了解(jie)用戶的(de)說話方式(shi)和愛好(hao)需求,進而輸(shu)出(chu)個性化(hua)的(de)服(fu)務。
而(er)其(qi)連(lian)接整(zheng)合(he)能力就是指,語音(yin)助手(shou)將越(yue)來(lai)越(yue)多的(de)設備和(he)服務(wu)接入,從(cong)(cong)而(er)構建自身生(sheng)態的(de)能力。尤其(qi)是在(zai)智能家庭(ting)中,用戶最終獲得的(de)是體驗和(he)服務(wu),單一(yi)設備單一(yi)APP控制不是智能家居的(de)追(zhui)求,智能家居需要(yao)的(de)是形成(cheng)一(yi)個生(sheng)態,形成(cheng)一(yi)個閉(bi)環,從(cong)(cong)而(er)通過一(yi)個入口來(lai)更便捷的(de)控制所有設備。而(er)這(zhe)需要(yao)語音(yin)助手(shou)平臺(tai)一(yi)方(fang)面(mian)開放其(qi)語音(yin)助手(shou),另一(yi)方(fang)面(mian)也要(yao)加強商務(wu)合(he)作,來(lai)聚合(he)服務(wu)。
三、智能語音市場將達百億
據(ju)工(gong)業和信息化部電子科技信息情(qing)報研究所數據(ju)顯示,2012年(nian)以來(lai),全球(qiu)智(zhi)能語(yu)音(yin)產業規模(mo)持(chi)續快速增長。2013年(nian),全球(qiu)智(zhi)能語(yu)音(yin)產業規模(mo)整(zheng)體達33.7億美元,同比增長38.1%;2014年(nian)較2013年(nian)同比增長41.0%,產業規模(mo)大幅提升。預計到2017年(nian),全球(qiu)智(zhi)能語(yu)音(yin)規模(mo)將達112.4億美元,復合增長率達35.1%。
據了解,語(yu)音技(ji)(ji)(ji)術(shu)以其廣闊的(de)(de)(de)(de)產(chan)業(ye)應用(yong)席卷人們的(de)(de)(de)(de)日常生活(huo)和工(gong)作,其產(chan)業(ye)規模大幅提升主要得(de)益于三方面。第一是(shi)大數據、云(yun)計算等技(ji)(ji)(ji)術(shu)的(de)(de)(de)(de)發展使得(de)智能語(yu)音技(ji)(ji)(ji)術(shu)的(de)(de)(de)(de)應用(yong)不(bu)斷成熟;第二是(shi)各國政府(fu)、相關行業(ye)及資(zi)本(ben)的(de)(de)(de)(de)持續關注(zhu)推動語(yu)音技(ji)(ji)(ji)術(shu)的(de)(de)(de)(de)研發和產(chan)業(ye)化;第三是(shi)隨著移動互(hu)聯網(wang)技(ji)(ji)(ji)術(shu)的(de)(de)(de)(de)發展,智能語(yu)音技(ji)(ji)(ji)術(shu)正在(zai)快速成為人們日常生活(huo)的(de)(de)(de)(de)組(zu)成部分,并顯著改(gai)變消費者(zhe)的(de)(de)(de)(de)交互(hu)方式。
但智能(neng)語(yu)(yu)音(yin)市(shi)場在(zai)帶來高價值的同時,也(ye)將(jiang)導(dao)致行(xing)業的壟(long)斷。據MBA報告,智能(neng)語(yu)(yu)音(yin)產(chan)(chan)業是(shi)技(ji)(ji)(ji)術先導(dao)型的新興(xing)產(chan)(chan)業,存在(zai)核心技(ji)(ji)(ji)術壁壘、行(xing)業應用壁壘和(he)語(yu)(yu)音(yin)資源壁壘,具有顯著的“馬太效應”。從全球范圍來看,僅有少(shao)數廠商在(zai)語(yu)(yu)音(yin)市(shi)場具有競爭力,一類是(shi)傳統語(yu)(yu)音(yin)技(ji)(ji)(ji)術廠商,擁(yong)有長期技(ji)(ji)(ji)術和(he)用戶積累(lei),如(ru)美國的Nuance公司,但近年逐(zhu)漸衰落,而讓(rang)位給(gei)互聯網(wang)巨頭(tou)。另一類是(shi)以IBM、微軟(ruan)、谷歌、蘋果等為代表的IT巨頭(tou),憑借在(zai)互聯網(wang)端的優勢迅速搶(qiang)占(zhan)語(yu)(yu)音(yin)信(xin)息流入口。
資料(liao)顯示,早在(zai)(zai)2009年,Nuance公(gong)司占(zhan)有全球語音識別市(shi)(shi)(shi)場(chang)(chang)(chang)約69%的(de)市(shi)(shi)(shi)場(chang)(chang)(chang)份額(e)。在(zai)(zai)2012年,Nuance的(de)市(shi)(shi)(shi)場(chang)(chang)(chang)份額(e)下(xia)降到62%,Nuance、谷歌(ge)、微(wei)軟(ruan)、蘋果、IBM、科大(da)訊飛五家企業(ye)占(zhan)據市(shi)(shi)(shi)場(chang)(chang)(chang)份額(e)超(chao)95%。2013年,Nuance市(shi)(shi)(shi)場(chang)(chang)(chang)份額(e)下(xia)降到51%,而谷歌(ge)依靠其在(zai)(zai)互(hu)(hu)聯(lian)網和(he)移動互(hu)(hu)聯(lian)網領域的(de)優勢,市(shi)(shi)(shi)場(chang)(chang)(chang)份額(e)由(you)16.9%上升至28%;蘋果、微(wei)軟(ruan)、科大(da)訊飛以4.7%、4.4%、4.3%的(de)市(shi)(shi)(shi)場(chang)(chang)(chang)份額(e)分(fen)列第三、第四、第五位。可見智能(neng)語音行業(ye)的(de)寡頭壟斷特征十分(fen)明顯。
此外(wai),隨著智(zhi)能家居(ju)已從概(gai)念向商(shang)業化階(jie)段發(fa)展(zhan),語音控制和交互將是智(zhi)能家庭的(de)(de)一大趨勢。根據市(shi)場(chang)研究公司Juniper發(fa)布的(de)(de)數(shu)據,2018年(nian)全球智(zhi)能家居(ju)市(shi)場(chang)規模將達710億美元(yuan)。以蘋果、三(san)星、海(hai)爾(er)為代(dai)表的(de)(de)消費電子廠商(shang)和以谷歌(ge)、小(xiao)米(mi)、樂視等為代(dai)表的(de)(de)互聯(lian)網(wang)企業開(kai)始紛紛推出智(zhi)能家電產品,為智(zhi)能家居(ju)市(shi)場(chang)打前(qian)站。而智(zhi)能家居(ju)的(de)(de)發(fa)展(zhan)也將帶動智(zhi)能語音服務的(de)(de)快速增(zeng)長(chang)。
由(you)于智能語音助(zhu)手將會是家(jia)庭(ting)(ting)的(de)(de)中心(xin)入(ru)口,占據(ju)了這(zhe)個(ge)入(ru)口,就占據(ju)了家(jia)庭(ting)(ting)服(fu)務(wu)(wu)的(de)(de)大部分,接入(ru)其中的(de)(de)服(fu)務(wu)(wu)將會獲得(de)更(geng)多的(de)(de)市場(chang)份額。另一方面,語音助(zhu)手也將獲得(de)海量的(de)(de)家(jia)庭(ting)(ting)數據(ju)信息,這(zhe)些(xie)海量、動(dong)態的(de)(de)數據(ju)可以(yi)用來(lai)優化算法(fa)的(de)(de)迭代(dai),也可以(yi)用于其他云(yun)服(fu)務(wu)(wu),產生(sheng)更(geng)高的(de)(de)價值。
結語:助力智能化生活
在人類文(wen)明的(de)技術史(shi)中(zhong),由(you)于(yu)通信(xin)的(de)需(xu)要,我們(men)創造了文(wen)字,它是我們(men)在歷(li)史(shi)長河中(zhong)由(you)于(yu)自身(shen)局限不(bu)得不(bu)做的(de)選擇。而今(jin)天(tian)我們(men)由(you)于(yu)技術的(de)進(jin)步,將擺脫文(wen)字的(de)束縛,再(zai)次選擇口語作為(wei)(wei)我們(men)的(de)通訊方式(shi),讓(rang)我們(men)的(de)生活更加便捷、高效(xiao)化。或許這(zhe)(zhe)也是蘋果、亞馬遜當初(chu)選擇語音這(zhe)(zhe)種(zhong)最原始的(de)方式(shi)作為(wei)(wei)交互入口的(de)原因。
試(shi)想一下(xia),在不(bu)遠將來的一個(ge)早晨,你(ni)(ni)(ni)從睡夢中醒(xing)(xing)來,輕(qing)輕(qing)喚醒(xing)(xing)你(ni)(ni)(ni)的語(yu)音(yin)助(zhu)手(shou)。它(ta)(ta)為(wei)你(ni)(ni)(ni)打開窗(chuang)簾,為(wei)你(ni)(ni)(ni)播(bo)(bo)報(bao)今(jin)天的天氣,建議你(ni)(ni)(ni)穿什么樣的衣(yi)服。同時(shi)(shi)(shi)喚醒(xing)(xing)廚房,預(yu)熱你(ni)(ni)(ni)事(shi)先(xian)準(zhun)備好的早餐。在你(ni)(ni)(ni)吃早餐時(shi)(shi)(shi),你(ni)(ni)(ni)的語(yu)音(yin)助(zhu)手(shou)為(wei)你(ni)(ni)(ni)播(bo)(bo)報(bao)昨(zuo)晚和(he)今(jin)日的要(yao)聞。當(dang)你(ni)(ni)(ni)感覺室(shi)內的光線(xian)略(lve)暗時(shi)(shi)(shi),它(ta)(ta)為(wei)你(ni)(ni)(ni)調(diao)節室(shi)內燈光。它(ta)(ta)會根據空氣質量來決定(ding)是(shi)否(fou)開窗(chuang)以及(ji)啟動空氣凈化器。并(bing)在你(ni)(ni)(ni)出門(men)時(shi)(shi)(shi),為(wei)你(ni)(ni)(ni)安排好上(shang)班(ban)的行程以及(ji)交通(tong)方式(shi)。而(er)這只在不(bu)遠的未來。
隨著(zhu)人(ren)工智(zhi)(zhi)能(neng)(neng)的發展(zhan),智(zhi)(zhi)能(neng)(neng)語音助手(shou)將(jiang)(jiang)會更加(jia)智(zhi)(zhi)能(neng)(neng),融入我們(men)的家庭和(he)我們(men)的生活。盡管(guan)也(ye)會面臨種(zhong)種(zhong)隱私(si)、數據泄露(lu)和(he)營銷行為,但它們(men)將(jiang)(jiang)便(bian)捷和(he)高效化(hua)我們(men)的生活。我們(men)將(jiang)(jiang)獲得更多(duo)控制(zhi),解放雙手(shou),從而將(jiang)(jiang)時間精力用到更有(you)(you)意義、更有(you)(you)價值(zhi)的事情(qing)上(shang)。