【AI人(ren)工智能(neng)】什么是AI人(ren)工智能(neng) 關(guan)于人(ren)工智能(neng)AI的七大誤(wu)解(jie)
如果你是(shi)(shi)一(yi)名企(qi)業主管(而不是(shi)(shi)數據科學家或機器學習(xi)專家),你可(ke)能已經從主流媒體的(de)報道中接(jie)觸過(guo)(guo)人(ren)(ren)工智能。你可(ke)能在(zai)《經濟學人(ren)(ren)》和《名利場(chang)》讀過(guo)(guo)相(xiang)關文章,或讀過(guo)(guo)有關Tesla自動(dong)駕駛的(de)故事(shi),或史蒂芬(fen)·霍金寫AI對人(ren)(ren)類的(de)威脅的(de)文章,甚至(zhi)還(huan)看過(guo)(guo)有關人(ren)(ren)工智能和人(ren)(ren)類智能的(de)諷刺漫畫。
所以(yi),如果你(ni)是關心你(ni)的企業發展的高管,這些有關AI的媒(mei)體報道可能會引出兩(liang)個(ge)惱人的問題:
第(di)一,AI的商業(ye)潛力是真是假?
第二,AI如何(he)應用于我(wo)的產(chan)品?
第(di)一個問題的(de)答案是肯定的(de),AI具有商業潛力。今(jin)天,企(qi)(qi)業已經能應(ying)用(yong)AI改變需要人(ren)類(lei)智能的(de)自動作(zuo)業流程。AI能讓人(ren)力密集型企(qi)(qi)業處理的(de)工作(zuo)量增加100倍,同時(shi)把單位(wei)經濟效益降低(di)90%。
回(hui)答第二個問題需要多一(yi)點時間。首先(xian),我們必(bi)須消除(chu)(chu)主流媒體宣傳的AI神話(hua)。只(zhi)有(you)消除(chu)(chu)這些誤解,你才能對怎(zen)樣應用AI到你的業務中有(you)一(yi)個框架。
神話1:AI是魔術
許多主流媒體把AI的(de)(de)描述得(de)想魔(mo)術(shu)一(yi)般神奇(qi),好像我們(men)只(zhi)需要(yao)對谷歌、Facebook、蘋果(guo)、亞馬(ma)遜和微軟(ruan)這些大公司的(de)(de)高級魔(mo)術(shu)師(shi)使勁鼓掌(zhang)。這種描述是(shi)幫倒忙(mang)。如果(guo)我們(men)希望(wang)企業(ye)采用AI,那么(me)我們(men)就需要(yao)讓企業(ye)家們(men)理解AI。AI并不是(shi)魔(mo)術(shu)。AI是(shi)數據、數學、模型以及(ji)迭代。要(yao)想讓AI為企業(ye)接(jie)受(shou),我們(men)需要(yao)更加透(tou)明,以下是(shi)3個有(you)關AI的(de)(de)關鍵概(gai)念的(de)(de)解釋:
訓練數據(TD):訓練數據是(shi)機(ji)器學(xue)(xue)習的初(chu)始數據集。訓練數據包括輸(shu)入和預(yu)回答(da)輸(shu)出(chu),所(suo)以(yi)機(ji)器學(xue)(xue)習模型能夠為任何(he)給定(ding)(ding)輸(shu)出(chu)尋(xun)找(zhao)模式。例如,輸(shu)入可以(yi)是(shi)帶(dai)有客(ke)戶和企業(ye)支(zhi)持(chi)代表(CSR)間的電子(zi)郵件線(xian)程的客(ke)戶支(zhi)持(chi)ticket,輸(shu)出(chu)可以(yi)是(shi)基于企業(ye)特定(ding)(ding)分類(lei)定(ding)(ding)義的從(cong)1到5的分類(lei)標簽。
機(ji)器學(xue)(xue)(xue)習(xi)(xi)(xi)(ML):機(ji)器學(xue)(xue)(xue)習(xi)(xi)(xi)是能從訓練數據(ju)(ju)中(zhong)學(xue)(xue)(xue)習(xi)(xi)(xi)模式,并讓這(zhe)些模式應(ying)用(yong)于新(xin)(xin)的(de)輸入數據(ju)(ju)的(de)軟件。例如(ru),接收到(dao)帶有(you)客戶和CSR間的(de)電子郵件線程的(de)一個新(xin)(xin)的(de)客戶支持ticket時(shi),機(ji)器學(xue)(xue)(xue)習(xi)(xi)(xi)模型能預測(ce)它(ta)的(de)分類,并告(gao)訴你它(ta)對這(zhe)個預測(ce)的(de)置信度。機(ji)器學(xue)(xue)(xue)習(xi)(xi)(xi)的(de)主要特點(dian)是它(ta)學(xue)(xue)(xue)習(xi)(xi)(xi)新(xin)(xin)的(de)、而非(fei)適用(yong)固(gu)有(you)的(de)規則(ze)(ze)。因此,它(ta)能通(tong)過消(xiao)化新(xin)(xin)的(de)數據(ju)(ju)調(diao)整自己的(de)規則(ze)(ze)。
Human-in-the-Loop(HITL):Human-in-the-Loop是(shi)AI的(de)(de)第三個核心要素(su)。我們不能(neng)指望機器學習(xi)模(mo)型絕對可靠。一個好的(de)(de)機器學習(xi)模(mo)型可能(neng)只有70%的(de)(de)準確率。因此,當模(mo)型的(de)(de)置信度較低時,就需要人(ren)使(shi)用Human-in-the-Loop作業流程。
所(suo)以,不要被AI是魔術的(de)(de)神(shen)話所(suo)迷惑。理解(jie)AI的(de)(de)基礎公式是:AI=TD+ML+HITL。
神話2:AI只為技術精英專屬
媒體(ti)報道很容易讓人產生(sheng)一種錯(cuo)覺,就是AI只屬于技術精(jing)英——大(da)公司例(li)如(ru)Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有它們能夠組建大(da)型機器學習專家團隊,并獲得億美(mei)元級的(de)(de)投資(zi)。這種觀念是錯(cuo)的(de)(de)。
今(jin)天,不用(yong)10萬美元就能(neng)著手應用(yong)AI到你(ni)(ni)的業務中。所以,如果你(ni)(ni)是美國收益大于5000萬美元的26000家企業之一(yi),你(ni)(ni)就可(ke)以把收益的0.2%投資于AI應用(yong)了。
所以,AI不是技術精(jing)英專(zhuan)屬。它屬于每個企業(ye)。
神話3:AI只為解決十億美元級別的問題
主(zhu)流媒體的(de)(de)傾向(xiang)于(yu)報道未(wei)來主(zhu)義的(de)(de)事物,例如自動駕駛汽(qi)車(che)或(huo)用(yong)于(yu)運送快遞(di)的(de)(de)無人(ren)飛機(ji)。像Google,Tesla,Uber這些(xie)公(gong)司由于(yu)“贏者通吃”的(de)(de)心(xin)態,為(wei)了搶占未(wei)來無人(ren)車(che)市場的(de)(de)龍頭老(lao)大地位,已(yi)經投資進(jin)去數百億(yi)美(mei)元。這些(xie)給人(ren)的(de)(de)印象是(shi)AI只用(yong)于(yu)解決(jue)十億(yi)美(mei)元級別的(de)(de)新問題(ti)。但這又是(shi)一個錯誤。
AI也(ye)應(ying)用于(yu)解(jie)決現存的(de)(de)(de)較小的(de)(de)(de)問題(ti),例如(ru)百萬美元級別的(de)(de)(de)問題(ti)。讓我解(jie)釋一下:任何一個企業的(de)(de)(de)核心需(xu)求都(dou)是理解(jie)客(ke)戶(hu)。從古(gu)希臘的(de)(de)(de)agora市(shi)集和古(gu)羅馬的(de)(de)(de)個人買(mai)(mai)賣廣(guang)場就是如(ru)此。今天也(ye)是如(ru)此,哪怕生(sheng)意買(mai)(mai)賣爆(bao)發(fa)性地轉移(yi)到了互聯網上。許多企業坐擁來(lai)(lai)自客(ke)戶(hu)的(de)(de)(de)非結構化數據(ju)寶藏,這(zhe)(zhe)些數據(ju)來(lai)(lai)自電(dian)子郵(you)件線程或Twitter評(ping)論。AI能應(ying)用于(yu)這(zhe)(zhe)些分類支持(chi)ticket的(de)(de)(de)挑戰,或用于(yu)理解(jie)推文情(qing)緒。
所以,AI不僅能應(ying)用(yong)(yong)于(yu)十(shi)億美元級別的(de)令人興奮的(de)新問題(ti),例(li)如自(zi)動駕駛汽車。AI也用(yong)(yong)于(yu)現存的(de)“無趣”的(de)小問題(ti),例(li)如通過支持ticket分類或社交(jiao)媒體情緒分析更好地理解客(ke)戶。
神話4:算法比數據更重要
主流(liu)媒(mei)體中有(you)關AI的(de)報(bao)道傾向于(yu)認為機(ji)器(qi)學(xue)習算(suan)法(fa)是(shi)(shi)最重要的(de)要素。它們似乎把算(suan)法(fa)等同于(yu)人(ren)類大(da)腦。它們暗示(shi)正(zheng)是(shi)(shi)算(suan)法(fa)讓魔術(shu)發(fa)生作(zuo)用,更精細復雜(za)的(de)算(suan)法(fa)能超越人(ren)類大(da)腦。有(you)關機(ji)器(qi)在(zai)國際(ji)圍棋和象(xiang)棋中戰(zhan)勝人(ren)類的(de)報(bao)道就是(shi)(shi)例子。媒(mei)體關注(zhu)的(de)是(shi)(shi)“深(shen)度神經(jing)網(wang)絡”、“深(shen)度學(xue)習”以及機(ji)器(qi)如何做(zuo)決定(ding)。
這(zhe)樣(yang)的(de)(de)(de)報道可能(neng)帶(dai)給(gei)企業(ye)這(zhe)樣(yang)的(de)(de)(de)印象:想要應用AI,他們(men)得(de)(de)先(xian)聘請(qing)到(dao)機(ji)(ji)器學習(xi)專家(jia)來(lai)建一(yi)個完(wan)美的(de)(de)(de)算(suan)法(fa)。但(dan)假如企業(ye)不考慮怎樣(yang)獲得(de)(de)更高(gao)質量(liang)、更大量(liang)的(de)(de)(de)定制(zhi)訓練數據以讓機(ji)(ji)器學習(xi)模型學習(xi),就算(suan)有了完(wan)美的(de)(de)(de)算(suan)法(fa)也可能(neng)得(de)(de)不到(dao)理(li)想的(de)(de)(de)效果(guo)(“我們(men)有超(chao)棒的(de)(de)(de)算(suan)法(fa)”和“我們(men)的(de)(de)(de)模型只有60%的(de)(de)(de)準確率”間的(de)(de)(de)落(luo)差(cha))。
從(cong)Microsoft,Amazon和(he)Google這(zhe)些公司購買商用機器(qi)學習服務,卻(que)沒(mei)有一(yi)個(ge)訓(xun)練(lian)數據(ju)規劃或(huo)預算,就好比(bi)買了一(yi)輛汽車(che),卻(que)沒(mei)法到達加油站。你(ni)(ni)只是買了一(yi)大(da)塊很貴(gui)的(de)金屬而(er)已。汽車(che)和(he)汽油的(de)類比(bi)雖(sui)然不夠恰當,因(yin)為如果你(ni)(ni)給(gei)機器(qi)學習模(mo)型(xing)補給(gei)越(yue)多的(de)訓(xun)練(lian)數據(ju),模(mo)型(xing)就能(neng)變得越(yue)好。這(zhe)就像汽車(che)每用完一(yi)箱汽油,積累的(de)里程數越(yue)大(da)。所以訓(xun)練(lian)數據(ju)甚至比(bi)汽油更重要。了解更多可以閱讀我(wo)們此前(qian)的(de)文章:More data beats better algorithms(//www.crowdflower.com/more-data-beats-better-algorithms/)
所以,訓練數(shu)據(ju)的質量和數(shu)量至少是與(yu)算法同等重要的。
神話5:機器>人
過去(qu)30年來,媒體一(yi)直喜(xi)歡把AI描述為(wei)比人(ren)類強大的(de)(de)(de)機(ji)器,例如《終結(jie)者》的(de)(de)(de)施瓦辛格(ge)和(he)《Ex Machina》的(de)(de)(de)Alicia Vikander。媒體這樣做也(ye)可以理解,因(yin)為(wei)媒體想建(jian)立起機(ji)器和(he)人(ren)類之間(jian)誰(shui)會(hui)贏的(de)(de)(de)簡單敘(xu)述結(jie)構。但(dan)是,這和(he)實際情況不(bu)符。
例如,最近Google的(de)DeepMind/AlphaGo戰勝李(li)世石的(de)新(xin)聞被媒體簡(jian)單(dan)描述(shu)成機器戰勝了人類。這是(shi)不(bu)準(zhun)確的(de),真實情況不(bu)是(shi)這樣(yang)簡(jian)單(dan)。更準(zhun)確的(de)描述(shu)應該(gai)是(shi)“機器聯合許多人戰勝了一個人”。
消除這種誤解的(de)核心理由是(shi)機器和人(ren)類具有互(hu)補(bu)的(de)能力。請看上圖。機器的(de)特(te)(te)(te)長是(shi)處理結構(gou)化(hua)計算,他(ta)們(men)會在“找(zhao)出特(te)(te)(te)征矢量”任(ren)務上表現良(liang)好。而人(ren)類的(de)特(te)(te)(te)長是(shi)理解意義和上下文,他(ta)們(men)在“找(zhao)出豹紋連衣裙”任(ren)務上表現良(liang)好,讓人(ren)類做“找(zhao)出特(te)(te)(te)征矢量”的(de)任(ren)務就不那(nei)么容(rong)易了(le)。
因此,對企(qi)業來說正確(que)的框架是實現機器和(he)(he)人的互補,AI是機器和(he)(he)人的共同工作。
神話6:AI就是機器取代人類
主(zhu)流媒(mei)體喜歡描繪(hui)反烏托邦的未來(lai),因為它(ta)們認為這能吸引眼球。這樣(yang)或許確實能吸引讀者眼球,但(dan)是,它(ta)對真(zhen)正(zheng)理解機(ji)器和人類如何共同工(gong)作(zuo)沒有一點幫助(zhu)。
例如(ru),讓我們再回到(dao)企業(ye)分(fen)類支持(chi)ticket的(de)(de)業(ye)務上來(lai)。在現今的(de)(de)大(da)(da)多(duo)數(shu)(shu)企業(ye),這(zhe)還(huan)是100%人工(gong)(gong)(gong)的(de)(de)過(guo)程。所以,這(zhe)個(ge)過(guo)程又(you)慢(man)成(cheng)本又(you)高(gao),能(neng)做(zuo)的(de)(de)數(shu)(shu)量受(shou)到(dao)限制。假設(she)你在分(fen)類了10000個(ge)支持(chi)ticket之(zhi)后得(de)到(dao)了一個(ge)準確率為(wei)70%的(de)(de)模型。30%的(de)(de)時候結果(guo)錯誤,但(dan)這(zhe)時Human-in-the-loop就(jiu)可以介入了。你可以把可接(jie)受(shou)置信(xin)度設(she)置為(wei)95%,只(zhi)接(jie)受(shou)置信(xin)度是95%或高(gao)于95%的(de)(de)輸出(chu)結果(guo)。那么機(ji)器學習模型最初(chu)就(jiu)只(zhi)能(neng)做(zuo)一小(xiao)部(bu)分(fen)工(gong)(gong)(gong)作(zuo),比(bi)如(ru)說(shuo)5%-10%。但(dan)是當模型得(de)到(dao)新(xin)的(de)(de)人工(gong)(gong)(gong)標記數(shu)(shu)據時,它(ta)就(jiu)能(neng)學習、進步。因(yin)此,隨著時間的(de)(de)推移,模型能(neng)處理更(geng)多(duo)的(de)(de)客戶支持(chi)ticket分(fen)類工(gong)(gong)(gong)作(zuo),企業(ye)也能(neng)大(da)(da)大(da)(da)增加(jia)分(fen)類的(de)(de)ticket量。
所以,機(ji)器和(he)人(ren)聯(lian)合可以增加工作量,同時(shi)保持(chi)質(zhi)量,降低重要(yao)業務(wu)的單位經濟效(xiao)益。這就(jiu)消滅了機(ji)器取代(dai)人(ren)類的AI神話。真相是(shi),AI是(shi)機(ji)器強(qiang)化人(ren)類。
神話7:AI=ML
主流媒體有關AI的最后一個(ge)神話是把人工智能和機(ji)器學習當(dang)做一回事了(le)。這(zhe)可能讓(rang)企(qi)業(ye)管(guan)理層以為只(zhi)要買下Microsoft,Amazon或Google的某(mou)個(ge)商用(yong)機(ji)器學習服(fu)務就能把AI轉(zhuan)變為產品(pin)。
實(shi)現(xian)一個AI解決方(fang)案(an),除(chu)了(le)機器(qi)(qi)學(xue)習(xi),你還需(xu)要訓練數據,需(xu)要human-in-the-loop。缺了(le)訓練數據的(de)(de)機器(qi)(qi)學(xue)習(xi)就像沒汽(qi)油的(de)(de)汽(qi)車,雖(sui)然很貴,但去不到任何地(di)方(fang)。缺了(le)human-in-the-loop的(de)(de)機器(qi)(qi)學(xue)習(xi)也會導致(zhi)不良(liang)后果(guo)。你需(xu)要人去推翻(fan)機器(qi)(qi)學(xue)習(xi)模型低置信度的(de)(de)預測(ce)。
所以(yi),如果(guo)你(ni)是想把AI應用于你(ni)的業(ye)務的企業(ye)高(gao)管,那么你(ni)想在應該有一個框架了(le)。你(ni)可以(yi)用AI的7個真相代替AI的7個神話(hua):
真相1:AI=TD+ML+HITL
真(zhen)相2:AI適用所有企(qi)業。
真相(xiang)3:AI適用(yong)現存的小問(wen)題。
真相(xiang)4:算法(fa)并不(bu)比訓練數(shu)(shu)據的質量和數(shu)(shu)量更重要。
真相5:機器和人類互補
真相6:AI是(shi)機器強化人類(lei)
真相7:AI=TD+ML+HITL