【AI人工(gong)智(zhi)(zhi)能(neng)】什(shen)么是AI人工(gong)智(zhi)(zhi)能(neng) 關于(yu)人工(gong)智(zhi)(zhi)能(neng)AI的(de)七大誤解
如果你是一名企業主管(而(er)不是數據科學家或機器(qi)學習(xi)專家),你可(ke)能(neng)(neng)(neng)已經(jing)從主流(liu)媒體的(de)報(bao)道中(zhong)接觸(chu)過人(ren)工(gong)智能(neng)(neng)(neng)。你可(ke)能(neng)(neng)(neng)在《經(jing)濟學人(ren)》和《名利場》讀過相關文(wen)章,或讀過有(you)(you)關Tesla自動駕駛(shi)的(de)故事(shi),或史蒂芬·霍金(jin)寫AI對人(ren)類(lei)的(de)威(wei)脅的(de)文(wen)章,甚至還(huan)看過有(you)(you)關人(ren)工(gong)智能(neng)(neng)(neng)和人(ren)類(lei)智能(neng)(neng)(neng)的(de)諷刺(ci)漫畫。
所以,如果你是(shi)關心(xin)你的企業(ye)發展的高管,這些有關AI的媒(mei)體報道(dao)可能會(hui)引出(chu)兩個惱人(ren)的問題(ti):
第一,AI的商業潛力是真是假?
第二,AI如何應(ying)用于(yu)我的產(chan)品?
第一個(ge)問題(ti)的(de)(de)答案是肯(ken)定的(de)(de),AI具(ju)有商(shang)業(ye)(ye)潛力。今天(tian),企業(ye)(ye)已經能應用AI改變需要人(ren)類(lei)智(zhi)能的(de)(de)自動(dong)作業(ye)(ye)流程。AI能讓人(ren)力密(mi)集(ji)型(xing)企業(ye)(ye)處理的(de)(de)工作量增(zeng)加100倍(bei),同時把(ba)單位經濟(ji)效(xiao)益降(jiang)低90%。
回(hui)答第二個問(wen)題需要(yao)多一(yi)點時間。首先,我(wo)們必須消(xiao)除主流(liu)媒體宣傳的(de)AI神話。只有(you)消(xiao)除這些(xie)誤解,你才(cai)能對怎(zen)樣應用(yong)AI到你的(de)業(ye)務中有(you)一(yi)個框架。
神話1:AI是魔術
許多主流媒體把AI的(de)描(miao)述(shu)得(de)想魔術(shu)(shu)一般神(shen)奇(qi),好像我們只需(xu)(xu)要(yao)對谷歌、Facebook、蘋(pin)果、亞(ya)馬遜和微軟這(zhe)些大公(gong)司的(de)高級魔術(shu)(shu)師(shi)使勁鼓掌。這(zhe)種(zhong)描(miao)述(shu)是(shi)幫倒(dao)忙。如(ru)果我們希望企業(ye)采(cai)用AI,那么(me)我們就需(xu)(xu)要(yao)讓企業(ye)家們理解(jie)AI。AI并不是(shi)魔術(shu)(shu)。AI是(shi)數據(ju)、數學(xue)、模型以及迭代。要(yao)想讓AI為企業(ye)接受,我們需(xu)(xu)要(yao)更加(jia)透明,以下是(shi)3個有關AI的(de)關鍵概念的(de)解(jie)釋:
訓(xun)練數據(ju)(ju)(TD):訓(xun)練數據(ju)(ju)是機器學習的(de)(de)(de)(de)初(chu)始數據(ju)(ju)集。訓(xun)練數據(ju)(ju)包括輸(shu)入(ru)和(he)預回(hui)答(da)輸(shu)出,所以(yi)機器學習模型能夠為任何給(gei)定輸(shu)出尋(xun)找模式。例如,輸(shu)入(ru)可(ke)以(yi)是帶有客戶和(he)企(qi)業(ye)支(zhi)持代表(CSR)間的(de)(de)(de)(de)電子郵件線程(cheng)的(de)(de)(de)(de)客戶支(zhi)持ticket,輸(shu)出可(ke)以(yi)是基于(yu)企(qi)業(ye)特定分(fen)類(lei)定義(yi)的(de)(de)(de)(de)從(cong)1到5的(de)(de)(de)(de)分(fen)類(lei)標簽。
機(ji)器(qi)(qi)學(xue)習(ML):機(ji)器(qi)(qi)學(xue)習是能從訓練數據中學(xue)習模式,并讓這(zhe)些(xie)模式應(ying)用于新的輸入(ru)數據的軟件。例如(ru),接(jie)收到帶有(you)客(ke)戶和CSR間的電子郵件線(xian)程的一個新的客(ke)戶支持ticket時,機(ji)器(qi)(qi)學(xue)習模型能預測(ce)它的分類(lei),并告訴你它對這(zhe)個預測(ce)的置信度。機(ji)器(qi)(qi)學(xue)習的主要特點是它學(xue)習新的、而非適用固有(you)的規則(ze)。因此,它能通過消(xiao)化(hua)新的數據調整自己(ji)的規則(ze)。
Human-in-the-Loop(HITL):Human-in-the-Loop是AI的第三個核(he)心要素。我們不能(neng)指望機(ji)器(qi)學(xue)習(xi)模型(xing)絕對可靠。一個好的機(ji)器(qi)學(xue)習(xi)模型(xing)可能(neng)只有70%的準確(que)率。因此,當模型(xing)的置信度較低時,就需(xu)要人使用Human-in-the-Loop作業流程。
所(suo)以,不要被AI是(shi)魔(mo)術的神話所(suo)迷惑。理解AI的基礎公式是(shi):AI=TD+ML+HITL。
神話2:AI只為技術精英專屬
媒(mei)體報道(dao)很(hen)容易讓人產生(sheng)一種(zhong)錯覺,就是AI只屬(shu)于技(ji)術精英(ying)——大公司例如Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有它們能夠(gou)組(zu)建大型(xing)機器學習專(zhuan)家(jia)團(tuan)隊,并獲得億美元(yuan)級的投(tou)資(zi)。這(zhe)種(zhong)觀念是錯的。
今天(tian),不用(yong)(yong)10萬美元就能著手應用(yong)(yong)AI到你(ni)的業(ye)務(wu)中。所(suo)以(yi),如(ru)果你(ni)是美國收益(yi)大于(yu)5000萬美元的26000家(jia)企業(ye)之一(yi),你(ni)就可以(yi)把收益(yi)的0.2%投(tou)資于(yu)AI應用(yong)(yong)了(le)。
所以,AI不(bu)是技術精英專屬。它屬于每個企業。
神話3:AI只為解決十億美元級別的問題
主(zhu)流媒體的傾向(xiang)于報道未來主(zhu)義的事物,例(li)如自(zi)動(dong)駕駛汽車(che)或用于運送快遞的無(wu)人(ren)(ren)飛(fei)機。像Google,Tesla,Uber這些(xie)公司(si)由于“贏者(zhe)通吃”的心態,為了搶占未來無(wu)人(ren)(ren)車(che)市(shi)場的龍頭老大地位(wei),已經投資進去(qu)數(shu)百(bai)億(yi)美元(yuan)。這些(xie)給人(ren)(ren)的印象是AI只用于解決十億(yi)美元(yuan)級別(bie)的新(xin)問題。但這又是一個錯誤。
AI也應用(yong)于解(jie)(jie)決(jue)現存的(de)(de)較小的(de)(de)問(wen)題,例如百萬(wan)美元級別(bie)的(de)(de)問(wen)題。讓我解(jie)(jie)釋一下:任何一個(ge)企業的(de)(de)核心(xin)需求都是(shi)理解(jie)(jie)客(ke)戶(hu)。從古希臘的(de)(de)agora市集(ji)和古羅馬的(de)(de)個(ge)人買賣(mai)廣場就是(shi)如此(ci)。今(jin)天也是(shi)如此(ci),哪(na)怕生意買賣(mai)爆(bao)發性地轉移到了互(hu)聯(lian)網上(shang)。許(xu)多企業坐擁來自客(ke)戶(hu)的(de)(de)非結構(gou)化數據寶(bao)藏,這(zhe)些(xie)數據來自電子郵件線程或Twitter評論。AI能應用(yong)于這(zhe)些(xie)分類支持ticket的(de)(de)挑戰(zhan),或用(yong)于理解(jie)(jie)推(tui)文情緒(xu)。
所以,AI不僅能應(ying)用于十億美元級別的(de)令人興奮的(de)新問題,例如自動駕駛汽車。AI也用于現(xian)存的(de)“無趣”的(de)小問題,例如通過(guo)支(zhi)持ticket分類或社交(jiao)媒體(ti)情緒分析更好(hao)地理(li)解客戶。
神話4:算法比數據更重要
主流媒(mei)體(ti)中有(you)關AI的(de)報道傾向于(yu)認為機器(qi)(qi)學習(xi)算法(fa)是最(zui)重要(yao)的(de)要(yao)素。它們似乎把算法(fa)等同(tong)于(yu)人類大腦(nao)(nao)。它們暗示正(zheng)是算法(fa)讓魔術發(fa)生作用,更精(jing)細復雜的(de)算法(fa)能超(chao)越人類大腦(nao)(nao)。有(you)關機器(qi)(qi)在國際圍棋和象(xiang)棋中戰勝人類的(de)報道就是例子。媒(mei)體(ti)關注的(de)是“深度(du)神經網絡”、“深度(du)學習(xi)”以及機器(qi)(qi)如何做決定。
這(zhe)樣(yang)的(de)(de)(de)(de)報道可(ke)能帶給企(qi)業這(zhe)樣(yang)的(de)(de)(de)(de)印(yin)象:想要(yao)應用AI,他們得(de)先聘請到機器學(xue)習專家(jia)來建一個完美的(de)(de)(de)(de)算法(fa)。但假如企(qi)業不考慮怎樣(yang)獲(huo)得(de)更高(gao)質(zhi)量、更大量的(de)(de)(de)(de)定制訓練(lian)數據以讓(rang)機器學(xue)習模型(xing)學(xue)習,就算有(you)(you)了完美的(de)(de)(de)(de)算法(fa)也可(ke)能得(de)不到理想的(de)(de)(de)(de)效(xiao)果(“我們有(you)(you)超棒的(de)(de)(de)(de)算法(fa)”和(he)“我們的(de)(de)(de)(de)模型(xing)只有(you)(you)60%的(de)(de)(de)(de)準(zhun)確(que)率”間(jian)的(de)(de)(de)(de)落差)。
從(cong)Microsoft,Amazon和Google這(zhe)些公司購買(mai)(mai)商用(yong)機器學(xue)習(xi)服務(wu),卻沒有(you)一個訓練(lian)數(shu)據(ju)規(gui)劃或預算,就好(hao)(hao)比(bi)買(mai)(mai)了一輛汽(qi)車(che),卻沒法到達加油站。你只是(shi)買(mai)(mai)了一大(da)塊很貴(gui)的(de)金屬而已。汽(qi)車(che)和汽(qi)油的(de)類比(bi)雖然不夠恰當,因為如(ru)果(guo)你給機器學(xue)習(xi)模(mo)型(xing)補給越(yue)多(duo)(duo)的(de)訓練(lian)數(shu)據(ju),模(mo)型(xing)就能變(bian)得越(yue)好(hao)(hao)。這(zhe)就像汽(qi)車(che)每(mei)用(yong)完(wan)一箱汽(qi)油,積累的(de)里程數(shu)越(yue)大(da)。所以訓練(lian)數(shu)據(ju)甚至比(bi)汽(qi)油更(geng)重要。了解更(geng)多(duo)(duo)可以閱讀(du)我(wo)們此前(qian)的(de)文章:More data beats better algorithms(//www.crowdflower.com/more-data-beats-better-algorithms/)
所以,訓(xun)練數(shu)據的(de)質(zhi)量和數(shu)量至少是與(yu)算法(fa)同(tong)等重要(yao)的(de)。
神話5:機器>人
過去30年(nian)來,媒體(ti)一直喜歡(huan)把AI描述為比人類強大的(de)機(ji)器,例(li)如(ru)《終結者》的(de)施(shi)瓦辛(xin)格和(he)(he)《Ex Machina》的(de)Alicia Vikander。媒體(ti)這(zhe)樣做也(ye)可以(yi)理解,因為媒體(ti)想建立起(qi)機(ji)器和(he)(he)人類之間(jian)誰會贏的(de)簡單(dan)敘述結構。但是,這(zhe)和(he)(he)實際情(qing)況不符。
例如(ru),最(zui)近Google的DeepMind/AlphaGo戰勝(sheng)李世石的新聞被媒(mei)體簡單描(miao)(miao)述成(cheng)機(ji)器戰勝(sheng)了(le)人類。這(zhe)是(shi)不(bu)準(zhun)確的,真(zhen)實情況不(bu)是(shi)這(zhe)樣簡單。更準(zhun)確的描(miao)(miao)述應該是(shi)“機(ji)器聯合許多(duo)人戰勝(sheng)了(le)一個(ge)人”。
消(xiao)除這種誤(wu)解(jie)的核(he)心理由是機(ji)器和人(ren)類(lei)(lei)具有互補的能力。請看上圖(tu)。機(ji)器的特(te)(te)長是處理結構(gou)化計算,他們會在“找出(chu)(chu)特(te)(te)征矢量”任(ren)務(wu)上表現良好。而人(ren)類(lei)(lei)的特(te)(te)長是理解(jie)意義和上下文,他們在“找出(chu)(chu)豹紋(wen)連衣(yi)裙”任(ren)務(wu)上表現良好,讓人(ren)類(lei)(lei)做“找出(chu)(chu)特(te)(te)征矢量”的任(ren)務(wu)就不(bu)那么容易了。
因(yin)此,對(dui)企業來(lai)說正確的(de)框(kuang)架是實現機(ji)器和人(ren)的(de)互補,AI是機(ji)器和人(ren)的(de)共(gong)同工(gong)作。
神話6:AI就是機器取代人類
主流媒體喜歡描繪反(fan)烏托邦的未(wei)來,因為它(ta)們(men)認為這(zhe)能吸引(yin)眼(yan)球。這(zhe)樣或許確實能吸引(yin)讀者眼(yan)球,但是,它(ta)對(dui)真正理解(jie)機器和人(ren)類如何共(gong)同(tong)工作沒(mei)有一點幫助。
例如,讓我(wo)們再(zai)回到(dao)(dao)企業(ye)(ye)分(fen)類(lei)支持ticket的(de)(de)(de)業(ye)(ye)務上來。在現今的(de)(de)(de)大多(duo)數(shu)企業(ye)(ye),這(zhe)還是(shi)100%人工的(de)(de)(de)過程(cheng)。所以,這(zhe)個過程(cheng)又慢成本又高,能(neng)做的(de)(de)(de)數(shu)量(liang)受(shou)到(dao)(dao)限(xian)制。假設你在分(fen)類(lei)了10000個支持ticket之(zhi)后得(de)到(dao)(dao)了一(yi)個準確率為(wei)70%的(de)(de)(de)模型。30%的(de)(de)(de)時(shi)(shi)(shi)候(hou)結(jie)果(guo)錯誤,但這(zhe)時(shi)(shi)(shi)Human-in-the-loop就(jiu)(jiu)可以介入了。你可以把可接受(shou)置(zhi)(zhi)(zhi)信(xin)(xin)度(du)設置(zhi)(zhi)(zhi)為(wei)95%,只(zhi)接受(shou)置(zhi)(zhi)(zhi)信(xin)(xin)度(du)是(shi)95%或高于95%的(de)(de)(de)輸出結(jie)果(guo)。那么機器學習(xi)模型最初就(jiu)(jiu)只(zhi)能(neng)做一(yi)小部分(fen)工作(zuo),比(bi)如說5%-10%。但是(shi)當(dang)模型得(de)到(dao)(dao)新的(de)(de)(de)人工標記數(shu)據時(shi)(shi)(shi),它就(jiu)(jiu)能(neng)學習(xi)、進步。因此,隨(sui)著時(shi)(shi)(shi)間的(de)(de)(de)推移,模型能(neng)處理更多(duo)的(de)(de)(de)客戶支持ticket分(fen)類(lei)工作(zuo),企業(ye)(ye)也能(neng)大大增加分(fen)類(lei)的(de)(de)(de)ticket量(liang)。
所以,機器(qi)和人(ren)聯合可以增(zeng)加(jia)工作量,同時保持質量,降低重要業務的(de)單位經濟效(xiao)益(yi)。這就消(xiao)滅了(le)機器(qi)取(qu)代(dai)人(ren)類的(de)AI神話。真相是(shi),AI是(shi)機器(qi)強化人(ren)類。
神話7:AI=ML
主流媒體有關(guan)AI的(de)最后(hou)一個神(shen)話是把人工智能和機器(qi)學習(xi)當做一回事了。這(zhe)可(ke)能讓企業(ye)管理層以為只要(yao)買下Microsoft,Amazon或(huo)Google的(de)某個商用機器(qi)學習(xi)服務(wu)就能把AI轉變為產品。
實現一(yi)個AI解決(jue)方案,除了(le)機(ji)器(qi)學(xue)(xue)習(xi)(xi),你還需(xu)(xu)要訓(xun)練數(shu)據,需(xu)(xu)要human-in-the-loop。缺了(le)訓(xun)練數(shu)據的(de)機(ji)器(qi)學(xue)(xue)習(xi)(xi)就像沒汽(qi)油的(de)汽(qi)車,雖然很貴(gui),但去不到任何地方。缺了(le)human-in-the-loop的(de)機(ji)器(qi)學(xue)(xue)習(xi)(xi)也會(hui)導(dao)致不良后果。你需(xu)(xu)要人去推翻(fan)機(ji)器(qi)學(xue)(xue)習(xi)(xi)模型低(di)置信度的(de)預(yu)測(ce)。
所以(yi),如果你(ni)(ni)是想把AI應(ying)用于你(ni)(ni)的業務的企(qi)業高(gao)管(guan),那么(me)你(ni)(ni)想在(zai)應(ying)該有(you)一個框架了(le)。你(ni)(ni)可以(yi)用AI的7個真相代替AI的7個神話:
真相1:AI=TD+ML+HITL
真相2:AI適用所(suo)有企業。
真相3:AI適用現存(cun)的小問題。
真相(xiang)4:算法并不(bu)比訓(xun)練數據的質量和(he)數量更重要。
真(zhen)相5:機器和人類(lei)互(hu)補
真相(xiang)6:AI是機(ji)器(qi)強化(hua)人類
真相7:AI=TD+ML+HITL