【AI人(ren)工智(zhi)能】什么(me)是AI人(ren)工智(zhi)能 關于人(ren)工智(zhi)能AI的七(qi)大誤(wu)解
如果你是(shi)(shi)一(yi)名企業主管(而不是(shi)(shi)數據科學家(jia)或機器學習專家(jia)),你可能(neng)已經(jing)從(cong)主流媒體(ti)的報(bao)道(dao)中接觸過人工(gong)智能(neng)。你可能(neng)在《經(jing)濟學人》和(he)《名利(li)場》讀(du)過相關文章,或讀(du)過有(you)關Tesla自動駕駛的故(gu)事,或史(shi)蒂(di)芬·霍金寫AI對人類的威脅的文章,甚(shen)至還看過有(you)關人工(gong)智能(neng)和(he)人類智能(neng)的諷刺漫(man)畫。
所以,如(ru)果你是關(guan)心你的企業(ye)發展(zhan)的高(gao)管,這些有(you)關(guan)AI的媒體(ti)報(bao)道可能會引出兩個惱人的問題(ti):
第一,AI的(de)商業潛力是(shi)真是(shi)假?
第二,AI如(ru)何應用于我(wo)的產品?
第一個(ge)問題的(de)(de)答案是肯定的(de)(de),AI具有商(shang)業(ye)潛(qian)力(li)。今天,企業(ye)已經(jing)能(neng)應用(yong)AI改變需要(yao)人類智能(neng)的(de)(de)自動作業(ye)流程。AI能(neng)讓人力(li)密集型企業(ye)處理的(de)(de)工作量增加100倍,同時把單位(wei)經(jing)濟效益降低(di)90%。
回答第二個問題需要多一(yi)點時間。首先(xian),我們必須(xu)消除主流媒體宣(xuan)傳的(de)AI神(shen)話。只有消除這些誤解,你(ni)才能(neng)對怎樣應用AI到你(ni)的(de)業務(wu)中有一(yi)個框架(jia)。
神話1:AI是魔術
許多主流媒(mei)體把AI的(de)(de)描述得想魔術(shu)(shu)一般神奇,好(hao)像我(wo)們(men)只需要對谷歌、Facebook、蘋果、亞馬遜和(he)微軟這些大(da)公司的(de)(de)高級魔術(shu)(shu)師(shi)使(shi)勁(jing)鼓掌。這種描述是幫倒忙。如果我(wo)們(men)希望企(qi)業(ye)(ye)采用AI,那么我(wo)們(men)就需要讓企(qi)業(ye)(ye)家們(men)理解AI。AI并不是魔術(shu)(shu)。AI是數據、數學(xue)、模(mo)型以(yi)及迭代。要想讓AI為企(qi)業(ye)(ye)接受,我(wo)們(men)需要更(geng)加透(tou)明,以(yi)下是3個(ge)有關AI的(de)(de)關鍵概念的(de)(de)解釋:
訓(xun)練數(shu)據(ju)(TD):訓(xun)練數(shu)據(ju)是機器學習的(de)初始數(shu)據(ju)集。訓(xun)練數(shu)據(ju)包括輸(shu)入和預回答輸(shu)出,所以機器學習模(mo)型(xing)能夠(gou)為任何給定輸(shu)出尋找模(mo)式。例(li)如,輸(shu)入可(ke)以是帶有客(ke)戶(hu)和企業(ye)支(zhi)持代表(CSR)間的(de)電(dian)子郵件線程的(de)客(ke)戶(hu)支(zhi)持ticket,輸(shu)出可(ke)以是基于企業(ye)特定分類定義的(de)從1到5的(de)分類標簽(qian)。
機(ji)器學習(xi)(xi)(ML):機(ji)器學習(xi)(xi)是(shi)能(neng)從訓(xun)練數(shu)據中學習(xi)(xi)模(mo)式(shi),并(bing)讓這些(xie)模(mo)式(shi)應用于(yu)新(xin)的(de)(de)(de)輸入數(shu)據的(de)(de)(de)軟(ruan)件。例(li)如,接收到帶(dai)有(you)客戶(hu)(hu)和CSR間(jian)的(de)(de)(de)電(dian)子(zi)郵件線(xian)程(cheng)的(de)(de)(de)一個新(xin)的(de)(de)(de)客戶(hu)(hu)支持ticket時,機(ji)器學習(xi)(xi)模(mo)型(xing)能(neng)預(yu)測(ce)它(ta)的(de)(de)(de)分類(lei),并(bing)告訴你它(ta)對這個預(yu)測(ce)的(de)(de)(de)置(zhi)信度。機(ji)器學習(xi)(xi)的(de)(de)(de)主要特點是(shi)它(ta)學習(xi)(xi)新(xin)的(de)(de)(de)、而非適用固(gu)有(you)的(de)(de)(de)規則。因(yin)此,它(ta)能(neng)通(tong)過消化(hua)新(xin)的(de)(de)(de)數(shu)據調整自己的(de)(de)(de)規則。
Human-in-the-Loop(HITL):Human-in-the-Loop是(shi)AI的第(di)三個(ge)核(he)心(xin)要素。我們不能(neng)指望機(ji)器學習模(mo)型(xing)絕(jue)對可(ke)靠。一個(ge)好的機(ji)器學習模(mo)型(xing)可(ke)能(neng)只(zhi)有(you)70%的準確率。因此,當(dang)模(mo)型(xing)的置信度(du)較低時,就需(xu)要人使用Human-in-the-Loop作業流程(cheng)。
所以,不要(yao)被AI是(shi)魔(mo)術的神話(hua)所迷(mi)惑。理解AI的基礎公式是(shi):AI=TD+ML+HITL。
神話2:AI只為技術精英專屬
媒體(ti)報道(dao)很容易讓人(ren)產生一種(zhong)錯覺,就是AI只屬于技(ji)術(shu)精英(ying)——大公(gong)司例如(ru)Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有(you)它(ta)們能夠(gou)組建大型機器學習專家團隊(dui),并(bing)獲得億(yi)美(mei)元級的(de)投資。這種(zhong)觀念是錯的(de)。
今天,不用10萬美元(yuan)就能著手(shou)應用AI到你的業(ye)務中。所以,如果你是美國收益大于(yu)5000萬美元(yuan)的26000家企業(ye)之一,你就可以把收益的0.2%投資(zi)于(yu)AI應用了。
所以,AI不(bu)是技術精英專(zhuan)屬。它(ta)屬于(yu)每(mei)個(ge)企業。
神話3:AI只為解決十億美元級別的問題
主(zhu)流媒體(ti)的(de)傾(qing)向于(yu)(yu)報道未(wei)來主(zhu)義的(de)事物(wu),例如自動駕駛汽車或用于(yu)(yu)運送快遞(di)的(de)無人飛(fei)機。像Google,Tesla,Uber這(zhe)(zhe)些公司由于(yu)(yu)“贏者(zhe)通吃”的(de)心態,為(wei)了搶占未(wei)來無人車市場的(de)龍頭老大地位,已經投資進去數(shu)百(bai)億(yi)美元(yuan)。這(zhe)(zhe)些給人的(de)印象是AI只用于(yu)(yu)解決十億(yi)美元(yuan)級(ji)別的(de)新問(wen)題。但(dan)這(zhe)(zhe)又是一個(ge)錯(cuo)誤(wu)。
AI也應(ying)用于解(jie)決現存的(de)較小的(de)問(wen)題,例如(ru)百萬美(mei)元(yuan)級別的(de)問(wen)題。讓我解(jie)釋一(yi)下(xia):任何一(yi)個企業(ye)的(de)核(he)心需求都(dou)是理解(jie)客戶。從古希臘的(de)agora市(shi)集(ji)和古羅馬的(de)個人買賣廣場(chang)就(jiu)是如(ru)此(ci)(ci)。今天也是如(ru)此(ci)(ci),哪怕生意買賣爆發性(xing)地轉移到了互聯網上。許(xu)多企業(ye)坐擁來(lai)自客戶的(de)非結構化數據寶藏,這些(xie)數據來(lai)自電子郵件線(xian)程或(huo)(huo)Twitter評論。AI能(neng)應(ying)用于這些(xie)分類支(zhi)持ticket的(de)挑(tiao)戰,或(huo)(huo)用于理解(jie)推文情(qing)緒。
所(suo)以,AI不(bu)僅能應用于十億美元級別的(de)令人興奮的(de)新問題(ti),例如自動駕駛汽車(che)。AI也用于現存(cun)的(de)“無趣”的(de)小問題(ti),例如通(tong)過支(zhi)持ticket分類或(huo)社交媒體(ti)情緒分析(xi)更好地理(li)解客戶。
神話4:算法比數據更重要
主流媒(mei)體中有(you)關AI的(de)(de)報(bao)道(dao)傾向于認為機(ji)器學習(xi)(xi)算(suan)法是(shi)最重要的(de)(de)要素。它們(men)似乎把算(suan)法等同于人(ren)類大腦。它們(men)暗示正是(shi)算(suan)法讓魔術發生作用,更精細復(fu)雜(za)的(de)(de)算(suan)法能超越(yue)人(ren)類大腦。有(you)關機(ji)器在國際圍棋(qi)(qi)和象棋(qi)(qi)中戰勝人(ren)類的(de)(de)報(bao)道(dao)就(jiu)是(shi)例子(zi)。媒(mei)體關注的(de)(de)是(shi)“深度神經(jing)網絡(luo)”、“深度學習(xi)(xi)”以及機(ji)器如何做決定(ding)。
這樣的(de)(de)(de)報道可能帶給(gei)企業這樣的(de)(de)(de)印象:想要應(ying)用AI,他(ta)們得(de)先聘請(qing)到(dao)機(ji)器學習專家(jia)來建一個完美的(de)(de)(de)算(suan)法。但假如企業不(bu)(bu)考慮怎樣獲得(de)更(geng)高質量(liang)、更(geng)大量(liang)的(de)(de)(de)定制訓練數據以讓機(ji)器學習模(mo)型(xing)學習,就(jiu)算(suan)有了完美的(de)(de)(de)算(suan)法也可能得(de)不(bu)(bu)到(dao)理(li)想的(de)(de)(de)效果(“我們有超棒(bang)的(de)(de)(de)算(suan)法”和“我們的(de)(de)(de)模(mo)型(xing)只(zhi)有60%的(de)(de)(de)準確率(lv)”間的(de)(de)(de)落差)。
從Microsoft,Amazon和(he)Google這些(xie)公司購買(mai)商用(yong)機器(qi)學(xue)習服務,卻(que)(que)沒有一個訓(xun)(xun)練(lian)數(shu)據規劃(hua)或預算,就(jiu)好比(bi)買(mai)了(le)一輛汽(qi)(qi)(qi)車,卻(que)(que)沒法到達加油(you)站。你(ni)只(zhi)是買(mai)了(le)一大(da)塊(kuai)很貴的金(jin)屬而已。汽(qi)(qi)(qi)車和(he)汽(qi)(qi)(qi)油(you)的類比(bi)雖(sui)然不(bu)夠恰當,因(yin)為如果你(ni)給機器(qi)學(xue)習模型補給越多的訓(xun)(xun)練(lian)數(shu)據,模型就(jiu)能變(bian)得越好。這就(jiu)像(xiang)汽(qi)(qi)(qi)車每用(yong)完一箱(xiang)汽(qi)(qi)(qi)油(you),積累的里程(cheng)數(shu)越大(da)。所以訓(xun)(xun)練(lian)數(shu)據甚至比(bi)汽(qi)(qi)(qi)油(you)更重要。了(le)解更多可以閱讀我們此前的文章:More data beats better algorithms(//www.crowdflower.com/more-data-beats-better-algorithms/)
所(suo)以,訓練數據的質(zhi)量(liang)和(he)數量(liang)至少(shao)是與算(suan)法同等重要的。
神話5:機器>人
過去30年來(lai),媒體(ti)一直喜(xi)歡把AI描(miao)述為(wei)比人類強(qiang)大的(de)機器,例(li)如《終結者(zhe)》的(de)施(shi)瓦辛格(ge)和(he)《Ex Machina》的(de)Alicia Vikander。媒體(ti)這樣做也可以理(li)解,因為(wei)媒體(ti)想(xiang)建立起機器和(he)人類之間誰(shui)會贏的(de)簡單敘(xu)述結構。但是(shi),這和(he)實際情況(kuang)不(bu)符。
例如,最近Google的DeepMind/AlphaGo戰勝(sheng)李世石(shi)的新聞被媒體簡單描述成機器戰勝(sheng)了人類。這是(shi)不準確的,真實情(qing)況不是(shi)這樣簡單。更準確的描述應(ying)該是(shi)“機器聯合許多(duo)人戰勝(sheng)了一個人”。
消除這種誤(wu)解的(de)(de)核心理(li)由是(shi)機(ji)器和人類(lei)具有互補的(de)(de)能力。請看上(shang)圖。機(ji)器的(de)(de)特長是(shi)處理(li)結構化計算,他(ta)們會在“找(zhao)出(chu)特征矢量”任務(wu)(wu)上(shang)表現良好(hao)(hao)。而(er)人類(lei)的(de)(de)特長是(shi)理(li)解意(yi)義和上(shang)下(xia)文(wen),他(ta)們在“找(zhao)出(chu)豹紋連衣(yi)裙”任務(wu)(wu)上(shang)表現良好(hao)(hao),讓人類(lei)做“找(zhao)出(chu)特征矢量”的(de)(de)任務(wu)(wu)就不那么容易了。
因此,對企業來(lai)說正確的(de)(de)框架是實(shi)現(xian)機(ji)器和人(ren)的(de)(de)互補,AI是機(ji)器和人(ren)的(de)(de)共(gong)同工作。
神話6:AI就是機器取代人類
主流媒體喜歡描繪反(fan)烏托邦的未來(lai),因為它(ta)們認為這能(neng)吸引(yin)(yin)眼球(qiu)。這樣或許確實能(neng)吸引(yin)(yin)讀者眼球(qiu),但(dan)是,它(ta)對真正理解機器和人(ren)類(lei)如何共同工(gong)作沒有一點幫助。
例如,讓我(wo)們再回(hui)到企(qi)業(ye)分(fen)類(lei)支持ticket的(de)業(ye)務上來。在(zai)現今的(de)大(da)多(duo)數(shu)企(qi)業(ye),這(zhe)還是(shi)(shi)100%人(ren)工(gong)的(de)過(guo)程。所以(yi),這(zhe)個(ge)過(guo)程又(you)慢成本又(you)高,能(neng)做的(de)數(shu)量(liang)(liang)受到限制(zhi)。假(jia)設你在(zai)分(fen)類(lei)了10000個(ge)支持ticket之后得到了一個(ge)準確率(lv)為70%的(de)模型(xing)。30%的(de)時候結果(guo)錯誤,但這(zhe)時Human-in-the-loop就可以(yi)介入了。你可以(yi)把可接受置(zhi)信度設置(zhi)為95%,只(zhi)接受置(zhi)信度是(shi)(shi)95%或高于95%的(de)輸(shu)出(chu)結果(guo)。那么機(ji)器學習(xi)模型(xing)最初就只(zhi)能(neng)做一小部(bu)分(fen)工(gong)作,比如說5%-10%。但是(shi)(shi)當模型(xing)得到新(xin)的(de)人(ren)工(gong)標記數(shu)據時,它就能(neng)學習(xi)、進(jin)步。因此(ci),隨(sui)著(zhu)時間的(de)推移,模型(xing)能(neng)處理更多(duo)的(de)客(ke)戶支持ticket分(fen)類(lei)工(gong)作,企(qi)業(ye)也(ye)能(neng)大(da)大(da)增加分(fen)類(lei)的(de)ticket量(liang)(liang)。
所以,機(ji)器(qi)和人聯合可(ke)以增(zeng)加工作量(liang),同時(shi)保持質(zhi)量(liang),降低(di)重要業務的(de)單位經(jing)濟效益。這(zhe)就消(xiao)滅了(le)機(ji)器(qi)取代人類的(de)AI神話。真相是(shi),AI是(shi)機(ji)器(qi)強(qiang)化人類。
神話7:AI=ML
主流媒體有關AI的最后(hou)一個神(shen)話是把(ba)人工智能和機器學(xue)(xue)習當做一回事了(le)。這可能讓企業管理層以為只(zhi)要(yao)買下Microsoft,Amazon或Google的某個商用(yong)機器學(xue)(xue)習服務就能把(ba)AI轉變為產品。
實現一(yi)個AI解決(jue)方案(an),除了機(ji)器學(xue)習,你還需(xu)要(yao)(yao)訓練(lian)數(shu)據,需(xu)要(yao)(yao)human-in-the-loop。缺(que)了訓練(lian)數(shu)據的(de)機(ji)器學(xue)習就(jiu)像沒汽(qi)油的(de)汽(qi)車,雖(sui)然很貴,但去不(bu)到(dao)任何(he)地方。缺(que)了human-in-the-loop的(de)機(ji)器學(xue)習也會導(dao)致不(bu)良后(hou)果。你需(xu)要(yao)(yao)人去推翻(fan)機(ji)器學(xue)習模型低置信度(du)的(de)預(yu)測。
所以,如果你是想(xiang)把AI應用于你的業務(wu)的企業高管(guan),那(nei)么(me)你想(xiang)在應該有一個框架了。你可以用AI的7個真相代替AI的7個神(shen)話:
真相1:AI=TD+ML+HITL
真相(xiang)2:AI適用所(suo)有企業。
真相(xiang)3:AI適用現存的小問(wen)題(ti)。
真相4:算法(fa)并不比訓練數據的質量(liang)和數量(liang)更(geng)重要。
真(zhen)相(xiang)5:機(ji)器和人(ren)類(lei)互補
真相6:AI是機器強(qiang)化人類
真相(xiang)7:AI=TD+ML+HITL