賽事背景
圍(wei)棋(qi)人(ren)(ren)機(ji)大戰(zhan),源于2016年1月27日英國《自然(ran)》雜(za)志的一篇(pian)文章(zhang)(zhang)。這篇(pian)文章(zhang)(zhang)稱,谷歌(ge)的人(ren)(ren)工智能(neng)系統阿(a)爾法圍(wei)棋(qi)(AlphaGo)2015年10月份以5比0的戰(zhan)績完勝歐洲(zhou)冠軍(jun)、職業圍(wei)棋(qi)二段樊麾,這是人(ren)(ren)類歷史上,圍(wei)棋(qi)人(ren)(ren)工智能(neng)(AI)第一次在公平比賽中戰(zhan)勝職業圍(wei)棋(qi)手。
棋(qi)(qi)(qi)(qi)類(lei)(lei)(lei)(lei)游戲(xi)一(yi)直被視為頂(ding)(ding)(ding)級人(ren)(ren)類(lei)(lei)(lei)(lei)智(zhi)力(li)(li)的(de)試金石。人(ren)(ren)工智(zhi)能(neng)(neng)與人(ren)(ren)類(lei)(lei)(lei)(lei)棋(qi)(qi)(qi)(qi)手的(de)對抗一(yi)直在(zai)(zai)上(shang)演,此前(qian)在(zai)(zai)三子棋(qi)(qi)(qi)(qi)、跳棋(qi)(qi)(qi)(qi)和國(guo)際象棋(qi)(qi)(qi)(qi)等棋(qi)(qi)(qi)(qi)類(lei)(lei)(lei)(lei)上(shang),計算機程序都曾打(da)(da)(da)敗過(guo)人(ren)(ren)類(lei)(lei)(lei)(lei)。在(zai)(zai)圍棋(qi)(qi)(qi)(qi)人(ren)(ren)機大戰(zhan)(zhan)之前(qian)的(de)歷史上(shang),最著名(ming)的(de)人(ren)(ren)機大戰(zhan)(zhan)要數(shu)國(guo)際象棋(qi)(qi)(qi)(qi)世界冠軍加里·卡斯帕羅夫對國(guo)際象棋(qi)(qi)(qi)(qi)人(ren)(ren)工智(zhi)能(neng)(neng)程序“深藍”的(de)國(guo)際象棋(qi)(qi)(qi)(qi)比賽。1997年(nian),國(guo)際象棋(qi)(qi)(qi)(qi)人(ren)(ren)工智(zhi)能(neng)(neng)第一(yi)次打(da)(da)(da)敗頂(ding)(ding)(ding)尖的(de)人(ren)(ren)類(lei)(lei)(lei)(lei);2006年(nian),人(ren)(ren)類(lei)(lei)(lei)(lei)最后(hou)一(yi)次打(da)(da)(da)敗頂(ding)(ding)(ding)尖的(de)國(guo)際象棋(qi)(qi)(qi)(qi)人(ren)(ren)工智(zhi)能(neng)(neng)。自(zi)那(nei)時起,歐美傳統里的(de)頂(ding)(ding)(ding)級人(ren)(ren)類(lei)(lei)(lei)(lei)智(zhi)力(li)(li)游戲(xi)國(guo)際象棋(qi)(qi)(qi)(qi),已經在(zai)(zai)電腦(nao)面前(qian)一(yi)敗涂地(di)。圍棋(qi)(qi)(qi)(qi)成了(le)人(ren)(ren)類(lei)(lei)(lei)(lei)智(zhi)力(li)(li)游戲(xi)最后(hou)的(de)一(yi)塊高地(di)。
圍棋(qi)(qi)人(ren)工智(zhi)(zhi)能(neng)(neng)長期以(yi)來舉步(bu)維(wei)艱,頂級人(ren)工智(zhi)(zhi)能(neng)(neng)甚(shen)至不能(neng)(neng)打敗(bai)稍強的(de)(de)業余選(xuan)手。這似乎(hu)也合(he)情(qing)合(he)理(li)。因為要(yao)是人(ren)工智(zhi)(zhi)能(neng)(neng)用暴力(li)列舉所(suo)有情(qing)況的(de)(de)方(fang)式,圍棋(qi)(qi)需要(yao)計算(suan)的(de)(de)變化數量遠(yuan)遠(yuan)超過已經觀(guan)測(ce)到(dao)的(de)(de)宇宙中原子的(de)(de)數量。這一巨大(da)的(de)(de)數目,足以(yi)令任(ren)何蠻(man)力(li)窮舉者望而卻步(bu)。而人(ren)類(lei),可以(yi)憑借某(mou)種難以(yi)復制的(de)(de)算(suan)法跳過蠻(man)力(li),一眼看(kan)到(dao)棋(qi)(qi)盤的(de)(de)本質。
后來,人工(gong)智能研究者們(men)祭出了終極殺(sha)器——“深度學習(xi)(xi)”。深度學習(xi)(xi)是(shi)人工(gong)智能領域中的(de)熱(re)門科目,它能完成(cheng)筆跡識別(bie)、面部識別(bie)、駕駛自(zi)動汽(qi)車、自(zi)然語(yu)言處理(li)、識別(bie)聲音、分(fen)析(xi)生物信息數據等非(fei)常復雜(za)的(de)任務。谷(gu)歌(ge)人工(gong)智能程序阿(a)爾法圍(wei)棋(qi)(AlphaGo)就是(shi)基于(yu)深度學習(xi)(xi)技術研究開(kai)發(fa)的(de)。為了測試阿(a)爾法圍(wei)棋(qi)的(de)水平,谷(gu)歌(ge)于(yu)2016年3月份(fen)向(xiang)圍(wei)棋(qi)世(shi)界冠(guan)軍、韓國頂尖棋(qi)手李世(shi)石發(fa)起挑(tiao)戰(zhan)。李世(shi)石接受挑(tiao)戰(zhan)。
比賽規程
李世石(shi)與阿爾法圍(wei)(wei)棋(qi)的(de)圍(wei)(wei)棋(qi)人(ren)機(ji)(ji)大戰為五(wu)番棋(qi)挑(tiao)戰,但無論比分如何將下滿五(wu)局(ju)(ju),比賽(sai)采用中國圍(wei)(wei)棋(qi)規則,執黑一方(fang)貼(tie)3又3/4子(即7.5目(mu)),各方(fang)用時為2小(xiao)時,3次60秒的(de)讀秒機(ji)(ji)會。五(wu)局(ju)(ju)比賽(sai)分別(bie)于2016年3月(yue)9日(ri)、3月(yue)10日(ri)、3月(yue)12日(ri)、3月(yue)13日(ri)和3月(yue)15日(ri)在(zai)韓(han)國首(shou)爾鐘(zhong)路區四季酒(jiu)店進行,獲(huo)得三勝(sheng)者獲(huo)得100萬(wan)美(mei)(mei)(mei)元(yuan)獎(jiang)金(jin)(jin)(約(yue)11億韓(han)元(yuan))。若阿爾法圍(wei)(wei)棋(qi)獲(huo)勝(sheng),獎(jiang)金(jin)(jin)將捐贈給聯合國兒童基金(jin)(jin)會、STEM教育以及(ji)圍(wei)(wei)棋(qi)慈(ci)善機(ji)(ji)構。除(chu)了(le)100萬(wan)美(mei)(mei)(mei)元(yuan)基礎獎(jiang)金(jin)(jin)外,李世石(shi)還(huan)可獲(huo)得15萬(wan)美(mei)(mei)(mei)元(yuan)出場費。此外每勝(sheng)一局(ju)(ju)還(huan)有2萬(wan)美(mei)(mei)(mei)元(yuan)勝(sheng)局(ju)(ju)獎(jiang)金(jin)(jin),如果五(wu)盤(pan)全勝(sheng),勝(sheng)局(ju)(ju)獎(jiang)金(jin)(jin)為10萬(wan)美(mei)(mei)(mei)元(yuan)。
賽程賽果
第一局
第一局:阿爾法圍棋執白(bai)中盤勝李世石(shi)
2016年3月9日,圍棋(qi)(qi)人機(ji)大戰(zhan)首(shou)局(ju)在韓國首(shou)爾(er)四季酒(jiu)店打(da)響。賽前猜先(xian)阿(a)爾(er)法(fa)(fa)圍棋(qi)(qi)猜錯(cuo),李世(shi)石(shi)(shi)選(xuan)擇黑棋(qi)(qi),率(lv)先(xian)展(zhan)(zhan)開布(bu)局(ju)。黑棋(qi)(qi)布(bu)局(ju)走(zou)出新型,阿(a)爾(er)法(fa)(fa)應對不(bu)佳(jia),出現失誤。李世(shi)石(shi)(shi)抓住(zhu)電腦布(bu)局(ju)不(bu)擅長應對新型的(de)(de)(de)弱點獲得(de)不(bu)錯(cuo)的(de)(de)(de)局(ju)面(mian)。但圍棋(qi)(qi)的(de)(de)(de)勝(sheng)負關鍵往(wang)往(wang)是(shi)中盤(pan)階(jie)段。阿(a)爾(er)法(fa)(fa)圍棋(qi)(qi)之后(hou)的(de)(de)(de)下(xia)法(fa)(fa)變得(de)強硬,雙(shuang)方展(zhan)(zhan)開接(jie)觸戰(zhan)。李世(shi)石(shi)(shi)抓住(zhu)機(ji)會,圍住(zhu)一(yi)塊大空,在大局(ju)上(shang)搶得(de)先(xian)機(ji)。就在觀戰(zhan)棋(qi)(qi)手都認為(wei)李世(shi)石(shi)(shi)占(zhan)優的(de)(de)(de)情況下(xia),他卻放(fang)出了非(fei)常業余(yu)的(de)(de)(de)手法(fa)(fa),瞬間使微弱的(de)(de)(de)優勢化為(wei)烏有,還變成了劣勢。進(jin)入官(guan)子,阿(a)爾(er)法(fa)(fa)圍棋(qi)(qi)根本不(bu)犯一(yi)點錯(cuo)誤,著(zhu)著(zhu)精準。等阿(a)爾(er)法(fa)(fa)圍棋(qi)(qi)下(xia)了186手,李世(shi)石(shi)(shi)算(suan)清后(hou)投子認輸。
第二局
第二局:阿爾法圍棋執黑中盤勝李世(shi)石
2016年3月10日,圍(wei)棋(qi)(qi)(qi)(qi)人機(ji)大戰(zhan)展(zhan)開第二局較(jiao)量。阿爾(er)(er)(er)法(fa)圍(wei)棋(qi)(qi)(qi)(qi)執(zhi)黑(hei)先(xian)行(xing),李世石(shi)(shi)轉(zhuan)變了行(xing)棋(qi)(qi)(qi)(qi)的(de)(de)(de)風格(ge),開局下(xia)得(de)非常(chang)穩健。阿爾(er)(er)(er)法(fa)圍(wei)棋(qi)(qi)(qi)(qi)也(ye)下(xia)出了不(bu)少(shao)新手(shou),這讓李世石(shi)(shi)應對得(de)非常(chang)謹慎(shen),不(bu)時陷(xian)(xian)入長考,這讓他在(zai)時間上一(yi)直落后(hou)。你來我往(wang)中,黑(hei)37和(he)41兩步(bu)尖沖令(ling)人匪(fei)夷所思,尤(you)其是(shi)第41手(shou),致(zhi)目數(shu)大虧。中盤(pan)階段,本來形(xing)勢(shi)(shi)占優(you)(you)的(de)(de)(de)李世石(shi)(shi)行(xing)棋(qi)(qi)(qi)(qi)過緩,右上角的(de)(de)(de)一(yi)步(bu)二路打拔(ba)被視(shi)作敗手(shou),阿爾(er)(er)(er)法(fa)圍(wei)棋(qi)(qi)(qi)(qi)的(de)(de)(de)優(you)(you)勢(shi)(shi)逐漸(jian)清晰起來。在(zai)形(xing)勢(shi)(shi)陷(xian)(xian)入被動的(de)(de)(de)情況(kuang)下(xia),李世石(shi)(shi)下(xia)出一(yi)手(shou)扳(ban)的(de)(de)(de)好棋(qi)(qi)(qi)(qi),但(dan)幾次轉(zhuan)換(huan)后(hou),黑(hei)棋(qi)(qi)(qi)(qi)還是(shi)牢牢守住了領(ling)先(xian)的(de)(de)(de)局面,而且棋(qi)(qi)(qi)(qi)形(xing)很(hen)厚。李世石(shi)(shi)雖然脫了幾手(shou),但(dan)并無實質性改變,最終阿爾(er)(er)(er)法(fa)圍(wei)棋(qi)(qi)(qi)(qi)執(zhi)黑(hei)于(yu)211手(shou)獲勝且優(you)(you)勢(shi)(shi)明顯,總(zong)比(bi)分2比(bi)0領(ling)先(xian)。
第三局
第三局:阿爾(er)法圍棋(qi)執(zhi)白中(zhong)盤勝李世石
2016年3月12日,圍(wei)(wei)棋(qi)人機(ji)大(da)戰(zhan)展開(kai)第三局(ju)較量。李(li)(li)世石執(zhi)黑(hei)先(xian)行(xing),該局(ju)開(kai)始前(qian)(qian),還(huan)有棋(qi)迷希望李(li)(li)世石能夠實(shi)現逆轉,但(dan)阿(a)爾(er)法(fa)圍(wei)(wei)棋(qi)徹底摧毀了這種可能。布局(ju)階段,李(li)(li)世石左(zuo)下(xia)(xia)掛(gua)角后走高中國流。行(xing)不(bu)到二十手,李(li)(li)世石局(ju)面就(jiu)落入下(xia)(xia)風。隨后,雙方(fang)在左(zuo)上角展開(kai)戰(zhan)斗,阿(a)爾(er)法(fa)圍(wei)(wei)棋(qi)對全局(ju)的(de)(de)把握(wo)一如既往地強(qiang)大(da)。李(li)(li)世石不(bu)但(dan)自己的(de)(de)模(mo)樣被對手輕松打(da)入,阿(a)爾(er)法(fa)圍(wei)(wei)棋(qi)還(huan)借助戰(zhan)斗在下(xia)(xia)邊圍(wei)(wei)起一大(da)塊空,局(ju)面看上去還(huan)不(bu)如前(qian)(qian)兩盤好看。隨后的(de)(de)比賽(sai),雖然李(li)(li)世石仍然極力抵抗,并且祭(ji)出劫爭的(de)(de)手段,但(dan)是電腦精確應對,讓他(ta)無功而返。到阿(a)爾(er)法(fa)圍(wei)(wei)棋(qi)下(xia)(xia)了176手后,李(li)(li)世石只有投子(zi)認(ren)負。圍(wei)(wei)棋(qi)人機(ji)大(da)戰(zhan)前(qian)(qian)三盤人類三連敗。
第四局
第四局:李世石執白(bai)中盤(pan)勝阿爾法圍棋
2016年3月(yue)13日,圍(wei)(wei)(wei)(wei)棋(qi)人機(ji)大(da)戰(zhan)展開第四局(ju)較量。在(zai)(zai)接(jie)連三局(ju)負(fu)于“阿(a)爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)”后(hou),脫去勝(sheng)負(fu)包袱的(de)李(li)世(shi)石為榮譽而戰(zhan),終(zhong)于迎來了(le)“圍(wei)(wei)(wei)(wei)棋(qi)人機(ji)大(da)戰(zhan)”的(de)首(shou)次(ci)(ci)勝(sheng)利。與(yu)前幾局(ju)比賽相比,李(li)世(shi)石此局(ju)更多次(ci)(ci)陷(xian)入(ru)(ru)了(le)長時(shi)間(jian)思考(kao),導(dao)致耗時(shi)過多。在(zai)(zai)比賽進(jin)行到兩個半(ban)小(xiao)時(shi)后(hou),李(li)世(shi)石僅剩下17分鐘,比“阿(a)爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)”剩余時(shi)間(jian)足足少1個小(xiao)時(shi)。但隨后(hou)李(li)世(shi)石祭出(chu)白(bai)78“挖”的(de)妙手,一(yi)場“逆襲(xi)”之戰(zhan)也由此開始。阿(a)爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)被李(li)世(shi)石的(de)“神之一(yi)手”下得陷(xian)入(ru)(ru)混(hun)亂,走出(chu)了(le)黑(hei)93一(yi)步常理(li)上的(de)廢棋(qi),導(dao)致棋(qi)盤(pan)右(you)側一(yi)大(da)片黑(hei)子“全死”。此后(hou),“阿(a)爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)”判斷局(ju)面對自己不(bu)利,每步耗時(shi)明顯增長,更首(shou)次(ci)(ci)被李(li)世(shi)石拖(tuo)入(ru)(ru)讀秒。最終(zhong),李(li)世(shi)石冷靜收官鎖定勝(sheng)局(ju)。到180手,阿(a)爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)中(zhong)盤(pan)認(ren)輸(shu)。
第五局
第五局(ju):阿爾法圍棋執白(bai)中盤勝李世(shi)石
2016年3月15日,圍(wei)(wei)(wei)棋人機大戰(zhan)(zhan)展開第五(wu)局對決。在上局比(bi)(bi)賽扳回(hui)一城(cheng)后,李(li)世石向阿(a)(a)爾(er)法(fa)圍(wei)(wei)(wei)棋團隊提出(chu)要在末戰(zhan)(zhan)中(zhong)(zhong)執黑(hei),因為(wei)他覺得(de)阿(a)(a)爾(er)法(fa)圍(wei)(wei)(wei)棋執黑(hei)時發揮并(bing)不完美,戰(zhan)(zhan)勝執白的阿(a)(a)爾(er)法(fa)圍(wei)(wei)(wei)棋才(cai)更有(you)意義。執黑(hei)的李(li)世石選擇了(le)穩(wen)健的錯小目、無憂角開局,阿(a)(a)爾(er)法(fa)圍(wei)(wei)(wei)棋則以二(er)連星應(ying)對。進入中(zhong)(zhong)盤,李(li)世石意圖(tu)非常明顯,以撈實地為(wei)主。但李(li)世石在79和(he)81手(shou)(shou)連出(chu)緩手(shou)(shou),被視(shi)為(wei)敗招。阿(a)(a)爾(er)法(fa)圍(wei)(wei)(wei)棋82靠(kao)也(ye)并(bing)非好的應(ying)手(shou)(shou)。一波錯進錯出(chu)后,黑(hei)棋在87和(he)89手(shou)(shou)再出(chu)緩手(shou)(shou),致使白棋左上角的圍(wei)(wei)(wei)剿更加有(you)力(li),黑(hei)棋形勢瞬間坍(tan)塌。此后,占據(ju)優(you)勢的阿(a)(a)爾(er)法(fa)圍(wei)(wei)(wei)棋展現了(le)它強大的中(zhong)(zhong)后盤計(ji)算能力(li),鮮有(you)失誤,落(luo)子效(xiao)率(lv)極(ji)高。不過李(li)世石也(ye)并(bing)未放棄,連續走出(chu)強硬應(ying)手(shou)(shou),可惜棋盤下得(de)越來(lai)越小,難再覓逆轉(zhuan)機會。第280手(shou)(shou),李(li)世石投子認負。這次圍(wei)(wei)(wei)棋人機大戰(zhan)(zhan)的最終比(bi)(bi)分定格為(wei)1比(bi)(bi)4。
賽事影響
對圍棋項目
圍(wei)(wei)棋(qi)(qi)人(ren)(ren)機(ji)(ji)大(da)戰(zhan)前(qian),不(bu)少(shao)人(ren)(ren)擔心圍(wei)(wei)棋(qi)(qi)這塊陣地一旦失守,將對整(zheng)個項目(mu)產(chan)生(sheng)滅頂(ding)之災,因為(wei)不(bu)少(shao)人(ren)(ren)或(huo)許會產(chan)生(sheng)這樣的(de)(de)(de)想(xiang)法(fa):號稱棋(qi)(qi)類智力最頂(ding)尖的(de)(de)(de)圍(wei)(wei)棋(qi)(qi)也(ye)不(bu)過爾(er)爾(er),從而魅力大(da)減。可實際的(de)(de)(de)情況卻(que)是(shi)恰恰相(xiang)反,很多平時不(bu)關心圍(wei)(wei)棋(qi)(qi)或(huo)者說根本連(lian)圍(wei)(wei)棋(qi)(qi)規則都不(bu)了解的(de)(de)(de)人(ren)(ren),也(ye)因為(wei)人(ren)(ren)機(ji)(ji)大(da)戰(zhan)開始了解和關心這項運(yun)動。
圍棋人機大戰(zhan)期間,關(guan)于人機大戰(zhan)的(de)(de)報道充斥于國(guo)(guo)內(nei)各種媒體的(de)(de)“頭條”,風(feng)頭完全(quan)蓋過了足球、籃球這(zhe)些(xie)風(feng)靡(mi)世界的(de)(de)運動;就(jiu)連圍棋普及率極低的(de)(de)歐美(mei)國(guo)(guo)家,英國(guo)(guo)廣播公司(BBC)、路透社、美(mei)聯(lian)社這(zhe)些(xie)主(zhu)流媒體也(ye)對比賽進行(xing)了詳細報道,這(zhe)在以往幾乎是不可(ke)能的(de)(de)。
對人工智能
“人工(gong)(gong)智能”這個概念是人機大戰(zhan)(zhan)最終極的(de)受益者。圍(wei)棋人機大戰(zhan)(zhan)前,人工(gong)(gong)智能對于普通人而言(yan)還是那么“云山霧(wu)罩(zhao)”;圍(wei)棋人機大戰(zhan)(zhan)后,人們(men)通過各種報(bao)道(dao)已(yi)經了(le)解(jie)到(dao),人工(gong)(gong)智能已(yi)經滲透(tou)到(dao)每個人的(de)工(gong)(gong)作(zuo)和生活中。智能化服務將(jiang)會快速地接(jie)入(ru)餐飲、出(chu)行、旅游、電影、教育、醫療(liao)等生活服務領域,覆蓋用戶吃、住(zhu)、行、玩,人工(gong)(gong)智能在未(wei)來(lai)可能媲美人類的(de)專職秘書。
阿爾法圍棋最大的勝利是(shi)為人(ren)工智(zhi)能(neng)打造了一(yi)場全(quan)球性的科(ke)普(pu),也(ye)代表了高科(ke)技(ji)企業對(dui)人(ren)工智(zhi)能(neng)技(ji)術充滿“野(ye)心”的宣告。過去的人(ren)工智(zhi)能(neng)只是(shi)存在于實驗室的智(zhi)慧探索;而(er)未來的科(ke)學(xue)技(ji)術,人(ren)工智(zhi)能(neng)將是(shi)基礎,是(shi)推動(dong)商業與(yu)社(she)會發(fa)展(zhan)的強大動(dong)力。
李世石簡介
李(li)世(shi)(shi)石是李(li)昌鎬之后,韓國最具代表性的棋(qi)(qi)手,他(ta)在(zai)2003年獲(huo)第16屆富士通(tong)杯冠軍后升為九段棋(qi)(qi)手。自2002年加(jia)冕富士通(tong)杯以(yi)來(lai)(lai),十年時間里他(ta)共獲(huo)18個世(shi)(shi)界冠軍。李(li)世(shi)(shi)石屬于(yu)(yu)典(dian)型的力戰型棋(qi)(qi)風(feng),善于(yu)(yu)敏(min)銳(rui)地抓住(zhu)對手的弱處主動出(chu)擊,以(yi)強(qiang)大(da)的力量擊垮(kua)對手,他(ta)的攻擊可以(yi)用(yong)“穩,準,狠(hen)”來(lai)(lai)形容,經常(chang)能在(zai)劣勢下完成逆轉(zhuan)。
AlphaGo2015年10月擊敗歐洲冠軍
谷歌曾于2014年(nian)以4億歐(ou)元收購人工智能公(gong)司(si)DeepMind。由(you)DeepMind研發的AlphaGo項目已有兩年(nian)歷史,AlphaGo曾在去年(nian)戰(zhan)勝(sheng)了歐(ou)洲圍棋冠軍樊麾(hui)(職業二(er)段)。
去年10月5日(ri)-10月9日(ri),谷(gu)歌AlphaGo在比賽(sai)中以5:0的比分完勝了歐洲冠軍。除(chu)了戰勝人類(lei)外,AlphaGo還與其他的圍棋程序對(dui)戰,獲得(de)了500場勝利。
AlphaGo原理簡介
傳(chuan)統(tong)的(de)人工智(zhi)能方法是(shi)將所有(you)可能的(de)走法構建成(cheng)一(yi)棵搜索樹 ,但這種方法對圍棋并不適用。此次谷歌推出的(de)AlphaGo,將高級搜索樹與(yu)深度神(shen)經網絡(luo)結合在一(yi)起。這些神(shen)經網絡(luo)通(tong)過12個(ge)處(chu)理(li)層傳(chuan)遞對棋盤的(de)描述,處(chu)理(li)層則包(bao)含數百(bai)萬(wan)個(ge)類似(si)于神(shen)經的(de)連接點(dian)。
其中一(yi)個神(shen)經(jing)(jing)網絡(luo)“決策網絡(luo)”(policy network)負(fu)責選(xuan)擇下一(yi)步走(zou)(zou)法(fa),另一(yi)個神(shen)經(jing)(jing)網絡(luo)“值(zhi)網絡(luo)”(“value network)則預測比(bi)賽勝利(li)方。谷歌(ge)方面用人類圍棋高手(shou)的三千(qian)(qian)萬步圍棋走(zou)(zou)法(fa)訓練(lian)神(shen)經(jing)(jing)網絡(luo),與此同時,AlphaGo也自行研究新戰(zhan)略,在(zai)它(ta)的神(shen)經(jing)(jing)網絡(luo) 之間運行了數(shu)千(qian)(qian)局圍棋,利(li)用反復試(shi)驗調整(zheng)連接點,這個流(liu)程也稱為鞏(gong)固(gu)學習(xi)(reinforcement learning)。通過廣泛使用Google云平臺,完成了大量研究工(gong)作。
AlphaGo在與人的對弈中用了“兩個大腦”來解(jie)決(jue)問題:“決(jue)策網絡”和“值網絡”。通俗來說(shuo)就是,一個大腦用來決(jue)策當(dang)前應(ying)該(gai)如何落(luo)子,另一個大腦來預測比賽最終的勝利方。
值得一提的是(shi)(shi),李世(shi)(shi)石也(ye)是(shi)(shi)第一次(ci)與機器對(dui)戰(zhan),所以他無(wu)法像和人(ren)類對(dui)戰(zhan)那(nei)樣,先(xian)研(yan)究對(dui)方的棋譜和下棋風格。李世(shi)(shi)石所能做的就是(shi)(shi)和自(zi)己(ji)對(dui)弈。谷歌AlphaGo也(ye)是(shi)(shi)通(tong)過這種方式鍛煉自(zi)己(ji),真正做到了“人(ren)工智能”。
李世石之后 谷歌AlphaGo還會挑戰誰?
谷歌(ge)旗下(xia)DeepMind創始人哈薩比(bi)斯曾表示(shi),還有很(hen)多實力很(hen)強的選手,所以這次比(bi)賽之后,也(ye)(ye)許(xu)也(ye)(ye)會去中國、日(ri)本,與當地(di)高手切磋棋藝。
中國圍棋圍棋九段柯潔也對此表示了(le)興趣,昨天AlphaGo戰(zhan)勝李(li)(li)世石后(hou),他發微博稱,“就算阿法(fa)狗戰(zhan)勝了(le)李(li)(li)世石,但它贏不了(le)我(wo)”,并且還(huan)置頂了(le)該微博。
并且他來(lai)頭(tou)也不小(xiao),柯潔自述,“現在(zai)暫時是(shi)世(shi)界圍棋第一人(特地用(yong)了(le)暫時,謙虛(xu)是(shi)美(mei)德(de))正(zheng)式(shi)比賽我(wo)是(shi)單(dan)盤8:2碾壓李世(shi)石(他贏得這兩盤沒有(you)任何作用(yong))世(shi)界冠軍(jun)獲得過三次(此年(nian)齡如此成(cheng)績前(qian)無古(gu)人)”。