賽事背景
圍(wei)棋(qi)人(ren)(ren)機大戰(zhan)(zhan),源于2016年1月(yue)27日(ri)英國《自然》雜志的一(yi)(yi)篇文章。這篇文章稱(cheng),谷歌的人(ren)(ren)工智能(neng)系統阿(a)爾法圍(wei)棋(qi)(AlphaGo)2015年10月(yue)份以5比(bi)0的戰(zhan)(zhan)績(ji)完勝(sheng)歐(ou)洲冠軍、職(zhi)業圍(wei)棋(qi)二段樊(fan)麾,這是人(ren)(ren)類(lei)歷史上(shang),圍(wei)棋(qi)人(ren)(ren)工智能(neng)(AI)第(di)一(yi)(yi)次在公平比(bi)賽中戰(zhan)(zhan)勝(sheng)職(zhi)業圍(wei)棋(qi)手。
棋(qi)(qi)(qi)(qi)(qi)類游戲(xi)一(yi)(yi)(yi)直(zhi)被(bei)視為(wei)頂級人(ren)類智(zhi)力的(de)(de)(de)試(shi)金石(shi)。人(ren)工(gong)智(zhi)能與(yu)人(ren)類棋(qi)(qi)(qi)(qi)(qi)手的(de)(de)(de)對抗(kang)一(yi)(yi)(yi)直(zhi)在(zai)(zai)上(shang)演,此前在(zai)(zai)三子棋(qi)(qi)(qi)(qi)(qi)、跳棋(qi)(qi)(qi)(qi)(qi)和國(guo)際(ji)(ji)象(xiang)棋(qi)(qi)(qi)(qi)(qi)等棋(qi)(qi)(qi)(qi)(qi)類上(shang),計算機(ji)程序都(dou)曾打敗(bai)過人(ren)類。在(zai)(zai)圍(wei)棋(qi)(qi)(qi)(qi)(qi)人(ren)機(ji)大(da)戰之前的(de)(de)(de)歷史(shi)上(shang),最(zui)(zui)著名的(de)(de)(de)人(ren)機(ji)大(da)戰要數國(guo)際(ji)(ji)象(xiang)棋(qi)(qi)(qi)(qi)(qi)世界冠軍加里·卡斯帕羅夫對國(guo)際(ji)(ji)象(xiang)棋(qi)(qi)(qi)(qi)(qi)人(ren)工(gong)智(zhi)能程序“深藍”的(de)(de)(de)國(guo)際(ji)(ji)象(xiang)棋(qi)(qi)(qi)(qi)(qi)比賽(sai)。1997年,國(guo)際(ji)(ji)象(xiang)棋(qi)(qi)(qi)(qi)(qi)人(ren)工(gong)智(zhi)能第一(yi)(yi)(yi)次(ci)打敗(bai)頂尖的(de)(de)(de)人(ren)類;2006年,人(ren)類最(zui)(zui)后(hou)一(yi)(yi)(yi)次(ci)打敗(bai)頂尖的(de)(de)(de)國(guo)際(ji)(ji)象(xiang)棋(qi)(qi)(qi)(qi)(qi)人(ren)工(gong)智(zhi)能。自那時起(qi),歐美傳統里的(de)(de)(de)頂級人(ren)類智(zhi)力游戲(xi)國(guo)際(ji)(ji)象(xiang)棋(qi)(qi)(qi)(qi)(qi),已經在(zai)(zai)電腦面前一(yi)(yi)(yi)敗(bai)涂地(di)。圍(wei)棋(qi)(qi)(qi)(qi)(qi)成了(le)人(ren)類智(zhi)力游戲(xi)最(zui)(zui)后(hou)的(de)(de)(de)一(yi)(yi)(yi)塊(kuai)高地(di)。
圍棋人(ren)工智能長期(qi)以(yi)(yi)(yi)來舉(ju)步維艱,頂級人(ren)工智能甚至不能打(da)敗(bai)稍強(qiang)的(de)業余選手。這(zhe)(zhe)似(si)乎也(ye)合(he)情合(he)理。因為要是人(ren)工智能用暴力列(lie)舉(ju)所(suo)有情況(kuang)的(de)方式,圍棋需要計算的(de)變(bian)化數量遠(yuan)遠(yuan)超過已經觀測到的(de)宇(yu)宙中原子(zi)的(de)數量。這(zhe)(zhe)一(yi)巨大的(de)數目,足以(yi)(yi)(yi)令任何蠻力窮(qiong)舉(ju)者望而卻步。而人(ren)類,可以(yi)(yi)(yi)憑借(jie)某種難以(yi)(yi)(yi)復制的(de)算法跳過蠻力,一(yi)眼(yan)看到棋盤的(de)本質。
后來,人工智(zhi)能(neng)研(yan)究者(zhe)們祭出(chu)了終極(ji)殺器——“深度(du)(du)學(xue)(xue)(xue)習”。深度(du)(du)學(xue)(xue)(xue)習是人工智(zhi)能(neng)領域(yu)中的(de)熱門(men)科目(mu),它能(neng)完(wan)成筆(bi)跡(ji)識別(bie)、面部識別(bie)、駕駛自(zi)動汽車、自(zi)然語言處理、識別(bie)聲音、分析生(sheng)物(wu)信息數據等(deng)非常復雜的(de)任務。谷(gu)(gu)歌(ge)人工智(zhi)能(neng)程序阿爾法圍棋(AlphaGo)就是基(ji)于(yu)深度(du)(du)學(xue)(xue)(xue)習技術研(yan)究開發的(de)。為了測試阿爾法圍棋的(de)水平,谷(gu)(gu)歌(ge)于(yu)2016年(nian)3月份(fen)向圍棋世界冠軍、韓國頂尖棋手李(li)世石發起挑(tiao)戰。李(li)世石接受挑(tiao)戰。
比賽規程
李世(shi)石(shi)(shi)與(yu)阿爾法圍棋(qi)(qi)的(de)圍棋(qi)(qi)人機大(da)戰為(wei)五(wu)番棋(qi)(qi)挑戰,但無論比(bi)分如(ru)何將下滿五(wu)局,比(bi)賽(sai)采用中(zhong)國(guo)圍棋(qi)(qi)規則(ze),執黑一方貼(tie)3又3/4子(即7.5目),各(ge)方用時為(wei)2小時,3次60秒的(de)讀(du)秒機會(hui)。五(wu)局比(bi)賽(sai)分別于2016年3月(yue)(yue)9日(ri)、3月(yue)(yue)10日(ri)、3月(yue)(yue)12日(ri)、3月(yue)(yue)13日(ri)和3月(yue)(yue)15日(ri)在(zai)韓國(guo)首爾鐘(zhong)路(lu)區四季酒店(dian)進行,獲(huo)得三勝(sheng)者獲(huo)得100萬(wan)美(mei)元獎金(約11億韓元)。若阿爾法圍棋(qi)(qi)獲(huo)勝(sheng),獎金將捐(juan)贈給聯合(he)國(guo)兒童(tong)基(ji)金會(hui)、STEM教育以及圍棋(qi)(qi)慈善機構。除(chu)了100萬(wan)美(mei)元基(ji)礎獎金外,李世(shi)石(shi)(shi)還(huan)可獲(huo)得15萬(wan)美(mei)元出場費。此外每勝(sheng)一局還(huan)有(you)2萬(wan)美(mei)元勝(sheng)局獎金,如(ru)果(guo)五(wu)盤全勝(sheng),勝(sheng)局獎金為(wei)10萬(wan)美(mei)元。
賽程賽果
第一局
第一局(ju):阿爾法圍棋(qi)執(zhi)白中(zhong)盤勝李世石
2016年3月(yue)9日,圍(wei)棋(qi)(qi)(qi)人機大戰(zhan)(zhan)首局(ju)(ju)(ju)在韓國首爾(er)(er)四(si)季酒(jiu)店打響。賽前猜先(xian)阿(a)爾(er)(er)法(fa)(fa)圍(wei)棋(qi)(qi)(qi)猜錯(cuo),李世石(shi)(shi)選擇(ze)黑棋(qi)(qi)(qi),率先(xian)展開布局(ju)(ju)(ju)。黑棋(qi)(qi)(qi)布局(ju)(ju)(ju)走出新型(xing),阿(a)爾(er)(er)法(fa)(fa)應(ying)對(dui)不(bu)佳(jia),出現失誤。李世石(shi)(shi)抓(zhua)住電腦(nao)布局(ju)(ju)(ju)不(bu)擅長應(ying)對(dui)新型(xing)的(de)弱(ruo)點獲(huo)得(de)不(bu)錯(cuo)的(de)局(ju)(ju)(ju)面。但圍(wei)棋(qi)(qi)(qi)的(de)勝負關鍵往往是中盤階段。阿(a)爾(er)(er)法(fa)(fa)圍(wei)棋(qi)(qi)(qi)之后的(de)下法(fa)(fa)變(bian)得(de)強硬,雙方展開接觸戰(zhan)(zhan)。李世石(shi)(shi)抓(zhua)住機會,圍(wei)住一塊大空,在大局(ju)(ju)(ju)上搶得(de)先(xian)機。就在觀戰(zhan)(zhan)棋(qi)(qi)(qi)手都(dou)認為(wei)李世石(shi)(shi)占(zhan)優的(de)情況下,他卻放出了(le)非常業余的(de)手法(fa)(fa),瞬間(jian)使微弱(ruo)的(de)優勢化為(wei)烏有,還變(bian)成了(le)劣勢。進入官子(zi),阿(a)爾(er)(er)法(fa)(fa)圍(wei)棋(qi)(qi)(qi)根本不(bu)犯一點錯(cuo)誤,著著精準。等阿(a)爾(er)(er)法(fa)(fa)圍(wei)棋(qi)(qi)(qi)下了(le)186手,李世石(shi)(shi)算清(qing)后投子(zi)認輸。
第二局
第二(er)局:阿(a)爾(er)法圍棋執黑(hei)中盤勝李世石
2016年3月10日,圍(wei)棋(qi)人(ren)機大(da)戰展(zhan)開(kai)第(di)二(er)局(ju)(ju)較量(liang)。阿(a)(a)爾(er)法圍(wei)棋(qi)執黑(hei)先(xian)行,李(li)世(shi)石(shi)(shi)轉變了行棋(qi)的(de)(de)(de)(de)風格,開(kai)局(ju)(ju)下(xia)(xia)得(de)非常穩健(jian)。阿(a)(a)爾(er)法圍(wei)棋(qi)也下(xia)(xia)出了不少新手,這讓李(li)世(shi)石(shi)(shi)應對得(de)非常謹慎,不時(shi)陷(xian)入(ru)長考,這讓他在時(shi)間上一直落后。你(ni)來我(wo)往(wang)中(zhong),黑(hei)37和(he)41兩(liang)步尖沖令人(ren)匪夷所思,尤其是(shi)第(di)41手,致目數大(da)虧。中(zhong)盤階段,本(ben)來形勢(shi)占(zhan)優(you)(you)(you)的(de)(de)(de)(de)李(li)世(shi)石(shi)(shi)行棋(qi)過緩,右上角的(de)(de)(de)(de)一步二(er)路(lu)打拔被視作敗手,阿(a)(a)爾(er)法圍(wei)棋(qi)的(de)(de)(de)(de)優(you)(you)(you)勢(shi)逐漸清晰起來。在形勢(shi)陷(xian)入(ru)被動的(de)(de)(de)(de)情況下(xia)(xia),李(li)世(shi)石(shi)(shi)下(xia)(xia)出一手扳(ban)的(de)(de)(de)(de)好棋(qi),但(dan)幾次轉換(huan)后,黑(hei)棋(qi)還(huan)是(shi)牢牢守(shou)住了領(ling)先(xian)的(de)(de)(de)(de)局(ju)(ju)面,而且棋(qi)形很厚(hou)。李(li)世(shi)石(shi)(shi)雖然脫了幾手,但(dan)并無(wu)實質性改變,最終阿(a)(a)爾(er)法圍(wei)棋(qi)執黑(hei)于(yu)211手獲勝且優(you)(you)(you)勢(shi)明(ming)顯(xian),總比分2比0領(ling)先(xian)。
第三局
第三(san)局(ju):阿爾法圍(wei)棋執(zhi)白中盤勝李(li)世石
2016年3月12日,圍(wei)棋(qi)人機(ji)(ji)大(da)戰(zhan)展開(kai)第三局(ju)較量。李(li)世(shi)(shi)石(shi)(shi)(shi)執黑先(xian)行(xing),該局(ju)開(kai)始(shi)前,還有棋(qi)迷希望李(li)世(shi)(shi)石(shi)(shi)(shi)能(neng)夠實現逆(ni)轉,但(dan)阿(a)爾(er)法圍(wei)棋(qi)徹底摧毀了這種可能(neng)。布局(ju)階(jie)段,李(li)世(shi)(shi)石(shi)(shi)(shi)左下(xia)掛角后(hou)(hou)走(zou)高中國(guo)流(liu)。行(xing)不到(dao)(dao)二十手,李(li)世(shi)(shi)石(shi)(shi)(shi)局(ju)面就落入下(xia)風。隨后(hou)(hou),雙方(fang)在左上(shang)角展開(kai)戰(zhan)斗,阿(a)爾(er)法圍(wei)棋(qi)對(dui)全局(ju)的(de)把握一如(ru)既往地(di)強大(da)。李(li)世(shi)(shi)石(shi)(shi)(shi)不但(dan)自己的(de)模樣(yang)被對(dui)手輕(qing)松(song)打入,阿(a)爾(er)法圍(wei)棋(qi)還借助戰(zhan)斗在下(xia)邊圍(wei)起一大(da)塊空,局(ju)面看(kan)(kan)上(shang)去還不如(ru)前兩(liang)盤(pan)好看(kan)(kan)。隨后(hou)(hou)的(de)比賽,雖然李(li)世(shi)(shi)石(shi)(shi)(shi)仍(reng)然極(ji)力抵抗,并且祭出劫爭(zheng)的(de)手段,但(dan)是電腦(nao)精(jing)確應(ying)對(dui),讓他無(wu)功而返。到(dao)(dao)阿(a)爾(er)法圍(wei)棋(qi)下(xia)了176手后(hou)(hou),李(li)世(shi)(shi)石(shi)(shi)(shi)只有投子認負。圍(wei)棋(qi)人機(ji)(ji)大(da)戰(zhan)前三盤(pan)人類三連敗。
第四局
第(di)四局:李世石(shi)執白中盤(pan)勝阿爾(er)法(fa)圍棋(qi)
2016年3月(yue)13日,圍(wei)(wei)棋(qi)(qi)(qi)人機大戰(zhan)(zhan)展開(kai)第(di)四局(ju)較量。在接連三局(ju)負于“阿(a)(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)”后(hou),脫去勝(sheng)負包袱的李(li)世(shi)(shi)(shi)石(shi)為榮譽而戰(zhan)(zhan),終(zhong)于迎來了“圍(wei)(wei)棋(qi)(qi)(qi)人機大戰(zhan)(zhan)”的首次(ci)勝(sheng)利(li)。與前幾局(ju)比賽(sai)相(xiang)比,李(li)世(shi)(shi)(shi)石(shi)此局(ju)更(geng)多次(ci)陷入了長(chang)時間(jian)思考,導(dao)致耗(hao)時過多。在比賽(sai)進行到兩個半小(xiao)時后(hou),李(li)世(shi)(shi)(shi)石(shi)僅(jin)剩下17分鐘,比“阿(a)(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)”剩余時間(jian)足足少1個小(xiao)時。但隨(sui)后(hou)李(li)世(shi)(shi)(shi)石(shi)祭出白78“挖”的妙手(shou),一場(chang)“逆襲(xi)”之戰(zhan)(zhan)也由此開(kai)始。阿(a)(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)被(bei)李(li)世(shi)(shi)(shi)石(shi)的“神之一手(shou)”下得(de)陷入混(hun)亂,走出了黑93一步常理上的廢棋(qi)(qi)(qi),導(dao)致棋(qi)(qi)(qi)盤右(you)側一大片(pian)黑子“全死”。此后(hou),“阿(a)(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)”判斷(duan)局(ju)面對自己不利(li),每步耗(hao)時明顯增長(chang),更(geng)首次(ci)被(bei)李(li)世(shi)(shi)(shi)石(shi)拖入讀秒。最終(zhong),李(li)世(shi)(shi)(shi)石(shi)冷靜收(shou)官(guan)鎖定勝(sheng)局(ju)。到180手(shou),阿(a)(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)中(zhong)盤認(ren)輸。
第五局
第(di)五局(ju):阿爾(er)法圍棋執白中(zhong)盤勝李世(shi)石(shi)
2016年3月15日,圍(wei)(wei)棋(qi)(qi)人機大戰(zhan)展開第(di)五局對決(jue)。在(zai)(zai)上局比賽扳回一城(cheng)后(hou),李世(shi)石(shi)向(xiang)阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)團隊提出要在(zai)(zai)末戰(zhan)中執黑(hei),因(yin)為(wei)他覺(jue)得阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)執黑(hei)時發揮并(bing)不完美,戰(zhan)勝執白(bai)的(de)阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)才(cai)更有(you)(you)意義。執黑(hei)的(de)李世(shi)石(shi)選(xuan)擇了(le)穩(wen)健的(de)錯小目、無(wu)憂角(jiao)開局,阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)則以(yi)(yi)二連星應(ying)對。進(jin)入中盤(pan)(pan),李世(shi)石(shi)意圖非常明顯,以(yi)(yi)撈實地為(wei)主。但李世(shi)石(shi)在(zai)(zai)79和81手(shou)(shou)(shou)連出緩手(shou)(shou)(shou),被視為(wei)敗招。阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)82靠也并(bing)非好的(de)應(ying)手(shou)(shou)(shou)。一波錯進(jin)錯出后(hou),黑(hei)棋(qi)(qi)在(zai)(zai)87和89手(shou)(shou)(shou)再(zai)出緩手(shou)(shou)(shou),致使白(bai)棋(qi)(qi)左上角(jiao)的(de)圍(wei)(wei)剿(jiao)更加有(you)(you)力(li),黑(hei)棋(qi)(qi)形勢(shi)瞬間坍塌。此后(hou),占據優勢(shi)的(de)阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)展現(xian)了(le)它強大的(de)中后(hou)盤(pan)(pan)計算能力(li),鮮(xian)有(you)(you)失誤,落子效(xiao)率(lv)極(ji)高(gao)。不過李世(shi)石(shi)也并(bing)未(wei)放棄(qi),連續(xu)走(zou)出強硬(ying)應(ying)手(shou)(shou)(shou),可惜(xi)棋(qi)(qi)盤(pan)(pan)下(xia)得越(yue)來越(yue)小,難再(zai)覓逆轉(zhuan)機會(hui)。第(di)280手(shou)(shou)(shou),李世(shi)石(shi)投子認負。這次圍(wei)(wei)棋(qi)(qi)人機大戰(zhan)的(de)最終比分(fen)定格為(wei)1比4。
賽事影響
對圍棋項目
圍(wei)棋人(ren)(ren)機大(da)戰前,不(bu)少人(ren)(ren)擔心圍(wei)棋這(zhe)塊陣地一(yi)旦失守,將對整個項(xiang)目產生滅(mie)頂之災,因(yin)為不(bu)少人(ren)(ren)或(huo)(huo)許(xu)會產生這(zhe)樣的想(xiang)法:號稱棋類智力最(zui)頂尖的圍(wei)棋也(ye)不(bu)過(guo)爾爾,從而魅力大(da)減(jian)。可實(shi)際的情況卻是(shi)恰恰相(xiang)反(fan),很多平(ping)時不(bu)關心圍(wei)棋或(huo)(huo)者(zhe)說(shuo)根本連圍(wei)棋規則都(dou)不(bu)了解(jie)的人(ren)(ren),也(ye)因(yin)為人(ren)(ren)機大(da)戰開始了解(jie)和關心這(zhe)項(xiang)運動。
圍棋(qi)人(ren)機大(da)戰期(qi)間(jian),關于人(ren)機大(da)戰的報道(dao)充斥于國(guo)內(nei)各種(zhong)媒體的“頭(tou)條(tiao)”,風(feng)頭(tou)完全蓋過(guo)了足球(qiu)、籃球(qiu)這(zhe)些(xie)風(feng)靡世界的運動;就(jiu)連圍棋(qi)普及率極低的歐美(mei)國(guo)家(jia),英國(guo)廣播(bo)公(gong)司(BBC)、路透(tou)社、美(mei)聯社這(zhe)些(xie)主流(liu)媒體也對比賽進行了詳細報道(dao),這(zhe)在以往幾乎是不可能的。
對人工智能
“人(ren)(ren)(ren)工智能(neng)(neng)”這個概念是人(ren)(ren)(ren)機大戰(zhan)最終(zhong)極的(de)受益者。圍(wei)棋人(ren)(ren)(ren)機大戰(zhan)前,人(ren)(ren)(ren)工智能(neng)(neng)對于普通人(ren)(ren)(ren)而言還是那么“云山霧罩”;圍(wei)棋人(ren)(ren)(ren)機大戰(zhan)后,人(ren)(ren)(ren)們通過各(ge)種(zhong)報道已經了(le)解到,人(ren)(ren)(ren)工智能(neng)(neng)已經滲(shen)透(tou)到每個人(ren)(ren)(ren)的(de)工作(zuo)和生(sheng)活中。智能(neng)(neng)化(hua)服務將會快速地(di)接入餐飲、出(chu)行、旅游、電(dian)影(ying)、教育、醫療等生(sheng)活服務領域,覆(fu)蓋(gai)用戶(hu)吃、住(zhu)、行、玩,人(ren)(ren)(ren)工智能(neng)(neng)在(zai)未來可(ke)能(neng)(neng)媲美人(ren)(ren)(ren)類(lei)的(de)專(zhuan)職秘書。
阿爾法圍(wei)棋(qi)最大(da)的(de)(de)(de)勝利是(shi)為人工(gong)智(zhi)能(neng)打造了(le)一場全球性(xing)的(de)(de)(de)科普,也代表了(le)高科技企業對人工(gong)智(zhi)能(neng)技術(shu)充滿“野心”的(de)(de)(de)宣(xuan)告。過去的(de)(de)(de)人工(gong)智(zhi)能(neng)只是(shi)存(cun)在于實驗室的(de)(de)(de)智(zhi)慧探索(suo);而未(wei)來的(de)(de)(de)科學技術(shu),人工(gong)智(zhi)能(neng)將是(shi)基礎(chu),是(shi)推動商業與(yu)社會發展的(de)(de)(de)強大(da)動力。
李世石簡介
李世(shi)石(shi)是李昌鎬之(zhi)后,韓國最具代表性的棋手,他在2003年(nian)獲第16屆富士通杯冠(guan)軍后升(sheng)為九段棋手。自2002年(nian)加冕富士通杯以(yi)來(lai),十年(nian)時間里他共獲18個世(shi)界冠(guan)軍。李世(shi)石(shi)屬于(yu)典(dian)型的力戰(zhan)型棋風,善于(yu)敏銳地抓(zhua)住對(dui)手的弱處主(zhu)動出(chu)擊,以(yi)強大的力量擊垮對(dui)手,他的攻擊可以(yi)用(yong)“穩,準,狠”來(lai)形容(rong),經常(chang)能在劣(lie)勢下完成逆轉。
AlphaGo2015年10月擊敗歐洲冠軍
谷歌曾于2014年以4億歐(ou)元收(shou)購人(ren)工智(zhi)能(neng)公司DeepMind。由DeepMind研發的AlphaGo項目(mu)已(yi)有兩年歷史,AlphaGo曾在去年戰勝了(le)歐(ou)洲圍棋(qi)冠軍樊麾(hui)(職(zhi)業(ye)二(er)段(duan))。
去年10月5日-10月9日,谷歌AlphaGo在比(bi)(bi)賽中以5:0的比(bi)(bi)分完勝(sheng)了歐洲(zhou)冠軍。除(chu)了戰勝(sheng)人類(lei)外(wai),AlphaGo還與其他的圍棋程(cheng)序(xu)對戰,獲得了500場勝(sheng)利。
AlphaGo原理簡介
傳(chuan)統的人工(gong)智能(neng)方法是將(jiang)所有(you)可(ke)能(neng)的走法構建(jian)成一(yi)棵搜索(suo)樹 ,但這種方法對圍棋并不(bu)適用(yong)。此次谷(gu)歌推出的AlphaGo,將(jiang)高級(ji)搜索(suo)樹與深度(du)神(shen)經網絡結合在一(yi)起。這些神(shen)經網絡通過12個處理層傳(chuan)遞對棋盤的描述,處理層則(ze)包含(han)數百萬個類似于神(shen)經的連接點。
其中一個(ge)神(shen)(shen)(shen)經(jing)(jing)網(wang)(wang)絡(luo)“決策(ce)網(wang)(wang)絡(luo)”(policy network)負責選擇(ze)下一步(bu)走(zou)法,另一個(ge)神(shen)(shen)(shen)經(jing)(jing)網(wang)(wang)絡(luo)“值網(wang)(wang)絡(luo)”(“value network)則(ze)預測比賽勝利方。谷歌方面用人類圍(wei)(wei)(wei)棋(qi)(qi)高手的(de)三千(qian)萬步(bu)圍(wei)(wei)(wei)棋(qi)(qi)走(zou)法訓練(lian)神(shen)(shen)(shen)經(jing)(jing)網(wang)(wang)絡(luo),與(yu)此同(tong)時,AlphaGo也(ye)自行研(yan)究新戰略(lve),在它的(de)神(shen)(shen)(shen)經(jing)(jing)網(wang)(wang)絡(luo) 之間(jian)運行了數千(qian)局圍(wei)(wei)(wei)棋(qi)(qi),利用反復(fu)試(shi)驗調整連接點,這個(ge)流程也(ye)稱為鞏(gong)固學習(xi)(reinforcement learning)。通過廣(guang)泛使用Google云平臺(tai),完成了大量研(yan)究工作。
AlphaGo在與(yu)人的對弈中用了(le)“兩個大腦”來(lai)(lai)解決(jue)問題:“決(jue)策網絡(luo)”和“值網絡(luo)”。通俗(su)來(lai)(lai)說就是(shi),一個大腦用來(lai)(lai)決(jue)策當前應該如何落子(zi),另一個大腦來(lai)(lai)預測比賽最(zui)終的勝利(li)方。
值(zhi)得一提的是,李(li)世石(shi)也是第一次與機(ji)器對(dui)(dui)(dui)戰,所以他無法像和人(ren)(ren)類對(dui)(dui)(dui)戰那樣,先研究對(dui)(dui)(dui)方的棋譜和下棋風格。李(li)世石(shi)所能做的就是和自己對(dui)(dui)(dui)弈。谷歌AlphaGo也是通過這種方式(shi)鍛煉(lian)自己,真(zhen)正做到(dao)了“人(ren)(ren)工智能”。
李世石之后 谷歌AlphaGo還會挑戰誰?
谷歌(ge)旗下DeepMind創始人(ren)哈薩比(bi)斯曾表示,還有(you)很(hen)多實力很(hen)強的選(xuan)手,所以(yi)這次比(bi)賽之后,也(ye)許(xu)也(ye)會(hui)去中國、日本,與當(dang)地高手切磋棋藝。
中國圍棋圍棋九段(duan)柯潔也對(dui)此表示了(le)興趣,昨天AlphaGo戰勝李(li)世(shi)石(shi)后,他發微博(bo)稱,“就算阿法狗(gou)戰勝了(le)李(li)世(shi)石(shi),但它贏不了(le)我”,并且還置頂了(le)該微博(bo)。
并(bing)且(qie)他來頭也不小,柯潔自(zi)述(shu),“現在暫時是(shi)世(shi)(shi)(shi)界(jie)圍棋第一人(特(te)地用了暫時,謙虛是(shi)美德)正(zheng)式比賽(sai)我是(shi)單盤8:2碾(nian)壓李世(shi)(shi)(shi)石(他贏(ying)得這兩盤沒(mei)有任何作用)世(shi)(shi)(shi)界(jie)冠軍獲得過三(san)次(此年齡如此成(cheng)績前無古人)”。