賽事背景
圍棋(qi)人(ren)機大(da)戰,源于2016年1月(yue)27日英國《自(zi)然(ran)》雜志(zhi)的一篇文章。這篇文章稱,谷歌的人(ren)工(gong)智(zhi)能系統阿爾法圍棋(qi)(AlphaGo)2015年10月(yue)份以5比0的戰績(ji)完勝歐洲冠軍、職(zhi)業(ye)圍棋(qi)二段樊麾,這是人(ren)類歷史上,圍棋(qi)人(ren)工(gong)智(zhi)能(AI)第一次在公平比賽中戰勝職(zhi)業(ye)圍棋(qi)手。
棋(qi)(qi)(qi)類(lei)(lei)游戲一(yi)直(zhi)被視為頂級(ji)人(ren)類(lei)(lei)智(zhi)(zhi)力(li)的(de)(de)試金石。人(ren)工智(zhi)(zhi)能(neng)與(yu)人(ren)類(lei)(lei)棋(qi)(qi)(qi)手的(de)(de)對抗一(yi)直(zhi)在(zai)(zai)上(shang)(shang)演,此前(qian)在(zai)(zai)三子棋(qi)(qi)(qi)、跳棋(qi)(qi)(qi)和國際象(xiang)(xiang)棋(qi)(qi)(qi)等棋(qi)(qi)(qi)類(lei)(lei)上(shang)(shang),計算機程序都曾(ceng)打敗過人(ren)類(lei)(lei)。在(zai)(zai)圍棋(qi)(qi)(qi)人(ren)機大戰之前(qian)的(de)(de)歷史上(shang)(shang),最著名的(de)(de)人(ren)機大戰要數國際象(xiang)(xiang)棋(qi)(qi)(qi)世界冠(guan)軍加(jia)里·卡斯帕羅夫對國際象(xiang)(xiang)棋(qi)(qi)(qi)人(ren)工智(zhi)(zhi)能(neng)程序“深藍”的(de)(de)國際象(xiang)(xiang)棋(qi)(qi)(qi)比(bi)賽。1997年,國際象(xiang)(xiang)棋(qi)(qi)(qi)人(ren)工智(zhi)(zhi)能(neng)第一(yi)次(ci)打敗頂尖(jian)的(de)(de)人(ren)類(lei)(lei);2006年,人(ren)類(lei)(lei)最后一(yi)次(ci)打敗頂尖(jian)的(de)(de)國際象(xiang)(xiang)棋(qi)(qi)(qi)人(ren)工智(zhi)(zhi)能(neng)。自那時起,歐美傳統里的(de)(de)頂級(ji)人(ren)類(lei)(lei)智(zhi)(zhi)力(li)游戲國際象(xiang)(xiang)棋(qi)(qi)(qi),已經在(zai)(zai)電腦面前(qian)一(yi)敗涂地(di)(di)。圍棋(qi)(qi)(qi)成了人(ren)類(lei)(lei)智(zhi)(zhi)力(li)游戲最后的(de)(de)一(yi)塊(kuai)高地(di)(di)。
圍棋(qi)人(ren)(ren)工智(zhi)能(neng)長期以(yi)來舉步維艱,頂級人(ren)(ren)工智(zhi)能(neng)甚至不能(neng)打敗稍強(qiang)的(de)(de)業余(yu)選手。這(zhe)似乎(hu)也合情合理。因(yin)為(wei)要是人(ren)(ren)工智(zhi)能(neng)用暴力(li)列(lie)舉所有情況(kuang)的(de)(de)方式,圍棋(qi)需要計算的(de)(de)變化(hua)數(shu)量遠遠超過已經觀測到的(de)(de)宇宙中原子的(de)(de)數(shu)量。這(zhe)一巨大(da)的(de)(de)數(shu)目(mu),足以(yi)令(ling)任何蠻力(li)窮舉者望而卻步。而人(ren)(ren)類,可以(yi)憑借某種難以(yi)復(fu)制的(de)(de)算法跳過蠻力(li),一眼(yan)看到棋(qi)盤(pan)的(de)(de)本質。
后來,人工智(zhi)(zhi)能(neng)研究者們(men)祭(ji)出了(le)終極殺器(qi)——“深度(du)(du)學習(xi)”。深度(du)(du)學習(xi)是人工智(zhi)(zhi)能(neng)領(ling)域中的(de)熱門科目,它能(neng)完成筆跡(ji)識別(bie)、面部識別(bie)、駕駛自動(dong)汽車、自然語言處理(li)、識別(bie)聲音、分析(xi)生(sheng)物信息數據等非(fei)常(chang)復雜(za)的(de)任務(wu)。谷(gu)歌人工智(zhi)(zhi)能(neng)程(cheng)序阿爾(er)法(fa)圍(wei)棋(AlphaGo)就是基于(yu)深度(du)(du)學習(xi)技術研究開發(fa)的(de)。為了(le)測試阿爾(er)法(fa)圍(wei)棋的(de)水平,谷(gu)歌于(yu)2016年3月(yue)份向圍(wei)棋世(shi)(shi)界冠軍、韓國頂(ding)尖棋手李世(shi)(shi)石發(fa)起挑(tiao)戰。李世(shi)(shi)石接受挑(tiao)戰。
比賽規程
李(li)世石與阿爾法(fa)圍(wei)棋的(de)圍(wei)棋人機(ji)(ji)大戰為(wei)(wei)五番棋挑(tiao)戰,但(dan)無論比分如何將下滿五局(ju),比賽(sai)采用(yong)中國(guo)圍(wei)棋規則,執(zhi)黑一方(fang)貼(tie)3又(you)3/4子(即7.5目),各方(fang)用(yong)時為(wei)(wei)2小時,3次60秒的(de)讀秒機(ji)(ji)會。五局(ju)比賽(sai)分別(bie)于2016年3月(yue)9日(ri)(ri)、3月(yue)10日(ri)(ri)、3月(yue)12日(ri)(ri)、3月(yue)13日(ri)(ri)和3月(yue)15日(ri)(ri)在韓國(guo)首(shou)爾鐘路區四季(ji)酒(jiu)店(dian)進行,獲(huo)(huo)得(de)三(san)勝(sheng)者(zhe)獲(huo)(huo)得(de)100萬美(mei)元(yuan)獎(jiang)(jiang)金(jin)(jin)(約11億韓元(yuan))。若阿爾法(fa)圍(wei)棋獲(huo)(huo)勝(sheng),獎(jiang)(jiang)金(jin)(jin)將捐贈給聯合國(guo)兒童基(ji)金(jin)(jin)會、STEM教育以及(ji)圍(wei)棋慈善機(ji)(ji)構。除了100萬美(mei)元(yuan)基(ji)礎獎(jiang)(jiang)金(jin)(jin)外(wai),李(li)世石還(huan)可獲(huo)(huo)得(de)15萬美(mei)元(yuan)出場費。此(ci)外(wai)每勝(sheng)一局(ju)還(huan)有2萬美(mei)元(yuan)勝(sheng)局(ju)獎(jiang)(jiang)金(jin)(jin),如果五盤全勝(sheng),勝(sheng)局(ju)獎(jiang)(jiang)金(jin)(jin)為(wei)(wei)10萬美(mei)元(yuan)。
賽程賽果
第一局
第一(yi)局:阿爾法(fa)圍棋執白中盤勝李世石
2016年(nian)3月9日,圍(wei)(wei)(wei)(wei)棋(qi)人機大戰首局(ju)在(zai)(zai)韓國首爾(er)四季酒店打響。賽前猜先(xian)阿爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)猜錯(cuo),李(li)世石(shi)選擇黑棋(qi),率先(xian)展開布(bu)局(ju)。黑棋(qi)布(bu)局(ju)走出(chu)新型(xing),阿爾(er)法(fa)應(ying)對(dui)不佳,出(chu)現失誤。李(li)世石(shi)抓住電腦布(bu)局(ju)不擅長應(ying)對(dui)新型(xing)的弱點獲得(de)不錯(cuo)的局(ju)面。但圍(wei)(wei)(wei)(wei)棋(qi)的勝負關鍵往(wang)往(wang)是中盤階(jie)段。阿爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)之后的下法(fa)變得(de)強(qiang)硬(ying),雙方展開接觸戰。李(li)世石(shi)抓住機會(hui),圍(wei)(wei)(wei)(wei)住一塊大空(kong),在(zai)(zai)大局(ju)上搶得(de)先(xian)機。就在(zai)(zai)觀戰棋(qi)手(shou)都(dou)認為李(li)世石(shi)占優的情況下,他卻放(fang)出(chu)了(le)非常業余的手(shou)法(fa),瞬間使微弱的優勢(shi)化為烏(wu)有,還變成了(le)劣勢(shi)。進(jin)入官(guan)子(zi),阿爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)根本(ben)不犯一點錯(cuo)誤,著著精準。等(deng)阿爾(er)法(fa)圍(wei)(wei)(wei)(wei)棋(qi)下了(le)186手(shou),李(li)世石(shi)算清后投子(zi)認輸。
第二局
第二(er)局:阿(a)爾法(fa)圍棋執(zhi)黑(hei)中(zhong)盤(pan)勝李世石(shi)
2016年3月10日,圍棋(qi)(qi)(qi)(qi)人機(ji)大戰展開第二局(ju)較量。阿爾法圍棋(qi)(qi)(qi)(qi)執黑(hei)先(xian)行,李(li)世(shi)石(shi)轉變了行棋(qi)(qi)(qi)(qi)的(de)(de)(de)(de)風(feng)格,開局(ju)下(xia)得非常穩健(jian)。阿爾法圍棋(qi)(qi)(qi)(qi)也(ye)下(xia)出了不少新手,這讓李(li)世(shi)石(shi)應對得非常謹(jin)慎,不時(shi)陷入長考,這讓他在(zai)時(shi)間上(shang)一直落后。你來我往中,黑(hei)37和41兩步尖沖令人匪夷所思,尤(you)其是第41手,致目數大虧。中盤階(jie)段(duan),本來形勢(shi)占優(you)的(de)(de)(de)(de)李(li)世(shi)石(shi)行棋(qi)(qi)(qi)(qi)過(guo)緩,右上(shang)角的(de)(de)(de)(de)一步二路打拔被(bei)(bei)視作(zuo)敗手,阿爾法圍棋(qi)(qi)(qi)(qi)的(de)(de)(de)(de)優(you)勢(shi)逐(zhu)漸清晰(xi)起來。在(zai)形勢(shi)陷入被(bei)(bei)動的(de)(de)(de)(de)情況下(xia),李(li)世(shi)石(shi)下(xia)出一手扳的(de)(de)(de)(de)好棋(qi)(qi)(qi)(qi),但幾次轉換后,黑(hei)棋(qi)(qi)(qi)(qi)還是牢牢守住了領先(xian)的(de)(de)(de)(de)局(ju)面,而且(qie)棋(qi)(qi)(qi)(qi)形很厚。李(li)世(shi)石(shi)雖然脫了幾手,但并無(wu)實質性改(gai)變,最終阿爾法圍棋(qi)(qi)(qi)(qi)執黑(hei)于211手獲勝且(qie)優(you)勢(shi)明(ming)顯,總比分2比0領先(xian)。
第三局
第三局:阿爾(er)法圍棋(qi)執白(bai)中盤勝李世石
2016年(nian)3月12日,圍(wei)(wei)(wei)棋(qi)人(ren)機(ji)大(da)戰展開第(di)三局(ju)較量。李(li)世(shi)(shi)(shi)(shi)石(shi)(shi)執黑(hei)先行,該(gai)局(ju)開始前,還有棋(qi)迷希(xi)望李(li)世(shi)(shi)(shi)(shi)石(shi)(shi)能(neng)夠實現逆轉,但(dan)阿(a)(a)(a)爾法圍(wei)(wei)(wei)棋(qi)徹底摧(cui)毀了這種可能(neng)。布(bu)局(ju)階段,李(li)世(shi)(shi)(shi)(shi)石(shi)(shi)左(zuo)(zuo)下掛(gua)角(jiao)后(hou)走(zou)高中國流。行不到(dao)二十手,李(li)世(shi)(shi)(shi)(shi)石(shi)(shi)局(ju)面就落入下風。隨后(hou),雙方在(zai)左(zuo)(zuo)上(shang)(shang)角(jiao)展開戰斗,阿(a)(a)(a)爾法圍(wei)(wei)(wei)棋(qi)對全局(ju)的把握一如既往地(di)強大(da)。李(li)世(shi)(shi)(shi)(shi)石(shi)(shi)不但(dan)自己的模樣被(bei)對手輕松打(da)入,阿(a)(a)(a)爾法圍(wei)(wei)(wei)棋(qi)還借助(zhu)戰斗在(zai)下邊圍(wei)(wei)(wei)起一大(da)塊空,局(ju)面看上(shang)(shang)去還不如前兩盤好(hao)看。隨后(hou)的比賽,雖然李(li)世(shi)(shi)(shi)(shi)石(shi)(shi)仍然極力(li)抵抗,并且(qie)祭出劫(jie)爭的手段,但(dan)是電腦精(jing)確應對,讓他無功而返。到(dao)阿(a)(a)(a)爾法圍(wei)(wei)(wei)棋(qi)下了176手后(hou),李(li)世(shi)(shi)(shi)(shi)石(shi)(shi)只有投子認(ren)負。圍(wei)(wei)(wei)棋(qi)人(ren)機(ji)大(da)戰前三盤人(ren)類三連敗。
第四局
第四局:李世石執白中盤(pan)勝(sheng)阿爾(er)法圍棋(qi)
2016年3月13日,圍(wei)棋(qi)(qi)(qi)(qi)人機大(da)(da)戰展(zhan)開第四(si)局(ju)較(jiao)量。在接連三(san)局(ju)負(fu)于“阿(a)爾法(fa)(fa)(fa)圍(wei)棋(qi)(qi)(qi)(qi)”后(hou),脫(tuo)去勝負(fu)包袱的李(li)(li)(li)(li)世(shi)石(shi)為榮譽而戰,終于迎來了(le)“圍(wei)棋(qi)(qi)(qi)(qi)人機大(da)(da)戰”的首次(ci)(ci)勝利。與前幾局(ju)比賽(sai)相比,李(li)(li)(li)(li)世(shi)石(shi)此局(ju)更多次(ci)(ci)陷入(ru)了(le)長(chang)時(shi)(shi)(shi)間思考,導(dao)致耗時(shi)(shi)(shi)過多。在比賽(sai)進行到(dao)(dao)兩個(ge)半小(xiao)時(shi)(shi)(shi)后(hou),李(li)(li)(li)(li)世(shi)石(shi)僅剩下17分鐘,比“阿(a)爾法(fa)(fa)(fa)圍(wei)棋(qi)(qi)(qi)(qi)”剩余時(shi)(shi)(shi)間足足少1個(ge)小(xiao)時(shi)(shi)(shi)。但隨后(hou)李(li)(li)(li)(li)世(shi)石(shi)祭出(chu)白78“挖”的妙手,一(yi)(yi)場“逆(ni)襲(xi)”之(zhi)戰也由此開始(shi)。阿(a)爾法(fa)(fa)(fa)圍(wei)棋(qi)(qi)(qi)(qi)被李(li)(li)(li)(li)世(shi)石(shi)的“神之(zhi)一(yi)(yi)手”下得(de)陷入(ru)混亂,走出(chu)了(le)黑(hei)93一(yi)(yi)步常(chang)理上的廢棋(qi)(qi)(qi)(qi),導(dao)致棋(qi)(qi)(qi)(qi)盤右側一(yi)(yi)大(da)(da)片黑(hei)子“全死”。此后(hou),“阿(a)爾法(fa)(fa)(fa)圍(wei)棋(qi)(qi)(qi)(qi)”判斷局(ju)面對自己不利,每步耗時(shi)(shi)(shi)明顯增長(chang),更首次(ci)(ci)被李(li)(li)(li)(li)世(shi)石(shi)拖入(ru)讀秒。最終,李(li)(li)(li)(li)世(shi)石(shi)冷靜收官鎖定勝局(ju)。到(dao)(dao)180手,阿(a)爾法(fa)(fa)(fa)圍(wei)棋(qi)(qi)(qi)(qi)中盤認(ren)輸(shu)。
第五局
第五局:阿爾法圍(wei)棋(qi)執白中盤勝李世石
2016年3月15日,圍(wei)(wei)(wei)棋(qi)(qi)人機(ji)大戰(zhan)展開第(di)五局對決。在(zai)(zai)上局比賽扳回(hui)一(yi)城后,李(li)(li)(li)世(shi)石(shi)(shi)向阿爾(er)法(fa)圍(wei)(wei)(wei)棋(qi)(qi)團隊提出要在(zai)(zai)末戰(zhan)中(zhong)執黑(hei),因為(wei)(wei)他覺得(de)阿爾(er)法(fa)圍(wei)(wei)(wei)棋(qi)(qi)執黑(hei)時發揮并(bing)不完美,戰(zhan)勝執白(bai)的(de)阿爾(er)法(fa)圍(wei)(wei)(wei)棋(qi)(qi)才更(geng)有意(yi)義。執黑(hei)的(de)李(li)(li)(li)世(shi)石(shi)(shi)選(xuan)擇了穩健的(de)錯小目、無(wu)憂角開局,阿爾(er)法(fa)圍(wei)(wei)(wei)棋(qi)(qi)則以二連星(xing)應對。進(jin)入中(zhong)盤,李(li)(li)(li)世(shi)石(shi)(shi)意(yi)圖非(fei)常明顯,以撈實地(di)為(wei)(wei)主。但李(li)(li)(li)世(shi)石(shi)(shi)在(zai)(zai)79和(he)81手(shou)連出緩(huan)手(shou),被視為(wei)(wei)敗招。阿爾(er)法(fa)圍(wei)(wei)(wei)棋(qi)(qi)82靠也(ye)并(bing)非(fei)好的(de)應手(shou)。一(yi)波(bo)錯進(jin)錯出后,黑(hei)棋(qi)(qi)在(zai)(zai)87和(he)89手(shou)再出緩(huan)手(shou),致使(shi)白(bai)棋(qi)(qi)左上角的(de)圍(wei)(wei)(wei)剿更(geng)加有力,黑(hei)棋(qi)(qi)形勢(shi)瞬間坍塌(ta)。此后,占據優勢(shi)的(de)阿爾(er)法(fa)圍(wei)(wei)(wei)棋(qi)(qi)展現了它(ta)強大的(de)中(zhong)后盤計算(suan)能力,鮮(xian)有失誤,落子效率極高。不過李(li)(li)(li)世(shi)石(shi)(shi)也(ye)并(bing)未(wei)放棄(qi),連續走(zou)出強硬應手(shou),可惜棋(qi)(qi)盤下得(de)越(yue)來越(yue)小,難再覓(mi)逆轉(zhuan)機(ji)會。第(di)280手(shou),李(li)(li)(li)世(shi)石(shi)(shi)投子認負。這次圍(wei)(wei)(wei)棋(qi)(qi)人機(ji)大戰(zhan)的(de)最終(zhong)比分定格為(wei)(wei)1比4。
賽事影響
對圍棋項目
圍(wei)棋(qi)人(ren)機(ji)大戰(zhan)前(qian),不少人(ren)擔心(xin)圍(wei)棋(qi)這(zhe)塊(kuai)陣地一旦失守,將(jiang)對整個項目產生滅(mie)頂之災,因(yin)為不少人(ren)或(huo)許會(hui)產生這(zhe)樣的(de)(de)想法:號(hao)稱棋(qi)類(lei)智力最頂尖的(de)(de)圍(wei)棋(qi)也(ye)(ye)不過爾爾,從而魅力大減。可實際(ji)的(de)(de)情況卻(que)是恰(qia)恰(qia)相反,很多平時不關心(xin)圍(wei)棋(qi)或(huo)者(zhe)說根本連圍(wei)棋(qi)規(gui)則都不了解(jie)的(de)(de)人(ren),也(ye)(ye)因(yin)為人(ren)機(ji)大戰(zhan)開始了解(jie)和關心(xin)這(zhe)項運動。
圍(wei)(wei)棋(qi)人機大戰(zhan)期間,關(guan)于(yu)人機大戰(zhan)的(de)(de)報(bao)道充斥于(yu)國(guo)內各(ge)種媒體的(de)(de)“頭條”,風頭完(wan)全(quan)蓋過了足球、籃球這些(xie)風靡世界的(de)(de)運動;就連圍(wei)(wei)棋(qi)普及(ji)率極(ji)低(di)的(de)(de)歐美國(guo)家,英(ying)國(guo)廣播公(gong)司(BBC)、路透社、美聯(lian)社這些(xie)主流(liu)媒體也對(dui)比(bi)賽進行了詳細(xi)報(bao)道,這在(zai)以往(wang)幾乎(hu)是不(bu)可能的(de)(de)。
對人工智能
“人(ren)工(gong)智(zhi)(zhi)能(neng)”這個概(gai)念是人(ren)機(ji)大戰(zhan)最終極的受益者。圍棋人(ren)機(ji)大戰(zhan)前,人(ren)工(gong)智(zhi)(zhi)能(neng)對于(yu)普通(tong)人(ren)而言(yan)還是那么“云山霧罩”;圍棋人(ren)機(ji)大戰(zhan)后(hou),人(ren)們通(tong)過各(ge)種報道已經了解到(dao),人(ren)工(gong)智(zhi)(zhi)能(neng)已經滲透到(dao)每(mei)個人(ren)的工(gong)作和生活中。智(zhi)(zhi)能(neng)化服務將會快速(su)地接入餐飲、出行、旅游、電影、教(jiao)育、醫療等生活服務領域,覆蓋用(yong)戶吃、住、行、玩,人(ren)工(gong)智(zhi)(zhi)能(neng)在未來可能(neng)媲美(mei)人(ren)類的專(zhuan)職秘書(shu)。
阿爾法(fa)圍棋最大的(de)(de)勝利是(shi)為人工(gong)智能(neng)打造了一場全(quan)球性的(de)(de)科(ke)普(pu),也代(dai)表了高科(ke)技企(qi)業(ye)對(dui)人工(gong)智能(neng)技術(shu)充滿“野心”的(de)(de)宣(xuan)告。過去的(de)(de)人工(gong)智能(neng)只是(shi)存在于(yu)實驗室的(de)(de)智慧探索;而未來的(de)(de)科(ke)學技術(shu),人工(gong)智能(neng)將是(shi)基(ji)礎,是(shi)推動商業(ye)與社(she)會發展的(de)(de)強大動力(li)。
李世石簡介
李世(shi)石是李昌鎬之后,韓(han)國(guo)最(zui)具(ju)代表性的(de)棋手,他在(zai)2003年獲第16屆富士通(tong)(tong)杯冠軍后升為九(jiu)段棋手。自2002年加冕富士通(tong)(tong)杯以來(lai),十年時間里他共(gong)獲18個世(shi)界冠軍。李世(shi)石屬于典型的(de)力戰(zhan)型棋風,善于敏銳地抓(zhua)住對手的(de)弱處主(zhu)動(dong)出擊(ji),以強(qiang)大的(de)力量擊(ji)垮對手,他的(de)攻擊(ji)可以用“穩(wen),準,狠”來(lai)形容,經常能在(zai)劣勢下完成逆轉。
AlphaGo2015年10月擊敗歐洲冠軍
谷歌曾于2014年(nian)以4億歐(ou)元收購人工智能公司DeepMind。由DeepMind研發(fa)的AlphaGo項目(mu)已有兩(liang)年(nian)歷(li)史,AlphaGo曾在去(qu)年(nian)戰勝了歐(ou)洲圍棋冠軍樊麾(職業二段(duan))。
去年(nian)10月(yue)5日-10月(yue)9日,谷歌AlphaGo在比賽(sai)中(zhong)以5:0的(de)比分完勝了歐洲(zhou)冠軍。除了戰勝人(ren)類外(wai),AlphaGo還與其他(ta)的(de)圍(wei)棋程序(xu)對(dui)戰,獲得(de)了500場勝利。
AlphaGo原理簡介
傳統的(de)人工(gong)智能方法(fa)是(shi)將所有可能的(de)走法(fa)構建成一棵搜索(suo)(suo)樹 ,但這種方法(fa)對(dui)圍棋并不適用。此次谷(gu)歌(ge)推出(chu)的(de)AlphaGo,將高級(ji)搜索(suo)(suo)樹與(yu)深(shen)度神經(jing)(jing)網絡(luo)(luo)結合在一起。這些神經(jing)(jing)網絡(luo)(luo)通過(guo)12個處理層傳遞對(dui)棋盤(pan)的(de)描述(shu),處理層則(ze)包含數百萬個類似于神經(jing)(jing)的(de)連接點(dian)。
其(qi)中一(yi)個(ge)神經(jing)(jing)網絡(luo)“決策網絡(luo)”(policy network)負(fu)責(ze)選擇下(xia)一(yi)步(bu)走法,另一(yi)個(ge)神經(jing)(jing)網絡(luo)“值(zhi)網絡(luo)”(“value network)則預測比賽勝(sheng)利方。谷歌方面(mian)用人類圍(wei)棋高手(shou)的三千(qian)萬步(bu)圍(wei)棋走法訓練神經(jing)(jing)網絡(luo),與此(ci)同時,AlphaGo也(ye)(ye)自(zi)行研(yan)究新戰略,在它(ta)的神經(jing)(jing)網絡(luo) 之間運行了(le)數千(qian)局圍(wei)棋,利用反(fan)復試驗調整(zheng)連接點(dian),這個(ge)流程也(ye)(ye)稱為鞏固學習(reinforcement learning)。通過(guo)廣泛使用Google云平臺,完成了(le)大量研(yan)究工(gong)作。
AlphaGo在(zai)與人的對弈中用(yong)了“兩個(ge)大(da)(da)腦”來(lai)解(jie)決問題(ti):“決策(ce)(ce)網絡”和“值(zhi)網絡”。通俗來(lai)說就是(shi),一(yi)個(ge)大(da)(da)腦用(yong)來(lai)決策(ce)(ce)當前應該如何落(luo)子,另一(yi)個(ge)大(da)(da)腦來(lai)預測比(bi)賽最終的勝利(li)方。
值得一提的(de)是(shi)(shi),李世(shi)石(shi)也是(shi)(shi)第一次(ci)與機器對戰,所(suo)以(yi)他無法(fa)像和人類對戰那樣(yang),先研(yan)究對方的(de)棋譜和下棋風格。李世(shi)石(shi)所(suo)能做的(de)就是(shi)(shi)和自(zi)己(ji)(ji)對弈。谷歌AlphaGo也是(shi)(shi)通過(guo)這種方式鍛煉(lian)自(zi)己(ji)(ji),真正做到了“人工智能”。
李世石之后 谷歌AlphaGo還會挑戰誰?
谷歌旗下DeepMind創(chuang)始人哈薩比斯曾(ceng)表(biao)示,還有很多實(shi)力很強的選(xuan)手,所以(yi)這次比賽之(zhi)后,也許也會去中國、日本,與當地高(gao)手切磋棋藝。
中國圍(wei)棋(qi)圍(wei)棋(qi)九(jiu)段柯潔也(ye)對此表示了(le)(le)興趣,昨天AlphaGo戰勝(sheng)李世(shi)石(shi)后(hou),他發微博稱,“就(jiu)算阿法(fa)狗戰勝(sheng)了(le)(le)李世(shi)石(shi),但(dan)它贏不了(le)(le)我(wo)”,并(bing)且還(huan)置頂了(le)(le)該微博。
并且他來頭也不(bu)小,柯潔自述,“現在暫時是(shi)世(shi)(shi)界圍(wei)棋第一人(ren)(特地用了暫時,謙虛是(shi)美德(de))正式比賽我是(shi)單盤8:2碾壓李世(shi)(shi)石(他贏得這兩盤沒有任何作用)世(shi)(shi)界冠軍獲得過三次(ci)(此年齡(ling)如此成(cheng)績前無(wu)古人(ren))”。