賽事背景
圍棋人機大戰,源于2016年1月27日英國《自然》雜志的一(yi)(yi)篇文(wen)章。這篇文(wen)章稱,谷歌(ge)的人工(gong)智能(neng)系統(tong)阿爾法圍棋(AlphaGo)2015年10月份以(yi)5比(bi)(bi)0的戰績完勝歐洲冠軍、職業圍棋二段樊麾,這是(shi)人類歷史上,圍棋人工(gong)智能(neng)(AI)第一(yi)(yi)次在公平比(bi)(bi)賽中戰勝職業圍棋手。
棋(qi)(qi)類(lei)(lei)(lei)(lei)游(you)戲(xi)一(yi)(yi)直(zhi)被視為頂(ding)(ding)級(ji)人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)智力的(de)試金石。人(ren)(ren)(ren)工(gong)(gong)智能(neng)(neng)與人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)棋(qi)(qi)手(shou)的(de)對(dui)抗一(yi)(yi)直(zhi)在(zai)(zai)上演,此前在(zai)(zai)三(san)子棋(qi)(qi)、跳棋(qi)(qi)和國(guo)際(ji)象棋(qi)(qi)等棋(qi)(qi)類(lei)(lei)(lei)(lei)上,計算機(ji)程(cheng)序都曾打(da)敗(bai)過人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)。在(zai)(zai)圍(wei)(wei)棋(qi)(qi)人(ren)(ren)(ren)機(ji)大戰(zhan)之前的(de)歷史(shi)上,最(zui)著名的(de)人(ren)(ren)(ren)機(ji)大戰(zhan)要數國(guo)際(ji)象棋(qi)(qi)世界冠軍加里·卡(ka)斯帕羅夫(fu)對(dui)國(guo)際(ji)象棋(qi)(qi)人(ren)(ren)(ren)工(gong)(gong)智能(neng)(neng)程(cheng)序“深藍”的(de)國(guo)際(ji)象棋(qi)(qi)比賽。1997年,國(guo)際(ji)象棋(qi)(qi)人(ren)(ren)(ren)工(gong)(gong)智能(neng)(neng)第(di)一(yi)(yi)次(ci)打(da)敗(bai)頂(ding)(ding)尖(jian)的(de)人(ren)(ren)(ren)類(lei)(lei)(lei)(lei);2006年,人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)最(zui)后(hou)一(yi)(yi)次(ci)打(da)敗(bai)頂(ding)(ding)尖(jian)的(de)國(guo)際(ji)象棋(qi)(qi)人(ren)(ren)(ren)工(gong)(gong)智能(neng)(neng)。自那時(shi)起,歐美傳統里的(de)頂(ding)(ding)級(ji)人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)智力游(you)戲(xi)國(guo)際(ji)象棋(qi)(qi),已經在(zai)(zai)電腦面前一(yi)(yi)敗(bai)涂地(di)。圍(wei)(wei)棋(qi)(qi)成了人(ren)(ren)(ren)類(lei)(lei)(lei)(lei)智力游(you)戲(xi)最(zui)后(hou)的(de)一(yi)(yi)塊高地(di)。
圍(wei)棋(qi)人工智能長期以(yi)來(lai)舉(ju)(ju)步維(wei)艱,頂(ding)級人工智能甚至不(bu)能打敗稍強的(de)業余選手。這似(si)乎也合情合理。因為要是人工智能用暴力列(lie)舉(ju)(ju)所有情況(kuang)的(de)方式,圍(wei)棋(qi)需要計(ji)算(suan)的(de)變化數量(liang)遠(yuan)遠(yuan)超(chao)過(guo)已(yi)經(jing)觀測到的(de)宇宙中原子的(de)數量(liang)。這一巨(ju)大的(de)數目,足以(yi)令任何蠻(man)力窮舉(ju)(ju)者(zhe)望而(er)卻步。而(er)人類(lei),可以(yi)憑借某種難以(yi)復制(zhi)的(de)算(suan)法跳過(guo)蠻(man)力,一眼看到棋(qi)盤(pan)的(de)本質(zhi)。
后(hou)來,人工智(zhi)能(neng)(neng)研(yan)究(jiu)(jiu)者(zhe)們(men)祭出了終極殺器——“深度(du)(du)學(xue)(xue)習”。深度(du)(du)學(xue)(xue)習是人工智(zhi)能(neng)(neng)領域中的熱門科目(mu),它能(neng)(neng)完成筆跡識別、面部識別、駕(jia)駛(shi)自動汽車、自然語言處理、識別聲音(yin)、分析生(sheng)物信息數據等非常復(fu)雜的任務。谷歌人工智(zhi)能(neng)(neng)程序(xu)阿(a)爾法(fa)(fa)圍(wei)棋(qi)(AlphaGo)就是基(ji)于深度(du)(du)學(xue)(xue)習技術研(yan)究(jiu)(jiu)開(kai)發的。為(wei)了測試阿(a)爾法(fa)(fa)圍(wei)棋(qi)的水平,谷歌于2016年3月份向圍(wei)棋(qi)世界冠軍、韓國頂尖(jian)棋(qi)手(shou)李世石發起挑戰(zhan)。李世石接受(shou)挑戰(zhan)。
比賽規程
李世石與阿爾法圍(wei)(wei)棋(qi)(qi)的(de)圍(wei)(wei)棋(qi)(qi)人機(ji)大(da)戰(zhan)(zhan)為五(wu)番棋(qi)(qi)挑戰(zhan)(zhan),但無(wu)論(lun)比(bi)分(fen)(fen)如何將下(xia)滿五(wu)局,比(bi)賽采用中(zhong)國(guo)圍(wei)(wei)棋(qi)(qi)規則,執黑一方貼3又3/4子(即(ji)7.5目),各(ge)方用時為2小時,3次60秒(miao)的(de)讀(du)秒(miao)機(ji)會。五(wu)局比(bi)賽分(fen)(fen)別(bie)于2016年3月(yue)9日(ri)(ri)、3月(yue)10日(ri)(ri)、3月(yue)12日(ri)(ri)、3月(yue)13日(ri)(ri)和3月(yue)15日(ri)(ri)在(zai)韓(han)國(guo)首爾鐘路區四季酒(jiu)店進行,獲得(de)三勝者獲得(de)100萬(wan)美(mei)元獎(jiang)金(jin)(jin)(jin)(jin)(jin)(約11億韓(han)元)。若(ruo)阿爾法圍(wei)(wei)棋(qi)(qi)獲勝,獎(jiang)金(jin)(jin)(jin)(jin)(jin)將捐贈給聯合國(guo)兒童基金(jin)(jin)(jin)(jin)(jin)會、STEM教育以及圍(wei)(wei)棋(qi)(qi)慈善(shan)機(ji)構(gou)。除了(le)100萬(wan)美(mei)元基礎(chu)獎(jiang)金(jin)(jin)(jin)(jin)(jin)外,李世石還(huan)(huan)可獲得(de)15萬(wan)美(mei)元出場費(fei)。此外每勝一局還(huan)(huan)有(you)2萬(wan)美(mei)元勝局獎(jiang)金(jin)(jin)(jin)(jin)(jin),如果五(wu)盤(pan)全勝,勝局獎(jiang)金(jin)(jin)(jin)(jin)(jin)為10萬(wan)美(mei)元。
賽程賽果
第一局
第一(yi)局:阿爾(er)法圍棋執白中盤勝李(li)世石
2016年3月9日,圍(wei)(wei)棋(qi)(qi)人機大(da)戰首局(ju)(ju)在韓(han)國首爾四(si)季酒店打響(xiang)。賽前猜先(xian)阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)猜錯(cuo),李世(shi)石(shi)選擇(ze)黑(hei)棋(qi)(qi),率先(xian)展(zhan)開布局(ju)(ju)。黑(hei)棋(qi)(qi)布局(ju)(ju)走出(chu)新(xin)型,阿(a)(a)爾法(fa)應對不佳,出(chu)現失誤(wu)。李世(shi)石(shi)抓(zhua)住電腦布局(ju)(ju)不擅長應對新(xin)型的弱點獲得(de)不錯(cuo)的局(ju)(ju)面。但圍(wei)(wei)棋(qi)(qi)的勝負(fu)關鍵往往是中(zhong)盤階(jie)段。阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)之后的下(xia)法(fa)變(bian)得(de)強硬,雙方展(zhan)開接觸戰。李世(shi)石(shi)抓(zhua)住機會,圍(wei)(wei)住一塊大(da)空,在大(da)局(ju)(ju)上搶得(de)先(xian)機。就在觀戰棋(qi)(qi)手都認為李世(shi)石(shi)占優的情況下(xia),他卻放出(chu)了(le)非常業余(yu)的手法(fa),瞬間(jian)使微弱的優勢化(hua)為烏有,還變(bian)成了(le)劣(lie)勢。進入官子(zi),阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)根本不犯一點錯(cuo)誤(wu),著著精準。等(deng)阿(a)(a)爾法(fa)圍(wei)(wei)棋(qi)(qi)下(xia)了(le)186手,李世(shi)石(shi)算清后投子(zi)認輸(shu)。
第二局
第(di)二局(ju):阿爾法圍棋執黑中盤勝李世石
2016年3月10日,圍棋(qi)人機大(da)戰展開第(di)二(er)局較量。阿爾法(fa)圍棋(qi)執(zhi)黑(hei)先行,李世石(shi)轉變(bian)了行棋(qi)的(de)風格,開局下(xia)得非(fei)常穩健。阿爾法(fa)圍棋(qi)也下(xia)出(chu)了不(bu)少新(xin)手,這讓李世石(shi)應對得非(fei)常謹慎(shen),不(bu)時(shi)陷入長考,這讓他在時(shi)間上一(yi)直落(luo)后(hou)。你來(lai)我(wo)往中,黑(hei)37和41兩(liang)步尖沖令人匪夷所思,尤(you)其是(shi)第(di)41手,致目數大(da)虧。中盤階(jie)段(duan),本來(lai)形(xing)勢占(zhan)優(you)的(de)李世石(shi)行棋(qi)過(guo)緩,右(you)上角(jiao)的(de)一(yi)步二(er)路(lu)打拔被視(shi)作(zuo)敗手,阿爾法(fa)圍棋(qi)的(de)優(you)勢逐漸清(qing)晰起來(lai)。在形(xing)勢陷入被動的(de)情況(kuang)下(xia),李世石(shi)下(xia)出(chu)一(yi)手扳的(de)好棋(qi),但幾次轉換(huan)后(hou),黑(hei)棋(qi)還(huan)是(shi)牢牢守(shou)住了領先的(de)局面(mian),而(er)且棋(qi)形(xing)很厚。李世石(shi)雖然(ran)脫(tuo)了幾手,但并無(wu)實質性(xing)改變(bian),最終阿爾法(fa)圍棋(qi)執(zhi)黑(hei)于211手獲勝且優(you)勢明顯(xian),總比分2比0領先。
第三局
第三局:阿爾法圍棋執白中盤(pan)勝李世石(shi)
2016年(nian)3月12日,圍(wei)棋人(ren)機(ji)(ji)大戰(zhan)展(zhan)開第三(san)(san)局(ju)較量。李(li)世(shi)石(shi)執黑(hei)先行,該(gai)局(ju)開始前(qian),還(huan)有棋迷希望李(li)世(shi)石(shi)能夠(gou)實現逆轉,但(dan)阿(a)爾法圍(wei)棋徹底摧(cui)毀了這(zhe)種可能。布局(ju)階段(duan),李(li)世(shi)石(shi)左下(xia)掛角后走(zou)高中(zhong)國流。行不到二十(shi)手,李(li)世(shi)石(shi)局(ju)面就落入下(xia)風。隨后,雙方在左上角展(zhan)開戰(zhan)斗,阿(a)爾法圍(wei)棋對全局(ju)的把(ba)握一如既(ji)往地(di)強大。李(li)世(shi)石(shi)不但(dan)自己的模樣被對手輕松打(da)入,阿(a)爾法圍(wei)棋還(huan)借助戰(zhan)斗在下(xia)邊圍(wei)起一大塊空,局(ju)面看(kan)上去還(huan)不如前(qian)兩盤好看(kan)。隨后的比賽,雖然李(li)世(shi)石(shi)仍然極力抵(di)抗,并且(qie)祭出(chu)劫爭的手段(duan),但(dan)是電(dian)腦精確(que)應對,讓他(ta)無功(gong)而(er)返。到阿(a)爾法圍(wei)棋下(xia)了176手后,李(li)世(shi)石(shi)只有投(tou)子認負。圍(wei)棋人(ren)機(ji)(ji)大戰(zhan)前(qian)三(san)(san)盤人(ren)類三(san)(san)連敗。
第四局
第四局:李世石執白中(zhong)盤勝阿(a)爾法圍棋
2016年3月13日(ri),圍(wei)(wei)棋(qi)人(ren)(ren)機大(da)戰展開(kai)第四局較量(liang)。在(zai)接(jie)連三局負于(yu)“阿爾(er)法(fa)圍(wei)(wei)棋(qi)”后(hou),脫去勝(sheng)負包(bao)袱的(de)(de)(de)李(li)(li)(li)(li)世(shi)石(shi)為榮(rong)譽而戰,終于(yu)迎來了“圍(wei)(wei)棋(qi)人(ren)(ren)機大(da)戰”的(de)(de)(de)首次(ci)(ci)勝(sheng)利。與前(qian)幾局比(bi)賽相比(bi),李(li)(li)(li)(li)世(shi)石(shi)此局更多次(ci)(ci)陷入(ru)了長時(shi)(shi)(shi)(shi)間(jian)思考,導(dao)致(zhi)耗時(shi)(shi)(shi)(shi)過多。在(zai)比(bi)賽進行到(dao)兩個半(ban)小時(shi)(shi)(shi)(shi)后(hou),李(li)(li)(li)(li)世(shi)石(shi)僅(jin)剩下(xia)17分(fen)鐘,比(bi)“阿爾(er)法(fa)圍(wei)(wei)棋(qi)”剩余時(shi)(shi)(shi)(shi)間(jian)足足少1個小時(shi)(shi)(shi)(shi)。但隨(sui)后(hou)李(li)(li)(li)(li)世(shi)石(shi)祭出白78“挖”的(de)(de)(de)妙手,一(yi)場“逆襲(xi)”之戰也由此開(kai)始。阿爾(er)法(fa)圍(wei)(wei)棋(qi)被李(li)(li)(li)(li)世(shi)石(shi)的(de)(de)(de)“神之一(yi)手”下(xia)得陷入(ru)混亂(luan),走出了黑93一(yi)步常理上(shang)的(de)(de)(de)廢棋(qi),導(dao)致(zhi)棋(qi)盤右側一(yi)大(da)片黑子(zi)“全死”。此后(hou),“阿爾(er)法(fa)圍(wei)(wei)棋(qi)”判斷局面對自己(ji)不(bu)利,每步耗時(shi)(shi)(shi)(shi)明(ming)顯增長,更首次(ci)(ci)被李(li)(li)(li)(li)世(shi)石(shi)拖入(ru)讀秒。最終,李(li)(li)(li)(li)世(shi)石(shi)冷(leng)靜收官鎖定勝(sheng)局。到(dao)180手,阿爾(er)法(fa)圍(wei)(wei)棋(qi)中(zhong)盤認輸。
第五局
第五(wu)局:阿爾(er)法圍棋執(zhi)白中盤勝(sheng)李世石
2016年3月15日,圍棋(qi)(qi)(qi)(qi)人機(ji)大(da)戰(zhan)(zhan)展開第五局對(dui)決(jue)。在(zai)上局比賽扳回(hui)一城后,李(li)世(shi)(shi)(shi)石(shi)向阿(a)(a)爾(er)法(fa)(fa)圍棋(qi)(qi)(qi)(qi)團隊提出要(yao)在(zai)末戰(zhan)(zhan)中(zhong)執黑,因為(wei)(wei)他覺(jue)得(de)阿(a)(a)爾(er)法(fa)(fa)圍棋(qi)(qi)(qi)(qi)執黑時發揮并不完美,戰(zhan)(zhan)勝執白的(de)(de)阿(a)(a)爾(er)法(fa)(fa)圍棋(qi)(qi)(qi)(qi)才更(geng)有(you)(you)意義(yi)。執黑的(de)(de)李(li)世(shi)(shi)(shi)石(shi)選擇了穩(wen)健的(de)(de)錯小目、無憂角開局,阿(a)(a)爾(er)法(fa)(fa)圍棋(qi)(qi)(qi)(qi)則以二連星應對(dui)。進入中(zhong)盤,李(li)世(shi)(shi)(shi)石(shi)意圖非(fei)常明顯,以撈(lao)實地為(wei)(wei)主。但(dan)李(li)世(shi)(shi)(shi)石(shi)在(zai)79和81手(shou)(shou)(shou)(shou)(shou)連出緩手(shou)(shou)(shou)(shou)(shou),被視為(wei)(wei)敗招。阿(a)(a)爾(er)法(fa)(fa)圍棋(qi)(qi)(qi)(qi)82靠也并非(fei)好的(de)(de)應手(shou)(shou)(shou)(shou)(shou)。一波錯進錯出后,黑棋(qi)(qi)(qi)(qi)在(zai)87和89手(shou)(shou)(shou)(shou)(shou)再出緩手(shou)(shou)(shou)(shou)(shou),致(zhi)使白棋(qi)(qi)(qi)(qi)左上角的(de)(de)圍剿更(geng)加有(you)(you)力,黑棋(qi)(qi)(qi)(qi)形勢(shi)瞬間坍塌(ta)。此后,占(zhan)據優勢(shi)的(de)(de)阿(a)(a)爾(er)法(fa)(fa)圍棋(qi)(qi)(qi)(qi)展現了它強(qiang)大(da)的(de)(de)中(zhong)后盤計(ji)算能力,鮮有(you)(you)失誤,落(luo)子效率(lv)極高。不過李(li)世(shi)(shi)(shi)石(shi)也并未放棄,連續走出強(qiang)硬應手(shou)(shou)(shou)(shou)(shou),可惜棋(qi)(qi)(qi)(qi)盤下得(de)越來越小,難再覓逆轉機(ji)會。第280手(shou)(shou)(shou)(shou)(shou),李(li)世(shi)(shi)(shi)石(shi)投子認(ren)負。這次圍棋(qi)(qi)(qi)(qi)人機(ji)大(da)戰(zhan)(zhan)的(de)(de)最終比分定格為(wei)(wei)1比4。
賽事影響
對圍棋項目
圍(wei)(wei)棋人(ren)(ren)機大戰(zhan)前,不(bu)(bu)少人(ren)(ren)擔心圍(wei)(wei)棋這(zhe)塊陣地一旦失(shi)守,將(jiang)對整個項(xiang)目產生(sheng)滅頂之災,因(yin)為不(bu)(bu)少人(ren)(ren)或許會產生(sheng)這(zhe)樣的(de)想(xiang)法(fa):號稱棋類智力最頂尖(jian)的(de)圍(wei)(wei)棋也(ye)不(bu)(bu)過爾爾,從而魅(mei)力大減。可實(shi)際的(de)情況卻(que)是恰(qia)恰(qia)相反,很多平(ping)時(shi)不(bu)(bu)關心圍(wei)(wei)棋或者說根本連圍(wei)(wei)棋規則(ze)都(dou)不(bu)(bu)了解的(de)人(ren)(ren),也(ye)因(yin)為人(ren)(ren)機大戰(zhan)開始了解和關心這(zhe)項(xiang)運(yun)動。
圍棋人(ren)機(ji)大(da)戰(zhan)期間,關于(yu)(yu)人(ren)機(ji)大(da)戰(zhan)的(de)(de)報(bao)道充斥(chi)于(yu)(yu)國(guo)內各(ge)種媒體(ti)的(de)(de)“頭條”,風頭完(wan)全(quan)蓋過了(le)足球、籃球這(zhe)些(xie)風靡世界(jie)的(de)(de)運(yun)動;就連圍棋普(pu)及率(lv)極(ji)低的(de)(de)歐美國(guo)家,英國(guo)廣播公司(BBC)、路透社、美聯社這(zhe)些(xie)主流媒體(ti)也對比賽(sai)進(jin)行了(le)詳細報(bao)道,這(zhe)在以往(wang)幾(ji)乎是不可能的(de)(de)。
對人工智能
“人(ren)(ren)(ren)工智(zhi)能(neng)(neng)”這個概念(nian)是人(ren)(ren)(ren)機大戰(zhan)(zhan)最終極的(de)受(shou)益者。圍(wei)棋(qi)人(ren)(ren)(ren)機大戰(zhan)(zhan)前,人(ren)(ren)(ren)工智(zhi)能(neng)(neng)對于普通(tong)人(ren)(ren)(ren)而言(yan)還是那(nei)么“云山霧罩”;圍(wei)棋(qi)人(ren)(ren)(ren)機大戰(zhan)(zhan)后(hou),人(ren)(ren)(ren)們通(tong)過各種報道已(yi)經了解到(dao),人(ren)(ren)(ren)工智(zhi)能(neng)(neng)已(yi)經滲透到(dao)每個人(ren)(ren)(ren)的(de)工作(zuo)和生活中。智(zhi)能(neng)(neng)化服(fu)(fu)務將(jiang)會快速地接(jie)入餐飲、出行、旅游、電(dian)影、教育、醫療等(deng)生活服(fu)(fu)務領域,覆蓋用戶吃、住、行、玩(wan),人(ren)(ren)(ren)工智(zhi)能(neng)(neng)在未來可能(neng)(neng)媲美(mei)人(ren)(ren)(ren)類的(de)專職(zhi)秘書。
阿(a)爾(er)法圍棋最(zui)大(da)的(de)勝利(li)是(shi)為人工(gong)(gong)智(zhi)(zhi)能打造了一場全球性的(de)科普,也代表了高科技(ji)(ji)企業對人工(gong)(gong)智(zhi)(zhi)能技(ji)(ji)術(shu)充滿“野心”的(de)宣告。過去的(de)人工(gong)(gong)智(zhi)(zhi)能只是(shi)存在于實驗室的(de)智(zhi)(zhi)慧探(tan)索;而未來的(de)科學(xue)技(ji)(ji)術(shu),人工(gong)(gong)智(zhi)(zhi)能將是(shi)基礎,是(shi)推動商業與社會發展(zhan)的(de)強大(da)動力。
李世石簡介
李(li)世(shi)(shi)石是李(li)昌鎬之(zhi)后(hou),韓國最具代表性的(de)棋手,他在2003年(nian)獲(huo)第16屆富士通杯(bei)冠(guan)(guan)軍后(hou)升(sheng)為九(jiu)段棋手。自2002年(nian)加(jia)冕富士通杯(bei)以(yi)來,十年(nian)時間里他共獲(huo)18個世(shi)(shi)界冠(guan)(guan)軍。李(li)世(shi)(shi)石屬(shu)于典型(xing)的(de)力戰型(xing)棋風,善于敏銳地抓住對手的(de)弱處(chu)主動出擊(ji)(ji),以(yi)強大的(de)力量(liang)擊(ji)(ji)垮對手,他的(de)攻擊(ji)(ji)可以(yi)用“穩,準,狠”來形容,經常能在劣勢(shi)下(xia)完成逆轉。
AlphaGo2015年10月擊敗歐洲冠軍
谷歌曾于2014年以4億歐(ou)元收購人工智能公(gong)司DeepMind。由DeepMind研發的AlphaGo項目已有兩年歷史,AlphaGo曾在去年戰勝了歐(ou)洲圍棋冠軍樊(fan)麾(職業(ye)二段)。
去年10月5日-10月9日,谷(gu)歌AlphaGo在(zai)比(bi)賽中以5:0的比(bi)分(fen)完勝了(le)歐(ou)洲(zhou)冠軍。除了(le)戰(zhan)勝人類外(wai),AlphaGo還與其他的圍(wei)棋程序對(dui)戰(zhan),獲(huo)得(de)了(le)500場勝利。
AlphaGo原理簡介
傳統的(de)人工智能方法(fa)是將所(suo)有可能的(de)走(zou)法(fa)構建成(cheng)一棵搜索樹 ,但這種方法(fa)對圍棋并不適用。此次谷(gu)歌推出的(de)AlphaGo,將高級搜索樹與深度神經網絡結合在一起。這些神經網絡通過(guo)12個處理層傳遞對棋盤的(de)描述,處理層則包含數百萬個類似于神經的(de)連接點。
其中(zhong)一個神經網(wang)(wang)絡“決(jue)策網(wang)(wang)絡”(policy network)負(fu)責選擇(ze)下一步走(zou)法,另(ling)一個神經網(wang)(wang)絡“值(zhi)網(wang)(wang)絡”(“value network)則預測比賽(sai)勝利(li)(li)方(fang)。谷歌方(fang)面用人類圍(wei)棋(qi)高(gao)手的三(san)千(qian)萬步圍(wei)棋(qi)走(zou)法訓(xun)練神經網(wang)(wang)絡,與此同時(shi),AlphaGo也(ye)自行研究新戰略,在(zai)它的神經網(wang)(wang)絡 之間運行了數(shu)千(qian)局(ju)圍(wei)棋(qi),利(li)(li)用反復試驗調整連接點,這個流程也(ye)稱為鞏固學習(reinforcement learning)。通(tong)過廣泛使用Google云平(ping)臺,完成了大量研究工(gong)作。
AlphaGo在與人的對弈中用(yong)了“兩個(ge)大腦(nao)”來解決問題(ti):“決策(ce)網絡(luo)”和(he)“值網絡(luo)”。通(tong)俗來說就是,一(yi)個(ge)大腦(nao)用(yong)來決策(ce)當前(qian)應該如何落(luo)子,另一(yi)個(ge)大腦(nao)來預(yu)測比賽(sai)最終的勝利方。
值(zhi)得一(yi)提的(de)是(shi),李世石(shi)也是(shi)第(di)一(yi)次與(yu)機(ji)器對(dui)戰(zhan),所(suo)以他無法像和人(ren)類對(dui)戰(zhan)那樣(yang),先研究對(dui)方的(de)棋(qi)譜和下棋(qi)風格。李世石(shi)所(suo)能(neng)做的(de)就是(shi)和自(zi)己對(dui)弈(yi)。谷歌AlphaGo也是(shi)通過(guo)這種方式鍛煉自(zi)己,真正做到了“人(ren)工智能(neng)”。
李世石之后 谷歌AlphaGo還會挑戰誰?
谷歌(ge)旗下DeepMind創(chuang)始人(ren)哈薩比(bi)斯曾表示,還有很(hen)多(duo)實力(li)很(hen)強的選手,所以這次比(bi)賽之后,也(ye)許也(ye)會(hui)去中(zhong)國、日本,與當地高手切(qie)磋棋藝(yi)。
中國圍(wei)棋圍(wei)棋九段柯潔也對此表示了(le)興趣(qu),昨天AlphaGo戰勝李世石后(hou),他發微博稱,“就算阿法狗戰勝了(le)李世石,但它贏不(bu)了(le)我”,并(bing)且還(huan)置(zhi)頂了(le)該微博。
并且他(ta)來頭也不小(xiao),柯潔(jie)自述(shu),“現在暫(zan)時是(shi)世界(jie)圍棋第一人(ren)(特地用(yong)(yong)了暫(zan)時,謙虛是(shi)美德(de))正式比賽我是(shi)單盤(pan)8:2碾壓李(li)世石(shi)(他(ta)贏得(de)(de)這(zhe)兩盤(pan)沒有任何作(zuo)用(yong)(yong))世界(jie)冠軍獲得(de)(de)過三次(此年齡如此成績前無古人(ren))”。