你的位置:首頁新聞業界新聞 → 谷歌alphago和李世石的比賽棋譜分析

谷歌alphago和李世石的比賽棋譜分析

來源:本站整理時間:2016/3/11 18:10:20作者:CRL點擊: 0 評論:0

谷歌alphago和李世石的比賽棋譜吸引了不少的圍棋愛好者,通過觀察此次AlphaGo圍棋VS李世石的棋譜,可以看出,人工智能還是比較強大的,下面來一起看下谷歌alphago和李世石的比賽棋譜精彩對局吧。

比賽采用5局3勝制,最終比賽獲勝方將獲得獎金100萬美元。李世石在本輪戰敗后,只有剩下3局全部獲勝才能以3:2總比分戰勝AlphaGo,而AlphaGo下一局只需獲勝即可宣布戰勝李世石。

剩余賽程如下(北京時間中午12點開賽):

第三場比賽:3月12日(周六)

第四場比賽:3月13日(周日)

第五場比賽:3月15日(周二)

終盤畫面,有網友說黑棋像個“死”字

在剛剛結束的人機圍棋大戰中,李世石再一次輸給了谷歌的AlphaGo。目前來看,總體形勢不容樂觀,有可能李世石會連敗五局。而機智的網友們馬上開始發揮P圖本領,通過棋譜來對可憐的小李子進行嘲諷。

▲這張圖說AlphaGo在嘲諷小李子是一個弱雞。


▲這兩張棋譜寫著李世石今天一定會輸,因為寫著今天我死。

網友嘲諷歸嘲諷,但是李世石的實力還是毋庸置疑的。作為韓國最強棋手,李世石九段還是具有很大的實力的。希望小李子調整好心態,勇敢地面對接下來的三場對AlphaGo的比賽。

AlphaGo贏了,但我找到了它的兩個“弱點”

谷歌人工智能(AI)程序AlphaGo圍棋逆轉戰敗李世乭九段的消息讓人頗為震驚,大呼“最后的驕傲”也喪失了。確實,在很多事情上,人工智能都能夠代替人類來完成。但就今天這局“世紀圍棋”之戰來說, 勝負在棋盤之外。或者說,AlphaGo的勝利并沒有神奇到可以說“人工智能戰勝人類”。

一、計算力強勢碾壓

在AlphaGo的系統上,開發團隊使用了更大的計算機網絡——包括170個GPU和1200個標準CPU。結合蒙特卡洛搜索算法,AlphaGo能夠看到的可能性走法清晰而全面,純計算的方式同時避免了失誤的可能。計算機一分鐘的計算量(實戰中AlphaGo前期步時約1分鐘),人腦也許需要半小時甚至更多。

而據搜狗CEO表示,如今AlphaGo的配置已有了極大的改善,其中GPU達到2000以上。也就是說,AlphaGo擁有了這個先決的優勢條件,在走子上的表現也不足為奇。在Alphago之前,也已經有多種純計算軟件戰勝棋力高強的人類選手。

從今天的對局來看,AlphaGo(執白)非常擅長近身肉搏,可見其局部計算之精密。

二、不懂大局謀劃,形勢判斷仍未突破

AlphaGo和李世乭今天的對局中,前期李世乭使用大規模布局的作戰方式,形勢上偶有領先。但是,形勢屬虛,在后來近身肉搏的過程中,AlphaGo比李世乭要兇猛。比如下圖,黑棋在左下方定型時,白子回到上方挑事,非常頑強,所以黑子才會被白子挖走一塊又一塊。

但是,這樣說明計算機程序對于布局還沒學會。布局變數比應著要多,形勢要虛,判斷依賴棋感。在這一點上,AlphaGo仍然體現出了電腦的弱點。古力九段表示,AlphaGo對厚勢(外勢)的判斷沒有搞清楚。

而恰好,李世乭的強項和弱項都和AlphaGo的特性對上了。“中國圍棋第一人”柯潔九段分析稱:“李世乭的強項是后半盤的翻盤能力,布局則是李世乭最差的地方,判斷力也不是太好,這對于AlphaGo來說是個重大利好,因為計算機一般來說也是強在后半盤。”

三、AlphaGo在進取,但更多的是反應

到了中盤,盡管黑方已經定勢,但AlphaGo非常進取,以致黑方未能坐實優勢。這是AlphaGo表現優秀的一面。因為按理說,要破這種形勢需要找到最優的妙手,可見AlphaGo的蒙特卡洛搜索算法的準確度有了極大的提高。

不過, AI目前只能在特定場景下,遵循規則產生特定的結果。在此對局中,AlphaGo雖然執白屬后手,但基本無法搶得先手,也很少能夠主導局面形勢的變化,更多的是順著對方走,直到對手失誤。

曹大元九段在對局結束時表示,AlphaGo的表現令人吃驚,但人工智能與人類本質上還沒有分出勝負。就弈棋而言,低手比棋譜,強手比計算,高手比棋理。

我們不能否認AlphaGo在人工智能上取得的突破,人工智能的復雜性和艱巨性不言而喻,它的每一小步都意味著人類科學邁出的一大步,即便它還是這么“蠢”,我們仍為它歡欣鼓舞。

圖片來源:弈客直播

本人作為一名圍棋愛好者,就此發表了一些個人見解,不喜勿噴,也歡迎交流。

【AlphaGo分析】

AlphaGo簡介

AlphaGo去年10月擊敗歐洲冠軍

谷歌曾于2014年以4億歐元收購人工智能公司DeepMind。由DeepMind研發的AlphaGo項目已有兩年歷史,AlphaGo曾在去年戰勝了歐洲圍棋冠軍樊麾(職業二段)。

去年10月5日-10月9日,谷歌AlphaGo在比賽中以5:0的比分完勝了歐洲冠軍。除了戰勝人類外,AlphaGo還與其他的圍棋程序對戰,獲得了500場勝利。

AlphaGo原理簡介

傳統的人工智能方法是將所有可能的走法構建成一棵搜索樹 ,但這種方法對圍棋并不適用。此次谷歌推出的AlphaGo,將高級搜索樹與深度神經網絡結合在一起。這些神經網絡通過12個處理層傳遞對棋盤的描述,處理層則包含數百萬個類似于神經的連接點。

其中一個神經網絡“決策網絡”(policy network)負責選擇下一步走法,另一個神經網絡“值網絡”(“value network)則預測比賽勝利方。谷歌方面用人類圍棋高手的三千萬步圍棋走法訓練神經網絡,與此同時,AlphaGo也自行研究新戰略,在它的神經網絡 之間運行了數千局圍棋,利用反復試驗調整連接點,這個流程也稱為鞏固學習(reinforcement learning)。通過廣泛使用Google云平臺,完成了大量研究工作。

AlphaGo在與人的對弈中用了“兩個大腦”來解決問題:“決策網絡”和“值網絡”。通俗來說就是,一個大腦用來決策當前應該如何落子,另一個大腦來預測比賽最終的勝利方。

值得一提的是,李世石也是第一次與機器對戰,所以他無法像和人類對戰那樣,先研究對方的棋譜和下棋風格。李世石所能做的就是和自己對弈。谷歌AlphaGo也是通過這種方式鍛煉自己,真正做到了“人工智能”。

關于這盤棋,會有很多解讀。不止在今天,甚至在數十年之后,這盤棋還可能會被拿出來研究,從棋譜上,更從人機不同的思維上。不論未來回看這盤棋的是人類還是真正有了自我意識的AI,想必都會有與當下的我們不同的感受。而我們有義務把我們的感受和思考記錄下來,讓后人知道當時的人究竟是如何理解這盤棋,他們有哪些錯誤的認識、可笑的想法,又有哪些深刻的洞察。

我們來看看,今天這盤棋,究竟發生了什么。這盤棋可能將是有史以來職業棋手最難以統一意見的對局,以下觀點是我個人見解,只是在圍棋AI時代毫無預兆迅猛而來時,一名棋手盡可能理性的分析和思考。

一、李世石的針對性策略

從棋譜來看,我認為李世石在這盤棋前后主要使用了一個試探,和兩個策略。

1)試探:從未出現過的布局

棋譜復盤人機大戰

李世石第7手,沒有按常規布局在上邊連片,而選擇走在右邊。李世石自己在職業比賽中從未使用過這一開局,甚至整個職業圍棋界,沒有人見過這一開局。

李世石不按常規布局,顯然是對電腦的一種試探。在去年10月AlphaGo對樊麾的五盤棋中,所有開局都是常規布局,雖然那五盤的開局在今天已經不是主流,但都是曾經流行一時的布局。

避開流行布局,甚至避開曾經流行過的已經被淘汰的布局,選擇一個從未出現過的布局。李世石在考驗AlphaGo在布局階段的應變能力。我們知道AlphaGo的深度學習基于大量已有對局的數據,那么,面對一個棋譜庫里從未見過的布局,AlphaGo你將如何應對?

AlphaGo給出了完美的回答。

棋譜復盤人機大戰

白8掛角正常,黑9二間高夾最為激烈。白10,這一手……非常出色。

通常情況下,在右上白8遭遇二間高夾的時候,白10是“不存在”的一手,它不在任何定式之中。面對黑9,白棋有諸多定式選擇,卻沒有白10這一手。

然而,我認為白10是好手。

白10的好處在于使黑7變成效率低下的一手,雖然在右上局部白棋稍稍虧損,但加上黑7的低效,白棋一點也不吃虧。

AI竟然會通盤考慮!傳統的圍棋AI,會根據已有棋譜來走定式,定式是經過長期檢驗的局部雙方可以接受的定型。然而定式的弊端就在于,不同的周圍環境,定式的適用性有所不同。從這盤棋來看,黑9夾擊之后,白棋如果選擇面對二間高夾最常用的“妖刀”定式,即走在15位,反而將使黑7的位置成為絕對的好點,黑7的效率將會大大提升。

實戰白棋選擇了一個定式里沒有的、局部稍虧的、卻使得黑7這個遙遠棋子的效率變低的下法,非常清楚地證明了兩點:

電腦不依靠背譜來下棋

電腦的考慮基于全局而非局部。

當然,第一點其實在對樊麾的棋譜中已經可以看出來。在對樊麾的常規開局中,AI出現了數次不同于“譜著”的下法。其中有一盤出現“大雪崩”定式,電腦選擇的次序是定式和棋譜里沒有的,而且是從邏輯上不如譜著的。注意,這里強調是邏輯上不如譜著,而不是在經驗上。即,AI當時的次序是“絕對弱于”譜著,只可能虧沒可能便宜,雖然選點是正確的,但在我們看來是“次序錯誤”。這體現出,AlphaGo不依賴于定式和譜著,但也暴露出AI在邏輯上的不足,反應在棋盤上就可能會出現次序錯誤。這一點,也是棋手普遍不看好AI能戰勝李世石的一個原因。

但這一問題在這盤棋我們并沒有看到。起碼,沒有非常明顯地顯現出來(后面會提到一個細微的類似問題)。

而第二點則是這盤棋AI開局給我們秀出的能力。他輕易擺脫了李世石設下的定式圈套,以全局的視野作出了定式中不存在的選擇。

如果說第一點是我們在AlphaGo對樊麾時已經能夠看到的情況,那么第二點則是這局棋在布局階段對人類試探的完美答復。如果只依靠大量棋譜堆砌出來的局部圖像識別,AI做不出這樣的選擇。

AlphaGo第三場直播地址匯總 李世石第三場會贏嗎 

谷歌alphago智能圍棋軟件能下載嗎 AlphaGo圍棋下載地址

AlphaGo李世石人機大戰視頻直播地址匯總 

谷歌alphago是什么

李世石人機大戰第三局棋譜視頻解說直播地址 

游客評論

熱門評論

最新評論

發表評論 查看所有評論(0)

(您的評論需要經過審核才能顯示) 字數: 0/500

本周熱門

找游戲 下應用

排行榜

游戲軟件破解

關于安卓網 | 聯系方式 | 發展歷程 | 下載幫助(?) | 廣告聯系 | 網站地圖 | 友情鏈接

Copyright 2011-2014 5577.com安卓網 鄂ICP備15005058號-1