你的位置:首頁(yè)攻略教程軟件教程 → 李世石alphago人機(jī)大戰(zhàn)第二回合分析

李世石alphago人機(jī)大戰(zhàn)第二回合分析

來(lái)源:本站整理時(shí)間:2016/3/11 14:19:28作者:WangYK點(diǎn)擊: 0 評(píng)論:0

alphago在人機(jī)大戰(zhàn)的第二回合也取得了勝利,這讓很多人都感受到了人工智能的強(qiáng)大,那么在第二回合中究竟是alphago用了奇招還是李世石出現(xiàn)了失誤呢?下面小編就為大家詳細(xì)分析一下人機(jī)大戰(zhàn)的第二回合戰(zhàn)況。

李世石alphago人機(jī)大戰(zhàn)第二回合分析

之前大家認(rèn)為末盤(pán)官子肯定是Alphago強(qiáng),中盤(pán)55開(kāi)(因?yàn)槿祟?lèi)不可避免會(huì)失誤),小李的機(jī)會(huì)只在開(kāi)盤(pán)布局。如果開(kāi)盤(pán)沒(méi)有積累足夠的優(yōu)勢(shì),根本沒(méi)有中盤(pán)、尾盤(pán)的機(jī)會(huì)。但是兩盤(pán)下來(lái),中盤(pán)、尾盤(pán)alphago全面壓制,開(kāi)盤(pán)布局更像是alphago的強(qiáng)項(xiàng)。

從第二局來(lái)看,alphago已經(jīng)不拘泥于棋譜的表現(xiàn)了,經(jīng)常走出一些超出定式的具有新意的下法,但是從柯潔的現(xiàn)場(chǎng)點(diǎn)評(píng)來(lái)看,仔細(xì)分析沒(méi)有一手是問(wèn)題手,大多數(shù)都是可以接受的。

開(kāi)盤(pán)小李左下實(shí)地占優(yōu),眾多點(diǎn)評(píng)都說(shuō)此局穩(wěn)贏了,但是真的是優(yōu)勢(shì)么?白取實(shí)地黑取外勢(shì),職業(yè)棋手的感覺(jué)是白子獲利,但是如果是職業(yè)棋手的判斷出問(wèn)題了呢?外勢(shì)為虛,是因?yàn)橹斜P(pán)存在巨大變數(shù),是否能將外事轉(zhuǎn)化為實(shí)力,是要雙方棋手拼殺計(jì)算決定的,人力是無(wú)法計(jì)算到中盤(pán)的細(xì)微之處的,但是如果電腦能呢?如果電腦的計(jì)算能力已經(jīng)可以完成中盤(pán)局勢(shì)的評(píng)估了呢?

局勢(shì)的評(píng)估是開(kāi)局布局的關(guān)鍵,也是蒙特卡洛法的關(guān)鍵。如果能評(píng)估最優(yōu)、勝率最大的點(diǎn),照著這些點(diǎn)平A就贏了。柯潔往往能先于其他直播解說(shuō)發(fā)現(xiàn)"畫(huà)風(fēng)不對(duì)",“小李子有危險(xiǎn)”,確實(shí)表現(xiàn)出高出他人的實(shí)力。但是試想到中局混戰(zhàn)的時(shí)候,柯潔也會(huì)簡(jiǎn)單的擺一擺,飛速的點(diǎn)目評(píng)估一下場(chǎng)上的局勢(shì),這不TM實(shí)際上就是蒙特卡洛方法么?柯潔再快,也不過(guò)是五十步笑百步的區(qū)別,跟alphago不可同日而語(yǔ),alphago一秒鐘內(nèi)不知道已經(jīng)算完了多少種變化,評(píng)估了多少局勢(shì)了。

因此,開(kāi)局的某些定式,可能僅僅是人類(lèi)計(jì)算能力不足而妥協(xié)的結(jié)果。想想從古至今,多少定式被后來(lái)的棋手推翻,建立起新的定式?古人打過(guò)多少譜,現(xiàn)在的職業(yè)棋手每年打過(guò)多少譜,推翻舊的定式建立新的定式不難理解,那么想一想alphago一天就能打幾萬(wàn)個(gè)譜,推翻我們現(xiàn)在的定式不是理所當(dāng)然的么?!

這已經(jīng)很恐怖了!!!alphago看李世石今天擺出的定式,可能好像我們看幾百年前甚至幾千年前流失的古譜一樣,夢(mèng)里都能笑醒了好么?事實(shí)也是如此,布局到定式一半果斷脫先,李世石連完成定式的勇氣都沒(méi)有,只能以虛對(duì)虛。柯潔和一些解說(shuō)都說(shuō)要完成定式教alphago做人,但是真走下去恐怕也占不到便宜。當(dāng)然脫離自己的開(kāi)局,放棄“定式”的優(yōu)勢(shì),和計(jì)算機(jī)拼計(jì)算力搏中期,也沒(méi)有什么機(jī)會(huì),就像今天這樣,輸?shù)靡埠茈y看。

所以結(jié)論很簡(jiǎn)單,開(kāi)局、中盤(pán)、收官,alphago全面壓制,甚至兩盤(pán)都沒(méi)有收官的必要,alphago官子也肯定不會(huì)留下任何的機(jī)會(huì)。完敗,沒(méi)有任何余地。小李子之后的采訪也承認(rèn)完敗。

還有更恐怖的可能:從alphago開(kāi)局脫先開(kāi)始,李世石就走上了敗局。如前所說(shuō),職業(yè)選手看起來(lái)差不多的著法,alphago可不是這么看的,再接近的著法對(duì)于之后的勝率也是不一樣的。人類(lèi)是看不出來(lái)的,和人對(duì)決也不在乎,反正對(duì)手也覺(jué)得差不多,稀里糊涂就到中盤(pán)拼殺好了。alphago卻是在開(kāi)局積累勝勢(shì)的,哪怕1手只強(qiáng)1%,開(kāi)局20手下來(lái),利滾利的優(yōu)勢(shì)也是嚇?biāo)廊说模膳碌娜祟?lèi)棋手還可能渾然不覺(jué),甚至占了一些實(shí)地小利覺(jué)得自己占優(yōu)勢(shì)呢。什么時(shí)候看出來(lái)那是棋力的差距了,能看出來(lái)也不見(jiàn)得來(lái)得及翻,畢竟已入中盤(pán),變化復(fù)雜,計(jì)算力的優(yōu)勢(shì)更大。

所以小李子還是做出了應(yīng)對(duì)的,從開(kāi)局布局就投入了比上一局多得多的時(shí)間和精力,花費(fèi)了大量的計(jì)算。左下角的處理是職業(yè)棋手見(jiàn)到都不會(huì)放過(guò)的,但是我真的懷疑alphago根本不在乎局部的得失。再重復(fù)一遍,這樣的下法是建立在中期強(qiáng)大計(jì)算力上的,人類(lèi)模仿這種下法就是東施效顰了,想都不敢想。沒(méi)有了定式的輔助,沒(méi)有了經(jīng)驗(yàn)的幫助,和幾百萬(wàn)盤(pán)的計(jì)算機(jī)拼棋感,真的是難。

中盤(pán)alphago展現(xiàn)了多線作戰(zhàn)的強(qiáng)大能力。經(jīng)常毫不講理的脫先,下一些奇怪的選點(diǎn)。脫先還是歸功于強(qiáng)大的局勢(shì)判斷能力。舉個(gè)例子,A戰(zhàn)場(chǎng)投子價(jià)值10,B戰(zhàn)場(chǎng)價(jià)值15,但是B戰(zhàn)場(chǎng)搏殺幾輪后因?yàn)榭臻g減小,局勢(shì)趨于確定價(jià)值在逐漸減少,當(dāng)B戰(zhàn)場(chǎng)價(jià)值9的時(shí)候,按人類(lèi)的標(biāo)準(zhǔn)可能還是必應(yīng)的一手,alphago毫不猶豫就脫先了,甚至A戰(zhàn)場(chǎng)價(jià)值下降到7再轉(zhuǎn)回B戰(zhàn)場(chǎng),甚至奔向同樣價(jià)值9的C戰(zhàn)場(chǎng)。這就逼迫小李子進(jìn)入到了alphago的行棋節(jié)奏,被迫同時(shí)雙線、甚至多線作戰(zhàn),這對(duì)于人類(lèi)棋手捉襟見(jiàn)肘的記憶力、計(jì)算力無(wú)疑是雪上加霜,對(duì)狗來(lái)說(shuō)卻根本不是事。該棄的子果斷棄,只要從其他地方獲得更大的利益,而人類(lèi)渾然不覺(jué)。尾盤(pán)的幾手就有這樣的表現(xiàn),在結(jié)束剛開(kāi)始會(huì)出現(xiàn)一些很賤的行棋順序,關(guān)鍵棋中走出幾手莫名其妙的,小李又不得不應(yīng)的棋,再回頭繼續(xù)原來(lái)的行棋。這就是計(jì)算機(jī),這就是程序,一絲不茍的完成勝率最大的行棋。

所以存在著這樣一種可能,從某一刻開(kāi)始,小李子想贏alphago就只剩下為數(shù)不多的幾種選擇,困難的不止是在多種變化中找出最后的正解,而且要找出正解的順序。這些順序可能包括在多個(gè)戰(zhàn)場(chǎng),走錯(cuò)一步,alphago都可能脫先,走出尖沖五路的妙手。這對(duì)于人類(lèi)選手來(lái)說(shuō)都沒(méi)有在有限時(shí)間內(nèi)解出的可能。小李子用時(shí)明顯比第一局多了很多,用時(shí)也比alphago多,燒腦燒到這種程度,早晚會(huì)失誤的。不是打拔的弱手,也是其他的弱手,早晚會(huì)"失誤“的。

當(dāng)中局面對(duì)變化時(shí),當(dāng)面對(duì)眾多選擇沒(méi)法抉擇最優(yōu)點(diǎn)的時(shí)候,靜靜的等待alphago先手進(jìn)攻的時(shí)候,勝利的天平已經(jīng)傾斜了。無(wú)論你復(fù)盤(pán)的時(shí)候覺(jué)得哪手有問(wèn)題,也不代表你能走出更強(qiáng)手,甚至說(shuō)不定當(dāng)時(shí)在alphago眼中,已經(jīng)是無(wú)解的變化了。哪怕是復(fù)盤(pán),人類(lèi)也不能擺出所有的可能。所以往往看來(lái)覺(jué)得alphago平平無(wú)奇,沒(méi)有妙手,但是就是沒(méi)有攻擊、翻盤(pán)的點(diǎn)。輸都不知道怎么輸?shù)摹=^望。

尾盤(pán)就不說(shuō)了,不可能輸給人類(lèi)的。

善戰(zhàn)者無(wú)赫赫之功。alphago在棋盤(pán)上展現(xiàn)出了強(qiáng)大的統(tǒng)治力。

李世石最后堅(jiān)持著把最后的布局下完,我只能想到兩個(gè)字:悲壯。李世石在人類(lèi)看來(lái)是捍衛(wèi)人類(lèi)最高智力棋類(lèi)的先烈,在alphago里眼里不過(guò)是自我完善路上的一塊墊腳石。戰(zhàn)勝小李可能是一個(gè)時(shí)代的終結(jié),對(duì)于AI來(lái)說(shuō)是一個(gè)更廣闊的開(kāi)始。

在最后的“垃圾時(shí)間”中,我們還是從中了解出alphago的一些特點(diǎn),甚至是“弱點(diǎn)”。從每步的用時(shí)可以一窺alphago的“情緒波動(dòng)”,莫名其妙的騰挪和騾子順序展現(xiàn)出其超常的價(jià)值評(píng)價(jià)體系。其弱點(diǎn)可能還是在于劫財(cái)?shù)奶幚恚貏e是“連環(huán)劫”這種無(wú)限循環(huán)的可能對(duì)于蒙特卡洛方法來(lái)說(shuō)可能是一個(gè)盲點(diǎn),至少在劫財(cái)?shù)膬r(jià)值判定和計(jì)算用時(shí)上來(lái)說(shuō)對(duì)于計(jì)算機(jī)來(lái)說(shuō)還是存在一些問(wèn)題。也許保密協(xié)議中真的有“不能打劫”之類(lèi)的規(guī)定,可能是一個(gè)“阿奇琉斯之踵”。但是瑕不掩瑜,歷史的車(chē)輪已經(jīng)碾過(guò)了。

最后評(píng)價(jià)一句:李世石的表現(xiàn)無(wú)愧于職業(yè)棋手,無(wú)愧于曾經(jīng)的世界最強(qiáng)。被alphago完敗是他的不幸,甚至一蹶不振;和alphago對(duì)戰(zhàn)也是他的幸運(yùn),以這樣一種方式載入史冊(cè)。

戰(zhàn)后感想

現(xiàn)在職業(yè)棋手判斷形勢(shì)的算法,有明顯漏洞。

職業(yè)棋手判斷形勢(shì)的算法大致可以概括成一句話:估算雙方的目數(shù)(地盤(pán)大小)差距。

那如果地盤(pán)的邊界沒(méi)有完全確定怎么辦呢?如果有先手官子就判給先手方,如果是雙方后手官子就算一人一半。

那么有一些模糊的地方,比如說(shuō)一塊厚勢(shì)折算成幾目呢?這個(gè)就只能憑感覺(jué)了。

今天看各個(gè)平臺(tái)的解說(shuō),大概是柯潔的判斷最準(zhǔn)確。柯潔在中盤(pán)階段就點(diǎn)出黑棋盤(pán)面15目左右。古力一度判斷小李優(yōu)勢(shì),甚至到官子不多的時(shí)候還認(rèn)為是細(xì)棋。金明完也差不多。麥克雷蒙的判斷沒(méi)有仔細(xì)聽(tīng),好像比古力要準(zhǔn)一點(diǎn)。羋昱廷在128手的時(shí)候認(rèn)為還是細(xì)棋(這個(gè)時(shí)候柯潔已經(jīng)判斷黑棋明顯領(lǐng)先了)。圍棋TV的完全沒(méi)有看,請(qǐng)各位補(bǔ)充。

暫且不論到底是誰(shuí)的判斷更準(zhǔn),我們可以簡(jiǎn)單看一下白128手時(shí)候各方的判斷。有柯潔說(shuō)黑棋領(lǐng)先一個(gè)貼目,也有說(shuō)細(xì)棋的,甚至有說(shuō)白棋小優(yōu)的。這些職業(yè)棋手對(duì)同一局面判斷上的分歧居然能超過(guò)一個(gè)貼目!這恰好證明了上述算法模糊之處可能產(chǎn)生的巨大誤差。

那么我們思考一下誤差可能產(chǎn)生在何處。第一,先手官子判給先手方。然而在棋盤(pán)上,“先手”是個(gè)相對(duì)概念,逆收官子屢見(jiàn)不鮮。甚至在有些情況下,面對(duì)“絕先”,奮力一搏選擇脫先他頭也不少見(jiàn)。第二,模糊判斷。這個(gè)問(wèn)題更大。職業(yè)棋手對(duì)一塊棋厚薄判斷的分歧,很可能導(dǎo)致點(diǎn)目結(jié)果的南轅北轍。

AlphaGo是如何做形勢(shì)判斷的呢?AlphaGo策略組合的其中一部分是價(jià)值網(wǎng)絡(luò)。這一部分的原理以我的水平解釋不清楚。為了方便理解,我們考慮前一代AI,Zen的判斷方式:通過(guò)大量的隨機(jī)采樣估算“勝率”。打個(gè)比方,一盤(pán)棋下到120手。在這個(gè)時(shí)候AlphaGo隨機(jī)落子完成一盤(pán)棋,然后判斷哪一方在這個(gè)隨機(jī)完成的一盤(pán)棋中獲勝。重復(fù)這個(gè)流程多次,比如說(shuō)十萬(wàn)次,然后其中三萬(wàn)次黑勝,七萬(wàn)次白勝,那么估算出白方的勝率就是70%。

當(dāng)然,AlphaGo的價(jià)值網(wǎng)絡(luò)比Zen的方式要先進(jìn)很多,讓估算的勝率更加準(zhǔn)確。

感謝評(píng)論區(qū) @劉嘉耿 的補(bǔ)充:

AlphaGo并非完全隨機(jī)地模擬剩下的棋局,而是參照了之前的棋譜用落子選擇器找出最有可能的幾個(gè)點(diǎn),保證速度

從效果上來(lái)看,估算勝率的效果其實(shí)非常好。而且我認(rèn)為,這樣的判斷方法是本質(zhì)的。

為什么?首先要明確,雖然理論上來(lái)說(shuō),某一個(gè)局面下,要么是黑方必勝,要么是白方必勝。然而,由于圍棋事實(shí)上無(wú)法被窮舉,只能退而求其次估算概率,或者像人類(lèi)棋手一樣估算雙方相差的目數(shù)。然而,在很多情形下,相差多少目數(shù)是沒(méi)有意義的。

舉個(gè)例子(此處應(yīng)該有圖),黑方確定目數(shù)70目,沒(méi)有潛力。白方確定目數(shù)40目,有一塊40目潛力的大空。如果黑方立即打入并活出,則40目的潛力只能轉(zhuǎn)化成10目的實(shí)地,黑方獲勝。如果黑方打入失敗,則白棋40目大空圍成,白方獲勝。黑棋也可以選擇保守的淺消,則白方的40目潛力大約能轉(zhuǎn)換為25目實(shí)地。這個(gè)局面下,如果選擇淺消,雖然最后差距會(huì)縮小,然而其實(shí)勝機(jī)也很少。很遺憾,這種局面下,職業(yè)棋手很難準(zhǔn)確估算打入成活的概率,然而AlphaGo可以。于是心存幻想的人類(lèi)棋手覺(jué)得落后不多,而打入無(wú)成算,選擇淺消白棋大空,結(jié)果白方40目的潛力轉(zhuǎn)化成25目實(shí)地,黑棋盤(pán)面僅多5目,從而落敗。阿爾法狗估算出選擇打入的勝率是40%,而選擇淺消勝率僅為25%,于是毅然選擇打入。不論最后勝負(fù)如何,選擇打入顯然是更好的策略。

換句話說(shuō),只“領(lǐng)先兩目”而勝率80%,和“領(lǐng)先五目”而勝率70%,其實(shí)是前者優(yōu)勢(shì)更大,然而人類(lèi)會(huì)認(rèn)為后者優(yōu)勢(shì)更大。這或許是人類(lèi)棋手的命門(mén)所在。

可嘆的是,人類(lèi)不可能通過(guò)大量隨機(jī)采樣來(lái)估算勝率。

針對(duì)評(píng)論,補(bǔ)充一點(diǎn)吧。評(píng)論區(qū)說(shuō)古力是故意模糊判斷形勢(shì),實(shí)際上他是點(diǎn)清楚了的。也許有這個(gè)成分在里面。但是,我作為一個(gè)常年在各大平臺(tái)看圍棋直播的棋迷,經(jīng)常能看到對(duì)于同一盤(pán)棋的同一個(gè)局面,一個(gè)解說(shuō)認(rèn)為黑領(lǐng)先,另一個(gè)解說(shuō)認(rèn)為白領(lǐng)先的情況。而且這倆解說(shuō)都是頂尖職業(yè)。事實(shí)上職業(yè)棋手并不能準(zhǔn)確判斷形勢(shì),即使是在中盤(pán)階段末期。

以上就是關(guān)于李世石alphago人機(jī)大戰(zhàn)第二回合的分析了,大家如果對(duì)第二回合還意猶未盡,可以下載復(fù)盤(pán)軟件重新觀看和分析,今天的介紹就到這里,更多關(guān)于本次人機(jī)大戰(zhàn)的內(nèi)容請(qǐng)關(guān)注5577我機(jī)網(wǎng)。

Alphago李世石直播騰訊視頻手機(jī)版
10.0
類(lèi)別: 播放器.視頻.音樂(lè)    
大小:79.8M    
語(yǔ)言: 中文
更新: 3-11

點(diǎn)擊下載 >>

游客評(píng)論

熱門(mén)評(píng)論

最新評(píng)論

發(fā)表評(píng)論 查看所有評(píng)論(0)

(您的評(píng)論需要經(jīng)過(guò)審核才能顯示) 字?jǐn)?shù): 0/500

本周熱門(mén)

找游戲 下應(yīng)用

排行榜

游戲軟件破解

推薦手機(jī)游戲?qū)^(qū)

關(guān)于安卓網(wǎng) | 聯(lián)系方式 | 發(fā)展歷程 | 下載幫助(?) | 廣告聯(lián)系 | 網(wǎng)站地圖 | 友情鏈接

Copyright 2011-2014 5577.com安卓網(wǎng) 鄂ICP備15005058號(hào)-1