你的位置:首頁問題答疑軟件答疑 → 谷歌alphago是什么

谷歌alphago是什么

來源:本站整理時間:2016/3/11 11:21:28作者:GML點擊: 0 評論:0

文章標簽: 谷歌alphago

谷歌alphago最近相信已經被身邊的朋友和網絡給刷屏了,在兩次圍棋大戰中幾乎到達了頂峰,但是仍舊有不少親們相信并不是很清楚這個是什么意思?下面小編就為大家簡單的帶來相關說明吧!

李世石比賽輸了,人工智能逆襲了?人類真的敗給人工智能了嗎?

接下來,就讓我們了解一下,這個逆天的谷歌人工智能AlphaGo到底是為何物?

1936年,艾倫·圖靈提出了一種可以輔助數學研究的機器(后來被稱為“圖靈機”),80年過去了,人類在人工智能領域已經取得突飛猛進的發展。上世紀90年代,IBM超級計算機“深藍”擊敗國際象棋世界冠軍,引發了“電腦是否超越人腦”的熱議。然而,圍棋因其變化莫測的招式成為了AI(Artificial Intelligence,人工智能)難以攻克的“禁地”。當然,這個世界總有“不信邪”的人。DeepMind開發的AI程序AlphaGo,擊敗了歐洲圍棋冠軍樊麾。

AlphaGo是什么來歷?

起初,DeepMind是英國的一家小型人工智能公司,專精于深度學習和分析建模領域,在2014年被谷歌收購。這家公司的創始人名叫德米斯·哈薩比斯(Demis Hassabis),他擁有劍橋大學和倫敦大學學院的計算機科學和認知神經科學學位,還是一位國際象棋大師。從外表上來看,“學生氣”的哈薩比斯很普通,但是其對AI的見解和愿景改變了很多的看法,其中就包括著名物理學家史蒂芬·霍金。一直以來,霍金總是傾向于“AI威脅論”,認為智能機器終有一天會威脅人類的安全。不過在與哈薩比斯長談了4個小時之后,霍金似乎轉變了態度。

介紹完DeepMind的負責人,我們把目光轉回到AlphaGo。事實上,AlphaGo成名已久,曾經先后與Crazy Stone和Zen(兩款知名圍棋程序)進行了500局對弈,僅有一局失利。此外,其也優于圍棋程序Dark Forest,后者得到了馬克·扎克伯格的支持。AlphaGo具備策略網絡(Policy Network)和估值網絡(Value Network)能力,前者分析局面、預測對手招式,后者負責判斷勝率,可以在2微秒內走出一步棋,而Dark Forest僅具備第一種能力,并且走棋所花費的時間也要更慢。

當然,真正讓AlphaGo成名的還是戰勝歐洲圍棋冠軍樊麾,這在當時引起了軒然大波,甚至推升了谷歌的股價,畢竟這是電腦對人腦的一次勝利。更重要的是,站在計算機的角度來看,與象棋相比,圍棋的難度要大很多,每個步數的潛在組合非常復雜,曾有專家說AI十年內都無法掌握圍棋。

阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位于英國倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團隊開發,這個程序利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾;2016年3月對戰世界圍棋冠軍、職業九段選手李世石,李世石輸了。

阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。這個程序利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。

深度學習

阿爾法圍棋(AlphaGo)的主要工作原理是“深度學習”。“深度學習”是指多層的人工神經網絡和訓練它的方法。一層神經網絡會把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。這就像生物神經大腦的工作機理一樣,通過合適的矩陣數量,多層組織鏈接一起,形成神經網絡“大腦”進行精準復雜的處理,就像人們識別物體標注圖片一樣。

兩個大腦

阿爾法圍棋(AlphaGo)是通過兩個不同神經網絡“大腦”合作來改進下棋。這些大腦是多層神經網絡跟那些Google圖片搜索引擎識別圖片在結構上是相似的。它們從多層啟發式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網絡處理圖片一樣。經過過濾,13 個完全連接的神經網絡層產生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

這些網絡通過反復訓練來檢查結果,再去校對調整參數,去讓下次執行更好。這個處理器有大量的隨機性元素,所以人們是不可能精確知道網絡是如何“思考”的,但更多的訓練后能讓它進化到更好。

第一大腦:落子選擇器 (Move Picker)

阿爾法圍棋(AlphaGo)的第一個神經網絡大腦是“監督學習的策略網絡(Policy Network)” ,觀察棋盤布局企圖找到最佳的下一步。事實上,它預測每一個合法下一步的最佳概率,那么最前面猜測的就是那個概率最高的。這可以理解成“落子選擇器”。

第二大腦:棋局評估器 (Position Evaluator)

阿爾法圍棋(AlphaGo)的第二個大腦相對于落子選擇器是回答另一個問題。不是去猜測具體下一步,它預測每一個棋手贏棋的可能,在給定棋子位置情況下。這“局面評估器”就是“價值網絡(Value Network)”,通過整體局面判斷來輔助落子選擇器。這個判斷僅僅是大概的,但對于閱讀速度提高很有幫助。通過分類潛在的未來局面的“好”與“壞”,AlphaGo能夠決定是否通過特殊變種去深入閱讀。如果局面評估器說這個特殊變種不行,那么AI就跳過閱讀在這一條線上的任何更多落子。

那么,匯集了AlphaGo背后“最強大腦”的谷歌DeepMind究竟是一個什么樣的存在?

打開DeepMind的官網,“破解智能,用它來讓世界變得更好”的口號赫然映入眼簾。官網介紹稱,DeepMind是由哈薩比斯(Demis Hassabis)、雷格(Shane Legg)與蘇萊曼(Mustafa Suleyman)三人于2010年在倫敦創立的。

搜索一下資料我們可以發現,在這三人中,哈薩比斯是英國著名人工智能研究者,同時也是神經系統科學家、電腦游戲設計師與世界級的游戲選手,從小就有“神童”稱號。雷格專注于機器學習領域,擁有人工智能領域的博士學位。蘇萊曼則是一名英國企業家,除了幫助創立DeepMind,他還參與創立了一家專門研究社會問題、提供“沖突解決方案”的公司。

2014年,DeepMind正式被谷歌納入麾下,這也是谷歌截至目前在歐洲地區的最大收購案。據傳,在谷歌之前,包括特斯拉創始人馬斯克、創始人扎克伯格在內的許多硅谷大佬們也都曾向DeepMind拋出過橄欖枝。可以說,雖然成立不到6年,但這家公司卻似乎沒有經歷多少創業企業的艱辛,而是很早就飛上了枝頭,成為了各類大牌科技企業、風險投資機構眼中的“香餑餑”。

那么,拋開一些科技企業拿人工智能炒作的嫌疑不提,DeepMind在成立的六年里又主要干過些什么? 為什么他們會具備受硅谷大佬青睞的潛質呢?

潛質之一,或許是這個團隊對人工神經網絡的研究。據媒體報道,早在2013年,DeepMind就創造出了可以模仿人類思維、學習如何玩電子游戲的人工神經網絡。當年,DeepMind還獲得了劍橋大學計算機實驗室的“年度公司”獎項,名聲大震。

DeepMind在人工智能、深度學習領域的研發實力還可以從成立以來發表的各類學術論文中一窺。近六年來,該公司不斷在包括Neuron(號稱神經科學界的“頂級期刊”)、Nature(全球最權威學術期刊之一)等雜志發表研究成果。尤其是在2014年被谷歌收購后,發表的尖端研究成果數量更是與日俱增。

最后一個,當然也是最給DeepMind“長臉”的就是AlphaGo。資料顯示,AlphaGo和過去挑戰人類的機器們最大的區別在于,它是一款具備“深度學習”功能的機器人,也就是說他不是為了下棋而設計的,是來“學習”下棋的,無時無刻不在模仿人類的思維進行學習。

那么AlphaGo究竟是怎么思考的?

AlphaGo的兩個“大腦”

資料顯示,AlphaGo下圍棋的原理和人類有相似之處,一是判斷局部,二是把握全局。

DeepMind此前在Nature雜志發表的一篇論文中,也曾有過細節方面的介紹。簡而言之就是,AlphaGo總體上由兩個不同功能的“大腦”網絡組成:策略網絡(Policy network)和價值網絡(Value network)。

對弈中,AlphaGo的兩個“大腦”協同工作。策略網絡負責在當前局面下判斷“最好的”下一步,可以理解為落子選擇器;價值網絡負責評估整體盤面的優劣,淘汰掉不值得深入計算的走法,協助前者提高運算效率,可以理解為棋局評估器。然后,兩個“大腦”取各自選擇的平均值,做出最終的決定。

AlphaGo不斷升極的“腦力”也可以用它的戰績來證明。2015年,它就曾以5:0的絕對勝利打敗過歐洲圍棋冠軍樊麾,讓DeepMind由此有了向李世石“叫陣”的基礎。據稱,2015年那次也是人工智能程序首次在不讓子的情況下戰勝人類圍棋選手。這一戰績,加上9日首場比賽就戰勝了李世石,DeepMind對AlphaGo的信心或許還真不是空穴來風。

那么,在發明了迄今為止“史上最強機器人圍棋選手”、名利雙收后,DeepMind還打算干些什么?據透露,目前DeepMind正在與英國NHS(國家醫療服務體系)進行合作,并已經成立了“DeepMind健康”項目,并希望通過技術手段,幫助有意向參與的醫護人員提高服務質量。或許在圍棋選手后,DeepMind的下一個創造就是“機器人醫生”。

在AlphaGo和李世石第二局對弈的尾聲,擔任評論的國家圍棋隊總教練明明知道李世石輸了還在批評AlphaGo有俗手,聲稱如果他來給調一下,AlphaGo會下得更好,這說明他不光不懂人工智能,而且不懂圍棋。

先說圍棋:圍棋如果目標是贏,俗手不俗手就不是判斷依據,以前人的算力不足,只能借助模式識別能力來做模糊判斷,但方法一模糊,判斷的標準也就模糊了,所謂是否俗手的判斷力,肯定有些對有些錯,但會有大量的僵化的錯誤運用,最終導致魚龍混雜……聽聽,像不像是在說中醫!

再說人工智能:訓練人工智能已經越來越像培養孩子了,你給他準備好他該上的課程(不是指死記硬背的內容,而是循序漸進的學習框架),再給他足夠的時間練習,持之以恒,孩子的能力一定會逐漸增長的。其實孩子學習不好,絕大多數不是智力問題,而是各種原因導致的情緒問題。機器恰恰不存在情緒問題,只要設計的課程體系對了(在人工智能里就是所謂神經網絡),練習足夠充分(在人工智能里就是所謂深度學習),就一定能掌握好新能力。但是,長輩切忌把自己以為對的方法或知識強灌給孩子,知識是否正確,是在系統引導下、在充分的實踐中總結出來的,越人為干涉效果越差。

圍棋這個例子說明,人類的能力是有局限性的,在對很多復雜事物的認識上,人類的知識可能根本就是不完備的,甚至有大量謬誤,圍棋只是一個簡單的例子,對很多復雜系統的認識都是如此,比如社會,比如經濟,比如企業管理,比如中醫養生......

機器戰勝人類選手,是圍棋歷史上的一小步,卻是人類歷史上的一大步,尤其是AlphaGo和李世石對弈的第二局,證明了機器已經不用靠等人類犯錯來取勝了,人類不犯錯也贏不了,說明機器對圍棋本質的理解超越的人類。人類本來就很難理解到復雜事物的本質,該是人類在機器的幫助下更新對世間萬事萬物的理解的時候了。

而人工智能的優勢在于,只要給定目的,通過自我完善,機器就能做得越來越好,最終成為真正的專家,聽聽,是不是有點兒進化論的味道?本來嘛,人那么萬能的動物,不也是進化來的嗎!

因此,AlphaGo戰勝人類頂尖圍棋選手的意義,不在于什么挑戰了人類智力游戲的極限,也不在于未來會讓多少人失業,不在于達到了機器超越人類智力的奇點,而在于它宣示著另一種奇點的到來--人類可以借助非人類的認知能力去理解復雜事物的本質規律了。

不過對于人這種總喜歡清楚地了解因果的動物來說,人工智能能通過做得比我們好的結果來說明它們掌握了復雜事物的規律,但它們卻不能清楚地詳細道出其中的因果,因為多因素的綜合作用,即使你能預測結果,也無法清晰地表述因果,人不行,機器也不行。

所以雖然有了個強力的助手,卻不能增進我們對事物的顯現知識的了解,至少不是詳細的了解,但卻不妨礙我們把事情做得越來越好。當然,這沒什么大不了的,其實我們早就生活在一個自己無法完全了解的世界里了,想想相對論,想想量子力學,想想大腦的認知結構,你真的掌握了相關的專業知識嗎?你確信自己不只是在重復科學家們、課本里、甚至只是媒體上的觀點而已嗎?多數人之所以相信相對論是正確的,并不是自己能做出清晰的證明,而只是知道愛因斯坦被公認為20世紀最偉大的科學家,并因此對他的言論產生的信任甚至盲目崇拜吧。

未來,AlphaGo(阿法狗)和Watson之類的智能工具將無處不在,人類將進入人仗狗勢的時代。我們將能借助人工智能總統回避掉滿嘴跑火車的川普;我們將能借助人工智能總經理提升公司業績,甚至做到基業長青;我們將能借助人工智能管家管理我們的生活,讓我們專注于最富創造力、最能彰顯人性的事情上。當然,前提是,你不光要會利用人工智能,和人工智能親密合作,還要像信任愛因斯坦一樣信任人工智能。

這,才是真正的奇點,人工智能的奇點,這個奇點將會造成人類能力的空前進步,人類創造力的空前釋放,人類文明的空前繁榮。

以上,是關于阿爾法的一些簡單介紹,親們可以了解一下~~!

游客評論

熱門評論

最新評論

發表評論 查看所有評論(0)

(您的評論需要經過審核才能顯示) 字數: 0/500

本周熱門

找游戲 下應用

排行榜

游戲軟件破解

關于安卓網 | 聯系方式 | 發展歷程 | 下載幫助(?) | 廣告聯系 | 網站地圖 | 友情鏈接

Copyright 2011-2014 5577.com安卓網 鄂ICP備15005058號-1