北美首頁 | 新聞 | 時尚 | 大陸 | 台灣 | 美國 | 娛樂 | 體育 | 財經 | 圖片 | 移民 | 微博 | 健康
Value Engine Stock Forecast
ENTER SYMBOL(S)

AlphaGo為何缺席計算機圍棋賽 或已是不同物種

http://finance.sina.com   2017年03月19日 01:56   北京新浪網

人機大戰第一季的盛況還歷歷在目人機大戰第一季的盛況還歷歷在目

  3月19日,UEC杯世界圍棋計算機大賽在日本結束,中國的圍棋程序絶藝擊敗日本的DeepZenGo,取得冠軍。這次比賽其實也邀請了AlphaGo,但被他們拒絶了。參賽的圍棋程序大都是學習2016年DeepMind的那篇論文,而現在的AlphaGo又再度進化升級,成為更為強大的“Master”了。與參賽的圍棋程序相比,現在的AlphaGo可能已經是不同“物種”了,自然沒必要參賽。

  賽制並不完全“公平”

  以往的UEC杯世界圍棋計算機大賽並不廣為人知,今年之所以備受關注,主要是兩個參賽程序的,日本的DeepZenGo和中國的絶藝。前者馬上要和羋昱廷、朴廷桓、井山裕太進行世界圍棋大賽,后者則一直在對弈網站上測試,積累了相當的人氣。

  比賽的用時是每方30分鐘,平均下來20秒左右就要落子,參賽程序的計算能力顯然對比賽成績有着很大的影響。比賽並不是所有的程序都使用統一的硬件配置,而是各自通過手裏的筆記型電腦,把比賽數據發送到各自的伺服器計算平台上完成。這也是為什麼18日現場斷網之后,比賽不得不暫停的原因。

因斷網而暫停的比賽因斷網而暫停的比賽

  應用了深度學習技術的圍棋程序,對局時策略網絡和價值網絡同時工作,還要配備強大GPU等計算資源。雖然計算資源堆積到一定程度之后能起到的提升效果有限,但在UEC的快棋賽制裏,計算資源上的差別還是很有影響的。

  DeepZenGo是由日本最大的視頻網站作為技術支持,而絶藝的背景是騰訊,兩者在計算資源上的優勢是顯而易見的。據國內一位研究圍棋AI的同學介紹,絶藝能夠調用的計算資源大到無法想象,畢竟中國是目前超算能力最強的國家。

  所以,絶藝和DeepZenGo一路過關斬將,沒有遭遇什麼抵抗就打進了決賽。兩者之間的對決才是真正意義上的戰鬥。

  DeepZenGo的“離奇”失誤

  (這段內容是絶藝和ZEN的決賽棋譜分析,如果你不會下棋,可以略過,大致意思是,ZEN在局面不錯的情況下,因為計算上的失誤被絶藝逆轉勝了。)

  決賽DeepZenGo執黑先行,右下角黑棋的死活是這盤棋優劣的關鍵。但絶藝和DeepZenGo后來都沒有在右下角走棋,看來是對此有一致的判斷,黑棋是活的(如果某方認為黑角會死,肯定早就脫先搶着走了)。右下角的變化比較複雜,這裏就先不做討論了。

圖1圖1

  圖1:棋局進行到中盤階段,黑棋圍棋上邊大空,判斷下形勢,黑棋要稍占上風。

圖2圖2

  圖2:“絶藝”在黑棋上邊空裏行棋,DeepZenGo的應對很成問題,白1斷的時候,黑2虎效果比實戰要好不少,更關鍵的時候,白3頂的時候,黑棋明明可有在4位扳,這樣沒什麼棋。

圖3圖3

  圖3:然而實戰DeepZenGo卻配合絶藝,在黑棋空裏出棋了……絶藝逆轉獲勝!

  這盤棋DeepZenGo和絶藝到底使用了多大的計算資源我們不得而知,但很明顯,這樣的計算能力,DeepZenGo想在後天與人類世界冠軍的對抗中占到上風,几乎是不可能的。現在已經不是一年前了,人類棋手們已經對圍棋人工智能不再陌生。

  與現在的AlphaGo可能不是同一“物種”

  絶藝、DeepZenGo,還有此前新浪棋牌報導過的 “麗拉”,都是受到2016年DeepMind在《自然》雜誌上發表的關於AlphaGo論文啓發,進而發展成現在的圍棋人工智能的。從某種意義上講,它們都是去年那個AlphaGo的跟隨者。從這次世界計算機大賽的棋譜體現出的水平來看,他們距離去年擊敗李世石的那一版AlphaGo似乎還有一定的差距。

改變了圍棋界的論文改變了圍棋界的論文

  這個差距一方面來自於,當時AlphaGo與李世石下的是慢棋,計算時間比這次要長;另外一方面可能是谷歌在深度學習技術應用上的優勢所致。

  不過尤其要注意的是,現在這些圍棋程序對比的對象還只是2016年與李世石大戰的AlphaGo,現在的AlphaGo(或者说MAster)究竟進化到什麼程度我們並不知道。

  DeepMind在公佈科學成果上是很謹慎的。去年人機大戰之前他們说AlphaGo通過自我對弈,取得了巨大的進步,所以才有信心挑戰李世石。當時不少人對此嗤之以鼻,結果被4比1的比分打了臉。

樊麾微博截圖樊麾微博截圖

  2016年11月的時候,AlphaGo團隊的發言人樊麾通過微博宣佈:“我們很高興向大家宣佈,AlphaGo的棋力在已過半年有巨大的進步,將在2017年初復出下棋。我們團隊會在近期內公佈更多訊息。”這個“巨大進步”耐人尋味,AlphaGo的研究又取得了怎樣的進展呢?之后Master在網上的60盤快棋測試,讓我們驚鴻一瞥。計算時間極短、完美的局面掌控、精準的局部戰鬥,這些細節都告訴着我們,現在的AlphaGo或者说Master,已經和一年前的它完全不同了,甚至可能已經進化到了一個更為先進的階段。

  上一次AlphaGo公佈研究結果,改變了整個圍棋人工智能領域,為圍棋界打開了一道通往未來的大門。不久前,哈薩比斯说:“2017年將是AlphaGo與棋界興奮的一年”,這次他們會帶來什麼樣的驚喜呢?

哈薩比斯和李世石哈薩比斯和李世石

  (周游)

Bookmark and Share
|
關閉
列印
轉寄
去論壇發表評論
DJIA17773.64
-57.12
NASDAQ4775.36
-29.93
S&P 5002065.30
-10.51

今日焦點新聞

新浪推薦