2017年10月19日 星期四

圍棋界霸主換人當?新AI軟體靠自學就能戰勝AlphaGo

圍棋界霸主換人當?新AI軟體靠自學就能戰勝AlphaGo


Google旗下所屬的AI實驗室DeepMind,繼開發出AlphaGo打敗世界圍棋冠軍後,再宣布進階版的新軟體AlphaGo,宣稱比前一代更強、更聰明。

人工智慧(AI)圍棋軟體AlphaGo與圍棋世界冠軍李世乭激烈的大戰似乎還歷歷在目,Google旗下AI實驗室DeepMind又表示開發出更加強大的軟體,稱作AlphaGo Zero。

不需額外輸入資料,AlphaGo Zero靠自學


一般的人工智慧應用,都需要依靠事前輸入的大量資料來學習、訓練技能,舉例來說,Alpha Go就先透過線上圍棋社群中16萬筆業餘遊戲紀錄,來養成它的圍棋技能,之後再透過不斷與真人對戰,增強自己。

但是,這次的AlphaGo Zero不一樣,之所以有「Zero(零)」字樣,就是因為它完全不需要依靠人類的紀錄數據學習技能,DeepMind僅僅輸入圍棋的規則,AlphaGo Zero就會開始與自己下棋,每次優勝,這筆資料就會被輸入系統,藉此學習。

在這樣自我學習40天、對戰2900萬次之後,AlphaGo Zero勝戰原版AlphaGo的機率就已經達到90%,這樣的能力「能夠讓AlphaGo Zero成為圍棋歷史上最強大的玩家。」DeepMind說道。

此外,不依靠人類的經驗數據來學習技能,反而能讓電腦軟體突破人類知識的限制,找出新的遊戲策略與技巧,這都讓AlphaGo Zero較前一代更強大。
動態圖表顯示AlphaGo Zero如何靠自我對戰與學習,超過前一代AlphaGo的圍棋能力。
DeepMind

人類仍有超越AI的思考能力


AlphaGo Zero的背後技術設計,無疑簡潔有力,然而這項新技術,卻也展現人工智慧的限制。
人工智慧之所以能夠展現技能,是因為電腦在做決策之前,會先搜尋、列出幾項決策的可能對應結果,再由此中選出最好的選擇。
然而,面對複雜的問題,我們需要思考、尋求因果,並思考未來後果;電腦能夠在既定規則下的問題思考未來,但面對現實世界中缺乏規則的決策,人類的思考能力現在仍無法被電腦取代。
DeepMind希望AlphaGo Zero在圍棋界,能成為一個新的靈感來源,給予新的遊戲策略;進一步,他們希望這項AI技術能夠被用在新藥開發、量子化學、材料設計等領域,用來發現、解析複雜的大量數據資料。
資料來源:The VergeWired

40
在自我學習40天、對戰2900萬次之後,AlphaGo Zero勝戰原版AlphaGo的機率就已經達到90%。

沒有留言:

張貼留言