圍棋界霸主換人當?新AI軟體靠自學就能戰勝AlphaGo
不需額外輸入資料,AlphaGo Zero靠自學
一般的人工智慧應用,都需要依靠事前輸入的大量資料來學習、訓練技能,舉例來說,Alpha Go就先透過線上圍棋社群中16萬筆業餘遊戲紀錄,來養成它的圍棋技能,之後再透過不斷與真人對戰,增強自己。
但是,這次的AlphaGo Zero不一樣,之所以有「Zero(零)」字樣,就是因為它完全不需要依靠人類的紀錄數據學習技能,DeepMind僅僅輸入圍棋的規則,AlphaGo Zero就會開始與自己下棋,每次優勝,這筆資料就會被輸入系統,藉此學習。
在這樣自我學習40天、對戰2900萬次之後,AlphaGo Zero勝戰原版AlphaGo的機率就已經達到90%,這樣的能力「能夠讓AlphaGo Zero成為圍棋歷史上最強大的玩家。」DeepMind說道。
此外,不依靠人類的經驗數據來學習技能,反而能讓電腦軟體突破人類知識的限制,找出新的遊戲策略與技巧,這都讓AlphaGo Zero較前一代更強大。
人類仍有超越AI的思考能力
AlphaGo Zero的背後技術設計,無疑簡潔有力,然而這項新技術,卻也展現人工智慧的限制。
人工智慧之所以能夠展現技能,是因為電腦在做決策之前,會先搜尋、列出幾項決策的可能對應結果,再由此中選出最好的選擇。
然而,面對複雜的問題,我們需要思考、尋求因果,並思考未來後果;電腦能夠在既定規則下的問題思考未來,但面對現實世界中缺乏規則的決策,人類的思考能力現在仍無法被電腦取代。
DeepMind希望AlphaGo Zero在圍棋界,能成為一個新的靈感來源,給予新的遊戲策略;進一步,他們希望這項AI技術能夠被用在新藥開發、量子化學、材料設計等領域,用來發現、解析複雜的大量數據資料。
資料來源:The Verge、Wired
數字焦點
40天
在自我學習40天、對戰2900萬次之後,AlphaGo Zero勝戰原版AlphaGo的機率就已經達到90%。
沒有留言:
張貼留言