AlphaGo Zero靠自學,在數十天內超越前兩代AlphaGo,也勝過了人類累積數以千年計的圍棋智慧。
兩代AlphaGo先後擊敗人類頂級棋手李世乭和柯潔後,Google旗下的DeepMind在短短5個月內,發展出新一代AphaGo,名為AlphaGo Zero,它在完全不靠人類圍棋經驗之下自學,並已超越了前代AlphaGo。
前兩代的AlphaGo都是從數以千萬計的人類棋譜學習圍棋,但AlphaGo Zero的起步就只有圍棋規則和一個空白的棋盤。
帶領研發的David Silver表示,因為AlphaGo Zero起初完全不懂圍棋,它的神經網絡必須靠自己同自己下棋來掌握圍棋的世界。前兩代的AlphaGo用了多月學習才能打敗人類頂級棋手,但新的一代用3天已經達到打敗李世乭的AlphaGo水平,而且只是用了它一小部分的處理能力:「這說明,新的演算法才是至關重要,而不是人工智能的運算力或得到的數據有多強大。」40天後,AlphaGo Zero完勝AlphaGo Master,即是打敗柯潔的那個版本。
簡言之,在沒有人類認知的限制下,AlphaGo Zero在短短數十天時間就超越了人類數千年累積下來的圍棋智慧。Silver說:「可以說,我們已經擺脫了人類認知能力的限制,人工智能可以由一張白紙,自行創造知識。」
DeepMind的圍棋顧問,也是專業棋手表示,由AlphaGo Zero自行發展的一些奇招是他前所未見的。
以往的人工智能總是依賴人類的認知,問題是這些資料可能比較昂貴,甚至不可靠,又或者在某些情況下根本不適用。若把AlphaGo的新技術應於藥物設計、節省能源系統或研發新物料,可能有革命性的創見。
DeepMind創辦人兼CEO哈薩比斯(Demis Hassabis)表示,這一發展令人非常振奮,認為AlphaGo的技術已夠成熟,可以應用於人類世界面對的問題。對於有人憂慮人工智能可能威脅人類,他卻傾向樂觀,認為靠著AI演算法,人類在科研和醫學的領域可以得到很大的進步。