AlphaGo Zero完勝舊版100:0

所謂高處未算高,曾經把人類頂尖圍棋棋士打得落花流水的人工智能程式AlphaGo更上一層樓,其進化版本AlphaGo Zero在學會基本圍棋的玩法後,竟可無師自通花三天時間自己與自己下棋摸索,就完勝舊版本的AlphaGo,更創出自成一格的刁鑽下棋法。世界排名第一的中國九段棋士柯潔對此稱,純粹自我學習的AlphaGo是最強的。

Google旗下的子公司DeepMind開發出來的AlphaGo這麼厲害,全因由多名圍棋高手教過它數百萬手棋的下法,加上能夠預計自己的勝算再調整策略。而在進化版本,開發人員只教了它圍棋的基本玩法,在沒有其他指導下,就僅花三天時間「左右互搏」,從數百萬手棋中找出最佳的對弈方法。

進化版本AlphaGo Zero其後與它的「前輩」AlphaGo對弈,結果以一百比○的局數完勝。研究人員更指,AlphaGo Zero在四十天內,就「自學了人類三千年來下圍棋所累積得來的知識」,並自創新的策略,成為圍棋高手。曾敗於AlphaGo的柯潔在微博表示,一個純淨、純粹自我學習的AlphaGo是最強的;對於AlphaGo的自我進步來講,人類太多餘了。

期盼能力助加快尋治惡疾

DeepMind的行政總裁哈薩比斯指,AlphaGo Zero之所以如此強大,因為它不囿於人類的知識所限。他又指,若果AlphaGo Zero的能力可用於醫治頑疾,或者可在數周內就找出人類要花數百年才研究得出的治療方法。

本報綜合報道