【本報綜合報道】人工智能AlphaStar連續在電競比賽中完勝兩名頂尖高手,有網民質疑它有「光速手」,加上不會如真人般受遊戲中的「戰爭迷霧」限制視角,擊敗人類自有其道理。DeepMind為此拆解AlphaStar的訓練及作戰方式,說明它並非「屈機」。
研究人員指初期訓練時,AlphaStar的視野仍受戰爭迷霧限制,而且控制速度甚至比頂級玩家的平均水準還要低,其點擊只有約平均三百五十毫秒的反應時間。為公平起見,團隊亦限制了AlphaStar的每分鐘操作數(APM),避免它因這方面的優勢勝之不武。
DeepMind表示,為了訓練AlphaStar,開始時讓它閱讀各種聯賽的比賽影片學習,觀察不同玩家所處的環境,盡量模仿特定的應對動作,以理解遊戲基本知識;又指它目前已累積了人類約二百年的學習量。