2019-10-31 10:08 | 來源:科技日報 | 作者:未知 | [科技] 字號變大| 字號變小
此次,“深度思維”公司奧里奧·維亞爾斯及同事,展現了最新的多主體增強學習算法——“阿法星”。在該算法中,若干深度神經網絡主體相互競爭,生成大量的持續適應性策略和對策。
“阿法星”的訓練設置。圖片來源:《自然》網站
著名的人工智能公司英國“深度思維”(DeepMind)最新推出了一款主體增強學習算法“阿法星”(AlphaStar)。目前,這款人工智能程序已進入戰略游戲《星際爭霸II》前0.2%排名的人類玩家之列。根據英國《自然》雜志30日發表的一篇論文,該算法代表了機器學習的一大重要成就,經過改造,將有助于解決其他應用領域的復雜問題。
《星際爭霸II》游戲已經成為人工智能研究領域的一項巨大挑戰。據介紹,這是一款科幻主題的策略游戲,有全球性的專業比賽,也是全球最賺錢的專業電子競技之一。該游戲中有三個特征和能力截然不同的種族,玩家控制其中一個種族,相互對抗。
而在之前的比賽中,即使簡化了游戲規則,人工編制特定動作序列或依賴超人類的功能(如每分鐘執行上萬次動作),人工智能體也無法與頂尖人類玩家抗衡。
此次,“深度思維”公司奧里奧·維亞爾斯及同事,展現了最新的多主體增強學習算法——“阿法星”。在該算法中,若干深度神經網絡主體相互競爭,生成大量的持續適應性策略和對策。之后,“阿法星”在一系列在線游戲中與人類玩家比賽,無論玩《星際爭霸II》的哪一個種族,“阿法星”都達到了大師級水平。這標志著人工智能體首次在沒有簡化游戲的情況下,在專業電子競技中達到了頂尖人類玩家的水平。
“深度思維”公司2016年憑借“阿法狗”程序與人類圍棋世界冠軍之戰大獲全勝而成名;其后該程序升級為“阿法元”(AlphaGo Zero),能夠從空白狀態起,不需要任何人類棋譜輸入的條件下自學圍棋;下一代“阿法零”(AlphaZero)則接連擊敗了國際象棋、將棋、圍棋三個世界冠軍級的電腦程序,成了全能棋王。隨后,公司宣布這一程序不再主攻棋法,而是“投身”醫療、能源以及新材料等領域。
總編輯圈點
在AI領域,“阿法狗”是個囂張的名字,該程序妙手迭出,刷新了不少世界紀錄。但再厲害的AI算法,最終仍要落地于應用。“深度思維”早已宣布將重心從人機大戰中抽出來,轉而投向能“提供疾病治療方案”的AI、能“降低能源消耗”的AI、能“發明出革命性新材料”的AI……因此,笑傲一個曾被認為AI很難戰勝人類的游戲,也必然不是“阿法星”的訴求,那只是它甫出茅廬、抓住你眼球的方式罷了,這個多主體增強算法,未來所施展的才華必將超過它的前輩。
《電鰻快報》
熱門
相關新聞