Popular science work
据英国《新科学家》网站的报道,总部位于英国的“深度思维”公司研发的新人工智能“DeepNash”(深度纳什)学会了在“西洋陆军棋”(Stratego)游戏中,使用虚张声势等欺骗手段来击败人类对手。在与专业人类玩家进行的50场排名赛中,“深度纳什”得胜率为84%,跻身前三名。相关研究刊发于最新一期《科学》杂志。
西洋陆军棋是一款极其复杂的游戏,有10535种可能的游戏场景。相比之下,国际象棋和扑克要少得多。“深度思维”公司的朱利安·佩罗拉特表示:“最令人惊讶的是,‘深度纳什’学会了在游戏中使用较弱的棋子虚张声势,而且会为了胜利牺牲重要棋子。”
研究团队指出,“深度纳什”通过在55亿场游戏中与自己对决来攻克西洋陆军棋。它没有试图通过搜索所有可能的游戏场景来进行游戏,也没有被训练与特定选手比赛,而是利用一种算法不断将其行为导向经济博弈论所指导的最优策略,该最佳策略能保证其与完美对手的胜率至少为50%。
美国纽约大学副教授朱利安·托格利乌斯表示,在此策略下,尽管对手会隐藏一些信息,该游戏存在大量可能的游戏场景,每个回合都可采取许多不同的手段,“深度纳什”仍能作出决策取得胜利,“这是一件我们以前无法真正做到的事情”。
“深度纳什”已经战胜了人类和人工智能对手。在通过在线游戏平台与专业人类玩家进行的50场排名赛中,它的得胜率为84%,跻身前三名。在与西洋陆军棋顶级游戏机器人,包括此前赢得该游戏世界计算机锦标赛的几款机器人进行的比赛中,它也取得了97%的胜率。
马耳他大学的乔治斯·扬纳卡斯基说:“优秀的玩家往往会记住对手的棋子并预测他们的部署模式。‘深度纳什’在这两方面都做得很好:在记忆力方面它可能更具竞争优势,而且,它会虚张声势、出其不意。”
来源:科技日报