虚拟游戏|游戏的「隐藏身份」:AI与现实世界的「王牌训练师」( 二 )


人工智能的“教学”观察算法在电子游戏中的表现还可以深入了解它们的行为方式。Togelius 说,这有助于研究人员更好地了解算法如何解决问题并做出决策。
“通过观看 AI 代理玩游戏,我们可以更多地了解 AI 擅长什么以及人类擅长什么,”他说。
这一点可以帮助公司和政策制定者去识别在哪些领域人工智能能够以有利于人类的方式,来提高效率或支持现有的工作。在这些场景中观察 AI 的另一个好处可能是发现新技术或新机会。
例如,根据德国弗莱堡大学机器学习研究人员今年早些时候发表的一篇论文所述,一种使用进化策略的算法,其中最成功的算法能够生存和进化,利用电子游戏 Q*bert 中的一个bug,来累积几乎无限的积分。
该论文的作者之一弗兰克·哈特 (Frank Hutter) 表示,在这款游戏推出 36 年的时间里,包括开发者在内的任何人都没有发现这个漏洞。
Hutter 解释说,该算法的探索行为,以及为了长期最大化积分而不断尝试的意愿,帮助它找到了故障。
【 虚拟游戏|游戏的「隐藏身份」:AI与现实世界的「王牌训练师」】“按照设计,它着眼于长期依赖关系,”他说。“它只对‘最终分数’感兴趣,而其他方法则专注于‘如何快速获得积分’,这就是人类尝试玩游戏的方式。”
后续动作人类和人工智能,都仍有很多东西需要学习。例如, OpenAI 在 Dota 2 中战胜一支人类玩家队伍的几周后,它在电子游戏的年度锦标赛中输给了职业玩家。
虚拟游戏|游戏的「隐藏身份」:AI与现实世界的「王牌训练师」
文章插图

Togelius 说,展望未来,如何将 AI 的能力从特定任务扩展到更广义的“智能”,是我们需要思考的问题。
“我们非常擅长通过训练算法来做特定的事情或玩特定的游戏,但我们在广泛化应用方面仍在婴儿学步阶段”他说。“现在‘玩游戏’的人工智能和研究给人工智能界的回馈是,人类正在开发可被广泛适用的方法,这些方法既是为玩游戏而开发,也可以有其他用途”。
雷锋网雷锋网