训练|2000亿次训练！只为能让AI“自学”新游戏( 二 ) 游戏

除此之外，团队还发现智能体表现出一般的启发式行为（heuristic behaviours），如实验（experimentation），该行为出现在于许多任务中，而不是专门针对单个任务的行为。团队有观察到智能体在游戏中使用不同的工具，包括利用障碍物来遮挡自己、利用物品创建坡道。随着训练的进展，智能体还偶尔会出现与其他玩家合作的行为，但目前团队还不能确认这是否是有意识的行为。
结语：“自学”让AI更智能Open-Ended Learning Team正在训练一个新的智能体，它不需要从头开始训练数据，就能适应新的游戏。这个智能体将比仅使用强化学习方法的智能体更加“智能”。
大量的数据训练一直以来是人工智能发展绕不开的难题，此次如果能大量减少训练数据，并使其获得跨领域的自主学习能力，那么人工智能的能力将能得到进一步的提升。
【训练|2000亿次训练！只为能让AI“自学”新游戏】来源：deepmind