机器人智能进阶的秘诀，为什么是这个技术？智东西（公众号：zhidxcom）

智东西（公众号：zhidxcom）
作者|程茜
编辑|漠影
从“机器人之父”恩格尔伯格发明第一个机器人开始，人类就一直没有停止过对机器人的探索和想象。在影视世界里，人类更是畅想机器人的各种可能，把科技浪漫主义发挥到极致，从《WALL-E》到《超能陆战队》，从《西部世界》到《芬奇》，形形式式的机器人故事被讲述，它们或拥有人类的外观，或具备超强的思维能力，或试图建立自己的情感。
现实世界里，机器人虽然还远远达不到影视里呈现的高度智能，但实际上各相关行业和企业也一直在探索让机器人变得更“聪明”的方式。令人意想不到的是，游戏技术也正在这场探索里发挥作用。
6月27日，腾讯游戏发布会上，公布了一个特殊的项目——游戏驱动机器人加速智能学习项目，利用游戏技术和AI ，帮助腾讯首个全自研的四足机器人RoboticsXMax实现智能控制、决策，并提升训练效率，这或许能成为机器人研发领域一个创新的突破口。
近日，智东西独家对话项目技术团队，深入了解将游戏技术应用至机器人研发背后的故事，并探讨游戏技术跨界的可行方向。
一、智能机器人训练成本高、优化难？游戏技术来攻关
近年来，机器人的“技能树”逐渐枝繁叶茂，从早期能完成简单的单一动作，发展到具备力觉、触觉、听觉等多重感官，再到同时能进行多项复杂任务，甚至试图学会“思考” 。
【机器人智能进阶的秘诀，为什么是这个技术？】腾讯首席科学家、腾讯AILab及腾讯RoboticsX实验室主任张正友将智能机器人的核心技术概括为A2G：A是人工智能（AI）， B是机器人本体， C是控制， D是发育学习（developmentallearning）， E是情商， F是灵巧操控。通过学习能力、情感能力、操控能力及与其他要素的交互，机器人就会成为G ，即人类的守护天使（guardianangel）。

文章图片
这七个技术方向，推动机器从采集信息向分析决策、实现有意识自主的高阶智能发展——感知、学习、执行、规划。
说起来容易，但要实现真正的智能进阶，仍然有相当多的难题横亘在前。
就像人类在成长过程中通过学习、实践、试错，逐渐建立思考能力一样，研究人员希望给机器人设定一个目标，通过设计合理的奖励机制，让它自己摸索着学会感知和适应动态的环境变化。
而在真实场景中做这种训练，会非常“费钱” ，因为实体机器人一旦磕磕碰碰，很容易损毁硬件，更别提还需耗费大量的数据和训练时间。
无独有偶，伴随着游戏产品的迭代升级， NPC（非玩家角色）似乎也在变得越来越“智能” 。
在今天的游戏中， “状态机”是最常见的智能模拟方案，从《吃豆人》的鬼魂，到《暴力摩托》的摩托车手，再到《荒野大镖客》随处能与玩家进行交互的市民，随着游戏的进化和迭代，状态机智能已能做到真假难辨。
但即便是将NPC做到足够逼真的《荒野大镖客2》，也仅仅实现了“运动匹配” 。其技术总监曾在一次访谈中回顾说，他们给马设计了几百种不同的动作动画，就连喘气都有上百条不同的声音。而这些，并不是真正的智能，只是庞大行为树和动画资源堆叠的成果。

文章图片
那么如何通往真正的智能？怎样实现更高质量的虚拟角色，使其既能拥有更加自然真实的动作表现，又能显著降低开发成本？