机器人智能进阶的秘诀,为什么是这个技术?

智东西(公众号:zhidxcom)
作者|程茜
编辑|漠影
从“机器人之父”恩格尔伯格发明第一个机器人开始 , 人类就一直没有停止过对机器人的探索和想象 。 在影视世界里 , 人类更是畅想机器人的各种可能 , 把科技浪漫主义发挥到极致 , 从《WALL-E》到《超能陆战队》 , 从《西部世界》到《芬奇》 , 形形式式的机器人故事被讲述 , 它们或拥有人类的外观 , 或具备超强的思维能力 , 或试图建立自己的情感 。
现实世界里 , 机器人虽然还远远达不到影视里呈现的高度智能 , 但实际上各相关行业和企业也一直在探索让机器人变得更“聪明”的方式 。 令人意想不到的是 , 游戏技术也正在这场探索里发挥作用 。
6月27日 , 腾讯游戏发布会上 , 公布了一个特殊的项目——游戏驱动机器人加速智能学习项目 , 利用游戏技术和AI , 帮助腾讯首个全自研的四足机器人RoboticsXMax实现智能控制、决策 , 并提升训练效率 , 这或许能成为机器人研发领域一个创新的突破口 。
近日 , 智东西独家对话项目技术团队 , 深入了解将游戏技术应用至机器人研发背后的故事 , 并探讨游戏技术跨界的可行方向 。
一、智能机器人训练成本高、优化难?游戏技术来攻关
近年来 , 机器人的“技能树”逐渐枝繁叶茂 , 从早期能完成简单的单一动作 , 发展到具备力觉、触觉、听觉等多重感官 , 再到同时能进行多项复杂任务 , 甚至试图学会“思考” 。
机器人智能进阶的秘诀,为什么是这个技术?】腾讯首席科学家、腾讯AILab及腾讯RoboticsX实验室主任张正友将智能机器人的核心技术概括为A2G:A是人工智能(AI) , B是机器人本体 , C是控制 , D是发育学习(developmentallearning) , E是情商 , F是灵巧操控 。 通过学习能力、情感能力、操控能力及与其他要素的交互 , 机器人就会成为G , 即人类的守护天使(guardianangel) 。
机器人智能进阶的秘诀,为什么是这个技术?
文章图片
这七个技术方向 , 推动机器从采集信息向分析决策、实现有意识自主的高阶智能发展——感知、学习、执行、规划 。
说起来容易 , 但要实现真正的智能进阶 , 仍然有相当多的难题横亘在前 。
就像人类在成长过程中通过学习、实践、试错 , 逐渐建立思考能力一样 , 研究人员希望给机器人设定一个目标 , 通过设计合理的奖励机制 , 让它自己摸索着学会感知和适应动态的环境变化 。
而在真实场景中做这种训练 , 会非常“费钱” , 因为实体机器人一旦磕磕碰碰 , 很容易损毁硬件 , 更别提还需耗费大量的数据和训练时间 。
无独有偶 , 伴随着游戏产品的迭代升级 , NPC(非玩家角色)似乎也在变得越来越“智能” 。
在今天的游戏中 , “状态机”是最常见的智能模拟方案 , 从《吃豆人》的鬼魂 , 到《暴力摩托》的摩托车手 , 再到《荒野大镖客》随处能与玩家进行交互的市民 , 随着游戏的进化和迭代 , 状态机智能已能做到真假难辨 。
但即便是将NPC做到足够逼真的《荒野大镖客2》 , 也仅仅实现了“运动匹配” 。 其技术总监曾在一次访谈中回顾说 , 他们给马设计了几百种不同的动作动画 , 就连喘气都有上百条不同的声音 。 而这些 , 并不是真正的智能 , 只是庞大行为树和动画资源堆叠的成果 。
机器人智能进阶的秘诀,为什么是这个技术?
文章图片
那么如何通往真正的智能?怎样实现更高质量的虚拟角色 , 使其既能拥有更加自然真实的动作表现 , 又能显著降低开发成本?