王者绝悟:AI江湖里的"武林高手"
文章插图
编者按:本文来自微信公众号懂懂笔记(id:dongdong_note),创业邦经授权转载,图源:图虫。
2021世界人工智能大会走到了第四年,给人最明显的感受就是AI已经慢慢从酷炫的概念,逐渐被应用到了更多的场景中。化有形于无形,润物细无声,不知不觉中人们与AI的交集已经越来越多。
不过,就如马化腾在开幕式中提到的“对AI的未知仍然大于已知”,在考虑到未来“通用AI”成熟后面临的道德摇摆问题之前,可能先要去解决的是路径上的技术难题。而在这次的AI大会上,腾讯带来的策略协作型AI王者绝悟,也许能够成为未来通用AI探索之路上的一个“急先锋”。
王者绝悟的“武林高手”晋升之路王者绝悟,实际上是王者荣耀与腾讯AI Lab在游戏场景下研究的成果。
用通俗一点的话来理解“策略协作型AI”,“策略”指的是AI能够通过获取到的信息,分析局势优化策略,做出更有利于获胜的行为;“协作”指的是操作不同英雄的多个智能体能够互相配合,协同推进博弈。
一旦明白了所谓的“策略协作型AI”的定义,也许就能理解为什么在8日下午的“职业人气选手 VS 王者绝悟”表演赛上,王者绝悟能够表现如此出色 —— 团战越塔收割,完美撤退;以一敌众,掩护队友撤退,稳固优势等等。
有趣的是,王者绝悟并非一开始就这么“聪明”。事实上,回顾它的发展历程,特别像经典武侠小说里,一个武林高手的成长故事。
在18年面世的时候,王者绝悟通过监督学习,模拟了职业选手的操作,达到了顶尖业余水平。19年,它开始往深度强化学习课题上深入,达到了职业电竞水平。
好比一个初出茅庐的毛头小子,开始只能靠跟着师傅,“模仿”招式学习武功。但毕竟只是“模仿”,运气好学到的是“九阳神功”,运气不好可能就只能学到个“葵花点穴手”。而到了深度学习阶段,他决定不再模仿,而是开始自己修炼,逐渐摆脱了那些“套路化”的招式。
到了2020年,王者绝悟又通过课程化自我博弈,从单个或者固定英雄组合,高效地扩充到更多英雄组合的学习。
而在腾讯AI Lab高级研究员、王者绝悟AI模型负责人邱福浩描述的王者绝悟最新版本中,它进一步引用了多轮组合博弈和层次化的强化学习算法。也就是说,现在王者绝悟不仅能和你直接战斗,甚至在战斗之前的BP环节,就已经开始思考策略,并且战局中也能够持续调整策略来应对各种局面。
用邱福浩的来说,如今的王者绝悟,已经达到全英雄职业电竞水平。
但是,就像改变世界的是“武道”,不是“武术”。王者绝悟在游戏场景、电竞行业中都有着直接、有效的帮助。但是,这还不足以称其为“通用AI路径上的一个急先锋”。
真正值得一提的,是王者绝悟背后所代表的技术发展浪潮。
“人工+智能”向自主智能的进化现如今,AI对于各行各业的赋能,已经不用多说,从上下班打卡的人像识别、到陪玩游戏的语音助理… 其价值已经被大家广泛认知并认可。
但是,AI的开发、训练、调试的过程中,如果完全放到现实中去进行,存在成本高、风险大的问题。因此,游戏是最好的虚拟化场景。从简单到复杂、从低级到高级,AI研究的不同历史时期,都能找到对应的、不同复杂度的游戏作为测试相关技术主要难题的技术试验场。
2016年,AlphaGo一战成名。作为许多年前的“第一批AI网红”, AlphaGo的技术逻辑并不难理解:通过“走棋网络”模仿棋手,然后借助树搜索,分析战况,推演未来的每一步棋的变化,接着凭借估值网络,分析局势,判断胜率,最后做出行动。
- 小米12|自研动态性能调度!小姐姐实测小米12 Pro《王者荣耀》:功耗下降20%
- 尴尬了!鸿星尔克与王者荣耀联名宣发翻车,两次发文皆未得到回应
- 小米科技|小米10S不是最佳选择?三款不到2500元的曲屏手机:最强王者诞生
- thinkpad|围观!盘点2022年4款“最强”ThinkPad电脑:联想的王者,真香
- cos:王者荣耀安琪拉新皮肤时之奇旅cos正片@丝言
- 【黑马早报】新东方:俞敏洪个人文章不代表公司观点;王者荣耀2021全球吸金超28亿美元;22岁编程世界冠军加入华为…
- 高通骁龙|骁龙870机型盘点,这四款才是不折不扣的“性价比王者”,够强悍
- cos:王者荣耀嫦娥拒霜思cos正片@宵鱼鱼
- cos:王者荣耀遇见胡旋.貂蝉cos正片@故人面具
- 骁龙870|首款安卓电竞平板!联想拯救者Y700实测:《王者》几乎满帧、最高36.5℃