交互|中信建投证券:看虚拟人浪潮背后的投资逻辑及机遇( 二 )


具体来说,虚拟数字人可拆分为三大核心要素:“虚拟”,“数字”和“人”,其中,人是最核心的要素,是否能高度拟人化,提供自然逼真的相处体验是虚拟人在各个场景能否落地的关键。所谓拟人化,关键有三点:其一,外表是否高度“拟人”,虚拟数字人的面部长相和整体形象。会受到虚拟数字人类别、制作细节、渲染水平、设计审美等影响;其二,行为是否“拟人”:具体行为包括面部表情、形体表达、语音表述等会受到驱动方式、驱动模型类别、训练数据、驱动模型精度等影响,呈现不同程度的逼真效果;其三,交互能力上是否“拟人”:虚拟数字人与现实世界的交互水平,就是拥有人的思想,具有识别外界环境、并能与人交流互动的能力,包括回答内容、肢体反应等,会受到语音识别能力、自然语言理解及处理水平、知识图谱、预先设置知识库等影响。
1.1 虚拟数字人的发展历程:技术成熟驱动行业发展,场景内容不断丰富
虚拟人这一概念并不是到今天才出现的,从20世纪80年代开始,人们就开始在现实世界尝试引入虚拟人。起初的虚拟人技术主要是以手工绘制为主,日本动画《超时空要塞》播出后,动画官方以女主角林明美的名义将剧中插曲按照偶像专辑进行发售,她被看作全球首个“虚拟歌手”。由英国人创作的虚拟人Max Headroom也拍摄了多部电影和广告片。值得注意的是,这些虚拟人都是呈散点状出现,并且一时喧嚣后没有在社会上引发更大的水花,因此这一阶段的虚拟人还处在萌芽阶段。
21世纪初,随着CG、动作捕捉技术革新,虚拟人进入探索期,落地场景主要以影视娱乐行业为主。在影视方面,利用动作捕捉技术,经过计算机处理得到虚拟角色,用于电影制作中的数字替身。虚拟偶像方面,日本开发了第一款被广泛认可的虚拟人“初音未来”,她在商业领域的现象级成功使得虚拟偶像加速向产业化、职业化方向迈进,并开拓出了更多的细分领域。但这一阶段的虚拟人虽然达到实用水平,但造价较高,呈现形式也相对粗糙。
在最近 5 年,得益于人工智能技术的突破,虚拟人的制作得以简化、可交互性更强,进入了发展的快车道。当前更是在建模的精细度、动作捕捉和 AI 交互不断提升,虚拟人以达到写实级逼真程度,且具备情感表达和沟通交流的能力。近年来,虚拟人已经在更多的场景落地,已成功应用至银行、医疗、教育、政务、通信各行各业,逐渐进入主流市场。IP虚拟人方面,海外各类Vtuber,国内Bilibili等平台的Vup涌入市场;非IP虚拟人方面:这一阶段,一些科技公司已经着手布局虚拟人赛道,例如:新华社与搜狗联合发布“AI合成主播”, 浦发银行和百度共同发布提供及融服务的数字员工“小浦”。
从2020年至今,踩着元宇宙概念爆发的红利,越来越多的虚拟数字人如雨后春笋般涌现出来,商业价值逐步显现。除了娱乐公司与MCN机构,各头部大厂也纷纷入局这一赛道,布局不同类型的虚拟人IP,虚拟数字人正成为“Z世代”在各大社交平台上追逐崇拜的形象。目前,虚拟数字人正朝着智能化、便捷化、精细化、多样化发展,步入成长期。

交互|中信建投证券:看虚拟人浪潮背后的投资逻辑及机遇
文章插图
1.2 技术架构:真人驱动与计算驱动,双技术路线共同推进
当前虚拟数字人仍处在急速发展期,尚未形成统一的系统框架。我们引用人工智能产业发展联盟的框架,将虚拟数字人的通用系统分为5个部分:人物形象、语音生成、动画生成、音视频、合成显示、交互等。交互模块为扩展项,可智能识别用户意图,决定其后续语音和动作,驱动数字人下一轮交互。根据是否有交互模块分为非交互型虚拟数字人和交互型虚拟数字人,后者又根据驱动方式的不同分为真人驱动型和计算驱动型。非交互型虚拟人相对运作流程较简单,发展相对较早,目前布局的厂商也比较多。但未来的发展趋势整体还是着重于交互型虚拟人。