腾讯|“数字人”与“数智人”,不止一字之差( 三 )



另外,腾讯语音智能可以支持多种应用场景和设备,拥有优秀的场景适配性和通用性,面向实际场景的定制优化更简单、高效,为企业场景中的语音服务需求降低了运行和定制成本。

在媒体交流环节,李学朝还特别提到了与搜狗整合完成后,腾讯在2D真人方向获得提升。他认为,搜狗原来数字人尤其是2D数字人做得不错,搜狗的2D数字人在金融方向落地最早,而AI Lab主攻3D方向,搜狗和腾讯云小微叠加,对腾讯来说,在技术产品和场景落地方面都是增强。

更大的想象空间

“数智人正在走进我们的生活,在企业中承担岗位职责,为用户创造前所未有交互智能体验同时,提升企业服务效率和品牌形象。”李学朝在大会上表示。

比如,现在语音客服转人工客服的时候,中间还是会有声音的变化,让我们明确地感知到智能语音和人工服务的切换,而在数智人音视频传输更及时的前提下,可以让后面人工服务通过数智人表达,沿用数智人的声音和语气,让用户感受到是无缝切换,提升用户沟通体验,数智人客服可以7*24响应,成本仅为人工座席的约1/5,这一点在银行客服等服务行业尤为重要。

还有,疫情期间很多活动不得不转到线上,这时启用数字人讲解员,能最大限度减少现场人员数量,防止疫情传播风险。中国(深圳)国际文化产业博览交易会等活动中,已经做了虚拟讲解员尝试,像腾讯数智人这样能表达多种情绪、有多种肢体语言,并且能和观众对话、回答问题的数智人,才能更好地让用户在疫情期间突破空间、时间限制,享受如同到现场一般的互动性在线讲解游览体验。

人机交互模式从最早的文本客服,升级为语音客服,再到更“人性化”的交互系统,其商业化落地,在企业运行降本增效方面,起到重要作用。当我们被环球影城里威震天与观众们互动逗乐的时候,其实,一个真相是,这些问答都是由演员即兴表演完成的。我们可以想象,未来有一天,数智人经过训练,也可以达到同样的对话水平。

数智人的演进趋势是确定的。李学朝认为,目前有四大演进趋势,第一个是“听得清”,这个问题腾讯智能语音已经提出了解决方案;第二个是如何处理多音字或重名,腾讯已经有了解决思路;第三个是让数智人通过微表情、肢体语言等,变得更像真人;第四则是理解和表达情绪。

后面两个问题,腾讯云小微目前有8种微表情,足以使其比大多数数智人的表现更加细腻。不过,李学朝亦坦言,目前数智人对于交互中情感的“理解”,依然基于对文字内容的理解或者语义、语音情感的输入,“各个板块还是需要有这种深度的基础探索,让整体的数智人表现得更立体一点”。