腾讯|“数字人”与“数智人”,不止一字之差( 二 )



以腾讯为例,今年腾讯的数字生态大会上,发布了云智能战略架构,并宣布腾讯云小微数智人是实现其战略的重要一环。

腾讯云小微在现有的基础上,整合了语音交互、自然语言理解、图像识别等更多AI能力,将“数字人”升级为“数智人”,拥有了更强大的表现力、识别力和感知理解能力,与人之间的对话更自然,将人机交互从单纯的对话工具转变为真正的沟通交流。

具体而言,腾讯云小微数智人拥有8种超细微面部情感表情以及数百种肢体动作,让虚拟形象的表情和动作更接近于真人形象。腾讯在此次大会上,还一次性推出了3D超写实、3D写实、3D半写实、2D真人、2D卡通五种数智人的风格,以满足各类场景服务需求。在形象选择方面,腾讯云小微数智人可支持定制化需求,并且还能为客户进行海量IP形象授权。

不止在外在形象上下功夫,腾讯云小微数智人可识别超34种语种、方言、翻译超过11个语种,拥有超过46万垂直行业场景热词库,也就意味着能适应更多客户的需求。

大会之前,数智人已经与平安普惠、故宫、新华社等,在金融、文旅、传媒等多个领域建立了合作,例如新华社推出的全球首个“AI合成主播”,到目前为止已经累计播报新闻超过1万条,保证播报零误差,可对日常和突发事件实时响应。

这些实践的成功,让腾讯云小微数智人初步通过了在真实落地场景中的应用检验,让我国的数智人相关技术和体验,更接近世界领先水平。

云小微的优势
试想一些场景:你在看智能电视,想要换台,但是旁边有打麻将的人刚好胡牌,大声笑闹,智能电视听不全你的指令,你只能到处找遥控器,或者等他们安静下来再换;或者你在开车,想用语音导航找目的地,副驾驶座位上的人却在大声打电话,语音导航导错了地方。

人是社会性动物,现实生活中上述场景很常见,但因为技术问题,语音交互如何排除干扰的问题,一直没能得到好的解决。

腾讯云小微和AI Lab联合发布的腾讯语音智能,则针对这一常见问题提出了解决方案。这是一款能够提升语音识别效果和效率的全链路AI+声学技术解决方案。

腾讯语音智能通过语音分离工作模式,极大提升了在复杂场景下语音采集、降噪分离和增强的效果,在复杂环境中大幅度降低了语音收集的错误率。数据表示,使用腾讯最新技术的语音识别,错误率可降低超过50%,可以更好地进行转写、理解和回复。

腾讯智能产品副总裁、腾讯教育副总裁李学朝接受媒体专访时,还提到腾讯数智人的另外几个优势。

“云小微、AI Lab和搜狗原来的AI数字人走到一起,所以我们现在打造的不仅从技术上,从产品上和场景上,应该是在业界看到的比较领先的。这里面的话,最典型的像最近有一次信通院针对数智人交付的评定,我们是拿的优良级,是唯一的厂商,这是代表对我们形象,也是智能各方面的认可,这也是从技术到产品的维度的认可。”

首先是在实际应用场景方面。中国各大互联网公司近几年都在AI技术研发上投入不菲,也获得了相应的回报,在中国AI行业中取得领先地位。但是,技术和应用之间,理论和实践之间,尚有差别。

腾讯云小微数智人就是最早一批落到实际应用场景的。有别于媒体上更多见的偏静态数字人,腾讯云小微数智人根据实际场景中的需求,训练数智人底层的AI算法,实现了不同行业和具体场景下的差异化,让用户可以跟数智人真正对话。

更早进入实际应用场景,意味着AI能接受更多来源于真实情景的训练,能更快基于已有的语种、方言、热词库,进行训练,从而更快“进化”。