数字人|用人工智能技术跨越声音的障碍

语音识别、机器翻译等人工智能技术，构建了一套复杂而精确的手语翻译引擎，可实现由文字及音视频内容到手语的翻译，再通过专门为手语优化研发的自然动作引擎，进行虚拟形象的驱动。这些技术使得AI手语主播具备高可懂度的手语表达能力和精准连贯的手语呈现效果。
◎采访人员华凌
令人翘首期盼的2022年北京冬奥会即将举行。在关注冬奥会的人群中，有一个特殊的群体，他们虽然听不到赛场的声音，但也希望能了解比赛动态，渴望感受比赛的激情。据统计，全球约有4.3亿人患中度及以上程度的听力障碍，根据全国第二次残疾人抽样调查数据，中国约有听障人士2780万人。
“我们用技术跨越声音的障碍。 ”11月24日，央视新闻联合百度智能云推出的央视总台首个AI手语主播正式亮相——她有着真人般的皮肤、头发、眼睛，形象亲切自然，气质优雅独特。从北京冬奥会开始，她将全年无休用AI智慧为听障用户提供手语服务，让他们快捷的获取比赛资讯。
可提供专业、准确的手语解说
据悉， 9月24日，曾在2021中关村论坛上亮相的冬奥手语播报数字人系统是由北京市科委、北京市残联发起，科技冬奥专项支持，北京智谱AI、凌云光与北京广播电视台联合打造。项目还得到了北京市残联聋人协会的大力支持。系统依托智谱AI打造的数据与知识双轮驱动的智能平台，旨在实现冬奥会期间赛事新闻的实时手语翻译播报。
而此次央视新闻与百度智能云联合打造的央视总台首个AI手语主播，从表情、口型、毛发、服饰身形五大维度打造3D高精超写实的数字人AI模型，让AI驱动的数字人表情则更加亲切自然。
据介绍，百度智能云采用语音识别、机器翻译等人工智能技术，构建了一套复杂而精确的手语翻译引擎，可实现由文字及音视频内容到手语的翻译，再通过专门为手语优化研发的自然动作引擎，进行虚拟形象的驱动。这些技术使得AI手语主播具备高可懂度的手语表达能力和精准连贯的手语呈现效果。
冬奥AI手语主播掌握的手语词汇规范都来自《国家通用手语词典》，经过长时间的智能学习，能够为观众提供专业、准确的手语解说。
AI手语主播的工作空间或将更大
据介绍，百度智能云的数字明星运营平台为AI手语主播提供了技术支持和服务。
目前，数字明星运营平台支持二次元、2D、3D高精多种数字人风格；同时，在内容生产维度支持真人驱动、AI驱动、融合驱动等多种直播方式；基于领先的跨模态技术，口型合成准确性达98.5% 。
“随着AI技术的更迭和进化， 3D虚拟场景不断拓展，冬奥AI手语主播的工作空间会更大。也许不久AI主播会走出演播室，在不同场景中更好地满足新闻呈现多样化的需求。 ”相关项目负责人表示。
【数字人|用人工智能技术跨越声音的障碍】这个冬奥会，也将通过冬奥AI手语主播，让更多的残障人士酣畅淋漓地感受冰雪运动的激情与荣耀。