数字人|用人工智能技术跨越声音的障碍

语音识别、机器翻译等人工智能技术 , 构建了一套复杂而精确的手语翻译引擎 , 可实现由文字及音视频内容到手语的翻译 , 再通过专门为手语优化研发的自然动作引擎 , 进行虚拟形象的驱动 。 这些技术使得AI手语主播具备高可懂度的手语表达能力和精准连贯的手语呈现效果 。
◎采访人员 华 凌
令人翘首期盼的2022年北京冬奥会即将举行 。 在关注冬奥会的人群中 , 有一个特殊的群体 , 他们虽然听不到赛场的声音 , 但也希望能了解比赛动态 , 渴望感受比赛的激情 。 据统计 , 全球约有4.3亿人患中度及以上程度的听力障碍 , 根据全国第二次残疾人抽样调查数据 , 中国约有听障人士2780万人 。
“我们用技术跨越声音的障碍 。 ”11月24日 , 央视新闻联合百度智能云推出的央视总台首个AI手语主播正式亮相——她有着真人般的皮肤、头发、眼睛 , 形象亲切自然 , 气质优雅独特 。 从北京冬奥会开始 , 她将全年无休用AI智慧为听障用户提供手语服务 , 让他们快捷的获取比赛资讯 。
可提供专业、准确的手语解说
据悉 , 9月24日 , 曾在2021中关村论坛上亮相的冬奥手语播报数字人系统是由北京市科委、北京市残联发起 , 科技冬奥专项支持 , 北京智谱AI、凌云光与北京广播电视台联合打造 。 项目还得到了北京市残联聋人协会的大力支持 。 系统依托智谱AI打造的数据与知识双轮驱动的智能平台 , 旨在实现冬奥会期间赛事新闻的实时手语翻译播报 。
而此次央视新闻与百度智能云联合打造的央视总台首个AI手语主播 , 从表情、口型、毛发、服饰身形五大维度打造3D高精超写实的数字人AI模型 , 让AI驱动的数字人表情则更加亲切自然 。
据介绍 , 百度智能云采用语音识别、机器翻译等人工智能技术 , 构建了一套复杂而精确的手语翻译引擎 , 可实现由文字及音视频内容到手语的翻译 , 再通过专门为手语优化研发的自然动作引擎 , 进行虚拟形象的驱动 。 这些技术使得AI手语主播具备高可懂度的手语表达能力和精准连贯的手语呈现效果 。
冬奥AI手语主播掌握的手语词汇规范都来自《国家通用手语词典》 , 经过长时间的智能学习 , 能够为观众提供专业、准确的手语解说 。
AI手语主播的工作空间或将更大
据介绍 , 百度智能云的数字明星运营平台为AI手语主播提供了技术支持和服务 。
目前 , 数字明星运营平台支持二次元、2D、3D高精多种数字人风格;同时 , 在内容生产维度支持真人驱动、AI驱动、融合驱动等多种直播方式;基于领先的跨模态技术 , 口型合成准确性达98.5% 。
“随着AI技术的更迭和进化 , 3D虚拟场景不断拓展 , 冬奥AI手语主播的工作空间会更大 。 也许不久AI主播会走出演播室 , 在不同场景中更好地满足新闻呈现多样化的需求 。 ”相关项目负责人表示 。
【数字人|用人工智能技术跨越声音的障碍】这个冬奥会 , 也将通过冬奥AI手语主播 , 让更多的残障人士酣畅淋漓地感受冰雪运动的激情与荣耀 。