中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始( 三 )






中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始
文章插图

分享嘉宾:张晴晴,爱数智慧创始人兼CEO
题目:多语种对话式AI技术及语料库建设
如今对话式AI成为人工智能行业发展的重要方向,在各大行业场景中得到广泛的应用。但人工智能要想与人实现更自然的对话,还需克服很多难题。人机对话面对较为复杂的场景,其中多语种混杂现象愈发频繁,如何提升机器识别多语种混合表达的能力?报告从对话式AI出发,探讨对话式口语交互为语音识别带来哪些挑战,通过双语声学建模、发音词典如何构建双语识别系统,解决非母语发音的插入语问题。同时,多语种语料库建设对AI识别率提升起到积极的作用。




中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始
文章插图

分享嘉宾:向江旭,美的集团 loT 副总裁兼CTO
题目:多模感知和人机交互在智能家居的应用探索
AI与IoT的结合已经是行业趋势,AI根据人机交互技术和对海量不同场景数据的学习,进行对未来的预测和洞察,而多模感知将大量的数据“采集起来”,由IoT将这些数据“分发”到AI的交互技术当中,实现世界的“AI大脑”端到端的链接。智能家居是离消费者最近的AIoT场景,报告将分享美的多模感知技术、人工智能技术与物联网在智能家居的应用中的落地融合。



中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始
文章插图

分享嘉宾:田彪,阿里巴巴达摩院语音实验室
题目:多模态语音交互的技术实践及发展趋势
随着5G和AIoT技术的快速发展,语音和视觉等多模态技术的融合逐步加深,在新型人机交互入口中的作用越来越明显,本报告以阿里巴巴在智能交通领域的「地铁多模态语音售票机」和协同办公领域的「钉钉智能无人前台」的产品研发实践为基础,介绍声学设计、麦克风阵列处理、远场语音对话、人脸检测与识别等多模态技术的设计思想与方案架构,在多模态数据的助力下,如何在公众嘈杂场景进行多模态融合从而给用户带来更好的产品体验。同时结合产业落地情况与研究进展介绍下一代的产品和技术演进趋势。




中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始
文章插图

分享嘉宾:宋彦,香港中文大学(深圳)数据科学学院教授
题目:面向领域的中文自然语言处理面对的数据挑战及机遇
自然语言处理作为人工智能的核心板块,承载着大量针对大规模以文本为载体的数据处理的需求,近年来发展出了各类基于大数据的处理方案(例如预训练模型等),对数据的数量和质量提出了较高的要求。与通用领域相似,面向特定领域的文本处理任务,从基础的例如分词、命名实体识别等,到复杂的例如阅读理解、机器翻译等,都需要大规模高质量数据的支持。然而,与英文相比,目前中文特定领域的数据建设尚不成熟,不论是可用于训练预训练模型的高质量未标注文本,还是针对特定任务的高质量标注数据,都十分稀缺。这些数据的稀缺使得目前难以训练高性能的中文文本处理模型,进而导致中文特定领域目前仍缺少公开的、被广泛使用的高质量的基础文本处理工具。因此,大力发展中文领域内数据建设,是一项长期且具有重大意义的工作,能够为未来中文文本处理在各个行业的深度发展提供基石,以至于成为自然语言处理发展下一个阶段的重大且实际的机遇。