语音识别|3大赛道，2000万奖池，这场面向全球的人工智能大赛等你挑战网络安全|关键信息基础设施安

编辑：QQ
【导读】聚焦前沿研究方向，致力于解决实际应用难题。这场面向全球的人工智能新赛事报名及初赛正在火热进行中！创新赛、揭榜赛、创业赛，三大赛道等你来！新一轮科技革命蓬勃兴起，人工智能技术不断向纵深发展，改变产业生态，重塑社会面貌。
随着万物互联时代的到来，我们也需要开发更先进的人工智能方法，以应对越来越多的产业应用及科学研究的需求。
为推动人工智能技术发展，之江实验室、中国人工智能产业发展联盟、杭州市人民政府共同主办了一场面向全球的人工智能赛事——2021之江杯全球人工智能大赛，设创新赛、揭榜赛、创业赛三个赛道，共2000万总奖池，以发掘人工智能领域优秀人才，加快打造人工智能创新高地。

文章插图
用AI解决实际应用难题
在嘈杂环境下，如何识别不同对象的声音并保证语音转换的准确率？当计算机面对它从未见过的某类物体时，如何正确识别物体的类别？
这些极具实际应用价值的技术问题是2021之江杯全球人工智能大赛创新赛的赛题——非确定场景语音识别、零样本目标物体识别。

文章插图
【语音识别|3大赛道，2000万奖池，这场面向全球的人工智能大赛等你挑战】据大赛出题人介绍，非确定场景语音识别主要考察参赛队伍在声纹识别和语音识别两方面的技术积累。「参赛者需要提取不同说话人的声纹特征，识别出语音数据集中其中特定的说话人，然后再将提取出来的语音翻译为文本。」
在这道赛题中，设置了城市道路环境场景、地铁机场环境场景、餐厅环境场景、居家环境场景和室外风雨天场景5个与日常生活息息相关的场景。通过设置非确定性的环境、包括古诗文在内的各种类型的语音文本、包含多位说话人同时说话的语音段落，考察参赛选手的综合能力以及细节处理能力。
为了让赛题更贴近实际应用场景，本次大赛将零样本目标物体识别的数据集限定在安防检测的场景之下。「在训练的数据集中，可能是电脑、手机、水杯这些常见物品的图像，但在测试集中，需要机器学习模型能够识别出一些异常或者是有危险性的目标对象。」本次大赛的出题人表示。
「如果参赛选手的语音识别机器学习模型能够达到比较高的精度，是能够直接应用在相关场景中的。而零样本目标物体识别具有更高的前沿性，是近年来学术界聚焦的一个热门方向，在一些无法获得大量训练数据的专业领域，有着更大的应用潜力。」
用AI赋能各行各业
在本届之江杯全球人工智能大赛中，特别设置了揭榜赛，规划了四大赛题——基于人工智能生成模型的可编辑影视场景生成、基于深度生成网络的多类别参数化三维模型生成算法和系统、基于数据与计算驱动的材料设计算法与模型、基于靶标结构的小分子配体从头设计与生成。
「这些选题涵盖了艺术创作以及材料学、医学相关科学研究领域。」之江实验室基础理论研究院应用数学与机器智能研究中心研究专家刘斌表示，「赛题设置反映了当前人工智能的一大发展趋势，即人工智能与各行业中计算问题的深度结合。以深度学习为代表的人工智能技术，为我们提供了可将多模态、多领域海量数据进行汇聚并高效准确地从中提取规律、价值的可能。」
跟传统竞赛方式不同，揭榜赛聚焦前沿研究方向，更看重的是项目的实质效果，能不能达到预期目标。之江实验室对于在本次大赛中揭榜成功的研究团队和项目会进行长期跟踪，评估项目成果。根据大赛赛制，揭榜赛每个赛题最多评比出1-2支挑战成功团队，将给予300-500万科研经费资助。