Netflix|AI比我懂中文?BAT的新战争进行中

Netflix|AI比我懂中文?BAT的新战争进行中

文章图片

Netflix|AI比我懂中文?BAT的新战争进行中

文章图片

Netflix|AI比我懂中文?BAT的新战争进行中

文章图片

Netflix|AI比我懂中文?BAT的新战争进行中

今年以来 , AIGC(AI 生产内容)成了新的互联网潮头 , 就如同年初大火的 Web3 。
最新一波热潮要归功于上周刚刚发布的 ChatGPT , 凭借超乎想象的语言理解能力、沟通技巧和背后的知识储备 , 不仅技惊四座 , 也在某种程度上碰到了恐怖谷效应 , 有些网友甚至认为它「牛得让人有点畏惧」 。

但 ChatGPT 对人类语言依然存在理解问题 , 特别是在中文上 , 比如就有网友提问「如果你是贾宝玉 , 会娶谁当老婆」 , 结果得到一个啼笑皆非的回答:

图/即刻@雨医生
在AI领域 , 语言理解一直最为核心 , 也是难以攻克的问题之一 , 尤其是中文的语言理解 。 放眼目前全世界的所有语言 , 中文的难度系数是最高的 。 相比拉丁语系中的单词 , 中文汉字的语义更加模糊 , 容易产生歧义、信息失真等问题 , 这些都给 AI 提出了更大的挑战 。
也是在最近 , 阿里和腾讯的 AI 接连取得了突破性的进展 , 中文语言理解又往前再走了关键一步 。
AI 中文成绩超人类上月底 , 在中文语言理解领域权威榜单 CLUE 中 , 阿里 AI 以 86.685 的总成绩创造了一个新的纪录——该榜单诞生以来AI第一次超过人类成绩(86.678) 。 仅仅不到一周 , 腾讯 AI 也更新了自己成绩 , 以 86.918 的得分超过了人类和阿里 AI 的成绩 。

CLUE 总榜 , 图/CLUE

中国两大互联网巨头 , 在短短一周内相继超越人类的 CLUE 成绩 。
作为业界最权威的中文自然语言理解榜单 , CLUE(中文语言理解测评基准)是一组评估AI机器人能够像人类一样理解和响应中文文本的任务 , 从长短文本分类、多选阅读理解、自然语言推理等 17 项任务中全面考核 AI 模型的语言理解能力 。
上线 3 年 , 该榜单竞争激烈 , 几乎是中国互联网巨头的兵家必争之地 , 除了阿里达摩院 NLP 和腾讯混元 AI 大模型团队 , OPPO 研究院、快手搜索及美团 NLP 等研究机构也都参与了该榜单的竞争 。 尽管榜首有过多次易主 , 但在阿里和腾讯AI最近一次更新之前 , 从未有过 AI 超过人类成绩 。
不过 , 此次超越实际是指总成绩在总榜上超过人类 , 具体到子榜单如自然语言推理榜和分类任务排行榜 , 人类的成绩依然位居第一 。 换言之 , 阿里和腾讯的AI模型目前与人类在 CLUE 的不同测评中互有胜负 。
而另一边 , 百度也以中国学生更为切身的方式展示了中国AI的中文理解能力 。 9 月举办的 2022 百度万象大会上 , 百度宣称AI数字人度晓晓挑战了高考作文 , 针对全国新高考Ⅰ卷题为《本手、妙手、俗手》作答 , 凭借 48 分的成绩 , 度晓晓可以排在整体考生作文成绩的前 25% 。

图/百度
中国互联网巨头对中文的理解似乎迎来了一个奇点 , 阿里云计算部门就在阿里 AI  CLUE 成绩首度超越人类后发文称 , 「这标志着中国对 AI 模型的理解 , 达到了一个新的水平 。 」
巨头的AI军备竞赛如果说最近数年 AI 的快速发展要从 2016 年的 AlphaGo 算起 , 2020 年夏天 OpenAI 发布 GPT-3 模型 , 可以视为又一个关键节点 。 GPT-3 从发布之初就展现了惊人的 AI 能力 , 写文章、做翻译、写代码 , 甚至可以学习一个人的语言模式并与之对话 。