Netflix|AI比我懂中文？BAT的新战争进行中 Netflix

文章图片

文章图片

文章图片

今年以来， AIGC（AI 生产内容）成了新的互联网潮头，就如同年初大火的 Web3 。
最新一波热潮要归功于上周刚刚发布的 ChatGPT ，凭借超乎想象的语言理解能力、沟通技巧和背后的知识储备，不仅技惊四座，也在某种程度上碰到了恐怖谷效应，有些网友甚至认为它「牛得让人有点畏惧」。

但 ChatGPT 对人类语言依然存在理解问题，特别是在中文上，比如就有网友提问「如果你是贾宝玉，会娶谁当老婆」，结果得到一个啼笑皆非的回答：

图/即刻@雨医生
在AI领域，语言理解一直最为核心，也是难以攻克的问题之一，尤其是中文的语言理解。放眼目前全世界的所有语言，中文的难度系数是最高的。相比拉丁语系中的单词，中文汉字的语义更加模糊，容易产生歧义、信息失真等问题，这些都给 AI 提出了更大的挑战。
也是在最近，阿里和腾讯的 AI 接连取得了突破性的进展，中文语言理解又往前再走了关键一步。
AI 中文成绩超人类上月底，在中文语言理解领域权威榜单 CLUE 中，阿里 AI 以 86.685 的总成绩创造了一个新的纪录——该榜单诞生以来AI第一次超过人类成绩（86.678）。仅仅不到一周，腾讯 AI 也更新了自己成绩，以 86.918 的得分超过了人类和阿里 AI 的成绩。

CLUE 总榜，图/CLUE

中国两大互联网巨头，在短短一周内相继超越人类的 CLUE 成绩。
作为业界最权威的中文自然语言理解榜单， CLUE（中文语言理解测评基准）是一组评估AI机器人能够像人类一样理解和响应中文文本的任务，从长短文本分类、多选阅读理解、自然语言推理等 17 项任务中全面考核 AI 模型的语言理解能力。
上线 3 年，该榜单竞争激烈，几乎是中国互联网巨头的兵家必争之地，除了阿里达摩院 NLP 和腾讯混元 AI 大模型团队， OPPO 研究院、快手搜索及美团 NLP 等研究机构也都参与了该榜单的竞争。尽管榜首有过多次易主，但在阿里和腾讯AI最近一次更新之前，从未有过 AI 超过人类成绩。
不过，此次超越实际是指总成绩在总榜上超过人类，具体到子榜单如自然语言推理榜和分类任务排行榜，人类的成绩依然位居第一。换言之，阿里和腾讯的AI模型目前与人类在 CLUE 的不同测评中互有胜负。
而另一边，百度也以中国学生更为切身的方式展示了中国AI的中文理解能力。 9 月举办的 2022 百度万象大会上，百度宣称AI数字人度晓晓挑战了高考作文，针对全国新高考Ⅰ卷题为《本手、妙手、俗手》作答，凭借 48 分的成绩，度晓晓可以排在整体考生作文成绩的前 25% 。

图/百度
中国互联网巨头对中文的理解似乎迎来了一个奇点，阿里云计算部门就在阿里 AI CLUE 成绩首度超越人类后发文称，「这标志着中国对 AI 模型的理解，达到了一个新的水平。」
巨头的AI军备竞赛如果说最近数年 AI 的快速发展要从 2016 年的 AlphaGo 算起， 2020 年夏天 OpenAI 发布 GPT-3 模型，可以视为又一个关键节点。 GPT-3 从发布之初就展现了惊人的 AI 能力，写文章、做翻译、写代码，甚至可以学习一个人的语言模式并与之对话。