文章图片
文章图片
文章图片
今年以来 , AIGC(AI 生产内容)成了新的互联网潮头 , 就如同年初大火的 Web3 。
最新一波热潮要归功于上周刚刚发布的 ChatGPT , 凭借超乎想象的语言理解能力、沟通技巧和背后的知识储备 , 不仅技惊四座 , 也在某种程度上碰到了恐怖谷效应 , 有些网友甚至认为它「牛得让人有点畏惧」 。
但 ChatGPT 对人类语言依然存在理解问题 , 特别是在中文上 , 比如就有网友提问「如果你是贾宝玉 , 会娶谁当老婆」 , 结果得到一个啼笑皆非的回答:
图/即刻@雨医生
在AI领域 , 语言理解一直最为核心 , 也是难以攻克的问题之一 , 尤其是中文的语言理解 。 放眼目前全世界的所有语言 , 中文的难度系数是最高的 。 相比拉丁语系中的单词 , 中文汉字的语义更加模糊 , 容易产生歧义、信息失真等问题 , 这些都给 AI 提出了更大的挑战 。
也是在最近 , 阿里和腾讯的 AI 接连取得了突破性的进展 , 中文语言理解又往前再走了关键一步 。
AI 中文成绩超人类上月底 , 在中文语言理解领域权威榜单 CLUE 中 , 阿里 AI 以 86.685 的总成绩创造了一个新的纪录——该榜单诞生以来AI第一次超过人类成绩(86.678) 。 仅仅不到一周 , 腾讯 AI 也更新了自己成绩 , 以 86.918 的得分超过了人类和阿里 AI 的成绩 。
CLUE 总榜 , 图/CLUE
中国两大互联网巨头 , 在短短一周内相继超越人类的 CLUE 成绩 。
作为业界最权威的中文自然语言理解榜单 , CLUE(中文语言理解测评基准)是一组评估AI机器人能够像人类一样理解和响应中文文本的任务 , 从长短文本分类、多选阅读理解、自然语言推理等 17 项任务中全面考核 AI 模型的语言理解能力 。
上线 3 年 , 该榜单竞争激烈 , 几乎是中国互联网巨头的兵家必争之地 , 除了阿里达摩院 NLP 和腾讯混元 AI 大模型团队 , OPPO 研究院、快手搜索及美团 NLP 等研究机构也都参与了该榜单的竞争 。 尽管榜首有过多次易主 , 但在阿里和腾讯AI最近一次更新之前 , 从未有过 AI 超过人类成绩 。
不过 , 此次超越实际是指总成绩在总榜上超过人类 , 具体到子榜单如自然语言推理榜和分类任务排行榜 , 人类的成绩依然位居第一 。 换言之 , 阿里和腾讯的AI模型目前与人类在 CLUE 的不同测评中互有胜负 。
而另一边 , 百度也以中国学生更为切身的方式展示了中国AI的中文理解能力 。 9 月举办的 2022 百度万象大会上 , 百度宣称AI数字人度晓晓挑战了高考作文 , 针对全国新高考Ⅰ卷题为《本手、妙手、俗手》作答 , 凭借 48 分的成绩 , 度晓晓可以排在整体考生作文成绩的前 25% 。
图/百度
中国互联网巨头对中文的理解似乎迎来了一个奇点 , 阿里云计算部门就在阿里 AI CLUE 成绩首度超越人类后发文称 , 「这标志着中国对 AI 模型的理解 , 达到了一个新的水平 。 」
巨头的AI军备竞赛如果说最近数年 AI 的快速发展要从 2016 年的 AlphaGo 算起 , 2020 年夏天 OpenAI 发布 GPT-3 模型 , 可以视为又一个关键节点 。 GPT-3 从发布之初就展现了惊人的 AI 能力 , 写文章、做翻译、写代码 , 甚至可以学习一个人的语言模式并与之对话 。
- |一个Al有多会聊天?这两天爆火的ChatGPT,情商比我高
- 教你看懂主板上的那些接口
- 手机壳|手机壳后面为什么要放一张钱?好多人都不懂,看完抓紧放一张
- 著名美剧制作人Shonda Rhimes将为Netflix打造VR内容
- MIUI|外观胜过惠威漫步者,声音改进美国声,这款有源音箱很懂国人心理
- 芯片|OPPO Reno9值得入手吗?寥寥数语看完就懂
- 移动支付|如何从零开始学做互联网运营?懂这些让你快速进阶
- Netflix|当互联网人走向田间地头,关心粮食和蔬菜
- 洞察趋势!一文读懂2022中国光伏玻璃行业重点企业对比分析:福莱特vs信义光能
- 三星|终于理解为什么手机要换苹果了,内行人懂的原因,让人无法反驳!