人类没有足够的高质量语料给AI学了,2026年就用尽( 二 )
文章图片
再结合用户生成的平均数据量 , 就能计算出生成数据的速率 。 (由于地理和时间变化复杂 , 论文简化了用户平均生成数据量计算方法)
根据这一方法 , 计算得出语言数据增长率在7%左右 , 然而这一增长率会随着时间延长逐渐下降 。
预计到2100年 , 我们的语言数据增长率会降低到1% 。
同样类似的方法分析图像数据 , 当前增长率在8%左右 , 然而到2100年图像数据增长率同样会放缓至1%左右 。
论文认为 , 如果数据增长率没有大幅提高、或是出现新的数据来源 , 无论是靠高质量数据训练的图像还是文本大模型 , 都可能在某个阶段迎来瓶颈期 。
对此有网友调侃 , 未来或许会有像科幻故事情节一样的事情发生:
人类为了训练AI , 启动大型文本生成项目 , 大家为了AI拼命写东西 。
文章图片
他称之为一种“对AI的教育”:
我们每年给AI送14万到260万单词量的文本数据 , 听起来似乎比《黑客帝国》中人类当电池要更酷?
文章图片
你觉得呢?
论文地址:
https://arxiv.org/abs/2211.04325参考链接:
https://twitter.com/emollick/status/1605756428941246466
- 沈妍|红绿灯倒计时覆盖量破百万 百度地图:全国3000县市只差1个没有
- 荣耀80系列的上架时间并没有多久|荣耀80pro直屏版全面上线售价3599元
- LG|LG宣布2023年款回音壁:设计更加轻薄化,没有旗舰款产品
- 四级文明到底有多可怕?科学家提都不敢提,人类文明仅为0.73级!
- 硅谷没有群聊
- 人类在探索火星过程中|nasa科学家解释火星上有生命存在吗nasa科学家作出解释
- 刘德音还能继续淡定么?曾说断供对自己没有影响,如今营收却下滑
- 安卓|如果没有华为,国产手机会在世界上处于什么水平?
- 高通传来好消息!华为18亿美元没有白掏,芯片困境或将迎来转机
- 小程序|为什么APP还是没有被小程序取代