专访吴恩达:AI未来10年,从硬件至上到数据为王( 二 )
然而 , 如何在现代AI模型和方法的基础上建立并重新审视这些技术 , 才是新的要求 。
就在几年前 , 我们还没有长寿的AI系统 , 也没有目前这种规模的性能强大的深度模型 。 吴恩达指出 , 自从他在2021年3月开始谈论以数据为中心的AI以来 , 他得到的反应让他想起了大约15年前他和其他人开始讨论深度学习的时候的场景 。
吴恩达说「今天人们的反应是:“我一直都知道这个 , 没有什么新东西” , 到'这不可能成功' 。 "但也有一些人说'对 , 我一直觉得这个行业需要这个东西 , 这是一个伟大的方向' 。 」
「数据为中心」的AI与基础模型
假如说 , 以数据为核心的人工智能是正确的方向 , 那么该如何在现实世界运作这一切呢?吴恩达指出 , 指望机构训练各自的定制AI模型是不现实的 。
唯一一个走出这种困境的办法就是设计一种工具 , 让客户有能力设计自己的模型 , 收集数据 , 表达各自领域的知识 。
文章图片
吴恩达和LandingAI将通过LandingLens实现这一点 , 赋予各领域专家通过数据标记的方式传达知识的能力 。 吴恩达指出 , 在生产领域 , 一般没有大量的数据来做参照 。 比方说 , 如果目标是识别出错的产品 , 那么一条还算不错的生产线就没那么多废品的图片来参照 。
文章图片
在生产领域 , 有时候全世界只有50张图片做参照 。 这对现有的AI来说根本不够 。 这也就是为什么现在关注的重点应该转向让专家通过收集数据来记录他们所拥有的知识 。
吴恩达说 , LandingAI的平台正在做这件事 。 该平台可以帮助用户找到最有用的案例 , 来构建最一致的标签 , 并且提高输入到算法里的图片和标签的质量 。
这里的关键是「一致性」 。 吴恩达和他之前的一些人发现 , 专业知识并不能被单一专家定义 。 对一位专家来说有缺陷的东西可能会被另一位专家重视 。 这种现象并不是才有 , 但只有在不得不生成注释相同的数据集时才会浮出水面 。
吴恩达表示 , 「这就是为什么我们需要好的工具和工作流程来让专家能快速达成一致 。 没有必要在已经打成共识的地方花时间 。 相反 , 我们的目标是关注专家们没有达成一致意见的部分 , 这样他们就可以通过讨论来解决存在缺陷的部分 。 事实证明 , 想让AI系统快速获得良好性能 , 达成整个数据的一致性至关重要 。 」
这种方法不仅很有意义 , 而且也有一些相似之处 。 吴恩达所描述的过程显然背离了当今AI经常采用的「投入更多数据」的方法 , 而是更多指向基于管理、元数据和语义协调的方法 。
事实上 , 像Google前机器翻译主管DavidTalbot这样的人一直在传达这么一个思想:除了从数据中学习之外 , 应用各个领域内的知识对机器翻译也很有意义 。 在应用机器翻译和自然语言处理(NLP)的情况下 , 所说的领域内的知识就指的是语言学 。
文章图片
我们现在已经达到了一个新阶段 , 我们拥有所谓的NLP基础模型:比方说像GPT3这样的巨大模型 。 经过大量数据训练 , 人们可以使用这些模型针对特定的应用程序或领域进行微调 。 然而 , 这类NLP基础模型并没有真正上利用各领域的知识 。
计算机视觉的基础模型能不能做到这一点呢?如果能的话 , 我们该如何实现 , 以及何时能实现?实现又将带来什么?根据吴恩达的说法 , 基础模型既是规模问题 , 也是传统问题 。 他认为这是可以实现的 , 因为有很多研究组正在尝试建立计算机视觉的基础模型 。
- 游戏陪玩行业,乱象诸多,这个产业未来发展前景如何?
- 00后|一二三未来:零零后反内卷
- AMD在对待老玩家方面一直很良心|A卡战未来 10年前的GCN显卡有望支持RSR
- playstation5|Sony 确认PS5 将在未来数月内支援可变更新率
- 程序员|在中国,年龄最大的程序员不过60岁左右,请问未来还可以做什么?
- 摩托罗拉|田言梦语:AMD显卡战未来,性能翻倍,FSR 2.0很强!
- AIoT是人工智能(AI)与物联网(IoT)的有机结合|重新定义万物互联的未来!卡奥斯创智物联引领AIoT行业新生态
- AMD|A卡战未来 10年前的GCN显卡有望支持RSR:免费3倍性能提升
- 美团财报电话会:广义Robotics未来能发挥更大价值
- 药房|AI审方+药师审核,徐汇这家智慧药房未来感十足!