LeCun在线访谈:我的深度学习之路( 二 )
CNN的出现
同之前的研究一样 , LeCun展开CNN研究的时候 , 灵感也来自于图书馆 。
从前人对于视觉系统的生物学研究中 , LeCun发现了图像的秘密 。 在博士即将毕业之前的6个月 , LeCun开始与Leo一起开始编写一个深度学习框架 。
最终他们在1989年发表论文 , 通过使用梯度下降方法训练的CNN进行图像识别 , 这成为了日后计算机视觉研究的基础理论 。
文章图片
「当时还没有Python , 所以我基本上使用的是自己的语言编写的代码」 , 那时由于多伦多有更好的研究条件 , 所以LeCun搬到了多伦多继续自己的研究 。
在多伦多的前六个月进展并不理想 , 以至于Hinton多次在质疑LeCun是不是在「摸鱼」 。
文章图片
LeCun(右)与导师Hinton(中)、Bengio(左)合影
「我当时在尝试手机一些小数据集 , 简而言之 , 就是用鼠标把一个个字符连起来」 。
然而当LeCun去贝尔实验室时 , 他被实验室的一个包含上千个样本的数据集震惊到了 。 「当时我想这太疯狂了 。 」
在1988年 , 贝尔实验室在2个月内做出了最好的结果 。 LeCun搭建研究框架 , 张量引擎 , 以及一套前端语言 , 基本的机器学习流程就这样搭建出来了 。
可以说 , 后来的TensorFlow、PyTorch等等都是基于这个概念打造的 。
在视觉领域应用自监督学习可行吗?
在谈到自监督学习时 , LeCun说道在近些年的研究中 , 它在计算机视觉领域的确产生了许多令人兴奋的成果 。
当然 , 与基于全球巨大的图像识别数据集的研究相比 , 自监督学习仍然没有胜算 。 但是在语音识别等其他领域 , 监督学习的确带来了许多成果 。 比如 , 它可以在10分钟以内训练一套语音识别系统 。
之前DeepMind两位大神DavidSilver以及RichardSutton不久前发表过惊人言论:通过奖励最大化结合强化学习就能实现通用人工智能 。
文章图片
【LeCun在线访谈:我的深度学习之路】关于这个论调LeCun也在采访中表明了自己的态度:
「他们的观点非常可笑 , 要在现实世界里进行数千年的训练 。 我完全不同意这种说法 , 我认为这完全是错误的 。 所以我们未来也不打算向那个方向前进」 。
目前的SSL系统关键问题在于现在有一个监督系统 , 你只提供很少的样本 , 然后你使用监督系统让机器学会从一个输入部分来对另一部分进行基本的预测 。
比如说 , 提供一幅图像的左边和右边 , 那系统能否判断出两个部分是来自于同一图像呢?
又「比如通过输入两段分割的视频 , AI能否自动判断两个视频的逻辑关系?」
所以这就需要机器了解两者之间的依赖关系 。
「所以在计算机视觉方面 , 我认为最大的挑战是让机器通过看视频来了解这个世界的运作方式」 。
「SSL将对计算机视觉领域产生重大影响 。 」
谈及上半年做了哪些工作 , LeCun阐述了如何让机器进行SSL?
花一个小时让机器「随机」观看Instagram上10亿张公开照片 。
文章图片
也就是说 , 这些图片并未做过通常用于算法训练的标签和注释处理 。
接下来 , 使用SwAV算法在这些图像上进行预训练 。 也就是 , 利用数据集一边学习一边处理数据 , 完成快速分组、物体检测等任务 。
在这些任务中 , SwAV表现都出奇地好 , 所以如果你有一个足够大的未经标注的数据集 , 这些技术将会给你带来SOTA级的表现 。 所以SSL未来也会为计算机视觉领域带来巨大的影响 。
- 苹果7|明明我的苹果7P还能再战两年,为什么要我淘汰
- 小米科技|用了一个月的小米后再次换回华为?不吹不捧,说一说我的心里话!
- 紫光展锐|从iOS系统更换到MIUI13的7天后:不吹不黑,说一说我的心里话!
- 小米科技|花4699买了一台104W跑分的小米12Pro:上手3天后,说说我的心里话
- 环绕屏|房子大是我的错吗?大户型的wifi信号有救了!
- 20年前年轻人用什么听歌?晒晒我的sony NTE MD MZ-505
- 索尼|已经20年前年轻人用什么听歌?晒晒我的sony NTE MD MZ-505
- 我对我的CRM系统合作伙伴不完全满意,该怎么办?
- Java|二本谈币:关于web3.0,谈两句我的看法
- 抖音最爱我的人最依赖我的人最懂我的人最离不开我的人从那天起再不会有是什么歌 歌曲分享