模型难复现不一定是作者的错,研究发现模型架构要背锅丨CVPR 2022( 二 )
作者则继续使用决策边界方法 , 可视化了ResNet-18的双下降现象 。
他们通过宽度参数(k:1-64)的改变来增加模型容量 。
训练出的两组模型 , 其中一组使用无噪声标签(labelnoise)的训练集 , 另一组则带有20%的噪声标签 。
最终 , 在第二组模型中观察到了明显的双下降现象 。
文章图片
对此作者表示:
线性模型预测的模型不稳定性也适用于神经网络 , 不过这种不稳定性表现为决策区域的大量碎片 。
也就说 , 双下降现象是由噪声标签情况下决策区域的过度碎片引起的 。
具体来说 , 当k接近/达到10(也就是插值阈值)时 , 由于模型此时拟合了大部分训练数据 , 决策区域被分割成很多小块 , 变得“混乱和破碎” , 并不具备可重复性;此时模型的分类功能存在明显的不稳定性 。
而在模型宽度很窄(k=4)和很宽(k=64)时 , 决策区域碎片较少 , 有高水平的可重复性 。
为了进一步证明该结果 , 作者又设计了一个碎片分数计算方法 , 最终再次验证上图的观察结果 。
文章图片
模型的可复现性得分如下:
文章图片
同样可以看到 , 在参数化不足和过参数化的情况下 , 整个训练过程的可复现性很高 , 但在插值阈值处会出现“故障” 。
有趣的是 , 即使没有噪声标签 , 研究人员发现他们设计的量化方法也足够敏感 , 可以检测到可复现性的细微下降(上图蓝线部分) 。
目前代码已经开源 , 要不要来试试你的模型是否容易复现?
论文地址:
https://arxiv.org/abs/2203.08124
GitHub链接:
https://github.com/somepago/dbVi
- 众筹超算直播训练1760亿参数AI大模型,九百工程师搞开源
- 蚂蚁森林|马云斥巨资在沙漠里面种的“树”,如今成啥样了?网友:难以想象
- 软件|CAD难学吗?需要多久?学习难点在哪?
- 好消息!深圳五区恢复运营,多平台助力卖家渡过难关!
- 如果人类灭绝了,自然还能通过进化产生人类吗?很难
- 你家有多少个“被迫”买下的共享充电宝?2022年|共享充电宝的“归还难”成为新槽点
- 新能源卡车前景广阔?需要先攻克这七大难关
- 短视频|搜狐难救抖音
- iPhoneSE3都用上A15芯片了,iPhone14标准版也要用A15?难以理解
- 科沃斯|不要再为擦窗户玻璃“难”找借口了,科沃斯擦窗机W1 Pro 体验实测