注意力流|AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别( 二 )


本方法与现有技术相比,其显著优点为:
(1)本方法使用了两个注意力流分别得到了部件级别的关键信息和全局聚合信息,不仅对细粒度图像识别提供了区分新的部件级信息,也补充了对细粒度图像识别有用的微妙全局信息。
(2)对于硬注意力流,使用多示例方法将筛选出的有用深度描述符建模为包,并基于图的方法对包进行编码一体化得到对应细粒度部件的深度描述符的整体表示,丰富了细粒度部分的内在结构相关性。
(3)与基于双线性池的方法相比,我们的方法复杂度更低更加易于训练且有更高的识别效率。
试验结果【 注意力流|AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别】注意力流|AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别
文章插图

在三个常用的少样本细粒度图像识别数据集 (CUB Birds,Stanford Dogs和Stanford Cars) 上进行了实验,上图实验结果表明,论文提出的方法几乎在所有数据集上均明显优于其他基准方法。
注意力流|AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别
文章插图

上图结果显示出我们的模型对语义簇数的鲁棒性,并且当簇数为3时识别的准确率最高。
注意力流|AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别
文章插图

我们提出的基于MIL的聚合方法与原始MIL池化方法的效果,上表结果显示无论是否与全局特征进行连接,我们的方法均表现出较好的效果。
注意力流|AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别
文章插图

从上表结果可见,引入本文中考虑细粒度部件间关系的方法会显著提高少样本低粒度识别的准确性。
注意力流|AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别
文章插图

最后,我们将实验中一些硬/软注意力样例进行可视化,上图中第一排为输入图像;第二排为硬注意力选取的深度描述符的位置,可见均对应物体的细粒度部分,如头、耳、尾、轮胎等;第三排展示软注意力,更多的细节细粒度模式能够被软注意力关注到。
雷峰网