Selvaraju_Grad-CAM_Visual_Explanations_ICCV_2017_paper.pdf
5 E币
成为会员,免费下载资料
文件大小:1.43 MB
上传者:新唐单片机
时间:2022-01-05 18:44:00
下载量:5
CAM 算法是论文《Learning Deep Features for Discriminative Localization》中提出的,CNN网络虽然在训练时可能未提供对象的位置,但是仍然具有很强的定位特征能力,如图所示。图是 CAM 运行的效果,可以看到对于刷牙这一类,CNN 能有效地定位到牙刷,而对于锯树,CNN 能有效定位到电锯。
1.jpg
但是 CNN 后面通常会接全连接层,作者认为全连接层会影响 CNN 的定位能力。因此提出了 CAM 算法,用全局平均池化 GAP 代替全连接层,从而保留模型的定位特征能力。全局平均池化 GAP 通常起到正则化的作用,防止训练时的过拟合,GAP 和其他池化方法的区别如下图所示,全局的池化方法就是把池化的范围扩大到整个特征图的尺寸。
下图是 CAM 的模型示意图,最后一个卷积层后面采用了 GAP,GAP 后再利用 Softmax 层进行分类。图中最后一层卷积层的通道数为 n,因此 GAP 后得到的向量维度是 n,分别对应每个通道。图中的 w1, ..., wn 指 Softmax 层的权重,这里对应的是一个类 class 的权重 (图中的类是 Australian terrier 即澳大利亚梗犬)。
展开》
折叠》