使用深度学习的无监督对象检测和语义分割

使用深度学习的无监督对象检测和语义分割 2023-02-14 14:48:11 1464

Meta AI 发布了 CutLER,这是一款最先进的零镜头无监督对象检测器,可在视频帧、绘画、草图等不同领域的 2 个基准数据集上将检测性能提高 7.11 倍以上。

该模型的简单性允许与不同域的不同对象检测架构(例如掩码R-CNN)兼容。此外,它需要更少的数据来训练,更少的人力来标记数据以进行对象检测。与其他模型相比,对标记较少的数据的要求在数据丰富的时代很重要,这为更好的模型铺平了道路,而无需在数据标记上花费大量精力。

Meta AI 发布了一个用于学习图像表示的初始自监督模型,这意味着以无监督的方式从图像中学习重要对象,在 2021 年称为 DINO。这项初步工作使研究界能够跟踪图像中的物体并生成注意力图。DINO注意力图可以用作图像特征来执行语义分割和对象检测等任务。

使用这些功能,可以创建一个逐个补丁的相似性矩阵,该矩阵将图像中的不同补丁相关联。使用相似性矩阵作为归一化切割和图像分割的输入,将图像分割视为图分区任务,可以获得图像的单个前景对象掩码。当获得一个对象掩码时,与前一个对象关联的矩阵值将被屏蔽。此算法称为 MaskCut,对图像中的多个对象蒙版重复。

下一步是根据用户偏好(如Mask R-CNN)使用检测器,该检测器使用称为DropLoss的丢失函数。该检测器将通过探索其他图像区域进行对象检测来帮助通过 MaskCut 检测丢失的物体。DropLoss 不会惩罚不与基本事实重叠的预测区域,而是忽略每个具有最大重叠的区域的损失(交集超过并集),并鼓励探索不同的图像区域(即探索低重叠区域)。检测器在 ImageNet 数据集上进行训练,使用 DINO 进行神经网络权重初始化。

该模型多次使用相同的数据集进行自我训练,通过使用监督对象检测器改进 MaskCut 检测。每次训练都使用之前的权重进行下一次迭代。CutLER是Cut and Learn的缩写,这就是它的作用。

易百纳社区

评估对象检测器性能的最常见测量是平均精度,但由于模型与类无关,因此平均召回率是一个很好的补充指标。考虑到这一点,该模型的性能优于以前的无监督最先进的模型(例如FreeSOLO),是平均精度和平均召回率的两倍以上。此外,在性能方面,它更接近最先进的监督方法,如Mask R-CNN,更接近于像人类一样学习图像表示。

易百纳社区

Meta AIGitHub上发布了CutLER。要训练和评估模型,请尝试以下命令:

python train_net.py 
--num-gpus 8 \ --config-file model_zoo/configs/COCO-Semisupervised/cascade_mask_rcnn_R_50_FPN_{K}perc.yaml \ 
MODEL.WEIGHTS /path/to/cutler_pretrained_model


声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
红包 1 1 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区