目标检测入门——术语篇 | Hotel’s Blog (hotelll.github.io)//借鉴以下图表
术语 | 解释 |
---|---|
IoU | 图和框的 交集/并集,判断检测是否正确的阈值,通常为 0.5。 |
P | 每张图像中被检测出的正确目标占总目标数的多少。 |
AP | 对于一个类别的平均精度,图像个数/总精度和。 |
MAP | 所有类别的平均精度和/总类别数。 |
AP50… | AP50代表 IoU 取 0.5,AP60代表 IoU 值取 0.6。数值越高越难。 |
ROI | Region of Interest,有很大可能性包含检测目标的区域。 |
Anchor | 预先设定在图像上的密集方框,用于后续检测标记。 |
Region Proposals | 建议区域,经过 Region Proposal Network(RPN) 得到一个 region 的 p≥0.5,则这个 region 中可能具有目标,这些选出来的区域被称为 ROI(Region of Interests)。RPN 同时会在 feature map 上框定 ROI 大致位置,输出 Bounding-box。 |
one-stage | 一步检测器,指从图片到检测结果一步到位。(e.g. YOLO, SSD) |
two-stage | 两步检测器,指分两步走,先从图片提取 ROI,再进行检测。(e.g. RCNN, FPN, etc.) |
skeleton | 骨骼点,常见于行为检测数据集,标记人体几个重要位置的数据。 |
Re-ID | 行人重识别,利用计算机视觉技术判断图像或者视频序列中是否存在特定人的技术。 |
backbone | 图像特征提取器,往往是目标检测的第一步,常用 ResNet |
head | 分类+定位器 |
neck | 插在 backbone 和 detection head 之间的模块,使网络更好地融合/提取 backbone 给出的特征,提高网络性能,例如:FPN,NAS-FPN,PAN,ASFF,RFB,SPP。这部分是科研的主攻点。 |
目标检测网络中的neck、head等是什么意思?
在目标检测网络中,neck是指连接backbone和head的中间层,它的主要作用是将backbone提取的特征进行进一步的处理,以便与head中的分类器和回归器相结合,生成最终的检测结果。而head则是输出层,它包含一个分类器和一个回归器,用于预测目标的类别和位置。因此,neck和head都是目标检测网络中非常重要的组成部分。
请详细讲一下head
在目标检测网络中,head是输出层,主要负责预测目标的类别和位置。它通常包含一个分类器和一个回归器,用于生成最终的检测结果。
分类器用于判断目标属于哪个类别,通常是一个全连接层(有多少类就有多少结点),其输入是neck提取的特征,输出是每个类别的得分。在训练过程中,分类器的参数会被不断优化,以提高模型的分类准确率。
回归器则用于预测目标的位置,通常是一个包含4个输出节点的全连接层,对应目标的左上角和右下角的坐标。在训练过程中,回归器的参数也会被不断优化,以提高模型的位置精度。
在生成最终的检测结果时,通常会使用非极大值抑制(NMS)算法对输出结果进行筛选,以去除重叠的检测框,并选择置信度最高的检测框作为最终的结果。
需要注意的是,不同的目标检测网络可能会有不同的输出层结构,比如一些网络可能会在head中使用多个分类器和回归器,以提高检测精度和速度。
RPN与Head的关系?
在Faster R-CNN中,Region Proposal Network(RPN)和Head是两个独立的模块,但它们是紧密相连的,一起组成了完整的目标检测模型。
RPN是用于生成候选框的模块,它接受来自backbone的特征图作为输入,通过滑动窗口的方式在特征图上生成一组候选框,并对每个候选框的前景/背景进行分类和边界框回归。具体来说,RPN通过卷积操作提取特征,然后使用锚点框对特征图上的每个位置进行覆盖,得到候选框。而分类器和回归器则是用来预测每个候选框的前景/背景和边界框偏移量的。
Head则是用于检测和分类候选框的模块,它接受来自RPN的候选框作为输入,并在每个候选框上进行分类和边界框回归。Head的分类器和回归器通常是全连接层,用于对每个候选框进行分类和位置预测。最终,通过应用非极大值抑制(NMS)算法来去除重叠的检测框并选择最终的检测结果。
因此,RPN和Head的关系是,RPN用于生成候选框,Head用于检测和分类候选框,二者协同工作构成了Faster R-CNN的完整目标检测流程。
Reference
ChatGPT
五、目标检测基础和概念与术语 – 知乎 (zhihu.com)
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
相关推荐: 用Python白嫖WPS付费功能:把PPT转为 1张 长图,1行代码搞定
大家好,这里是程序员晚枫,小红薯也叫这个名。读者群👉点我直达。 上次在同名小破站给大家分享👉1行代码,PPT转图片后,评论区有朋友反映:上次分享的是把50页PPT转成了50张图片,但他还想要把1份PPT转成1张长图的代码。 每一个读者的认真评论,都必须给安排~…