目标检测
技巧
Ensembling:Train several networks independently and average their outputs Multi-crop at test time:Run classifier on multiple versions of test images and average results
定位
Need to output bx, by, bn, bw, class label (1-4)
需人工标注特征点的坐标
基于滑动窗口的目标检测算法
- 先训练卷积网络识别物体
- 滑动+放大窗口+再次滑动
问题:计算效率大,慢
在卷积层上的滑动窗口目标检测算法
一次得到所有的预测值。问题:可能不准确
yolo 边界框
图像划分、边界框预测、类预测、最终预测
物体只会被分配到其中一个格子(观察对象的中点)
单次卷积实现,共享计算
优点:快
评估指标:交并比IoU函数(“Correct” if loU ≥ 0.5)
非极大值抑制(NMS)
确保只检测出一次
- 当p小于阈值,去除重复框。
- 选择最高概率的
- 去除和高亮标记边界框重叠面积高的边框
- 循环
若n个对象,则做n次非极大值抑制
Anchor box
解决两个对象同时出现在同一个单位中
观察哪个Anchor box的IoU更高
可以手工决定Anchor box形状大小,也可以通过K-means算法重新调整Anchor Boxes,保证最优的边界框预测。
YOLO
最后,跑非极大值抑制
候选区域