论文: PIoU Loss: Towards Accurate Oriented Object Detection in Complex Environments
data:image/s3,"s3://crabby-images/2c4cd/2c4cd51e842788d28c1f49d473747bb5dd077d26" alt=""
Introduction
当前的目标检测方法由于BB(bounding boxes)的特性,对倾斜和密集物体的检测存在一定的局限性。为了解决这个问题,研究者扩展出了带旋转参数的OBB(oriented bounding boxes),即从BB(
)扩展为OBB(
),其中
旋转角度,这样OBB就能更紧凑地包围目标,可以更好地检测旋转和密集的物体。
data:image/s3,"s3://crabby-images/77b6c/77b6c31e496f813e7da6243610cc3b4bf9f1efd8" alt=""
目前的OBB-based方法大多数在anchor-based架构上采用距离损失来优化上述的5个参数,并且在航空图片的目标检测上已经有一些应用。但其检测性能在更复杂的场景中依然存在局限性,主要原因在于距离损失更多地是优化旋转角度误差,而不是优化全局IoU,特别是对长条形物体很不敏感。如图a所示,两个IoU相差很大的情景下,距离损失的结果却是一样的。
data:image/s3,"s3://crabby-images/dbd28/dbd28b3fc183d335261b798f20704ccd0a511bad" alt=""
为了解决这个问题,论文提出PIoU(Pixels-IOU)损失来同时提高旋转角度和IoU的准确率。如图b所示,PIoU损失能直接反映物体间的IoU,但由于OBB间的相交区域可能是多边形,OBB的IoU比BB的IoU要难算得多,所以PIoU损失以逐像素判断的方式进行IoU计算并且是连续可微的。另外论文还提供了包含高长宽比倾斜目标的检测数据集Retail50K,方便OBB-based检测算法的研究。
论文的贡献如下:
-
提出新的损失函数PIoU损失,能够提升倾斜目标的检测效果。
-
提供新的数据集Retail50K,可以更好的进行OBB-based算法的评估。
-
通过实验证明PIoU损失的有效性,能够运用于anchor-based和anchor-free方法。
Pixels-IoU (PIoU) Loss
对于OBB
(
),理想的损失函数能够引导网络最大化IoU,降低
的错误率。为了到达这个目的,需要准确且高效地计算OBB间的IoU,论文采用了像素计数的方式来计算IoU。
data:image/s3,"s3://crabby-images/ef1c7/ef1c799cdc48ab150d3d88c973f9210ebed56be7" alt=""
对于点
和OBB
,根据其到中线的距离
和中线交点到中点的距离
来判断点是否在OBB内:
data:image/s3,"s3://crabby-images/3bb01/3bb0164d1b7c05cb2dd0639b9fc284b9befb12de" alt=""
data:image/s3,"s3://crabby-images/a9fd4/a9fd4ea381b9a831a87a8d8d6bcf88d8ee59849d" alt=""
定义
为包围
和
的最小正方形,可以通过判断
中的所有像素来计算
和
间的交集区域和并集区域:
data:image/s3,"s3://crabby-images/70557/70557b703e8bb3b757a65f0b90f80cb32fb27c74" alt=""
最后通过
除以
计算IoU,但公式1并不是连续可微函数,导致不能进行反向传播训练。为了解决这个问题,将公式1转换为两个核的乘积
:
data:image/s3,"s3://crabby-images/e57a3/e57a35df0aa70c136aa01e4578b7a52c80edaa17" alt=""
data:image/s3,"s3://crabby-images/bea90/bea9021dcdbf2f30b173c0ef2aa9142f8ebdc4d2" alt=""
其中
用于控制对目标像素
的敏感程度,由于公式9使用了相对位置信息(图a的点距离和三角形的角度),所以
和
均是对OBB的旋转角度和大小敏感的。
data:image/s3,"s3://crabby-images/e0cb1/e0cb1b13632819b17d8a1cf83760ff8e1be20841" alt=""
如图b所示,
是连续可微的,且与公式1类似。当
在
内时,
接近于1,反之则接近于0。为此,
和
的交并集区域计算变为:
data:image/s3,"s3://crabby-images/85c29/85c29d2908c1ad0c2eda3f1349363910c6fe5990" alt=""
为了降低公式11的计算量,简化为:
data:image/s3,"s3://crabby-images/866e6/866e68e466ad48bc47560eb11ad9b0ffa050cb59" alt=""
基于公式10和公式12,PIoU的计算为:
data:image/s3,"s3://crabby-images/1a8ec/1a8ecffdeabddf4db3834fa881ba707222bfd69d" alt=""
定义
为所有正样本对,PIoU损失的计算为:
data:image/s3,"s3://crabby-images/47c31/47c31fd33ac8ecaa0e2a6b6fccc458a817235bce" alt=""
PIoU损失也可用于无交集的OBB,因为PIoU始终大于零,梯度依然可以计算,另外PIoU损失也可以用于正常的BB场景中。
Retail50K Dataset
data:image/s3,"s3://crabby-images/e0add/e0addc93c3bb4b56e69243fb1f9ed3416c935ad2" alt=""
data:image/s3,"s3://crabby-images/4ccda/4ccda289cdc61454b7ae26f213f85bb06df5c16b" alt=""
之前的大多数OBB数据集都是航空图片,少部分数据集对MSCOCO等数据集进行重新标注。据统计,航空图片数据集中大多数OBB的长宽比都在1:4内,而主流数据集则集中在1:1,不能够很好地评价OBB-based方法的性能。为此,论文提供了Retail50K数据集,由47000张不同的超市图片构成,标注对象为货架的层架边。数据集包含复杂的背景和高长宽比目标,并且具有实际使用意义。
Experiments
data:image/s3,"s3://crabby-images/77d82/77d82c7ee8c99521a611b5a466f0809c340efcd0" alt=""
不同
下对比实验。
data:image/s3,"s3://crabby-images/ffcc9/ffcc972ebe503e44558327d2760fa871f2c881f6" alt=""
对比其它损失函数在OBB场景下的性能。
data:image/s3,"s3://crabby-images/124bb/124bb256b92b8882cd52a49e60176e47303814d8" alt=""
对比其它损失函数在BB场景下的性能。
data:image/s3,"s3://crabby-images/b5e02/b5e02370c5104b154958566cd0d0c3f7d8ecd512" alt=""
Retail50K数据集上的性能对比。
data:image/s3,"s3://crabby-images/6f306/6f30603bf7fada370777c69a35adc4ae5a685c48" alt=""
HRSC2016数据上的性能对比。
data:image/s3,"s3://crabby-images/adea3/adea3693c6244f146cc703c1539cef90030eb429" alt=""
DOTA数据上的性能对比。
data:image/s3,"s3://crabby-images/e3788/e37885ff2ccafe39e181bd8b67c911c4bb9424c8" alt=""
结果可视化对比。
Conclustion
论文提出从IoU指标延伸来的PIoU损失函数,能够有效地提高倾斜目标检测场景下的旋转角度预测和IoU效果,对anchor-based方法和anchor-free方法均适用。从结果来看,PIoU损失的效果还是十分明显的。另外论文提供了Retail50K数据集,能够很好地用于评估倾斜目标检测算法的性能。
图文来源于晓飞的算法工程笔记
侵权联系管理员删除