边肖将与您分享如何在细分市场中实现无锚方法。相信大部分人还不太了解,所以分享这篇文章给大家参考。希望大家看完这篇文章后收获多多。让我们一起来发现吧!
00-1010
3. 基于Segmentation的方法
让我们从之前的FCOS总体框架开始:
根据FCOS的说法,它将每个地点作为样本。如下图所示,可以看到最左边的橙色点在棒球运动员的盒子里,这个点的gt实际上是这个点到盒子四边的距离和盒子的obj类别,所以最终预测的输出是HxWxC和HxWx4,C和4分别代表每个特征图的每个位置要预测到的类别和这个点到盒子的边界距离。以这种方式获得盒子后,NMS等以与FCOS回合的锚基方法相同的方式进行:
其实如果不考虑分类下的中心性分支,怎么样?你会觉得很熟悉吗?在这里粘贴视网膜的网络图:
可以发现两者最大的区别就是最后一个输出通道。Retinanet输出KA和4A(A代表锚的数量,K代表类别的数量),是预测它们的类别和A锚在每个位置位置的相对偏移量,而FCOS直接预测网格所属的类别和生成的盒子。完全没有盒子的概念,整体上也非常接近语义分割的分割思路。这种方法会有一个问题,就是越靠近box内部的中心,效果越好,但是越靠近Box的边缘,虽然理论上应该还是正的,但是因为经常落在obj之外,预测效果不好。因此,FCOS的解决方案是引入一个新的分支中心,其gt计算如下:
可以看出,如果位置与框的左右边界之间的距离相同,则根符号中的第一项应为1。类似地,当与上下边界的距离相同时,根符号中的第二项为1。此时gt值为1,位置正好在中心。如果位置非常靠近边缘,gt将非常小。经过这个分支训练后,在推理阶段会乘以分类的预测值作为最终得分,从而压制中心点附近的位置。此外,FCOS还引入了多尺度的概念。如果FPN某一级别的t/b/l/r最大值大于某一阈值,则认为该框不适合当前级别的特征,可以排除。00-1010认识FCOS后,更容易认识foveabox。foveabox的不同在于多尺度策略和编码方式。Foveabox的多尺度策略是根据区域将不同大小的盒子分配给不同级别的特征图,存在重叠。FPN的P3~P7的每个左叶的Pl分别有一个基数Sl。当l=3时,S3对应P3是3232,当l=4时,P4对应它。
S4是6464,一直倍增。每个level负责的box的面积范围为,其中n^2是可变化的参数,可以看到,不同leval预测的范围会有重叠,这可以增加一定的鲁棒性:
FSAF
以上是“Segmentation中anchor free方法怎么实现的”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/153656.html