本团队想通过打算机视觉战队平台打造属于自己的品牌,让更多干系领域的人理解本团队,结识更多干系领域的朋友,一起来学习,共同进步!
\"大众 data-from=\公众0\"大众 data-is_biz_ban=\"大众0\"大众>

"大众年夜众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入办法

论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9521517

jsp设置背景图片旋转角度扭转角度目的检测的主要性附源论文下载 Vue.js

打算机视觉研究院专栏

作者:Edison_G

任意方向的目标检测是一项具有寻衅性的任务。

一、背景

目标检测是打算机视觉中的一项基本任务,许多研究职员已经运用水平边界框来定位图像中的物体。
水平边界框的利用可以使候选区域的表示更加简洁直不雅观。
在许多基于深度学习的方法中,每每须要大量标记样本来演习目标检测器模型,利用轴平行标记框可以大大提高标记效率,快速获取大量标记样本。
此外,水平边界框涉及的参数较少,简化了检测模型的演习过程。
因此,在大多数目标检测方法中,利用水平边界框来表示遥感图像中目标的大致范围,如下图所示。

然而,航拍图像中的物体常日是任意方向的。
因此,利用水平边界框来检测目标会引起几个问题。
首先,这种类型的物体检测框常日包含许多背景区域。
如上图(a)所示,图中大约60%的区域属于背景区域。
检测框内存在过多的背景区域,不仅增加了分类任务的难度,而且会导致目标范围表示不准确的问题。
其次,水平边界框会导致检测框之间涌现强烈重叠,如上图(b)所示,降落检测精度。
末了,由于飞机、船舶、车辆等图像中的物体包含运动方向信息,如果利用水平边界框,则无法得到目标运动方向的信息。

上述三个问题可以通过利用带有角度信息的旋转检测框有效办理,如上图所示。
首先,旋转检测可以精确定位图像中的物体,并且边界框险些不包含背景区域,从而减少背景对物体分类的影响。
其次,旋转检测框之间险些没有重叠,从而可以更清晰地识别框内包含的物体。
末了,可以从旋转检测框粗略得到物体的运动方向信息,从而判断物体的运动轨迹。
综上所述,在遥感图像目标检测任务中利用带有角度信息的旋转检测框得到了优胜的性能。
二、序言
任意方向的目标检测是一项具有寻衅性的任务。
由于遥感图像中的物体方向是任意的,利用水平边界框会导致检测精度低。
现有的基于回归的旋转检测器会导致边界不连续的问题。
在本日的分享中,研究者提出了一种基于角度分类的遥感图像目标检测方法,该方法利用带有角度信息的旋转检测边界框来检测工具。
详细来说,研究者将神经架构搜索框架与特色金字塔网络 (NAS-FPN) 模块结合到密集检测器 (RetinaNet) 中,并在角度分类中利用二进制编码方法。
这种方法减少了背景影响,使得检测框之间险些没有重叠。
根据检测框的角度,我们可以推断出目标的运动方向信息,进一步确定目标的运动轨迹。
研究者对一个可用于航空影像 (DOTA) 中的目标检测的大型公共数据进行了溶解实验,以验证该方法中每个模块的有效性,并将该方法与其他几种检测方法进行比较。
实验结果证明了新提出方法的有效性。

三、新框架

新提出的旋转检测器框架如上图所示。
网络基于RetinaNet框架。
图中标记为C2、C3、C4的特色图是由深度卷积神经网络提取的。
该方法的总体步骤如下:首先利用特色提取网络对遥感图像中的特色进行提取,利用NAS-FPN对提取的特色进行领悟,得到不同尺度的特色图。
然后,利用长界限说方法来表示旋转检测框,并在框回归任务中利用二进制编码标记技能将角度回归问题转化为角度分类问题。
下面详细描述该方法中的一些主要构造。

NAS-FPN

在NAS-FPN中,最主要的构造是由特色图节点凑集、操作池和搜索终止条件组成的合并单元构造。
下图简要描述了特色图的搜索过程。

1)从特色图节点集中随机选择一个特色图作为输入之一。
初始特色图节点集包含五个尺度的特色图,表示为 {C1,C2, C3, C4, C5}。

2)从特色图节点集中随机选择另一个特色图作为另一个输入。

3)选择输出特色图的分辨率。

4)在操作池中选择一个操为难刁难(1)(2)中选择的特色图节点进行操作,产生与输出特色图分辨率相同的特色图,并将该特色图加入到特色图节点凑集中选择。

5) 循环重复上述步骤。
搜索的终止条件是天生五个与初始特色图分辨率相同的特色金字塔网络,记为{P1, P2, P3, P4, P5}。

ROTATION DETECTION FRAME

范例的角度编码方法有三种,包括两种不同角度范围的五参数方法和一种八参数方法。
详细情形如下:

角度范围为90°的五参数法(OpenCV定义法):其示意图如上图所示。
该定义法包含五个参数[x,y,w,h,θ]。
个中,x和y为旋转坐标系的中央坐标,θ为旋转坐标系与x轴的锐角,逆时针方向指定为负角,因此角度范围为[−90° , 0); 旋转框的宽度w为旋转框所在的边角,旋转框的高度h为另一边。

180°角范围的五参数法

八参数法

八参数法:该定义方法示意图如上图所示,该定义方法包含8个参数[a1,a2,b1,b2,c1,c2,d1,d2], 定义的左上角为出发点,别的点按逆时针顺序排列。
旋转坐标系的表示不限于上述三种方法,旋转坐标系别的部分的表示可以通过上述三种方法的变换得到。

ANGLE CODING METHOD

90°范围的五参数定义方法的问题

八参数四边形定义方法的问题

角度编码方法:

四、实验及可视化

实验环境

DOTA数据集上的性能比较

END

转载请联系本公众年夜众号得到授权

打算机视觉研究院学习群等你加入!

ABOUT

打算机视觉研究院

打算机视觉研究院紧张涉及深度学习领域,紧张致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型支配等研究方向。
研究院逐日分享最新的论文算法新框架,供应论文一键下载,并分享实战项目。
研究院紧张着重”技能研究“和“实践落地”。
研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习气!

?