CN111046880A

CN111046880A - 一种红外目标图像分割方法、系统、电子设备及存储介质

Info

Publication number: CN111046880A
Application number: CN201911195519.9A
Authority: CN
Inventors: 荆楠; 张智杰; 雷波; 谭海; 孙钢波
Original assignee: 717th Research Institute of CSIC
Current assignee: 717th Research Institute of CSIC
Priority date: 2019-11-28
Filing date: 2019-11-28
Publication date: 2020-04-21
Anticipated expiration: 2039-11-28
Also published as: CN111046880B

Abstract

本发明提供一种红外目标图像分割方法、系统、电子设备及存储介质，该方法包括：采集多种场景下的红外目标图像作为训练数据集，对红外目标图像进行预处理，对目标实例标注并制作像素级二值掩膜，提取红外目标图像的多级分辨率大小特征图，并逐个像素点预设不同大小的候选框，将候选框输入区域提名网络二值分类和边界框修饰，过滤背景的候选框，对前景候选框进行ROI Align操作得到ROI区域，并对ROI区域进行N类别分类、边界框回归和二值掩膜生成，最后得到训练完的红外目标图像分割模型。通过该方案解决了现有图像处理方法在复杂场景下难以保障实时性的问题，既能适应多种复杂场景下红外图像中的目标检测，同时实现红外图像处理的实时性，降低计算量。

Description

一种红外目标图像分割方法、系统、电子设备及存储介质

技术领域

本发明涉及图像处理领域，尤其涉及一种红外目标图像分割方法、系统、电子设备及存储介质。

背景技术

在计算机视觉领域，目标检测作为经典研究方向，广泛应用于交通监控、图像检索以及人机交互等方面。红外目标检测作为计算机图像处理中的重要分支，适用于目标的颜色、形态与周围环境相似的情况下，可运用于安防监控、军事侦查、夜间行车、航运等领域。红外图像反应的是物体的相对温度信息，受天气因素的影响较小，相对于照明摄像头、夜视等设备红外光谱成像具有探测距离远、探测可靠性高等优势，但红外成像具有分辨率较低，细节模糊等缺点。

目前，常见的可见光目标分割方法中，基于阈值分割的方法极易工程实现，计算量小，但难以处理背景较为复杂，干扰较多的场景，容易存在误检与漏检；而复杂的方法，如卷积神经网络等，可以取得较好的检测结果，但都有计算量大,难以满足实时处理的要求。

因此，有必要提出一种能处理复杂场景，且实现实时处理的红外目标图像分割方法。

发明内容

有鉴于此，本发明实施例提供了一种红外目标图像分割方法，以解决的现有图像分割方法难以在适应复杂应用场景的同时保障图像实时性处理的问题。

在本发明实施例的第一方面，提供了一种红外目标图像分割方法，包括：

根据待检测红外目标特征属性，采集多种场景下的红外目标图像；

对所述红外目标图像进行预处理，通过标注工具标注所述红外目标图像中的目标实例，并制作像素级二值掩膜；

通过预训练的ResNet网络提取所述红外目标图像中的多级分辨率大小特征图，并为所述多级分辨率大小特征图中逐个像素点预设预定数量的不同大小的先验框；

将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，去除属于背景类别的候选框，并对得到的前景类别的候选框进行ROI Align操作得到ROI区域；

分别对所述ROI区域进行N类别分类、边界框回归和二值掩膜生成，得到训练完的红外目标图像分割模型。

在本发明实施例的第二方面，提供了一种红外目标图像分割系统，包括：

采集模块，用于根据待检测红外目标特征属性，采集多种场景下的红外目标图像；

标注模块，用于对所述红外目标图像进行预处理，通过标注工具标注所述红外目标图像中的目标实例，并制作像素级二值掩膜；

提取模块，用于通过预训练的ResNet网络提取所述红外目标图像中的多级分辨率大小特征图，并为所述多级分辨率大小特征图中逐个像素点预设预定数量的不同大小的先验框；

输入模块，用于将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，去除属于背景类别的候选框，并对得到的前景类别的候选框进行ROI Align操作得到ROI区域；

处理模块，用于分别对所述ROI区域进行N类别分类、边界框回归和二值掩膜生成，得到训练完的红外目标图像分割模型。

在本发明实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如本发明实施例第一方面所述方法的步骤。

在本发明实施例的第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现本发明实施例第一方面提供的所述方法的步骤。

本发明实施例中，根据待检测红外目标特征属性采集多种场景下的红外目标图像作为训练数据集，对所述红外目标图像进行预处理，采用标注工具进行目标实例标注并制作像素级二值掩膜，通过预训练的ResNet网络提取红外目标图像的多级分辨率大小特征图，并为所述多级分辨率大小特征图中逐个像素点预设一定数量的不同大小的先验框，将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，过滤背景的候选框，并对提名区域进行对齐操作，得到ROI区域，分别对所述ROI区域进行N类别分类、边界框回归和二值掩膜生成，最后训练得到红外目标图像分割模型以进行红外图像中的目标检测分割，能适应多种复杂场景下红外图像中的目标检测，具有较强的抗干扰能力，同时可以保证检测的准确度，检测识别过程简单快速，解决了现有红外图像目标检测方法在复杂场景下计算过程复杂，能以保障实时性的问题，可以降低计算量，提高红外图像处理分析能力，在复杂场景下实现目标的实时检测，并提供像素级的目标获取分割，具有较高实用价值。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单介绍，显而易见地，下面描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获取其他附图。

图1为本发明的一个实施例提供的红外目标图像分割方法的流程示意图；

图2为本发明的一个实施例提供的红外目标图像分割系统的结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

本发明的说明书或权利要求书及上述附图中的术语“包括”以及其他相近意思表述，意指覆盖不排他的包含，如包含一系列步骤或单元的过程、方法或系统、设备没有限定于已列出的步骤或单元。

请参阅图1，本发明实施例提供的一种红外图像目标检测方法的流程示意图，包括：

S101、根据待检测红外目标特征属性，采集多种场景下的红外目标图像；

所述待检测红外目标为通过探测到的目标辐射的红外信号检测到的目标物，一般可以为人、车辆、动物等。红外目标的特征属性可以是目标的尺寸大小、辐射强度等。所述多种场景是指多个复杂场景，如人流、车流密集的区域场景，最少可以采集三个复杂场景下的红外目标图像，为提高红外目标检测的准确率，可以增加采集的场景。

可选的，通过红外热成像仪拍摄不同复杂场景下，不同目标的红外图像，并不断改变红外热成像仪的对焦、变焦参数以及曝光参数，形成红外目标图像数据集。

在红外目标数据集中红外图像的拍摄场景、目标、焦距参数、曝光参数等均可以不同，保证数据集的多样性。

S102、对所述红外目标图像进行预处理，通过标注工具标注所述红外目标图像中的目标实例，并制作像素级二值掩膜；

所述预处理过程具体可包括图像旋转平移、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动等方法，对所述红外目标图像进行数据增强。通过LabelImg标注工具对红外目标图像中的目标实例进行标注。

所述二值掩膜指由0和1组成的二进制图像中，对图像局部或去不进行遮挡来控制图像处理过程。具体可以通过指定数据值、数据范围、无限或有限值、感兴趣区及注释文件等来定义图像掩膜。

具体的，分别通过图像旋转平移、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动的方法对所述红外目标图像进行数据增强；基于数据类别不平衡采用类别平衡策略进行数据增广；对所述红外目标图像进行随机排序。

分类学习算法中，不同类别样本比例相差悬殊容易影响分类的准确度，通过数据增广可以使数据集多样化，提高模型泛化能力。数据增强过程中同一目标图片会连续出现，会导致模型在训练过程中对同一目标的特征进行连续学习，出现过拟合现象，本实施例中将数据样本顺序打乱后在进行随机排序，从而在训练过程中达到提升模型性能的作用。

S103、通过预训练的ResNet网络提取所述红外目标图像中的多级分辨率大小特征图，并为所述多级分辨率大小特征图中逐个像素点预设预定数量的不同大小的先验框；

所述ResNet网络模型为一种用于特征提取的残差学习网络，通过ImageNet分类数据集对ResNet网络进行预训练，利用训练后的ResNet网络提取红外目标图像的特征图。

可选的，基于卷积神经网络结构输出包含二分类(前景和背景)和边框修饰回归的二分支结构。具体的，首先利用一个3×3的卷积核在多级分辨率特征图上生成维度为256维或512维长度的全连接特征，然后利用产生的256维或512维的特征生成2个全连接层分支；回归层预测候选框的中心点的坐标和宽高，分类层判定该候选框属于前景还是背景；

RPN(Region Proposal Network，即区域生长网络)网络的损失函数是由softmax损失和regression损失两者按一定权重组成的。Softmax损失通过候选框对应的背景标定结果和预测结果计算得到，regression损失的计算如下；

t_x＝(x-x_a)/w_a,t_y＝(y-y_a)/h_a

t_w＝log(w/w_a),t_h＝log(h/h_a)

RPN网络的损失函数计算如下：

其中，x,y为RPN网络预测出的候选框中心点坐标，w和h为候选框宽和高，先验框的位置信息为(x_a,y_a,w_a,h_a)，真实标注框的位置信息为(x^*,y^*,w^*,h^*)。

S104、将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，去除属于背景类别的候选框，并对得到的前景类别的候选框进行ROI Align操作得到ROI区域；

区域提名网络(或称区域生长网络，即RPN)可以对候选框中对应的目标或非目标进行分类，并对候选框进行边框修饰。其中，分类的候选框可以分为前景候选框和背景候选框。ROI区域即图像处理中的感兴趣区域。

所述ROI Align操作是通过双线性插值确定原图RoI区域中每个像素点的特征值，然后进行最大或平均池化等操作提升精度，解决了池化过程直接采样带来的偏差对齐问题。

具体的，将ROI区域划分成预定数量的bin区域，如7×7个bin区域，在每个bin区域中选择4个采样点，获取距离每个采样点最近的4个特征点的像素值，通过双线性插值确定每个采样点的像素值；

计算每个bin区域的平均或最大池化，生成ROI区域的特征图，即7×7大小的特征图。

S105、分别对所述ROI区域进行N类别分类、边界框回归和二值掩膜生成，得到训练完的红外目标图像分割模型。

重复S104中将候选框输入至区域提名网络，去除属于背景候选框，并获取ROI区域，以及S105中对ROI区域分类、边框回归及二值掩膜生成操作，可以基于红外目标图像数据完成对红外目标图像分割模型的训练，通过所述红外目标图像分割模型可以快速准确的对待检测红外图像进行目标检测分割。

可选的，分类分支结构利用两个全连接层提取全连接特征，分类分支生成N维特征表示N类别得分

回归分支结构利用两个全连接层提取全连接特征，并生成N_num*4维特征表示生成的边界框坐标；

掩膜分支结构利用五个全卷积层提取卷积特征，掩膜分支生成N*28*28维特征表示生成的N类别掩膜；

其中，损失函数为：

L＝L_cls+L_box+L_mask

L_cls为分类分支损失，L_box为回归分支损失，L_mask为掩模分支损失。

通过本实施例提供的方法，可以解决现有红外图像检测方法在复杂场景下计算过程复杂，能以保障实时性的问题，能更好地适应复杂的背景，增强了对地面等景物的抗干扰能力，扩大了该方法的应用范围。

应理解，上述实施例中各步骤的序号大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

图2为本发明实施例提供的一种红外目标图像分割系统的结构示意图，该系统包括：

采集模块210，用于根据待检测红外目标特征属性，采集多种场景下的红外目标图像；

可选的，所述根据待检测红外目标特征属性，采集多种场景下的红外目标图像包括：

通过红外热成像仪拍摄不同复杂场景下，不同目标的红外图像，并不断改变红外热成像仪的对焦、变焦参数以及曝光参数，形成红外目标图像数据集。

标注模块220，用于对所述红外目标图像进行预处理，通过标注工具标注所述红外目标图像中的目标实例，并制作像素级二值掩膜；

可选的，所述对所述红外目标图像进行预处理包括：

分别通过图像旋转平移、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动的方法对所述红外目标图像进行数据增强；

基于数据类别不平衡采用类别平衡策略进行数据增广；

对所述红外目标图像进行随机排序。

提取模块230，用于通过预训练的ResNet网络提取所述红外目标图像中的多级分辨率大小特征图，并为所述多级分辨率大小特征图中逐个像素点预设预定数量的不同大小的先验框；

可选的，所述通过预训练的ResNet网络提取所述红外目标图像中的多级分辨率大小特征图，并为所述多级分辨率大小特征图中逐个像素点预设预定数量的不同大小的先验框包括：

首先用一个3×3的卷积核在多级分辨率特征图上生成维度为256维或512维长度的全连接特征，然后利用产生的256维或512维的特征生成2个全连接层分支；

回归层预测候选框的中心点的坐标和宽高，分类层判定该候选框属于前景还是背景；

RPN网络的损失函数是由softmax损失和regression损失两者按一定权重组成的。Softmax损失通过候选框对应的背景标定结果和预测结果计算得到，regression损失的计算如下；

t_x＝(x-x_a)/w_a,t_y＝(y-y_a)/h_a

t_w＝log(w/w_a),t_h＝log(h/h_a)

RPN网络的损失函数计算如下：

输入模块240，用于将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，去除属于背景类别的候选框，并对得到的前景类别的候选框进行ROI Align操作得到ROI区域；

可选的，所述将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，去除属于背景类别的候选框，并对得到的前景类别的候选框进行ROIAlign操作得到ROI区域包括：

将ROI区域划分成预定数量的bin区域，在每个bin区域中选择4个采样点，获取距离每个采样点最近的4个特征点的像素值，通过双线性插值确定每个采样点的像素值；

计算每个bin区域的平均或最大池化，生成ROI区域的特征图。

处理模块250，用于分别对所述ROI区域进行N类别分类、边界框回归和二值掩膜生成，得到训练完的红外目标图像分割模型。

可选的，所述分别对所述ROI区域进行N类别分类、边界框回归和二值掩膜生成，得到训练完的红外目标图像分割模型包括：

分类分支结构利用两个全连接层提取全连接特征，分类分支生成N维特征表示N类别得分

其中，损失函数为：

L＝L_cls+L_box+L_mask

在本发明的一个实施例中提供了一种用于红外目标图像分割的电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如本发明实施例中S101至S105步骤。

在本发明的一个实施例中还提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述实施例提供的红外目标图像分割方法，所述非暂态计算机可读存储介质包括如：ROM/RAM、磁碟、光盘等。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种红外目标图像分割方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据待检测红外目标特征属性，采集多种场景下的红外目标图像包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述红外目标图像进行预处理包括：

基于数据类别不平衡采用类别平衡策略进行数据增广；

对所述红外目标图像进行随机排序。

4.根据权利要求1所述的方法，其特征在于，所述通过预训练的ResNet网络提取所述红外目标图像中的多级分辨率大小特征图，并为所述多级分辨率大小特征图中逐个像素点预设预定数量的不同大小的先验框包括：

利用一个3×3的卷积核在多级分辨率特征图上生成维度为256维或512维长度的全连接特征，然后利用产生的256维或512维的特征生成2个全连接层分支；

t_x＝(x-x_a)/w_a,t_y＝(y-y_a)/h_a

t_w＝log(w/w_a),t_h＝log(h/h_a)

RPN网络的损失函数计算如下：

5.根据权利要求1所述的方法，其特征在于，所述将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，去除属于背景类别的候选框，并对得到的前景类别的候选框进行ROI Align操作得到ROI区域包括：

计算每个bin区域的平均或最大池化，生成ROI区域的特征图。

6.根据权利要求1所述的方法，其特征在于，所述分别对所述ROI区域进行N类别分类、边界框回归和二值掩膜生成，得到训练完的红外目标图像分割模型包括：

分类分支结构利用两个全连接层提取全连接特征，分类分支生成N维特征表示N类别得分；

其中，损失函数为：

L＝L_cls+L_box+L_mask

7.一种红外图像目标检测系统，其特征在于，包括：

输入模块，用于将所述先验框作为候选框输入至区域提名网络进行前景或背景的二值分类和边界框修饰，去除属于背景类别的候选框，并对得到的前景类别的候选框进行ROIAlign操作得到ROI区域；

8.根据权利要求7所述的系统，其特征在于，所述根据待检测红外目标特征属性，采集多种场景下的红外目标图像包括：

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述红外目标图像分割方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述红外目标图像分割方法的步骤。