CN114743109B

CN114743109B - 多模型协同优化高分遥感图像半监督变化检测方法及系统

Info

Publication number: CN114743109B
Application number: CN202210461115.5A
Authority: CN
Inventors: 李树涛; 谢雨欣; 方乐缘; 付巍
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2022-04-28
Filing date: 2022-04-28
Publication date: 2024-07-02
Anticipated expiration: 2042-04-28
Also published as: CN114743109A

Abstract

本发明公开了一种多模型协同优化高分遥感图像半监督变化检测方法及系统，包括将有标签训练集X_L训练孪生神经网络模型S，得到有标签训练模型S(X_L,θ)，加入蒙特卡罗移除层，对无标签训练集X_U进行多模型协同预测并筛选生成伪标签训练集X'_U；为有标签训练集X_L选择显著变化区域并剪裁到伪标签训练集X'_U中得到增强的伪标签数据集X_M；将有标签训练集X_L和增强的伪标签数据集X_M共同训练孪生神经网络模型S。本发明只需要少量的标签就可完成较高精度的变化检测，能够结合真实标签与伪标签，利用监督学习改进半监督学习过程，增加了更多的边缘数据，并且使正负样本分布更平衡，提升了变化检测性能。

Description

多模型协同优化高分遥感图像半监督变化检测方法及系统

技术领域

本发明涉及高分遥感图像处理技术，具体涉及一种多模型协同优化高分遥感图像半监督变化检测方法及系统。

背景技术

遥感图像可以提供对地观测的宏观视图，反映观测区域内物体的类型和属性。变化检测是通过在不同时间观察同一物体来识别其状态差异的技术。覆盖同一场景的多时相遥感图像能够揭示地面的动态变化，因此多时间序列图像的变化检测技术变得越来越重要。目前，遥感图像变化检测已广泛应用于生态系统监测、资源管理、土地利用/土地覆盖变化分析、城市扩展研究和损害评估等领域。

深度学习方法在处理数量庞大、特征复杂的数据方面具有优势。近年来，全监督深度学习技术在中低分辨率遥感图像变化检测方面取得了巨大的成功。然而，全监督变化检测需要大量的标记样本，由于高分辨率遥感图像场景的复杂性，标记大规模的高分辨率变化检测数据集非常耗时和费力。不仅需要大量的技术人员提供丰富的经验和专业的判断，而且需要大量的时间来分析图像对的变化。在这种情况下，对于我们所关注的变化多样且快速的应急情景(如自然灾害评估和土地覆盖转换)，那些依赖于大量标签的耗时方法是不现实的。直接利用线性变换理论的无监督深度学习变化检测方法，在一定程度上缓解了上述问题。然而，基于无监督的方法由于没有标签的支持，需要许多人为设定的参数，并且检测结果中会产生大量的伪变化区域，检测精度较低。

半监督学习不仅能学习有标签数据，还能够从无标签数据中提取有用的特征，从而提高模型泛化性能，并使利用少标签数据集训练模型成为可能。现有的大多数半监督变化检测方法都集中在具有中低分辨率的高光谱图像、SAR图像或多光谱图像上。针对高分辨率遥感图像的半监督变化检测的工作很少，并且由于训练数据标注样本受限，检测结果存在不准确、边缘信息模糊等问题。因此，提出一个高效的半监督变化检测方法，对于提高变化检测的准确性和效率，促进变化检测的落地具有重要意义。

发明内容

本发明要解决的技术问题：针对现有技术的上述问题，提供一种多模型协同优化高分遥感图像半监督变化检测方法及系统，本发明旨在解决训练数据标注样本受限时检测结果存在不确定性的问题，通过蒙特卡罗移除层进行多模型协同预测，提高变化检测的精确度和性能。

为了解决上述技术问题，本发明采用的技术方案为：

一种多模型协同优化高分遥感图像半监督变化检测方法，包括对用于高分遥感图像变化检测的孪生神经网络模型S进行训练的步骤：

1)分别获取有标签和无标签的遥感图像，生成有标签训练集X_L和无标签训练集X_U；

2)将有标签训练集X_L训练孪生神经网络模型S，得到有标签训练模型S(X_L,θ)，其中θ为网络参数；

3)在有标签训练模型S(X_L,θ)中加入蒙特卡罗移除层，多次采样得到多模型参数，对无标签训练集X_U进行多模型协同预测，得到有标签训练模型S(X_L,θ)对无标签训练集X_U中任意第i个无标签训练样本的预测概率p_i ^U以及二值预测结果y_i ^U，协同多次预测结果得到不确定性估计D_i，计算无标签训练样本i的预测概率p_i ^U的置信度，根据设定的置信度阈值a筛选无标签训练样本并将二值预测结果y_i ^U作为对应的伪标签，根据筛选出的无标签训练样本i及其对应的伪标签、不确定性估计结果D_i得到伪标签训练集X'_U；

4)计算有标签训练集X_L在孪生神经网络模型S的注意力图的显著变化区域，选择显著变化区域并剪裁到伪标签训练集X'_U中，从而得到结合真实标签与伪标签后的增强的伪标签数据集X_M；

5)将有标签训练集X_L和增强的伪标签数据集X_M共同构成混合训练集X，通过混合训练集X训练孪生神经网络模型S，得到更新后的网络参数θ'，得到半监督训练后的孪生神经网络模型S(X,θ')；

6)判断预设的结束条件是否成立，若不成立，则跳转执行步骤3)以继续迭代训练更新孪生神经网络模型S的网络参数θ'，否则判定孪生神经网络模型S已完成训练。

可选地，步骤1)中生成有标签训练集X_L包含N_L个有标签训练样本，且每一个有标签训练样本包含不同时相的两幅有标签遥感图像以及一个相应的像素级标签；无标签训练集X_U包含N_U个无标签训练样本，且每一个无标签训练样本包含不同时相的两幅有标签遥感图像。

可选地，所述孪生神经网络模型S包括两个分支编码器和解码合并模块，所述两个分支编码器共享参数，所述分支编码器包括依次相连的两个编码模块以及三个含有注意力模块的编码模块，所述解码合并模块包括依次相连的三个含有注意力模块的解码模块、两个解码模块以及卷积层，两个分支编码器中的一个分支编码器的输出端与解码合并模块的输入端相连，且两个分支编码器中相同级别的编码模块或含有注意力模块的编码模块之间输出的特征图差的绝对值与解码合并模块中含有注意力模块的解码模块或解码模块的输出端相连。

可选地，步骤2)中将有标签训练集X_L训练孪生神经网络模型S时，每一轮训练的步骤包括：将本轮的有标签训练样本输入孪生神经网络模型S进行训练，得到预测概率p_i ^L；根据预设的损失函数L_S对孪生神经网络模型S进行反向传播以得到孪生神经网络的网络参数θ，其中预设的损失函数L_S的函数表达式为：

L_S＝-[ω·y_i ^Llogp_i ^L+(1-y_i ^L)log(1-p_i ^L)]

上式中，ω为有标签训练集中变化类样本数与不变类样本数的比例，y_i ^L为标签训练样本相应的像素级标签，p_i ^L为孪生神经网络模型S得到的预测概率。

可选地，步骤3)中计算预测结果y^U中预测结果的置信度的函数表达式为：

上式中，γ_i为第i个无标签训练样本的置信度，N_P为第i个无标签训练样本的像素数，L_p(p_i,j ^U)表示统计p_i,j ^U大于预设的置信度上限阈值γ_p的像素个数，L_n(p_i,j ^U)表示统计p_i,j ^U大于预设的置信度下限阈值γ_n的像素个数，p_i,j ^U为预测概率p^U中第i个无标签训练样本中像素j的预测概率，N_U为无标签训练集X_U中的样本数量，且有：

可选地，步骤3)中协同多次预测结果得到不确定性估计结果D_i的函数表达式为：

上式中，N_pred为采用蒙特卡罗移除层生成的模型数，y_i,n ^U为第i个无标签训练样本对第n次预测产生的二值预测结果，E(y_i,n ^U)为第i个无标签训练样本的多模型N次预测产生的二值预测结果的均值。

可选地，步骤4)包括：

4.1)计算有标签训练集X_L在孪生神经网络模型S的注意力图的显著变化区域；

4.2)选择显著变化区域并构成一个与原始有标签训练样本相同大小的二元掩膜矩阵M；

4.3)基于下式选择显著变化区域并剪裁到伪标签训练集X'_U中以得到结合真实标签与伪标签后的增强的伪标签数据集X_M；

上式中，其中表示不同时相的两幅增强的伪标签遥感图像，为增强的像素级伪标签，为伪标签对应的不确定性估计结果，N_U′为增强的伪标签数据集X_M的样本数目；和为第i个有标签训练样本中的不同时相的两幅有标签遥感图像，为第i个有标签训练样本的标签，M为二元掩膜，为无标签训练集X_U中筛选出的无标签训练样本中的不同时相的两幅有标签遥感图像，为筛选出的无标签训练样本的伪标签，D_i'为筛选出的无标签训练样本对应的不确定性估计结果，⊙算子表示相应位置相乘。

可选地，步骤5)中通过混合训练集X训练孪生神经网络模型S时，采用的损失函数L为：

L＝L_S+L_U

上式中，L_S为步骤2)中将有标签训练集X_L训练孪生神经网络模型S时采用的预设的损失函数，L_U为不确定性-加权二元交叉熵损失，且有：

上式中，为混合训练集X中第i个不确定性估计结果，L_WBCE为中间变量，ω为有标签训练集中变化类样本数与不变类样本数的比例，y_i ^M为混合训练集X中第i个标签训练样本相应的伪标签，p_i ^M为混合训练集X中第i个标签训练样本相应的预测概率。

此外，本发明还提供一种多模型协同优化高分遥感图像半监督变化检测系统，包括相互连接的微处理器和存储器，该微处理器被编程或配置以执行所述多模型协同优化高分遥感图像半监督变化检测方法的步骤。

此外，本发明还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，且该计算机程序用于被计算机设备执行以实施所述多模型协同优化高分遥感图像半监督变化检测方法的步骤。

和现有技术相比，本发明具有下述优点：

第一，本发明针对高分辨率遥感图像训练数据标注样本受限的问题，使用半监督的方法，只需要少量的标签就可完成较高精度的变化检测。

第二，本发明将有标签训练集中显著变化区域剪裁到伪标签训练集中，能够结合真实标签与伪标签，利用监督学习改进半监督学习过程，增加了更多的边缘数据，并且使正负样本分布更平衡，进一步提升了变化检测性能。

附图说明

图1为本发明实施例方法的基本流程示意图。

图2为本发明实施例中孪生神经网络模型S的结构示意图。

图3为本发明实施例提出的编码器模块模型示意图。

图4为本发明实施例提出的解码器模块模型示意图。

图5为本发明实施例提出的注意力模块模型示意图。

图6为本发明实施例方法和其他现有方法的第一组变化检测结果对比示意图。

图7为本发明实施例方法和其他现有方法的第二组变化检测结果对比示意图。

图8为本发明实施例方法和其他现有方法的第二组变化检测结果对比示意图。

具体实施方式

如图1所示，本实施例提供一种多模型协同优化高分遥感图像半监督变化检测方法，包括对用于高分遥感图像变化检测的孪生神经网络模型S进行训练的步骤：

3)在有标签训练模型S(X_L,θ)中加入蒙特卡罗移除层，多次采样得到多模型参数，对无标签训练集X_U进行多模型协同预测，得到有标签训练模型S(X_L,θ)对无标签训练集X_U中任意第i个无标签训练样本的预测概率p_i ^U以及二值预测结果y_i ^U，协同多次预测结果得到不确定性估计结果D_i，计算无标签训练样本i的预测概率p_i ^U的置信度，根据设定的置信度阈值a筛选无标签训练样本并将二值预测结果y_i ^U作为对应的伪标签，根据筛选出的无标签训练样本i及其对应的伪标签、不确定性估计结果D_i得到伪标签训练集X'_U；

6)判断预设的结束条件是否成立，若不成立，则跳转执行步骤3)以继续迭代训练更新孪生神经网络模型S的网络参数θ'，否则判定孪生神经网络模型S已完成训练。在孪生神经网络模型S完成训练后，将待检测的遥感图像输入孪生神经网络模型S，即可实现遥感图像的变化检测。

本实施例中，步骤1)中生成有标签训练集X_L包含N_L个有标签训练样本，且每一个有标签训练样本包含不同时相的两幅有标签遥感图像以及一个相应的像素级标签；有标签训练集X_L可表示为：

上式中，表示不同时相的有标签遥感图像，为相应的像素级标签，N_L为有标签训练集中样本数目。无标签训练集X_U包含N_U个无标签训练样本，且每一个无标签训练样本包含不同时相的两幅有标签遥感图像。无标签训练集X_U可表示为：

上式中，表示不同时相的无标签遥感图像，N_U为无标签训练集中样本数目。有标签训练集中样本数目N_L、无标签训练集中样本数目N_U两者的比重可根据需要仅配置，例如作为一种可选的实施方式，本实施例中有标签训练集中样本数目N_L＝712，占全部训练集的10％；无标签训练集中样本数目N_U＝6408，占全部训练集的90％。

如图2所示，孪生神经网络模型S包括两个分支编码器和解码合并模块，所述两个分支编码器共享参数，分支编码器包括依次相连的两个编码模块(Enc1和Enc2)以及三个含有注意力模块的编码模块(EAM1～EAM3)，所述解码合并模块包括依次相连的三个含有注意力模块的解码模块(DAM1～DAM3)、两个解码模块(Dec1和Dec2)以及卷积层，两个分支编码器中的一个分支编码器的输出端与解码合并模块的输入端相连，且两个分支编码器中相同级别的编码模块或含有注意力模块的编码模块之间输出的特征图差的绝对值与解码合并模块中含有注意力模块的解码模块或解码模块的输出端相连，例如作为一种可选的实施方式，参见图2，其中两个分支编码器的编码模块Enc1之间输出的特征图差的绝对值与解码模块Dec2的输出端相连，两个分支编码器的编码模块Enc2之间输出的特征图差的绝对值与解码模块Dec1的输出端相连，两个分支编码器的含有注意力模块的编码模块EAM1之间输出的特征图差的绝对值与含有注意力模块的解码模块DAM3的输出端相连，两个分支编码器的含有注意力模块的编码模块EAM2之间输出的特征图差的绝对值与含有注意力模块的解码模块DAM2的输出端相连，两个分支编码器的含有注意力模块的编码模块EAM3之间输出的特征图差的绝对值与含有注意力模块的解码模块DAM1的输出端相连。参见图2，本实施例中的卷积层包括Conv16和Conv1两个卷积模块，解码合并模块的输出依次通过Conv16和Conv1两个卷积模块，得到二值变化图。

其中，编码模块和含有注意力模块的编码模块的结构如图3所示，其区别为是否含有可选的注意力模块(Attention)。编码模块包括两个3×3卷积层(Conv)、批归一化层和修正线性单元(批归一化层和修正线性单元图中省略未绘出)，以及一个跨步卷积层(StridedConv)以对特征进行两倍下采样；含有注意力模块的编码模块则包括两个3×3卷积层、批归一化层和修正线性单元、注意力模块(Attention)以及一个跨步卷积层以对特征进行两倍下采样。

其中，解码模块和含有注意力模块的解码模块的结构如图4所示，其区别为是否含有可选的注意力模块(Attention)。解码模块包括两个3×3卷积层(Conv)、批归一化层和修正线性单元(批归一化层和修正线性单元图中省略未绘出)，以及一个反卷积层(TransposeConv)以对特征进行两倍上采样；含有注意力模块的解码模块则包括两个3×3卷积层、批归一化层和修正线性单元、注意力模块(Attention)以及一个反卷积层以对特征进行两倍下采样。

其中，注意力模块的结构如图5所示。每个注意力模块都包含了空间注意力模块以及通道注意力模块，空间注意力模块包括一个全局协方差池化层(GCP)和两个1×1卷积层(Conv1×1)，通道注意力模块包括两个扩张率为4的3×3扩张卷积层(Dilated Conv)、一个全局平均池化层(GAP)和一个1×1卷积层(Conv 1×1)。空间注意力模块的输入和输出叠加后作为通道注意力模块的输入，通道注意力模块的输入和输出叠加后作为最终输出。

本实施例中，步骤2)中将有标签训练集X_L训练孪生神经网络模型S时，每一轮训练的步骤包括：将本轮的有标签训练样本输入孪生神经网络模型S进行训练，得到预测概率p_i ^L；参见前文可知，本实施例中有标签训练样本包含不同时相的有标签遥感图像；根据预设的损失函数L_S对孪生神经网络模型S进行反向传播以得到孪生神经网络的网络参数θ，其中预设的损失函数L_S的函数表达式为：

L_S＝-[ω·y_i ^Llogp_i ^L+(1-y_i ^L)log(1-p_i ^L)]

上式中，ω为有标签训练集中变化类样本数与不变类样本数的比例，y_i ^L为标签训练样本相应的像素级标签，p_i ^L为孪生神经网络模型S得到的预测概率。根据预设的损失函数L_S对孪生神经网络模型S进行反向传播以得到孪生神经网络的网络参数θ，根据学习得到的网络参数θ，提取样本在孪生神经网络中的注意力图；将此时在有标签训练集上训练好的孪生神经网络模型S记为有标签训练模型S(X_L,θ)。

本实施例中，步骤3)中计算预测结果y^U中预测结果的置信度的函数表达式为：

本实施例中，第i个无标签训练样本的像素数N_P＝65536，预设的置信度上限阈值γ_p＝0.9，预设的置信度下限阈值γ_n＝0.1；毫无疑问，上述参数取值可根据需要设定。在此基础上，若γ_i>a，将此图像对相应的二值预测结果y_i ^U视为伪标签，将此图像对、相应的伪标签y_i ^U及不确定性估计结果D_i加入伪标签训练集X'_U，伪标签训练集X'_U可表示为：

其中表示不同时相的伪标签遥感图像，为相应的像素级伪标签，D′_i为伪标签相应的不确定性估计结果，N_U'为伪标签训练集中样本数目，D′均为从D筛选得到，本实施例中，置信度阈值a＝0.9。

由于孪生神经网络模型S训练样本较少，网络训练的效果不是很好，模型得出来的预测结果存在不确定性；通过在多次预测过程中采用蒙特卡罗移除层，即在测试过程中也打开网络的移除层，让网络S的参数服从伯努利分布，每一次采样时得到的模型参数都不同，多次采样即得到多模型的预测结果。本实施例中，步骤3)中协同多次预测结果得到不确定性估计结果D_i的函数表达式为：

上式中，N_pred为采用蒙特卡罗移除层生成的模型数，y_i,n ^U为第i个无标签训练样本对第n次预测产生的二值预测结果，E(y_i,n ^U)为第i个无标签训练样本的多模型N次预测产生的二值预测结果的均值。其中采用蒙特卡罗移除层生成的模型数为N_pred可根据需要选择取值，例如本实施例中，采用模型数N_pred＝10。

本实施例中，步骤4)包括：

本实施例明协同多次预测结果得到不确定性估计，根据不确定性估计来设计损失函数，更有效的利用高质量的伪标签，避免模型发生过拟合，提高了模型检测边缘的准确性。具体地，步骤5)中通过混合训练集X训练孪生神经网络模型S时，采用的损失函数L为：

L＝L_S+L_U

本实施例中，通过不断循环基于当前半监督模型进行预测、筛选伪标签样本、剪裁显著变化框、混合数据集重新训练更新模型参数的步骤，直至所有无标签样本都打上伪标签时循环结束，最终完成对孪生神经网络模型S的训练。在孪生神经网络模型S完成训练后，将待检测的遥感图像输入孪生神经网络模型S，即可实现遥感图像的变化检测。

本实施例中训练和测试采用的数据集为LEVIR-CD数据集(LEVIR buildingChange Detection dataset)。LEVIR-CD数据集包含637组数据，每一组数据包含两张不同时相的图像，每张图像大小为1024×1024。由于图像尺寸较大，将每张图像裁剪成大小为256×256的16张不重叠的图像，共10192张。选取其中的10％作为训练集；并将训练集中10％作为有标签训练集，90％作为无标签训练集。

为了对本实施例方法进行验证，本文将本实施例中提出的方法与5种现有的全监督方法进行对比，5种现有的全监督方法包括：双时态图像变换器(Bitemporal ImageTransformer，BIT)、双重注意力网络(Dual Attention Network，DANet)、时空注意力神经网络(Spatial-Temporal Attention Neural Network，STANet)、W网络(W-Net)和全卷积早期融合网络(Fully Convolutional Early Fusion Resnet，FC-EF-Res)。5种全监督方法均采用LEVIR-CD数据集的10％作为有标签训练集，最终得到的实验结果如表1、图6、图7以及图8所示。

表1：本实施例方法与现有全监督方法的对比结果

	精度(％)	召回率(％)	F1分数(％)	总体精度(％)
					BIT	89.24	89.82	89.30	98.87
DANet	84.31	87.26	85.99	98.70
					STANet	87.01	89.38	88.65	98.65
W-Net	84.53	83.31	83.52	98.61
					FC-EF-Res	89.32	88.25	88.91	98.53
本实施例方法	89.48	89.21	89.31	98.95

参见表1，本文中采用的评价指标共有4种，分别为精度(Precision)、召回率(Recall)、F1分数(F1-score)、总体精度(OA)，其中F1分数是综合考虑了精度与召回率的评价指标。结合表1可以看出，与全监督方法相比，虽都采用LEVIR-CD数据集的10％作为训练集，但本实施例方法只利用了训练集中10％的数据标签进行半监督训练，达到媲美全监督的效果，并且在精度、F1分数与总体精度3种评价指标上效果好于DANet、STANet、W-Net以及FC-EF-Res四种全监督方法。值得一提的是，BIT方法与STANet方法的召回率略高于本实施例方法，这是因为这两种方法均采用注意力机制进行特征学习，虽将大部分的变化像素检测正确，但也将少部分的不变像素检测成了变化类，导致召回率的提高。本实施例方法在F1分数上优于所对比的5种全监督方法。

图6、图7和图8分别为本实施例方法和其他现有方法针对三个不同场景的三组变化检测结果对比示意图，其中T1图像和T2图像为不同时相的一对输入遥感图像；标签为像素级二进制标签，其中白色像素(值为1)代表变化类，黑色像素(值为0)代表不变类，由数据集作者进行标注；BIT、DANet、STANet、W-Net以及FC-EF-Res表示五种现有方法的变化检测结果，最后是本实施例的变化检测结果。结合图6～图8可以看出，本实施例方法的检测结果中边缘轮廓清晰，假阴性得到了明显的改善。由此可见，本实施例方法只需要少量的标签就可完成较高精度的变化检测，提高了模型检测边缘的准确性，进一步提升了变化检测性能。

综上所述，本实施例方法通过在少量的有标签训练集上进行模型训练，得到有标签训练模型；在有标签训练模型中加入蒙特卡罗移除层，多次采样得到多模型参数，对无标签训练集进行多模型预测，得到无标签样本的预测概率，并协同多次预测结果得到不确定性估计，根据设定的置信度阈值筛选出部分无标签样本打上伪标签；将有标签训练集中显著变化区域剪裁到伪标签训练集中，结合真实标签与伪标签，得到增强的伪标签数据集；根据不确定性估计结果设计损失函数，结合有标签数据集与伪标签数据集进行训练，得到多模型协同优化变化检测模型。本发明能够在训练数据标注样本受限的情况下进行半监督变化检测，通过协同多次预测结果来优化网络，学习更可靠的伪标签，并结合有标签图像与伪标签图像，利用监督学习改进半监督学习过程，进一步提升模型性能，有效改善了高分辨率遥感数据标注样本受限与变化检测结果轮廓不清晰的问题。

此外，本实施例还提供一种多模型协同优化高分遥感图像半监督变化检测系统，包括相互连接的微处理器和存储器，该微处理器被编程或配置以执行前述多模型协同优化高分遥感图像半监督变化检测方法的步骤。

此外，本实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，且该计算机程序用于被计算机设备执行以实施前述多模型协同优化高分遥感图像半监督变化检测方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种多模型协同优化高分遥感图像半监督变化检测方法，其特征在于，包括对用于高分遥感图像变化检测的孪生神经网络模型S进行训练的步骤：

6)判断预设的结束条件是否成立，若不成立，则跳转执行步骤3)以继续迭代训练更新孪生神经网络模型S的网络参数θ'，否则判定孪生神经网络模型S已完成训练；

所述孪生神经网络模型S包括两个分支编码器和解码合并模块，所述两个分支编码器共享参数，所述分支编码器包括依次相连的两个编码模块以及三个含有注意力模块的编码模块，所述解码合并模块包括依次相连的三个含有注意力模块的解码模块、两个解码模块以及卷积层，两个分支编码器中的一个分支编码器的输出端与解码合并模块的输入端相连，且两个分支编码器中相同级别的编码模块或含有注意力模块的编码模块之间输出的特征图差的绝对值与解码合并模块中含有注意力模块的解码模块或解码模块的输出端相连；

步骤2)中将有标签训练集X_L训练孪生神经网络模型S时，每一轮训练的步骤包括：将本轮的有标签训练样本输入孪生神经网络模型S进行训练，得到预测概率p_i ^L；根据预设的损失函数L_S对孪生神经网络模型S进行反向传播以得到孪生神经网络的网络参数θ，其中预设的损失函数L_S的函数表达式为：

L_S＝-[ω·y_i ^Llogp_i ^L+(1-y_i ^L)log(1-p_i ^L)]

上式中，ω为有标签训练集中变化类样本数与不变类样本数的比例，y_i ^L为标签训练样本相应的像素级标签，p_i ^L为孪生神经网络模型S得到的预测概率；

步骤3)中计算预测结果y^U中的置信度的函数表达式为：

步骤3)中协同多次预测结果得到不确定性估计D_i的函数表达式为：

上式中，N_pred为采用蒙特卡罗移除层生成的模型数，y_i,n ^U为第i个无标签训练样本对第n次预测产生的二值预测结果，E(y_i,n ^U)为第i个无标签训练样本的多模型N次预测产生的二值预测结果的均值；

步骤4)包括：

2.根据权利要求1所述的多模型协同优化高分遥感图像半监督变化检测方法，其特征在于，步骤1)中生成有标签训练集X_L包含N_L个有标签训练样本，且每一个有标签训练样本包含不同时相的两幅有标签遥感图像以及一个相应的像素级标签；无标签训练集X_U包含N_U个无标签训练样本，且每一个无标签训练样本包含不同时相的两幅有标签遥感图像。

3.根据权利要求1所述的多模型协同优化高分遥感图像半监督变化检测方法，其特征在于，步骤5)中通过混合训练集X训练孪生神经网络模型S时，采用的损失函数L为：

L＝L_S+L_U

4.一种多模型协同优化高分遥感图像半监督变化检测系统，包括相互连接的微处理器和存储器，其特征在于，该微处理器被编程或配置以执行权利要求1～3中任意一项所述多模型协同优化高分遥感图像半监督变化检测方法的步骤。

5.一种计算机可读存储介质，其特征在于，该计算机可读存储介质中存储有计算机程序，且该计算机程序用于被计算机设备执行以实施权利要求1～3中任意一项所述多模型协同优化高分遥感图像半监督变化检测方法的步骤。