Nothing Special   »   [go: up one dir, main page]

CN116106880B - 基于注意力机制和多尺度融合的水下声源测距方法和装置 - Google Patents

基于注意力机制和多尺度融合的水下声源测距方法和装置 Download PDF

Info

Publication number
CN116106880B
CN116106880B CN202310390544.2A CN202310390544A CN116106880B CN 116106880 B CN116106880 B CN 116106880B CN 202310390544 A CN202310390544 A CN 202310390544A CN 116106880 B CN116106880 B CN 116106880B
Authority
CN
China
Prior art keywords
feature
layer
network
module
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310390544.2A
Other languages
English (en)
Other versions
CN116106880A (zh
Inventor
徐立军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202310390544.2A priority Critical patent/CN116106880B/zh
Publication of CN116106880A publication Critical patent/CN116106880A/zh
Application granted granted Critical
Publication of CN116106880B publication Critical patent/CN116106880B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S11/00Systems for determining distance or velocity not using reflection or reradiation
    • G01S11/14Systems for determining distance or velocity not using reflection or reradiation using ultrasonic, sonic, or infrasonic waves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本申请提出了一种基于注意力机制和多尺度融合的水下声源测距方法和装置,涉及水下通信技术领域,其中,该方法包括:利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵;将样本协方差矩阵输入水下声源测距网络中进行特征提取,并将输出结果作为预测距离,其中,水下声源测距网络以残差网络为主干网络,水下声源测距网络包括自适应特征融合模块和至少一个特征子空间通道注意力模块。采用上述方案的本申请实现了水下声源的精确测距。

Description

基于注意力机制和多尺度融合的水下声源测距方法和装置
技术领域
本申请涉及水下通信技术领域,尤其涉及基于注意力机制和多尺度融合的水下声源测距方法和装置。
背景技术
海洋是实现可持续发展的重要空间和资源保障。基于声波的水下声源测距是环境感知、海洋监测、情报收集等海洋应用领域的重要手段,是提升应对海洋突发事件能力、加强战略战术的基础性技术之一。水下声源测距本质上是一个特征工程问题,包括特征提取和位置预测两部分。因此,设计高效的特征提取模块,可以实现水下声源的精确测距。
水下声源测距分为两类,一类是模型驱动方法,通过手动设计特征来预测目标位置,这些特征与声波传播的物理特性密切相关。此类方法的典型代表是匹配场处理方法(MFP)。该方法基于海洋环境参数,利用声传播模型模拟限定范围内的声场,然后将模拟声场与真实声场进行匹配,估计声源距离。模型驱动方法存在以下问题:手动设计的特征不能真实全面的反应深海的实际情况,在实际应用中受到限制,如果特征设计出现错误,则会直接导致测距性能的降低。因此,基于数据驱动的水下声源测距方法,即深度神经网络(DNN),通过数据分析和解释来学习特征模式,是一种有效的替代方法。
近年来,DNN在海洋工程中得到了广泛应用,比如水下目标探测,到达方向估计,海床分类等。DNN通过多个非线性层,在给定输入声学数据的情况下,学习与声源位置相关的特征。与模型驱动方法相比,DNN具有更强的特征表示能力,在水下声源测距中取得了最先进的性能。作为一种数据驱动的方法,DNN的性能在很大程度上取决于训练数据的数量和质量。然而,对于海洋工程,实际数据的获取相当困难,涉及预算、实验耗时、规章制度和保密性。训练数据的稀缺性导致模型过拟合,泛化能力差,预测精度低。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种基于注意力机制和多尺度融合的水下声源测距方法,解决了现有方法预测精度低、应用困难的技术问题,实现了水下声源的精确测距。
本申请的第二个目的在于提出一种基于注意力机制和多尺度融合的水下声源测距装置。
为达上述目的,本申请第一方面实施例提出了一种基于注意力机制和多尺度融合的水下声源测距方法,包括:利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵;将样本协方差矩阵输入水下声源测距网络中进行特征提取,并将输出结果作为预测距离,其中,水下声源测距网络以残差网络为主干网络,水下声源测距网络包括自适应特征融合模块和至少一个特征子空间通道注意力模块。
本申请实施例的基于注意力机制和多尺度融合的水下声源测距方法,利用信号处理技术预处理接收信号,所得样本协方差矩阵可以有效表示信号频率和接收阵列之间的关系。之后对传统的注意力机制和多尺度融合模块进行改进,并将其添加到传统的DNN中,得到基于注意力机制和多尺度融合的水下声源测距网络,最后将得到的样本协方差矩阵输入水下声源测距网络,输出预测距离,本申请针对水声测距任务的特殊性进行针对性的模型改进,使得模型的训练数据需求大幅降低,且有效提高预测精度。
可选地,在本申请的一个实施例中,利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵,包括:
对接收的水下信号进行归一化,并根据归一化的信号计算得到初始样本协方差矩阵;
将初始样本协方差矩阵的实部和虚部分离,并将分离后的不同频率的样本协方差矩阵沿第一维度进行堆叠,得到样本协方差矩阵;
其中,初始样本协方差矩阵表示为:
Figure SMS_1
其中,
Figure SMS_2
表示形状为/>
Figure SMS_3
的样本协方差矩阵,/>
Figure SMS_4
表示接收阵列阵元数量,/>
Figure SMS_5
表示归一化后的信号,/>
Figure SMS_6
表示复共轭转置。
可选地,在本申请的一个实施例中,水下声源测距网络还包括至少一个池化层和至少一个全连接层,残差网络为多层网络,每层由至少一个残差块组成,残差网络中除最后一层的其它层为中间层,每个中间层对应一个特征子空间通道注意力模块,残差网络每层对应一个池化层和一个全连接层,将样本协方差矩阵输入水下声源测距网络中进行特征提取,包括:
将样本协方差矩阵输入残差网络中,依次通过每层网络,获得每个中间层的输出数据,并获得最后一层的输出结果作为残差网络的最终输出结果;
将最终输出结果通过对应的池化层和全连接层,得到初始预测结果;
将每个中间层的输出数据分别通过对应的特征子空间通道注意力模块,得到每个中间层对应的特征图,将所有的特征图输入自适应特征融合模块,得到每个中间层对应的集成特征,并将每个中间层对应的集成特征分别通过对应的池化层和全连接层,得到所有中间层的预测结果;
将初始预测结果和所有中间层的预测结果相加并进行平均,得到最终预测结果。
可选地,在本申请的一个实施例中,特征子空间通道注意力模块包括特征子空间模块和至少一个压缩激励注意力模块,压缩激励注意力模块包括压缩模块和激励模块,将中间层的输出数据输入到特征子空间通道注意力模块,包括:
使用特征子空间模块沿通道维度对输出数据进行划分,得到至少一组特征图,其中,每组特征图对应一个压缩激励注意力模块;
将每组特征图输入对应的压缩激励注意力模块,通过对应的压缩模块使用全局平均池化将特征小组的通道上的整个空间特征编码为全局特征,通过对应的激励模块根据全局特征获得每个通道的权重,并将每个通道的权重乘以对应组的特征图,得到更新后的每组特征图;
将更新后的每组特征图沿通道维度进行拼接,得到对应的特征图。
可选地,在本申请的一个实施例中,全局特征表示为:
Figure SMS_7
其中,
Figure SMS_8
表示全局特征,/>
Figure SMS_9
表示当前处理的一组特征图;
每个通道的权重表示为:
Figure SMS_10
其中,
Figure SMS_12
表示每个通道的权重,/>
Figure SMS_15
表示全局特征,/>
Figure SMS_17
和/>
Figure SMS_13
分别表示ReLU激活函数和sigmoid激活函数,/>
Figure SMS_16
表示卷积层,包括/>
Figure SMS_18
和/>
Figure SMS_19
,/>
Figure SMS_11
用于压缩通道特征,/>
Figure SMS_14
用于还原通道维度;
更新后的每组特征图表示为:
Figure SMS_20
其中,
Figure SMS_21
表示当前处理的一组特征图,/>
Figure SMS_22
表示每个通道的权重;
特征图表示为:
Figure SMS_23
其中,
Figure SMS_24
表示更新后的第/>
Figure SMS_25
组特征图,concat表示通道维度的拼接操作。
可选地,在本申请的一个实施例中,将所有的特征图输入自适应特征融合模块,得到每个中间层对应的集成特征,包括:
选定所有特征图的图片大小的中间值为标准值,通过插值和最大池化按照标准值调整所有特征图的大小,并对调整后的特征图进行融合得到初始融合特征;
将初始融合特征通过卷积和softmax函数获得空间自适应权重,并将空间自适应权重在通道维度进行拆分,使其与调整后的特征图依次对应,得到拆分权重;
将调整后的特征图和对应的拆分权重对应相乘后相加,得到更新后的融合特征;
按照FPN的结构,将更新后的融合特征按照每个特征图的图片大小进行缩放和扩大,并通过跳跃连接使每个特征图与对应的调整的更新后的融合特征相加,得到每个中间层对应的特征图的集成特征。
可选地,在本申请的一个实施例中,调整后的特征图表示为:
Figure SMS_26
其中,
Figure SMS_27
、/>
Figure SMS_28
、/>
Figure SMS_29
表示所有的特征图;
初始融合特征表示为:
Figure SMS_30
其中,
Figure SMS_31
表示初始融合特征;
拆分权重表示为:
Figure SMS_32
其中,
Figure SMS_33
表示每个调整后的特征图对应的权重;
更新后的融合特征表示为:
Figure SMS_34
其中,
Figure SMS_35
表示更新后的融合特征;
每个中间层对应的特征图的集成特征表示为:
Figure SMS_36
Figure SMS_37
Figure SMS_38
其中,
Figure SMS_39
表示所有中间层对应的特征图的集成特征。
为达上述目的,本发明第二方面实施例提出了一种基于注意力机制和多尺度融合的水下声源测距装置,包括预处理模块、测距模块,其中,
预处理模块,用于利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵;
测距模块,用于将样本协方差矩阵输入水下声源测距网络中进行特征提取,并将输出结果作为预测距离,其中,水下声源测距网络以残差网络为主干网络,水下声源测距网络包括自适应特征融合模块和至少一个特征子空间通道注意力模块。
可选地,在本申请的一个实施例中,预处理模块,具体用于:
对接收的水下信号进行归一化,并根据归一化的信号计算得到初始样本协方差矩阵;
将初始样本协方差矩阵的实部和虚部分离,并将分离后的不同频率的样本协方差矩阵沿第一维度进行堆叠,得到样本协方差矩阵。
可选地,在本申请的一个实施例中,水下声源测距网络还包括至少一个池化层和至少一个全连接层,残差网络为多层网络,每层由至少一个残差块组成,残差网络中除最后一层的其它层为中间层,每个中间层对应一个特征子空间通道注意力模块,残差网络每层对应一个池化层和一个全连接层,测距模块,具体用于:
将样本协方差矩阵输入残差网络中,依次通过每层网络,获得每个中间层的输出数据,并获得最后一层的输出结果作为残差网络的最终输出结果;
将最终输出结果通过对应的池化层和全连接层,得到初始预测结果;
将每个中间层的输出数据分别通过对应的特征子空间通道注意力模块,得到每个中间层对应的特征图,将所有的特征图输入自适应特征融合模块,得到每个中间层对应的集成特征,并将集成特征分别通过对应的池化层和全连接层,得到所有中间层的预测结果;
将初始预测结果和所有中间层的预测结果相加并进行平均,得到最终预测结果。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例一所提供的一种基于注意力机制和多尺度融合的水下声源测距方法的流程示意图;
图2为本申请实施例的基于注意力机制和多尺度融合水下声源测距网络结构示例图;
图3为本申请实施例的特征子空间通道注意力结构示意图;
图4为本申请实施例的自适应特征融合模块结构示意图;
图5为本申请实施例提供的一种基于注意力机制和多尺度融合的水下声源测距装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于注意力机制和多尺度融合的水下声源测距方法和装置。
图1为本申请实施例一所提供的一种基于注意力机制和多尺度融合的水下声源测距方法的流程示意图。
如图1所示,该基于注意力机制和多尺度融合的水下声源测距方法包括以下步骤:
步骤101,利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵;
步骤102,将样本协方差矩阵输入水下声源测距网络中进行特征提取,并将输出结果作为预测距离,其中,水下声源测距网络以残差网络为主干网络,水下声源测距网络包括自适应特征融合模块和至少一个特征子空间通道注意力模块。
本申请实施例的基于注意力机制和多尺度融合的水下声源测距方法,利用信号处理技术预处理接收信号,所得样本协方差矩阵可以有效表示信号频率和接收阵列之间的关系。之后对传统的注意力机制和多尺度融合模块进行改进,并将其添加到传统的DNN中,得到基于注意力机制和多尺度融合的水下声源测距网络,最后将得到的样本协方差矩阵输入水下声源测距网络,输出预测距离,本申请针对水声测距任务的特殊性进行针对性的模型改进,使得模型的训练数据需求大幅降低,且有效提高预测精度。
可选地,在本申请的一个实施例中,利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵,包括:
对于接收信号预处理,即通过信号处理技术,首先对接收信号进行归一化,然后计算样本协方差矩阵,其公式为:
Figure SMS_40
其中,
Figure SMS_41
表示归一化后的信号,/>
Figure SMS_42
表示复共轭转置,/>
Figure SMS_43
表示形状为L×L的样本协方差矩阵,L表示接收阵列阵元数量。由于/>
Figure SMS_44
每个数据为复数形式,无法直接输入神经网络。因此,将其实部和虚部分离,得到形状为2×L×L的输入数据。
最后,将不同频率的
Figure SMS_45
沿第一维度进行堆叠,得到形状为2F×L×L的最终输入数据,其中/>
Figure SMS_46
表示频率个数。
可选地,在本申请的一个实施例中,水下声源测距网络还包括至少一个池化层和至少一个全连接层,残差网络为多层网络,每层由至少一个残差块组成,残差网络中除最后一层的其它层为中间层,每个中间层对应一个特征子空间通道注意力模块,残差网络每层对应一个池化层和一个全连接层,将样本协方差矩阵输入水下声源测距网络中进行特征提取,包括:
将样本协方差矩阵输入残差网络中,依次通过每层网络,获得每个中间层的输出数据,并获得最后一层的输出结果作为残差网络的最终输出结果;
将最终输出结果通过对应的池化层和全连接层,得到初始预测结果;
将每个中间层的输出数据分别通过对应的特征子空间通道注意力模块,得到每个中间层对应的特征图,将所有的特征图输入自适应特征融合模块,得到每个中间层对应的集成特征,并将集成特征分别通过对应的池化层和全连接层,得到所有中间层的预测结果;
将初始预测结果和所有中间层的预测结果相加并进行平均,得到最终预测结果。
可选地,在本申请的一个实施例中,特征子空间通道注意力模块包括特征子空间模块和至少一个压缩激励注意力模块,压缩激励注意力模块包括压缩模块和激励模块,将中间层的输出数据输入到特征子空间通道注意力模块,包括:
使用特征子空间模块沿通道维度对输出数据进行划分,得到至少一组特征图,其中,每组特征图对应一个压缩激励注意力模块;
将每组特征图输入对应的压缩激励注意力模块,通过对应的压缩模块使用全局平均池化将特征小组的通道上的整个空间特征编码为全局特征,通过对应的激励模块根据全局特征获得每个通道的权重,并将每个通道的权重乘以对应组的特征图,得到更新后的每组特征图;
将更新后的每组特征图沿通道维度进行拼接,得到对应的特征图。
可选地,在本申请的一个实施例中,全局特征表示为:
Figure SMS_47
其中,
Figure SMS_48
表示全局特征,/>
Figure SMS_49
表示当前处理的一组特征图;
每个通道的权重表示为:
Figure SMS_50
其中,
Figure SMS_52
表示每个通道的权重,/>
Figure SMS_55
表示全局特征,/>
Figure SMS_58
和/>
Figure SMS_53
分别表示ReLU激活函数和sigmoid激活函数,/>
Figure SMS_56
表示卷积层,包括/>
Figure SMS_57
和/>
Figure SMS_59
,/>
Figure SMS_51
用于压缩通道特征,/>
Figure SMS_54
用于还原通道维度;
更新后的每组特征图表示为:
Figure SMS_60
其中,
Figure SMS_61
表示当前处理的一组特征图,/>
Figure SMS_62
表示每个通道的权重;
特征图表示为:
Figure SMS_63
其中,
Figure SMS_64
表示更新后的第/>
Figure SMS_65
组特征图,concat表示通道维度的拼接操作。
可选地,在本申请的一个实施例中,将所有的特征图输入自适应特征融合模块,得到每个中间层对应的集成特征,包括:
选定所有特征图的图片大小的中间值为标准值,通过插值和最大池化按照标准值调整所有特征图的大小,并对调整后的特征图进行融合得到初始融合特征;
将初始融合特征通过卷积和softmax函数获得空间自适应权重,并将空间自适应权重在通道维度进行拆分,使其与调整后的特征图依次对应,得到拆分权重;
将调整后的特征图和对应的拆分权重对应相乘后相加,得到更新后的融合特征;
按照FPN的结构,将更新后的融合特征按照每个特征图的图片大小进行缩放和扩大,并通过跳跃连接使每个特征图与对应的调整的更新后的融合特征相加,得到每个中间层对应的特征图的集成特征。
可选地,在本申请的一个实施例中,调整后的特征图表示为:
Figure SMS_66
其中,
Figure SMS_67
、/>
Figure SMS_68
、/>
Figure SMS_69
表示所有的特征图;
初始融合特征表示为:
Figure SMS_70
其中,
Figure SMS_71
表示初始融合特征;
拆分权重表示为:
Figure SMS_72
其中,
Figure SMS_73
表示每个调整后的特征图对应的权重;
更新后的融合特征表示为:
Figure SMS_74
其中,
Figure SMS_75
表示更新后的融合特征;
每个中间层对应的特征图的集成特征表示为:
Figure SMS_76
Figure SMS_77
Figure SMS_78
其中,
Figure SMS_79
表示所有中间层对应的特征图的集成特征。
图2为本申请的基于注意力机制和多尺度融合的水下声源测距网络结构示例图,如图2所示,本实施例首先选择ResNet-50作为主干网络,该网络总共包含四层,每层由多个残差块(ResBlock)组成,并会产生一个输出
Figure SMS_80
。这些输出一方面从下到上依次传递,通过池化层和全连接层得到一个预测结果,另一方面前三层输出首先通过三个特征子空间通道注意力,实现通道特征和多频率特征的提取。随后通过自适应特征融合模块,实现语义特征和细节特征的融合,最后通过三个池化层和全连接层得到三个预测结果
Figure SMS_81
。最后将四个预测结果相加并进行平均得到最终的预测结果,由以下公式定义:
Figure SMS_82
特征子空间通道注意力
由于样本协方差矩阵的通道维度表示频率,相比传统图像,其通道数更多,含有更加丰富的通道特征。因此,需要使用通道注意力机制赋予这些特征不同的重要性,实现通道特征的有效表征和学习。基于以上发现,本实施例设计了一种特征子空间通道注意力。图3为本实施例所设计特征子空间通道注意力的结构示意图。
设输入特征图为
Figure SMS_83
,其中M为特征通道数,H,W为特征空间维度。首先将输入特征图通过特征子空间模块,该模块将输入特征图沿通道维度进行划分,总共划分出G组,每组包括g个特征。这种划分子空间的方式可以有效学习多领率特征,而多频率特征的提取有助于解决样本协方差矩阵中类内变化大的问题。
其次,将每组特征图通过压缩激励注意力模块(Squeeze-excitation module,SE)。SE通过对通道特征进行加权,强调有效信息,抑制无效信息,有助于对样本协方差矩阵中复杂的通道特征进行更好的提取。SE主要包括挤压(squeeze)和激励(excitation)两种操作。以其中一组特征图为例,设该组特征图为
Figure SMS_84
,首先将该组特征图输入squeeze模块。squeeze使用全局平均池化将通道上的整个空间特征编码为全局特征,由以下公式定义:
Figure SMS_85
其中
Figure SMS_86
表示全局特征。然后通过excitation模块,excitation通过squeeze提取的全局特征来捕获通道之间的依赖关系,由以下公式定义:
Figure SMS_87
其中
Figure SMS_88
表示每个通道的权重。δ和σ分别表示ReLU激活函数和sigmoid激活函数。
Figure SMS_89
和/>
Figure SMS_90
表示卷积层,第一个卷积层压缩通道特征,充分捕捉通道之间的关系,第二个卷积层还原通道维度。最后将每个通道的权重乘以,实现输入特征在通道维度的重新校准。该过程由以下公式定义:
Figure SMS_91
其中,
Figure SMS_92
表示当前处理的一组特征图,/>
Figure SMS_93
表示每个通道的权重;
最后,将通过SE模块的每组特征图沿通道维度进行拼接,该过程由以下公式定义:
Figure SMS_94
其中
Figure SMS_95
表示特征子空间通道注意力的输出,/>
Figure SMS_96
表示经过SE的每组特征图,concat表示通道维度的拼接操作。
自适应特征融合模块
由于样本协方差矩阵中存在较高的类内变化,因此对于距离相近的数据,单一的语义特征无法进行准确的预测,需要结合低层次的细节特征。特征金字塔(FPN)通过融合深层语义信息和浅层细节特征,实现特征集成,是一种有效的解决方法。然而,FPN中的自底向上路径和自顶向下路径是一种顺序处理方式。这种顺序处理方式导致每层特征更多的关注相邻特征和其本身,而缺乏对跨层特征的关注。基于以上发现,本发明设计了一种自适应特征融合模块。图4为本实施例所设计自适应特征融合模块的结构示意图。
设输入的三种尺度特征图分别为
Figure SMS_97
、/>
Figure SMS_98
、/>
Figure SMS_99
,对应尺度依次减小。第一步通过插值和最大池化将三种特征图调整为一个中间大小,即与/>
Figure SMS_100
相同的大小,对特征图进行缩放后,通过平均得到初始融合特征/>
Figure SMS_101
,该过程由以下公式定义:
Figure SMS_102
Figure SMS_103
第二步通过一个1×1卷积和softmax函数获得一个尺度为
Figure SMS_104
的空间自适应权重。然后,将其在通道维度进行拆分,与/>
Figure SMS_105
三种特征依次对应。该过程由以下公式定义:
Figure SMS_106
其中,
Figure SMS_107
表示每个调整后的特征图对应的权重;
第三步,将
Figure SMS_108
与/>
Figure SMS_109
相乘。通过计算加权和,将上下文信息进行聚集。该过程由以下公式定义:
Figure SMS_110
第四步,按照FPN中的结构,使用相反的操作将
Figure SMS_111
进行缩放和扩大,然后通过跳跃连接,与/>
Figure SMS_112
相加,输出集成特征/>
Figure SMS_113
。该过程由以下公式定义:
Figure SMS_114
Figure SMS_115
Figure SMS_116
为了实现上述实施例,本申请还提出一种基于注意力机制和多尺度融合的水下声源测距装置。
图5为本申请实施例提供的一种基于注意力机制和多尺度融合的水下声源测距装置的结构示意图。
如图5所示,该基于注意力机制和多尺度融合的水下声源测距装置包括预处理模块、测距模块,其中,
预处理模块,用于利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵;
测距模块,用于将样本协方差矩阵输入水下声源测距网络中进行特征提取,并将输出结果作为预测距离,其中,水下声源测距网络以残差网络为主干网络,水下声源测距网络包括自适应特征融合模块和至少一个特征子空间通道注意力模块。
可选地,在本申请的一个实施例中,预处理模块,具体用于:
对接收的水下信号进行归一化,并根据归一化的信号计算得到初始样本协方差矩阵;
将初始样本协方差矩阵的实部和虚部分离,并将分离后的不同频率的样本协方差矩阵沿第一维度进行堆叠,得到样本协方差矩阵。
可选地,在本申请的一个实施例中,水下声源测距网络还包括至少一个池化层和至少一个全连接层,残差网络为多层网络,每层由至少一个残差块组成,残差网络中除最后一层的其它层为中间层,每个中间层对应一个特征子空间通道注意力模块,残差网络每层对应一个池化层和一个全连接层,测距模块,具体用于:
将样本协方差矩阵输入残差网络中,依次通过每层网络,获得每个中间层的输出数据,并获得最后一层的输出结果作为残差网络的最终输出结果;
将最终输出结果通过对应的池化层和全连接层,得到初始预测结果;
将每个中间层的输出数据分别通过对应的特征子空间通道注意力模块,得到每个中间层对应的特征图,将所有的特征图输入自适应特征融合模块,得到每个中间层对应的集成特征,并将集成特征分别通过对应的池化层和全连接层,得到所有中间层的预测结果;
将初始预测结果和所有中间层的预测结果相加并进行平均,得到最终预测结果。
需要说明的是,前述对基于注意力机制和多尺度融合的水下声源测距方法实施例的解释说明也适用于该实施例的基于注意力机制和多尺度融合的水下声源测距装置,此处不再赘述。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (8)

1.一种基于注意力机制和多尺度融合的水下声源测距方法,其特征在于,包括以下步骤:
利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵;
将所述样本协方差矩阵输入水下声源测距网络中进行特征提取,并将输出结果作为预测距离,其中,所述水下声源测距网络以残差网络为主干网络,所述水下声源测距网络包括自适应特征融合模块和至少一个特征子空间通道注意力模块,所述水下声源测距网络还包括至少一个池化层和至少一个全连接层,所述残差网络为多层网络,每层由至少一个残差块组成,所述残差网络中除最后一层的其它层为中间层,每个中间层对应一个特征子空间通道注意力模块,所述残差网络每层对应一个池化层和一个全连接层,所述将所述样本协方差矩阵输入水下声源测距网络中进行特征提取,包括:
将所述样本协方差矩阵输入所述残差网络中,依次通过每层网络,获得每个中间层的输出数据,并获得最后一层的输出结果作为所述残差网络的最终输出结果;
将所述最终输出结果通过对应的池化层和全连接层,得到初始预测结果;
将所述每个中间层的输出数据分别通过对应的特征子空间通道注意力模块,得到每个中间层对应的特征图,将所有的特征图输入所述自适应特征融合模块,得到每个中间层对应的集成特征,并将所述每个中间层对应的集成特征分别通过对应的池化层和全连接层,得到所有中间层的预测结果;
将所述初始预测结果和所述所有中间层的预测结果相加并进行平均,得到最终预测结果。
2.如权利要求1所述的基于注意力机制和多尺度融合的水下声源测距方法,其特征在于,所述利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵,包括:
对接收的水下信号进行归一化,并根据归一化的信号计算得到初始样本协方差矩阵;
将所述初始样本协方差矩阵的实部和虚部分离,并将分离后的不同频率的样本协方差矩阵沿第一维度进行堆叠,得到所述样本协方差矩阵;
其中,所述初始样本协方差矩阵表示为:
Figure QLYQS_1
其中,
Figure QLYQS_2
表示形状为/>
Figure QLYQS_3
的样本协方差矩阵,/>
Figure QLYQS_4
表示接收阵列阵元数量,/>
Figure QLYQS_5
表示归一化后的信号,/>
Figure QLYQS_6
表示复共轭转置。
3.如权利要求1所述的基于注意力机制和多尺度融合的水下声源测距方法,其特征在于,所述特征子空间通道注意力模块包括特征子空间模块和至少一个压缩激励注意力模块,所述压缩激励注意力模块包括压缩模块和激励模块,将所述中间层的输出数据输入到所述特征子空间通道注意力模块,包括:
使用所述特征子空间模块沿通道维度对所述输出数据进行划分,得到至少一组特征图,其中,每组特征图对应一个压缩激励注意力模块;
将每组特征图输入对应的压缩激励注意力模块,通过对应的压缩模块使用全局平均池化将特征小组的通道上的整个空间特征编码为全局特征,通过对应的激励模块根据所述全局特征获得每个通道的权重,并将每个通道的权重乘以对应组的特征图,得到更新后的每组特征图;
将所述更新后的每组特征图沿通道维度进行拼接,得到对应的特征图。
4.如权利要求3所述的基于注意力机制和多尺度融合的水下声源测距方法,其特征在于,所述全局特征表示为:
Figure QLYQS_7
其中,
Figure QLYQS_8
表示全局特征,/>
Figure QLYQS_9
表示当前处理的一组特征图;
所述每个通道的权重表示为:
Figure QLYQS_10
其中,
Figure QLYQS_12
表示每个通道的权重,/>
Figure QLYQS_15
表示全局特征,/>
Figure QLYQS_17
和/>
Figure QLYQS_13
分别表示ReLU激活函数和sigmoid激活函数,/>
Figure QLYQS_16
表示卷积层,包括/>
Figure QLYQS_18
和/>
Figure QLYQS_19
,/>
Figure QLYQS_11
用于压缩通道特征,/>
Figure QLYQS_14
用于还原通道维度;
所述更新后的每组特征图表示为:
Figure QLYQS_20
其中,
Figure QLYQS_21
表示当前处理的一组特征图,/>
Figure QLYQS_22
表示每个通道的权重;
所述特征图表示为:
Figure QLYQS_23
其中,
Figure QLYQS_24
表示更新后的第/>
Figure QLYQS_25
组特征图,concat表示通道维度的拼接操作。
5.如权利要求1所述的基于注意力机制和多尺度融合的水下声源测距方法,其特征在于,所述将所有的特征图输入所述自适应特征融合模块,得到每个中间层对应的集成特征,包括:
选定所有特征图的图片大小的中间值为标准值,通过插值和最大池化按照所述标准值调整所有特征图的大小,并对调整后的特征图进行融合得到初始融合特征;
将所述初始融合特征通过卷积和softmax函数获得空间自适应权重,并将所述空间自适应权重在通道维度进行拆分,使其与调整后的特征图依次对应,得到拆分权重;
将所述调整后的特征图和对应的拆分权重对应相乘后相加,得到更新后的融合特征;
按照FPN的结构,将所述更新后的融合特征按照每个特征图的图片大小进行缩放和扩大,并通过跳跃连接使每个特征图与对应的调整的更新后的融合特征相加,得到每个中间层对应的特征图的集成特征。
6.如权利要求5所述的基于注意力机制和多尺度融合的水下声源测距方法,其特征在于,所述调整后的特征图表示为:
Figure QLYQS_26
其中,
Figure QLYQS_27
、/>
Figure QLYQS_28
、/>
Figure QLYQS_29
表示所有的特征图;
所述初始融合特征表示为:
Figure QLYQS_30
其中,
Figure QLYQS_31
表示所述初始融合特征;
所述拆分权重表示为:
Figure QLYQS_32
其中,
Figure QLYQS_33
表示每个调整后的特征图对应的权重;
所述更新后的融合特征表示为:
Figure QLYQS_34
其中,
Figure QLYQS_35
表示所述更新后的融合特征;
所述每个中间层对应的特征图的集成特征表示为:
Figure QLYQS_36
Figure QLYQS_37
Figure QLYQS_38
其中,
Figure QLYQS_39
表示所有中间层对应的特征图的集成特征。
7.一种基于注意力机制和多尺度融合的水下声源测距装置,其特征在于,包括预处理模块、测距模块,其中,
所述预处理模块,用于利用信号处理技术对接收的水下信号进行预处理,得到接收信号对应的样本协方差矩阵;
所述测距模块,用于将所述样本协方差矩阵输入水下声源测距网络中进行特征提取,并将输出结果作为预测距离,其中,所述水下声源测距网络以残差网络为主干网络,所述水下声源测距网络包括自适应特征融合模块和至少一个特征子空间通道注意力模块,所述水下声源测距网络还包括至少一个池化层和至少一个全连接层,所述残差网络为多层网络,每层由至少一个残差块组成,所述残差网络中除最后一层的其它层为中间层,每个中间层对应一个特征子空间通道注意力模块,所述残差网络每层对应一个池化层和一个全连接层;
所述测距模块,具体用于:
将所述样本协方差矩阵输入所述残差网络中,依次通过每层网络,获得每个中间层的输出数据,并获得最后一层的输出结果作为所述残差网络的最终输出结果;
将所述最终输出结果通过对应的池化层和全连接层,得到初始预测结果;
将所述每个中间层的输出数据分别通过对应的特征子空间通道注意力模块,得到每个中间层对应的特征图,将所有的特征图输入所述自适应特征融合模块,得到每个中间层对应的集成特征,并将所述每个中间层对应的集成特征分别通过对应的池化层和全连接层,得到所有中间层的预测结果;
将所述初始预测结果和所述所有中间层的预测结果相加并进行平均,得到最终预测结果。
8.如权利要求7所述的基于注意力机制和多尺度融合的水下声源测距装置,其特征在于,所述预处理模块,具体用于:
对接收的水下信号进行归一化,并根据归一化的信号计算得到初始样本协方差矩阵;
将所述初始样本协方差矩阵的实部和虚部分离,并将分离后的不同频率的样本协方差矩阵沿第一维度进行堆叠,得到所述样本协方差矩阵。
CN202310390544.2A 2023-04-13 2023-04-13 基于注意力机制和多尺度融合的水下声源测距方法和装置 Active CN116106880B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310390544.2A CN116106880B (zh) 2023-04-13 2023-04-13 基于注意力机制和多尺度融合的水下声源测距方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310390544.2A CN116106880B (zh) 2023-04-13 2023-04-13 基于注意力机制和多尺度融合的水下声源测距方法和装置

Publications (2)

Publication Number Publication Date
CN116106880A CN116106880A (zh) 2023-05-12
CN116106880B true CN116106880B (zh) 2023-06-30

Family

ID=86267671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310390544.2A Active CN116106880B (zh) 2023-04-13 2023-04-13 基于注意力机制和多尺度融合的水下声源测距方法和装置

Country Status (1)

Country Link
CN (1) CN116106880B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116559778B (zh) * 2023-07-11 2023-09-29 海纳科德(湖北)科技有限公司 一种基于深度学习的车辆鸣笛定位方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6207817B2 (ja) * 2012-08-10 2017-10-04 国立大学法人東京海洋大学 水中位置関係情報取得システム
CN109975762B (zh) * 2017-12-28 2021-05-18 中国科学院声学研究所 一种水下声源定位方法
CN109993280B (zh) * 2019-03-27 2021-05-11 东南大学 一种基于深度学习的水下声源定位方法
CN112329658B (zh) * 2020-11-10 2024-04-02 江苏科技大学 一种对于yolov3网络的检测算法改进方法
CN113269077B (zh) * 2021-05-19 2023-04-07 青岛科技大学 基于改进门控网络和残差网络的水声通信信号调制方式识别方法
CN114332592B (zh) * 2022-03-11 2022-06-21 中国海洋大学 一种基于注意力机制的海洋环境数据融合方法及系统
CN115239974A (zh) * 2022-06-27 2022-10-25 重庆邮电大学 融合注意力机制的视觉同步定位与地图构建闭环检测方法

Also Published As

Publication number Publication date
CN116106880A (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN111563418A (zh) 一种基于注意力机制的非对称多模态融合显著性检测方法
CN110555841B (zh) 基于自注意图像融合和dec的sar图像变化检测方法
CN110263819A (zh) 一种用于贝类图像的目标检测方法及装置
CN110781924A (zh) 一种基于全卷积神经网络的侧扫声纳图像特征提取方法
CN110532932A (zh) 一种多分量雷达信号脉内调制方式识别方法
Li et al. Learning deep models from synthetic data for extracting dolphin whistle contours
Wei et al. A method of underwater acoustic signal classification based on deep neural network
CN116106880B (zh) 基于注意力机制和多尺度融合的水下声源测距方法和装置
CN113076819A (zh) 同色系背景下的果实识别方法、装置及果实采摘机器人
White et al. More than a whistle: Automated detection of marine sound sources with a convolutional neural network
CN117423346A (zh) 基于tbta网络的海洋哺乳动物叫声识别分类方法
CN114418930A (zh) 一种基于轻量化YOLOv4的水下鲸鱼目标检测方法
CN116502174A (zh) 一种基于多模态深度学习的环境识别方法及装置
CN114201993B (zh) 一种检测超声缺陷的三分支注意力特征融合方法与系统
CN118549908B (zh) 星载激光雷达的光子提取方法
Williams Acoustic-color-based convolutional neural networks for UXO classification with low-frequency sonar
CN111242134A (zh) 一种基于特征自适应学习的遥感影像地物分割方法
CN114065822A (zh) 海洋潮流涨落的电磁识别方法及系统
CN114283082A (zh) 一种基于注意力机制的红外小目标检测方法
CN116486183B (zh) 基于多种注意力权重融合特征的sar图像建筑区分类方法
CN112330562A (zh) 一种异构遥感图像变换方法及系统
Wang et al. Underwater acoustic target recognition combining multi-scale features and attention mechanism
Vetaw et al. Learning-based tone mapping to improve 3d sas atr
CN117854540B (zh) 基于神经网络和多维特征融合的水声目标识别方法及系统
CN118537714B (zh) 一种基于跨尺度注意力的水下目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant