CN114170089B

CN114170089B - 一种用于糖尿病视网膜病变分类的方法及电子设备

Info

Publication number: CN114170089B
Application number: CN202111540274.6A
Authority: CN
Inventors: 黄昶荃; 李永红; 彭小东
Original assignee: Chengdu Second Peoples Hospital
Current assignee: Chengdu Second Peoples Hospital
Priority date: 2021-09-30
Filing date: 2021-12-16
Publication date: 2023-07-07
Anticipated expiration: 2041-12-16
Also published as: CN114170089A

Abstract

本发明公开了一种用于糖尿病视网膜病变分类的方法及电子设备，方法包括超分辨率重建和利用图像分类网络对超分图像进行分类等步骤，超分辨率重建网络包括初步卷积层、深层特征提取单元、特征融合单元和图像放大模块，初步卷积层用于对眼底图像进行浅层特征提取，深层特征提取单元包括跳跃连接和多个残差注意力模块，图像放大模块用于对第二特征图进行超分辨率重建。本发明利用超分辨率技术增大眼底图像的分辨率，在有限的硬件条件下，提升基于深度学习方法对糖尿病视网膜病变分类的准确率，以满足实际诊断的需要，缓解医疗资源紧张的局面；超分辨率重建网络特征提取效率高，重建效果好。

Description

一种用于糖尿病视网膜病变分类的方法及电子设备

技术领域

本发明属于医疗和图像处理技术领域，具体地说，涉及一种用于糖尿病视网膜病变分类的方法及电子设备。

背景技术

糖尿病会引起多种并发症，糖尿病性视网膜病变(DR)是其中比较严重的一种，它能够导致患者视力出现障碍，甚至致盲。随着人们物质生活水平的提高，人均年龄逐渐增大，我国患糖尿病的人数也随之迅速扩大，需要进行视网膜病变诊断的患者数量快速增长。另一方面，常规的人工诊断依赖于医生的临床经验，而合格的医疗人员培养周期长，与快速增加的患者数量相比，医疗资源越来越匮乏，使得很多患者得不到及时的诊断和治疗，导致疾病恶化。

利用人工智能技术，尤其是深度学习，对眼底视网膜图像进行自动分类，以辅助诊断糖尿病性视网膜病变是解决医疗资源匮乏的一个有效途径。但是，准确的诊断依赖于高质量的图像输入，而我国很多地区经济水平不高，医疗设备条件落后，拍摄获取的视网膜图像分辨率普遍比较低，导致基于深度学习的图像分类方法误诊率高，难以满足实际的需要。

发明内容

针对现有技术中上述的不足，本发明提供了一种用于糖尿病视网膜病变分类的方法及电子设备，以提高对眼底视网膜图像分类的准确率。

为了达到上述目的，本发明采用的解决方案是：一种用于糖尿病视网膜病变分类的方法，包括以下步骤：

S1、获取眼底图像，获取训练好的超分辨率重建网络，利用所述超分辨率重建网络对所述眼底图像进行超分辨率重建，获得分辨率大于所述眼底图像的超分图像；

S2、获取训练好的图像分类网络，将所述超分图像输入所述图像分类网络，利用所述图像分类网络对所述超分图像进行分类；

所述超分辨率重建网络包括：

初步卷积层，所述初步卷积层用于对所述眼底图像进行浅层特征提取，获得第一特征图；

深层特征提取单元，所述深层特征提取单元的输入端与所述初步卷积层的输出端连接，所述深层特征提取单元包括跳跃连接和多个残差注意力模块，多个所述残差注意力模块首尾顺次连接，所述第一特征图通过所述跳跃连接输入各个所述残差注意力模块；

特征融合单元，所述特征融合单元用于将各个所述残差注意力模块输出的特征图融合，得到第二特征图；

图像放大模块，所述图像放大模块用于对所述第二特征图进行超分辨率重建，获得所述超分图像；

其中，所述残差注意力模块的数学模型为：

F1＝σ₁(f₃₁(K_n))

F2＝σ₂(f₃₂(K_n))

F3＝σ₃(f₃₃(F2))

F4＝f_ca(f_T(F1,F2,K₀))

F5＝f_m(F4,[F1,F3])

K_n+1＝σ₄(f₁(F5))+K_n

其中，K₀表示所述第一特征图，K_n为上游输出的特征图，K₀和K_n同时作为所述残差注意力模块的输入，f₃₁、f₃₂和f₃₃均表示卷积核大小为3*3的卷积操作，f₁表示卷积核大小为1*1的卷积操作，σ₁、σ₂、σ₃和σ₄均表示非线性激活函数ReLU，f_T表示三元融合模块，所述三元融合模块用于将F1、F2和K₀融合，f_ca表示通道注意力模块，[·]表示对其中的特征图进行拼接操作，f_m(F4，[F1,F3])表示F1与F3拼接后、再与F4融合，K_n+1表示所述残差注意力模块输出的特征图。

进一步地，所述三元融合模块可表示为如下公式：

F_T1＝σ_T1(f_T1([F1,F2,K₀]))

F_T2＝σ_T2(F1+F2)

F_T＝σ_T3(f_T3([F_T1,F_T2]))

其中，F1、F2和K₀同时作为所述三元融合模块的输入，f_T1表示卷积核大小为1*1的卷积操作，f_T3表示卷积核大小为3*3的卷积操作，σT₁、σT₂和σT₃均表示非线性激活函数ReLU，[·]表示对其中的特征图进行拼接操作，F_T为所述三元融合模块的输出。

进一步地，所述通道注意力模块的数学模型为：

Fa1＝δ_a1(f_a12(σ_a1(f_a11(p_v(F_T)))))

Fa2＝δ_a2(f_a22(σ_a2(f_a21(p_M(F_T)))))

Fa3＝δ_a3(f_a32(σ_a3(f_a31(p_Max(F_T)))))

其中，F_T表示所述三元融合模块的输出，F_T作为所述通道注意力模块的输入，p_v表示全局方差池化操作，p_M表示全局平均池化操作，p_Max表示全局最大池化操作，f_a11、f_a12、f_a21、f_a22、f_a31和f_a32均表示全连接操作，σ_a1、σ_a2和σ_a3均表示非线性激活函数ReLU，δ_a1、δ_a2、和δ_a3均为sigmoid激活函数，Fa1、Fa2和Fa3为所述通道注意力模块输出的通道注意力图。

进一步地，特征图F1与特征图F3拼接后获得的特征图，与所述通道注意力图融合过程，包括以下步骤：

A1、特征图F1与特征图F3拼接后获得的特征图，分别与所述通道注意力模块输出的三个通道注意力图相乘，分别获得第一增强特征图、第二增强特征图和第三增强特征图，

A2、将所述第一增强特征图、所述第二增强特征图和所述第三增强特征图在通道方向上拼接。

进一步地，所述图像分类网络为MobileNet V3。

本发明还提供了一种用于糖尿病视网膜病变分类的电子设备，包括处理器和存储器，所述存储器储存有计算机程序，所述处理器通过加载所述计算机程序，用于执行如上所述的用于糖尿病视网膜病变分类的方法。

本发明的有益效果是：

(1)利用超分辨率技术增大眼底图像的分辨率，在有限的硬件条件下，提升基于深度学习方法对糖尿病视网膜病变分类的准确率，以满足实际诊断的需要，减轻医疗人员负担，缓解医疗资源紧张的局面，避免患者因为没有及时就诊导致病情加重；

(2)在残差注意力模块内部，输入的特征图先经过两个分支进行特征提取，其中一个为3*3大小的卷积操作，另外一个分支为串联的两个3*3卷积，相当于5*5的卷积操作，由于超分辨率重建是比分类更具象的任务，所以在本发明中，采用残差注意力模块前端卷积层输出的特征图输入三元融合模块，用以生成通道注意力图，因为这些特征图中包含相对更多的具象特征信息，生成的通道注意力图的调制效果也更好，有利于重建出效果更好的超分图像；

(3)为了更充分利用低分辨率图像中的信息，第一特征图通过跳跃连接输入各个残差注意力模块，第一特征图与残差注意力模块中的特征图融合后，经通道注意力模块生成的通道注意力图，更有利于调制提高高频信息的提取比例，减少无用信息冗余；

(4)对于不同的残差注意力模块，由于其在网络中的深度位置不同，F1、F2中信息的尺度也不同，为了使第一特征图能够与不同残差注意力模块中的F1特征图、F2特征图都能很好地融合，发明人创造性地设计了三元融合模块，F1、F2和第一特征图先通过拼接降维融合，得到的特征图再与F1、F2求和激活后的特征图拼接，最后通过3*3卷积层特征提取，这样很好地平衡了第一特征图中的具体特征信息和F1、F2中的抽象特征信息，输入不同残差注意力模块中的第一特征图能够与不同尺度的信息自适应地融合，提高有用特征信息提取效率；

(5)对于包含多个模块的注意力机制(如CBAM)，通常是将不同注意力模块产生的注意力图按照串联的方式依次与特征图相乘，上游注意力图对特征图调制后，改变了不同信息的重要性和占比，对位于后面的注意力模块会产生干扰，本发明则将三个分支生成的注意力图采用并联的方式进行调制，再通过拼接降维激活的方式融合，避免了不同注意力分支模块之间互相干扰，提高注意力机制的调制效果。

附图说明

图1为本发明的超分辨率重建网络结构示意图；

图2为本发明的残差注意力模块结构示意图；

图3为本发明的三元融合模块结构示意图；

图4为本发明的通道注意力模块第一分支结构示意图；

图5为本发明的通道注意力模块第二分支结构示意图；

图6为本发明的通道注意力模块第三分支结构示意图；

图7为本发明的特征融合单元结构示意图；

图8为本发明的图像放大模块结构示意图；

附图中：

1-眼底图像，2-初步卷积层，3-深层特征提取单元，4-跳跃连接，5-残差注意力模块，51-三元融合模块，52-通道注意力模块，53-第一分支，54-第二分支，55-第三分支，6-特征融合单元，7-图像放大模块，8-超分图像。

具体实施方式

以下结合附图对本发明作进一步描述：

实施例：

收集眼底图像1，制作眼底图像数据集，并将数据集划分为第一训练集、第二训练集和测试集三个部分。第一训练集、第二训练集和测试集中均包含由人类专家标注的病变信息，病变信息包括无病变、轻微病变、中等病变、严重病变和增殖病变五个类别。

超分辨率重建网络训练：

超分辨率重建网络的结构如图1所示，本实施例中超分网络中包含十六个残差注意力模块5。对第一训练集图像进行下采样，获得低分辨眼底图像1，然后利用低分辨率眼底图像1和第一训练集图像对超分辨率重建网络进行训练。训练过程中采用L2损失函数优化模型。

初步卷积层2采用卷积核大小为3*3的卷积层实现，初步卷积层2输出的第一特征图通道数量为48，初步卷积层2的输出端与深层特征提取单元3的输入端连接。对于第一个残差注意力模块5，第一特征图同时从上游端和跳跃连接4两个方向输入第一个残差注意力模块5，后面下游的残差注意力模块5的输入端则是接受上一个残差注意力模块5输出的特征图作为输入。

残差注意力模块5的结构如图2所示，从上游输入残差注意力模块5的特征图先经过两个分支进行特征提取，两个分支输出的特征图(F1、F3)通道数量均为48，在通道方向上拼接后，通道数量变为96。

三元融合模块51的结构如图3所示，输入三元融合模块51的三个特征图(第一特征图、F1、F2)通道数量均为48，三个特征图先经过拼接、1*1卷积和激活操作后，输出通道数量为48的第一中间特征图。另一方面，F1和F2通过求和、激活后，输出通道数量为48的第二中间特征图。然后第一中间特征图和第二中间特征图经过拼接、3*3卷积和激活函数，输出通道数量为96的特征图，该特征图作为通道注意力模块52的输入。

在本实施例中，通道注意力模块52包括第一分支53(如图4所示)、第二分支54(如图5所示)和第三分支55(如图6所示)，三个分支均包括全局池化操作和两个全连接操作。在每个分支中，第一个全连接层的输入结点数为96，输出结点数为24，第二全连接层输入结点数为24，输出结点数为96。三个通道注意力图分别对F1、F3拼接后特征图进行调制后，在通道方向上拼接，然后输入1*1卷积层和ReLU激活函数，输出通道数量为48的特征图。

特征融合单元6的结构如图7所示，所有残差注意力模块5输出的特征图先在通道方向上拼接，然后利用1*1卷积层卷积，使通道数量变为48，最后经过一个ReLU激活函数输出第二特征图。

图像放大模块7可以采用现有的反卷积和亚像素卷积操作实现，在本实施例中，图像放大模块7的结构如图8所示，图像放大模块7包括两个放大组件和末端卷积层，末端卷积层设于图像放大组件的尾部，两个放大组件首尾顺次连接，放大组件包括顺次连接的反卷积层和ReLU激活函数。末端卷积层和反卷积层的卷积核尺寸均为3*3，特征图每经过一个放大组件，长宽尺寸变为原来的两倍，通道数量不变。对于末端卷积层，输入通道数量为48，输出通道数量为3的超分图像8。

图像分类网络训练：

利用训练完成的超分辨率重建网络，对第二训练集中的图像进行超分辨率重建，然后利用获得的超分图像8训练图像分类网络。图像分类网络采用MobileNet V3，训练过程中采用交叉熵作为损失函数。

糖尿病视网膜病变分类：

将测试集中图像输入前面训练好的超分辨率重建网络，重建输出的图像输入前面训练好的图像分类网络，结合标注信息，计算模型分类的准确率。

作为对比实验，将本发明所提供的超分辨率重建网络替换为SAN模型，按照上述方法，在完全相同的条件(包括训练集、框架、epoch、batchsize、放大倍数等)下重新训练SAN模型和图像分类网络，并在相同的测试集上进行测试，结果表明，采用本发明提供的超分辨率重建网络最终得到的分类结果精度，比采用SAN网络要高7.4％。

以上所述实施例仅表达了本发明的具体实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种用于糖尿病视网膜病变分类的方法，其特征是：包括以下步骤：