CN114943832B - 一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法 - Google Patents
一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法 Download PDFInfo
- Publication number
- CN114943832B CN114943832B CN202210229869.8A CN202210229869A CN114943832B CN 114943832 B CN114943832 B CN 114943832B CN 202210229869 A CN202210229869 A CN 202210229869A CN 114943832 B CN114943832 B CN 114943832B
- Authority
- CN
- China
- Prior art keywords
- layer
- convolution
- network
- lightweight
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 41
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000011218 segmentation Effects 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 42
- 238000013461 design Methods 0.000 claims abstract description 12
- 238000013528 artificial neural network Methods 0.000 claims description 59
- 230000004913 activation Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000011068 loading method Methods 0.000 claims description 3
- 238000009966 trimming Methods 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 238000013434 data augmentation Methods 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 238000011049 filling Methods 0.000 claims 3
- 239000000284 extract Substances 0.000 claims 2
- 238000005096 rolling process Methods 0.000 claims 2
- 238000010276 construction Methods 0.000 claims 1
- 230000000149 penetrating effect Effects 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 9
- 238000003709 image segmentation Methods 0.000 abstract description 4
- 238000013135 deep learning Methods 0.000 abstract 1
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 239000010410 layer Substances 0.000 description 55
- 230000006870 function Effects 0.000 description 14
- 238000010606 normalization Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000000945 filler Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000004821 distillation Methods 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 239000011343 solid material Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000013585 weight reducing agent Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明设计了一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法,其包含了一种基于多路卷积特征融合的轻量化分割网络设计方法与一种基于差温知识蒸馏的模型训练方法,解决了现有基于深度学习的道路路面图像分割网络难以应用的问题。本发明设计了一种多路卷积特征融合网络结构,其包含标准卷积路径、长方卷积路径、膨胀卷积路径与融合路径,能在浅网络层与窄特征通道的条件下保持良好的分割性能。本发明拓展了知识蒸馏,通过制造差异温度参数进一步缩小轻量化网络的收敛空间,从而提升网络性能。最终基于本发明所训练出来的轻量化网络能够部署到嵌入式设备中执行高效准确的路面裂缝分割检测任务。
Description
技术领域
本发明涉及道路路面病害识别技术领域,可用于路面路面裂缝的快速检测,具体涉及一种基于多路卷积特征融合的轻量化分割网络设计方法与一种基于差温知识蒸馏的模型训练方法。
技术背景
道路裂缝是指道路固体材料组织在机械力冲击,化学侵蚀,温差效应等作用下产生的一种不连续现象,一般表现为肉眼可见的,宽度等于或大于0.05mm的宏观裂隙。道路路面裂缝扩展会使雨水与杂物侵入面层结构与路基,造成道路的结构性破坏,导致路面承载能力与耐久性下降,加速路面老化与损坏,增加交通安全风险。为了降低路面裂缝扩展带来的安全风险,我国每年要投入大量资金改善结构状况以维持道路寿命。目前,路面裂缝调查一般依靠检测员目测评估完成,但这种工作方式危险、辛苦而低效。所以,设计一种自动化快速巡检路面裂缝方法具有现实意义。
近年来得益于计算机视觉在道路结构健康监测领域的发展,基于图像的裂缝检测与分割方法取得了巨大进步。相关研究者构建深层神经网络执行路面裂缝检测任务,利用卷积神经网络强大的特征提取能力,开发了一系列自动化、高性能的检测方法,这些方法为道路运营与维护工作提供了便利。但是,由于深度神经网络对计算机内存空间与运算能力存在较高要求,因此神经网络的应用部署工作难以推进。而浅层神经网络又无法满足道路检测任务的性能要求。因此,寻找一种能同时满足轻量化与性能要求的路面裂缝图像分割网络具有现实意义。同时,寻找一种适用于嵌入式设备的神经网络部署方案可以进一步拓展神经网络的工程应用场景。
发明内容
为了克服现有技术的缺点,本发明的目的是提供一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法,解决现有神经网络无法部署到嵌入式设备并维持良好性能的问题,实现了路面裂缝分割网络在嵌入式设备中能以极小的运行成本进行接近实时、高效和准确的裂缝图像分割任务。
本系统涉及基于多路卷积特征融合的轻量化网络结构设计方法、基于差温知识蒸馏的轻量化模型训练方案以及适用于嵌入式设备的轻量化网络部署方案。
为了实现上述目的,本发明的技术方案是:
步骤一:收集路面裂缝图像,对图像进行数据分析、数据清理与数据增广等操作,对裂缝图像进行分割标注并创建训练实例;
步骤二:根据数据分析所获得的先验知识,设计构建复杂多路卷积特征融合深度神经网络与不平衡损失函数,针对裂缝的不同特征进行差异性提取,再融合提取到的差异性特征用于预测分割标签;
步骤三:训练构建好的复杂神经网络,经过反复实验后得到性能优越的复杂深度神经网络;
步骤四:修改复杂神经网络分类层参数,使复杂神经网络推理软目标分割标签,并将软目标分割标签视作轻量化神经网络训练数据集的一部分;
步骤五:设计构造与复杂网络具有相似结构的轻量化多路卷积特征融合神经网络,使用差温知识蒸馏的模型训练方案让轻量化网络学习复杂神经网络的知识,从而使轻量化分割神经网络保持优良性能;
步骤六:对轻量化分割神经网络进行修剪与量化,进一步压缩网络。
步骤七:将训练得到的基于多路卷积特征融合的轻量化神经网络部署至嵌入式设备,连接摄像头并安置在智能移动小车上,执行自动化巡检路面裂缝任务。
进一步地,所述步骤一:
从图像采集设备中采集的图像经过数据清理与数据标准化处理后可以得到三维张量,其平面彩色图像数学表达式可表示为I=f(x,y,λ),其中x表示空间x轴上的值,y表示空间y轴上的值,这两者表示像素空间位置,λ表示波长,彩色图像中一般指RGB三通道。标注图像的数学表达式可表示为L=f′(x,y),其中标注图像不包含色彩信息,只包含语义信息,0表示路面背景,1表示裂缝。我们需要构建神经网络D使其满足L=D(I)的映射。
进一步地,所述步骤二中:
根据图像分析,裂缝一般会贯穿图像并呈现细长条形,对此本发明有针对性地设计了多路卷积,分别包括了标准卷积路径、膨胀卷积路径、长方卷积路径三种卷积路径,最后通过融合路径融合所有特征信息。所建立的神经网络包含四个部分,第一部分是编码器,利用堆叠的卷积块(包含卷积层、标准化层、激活层)执行下采样过程,进行特征提取;第二部分是特征增强部分,利用残差块对特征进行强化与抽象;第三部分是利用堆叠的反卷积块(包含反卷积层、归一化层、激活层)执行上采样过程,解码还原抽象特征信息;第四部分是结果推理层,包含归一化指数函数层,将特征信息归一化成概率图以反映最终的推理结果,其中深颜色表示被视作裂缝的概率高,浅颜色表示被视作背景的概率高。本发明构造了一种特殊的不平衡损失函数以解决裂缝图像分割中的类不平衡问题。不平衡损失函数将对标注图像不同的通道附加不同的权重值,从而突破单通道图像的限制,实现对不平衡类(背景与裂缝)进行控制。
其中Yi代表原始标签,代表预测标签,w代表权重值,n代表样本数量。
进一步地,所述步骤三中:
使用复杂多路卷积特征融合深度神经网络进行训练,使用验证集与测试集对训练结果进行验证与测试,以保证神经网络良好的鲁棒性。
进一步地,所述步骤四中:
归一化指数函数层中的SoftMax函数可表示为:
其中zi代表特征信息值,T代表SoftMax函数的温度值,通过修改T可以改变概率结果qi的值,改变预测结果概率分布图。载入复杂多路卷积特征融合深度神经网络并将T值由1修改为10,对训练数据与验证数据进行重新推理,得到经过标签软化的数据标签结果,并且将这些结果组合在一起构建为轻量化网络的训练集。
进一步地,所述步骤五中:
设计构造具有相似网络结构的轻量化多路卷积特征融合网络,缩减通道宽度与网络宽度,从而减小网络复杂度,并将特征增强层残差块中的卷积层修改为深度可分离卷积层,进一步减小网络的内存占用空间。然后使用拓展的差温知识蒸馏以获得相较于标准知识蒸馏更优良的训练效果。
进一步地,所述步骤六中:
对轻量化多路卷积特征融合神经网络的分类层进行修剪优化,使用量化技术将网络模型中的浮点型数据量化成整型数据,进一步降低轻量化网络的大小并提升轻量化网络的推理速度。
进一步地,所述步骤七中:
将轻量化网络部署到嵌入式设备中,并设计计算机程序,将摄像头获取的图像流传入到程序中交由轻量化神经网络处理并在便携显示屏中实时反馈推理结果。
本发明的创新点为设计了基于多路卷积特征融合的轻量化神经网络架构,设计了性能比标准知识蒸馏方案更加优良的差温知识蒸馏方案,首次将轻量化神经网络部署到嵌入式设备中以近于实时的反馈速度显示准确的检测结果图像。
本发明的优点及有益效果有:本发明所设计训练的轻量化神经网络能在嵌入式设备中运行,并保持准确、清晰、近乎实时的处理效果,大大地拓展了神经网络在实际工程中的应用。本发明所提出的多路卷积特征融合可以有效地提升网络性能,在极致压缩的条件依然保持良好的性能,可以准确地处理复杂的分割任务。本发明所提出的差温知识蒸馏训练方案在不增加计算成本的情况下可以提升轻量化网络的学习能力,并保持良好的鲁棒性。本发明的训练方案可以推广到众多神经网络的轻量化,促进深度神经网络的应用进程。
附图说明
图1为本发明轻量化网络设计-训练-部署全流程示意图。
图2为本发明步骤二的基于多路卷积特征融合的网络结构示意图。
图3为本发明步骤二的基于多路卷积特征融合的网络的标准卷积路径示意图。
图4为本发明步骤五的基于差温蒸馏的轻量化网络训练流程图。
图5为本发明的轻量化模型优化部署全过程示意图。
图6为本发明的一个分割实例结果展示示意图。
具体实施方式
下面根据说明书附图对本发明做进一步说明:
如图1所示,一种基于多路卷积特征融合与知识蒸馏的轻量化神经网络的设计方法与训练方案,包含以下步骤:
步骤一、收集道路路面裂缝与标签信息,经过清理错误图像与重复图像等数据清洗操作后,得到2500份道路路面裂缝数据标签对,通过随机函数将2500份数据对分为训练集(2000份)、验证集(250份)与测试集(250份),创建基础的训练数据集。
步骤二、根据裂缝图像分析设计基于多路卷积特征融合的神经网络结构,其结构如图2所示,输入数据进入神经网络输入层后同时流入三条卷积路径,三条卷积路径分别为标准卷积路径(其中的卷积块以标准卷积层为主,卷积核为正方形,膨胀系数为1)、长方卷积(其中的卷积块以长方卷积层为主,卷积核为长方形,膨胀系数为1)、膨胀卷积层(其中的卷积块以膨胀卷积层为主,其卷积核为正方形,膨胀系数>1)。三条路径分别会生成相应的预测标签,其分别为标准卷积标签、长方卷积标签与膨胀卷积标签,除此之外,还有一条融合路径融合三条路径的特征信息,生成融合标签。因此基于多路卷积特征融合的神经网络存在四个输出,在网络训练过程中,四个输出的对应真实标签保持一致。三条路径的组成是相似的,是以编码器-解码器为主要的神经网络结构。如图3所示,标准卷积路径的全程包含图像调整层(由填充层、卷积层、批标准化层与激活层组成,目的是调整输入数据的尺寸)、下采样层(由卷积层、批标准化层与激活层组成的卷积块堆叠而成,目的是对数据进行下采样与特征提取)、特征增强层(由填充层、卷积层、批标准化层与激活层通过残差连接组合的残差块堆叠而成,目的是对特征信息进行增强)、上采样层(由反卷积层、批标准化层与激活层组成的反卷积块堆叠而成,目的是对数据进行上采样与特征解码)、图像调整层(由填充层与卷积层组成,目的是调整输入数据的尺寸)、分类层(由注意力模块与归一化指数函数组成,目的是执行预测)。损失函数为带有权值的均值平方差损失函数,其权值为10。最终设计方案中,复杂多路卷积特征融合的神经网络的初始通道宽度设置为64,下采样层与上采样层均设置为2层,特征增强层设置为8层。
步骤三、根据设计好的神经网络与损失函数调整训练超参数并执行训练,复杂模型需在训练集、验证集与测试集上均表现性能优异才能执行下一步,否则需调整训练超参数再次执行训练,直到性能满足要求。
步骤四、由步骤三得到满足性能条件的复杂网络后、载入复杂网络并修改分类层中归一化指数函数中的温度值T值为10,重新对训练集与验证集执行推理。经过推理后,一张原始图像可以得到四种软化标签,分别是软化标准卷积标签、软化长方卷积标签、软化膨胀卷积标签、软化融合标签。此时四个标签各不相同,组合各个标签与原始图像,构建软标签数据集,为后续知识蒸馏训练提供数据集。
步骤五、设计轻量化多路卷积特征融合网络结构。轻量化网络与复杂网络结构相似,但轻量化多路卷积特征融合神经网络的初始通道宽度设置为16,下采样层与上采样层均设置为2层,特征增强层设置为4层,并且特征增强层中的卷积层被替换为深度可分离卷积层。
步骤六、调整训练参数,执行知识蒸馏训练方法。知识蒸馏是通过构建一个轻量化模型,利用性能更好的复杂模型的监督信息训练轻量化模型,以期达到更好的性能和精度。这种方式有效地缩小了轻量化网络的收敛空间,从而使轻量化网络也能表现出良好的性能。知识蒸馏的具体过程如图4所示,图中共提到三种知识蒸馏策略,其中高温知识蒸馏与差温知识蒸馏是本发明所提出,并且这两种方式的性能都要好于标准知识蒸馏。在这三种知识蒸馏方案中差温知识蒸馏表现最好。差温知识蒸馏对获取的预处理真实标签不做处理,将推理得到软标签的温度值T1设置为10,在执行硬标签预测时将温度值T2设置为10。经过这种处理方式后,轻量化网络的收敛空间会进一步收敛,从而提升轻量化网络的性能。高温知识蒸馏的参数设置可参照策略2中的参数设置。知识蒸馏是一种特殊的模型训练方案,所以知识蒸馏也需要不断地调整训练超参数,当轻量化网络满足道路检测要求时,执行下一步优化阶段与部署阶段。
步骤七、训练完成的轻量化网络仍存在冗余设计,轻量化网多余的输出标签需被删除,只保留融合标签。网络内部的参数需量化为整型以提升运算速度。在轻量化网络同时满足运算速度与分割性能的要求后,执行下一步部署任务。
步骤八、如图5最后两部分所示,经过模型量化后,本发明将模型转换成Onnx文件形式,并用Tensor RT技术将其转换为可部署的Engine文件,进而将神经网络部署在本地嵌入式设备。
步骤九、最终,我们将转换好的网络模型部署到嵌入式设备中,并将嵌入式设备放置在移动小车上,连接摄像头执行分割程序。实际的分割效果如图6所示,图中灰白色标签表示预测结果。在本发明中,轻量化神经网络能有效识别裂缝,并且图像显示帧数可达到10FPS,此效果基本满足工程检测要求。
本发明的训练方法有效、简便且具有普适性,可以推动众多检测任务的神经网络轻量化。
Claims (3)
1.一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法,其特征在于,包括如下步骤:
步骤一:收集路面裂缝图像,对图像进行数据分析、数据清理与数据增广操作,对裂缝图像进行分割标注并创建训练实例;
步骤二:根据数据分析所获得的先验知识,设计构建复杂多路卷积特征融合深度神经网络与不平衡损失函数,针对裂缝的不同特征进行差异性提取,再融合提取到的差异性特征用于预测分割标签;
步骤三:训练构建好的复杂神经网络,经过反复实验后得到复杂深度神经网络;
步骤四:修改复杂神经网络分类层参数,使复杂神经网络推理软目标分割标签,并将软目标分割标签视作轻量化神经网络训练数据集的一部分;
步骤五:设计构造与复杂网络具有相似结构的轻量化多路卷积特征融合神经网络,使用差温知识蒸馏的模型训练方案让轻量化网络学习复杂神经网络的知识,从而使轻量化分割神经网络保持优良性能;
步骤六:对轻量化分割神经网络进行修剪与量化,进一步压缩网络;
步骤七:将训练得到的基于多路卷积特征融合的轻量化神经网络部署至嵌入式设备,连接摄像头并安置在移动智能小车上,执行快速自动化巡检路面裂缝任务;
不平衡损失函数将对标注图像不同的通道附加不同的权重值,从而突破单通道图像的限制,实现对不平衡类进行控制,包括裂缝类与背景类:
其中Yi代表原始标签,代表预测标签,w代表权重值,n代表样本数量;
步骤二中所提取到的先验知识为裂缝具有贯穿图像与长宽比大的特点;因此有针对性地设计了多路卷积,分别包括了普通卷积路径、膨胀卷积路径、长方卷积路径三种卷积路径,并在融合路径中融合所有特征信息;三条卷积路径的组成是相似的,都以编码器-解码器为主要的神经网络结构;标准卷积路径包含图像调整层,下采样层,特征增强层,上采样层与分类层;图像调整层是由填充层、卷积层、批标准化层与激活层组成,用于调整输入数据的尺寸;下采样层是由卷积层、批标准化层与激活层组成的卷积块堆叠而成,对数据进行下采样与特征提取;特征增强层是由填充层、卷积层、批标准化层与激活层通过残差连接组合的残差块堆叠而成,目的是对特征信息进行增强;上采样层是由反卷积层、批标准化层与激活层组成的反卷积块堆叠而成,用于对数据进行上采样与特征解码;图像调整层是由填充层、卷积层组成,以调整输出结果的尺寸;分类层由注意力模块与归一化指数函数组成,目的是执行预测;复杂多路卷积特征融合的神经网络的初始通道宽度设置为64,下采样层与上采样层均设置为2层,特征增强层设置为8层;
步骤二中所提取到的裂缝图像是一项典型类不平衡问题;在多路卷积特征融合神经网络的分类层中加入了注意力模块;注意力模块通过分离数据,提取一部分数据信息作为注意力掩膜,提取另一部分数据信息作为内容掩膜,再通过乘法连接注意力掩膜与内容掩膜以加强网络对裂缝区域的关注度;
步骤四中通过修改训练好的复杂多路卷积特征融合网络中的归一化指数函数,其中的SoftMax函数可表示为:
其中zi代表特征信息值,T代表SoftMax函数的温度值,通过修改T可以改变概率结果qi的值,最终改变预测结果的概率图;载入复杂多路卷积特征融合深度神经网络并将T值由1修改为10,对训练数据与验证数据进行重新推理,得到经过标签软化的数据标签结果,并且将这些结果组合在一起构建为轻量化网络的训练集;
步骤五中的轻量化网络设计方法与差温知识蒸馏方法;轻量化网络设计方法为,将轻量化多路卷积特征融合神经网络的初始通道宽度设置为16,下采样层与上采样层均设置为2层,特征增强层设置为4层,并且将特征增强层中的卷积层替换为深度可分离卷积层;差温知识蒸馏对获取的预处理真实标签不做处理,将推理得到软标签的温度值T1设置为10,在执行硬标签预测时将温度值T2设置为10。
2.根据权利要求1所述的一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法,其特征在于,在步骤一中,经过数据清洗构建的数据对不是单一的对应关系,而是一张原始图像对应四张真实标签的关系,并且四张真实标签的相似性会随着训练进程而发生改变;平面彩色图像的数学表达式可表示为I=f(x,y,λ),其中x表示空间x轴上的值,y表示空间y轴上的值,这两者表示像素的空间位置,λ表示波长,在彩色图像中指RGB三通道;标注图的数学图像可表示为L=f'(x,y),标注图像不包含色彩信息,只包含相应区域的语义信息,0代表路面背景,1代表裂缝;为了适应不平衡损失函数,数据集构建的额外特征在于标注图像会在数据预处理中扩展为正反两种标签,在第一通道中0代表路面背景,1代表裂缝,在第二通道中1表示路面背景,0表示裂缝;这种处理方式是为了适应不平衡损失函数的运算要求。
3.根据权利要求1或2所述的一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法,其特征在于,步骤六与七中的模型优化与部署工作;在道路裂缝分割领域,首次将轻量化网络部署到嵌入式设备中;训练完成的轻量化网络仍然存在冗余设计,轻量化网多余的输出标签需被删除,只保留融合标签;网络内部的参数需量化为整型以提升运算速度;经过模型量化后,将模型转换为可部署的工程文件;将转换好的模型部署至嵌入式设备中,将嵌入式设备放置在移动小车上,连接摄像头执行分割任务就能获得分割结果,并且图像显示帧数可达到10FPS。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210229869.8A CN114943832B (zh) | 2022-03-10 | 2022-03-10 | 一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210229869.8A CN114943832B (zh) | 2022-03-10 | 2022-03-10 | 一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114943832A CN114943832A (zh) | 2022-08-26 |
CN114943832B true CN114943832B (zh) | 2024-08-02 |
Family
ID=82906181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210229869.8A Active CN114943832B (zh) | 2022-03-10 | 2022-03-10 | 一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114943832B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115393727B (zh) * | 2022-10-31 | 2023-04-07 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种路面线性裂缝识别方法、电子设备及存储介质 |
CN116416212B (zh) * | 2023-02-03 | 2023-12-08 | 中国公路工程咨询集团有限公司 | 路面破损检测神经网络训练方法及路面破损检测神经网络 |
CN116070676B (zh) * | 2023-03-28 | 2023-06-30 | 南京气象科技创新研究院 | 基于注意力机制和自编码器的高速公路路面温度预报方法 |
CN116523888B (zh) * | 2023-05-08 | 2023-11-03 | 北京天鼎殊同科技有限公司 | 路面裂缝的检测方法、装置、设备及介质 |
CN116777926B (zh) * | 2023-08-21 | 2023-10-31 | 华侨大学 | 基于左右分和式轻量卷积神经网络的裂缝分割方法及装置 |
CN118097154B (zh) * | 2024-04-22 | 2024-08-02 | 清华大学深圳国际研究生院 | 轻量化裂缝分割方法、装置、终端设备及存储介质 |
CN118274846B (zh) * | 2024-05-30 | 2024-08-13 | 深圳技术大学 | 用于道路隐患排查的无人机群协同路径规划方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402311A (zh) * | 2020-03-09 | 2020-07-10 | 福建帝视信息科技有限公司 | 一种基于知识蒸馏的轻量级立体视差估计方法 |
CN112215334A (zh) * | 2020-09-24 | 2021-01-12 | 北京航空航天大学 | 一种面向事件相机的神经网络模型压缩方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866526B (zh) * | 2018-08-28 | 2024-10-01 | 北京三星通信技术研究有限公司 | 图像分割方法、电子设备及计算机可读存储介质 |
CN112989981B (zh) * | 2021-03-05 | 2023-10-17 | 五邑大学 | 一种路面裂缝检测方法、系统及存储介质 |
CN113034444A (zh) * | 2021-03-08 | 2021-06-25 | 安徽建筑大学 | 一种基于MobileNet-PSPNet神经网络模型的路面裂缝检测方法 |
CN113688989B (zh) * | 2021-08-31 | 2024-04-19 | 中国平安人寿保险股份有限公司 | 深度学习网络加速方法、装置、设备及存储介质 |
CN113850228A (zh) * | 2021-10-18 | 2021-12-28 | 北方民族大学 | 基于多模态融合的道路裂缝检测方法和系统 |
-
2022
- 2022-03-10 CN CN202210229869.8A patent/CN114943832B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402311A (zh) * | 2020-03-09 | 2020-07-10 | 福建帝视信息科技有限公司 | 一种基于知识蒸馏的轻量级立体视差估计方法 |
CN112215334A (zh) * | 2020-09-24 | 2021-01-12 | 北京航空航天大学 | 一种面向事件相机的神经网络模型压缩方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114943832A (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114943832B (zh) | 一种基于多路卷积特征融合网络与差温知识蒸馏的路面裂缝图像轻量化分割方法 | |
CN108961235B (zh) | 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法 | |
CN114359130B (zh) | 一种基于无人机影像的道路裂缝检测方法 | |
CN111127449B (zh) | 一种基于编码器-解码器的自动化裂缝检测方法 | |
CN111861978A (zh) | 基于Faster R-CNN的桥梁裂缝实例分割方法 | |
CN111882620B (zh) | 一种基于多尺度信息道路可行驶区域分割方法 | |
CN113392960A (zh) | 一种基于混合空洞卷积金字塔的目标检测网络及方法 | |
CN115063796B (zh) | 基于信号点内容约束的细胞分类方法和装置 | |
CN110766046A (zh) | 一种双通道卷积神经网络集成学习的空气质量测量方法 | |
CN116823800A (zh) | 一种基于深度学习的复杂背景下桥梁混凝土裂缝检测方法 | |
CN114049538A (zh) | 基于udwgan++网络的机场裂缝图像对抗生成方法 | |
CN116433629A (zh) | 一种基于GA-Unet的机场道面缺陷识别方法 | |
CN113724219A (zh) | 基于卷积神经网络的建筑物表面病害检测方法及系统 | |
CN115294033A (zh) | 一种基于语义分割网络的轮胎带束层差级和错边缺陷检测方法 | |
CN115908793A (zh) | 一种基于位置注意力机制的编解码结构语义分割模型 | |
Fan et al. | Application of YOLOv5 neural network based on improved attention mechanism in recognition of Thangka image defects | |
CN114612803B (zh) | 一种改进CenterNet的输电线路绝缘子缺陷检测方法 | |
CN116597411A (zh) | 极端天气下无人驾驶车辆识别交通标志的方法及系统 | |
CN117236520B (zh) | 一种分布式多无人机集群协同调度系统及其方法 | |
CN117994655A (zh) | 一种基于改进Yolov8s模型的桥梁病害检测系统及方法 | |
CN117237373A (zh) | 一种图像分割方法、装置及设备 | |
CN117173595A (zh) | 基于改进YOLOv7的无人机航拍图像目标检测方法 | |
CN117058386A (zh) | 基于改进DeepLabv3+网络的沥青道路裂缝检测方法 | |
CN113947567B (zh) | 基于多任务学习的缺陷检测方法 | |
CN116563691A (zh) | 一种基于TransUnet模型的道路病害检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |