CN115063589A - 基于知识蒸馏的车辆部件分割方法及相关设备 - Google Patents
基于知识蒸馏的车辆部件分割方法及相关设备 Download PDFInfo
- Publication number
- CN115063589A CN115063589A CN202210791176.8A CN202210791176A CN115063589A CN 115063589 A CN115063589 A CN 115063589A CN 202210791176 A CN202210791176 A CN 202210791176A CN 115063589 A CN115063589 A CN 115063589A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- component
- network
- teacher
- segmentation result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 227
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 96
- 230000006870 function Effects 0.000 claims description 84
- 239000013598 vector Substances 0.000 claims description 74
- 239000011159 matrix material Substances 0.000 claims description 38
- 230000002159 abnormal effect Effects 0.000 claims description 37
- 230000015654 memory Effects 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004821 distillation Methods 0.000 claims 5
- 238000012216 screening Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000011478 gradient descent method Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000013136 deep learning model Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
Abstract
本申请提出一种基于知识蒸馏的车辆部件分割方法、装置、电子设备及存储介质,基于知识蒸馏的车辆部件分割方法包括:采集标注数据集和未标注数据集作为训练集,标签数据包括车辆图像中各像素点的车辆部件种类;搭建初始教师网络,基于训练集对初始教师网络进行两次训练以获取第二教师网络;搭建初始学生网络;基于第二教师网络提取训练集中每一张车辆图像的暗知识,暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性;基于暗知识训练初始学生网络得到第二学生网络;基于第二学生网络获取实时车辆图像的部件分割结果。本申请能够得到参数量小且分割精度高的第二学生网络,提高移动端场景下车辆分割模型的精度和速度。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于知识蒸馏的车辆部件分割方法、装置、电子设备及存储介质。
背景技术
知识蒸馏是一种模型压缩方法,知识蒸馏系统包括性能较好但参数量较大的教师网络和参数量较小的学生网络,对教师网络进行知识提取获取监督信息来训练学生网络,从而使得学生网络达到更好的性能。
车辆部件分割在智能定损、整车验收等场景有广泛需求,通常使用深度学习模型对采集到的车辆图像进行分割以获取车辆部件的分割结果,然而由于移动端性能、深度学习模型参数量较大等因素,传统的深度学习模型在移动端场景往往效果不佳,因此需要针对车辆部件分割场景对深度学习模型的结构和训练方法进行设计,以提高移动端场景下车辆部件分割的速度和精度。
发明内容
鉴于以上内容,有必要提出一种基于知识蒸馏的车辆部件分割方法及相关设备,以解决如何提高移动端场景下车辆部件分割的速度和精度这一技术问题,其中,相关设备包括基于知识蒸馏的车辆部件分割装置、电子设备及存储介质。
本申请提供基于知识蒸馏的车辆部件分割方法,所述方法包括:
采集带标签数据的车辆图像作为标注数据集,采集不带标签数据的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,所述标签数据包括车辆图像中每一个像素点的车辆部件种类;
搭建初始教师网络,基于所述训练集对所述初始教师网络进行训练以获取第二教师网络;
搭建初始学生网络;
基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性;
基于所述第二学生网络获取实时车辆图像的部件分割结果。
在一些实施例中,所述基于所述训练集对所述初始教师网络进行训练以获取第二教师网络包括:
基于标注数据集和交叉熵损失函数对所述初始教师网络进行训练以获取第一教师网络;
基于所述第一教师网络得到未标注数据集中每一张车辆图片的部件分割结果,所述部件分割结果包括车辆图片中每一个像素点的类别向量,所述类别向量包括像素点属于每一种车辆部件的概率值;
依据可信度计算模型计算每一个部件分割结果可信度指标;
基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像;
获取所有异常图像的标签数据,并基于所述异常图像和所述异常图像的标签数据训练所述第一教师网络得到第二教师网络。
在一些实施例中,所述可信度计算模型满足关系式:
其中,N为所有车辆部件的种类的数量,W×H为部件分割结果k的宽高尺寸,为部件分割结果k中像素点(i,j)的类别向量中属于车辆部件种类c的概率值,αk为部件分割结果k的可信度指标,取值范围为(0,1],数值越大则表示部件分割结果k的可信度越大,车辆部件分割的精度越高。
在一些实施例中,所述基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像包括:
对比所述可信度指标和预设可信度阈值;
若所述可信度指标大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度满足要求,将所述部件分割结果对应的车辆图片标记为正常图像;
若所述可信度指标不大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度不满足要求,将所述部件分割结果对应的车辆图片标记为异常图像。
在一些实施例中,所述基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性,包括:
将目标车辆图像同时输入第二教师网络和初始学生网络,所述目标车辆图像为所述训练集中所有车辆图像中的任意一张,将所述第二教师网络的输出结果作为教师部件分割结果,将所述初始学生网络的输出结果作为学生部件分割结果,所述教师部件分割结果和所述学生部件分割结果均包括所述目标车辆图像中每一个像素点的类别向量;
基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵;
将所述教师部件分割结果的类别向量和所述位置相关矩阵作为所述目标车辆图像的暗知识,并基于所述暗知识构建第一预设损失函数;
判断所述目标车辆图像是否带有标签数据以获取判断参数,若所述目标车辆图像带有标签数据,则基于所述标签数据和所述学生部件分割结果构建交叉熵损失函数,所述判断参数的数值为1;若所述目标车辆图像不带有标签数据,则所述判断参数的数值为0;
基于所述判断参数和所述第一预设损失函数构建预设损失函数;
基于所述预设损失函数和所述训练集中所有车辆图像训练所述初始学生网络以获取第二学生网络。
在一些实施例中,所述基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵包括:
选取所述教师部件分割结果的类别向量中最大概率值对应的车辆部件种类以作为每一个像素点的车辆部件种类;
将同一车辆部件种类的像素点的像素值置为1,其他区域的像素点置为0得到所述车辆部件的区域图像,遍历所述教师部件分割结果中所有车辆部件种类,以便得到每一种车辆部件的区域图像;
将所述车辆部件的区域图像中的像素值沿着行方向按照固定顺序进行排列得到所述目标车辆图像中每一种车辆部件的位置向量;
基于所述位置向量计算不同车辆部件的位置相关性以构建所述目标车辆图像的位置相关矩阵,所述位置相关性满足关系式:
xmn=hm(hn)T
其中,hm为所述目标车辆图像中车辆部件m的位置向量,(hn)T为所述目标车辆图像中车辆部件n的位置向量的转置,xmn为车辆部件m和车辆部件n位置相关性。
在一些实施例中,所述基于所述判断参数和所述第一预设损失函数构建预设损失函数中,所述预设损失函数满足关系式:
其中,Loss1为第一预设损失函数,Loss2为基于标签数据和所述学生部件分割结果构建的交叉熵损失函数,β为判断参数,取值为0或1,Loss为预设损失函数;
所述第一预设损失函数满足关系式:
其中,Xs为学生部件分割结果的位置相关矩阵,X为目标车辆图像的位置相关矩阵,‖Xs-X‖2表示Xs-X的L2距离;Ps(i,j)为学生部件分割结果中像素点(i,j)的类别向量,P(i,j)为教师部件分割结果中像素点(i,j)的类别向量,KL(Ps(i,j),P(i,j))用于计算Ps(i,j),P(i,j)之间的KL散度;W,H为目标车辆图像的宽高尺寸。
本申请实施例还提供一种基于知识蒸馏的车辆部件分割装置,所述装置包括:
采集单元,用于采集带标签数据的车辆图像作为标注数据集,采集不带标签数据的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,所述标签数据包括车辆图像中每一个像素点的车辆部件种类;
训练单元,用于搭建初始教师网络,基于所述训练集对所述初始教师网络进行训练以获取第二教师网络;
搭建单元,用于搭建初始学生网络;
提取单元,用于基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性;
分割单元,用于基于所述第二学生网络获取实时车辆图像的部件分割结果。
本申请实施例还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;
处理器,执行所述存储器中存储的指令以实现所述的基于知识蒸馏的车辆部件分割方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述的基于知识蒸馏的车辆部件分割方法。
综上,本申请基于标注数据和无标注数据对初始教师网络进行两次训练得到教师网络,并使用教师网络提取标注数据和无标注数据中每一张车辆图片的暗知识以监督轻量化的初始学生网络的训练,从而获取参数量小且分割精度高的第二学生网络,将第二学生网络嵌入移动端设备,可以提高移动端场景下车辆部件分割的速度和精度。
附图说明
图1是本申请所涉及的基于知识蒸馏的车辆部件分割方法的较佳实施例的流程图。
图2是本申请所涉及的初始学生网络的训练过程示意图。
图3是本申请所涉及的基于知识蒸馏的车辆部件分割装置的较佳实施例的功能模块图。
图4是本申请所涉及的基于知识蒸馏的车辆部件分割方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本申请的目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本申请,所述描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本申请实施例提供一种基于知识蒸馏的车辆部件分割方法,可应用于一个或者多个电子设备中,电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
电子设备可以是任何一种可与客户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
电子设备还可以包括网络设备和/或客户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。
电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
如图1所示,是本申请基于知识蒸馏的车辆部件分割方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S10,采集带标签数据的车辆图像作为标注数据集,采集不带标签数据的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,所述标签数据包括车辆图像中每一个像素点的车辆部件种类。
在一个可选的实施例中,采集大量车辆图像,并获取每一张车辆图像的标签数据,所述标签数据为与所述车辆图像等大的图像,标签数据中的像素值表示每一个像素点处车辆部件种类的预设标签,所述预设标签为从1到N的整数,其中,N代表包括背景类在内的所有车辆部件种类的数量,将背景类作为一种特殊的车辆部件,所述背景类为车辆图片中不属于车辆部件的像素点的类别,所述车辆部件种类与所述预设标签一一对应,储存所有车辆图片以及所有车辆图片的标签数据作为标注数据集。
该可选的实施例中,采集大量新的车辆图像,不需要获取新的车辆图像的标签数据,直接存储所有新的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,用于后续教师网络和学生网络的训练。
如此,采集到标注数据集和未标注数据集作为训练集,为后续教师网络和学生网络的训练提供数据基础。
S11,搭建初始教师网络,基于所述训练集对所述初始教师网络进行训练以获取第二教师网络。
在一个可选的实施例中,搭建初始教师网络,所述初始教师网络的输入为车辆图片,预期输出为所述车辆图片的部件分割结果,所述部件分割结果为一张与所述车辆图像等大的图像,所述部件分割结果包括所述车辆图片中每一个像素点的类别向量,所述类别向量包括所述像素点属于每一种车辆部件的概率值,且同一像素点类别向量中所有概率值之和为1;选取所述类别向量中最大概率值对应的车辆部件种类即为所述像素点对应的车辆部件种类。
该可选的实施例中,所述初始教师网络为编码器和解码器结构,编码器利用卷积层对输入的车辆图像进行下采样得到教师特征图,并将所述教师特征图送入解码器中利用反卷积层进行上采样得到所述车辆图像的部件分割结果。需要说明的是,初始教师网络的车辆部件分割精度直接影响后续学生网络的分割精度,故不需要考虑所述初始教师网络的参数量,以保证所述初始教师网络的车辆部件分割精度为最优先条件,故所述初始教师网络可以选用DeepLapV3、UNet等现有的精度较高的图像分割网络,本申请不做限制。
该可选的实施例中,为了保证所述初始教师网络的输出为所述车辆图像的部件分割结果,需要基于所述训练集对所述初始教师网络进行训练以获取第二教师网络。所述基于所述训练集对所述初始教师网络进行训练以获取第二教师网络包括:
基于标注数据集和交叉熵损失函数对所述初始教师网络进行训练以获取第一教师网络;
基于所述第一教师网络得到未标注数据集中每一张车辆图片的部件分割结果,所述部件分割结果包括车辆图片中每一个像素点的类别向量,所述类别向量包括像素点属于每一种车辆部件的概率值;
依据可信度计算模型计算每一个部件分割结果可信度指标;
基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像;
获取所有异常图像的标签数据,并基于所述异常图像和所述异常图像的标签数据训练所述第一教师网络得到第二教师网络。
该可选的实施例中,首先基于标注数据集和交叉熵损失函数对所述初始教师网络进行训练以获取第一教师网络,在训练过程中,不断将标注数据集中的车辆图片输入所述初始教师网络以获取输出结果,基于所述输出结果和所述车辆图片的标签数据计算交叉熵损失函数的数值并使用梯度下降法更新所述初始教师网络中的参数,当交叉熵损失函数的数值不再变化时,停止初始教师网络的训练得到第一教师网络。
该可选的实施例中,将所述未标注数据集中的所有车辆图片依次输入所述第一教师网络以获取每一张车辆图片的部件分割结果,所述部件分割结果包括车辆图片中每一个像素点的类别向量,所述类别向量包括像素点属于每一种车辆部件的概率值;进一步依据可信度计算模型计算每一个部件分割结果可信度指标,以部件分割结果k为示例,所述可信度计算模型满足关系式:
其中,N为所有车辆部件的种类的数量,W×H为部件分割结果k的宽高尺寸,为部件分割结果k中像素点(i,j)的类别向量中属于车辆部件种类c的概率值,αk为部件分割结果k的可信度指标,取值范围为(0,1],数值越大则表示部件分割结果k的可信度越大,车辆部件分割的精度越高。
在上述公式中,为像素点(i,j)类别向量的信息熵,当所述信息熵的数值越大,表示所述类别向量中不同概率值之间的差值越小,所述像素点(i,j)的分割结果越不准确,当所述类别向量中所有的概率值相等时,所述信息熵达到最大值,所述最大值为log N。
示例性的,假设部件分割结果1中仅包含一个像素点,所有车辆部件的种类数为5,像素点对应的类别向量为(0.2,0.1,0,0.1,0.6),则所述部件分割结果的可信度指标为:
该可选的实施例中,所述基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像包括:
对比所述可信度指标和预设可信度阈值;
若所述可信度指标大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度满足要求,将所述部件分割结果对应的车辆图片标记为正常图像;
若所述可信度指标不大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度不满足要求,将所述部件分割结果对应的车辆图片标记为异常图像。其中,所述预设可信度阈值取值为0.6。
该可选的实施例中,第一教师网络不能很好的学习到不同车辆部件的区别特征,从而导致异常图像的部件分割结果的精度不满足要求,故获取所有异常图像的标签数据,并基于所有异常图像和所有异常图像的标签数据训练所述第一教师网络以约束所述第一教师网络学习到不同车辆部件的区别特征,其中,所述异常图像的标签数据的获取方式为人工标注。在训练过程中,不断将异常图像输入所述第一教师网络以获取输出结果,基于所述输出结果和所述异常图的标签数据计算交叉熵损失函数的数值并使用梯度下降法更新所述第一教师网络中的参数,当交叉熵损失函数的数值不再变化时,停止第一教师网络的训练得到第二教师网络,所述第二教师网络可以提取车辆图像中不同车辆部件的区别特征,获取准确的车辆部件分割结果。
如此,基于训练集中的标注数据集和未标注数据集对所述初始教师网络进行两次训练得到第二教师网络,所述第二教师网络可以提取车辆图像中不同车辆部件的区别特征,获取准确的车辆部件分割结果,保障后续学生网络的车辆部件分割精度。
S12,搭建初始学生网络。
在一个可选的实施例中,搭建初始学生网络,所述初始学生网络的输入和输出均与所述教师网络相同,所述初始学生网络为轻量化编码器和轻量化解码器构成,所述轻量化编码器利用卷积层对输入的车辆图像进行下采样得到学生特征图,所述轻量化解码器利用反卷积层对所述学生特征图进行上采样得到与输入的车辆图像等大的部件分割结果,其中,所述轻量化编码器可以采用现有的MobileNet、ShuffleNet等参数量较小的编码器结构,所述轻量化解码器可以通过减少反卷积层的层数来实现,所述轻量化编码器和轻量化解码器的具体结构本申请不做限制。
该可选的实施例中,由于初始学生网络的轻量化特征,可以将所述初始学生网络嵌入到移动终端设备,提高移动端场景下车辆部件分割的速度,所述移动端设备可以为智能手机、智能手表、平板电脑等便携的带有拍照功能的智能设备,本申请不做限制。
如此,完成初始学生网络,所述初始学生网络的参数量较小,可以很好的嵌入到移动终端设备,提高移动端场景下车辆部件分割的速度。
S13,基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性。
在一个可选的实施例中,完成初始学生网络的搭建后,使用车辆部件分割精度较高的第二教师网络提取所述训练集中每一张车辆图像的暗知识,所述暗知识可以反应车辆图像中不同种类的车辆部件之间的特征相似性和位置相关性,基于所述训练集和所述暗知识对搭建完毕的初始学生网络进行训练以约束所述初始学生网络的输出结果为准确的部件分割结果,所述初始学生网络的训练过程示意图如图2所示。
该可选的实施例中,所述基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性,包括:
将目标车辆图像同时输入第二教师网络和初始学生网络,所述目标车辆图像为所述训练集中所有车辆图像中的任意一张,将所述第二教师网络的输出结果作为教师部件分割结果,将所述初始学生网络的输出结果作为学生部件分割结果,所述教师部件分割结果和所述学生部件分割结果均包括所述目标车辆图像中每一个像素点的类别向量;
基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵;
将所述教师部件分割结果的类别向量和所述位置相关矩阵作为所述目标车辆图像的暗知识,并基于所述暗知识构建第一预设损失函数;
判断所述目标车辆图像是否带有标签数据以获取判断参数,若所述目标车辆图像带有标签数据,则基于所述标签数据和所述学生部件分割结果构建交叉熵损失函数,所述判断参数的数值为1;若所述目标车辆图像不带有标签数据,则所述判断参数的数值为0;
基于所述判断参数和所述第一预设损失函数构建预设损失函数;
基于所述预设损失函数和所述训练集中所有车辆图像训练所述初始学生网络以获取第二学生网络。
该可选的实施例中,所述教师部件分割结果为准确的部件分割结果,故所述教师部件分割结果的类别向量中,不同概率值的差异可以反应不同种类的车辆部件之间的特征相似性。示例性的,假设车辆部件的种类数为5,若一个像素点的类别向量为(0.1,0.3,0,0,0.6),则说明所述像素点属于车辆部件种类1的概率为0.1、车辆部件种类2的概率为0.3,属于车辆部件种类5的概率为0.6,表示车辆部件种类5和车辆部件种类2之间的特征相似性大于车辆部件种类5和车辆部件种类1之间的特征相似性。
该可选的实施例中,所述基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵包括:选取所述教师部件分割结果的类别向量中最大概率值对应的车辆部件种类以作为每一个像素点的车辆部件种类;将同一车辆部件种类的像素点的像素值置为1,其他区域的像素点置为0得到所述车辆部件的区域图像,遍历所述教师部件分割结果中所有车辆部件种类,以便得到每一种车辆部件的区域图像,示例性的,将所述教师部件分割结果中车辆部件种类为c的所有像素点的像素值置为1,其他区域像素点的像素值置为0即可得到所述目标车辆图像中车辆部件c的区域图像;将所述车辆部件的区域图像中的像素值沿着行方向按照固定顺序进行排列得到所述目标车辆图像中每一种车辆部件的位置向量;基于所述位置向量计算不同车辆部件的位置相关性以构建所述教师部件分割结果的位置相关矩阵,将所述教师部件分割结果的位置相关矩阵作为所述目标车辆图像的位置相关矩阵X,所述位置相关矩阵X为N×N的方阵,第m行第n列的数值表示所述目标车辆图像中车辆部件m和车辆部件n位置相关性,所述位置相关性满足关系式:
xmn=hm(hn)T
其中,hm为所述目标车辆图像中车辆部件m的位置向量,(hn)T为所述目标车辆图像中车辆部件n的位置向量的转置,xmn为车辆部件m和车辆部件n位置相关性。
该可选的实施例中,将所述教师部件分割结果的类别向量和所述位置相关矩阵作为所述目标车辆图像的暗知识,并基于所述暗知识构建第一预设损失函数,所述第一预设损失函数用于约束学生部件分割结果中不同种类的车辆部件之间的特征相似性和位置相关性与所述暗知识一致,所述第一预设损失函数满足关系式:
其中,Xs为学生部件分割结果的位置相关矩阵,X为目标车辆图像的位置相关矩阵,‖Xs-X‖2表示Xs-X的L2距离;Ps(i,j)为学生部件分割结果中像素点(i,j)的类别向量,P(i,j)为教师部件分割结果中像素点(i,j)的类别向量,KL(Ps(i,j),P(i,j))用于计算Ps(i,j),P(i,j)之间的KL散度;W,H为目标车辆图像的宽高尺寸。
需要说明的是,基于学生部件分割结果得到所述学生部件分割结果的位置相关矩阵Xs的方法与所述基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵X的方法相同。
该可选的实施例中,判断所述目标车辆图像是否带有标签数据以获取判断参数,若所述目标车辆图像带有标签数据,则基于所述标签数据和所述学生部件分割结果构建交叉熵损失函数,所述判断参数的数值为1;若所述目标车辆图像不带有标签数据,则所述判断参数的数值为0;基于所述判断参数和所述第一预设损失函数构建预设损失函数,所述预设损失函数满足关系式:
其中,Loss1为第一预设损失函数,Loss2为基于标签数据和所述学生部件分割结果构建的交叉熵损失函数,β为判断参数,Loss为预设损失函数。
该可选的实施例中,从所述训练集中不断挑选目标车辆图片所述初始学生网络和第二教师网络以计算预设损失函数的数值,并利用梯度下降法不断更新初始学生网络中的参数,当所述预设损失函数的数值不再变化时,停止所述初始学生网络的训练得到第二学生网络,所述第二学生网络可以提取车辆图像中不同车辆部件的区别特征,获取准确的车辆部件分割结果。
如此,能够基于车辆部件分割精度较高的教师网络提取每一张车辆图片的暗知识以监督初始学生网络的训练过程,得到参数量小且能够准确分割车辆部件的第二学生网络。
S14,基于所述第二学生网络获取实时车辆图像的部件分割结果。
在一个可选的实施例中,将参数量小的第二学生网络嵌入到移动端设备后,用户手持移动端设备采集实时车辆图像,第二学生网络对所述实时车辆图像进行分割即可得到部件分割结果。
由以上技术方案可以看出,本申请基于标注数据和无标注数据对初始教师网络进行两次训练得到教师网络,并使用教师网络提取标注数据和无标注数据中每一张车辆图片的暗知识以监督轻量化的初始学生网络的训练,从而获取参数量小且分割精度高的第二学生网络,将第二学生网络嵌入移动端设备,可以提高移动端场景下车辆部件分割的速度和精度。
请参见图4,图4是本申请基于知识蒸馏的车辆部件分割装置的较佳实施例的功能模块图。基于知识蒸馏的车辆部件分割装置11包括采集单元110、训练单元111、搭建单元112、提取单元113、分割单元114。本申请所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
在一个可选的实施例中,采集单元110用于采集带标签数据的车辆图像作为标注数据集,采集不带标签数据的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,所述标签数据包括车辆图像中每一个像素点的车辆部件种类。
在一个可选的实施例中,采集大量车辆图像,并获取每一张车辆图像的标签数据,所述标签数据为与所述车辆图像等大的图像,标签数据中的像素值表示每一个像素点处车辆部件种类的预设标签,所述预设标签为从1到N的整数,其中,N代表包括背景类在内的所有车辆部件种类的数量,将背景类作为一种特殊的车辆部件,所述背景类为车辆图片中不属于车辆部件的像素点的类别,所述车辆部件种类与所述预设标签一一对应,储存所有车辆图片以及所有车辆图片的标签数据作为标注数据集。
该可选的实施例中,采集大量新的车辆图像,不需要获取新的车辆图像的标签数据,直接存储所有新的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,用于后续教师网络和学生网络的训练。
在一个可选的实施例中,训练单元111用于搭建初始教师网络,基于所述训练集对所述初始教师网络进行训练以获取第二教师网络。
在一个可选的实施例中,搭建初始教师网络,所述初始教师网络的输入为车辆图片,预期输出为所述车辆图片的部件分割结果,所述部件分割结果为一张与所述车辆图像等大的图像,所述部件分割结果包括所述车辆图片中每一个像素点的类别向量,所述类别向量包括所述像素点属于每一种车辆部件的概率值,且同一像素点类别向量中所有概率值之和为1;选取所述类别向量中最大概率值对应的车辆部件种类即为所述像素点对应的车辆部件种类。
该可选的实施例中,所述初始教师网络为编码器和解码器结构,编码器利用卷积层对输入的车辆图像进行下采样得到教师特征图,并将所述教师特征图送入解码器中利用反卷积层进行上采样得到所述车辆图像的部件分割结果。需要说明的是,初始教师网络的车辆部件分割精度直接影响后续学生网络的分割精度,故不需要考虑所述初始教师网络的参数量,以保证所述初始教师网络的车辆部件分割精度为最优先条件,故所述初始教师网络可以选用DeepLapV3、UNet等现有的精度较高的图像分割网络,本申请不做限制。
该可选的实施例中,为了保证所述初始教师网络的输出为所述车辆图像的部件分割结果,需要基于所述训练集对所述初始教师网络进行训练以获取第二教师网络。所述基于所述训练集对所述初始教师网络进行训练以获取第二教师网络包括:
基于标注数据集和交叉熵损失函数对所述初始教师网络进行训练以获取第一教师网络;
基于所述第一教师网络得到未标注数据集中每一张车辆图片的部件分割结果,所述部件分割结果包括车辆图片中每一个像素点的类别向量,所述类别向量包括像素点属于每一种车辆部件的概率值;
依据可信度计算模型计算每一个部件分割结果可信度指标;
基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像;
获取所有异常图像的标签数据,并基于所述异常图像和所述异常图像的标签数据训练所述第一教师网络得到第二教师网络。
该可选的实施例中,首先基于标注数据集和交叉熵损失函数对所述初始教师网络进行训练以获取第一教师网络,在训练过程中,不断将标注数据集中的车辆图片输入所述初始教师网络以获取输出结果,基于所述输出结果和所述车辆图片的标签数据计算交叉熵损失函数的数值并使用梯度下降法更新所述初始教师网络中的参数,当交叉熵损失函数的数值不再变化时,停止初始教师网络的训练得到第一教师网络。
该可选的实施例中,将所述未标注数据集中的所有车辆图片依次输入所述第一教师网络以获取每一张车辆图片的部件分割结果,所述部件分割结果包括车辆图片中每一个像素点的类别向量,所述类别向量包括像素点属于每一种车辆部件的概率值;进一步依据可信度计算模型计算每一个部件分割结果可信度指标,以部件分割结果k为示例,所述可信度计算模型满足关系式:
其中,N为所有车辆部件的种类的数量,W×H为部件分割结果k的宽高尺寸,为部件分割结果k中像素点(i,j)的类别向量中属于车辆部件种类c的概率值,αk为部件分割结果k的可信度指标,取值范围为(0,1],数值越大则表示部件分割结果k的可信度越大,车辆部件分割的精度越高。
在上述公式中,为像素点(i,j)类别向量的信息熵,当所述信息熵的数值越大,表示所述类别向量中不同概率值之间的差值越小,所述像素点(i,j)的分割结果越不准确,当所述类别向量中所有的概率值相等时,所述信息熵达到最大值,所述最大值为log N。
示例性的,假设部件分割结果1中仅包含一个像素点,所有车辆部件的种类数为5,像素点对应的类别向量为(0.2,0.1,0,0.1,0.6),则所述部件分割结果的可信度指标为:
该可选的实施例中,所述基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像包括:
对比所述可信度指标和预设可信度阈值;
若所述可信度指标大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度满足要求,将所述部件分割结果对应的车辆图片标记为正常图像;
若所述可信度指标不大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度不满足要求,将所述部件分割结果对应的车辆图片标记为异常图像。其中,所述预设可信度阈值取值为0.6。
该可选的实施例中,第一教师网络不能很好的学习到不同车辆部件的区别特征,从而导致异常图像的部件分割结果的精度不满足要求,故获取所有异常图像的标签数据,并基于所有异常图像和所有异常图像的标签数据训练所述第一教师网络以约束所述第一教师网络学习到不同车辆部件的区别特征,其中,所述异常图像的标签数据的获取方式为人工标注。在训练过程中,不断将异常图像输入所述第一教师网络以获取输出结果,基于所述输出结果和所述异常图的标签数据计算交叉熵损失函数的数值并使用梯度下降法更新所述第一教师网络中的参数,当交叉熵损失函数的数值不再变化时,停止第一教师网络的训练得到第二教师网络,所述第二教师网络可以提取车辆图像中不同车辆部件的区别特征,获取准确的车辆部件分割结果。
在一个可选的实施例中,搭建单元112用于搭建初始学生网络。
在一个可选的实施例中,搭建初始学生网络,所述初始学生网络的输入和输出均与所述教师网络相同,所述初始学生网络为轻量化编码器和轻量化解码器构成,所述轻量化编码器利用卷积层对输入的车辆图像进行下采样得到学生特征图,所述轻量化解码器利用反卷积层对所述学生特征图进行上采样得到与输入的车辆图像等大的部件分割结果,其中,所述轻量化编码器可以采用现有的MobileNet、ShuffleNet等参数量较小的编码器结构,所述轻量化解码器可以通过减少反卷积层的层数来实现,所述轻量化编码器和轻量化解码器的具体结构本申请不做限制。
该可选的实施例中,由于初始学生网络的轻量化特征,可以将所述初始学生网络嵌入到移动终端设备,提高移动端场景下车辆部件分割的速度,所述移动端设备可以为智能手机、智能手表、平板电脑等便携的带有拍照功能的智能设备,本申请不做限制。
在一个可选的实施例中,提取单元113用于基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性。
在一个可选的实施例中,完成初始学生网络的搭建后,使用车辆部件分割精度较高的第二教师网络提取所述训练集中每一张车辆图像的暗知识,所述暗知识可以反应车辆图像中不同种类的车辆部件之间的特征相似性和位置相关性,基于所述训练集和所述暗知识对搭建完毕的初始学生网络进行训练以约束所述初始学生网络的输出结果为准确的部件分割结果,所述初始学生网络的训练过程示意图如图2所示。
该可选的实施例中,所述基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性,包括:
将目标车辆图像同时输入第二教师网络和初始学生网络,所述目标车辆图像为所述训练集中所有车辆图像中的任意一张,将所述第二教师网络的输出结果作为教师部件分割结果,将所述初始学生网络的输出结果作为学生部件分割结果,所述教师部件分割结果和所述学生部件分割结果均包括所述目标车辆图像中每一个像素点的类别向量;
基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵;
将所述教师部件分割结果的类别向量和所述位置相关矩阵作为所述目标车辆图像的暗知识,并基于所述暗知识构建第一预设损失函数;
判断所述目标车辆图像是否带有标签数据以获取判断参数,若所述目标车辆图像带有标签数据,则基于所述标签数据和所述学生部件分割结果构建交叉熵损失函数,所述判断参数的数值为1;若所述目标车辆图像不带有标签数据,则所述判断参数的数值为0;
基于所述判断参数和所述第一预设损失函数构建预设损失函数;
基于所述预设损失函数和所述训练集中所有车辆图像训练所述初始学生网络以获取第二学生网络。
该可选的实施例中,所述教师部件分割结果为准确的部件分割结果,故所述教师部件分割结果的类别向量中,不同概率值的差异可以反应不同种类的车辆部件之间的特征相似性。示例性的,假设车辆部件的种类数为5,若一个像素点的类别向量为(0.1,0.3,0,0,0.6),则说明所述像素点属于车辆部件种类1的概率为0.1、车辆部件种类2的概率为0.3,属于车辆部件种类5的概率为0.6,表示车辆部件种类5和车辆部件种类2之间的特征相似性大于车辆部件种类5和车辆部件种类1之间的特征相似性。
该可选的实施例中,所述基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵包括:选取所述教师部件分割结果的类别向量中最大概率值对应的车辆部件种类以作为每一个像素点的车辆部件种类;将同一车辆部件种类的像素点的像素值置为1,其他区域的像素点置为0得到所述车辆部件的区域图像,遍历所述教师部件分割结果中所有车辆部件种类,以便得到每一种车辆部件的区域图像,示例性的,将所述教师部件分割结果中车辆部件种类为c的所有像素点的像素值置为1,其他区域像素点的像素值置为0即可得到所述目标车辆图像中车辆部件c的区域图像;将所述车辆部件的区域图像中的像素值沿着行方向按照固定顺序进行排列得到所述目标车辆图像中每一种车辆部件的位置向量;基于所述位置向量计算不同车辆部件的位置相关性以构建所述教师部件分割结果的位置相关矩阵,将所述教师部件分割结果的位置相关矩阵作为所述目标车辆图像的位置相关矩阵X,所述位置相关矩阵X为N×N的方阵,第m行第n列的数值表示所述目标车辆图像中车辆部件m和车辆部件n位置相关性,所述位置相关性满足关系式:
xmn=hm(hn)T
其中,hm为所述目标车辆图像中车辆部件m的位置向量,(hn)T为所述目标车辆图像中车辆部件n的位置向量的转置,xmn为车辆部件m和车辆部件n位置相关性。
该可选的实施例中,将所述教师部件分割结果的类别向量和所述位置相关矩阵作为所述目标车辆图像的暗知识,并基于所述暗知识构建第一预设损失函数,所述第一预设损失函数用于约束学生部件分割结果中不同种类的车辆部件之间的特征相似性和位置相关性与所述暗知识一致,所述第一预设损失函数满足关系式:
其中,Xs为学生部件分割结果的位置相关矩阵,X为目标车辆图像的位置相关矩阵,‖Xs-X‖2表示Xs-X的L2距离;Ps(i,j)为学生部件分割结果中像素点(i,j)的类别向量,P(i,j)为教师部件分割结果中像素点(i,j)的类别向量,KL(Ps(i,j),P(i,j))用于计算Ps(i,j),P(i,j)之间的KL散度;W,H为目标车辆图像的宽高尺寸。
需要说明的是,基于学生部件分割结果得到所述学生部件分割结果的位置相关矩阵Xs的方法与所述基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵X的方法相同。
该可选的实施例中,判断所述目标车辆图像是否带有标签数据以获取判断参数,若所述目标车辆图像带有标签数据,则基于所述标签数据和所述学生部件分割结果构建交叉熵损失函数,所述判断参数的数值为1;若所述目标车辆图像不带有标签数据,则所述判断参数的数值为0;基于所述判断参数和所述第一预设损失函数构建预设损失函数,所述预设损失函数满足关系式:
其中,Loss1为第一预设损失函数,Loss2为基于标签数据和所述学生部件分割结果构建的交叉熵损失函数,β为判断参数,Loss为预设损失函数。
该可选的实施例中,从所述训练集中不断挑选目标车辆图片所述初始学生网络和第二教师网络以计算预设损失函数的数值,并利用梯度下降法不断更新初始学生网络中的参数,当所述预设损失函数的数值不再变化时,停止所述初始学生网络的训练得到第二学生网络,所述第二学生网络可以提取车辆图像中不同车辆部件的区别特征,获取准确的车辆部件分割结果。
在一个可选的实施例中,分割单元114用于基于所述第二学生网络获取实时车辆图像的部件分割结果。
在一个可选的实施例中,将参数量小的第二学生网络嵌入到移动端设备后,用户手持移动端设备采集实时车辆图像,第二学生网络对所述实时车辆图像进行分割即可得到部件分割结果。
由以上技术方案可以看出,本申请基于标注数据和无标注数据对初始教师网络进行两次训练得到教师网络,并使用教师网络提取标注数据和无标注数据中每一张车辆图片的暗知识以监督轻量化的初始学生网络的训练,从而获取参数量小且分割精度高的第二学生网络,将第二学生网络嵌入移动端设备,可以提高移动端场景下车辆部件分割的速度和精度。
请参见图4,是本申请实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令,处理器13用执行所述储器中存储的计算机可读指令以实现上述任一实施例所述的基于知识蒸馏的车辆部件分割方法。
在一个可选的实施例中,电子设备1还包括总线、存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于知识蒸馏的车辆部件分割程序。
图4仅示出了具有存储器12和处理器13的电子设备1,本领域技术人员可以理解的是,图4示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,电子设备1中的所述存储器12存储多个计算机可读指令以实现一种基于知识蒸馏的车辆部件分割方法,所述处理器13可执行所述多个指令从而实现:
采集带标签数据的车辆图像作为标注数据集,采集不带标签数据的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,所述标签数据包括车辆图像中每一个像素点的车辆部件种类;
搭建初始教师网络,基于所述训练集对所述初始教师网络进行训练以获取第二教师网络;
搭建初始学生网络;
基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性;
基于所述第二学生网络获取实时车辆图像的部件分割结果。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,电子设备1可以是总线型结构,也可以是星形结构,电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本申请,也应包含在本申请的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质可以是非易失性的,也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于知识蒸馏的车辆部件分割程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于知识蒸馏的车辆部件分割程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于知识蒸馏的车辆部件分割方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如,所述计算机程序可以被分割成采集单元110、训练单元111、搭建单元112、提取单元113、分割单元114。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(Processor)执行本申请各个实施例所述的基于知识蒸馏的车辆部件分割方法的部分。
电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存储器及其他存储器等。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图4中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
本申请实施例还提供一种计算机可读存储介质(图未示),计算机可读存储介质中存储有计算机可读指令,计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的基于知识蒸馏的车辆部件分割方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。说明书陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (10)
1.一种基于知识蒸馏的车辆部件分割方法,其特征在于,所述方法包括:
采集带标签数据的车辆图像作为标注数据集,采集不带标签数据的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,所述标签数据包括车辆图像中每一个像素点的车辆部件种类;
搭建初始教师网络,基于所述训练集对所述初始教师网络进行训练以获取第二教师网络;
搭建初始学生网络;
基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性;
基于所述第二学生网络获取实时车辆图像的部件分割结果。
2.如权利要求1所述的基于知识蒸馏的车辆部件分割方法,其特征在于,所述基于所述训练集对所述初始教师网络进行训练以获取第二教师网络包括:
基于标注数据集和交叉熵损失函数对所述初始教师网络进行训练以获取第一教师网络;
基于所述第一教师网络得到未标注数据集中每一张车辆图片的部件分割结果,所述部件分割结果包括车辆图片中每一个像素点的类别向量,所述类别向量包括像素点属于每一种车辆部件的概率值;
依据可信度计算模型计算每一个部件分割结果可信度指标;
基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像;
获取所有异常图像的标签数据,并基于所述异常图像和所述异常图像的标签数据训练所述第一教师网络得到第二教师网络。
4.如权利要求2所述的基于知识蒸馏的车辆部件分割方法,其特征在于,所述基于所述可信度指标和预设可信度阈值筛选所述未标注数据集中的车辆图像以获取异常图像包括:
对比所述可信度指标和预设可信度阈值;
若所述可信度指标大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度满足要求,将所述部件分割结果对应的车辆图片标记为正常图像;
若所述可信度指标不大于所述预设可信度阈值,则说明所述可信度指标对应的部件分割结果的精度不满足要求,将所述部件分割结果对应的车辆图片标记为异常图像。
5.如权利要求1所述的基于知识蒸馏的车辆部件分割方法,其特征在于,所述基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性,包括:
将目标车辆图像同时输入第二教师网络和初始学生网络,所述目标车辆图像为所述训练集中所有车辆图像中的任意一张,将所述第二教师网络的输出结果作为教师部件分割结果,将所述初始学生网络的输出结果作为学生部件分割结果,所述教师部件分割结果和所述学生部件分割结果均包括所述目标车辆图像中每一个像素点的类别向量;
基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵;
将所述教师部件分割结果的类别向量和所述位置相关矩阵作为所述目标车辆图像的暗知识,并基于所述暗知识构建第一预设损失函数;
判断所述目标车辆图像是否带有标签数据以获取判断参数,若所述目标车辆图像带有标签数据,则基于所述标签数据和所述学生部件分割结果构建交叉熵损失函数,所述判断参数的数值为1;若所述目标车辆图像不带有标签数据,则所述判断参数的数值为0;
基于所述判断参数和所述第一预设损失函数构建预设损失函数;
基于所述预设损失函数和所述训练集中所有车辆图像训练所述初始学生网络以获取第二学生网络。
6.如权利要求5所述的基于知识蒸馏的车辆部件分割方法,其特征在于,所述基于所述教师部件分割结果构建所述目标车辆图像的位置相关矩阵包括:
选取所述教师部件分割结果的类别向量中最大概率值对应的车辆部件种类以作为每一个像素点的车辆部件种类;
将同一车辆部件种类的像素点的像素值置为1,其他区域的像素点置为0得到所述车辆部件的区域图像,遍历所述教师部件分割结果中所有车辆部件种类,以便得到每一种车辆部件的区域图像;
将所述车辆部件的区域图像中的像素值沿着行方向按照固定顺序进行排列得到所述目标车辆图像中每一种车辆部件的位置向量;
基于所述位置向量计算不同车辆部件的位置相关性以构建所述目标车辆图像的位置相关矩阵,所述位置相关性满足关系式:
xmn=hm(hn)T
其中,hm为所述目标车辆图像中车辆部件m的位置向量,(hn)T为所述目标车辆图像中车辆部件n的位置向量的转置,xmn为车辆部件m和车辆部件n位置相关性。
7.如权利要求5所述的基于知识蒸馏的车辆部件分割方法,其特征在于,所述基于所述判断参数和所述第一预设损失函数构建预设损失函数中,所述预设损失函数满足关系式:
其中,Loss1为第一预设损失函数,Loss2为基于标签数据和所述学生部件分割结果构建的交叉熵损失函数,β为判断参数,取值为0或1,Loss为预设损失函数;
所述第一预设损失函数满足关系式:
其中,Xs为学生部件分割结果的位置相关矩阵,X为目标车辆图像的位置相关矩阵,‖Xs-X‖2表示Xs-X的L2距离;Ps(i,j)为学生部件分割结果中像素点(i,j)的类别向量,P(i,j)为教师部件分割结果中像素点(i,j)的类别向量,KL(Ps(i,j),P(i,j))用于计算Ps(i,j),P(i,j)之间的KL散度;W,H为目标车辆图像的宽高尺寸。
8.一种基于知识蒸馏的车辆部件分割装置,其特征在于,所述装置包括:
采集单元,用于采集带标签数据的车辆图像作为标注数据集,采集不带标签数据的车辆图像作为未标注数据集,将所述标注数据集和所述未标注数据集作为训练集,所述标签数据包括车辆图像中每一个像素点的车辆部件种类;
训练单元,用于搭建初始教师网络,基于所述训练集对所述初始教师网络进行训练以获取第二教师网络;
搭建单元,用于搭建初始学生网络;
提取单元,用于基于所述第二教师网络提取所述训练集中每一张车辆图像的暗知识,并基于所述暗知识训练所述初始学生网络得到第二学生网络,所述暗知识反应不同种类的车辆部件之间的特征相似性和位置相关性;
分割单元,用于基于所述第二学生网络获取实时车辆图像的部件分割结果。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的基于知识蒸馏的车辆部件分割方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于知识蒸馏的车辆部件分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210791176.8A CN115063589B (zh) | 2022-06-20 | 2022-06-20 | 基于知识蒸馏的车辆部件分割方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210791176.8A CN115063589B (zh) | 2022-06-20 | 2022-06-20 | 基于知识蒸馏的车辆部件分割方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115063589A true CN115063589A (zh) | 2022-09-16 |
CN115063589B CN115063589B (zh) | 2024-11-19 |
Family
ID=83203611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210791176.8A Active CN115063589B (zh) | 2022-06-20 | 2022-06-20 | 基于知识蒸馏的车辆部件分割方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115063589B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115641443A (zh) * | 2022-12-08 | 2023-01-24 | 北京鹰瞳科技发展股份有限公司 | 训练图像分割网络模型的方法、处理图像的方法及产品 |
CN115908253A (zh) * | 2022-10-18 | 2023-04-04 | 中科(黑龙江)数字经济研究院有限公司 | 一种基于知识蒸馏的跨域医学影像分割方法及装置 |
CN116863279A (zh) * | 2023-09-01 | 2023-10-10 | 南京理工大学 | 用于移动端模型轻量化的基于可解释指导的模型蒸馏方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329659A (zh) * | 2020-11-10 | 2021-02-05 | 平安科技(深圳)有限公司 | 基于车辆图像的弱监督语义分割方法及其相关设备 |
CN114241285A (zh) * | 2021-11-25 | 2022-03-25 | 华南理工大学 | 一种基于知识蒸馏和半监督学习的船舶快速检测方法 |
EP3996054A2 (en) * | 2020-11-09 | 2022-05-11 | Samsung Electronics Co., Ltd. | Method and apparatus for image segmentation |
-
2022
- 2022-06-20 CN CN202210791176.8A patent/CN115063589B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3996054A2 (en) * | 2020-11-09 | 2022-05-11 | Samsung Electronics Co., Ltd. | Method and apparatus for image segmentation |
CN112329659A (zh) * | 2020-11-10 | 2021-02-05 | 平安科技(深圳)有限公司 | 基于车辆图像的弱监督语义分割方法及其相关设备 |
CN114241285A (zh) * | 2021-11-25 | 2022-03-25 | 华南理工大学 | 一种基于知识蒸馏和半监督学习的船舶快速检测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115908253A (zh) * | 2022-10-18 | 2023-04-04 | 中科(黑龙江)数字经济研究院有限公司 | 一种基于知识蒸馏的跨域医学影像分割方法及装置 |
CN115641443A (zh) * | 2022-12-08 | 2023-01-24 | 北京鹰瞳科技发展股份有限公司 | 训练图像分割网络模型的方法、处理图像的方法及产品 |
CN115641443B (zh) * | 2022-12-08 | 2023-04-11 | 北京鹰瞳科技发展股份有限公司 | 训练图像分割网络模型的方法、处理图像的方法及产品 |
CN116863279A (zh) * | 2023-09-01 | 2023-10-10 | 南京理工大学 | 用于移动端模型轻量化的基于可解释指导的模型蒸馏方法 |
CN116863279B (zh) * | 2023-09-01 | 2023-11-21 | 南京理工大学 | 用于移动端模型轻量化的基于可解释指导的模型蒸馏方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115063589B (zh) | 2024-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115063589A (zh) | 基于知识蒸馏的车辆部件分割方法及相关设备 | |
CN112446025A (zh) | 联邦学习防御方法、装置、电子设备及存储介质 | |
CN111860398B (zh) | 遥感图像目标检测方法、系统及终端设备 | |
CN115063632B (zh) | 基于人工智能的车辆损伤识别方法、装置、设备及介质 | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN110738219A (zh) | 图像中线条提取方法和装置、存储介质及电子装置 | |
CN111738212B (zh) | 基于人工智能的交通信号灯识别方法、装置、设备及介质 | |
CN115049878B (zh) | 基于人工智能的目标检测优化方法、装置、设备及介质 | |
CN112132032A (zh) | 交通标志牌检测方法、装置、电子设备及存储介质 | |
CN115205225A (zh) | 医学图像识别模型的训练方法、装置、设备及存储介质 | |
CN116012709A (zh) | 一种高分辨率遥感影像建筑物提取方法及系统 | |
CN111931729B (zh) | 基于人工智能的行人检测方法、装置、设备及介质 | |
CN116363365A (zh) | 基于半监督学习的图像分割方法及相关设备 | |
CN112102205B (zh) | 图像去模糊方法、装置、电子设备及存储介质 | |
CN111104965A (zh) | 车辆目标识别的方法及装置 | |
CN114240935B (zh) | 一种空频域特征融合的医学影像特征识别方法及装置 | |
CN113610856B (zh) | 训练图像分割模型和图像分割的方法和装置 | |
CN112434631B (zh) | 目标物识别方法、装置、电子设备及可读存储介质 | |
CN115346095A (zh) | 视觉问答方法、装置、设备及存储介质 | |
CN115115991A (zh) | 视频特征提取方法、装置、设备及存储介质 | |
CN112288748B (zh) | 一种语义分割网络训练、图像语义分割方法及装置 | |
CN114972761B (zh) | 基于人工智能的车辆部件分割方法及相关设备 | |
CN111652226A (zh) | 基于图片的目标识别方法、装置及可读存储介质 | |
CN116012891A (zh) | 基于图像增强的多尺度行人检测方法、装置、设备及介质 | |
CN118038025B (zh) | 基于频率域和空间域的雾天目标检测方法、装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |