CN112712052A - 一种机场全景视频中微弱目标的检测识别方法 - Google Patents
一种机场全景视频中微弱目标的检测识别方法 Download PDFInfo
- Publication number
- CN112712052A CN112712052A CN202110041661.9A CN202110041661A CN112712052A CN 112712052 A CN112712052 A CN 112712052A CN 202110041661 A CN202110041661 A CN 202110041661A CN 112712052 A CN112712052 A CN 112712052A
- Authority
- CN
- China
- Prior art keywords
- network
- target
- student
- teacher
- airport
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 58
- 238000001514 detection method Methods 0.000 claims abstract description 28
- 238000013140 knowledge distillation Methods 0.000 claims abstract description 14
- 239000013077 target material Substances 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 239000000463 material Substances 0.000 claims abstract description 4
- 230000004927 fusion Effects 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000007547 defect Effects 0.000 description 3
- 238000004821 distillation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了机场全景视频中微弱目标的检测识别方法,包括:步骤1,采集含有待识别目标的素材,构建教师网络的训练集;步骤2,采集微弱目标素材,对微弱目标的特征进行增强处理,构建学生网络的训练集;步骤3,将教师网络训练集输入到教师网络中,通过训练优化后得到教师模型;步骤4,将学生网络训练集输入到学生网络中,采用知识蒸馏方法将教师网络推理出来的软目标和学生网络的硬目标所对应的交叉熵加权作为学生网络的总损失进行计算,训练优化后得到学生模型;步骤5,将待检测的视频输入到学生模型中进行推理计算,得到推理结果。本发明能够解决机场全景监控中微弱目标的漏检、误检、检测速度慢以及资源消耗大等问题。
Description
技术领域
本发明涉及视频图像检测技术领域,尤其是一种机场全景视频下微弱目标的检测识别方法。
背景技术
在机场全景视频监控的应用中,需要对视频中的特定目标进行实时监测。由于被监测目标在全景视频中尺度和角度会发生很大变化,当距离视频画面中心较远时,目标的尺寸很小、特征微弱,给目标检测带来很大难度。
现有的解决方案有借助雷达或红外技术,通过微弱目标包含的参数信息和噪声特征信息对目标进行检测和分辨,这些方法的缺点在于处理时长较长、丢帧严重,并且对设备依赖高,相应的成本也会增加。另一种解决方案是基于图像的三维霍夫变换,利用帧间信息的特点进行目标检测,其缺点是算法本身非常耗时,性能也不稳定,在有噪声干扰时检测效果下降严重。因此,针对当前机场全景监控中微弱目标检测的应用要求,迫切需要研究一种检测精度高、设备成本低、适用范围广的微弱目标检测识别方法。
发明内容
针对现有方法的以上缺陷或改进需求,本发明提供了一种机场全景视频中微弱目标的检测识别方法,能够有效提高机场全景监控视频中微弱目标的检测准确率。
为实现上述目的,本发明提供了以下的技术方案。
一种机场全景视频中微弱目标的检测识别方法,其特征在于:所述方法包括如下步骤:
步骤1,采集机场全景画面中含有待识别目标的素材,对目标素材赋予硬标签,构建教师网络的训练集;
步骤2,采集机场全景画面中微弱目标素材,对大场景微弱目标的特征进行图像二次重定位增强处理,对特征增强后的微弱目标素材赋予硬标签,构建学生网络的训练集;
步骤3,将教师网络训练集输入到教师网络中,通过训练优化后得到教师模型;
步骤4,将学生网络训练集输入到学生网络中,采用知识蒸馏方法将教师网络推理出来的软目标和学生网络的硬目标所对应的交叉熵加权作为学生网络的总损失进行计算,训练优化后得到学生模型;
步骤5,将待检测的视频输入到学生模型中进行推理计算,得到推理结果作为检测结果输出。
其中,所述机场全景是指采用3个及以上高点定焦摄像机拍摄并拼接而成的机场全景画面。
进一步的,所述增强处理是使用图像重定位方法对微弱目标素材进行处理:先将图像中不会出现目标的区域裁剪掉,再将含有待识别目标的图像进行放大。
进一步的,所述教师网络基于Darknet_3多尺度特征融合网络,包含23个ResidualBlock模块,1个Conv Block模块,5个卷积层和一个全连接层,输出13*13、26*26、52*52三个尺度的特征,并对这三个尺度的特征信息进行融合。
进一步的,所述学生网络基于Tiny_yolo,该网络包含13个卷积层、6个最大池化层、2个输出层、2个特征融合层、1个上采样层,输出为26*26和52*52两个尺度的特征并对其进行融合。
进一步的,所述知识蒸馏方法是将训练好的教师模型通过知识蒸馏手段得到更适合推理的小模型。
进一步的,步骤4学生网络的总损失函数采用下式计算:
Ltotal=αLsoft+βLhard
Lsoft为软目标所对应的交叉熵,Lhard为硬目标所对应的交叉熵,Ltotal为学生网络的总损失函数,α和β为对应的加权系数。
Lsoft采用下式计算:
T表示设定的控制参数,通过调节该参数可以控制“蒸馏”的效果;vi表示教师模型的权重向量,zi表示学生模型的权重向量,N表示类别总数,zk表示学生模型权重向量中的第k个权重值。
Lhard采用下式计算:
zj表示教师模型权重向量的第j个权重值,ci表示第i类目标的标签数值。
分别对Lsoft函数与Lhard函数对zi微分可得:
教师网络通过给Softmax函数增加“温度”参数T,进而控制输出的软目标的交叉熵qi:
软目标交叉熵的加权系数在训练初期阶段大于训练后期。
进一步的,所述教师网络的训练集构建,通过使用标注工具对该场景下的待检测目标进行标注,构成硬标签的训练集。学生网络的训练集的构建,通过使用标注工具对经过图像重定位处理后的图片进行标注,该训练集中的目标也采用硬标签。
本发明所述的方案与现有的技术相比,具有如下的有益效果是:本发明通过图像重定位方法来构建微弱目标的训练集,通过知识蒸馏方法来训练微弱目标检测的学生模型,精准高效地解决了机场全景监控视频下微弱目标的漏检、误检、检测速度慢以及资源消耗大等问题,具有极大的产业应用价值。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明一实施例所提供的检测识别方法的流程示意图;
图2是本发明一实施例所提供的知识蒸馏方法的原理示意图;
图3是本发明一实施例所提供的图像重定位的效果示意图;
图4是本发明一实施例所提供的在机场全景下对于微弱目标(飞机)的检测效果示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
本发明提供了一种机场全景视频中微弱目标的检测识别方法,所述机场全景是采用3个及以上高点定焦摄像机拍摄并拼接而成的机场全景画面,优选的,机场全景画面包含机场整个跑道。所述微弱目标是指在机场全景画面中分辨率较小、轮廓不清晰、特征不稳定、不易于识别的感兴趣目标。作为一个实施例,定义微弱目标为:在超5k分辨率的场景下目标占比小于1/100或图像模糊、轮廓粘连的特征微弱目标。
参照图1所示的流程示意图,本发明所提出的微弱目标的检测识别方法的具体实现步骤如下:
步骤1,采集机场全景视频中含有待识别目标的素材,对目标素材赋予硬标签,构建教师网络的训练集;
步骤2,采集机场全景视频中微弱目标素材,用图像重定位方法对图像进行裁剪以去除冗余图像信息,再进行适当放大以增强微弱目标的特征。对特征增强后的微弱目标素材赋予硬标签,构建学生网络训练集。
步骤3,将教师网络训练集输入到以Darknet_53构建的教师网络中,通过训练优化后得到教师模型;
步骤4,将学生网络训练集输入到以Tiny_yolo构建的学生网络,采用知识蒸馏方法将教师网络推理出来的软目标和学生网络的硬目标所对应的交叉熵加权作为学生网络的损失计算,训练优化后得到学生模型;其关键在于使用教师网络通过知识蒸馏的方法诱导学生网络进行训练;
步骤5,将待检测的视频输入到学生模型中进行推理计算,得到推理结果作为检测结果输出。
步骤1中所述教师网络的训练集构建,具体是通过使用标注工具对该场景下的待检测目标进行标注,构成携带硬标签的训练集,该训练集作为训练教师网络的输入样本数据。
步骤2中用图像重定位方法构建学生网络训练集,先将图像中不会出现目标的区域裁剪掉,再将含有待识别目标的图像进行放大,最后输入到网络中进行训练。由于机场固定场景中的目标其特征在全景图像中表现微弱,该方法通过去除图像中的冗余信息,再将图像进行放大来增强微弱目标的特征信息,从而使网络能够更有效地提取到微弱目标的特征,以提高网络对微弱目标的辨别能力。图像重定位后的效果示意图如图3所示。同样地,使用图像标注工具对经过图像重定位处理、特征增强后的图片进行标注进而构建学生网络的训练集,学生网络使用的训练集中的目标也采用硬标签。
步骤3中教师网络的训练是指将构建好的训练集输入到训练网络中训练出检测效果较好的网络模型作为教师模型。作为一个实施例,所述教师网络基于Darknet-53多尺度特征融合网络进行训练,包含23个Residual Block模块,1个Conv Block模块,5个卷积层和一个全连接层,输出13*13、26*26、52*52三个尺度的特征,并对这三个尺度的特征信息进行融合。Residual Block模块将局部特征与全局特征进行融合,解决因网络加深导致的网络退化问题。多尺度特征融合机制帮助算法从多个尺度对模型进行优化,大大提升模型的鲁棒性。教师网络的选择泛化能力强,网络结构复杂,能够提取目标的深度特征。其中,教师网络训练得越好,对于学生网络的指导效果越好。
步骤4是本发明的核心步骤,提出了利用教师网络诱导学生网络的训练,从而实现对学生网络的准确指导,如图2所示。学生网络的选择遵循以结构简单(轻量化)、推理速度快、资源消耗少的网络作为训练学生模型的主干网络。作为一个实施例,所述学生网络基于Tiny_yolo网络,该网络包含13个卷积层、6个最大池化层、2个输出层、2个特征融合层、1个上采样层。输出为26*26和52*52两个尺度的特征并对其进行融合。学生网络使用经过图像重定位方法处理后的图片构建成的训练集进行训练。
步骤4中使用了所述知识蒸馏方法来训练微弱目标检测的教师模型,参照图2,是将训练好的大模型(教师模型)通过知识蒸馏手段得到更适合推理的小模型。在神经网络训练过程中,为克服硬标签训练方式易于造成模型过拟合、泛化能力下降的缺陷,采用软标签训练方式进行模型学习,得到属于同一类的微弱目标与正常目标之间的相似性和差异性特征,使模型能够更好学习到数据的分布,从而大大增强模型的泛化能力。使用所述硬标签是人工标注的能够明确进行分类的标签;所述软标签是经过模型识别后输出的不具有明确分类信息,但是含有类别置信度的标签。
进一步参照图2,通过训练好的教师模型推理出来的软目标和学生网络使用的硬目标所对应的交叉熵加权纳为学生网络训练过程中的总损失进行计算,具体的步骤如下:
步骤41、在教师网络中设置softmax的“温度”参数T=1进行训练;
步骤42、进行网络维度转化:教师网络的维度和学生网络的中间层的维度不一致,需要增加线性矩阵或者卷积层去进行维度变换,使中间层网络维度达到一致,然后使用L2loss进行监督;
步骤43、在学生网络中:
(1)设置学生网络softmax的“温度”参数T=20的输出的软标签与教师网络的Softmax(“温度”T=1)的输出的软标签进行交叉熵融合计算作为软损失Lsoft。
(2)设置学生网络softmax的“温度”参数T=1,计算出学生网络与硬标签的交叉熵损失作为硬损失Lhard。
(3)将Lsoft和Lhard进行加权算作学生网络的最终的总损失Ltotal进行训练。所述交叉熵加权计算过程如下:
Ltotal=αLsoft+βLhard
Lsoft为软目标所对应的交叉熵,Lhard为硬目标所对应的交叉熵,Ltotal为学生网络的总损失函数,α和β为对应的加权系数。
Lsoft采用下式计算:
T表示设定的控制参数,通过调节该参数可以控制“蒸馏”的效果;vi表示教师模型的权重向量,zi表示学生模型的权重向量,N表示类别总数,zk表示学生模型权重向量中的第k个权重值。
Lhard采用下式计算:
zj表示教师模型权重向量的第j个权重值,ci表示第i类目标的标签数值。
分别对Lsoft函数与Lhard函数对zi微分可得:
其中,教师网络通过给Softmax函数增加“温度”参数T,进而控制输出的软目标的交叉熵qi:
α和β属于加权系数,软目标交叉熵Lsoft的加权系数越大,迁移诱导越依赖教师网络,在训练初期阶段是很有必要的,有助于让学生网络鉴别简单样本,训练后期适当减小软目标交叉熵的加权系数,让硬标签帮助鉴别困难样本。
综上所述,本发明选用Darknet_53和Tiny_yolo分别作为教师模型和学生模型训练的深度主干网络,通过图像重定位帮助微弱目标提高特征信息,通过知识蒸馏方法诱导学生网络学习到教师模型中的一些重要参数信息,使得学生模型在接受指导后尽可能达到教师模型的检测效果。本发明的一检测效果示意图如图4所示,在该次检测实验中,检测视频的分辨率为5728*1136,其中的模型文件大小为33M,检测速度达到每秒107帧,GPU显存消耗0.7G左右,对于机场全景场景下微弱目标的检测准确率达到90%以上。本发明有效提高了机场全景下微弱目标的检测率,有效解决了资源消耗严重和检测速度慢的问题,适应性更强、检测速度更快、准确度更高、成本更低。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和原则的前提下,可以在实施的形式及细节上进行任何的修改与变化、等同替换等,这些都属于本发明的保护范围。因此,本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (10)
1.一种机场全景视频中微弱目标的检测识别方法,其特征在于:所述方法包括如下步骤:
步骤1,采集机场全景画面中含有待识别目标的素材,对目标素材赋予硬标签,构建教师网络的训练集;
步骤2,采集机场全景画面中微弱目标素材,对大场景微弱目标的特征进行图像二次重定位增强处理,对特征增强后的微弱目标素材赋予硬标签,构建学生网络的训练集;
步骤3,将教师网络训练集输入到教师网络中,通过训练优化后得到教师模型;
步骤4,将学生网络训练集输入到学生网络中,采用知识蒸馏方法将教师网络推理出来的软目标和学生网络的硬目标所对应的交叉熵加权作为学生网络的总损失进行计算,训练优化后得到学生模型;
步骤5,将待检测的视频输入到学生模型中进行推理计算,得到推理结果作为检测结果输出。
2.根据权利要求1所述的系统,其特征在于,所述机场全景是指采用3个及以上高点定焦摄像机拍摄并拼接而成的机场全景画面。
3.根据权利要求1所述的系统,其特征在于,所述增强处理是使用图像重定位方法对微弱目标素材进行处理:先将图像中不会出现目标的区域裁剪掉,再将含有待识别目标的图像进行放大。
4.根据权利要求3所述的系统,其特征在于,所述教师网络基于Darknet_3多尺度特征融合网络,包含23个Residual Block模块,1个Conv Block模块,5个卷积层和一个全连接层,输出13*13、26*26、52*52三个尺度的特征,并对这三个尺度的特征信息进行融合。
5.根据权利要求4所述的系统,其特征在于,所述学生网络基于Tiny_yolo,该网络包含13个卷积层、6个最大池化层、2个输出层、2个特征融合层、1个上采样层,输出为26*26和52*52两个尺度的特征并对其进行融合。
6.根据权利要求1所述的系统,其特征在于,所述知识蒸馏方法是将训练好的教师模型通过知识蒸馏手段得到更适合推理的小模型。
9.根据权利要求1、7、8任一项所述的系统,其特征在于,软目标所对应的交叉熵的加权系数在网络训练初期阶段大于网络训练后期。
10.根据权利要求1所述的系统,其特征在于,步骤1和2中训练集的构建,具体通过使用标注工具对目标进行标注构成采用硬标签的训练集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110041661.9A CN112712052A (zh) | 2021-01-13 | 2021-01-13 | 一种机场全景视频中微弱目标的检测识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110041661.9A CN112712052A (zh) | 2021-01-13 | 2021-01-13 | 一种机场全景视频中微弱目标的检测识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112712052A true CN112712052A (zh) | 2021-04-27 |
Family
ID=75548882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110041661.9A Pending CN112712052A (zh) | 2021-01-13 | 2021-01-13 | 一种机场全景视频中微弱目标的检测识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112712052A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113281048A (zh) * | 2021-06-25 | 2021-08-20 | 华中科技大学 | 一种基于关系型知识蒸馏的滚动轴承故障诊断方法和系统 |
CN113326764A (zh) * | 2021-05-27 | 2021-08-31 | 北京百度网讯科技有限公司 | 训练图像识别模型和图像识别的方法和装置 |
CN113343898A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备 |
CN114241282A (zh) * | 2021-11-04 | 2022-03-25 | 河南工业大学 | 一种基于知识蒸馏的边缘设备场景识别方法及装置 |
CN114708646A (zh) * | 2021-11-10 | 2022-07-05 | 广州新华学院 | 基于光流蒸馏的压缩视频人体行为识别算法 |
CN116645507A (zh) * | 2023-05-18 | 2023-08-25 | 丽水瑞联医疗科技有限公司 | 一种基于语义分割的胎盘图像处理方法及系统 |
WO2024150339A1 (ja) * | 2023-01-11 | 2024-07-18 | 日本電信電話株式会社 | 学習装置、三次元再構成装置、学習方法、三次元再構成方法、及びプログラム |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182992A (zh) * | 2014-08-19 | 2014-12-03 | 哈尔滨工程大学 | 一种基于全景视觉的海上弱小目标检测方法 |
CN107358293A (zh) * | 2017-06-15 | 2017-11-17 | 北京图森未来科技有限公司 | 一种神经网络训练方法及装置 |
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
CN109145713A (zh) * | 2018-07-02 | 2019-01-04 | 南京师范大学 | 一种结合目标检测的小目标语义分割方法 |
CN109711544A (zh) * | 2018-12-04 | 2019-05-03 | 北京市商汤科技开发有限公司 | 模型压缩的方法、装置、电子设备及计算机存储介质 |
CN110348435A (zh) * | 2019-06-17 | 2019-10-18 | 武汉大学 | 一种基于裁剪区域候选网络的目标检测方法及系统 |
CN110969166A (zh) * | 2019-12-04 | 2020-04-07 | 国网智能科技股份有限公司 | 一种巡检场景下小目标识别方法和系统 |
CN111144417A (zh) * | 2019-12-27 | 2020-05-12 | 创新奇智(重庆)科技有限公司 | 基于教师学生网络的智能货柜小目标检测方法及检测系统 |
CN111209832A (zh) * | 2019-12-31 | 2020-05-29 | 华瑞新智科技(北京)有限公司 | 变电站巡检机器人辅助避障训练方法、设备及介质 |
CN111461212A (zh) * | 2020-03-31 | 2020-07-28 | 中国科学院计算技术研究所 | 一种用于点云目标检测模型的压缩方法 |
US20200293903A1 (en) * | 2019-03-13 | 2020-09-17 | Cortica Ltd. | Method for object detection using knowledge distillation |
CN111814810A (zh) * | 2020-08-11 | 2020-10-23 | Oppo广东移动通信有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN111880157A (zh) * | 2020-08-06 | 2020-11-03 | 中国人民解放军海军航空大学 | 一种雷达图像中目标的检测方法及系统 |
CN112163511A (zh) * | 2020-09-25 | 2021-01-01 | 天津大学 | 一种图像真伪鉴别方法 |
CN112200062A (zh) * | 2020-09-30 | 2021-01-08 | 广州云从人工智能技术有限公司 | 一种基于神经网络的目标检测方法、装置、机器可读介质及设备 |
-
2021
- 2021-01-13 CN CN202110041661.9A patent/CN112712052A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182992A (zh) * | 2014-08-19 | 2014-12-03 | 哈尔滨工程大学 | 一种基于全景视觉的海上弱小目标检测方法 |
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
CN107358293A (zh) * | 2017-06-15 | 2017-11-17 | 北京图森未来科技有限公司 | 一种神经网络训练方法及装置 |
CN109145713A (zh) * | 2018-07-02 | 2019-01-04 | 南京师范大学 | 一种结合目标检测的小目标语义分割方法 |
CN109711544A (zh) * | 2018-12-04 | 2019-05-03 | 北京市商汤科技开发有限公司 | 模型压缩的方法、装置、电子设备及计算机存储介质 |
US20200293903A1 (en) * | 2019-03-13 | 2020-09-17 | Cortica Ltd. | Method for object detection using knowledge distillation |
CN110348435A (zh) * | 2019-06-17 | 2019-10-18 | 武汉大学 | 一种基于裁剪区域候选网络的目标检测方法及系统 |
CN110969166A (zh) * | 2019-12-04 | 2020-04-07 | 国网智能科技股份有限公司 | 一种巡检场景下小目标识别方法和系统 |
CN111144417A (zh) * | 2019-12-27 | 2020-05-12 | 创新奇智(重庆)科技有限公司 | 基于教师学生网络的智能货柜小目标检测方法及检测系统 |
CN111209832A (zh) * | 2019-12-31 | 2020-05-29 | 华瑞新智科技(北京)有限公司 | 变电站巡检机器人辅助避障训练方法、设备及介质 |
CN111461212A (zh) * | 2020-03-31 | 2020-07-28 | 中国科学院计算技术研究所 | 一种用于点云目标检测模型的压缩方法 |
CN111880157A (zh) * | 2020-08-06 | 2020-11-03 | 中国人民解放军海军航空大学 | 一种雷达图像中目标的检测方法及系统 |
CN111814810A (zh) * | 2020-08-11 | 2020-10-23 | Oppo广东移动通信有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112163511A (zh) * | 2020-09-25 | 2021-01-01 | 天津大学 | 一种图像真伪鉴别方法 |
CN112200062A (zh) * | 2020-09-30 | 2021-01-08 | 广州云从人工智能技术有限公司 | 一种基于神经网络的目标检测方法、装置、机器可读介质及设备 |
Non-Patent Citations (3)
Title |
---|
GEOFFREY HINTON ET AL: "Distilling the Knowledge in a Neural Network", 《ARXIV》 * |
GUOBIN CHEN ET AL: "Learning Efficient Object Detection Models with Knowledge Distillation", 《31ST CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS (NIPS 2017)》 * |
许金逗: "基于深度学习的航拍图像目标检测", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326764A (zh) * | 2021-05-27 | 2021-08-31 | 北京百度网讯科技有限公司 | 训练图像识别模型和图像识别的方法和装置 |
CN113281048A (zh) * | 2021-06-25 | 2021-08-20 | 华中科技大学 | 一种基于关系型知识蒸馏的滚动轴承故障诊断方法和系统 |
CN113343898A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备 |
CN113343898B (zh) * | 2021-06-25 | 2022-02-11 | 江苏大学 | 基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备 |
CN113281048B (zh) * | 2021-06-25 | 2022-03-29 | 华中科技大学 | 一种基于关系型知识蒸馏的滚动轴承故障诊断方法和系统 |
CN114241282A (zh) * | 2021-11-04 | 2022-03-25 | 河南工业大学 | 一种基于知识蒸馏的边缘设备场景识别方法及装置 |
CN114241282B (zh) * | 2021-11-04 | 2024-01-26 | 河南工业大学 | 一种基于知识蒸馏的边缘设备场景识别方法及装置 |
CN114708646A (zh) * | 2021-11-10 | 2022-07-05 | 广州新华学院 | 基于光流蒸馏的压缩视频人体行为识别算法 |
WO2024150339A1 (ja) * | 2023-01-11 | 2024-07-18 | 日本電信電話株式会社 | 学習装置、三次元再構成装置、学習方法、三次元再構成方法、及びプログラム |
CN116645507A (zh) * | 2023-05-18 | 2023-08-25 | 丽水瑞联医疗科技有限公司 | 一种基于语义分割的胎盘图像处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114241282B (zh) | 一种基于知识蒸馏的边缘设备场景识别方法及装置 | |
CN112712052A (zh) | 一种机场全景视频中微弱目标的检测识别方法 | |
CN109949317B (zh) | 基于逐步对抗学习的半监督图像实例分割方法 | |
CN109101888B (zh) | 一种游客人流量监控预警方法 | |
CN112149547B (zh) | 基于图像金字塔引导和像素对匹配的遥感影像水体识别方法 | |
CN111898432B (zh) | 一种基于改进YOLOv3算法的行人检测系统及方法 | |
CN111950453A (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN110555420B (zh) | 一种基于行人区域特征提取和重识别融合模型网络及方法 | |
CN111062381B (zh) | 一种基于深度学习的车牌位置检测方法 | |
CN111339975A (zh) | 基于中心尺度预测与孪生神经网络的目标检测识别跟踪方法 | |
CN114821014A (zh) | 基于多模态与对抗学习的多任务目标检测识别方法及装置 | |
CN112487981A (zh) | 基于双路分割的ma-yolo动态手势快速识别方法 | |
CN113129336A (zh) | 一种端到端多车辆跟踪方法、系统及计算机可读介质 | |
CN114821326A (zh) | 一种宽幅遥感影像中密集弱小目标检测识别方法 | |
CN113569650A (zh) | 一种基于电力杆塔标牌识别的无人机自主巡检定位方法 | |
CN112700476A (zh) | 一种基于卷积神经网络的红外船视频跟踪方法 | |
Xingxin et al. | Adaptive auxiliary input extraction based on vanishing point detection for distant object detection in high-resolution railway scene | |
CN113538585B (zh) | 基于无人机的高精度多目标智能识别定位追踪方法及系统 | |
CN117456480B (zh) | 一种基于多源信息融合的轻量化车辆再辨识方法 | |
CN112464750B (zh) | 一种基于深度学习的车牌特征点检测方法 | |
CN110909645B (zh) | 一种基于半监督流形嵌入的人群计数方法 | |
CN113177511A (zh) | 基于多数据流的旋转边框智能感知目标检测方法 | |
CN118314353A (zh) | 一种基于双分支多尺度特征融合的遥感图像分割方法 | |
Wang et al. | Vehicle key information detection algorithm based on improved SSD | |
CN115719368B (zh) | 一种多目标船舶跟踪方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210427 |
|
WD01 | Invention patent application deemed withdrawn after publication |