CN116342955A - 一种基于改进的特征金字塔网络的目标检测方法及系统 - Google Patents
一种基于改进的特征金字塔网络的目标检测方法及系统 Download PDFInfo
- Publication number
- CN116342955A CN116342955A CN202310324705.8A CN202310324705A CN116342955A CN 116342955 A CN116342955 A CN 116342955A CN 202310324705 A CN202310324705 A CN 202310324705A CN 116342955 A CN116342955 A CN 116342955A
- Authority
- CN
- China
- Prior art keywords
- feature
- detection
- target
- target image
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 91
- 238000000605 extraction Methods 0.000 claims abstract description 32
- 230000004927 fusion Effects 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000004590 computer program Methods 0.000 claims description 4
- 230000010339 dilation Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/84—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using probabilistic graphical models from image or video features, e.g. Markov models or Bayesian networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于改进的特征金字塔网络的目标检测方法及系统,包括以下步骤:获取待检测识别的目标图像;将所述目标图像输入至目标识别检测模型,得到目标检测结果;其中,所述目标识别检测模型包括特征提取部分、融合部分和检测头部分;融合部分将所提取的具有强语义信息的高层特征图与具有丰富位置信息的低级特征图相融合,不仅可以进一步提取更细化的特征,而且更有利于小物体的检测。
Description
技术领域
本发明属于目标识别相关技术领域,尤其涉及一种基于改进的特征金字塔网络的目标检测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
为了提高单级物体探测器的精度,大多数物体检测器使用特征金字塔网络(FPN)结构来优化不同级别的特征。特征金字塔网络将不同大小的对象分发到不同的要素图层进行检测。随着网络的不断深入,特征图的语义信息更加丰富,而浅层特征的位置信息则更加丰富。为了使下层特征获得更多的语义信息特征金字塔网络提出了自上而下的结构,将特征图从高层传递到低层次,以增强浅层特征图的语义信息。特征金字塔网络缓解了多尺度检测的难度,获得了更好的物体特征。
对象检测是计算机视觉中一项重要但具有挑战性的任务,它需要对数字图像中的对象进行分类和定位。它构成了许多视觉应用的基础,包括实例分割、对象跟踪和自动驾驶。所有基于CNN的物体探测器可以分为两类:基于锚点的探测器和无锚探测器。前者由两阶段方法和单阶段方法组成。与基于锚点的方法相比,无锚点方法放弃了锚固机制,减少了锚固盒的许多超参数,包括尺寸,比率,数量和提高探测器的性能
全卷积单级探测器(FCOS)是一款出色的无锚点探测器,它将图像内部的所有像素视为训练样本,并直接预测边界框的四个距离。它新颖地引入了“中心度分支”,以抑制低质量的检测边界框。FCOS由三部分组成:(1)从输入图像中提取特征的主干网络。(2)用于预测对象的分类和定位的检测头。(3)颈部用于聚集来自不同阶段的特征。
特征金字塔网络的结构不是最优的,它有两个缺陷:1)使用1×1卷积以减少特征图中的通道数。特征映射C3、C4和C5的通道数分别为512,1024,2048。但是,所有通道数在传递给颈部结构时,全都使用1×1卷积将通道数降为256,因此图层上的特征会丢失很多有用的信息。2)特征金字塔网络的自上而下结构更加注重相邻层的特征,因此存在特征从高层到低级传播的障碍。因此,基于特征金字塔网络的探测器无法通过使用低级特征来获得小物体的最佳结果。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于改进的特征金字塔网络的目标检测方法及系统,通过融合部分将所提取的具有强语义信息的高层特征图与具有丰富位置信息的低级特征图相融合,不仅可以进一步提取更细化的特征,而且更有利于小物体的检测。
为实现上述目的,本发明的第一个方面提供一种基于改进的特征金字塔网络的目标检测方法,包括以下步骤:
获取待检测识别的目标图像;
将所述目标图像输入至目标识别检测模型,得到目标检测结果;
其中,所述目标识别检测模型包括特征提取部分、融合部分和检测头部分;
所述特征提取部分对所述目标图像进行特征提取,得到不同尺度的特征图;
所述融合部分将不同尺度的特征图进行堆叠操作,得到特征金字塔;
所述检测头部分根据所述特征金字塔,得到所述待检测识别的目标图像的检测结果。
本发明的第二个方面提供一种基于改进的特征金字塔网络的目标检测系统,包括:
目标图像获取模块:用于获取待检测识别的目标图像;
目标图像检测模块,将所述目标图像输入至目标识别检测模型,得到目标检测结果;
识别检测模型构建模块:所述目标识别检测模型包括特征提取部分、融合部分和检测头部分;
所述特征提取部分对所述目标图像进行特征提取,得到不同尺度的特征图;
所述融合部分将不同尺度的特征图进行堆叠操作,得到特征金字塔;
所述检测头部分根据所述特征金字塔,得到所述待检测识别的目标图像的检测结果。
本发明的第三个方面提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法所述的步骤。
本发明的第四个方面提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法所述的步骤。
以上一个或多个技术方案存在以下有益效果:
在本发明中,融合部分对特征提取部分提取的特征进行堆叠操作,利用特征金字塔网络多尺度融合的思想,将具有强语义信息的高层特征图与具有丰富位置信息的低级特征图相融合,不仅可以进一步提取更细化的特征,而且更有利于小物体的检测。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例一中目标识别检测模型网络结构示意图;
图2是本发明实施一种目标检测流程示意图;
图3是本发明实施例一中融合模块结构示意图;
图4是本发明实施例一中倒置残差模块结构示意图;
图5是本发明实施例一中轻量级检测头结构示意图;
图6是本发明实施例一中目标识别检测模型网络在COCO2017测试集上的检测结果。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例公开了一种基于改进的特征金字塔网络的目标检测方法,包括以下步骤:
获取待检测识别的目标图像;
将所述目标图像输入至目标识别检测模型,得到目标检测结果;
其中,所述目标识别检测模型包括特征提取部分、融合部分和检测头部分;
所述特征提取部分对所述目标图像进行特征提取,得到不同尺度的特征图;
所述融合部分将不同尺度的特征图进行堆叠操作,得到特征金字塔;
所述检测头部分根据所述特征金字塔,得到所述待检测识别的目标图像的检测结果。
如图1所示,在本实施例中,提出了一种以FCOS作为基线的无锚检测方法用来检测目标,所建立的目标识别检测模型包括特征提取部分、融合部分和检测头部分。
具体的,其中特征提取部分以ResNet-50作为骨干网络进行特征提取,得到不同尺度的特征图{C3,C4,C5},然后将不同尺度的特征图分别经过3×3卷积操作后得到了对应大小的特征图{N3,N4,N5},其中,3×3卷积核拥有更大的感受野,可以提取更加细化的特征。这里3×3卷积核主要作用是在不改变特征图大小的前提下,更好的提取特征。
如图3所示,我们首先将经过主干网络提取得到的不同尺度的特征图{C3,C4,C5},然后经过3×3卷积得到{N3,N4,N5},其次,通过下采样操作将N3,N4缩放成N5相同的大小。最后通过concat操作将三个特征图融合获得融合特征。融合特征主要是利用特征金字塔网络多尺度融合的思想,通过将具有强语义信息的高层特征图与具有丰富位置信息的低级特征图相融合,不仅可以进一步提取更细化的特征,而且更有利于小物体的检测。
将融合特征分别与经过1×1卷积的{C3,C4,C5}做concat操作,作为FPN的输入,然后再经过FPN中的倒置残差模块提取特征,生成P3-P5特征图。为了得到更好的语义信息检测大目标,将融合特征经过一个3×3卷积下采样操作得到P6,再将P6经过一个3×3卷积下采样操作得到P7。最后,将P3-P7作为特征图输入到头部中做检测。
如图4所示,在本实施例中,采用改进的特征金字塔网络,将原始的特征金字塔(FPN)内部3×3卷积替换成倒置残差模块,与先降维后升维的残差卷积相反,倒置残差模块中先使用1×1卷积实现升维,然后通过3×3DW卷积进行特征提取,最后通过1×1卷积实现降维,倒置残差模块不仅保证了DW卷积在高维可以提取更多的特征,也可以极大地减少模型的计算量。公式为:
Pout=Relu6(PW2(DW(Relu6(PW1(Pin)))))+Pin (1)
其中,Reiu6=min(max(x,0),6),Pin表示倒置残差模块输入,PW1表示升维的1×1卷积,PW2表示降维的1×1卷积,DW表示深度卷积。pout表示倒置残差模块输出。
在本实施例中,还设计了一个轻量级的检测头,目的是降低模型的复杂度,保持精度与速度的平衡。
如图5所示,检测头是由一个倒置残差卷积和两个分支的膨胀卷积构成。FPN输出的特征图首先经过倒置残差卷积进行特征提取,然后分别经过两个串联的3×3膨胀卷积(膨胀率=2)进一步提取特征,通过膨胀卷积的特性,增加了空间图像的感受野,从而可以在不同的尺度上很好地编码大范围的上下文信息,最终,输出三个预测值,分别是Classification预测,Center-ness预测和Regression预测。
对于Classification分支,在预测特征图的每个位置都会预测80个score参数(COCO数据集类别数为80)。
对于Regression和Center-ness分支,分别在预测特征图的每个位置会预测4个距离参数和1个参数。在网络的后续筛选高质量bbox时,会将预测的class score与Center-ness相乘在开根,然后根据得到的结果对bbox进行排序。只保留分数较高的bbox,这样做的目的是筛选掉那些目标class score低且预测点且距离目标中心较远的bbox,最终保留下来的就是高质量的bbox。
在COCO 2017数据集上训练和评估本实施例所提出的目标识别检测模型,并且与其他方法进行对来证明本实施例模型的优越性,并且将AP作为目标检测精度的评价指标。测试结果如表1所示,本实施例模型的方法实现了最佳的检测性能。图6展示了本实施例模型在COCO2017测试集上的检测结果。
表1:
方法 | 骨干网络 | 输入分辨率 | Params(M) | AP(%) |
Fast R-CNN | VGG-16 | 600×1000 | - | 19.3 |
Faster R-CNN | VGG-16 | 600×1000 | 134.7 | 21.9 |
RetinaNet | MobilNetV2 | 800×1024 | 11.3 | 30.8 |
SSD300 | VGG-16 | 300×300 | 26.3 | 23.2 |
SSD512 | VGG-16 | 512×512 | 29.4 | 26.8 |
YOLOV2 | DarkNet-19 | 544×544 | 51.0 | 21.2 |
EfficientDet-D0 | Efficient-B0 | 512×512 | - | 33.8 |
YOLOV3 | DarkNet-53 | 416×416 | - | 33.0 |
ours | ResNet-50 | 512×512 | 36.4 | 35.6 |
实施例二
本实施例的目的是提供一种基于改进的特征金字塔网络的目标检测系统,包括:
目标图像获取模块:用于获取待检测识别的目标图像;
目标图像检测模块,将所述目标图像输入至目标识别检测模型,得到目标检测结果;
识别检测模型构建模块:所述目标识别检测模型包括特征提取部分、融合部分和检测头部分;
所述特征提取部分对所述目标图像进行特征提取,得到不同尺度的特征图;
所述融合部分将不同尺度的特征图进行堆叠操作,得到特征金字塔;
所述检测头部分根据所述特征金字塔,得到所述待检测识别的目标图像的检测结果。
实施例三
本实施例的目的是提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
实施例四
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行上述方法的步骤。
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于改进的特征金字塔网络的目标检测方法,其特征在于,包括以下步骤:
获取待检测识别的目标图像;
将所述目标图像输入至目标识别检测模型,得到目标检测结果;
其中,所述目标识别检测模型包括特征提取部分、融合部分和检测头部分;
所述特征提取部分对所述目标图像进行特征提取,得到不同尺度的特征图;
所述融合部分将不同尺度的特征图进行堆叠操作,得到特征金字塔;
所述检测头部分根据所述特征金字塔,得到所述待检测识别的目标图像的检测结果。
2.如权利要求1所述的一种基于改进的特征金字塔网络的目标检测方法,其特征在于,所述特征提取部分采用ResNet-50主干网络,所述ResNet-50主干网络对待检测的目标图像进行特征提取,得到目标图像不同尺度的特征图{C3,C4,C5},将所获得的不同尺寸的特征图分别经过3×3卷积操作后得到了对应大小的特征图分别为{N3,N4,N5}。
3.如权利要求2所述的一种基于改进的特征金字塔网络的目标检测方法,其特征在于,所述融合部分,通过下采样操作将特征图N3,N4缩放成特征图N5相同的大小,然后通过concat操作将N3,N4缩放后的特征图与特征图N5进行融合。
4.如权利要求2所述的一种基于改进的特征金字塔网络的目标检测方法,其特征在于,将融合部分的输出分别与经过1×1卷积的{C3,C4,C5}做concat操作,然后作为改进特征金字塔网络的输入,所述改进特征金字塔具体为:将原始特征金字塔网络内部3*3卷积替换成倒置残差模块,对所述倒置残差模块的输入先使用1×1卷积进行升维操作,然后通过3×3DW卷积进行特征提取,最后通过1×1卷积进行降维操作。
5.如权利要求4所述的一种基于改进的特征金字塔网络的目标检测方法,其特征在于,将融合部分的输出经过3×3卷积下采样操作得到特征图P6,将特征图P6经过3×3卷积下采样操作得到特征图P7,将特征图P6,P7和所述倒置残差模块的输出作为检测头部分的输入进行检测输出。
6.如权利要求4所述的一种基于改进的特征金字塔网络的目标检测方法,其特征在于,所述检测头部分由倒置残差卷积和两个分支的膨胀卷积构成,所述倒置残差模块的输出先经过倒置残差卷积进行特征提取,然后分别经过两个串联的3×3膨胀卷积进行进一步的特征提取,输出预测值。
7.一种基于改进的特征金字塔网络的目标检测系统,其特征在于,
目标图像获取模块:用于获取待检测识别的目标图像;
目标图像检测模块,将所述目标图像输入至目标识别检测模型,得到目标检测结果;
识别检测模型构建模块:所述目标识别检测模型包括特征提取部分、融合部分和检测头部分;
所述特征提取部分对所述目标图像进行特征提取,得到不同尺度的特征图;
所述融合部分将不同尺度的特征图进行堆叠操作,得到特征金字塔;
所述检测头部分根据所述特征金字塔,得到所述待检测识别的目标图像的检测结果。
8.如权利要求5所述的一种基于改进的特征金字塔网络的目标检测系统,其特征在于,在所述识别检测模型构建模块中,所述特征提取部分采用ResNet-50主干网络,所述ResNet-50主干网络对待检测的目标图像进行特征提取,得到目标图像不同尺度的特征图{C3,C4,C5},将所获得的不同尺寸的特征图分别经过3×3卷积操作后得到了对应大小的特征图分别为{N3,N4,N5}。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征是,该程序被处理器执行时实现如权利要求1-6中任一项所述的一种基于改进的特征金字塔网络的目标检测方法中的步骤。
10.一种处理装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现如权利要求1-6中任一项所述的一种基于改进的特征金字塔网络的目标检测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310324705.8A CN116342955A (zh) | 2023-03-27 | 2023-03-27 | 一种基于改进的特征金字塔网络的目标检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310324705.8A CN116342955A (zh) | 2023-03-27 | 2023-03-27 | 一种基于改进的特征金字塔网络的目标检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116342955A true CN116342955A (zh) | 2023-06-27 |
Family
ID=86885457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310324705.8A Pending CN116342955A (zh) | 2023-03-27 | 2023-03-27 | 一种基于改进的特征金字塔网络的目标检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116342955A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118587622A (zh) * | 2024-08-07 | 2024-09-03 | 齐鲁空天信息研究院 | 一种基于无人机平台的轻量化目标检测方法及系统 |
-
2023
- 2023-03-27 CN CN202310324705.8A patent/CN116342955A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118587622A (zh) * | 2024-08-07 | 2024-09-03 | 齐鲁空天信息研究院 | 一种基于无人机平台的轻量化目标检测方法及系统 |
CN118587622B (zh) * | 2024-08-07 | 2024-11-01 | 齐鲁空天信息研究院 | 一种基于无人机平台的轻量化目标检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110533084B (zh) | 一种基于自注意力机制的多尺度目标检测方法 | |
CN110032998B (zh) | 自然场景图片的文字检测方法、系统、装置和存储介质 | |
CN110598788B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN111027576B (zh) | 基于协同显著性生成式对抗网络的协同显著性检测方法 | |
CN109165658B (zh) | 一种基于Faster-RCNN的强负样本水下目标检测方法 | |
CN114255403A (zh) | 基于深度学习的光学遥感图像数据处理方法及系统 | |
CN113487610B (zh) | 疱疹图像识别方法、装置、计算机设备和存储介质 | |
CN112926429B (zh) | 机审模型训练、视频机审方法、装置、设备及存储介质 | |
Zhang et al. | A new architecture of feature pyramid network for object detection | |
CN113361466B (zh) | 一种基于多模态交叉指导学习的多光谱目标检测方法 | |
CN110008900A (zh) | 一种由区域到目标的可见光遥感图像候选目标提取方法 | |
CN111368865B (zh) | 遥感影像储油罐检测方法、装置、可读存储介质及设备 | |
CN110866931B (zh) | 图像分割模型训练方法及基于分类的强化图像分割方法 | |
CN116342955A (zh) | 一种基于改进的特征金字塔网络的目标检测方法及系统 | |
CN116168240A (zh) | 基于注意力增强的任意方向密集舰船目标检测方法 | |
CN111582057B (zh) | 一种基于局部感受野的人脸验证方法 | |
CN113610178A (zh) | 一种基于视频监控图像的内河船舶目标检测方法和装置 | |
CN117911394A (zh) | 基于改进YOLOv5的钢材表面缺陷检测方法及系统 | |
CN117274754A (zh) | 梯度匀质化的点云多任务融合方法 | |
Rabecka et al. | Assessing the performance of advanced object detection techniques for autonomous cars | |
CN114927236A (zh) | 一种面向多重目标图像的检测方法及系统 | |
CN117710755B (zh) | 一种基于深度学习的车辆属性识别系统及方法 | |
CN118229717B (zh) | 一种似圆轮廓图像分割方法、系统和介质 | |
CN112733883B (zh) | 一种点监督的目标检测方法 | |
CN114360009B (zh) | 一种复杂场景下的多尺度特征人脸属性识别系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |