CN110334752B - 一种基于梯形卷积的不规则形状物体检测方法 - Google Patents
一种基于梯形卷积的不规则形状物体检测方法 Download PDFInfo
- Publication number
- CN110334752B CN110334752B CN201910559601.9A CN201910559601A CN110334752B CN 110334752 B CN110334752 B CN 110334752B CN 201910559601 A CN201910559601 A CN 201910559601A CN 110334752 B CN110334752 B CN 110334752B
- Authority
- CN
- China
- Prior art keywords
- trapezoidal
- candidate region
- convolution
- rectangular candidate
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 18
- 230000001788 irregular Effects 0.000 title 1
- 238000001228 spectrum Methods 0.000 claims abstract description 19
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 230000009466 transformation Effects 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 5
- 210000001624 hip Anatomy 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 4
- 238000011176 pooling Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于梯形卷积的不规则形状物体检测方法,包括:1)先提取输入图像的特征谱;2)利用候选区域网络RPN得到初步的矩形候选区域;3)将矩形候选区域与输入图像的特征谱结合,得到输入图像中矩形候选区域特征后进入形边框调整步骤;4)梯形边框调整步骤:将矩形候选区域特征f1输入神经网络得到6个输出,分别代表区域中心点偏移量、宽高偏移量以及纵向两条边界与水平线的夹角;5)将矩形候选区域特征f1变换为梯形卷积特征谱f2:6)将梯形卷积特征谱f2作为检测步骤的输入特征来完成对输入图像的检测。本发明能够减少无关特征干扰,提高检测精度;梯形卷积引入参数较少,易于取得良好效果。
Description
技术领域
本发明涉及不规则形状物体检测领域,主要通过改变卷积核形状,提高检测精度的同时使Bounding Box更贴合目标。
背景技术
在目标检测领域,物体形状的不规则性是制约检测正确率的一个重要因素。传统两阶段检测方法通过“产生候选区域”和“识别区域内目标”实现,候选区域采用矩形框,在不规则形状物体的检测中,矩形框标定完整物体的同时会包含大量的不相关区域,这在第二阶段目标识别中会引入大量的不相关特征,影响检测的精准度,同时也无法给出将目标紧致标定的边框(Bounding Box)。可变形卷积是这种情况的一种解决方案,在传统卷积的基础上增加了偏移向量,但是涉及向量参数过多,训练难度较高。
发明内容
本发明所要解决的技术问题是,提供一种增加少数几个参数提高Bounding Box的灵活性,使之更加贴合实际的不规则形状物体的特征检测方法。
本发明为解决上述技术问题所采用的技术方案是,一种基于梯形卷积的不规则形状物体检测方法,通过增加四边形的两个角度作为参数进行训练,得到更贴合目标的边界框,后续处理中使用更紧致边界框里的特征谱,具体包括以下步骤:
1)先提取输入图像的特征谱;
2)利用候选区域网络RPN得到初步的矩形候选区域;
3)将矩形候选区域与输入图像的特征谱结合,得到输入图像中矩形候选区域特征后进入形边框调整步骤;
5)将矩形候选区域特征f1变换为梯形卷积特征谱f2:
坐标P表示变换前矩形候选区域坐标P=(xp,yp),R卷积核,pn为卷积核R中的点,w(pn)为点pn对应的卷积核的值,P'为变换后的坐标;
6)将梯形卷积特征谱f2作为检测步骤的输入特征来完成对输入图像的检测。
本发明的有益效果是,四边形更紧致边界框里的特征谱,能够减少无关特征干扰,提高检测精度;相对于没有约束的自由变换而言,梯形卷积引入参数较少,更容易训练,易于取得良好效果。输入为神经网络提取出的特征谱,输出变换后特征谱的大小与输入一致,因此可以在传统的网络上增加梯形卷积模块,帮助改善效果。
附图说明
图1为本发明流程图。
图2为实施例示意图。
具体实施方式
本发明增加卷积分支——梯形卷积,得到6个调整参数,对主干卷积网络的候选区域进行调整,整体流程图如图1所示。
本发明主要包含基于RPN的区域提案部分和调整边框部分,技术方案如下所示:
A、通过卷积网络提取输入图像的特征。该部分卷积网络使用卷积、Relu和池化Pooling的组合提取图像的特征谱Feature map。
B、利用现有的RPN网络生成候选区域。在这个模块里通过Softmax判断区域是属于前景或者背景,被判断为前景的部分通过边框Bounding Box回归进行微调,得到初步的候选区域。
C、将上一步生成的候选区域与特征谱结合,得到每一个区域对应的特征,将之依次输入至神经网络产生6个预测参数,用符号代替表示为向量:Δx、Δy分别表示梯形边框相对于矩形候选区域中心点的横、纵坐标偏移量,Δw、Δh表示梯形边框相对于矩形候选区域宽、高偏移量,θ1、θ2表示梯形边框纵向左、右两条边界与水平线的夹角;根据梯形边框变换参数将矩形候选区域调整为上下两底平行,两腰角度为θ1、θ2的梯形边框;通过这些调整参数,矩形Bounding Box可以灵活表示为梯形的形式,上下两底保证平行,两腰的角度由两个参数θ1和θ2来确定。特殊情况下梯形卷积可变换为平行四边形卷积(θ1=θ2)或者常规的矩形框卷积(θ1=θ2=90°)。变换示意图如图2。神经网络结构不限,在本实施例中采用卷积+ReLU激活+卷积+ReLU激活+全连接层,最后一层全连接层输出为上述6个所需参数即可。梯形框超出图像的部分的点的值设置为0即可。
D、根据步骤C中调整参数确定四边形形状,将原候选区域Region Proposal中的特征用变换后四边形内对应点的特征代替,进行常规卷积操作,此时已经从传统卷积方法变成了梯形卷积。
D1、假设变换之前Region Proposal的大小为w×h,中心点坐标为(x,y)。则可以得到对应的变换之后对应的区域中心为(x+Δx,y+Δy),下底宽度为w+Δw,高度为h+Δh。
D2、设调整之前某点坐标P为P=(xp,yp),则变换之后的坐标P'可以表示为:P'=(xp',yp');
具体变换公式如式1、2所示:
D3、设输入区域对应的特征谱为f1,变换之后对应的特征谱为f2,卷积核用R表示,则变换之后的卷积如式3所示:
R为常规的3×3卷积核,由于变换之后的点坐标大多数为小数,采用双线性插值获得对应的值。令Q=P'-pn,则双线性插值公式如式4、5所示:
G(q,Q)=max(0,1-|qx-Qx|)·max(0,1-|qy-Qy|) (式4)
其中,q表示矩形候选区域特征f1中所有点;qx、Qx、qy、Qy分别表示点q和Q的横纵坐标。
梯形卷积后的特征谱f2如式6所示:
梯形卷积的反向传播公式可以由步骤D3中的公式推出,如式7所示:
使用式7可以在神经网络中反向传播训练梯形卷积,通过预测几个变换参数得到更贴合不规则形状物体的边界框。
E、变换后的Feature map和传统方式产生的结构一致,后续采用传统方式的池化RoI Pooling、卷积、全连接等方式检测得到对应区域的类别。
Claims (2)
1.一种基于梯形卷积的不规则形状物体检测方法,其特征在于,包括以下步骤:
1)先提取输入图像的特征谱;
2)利用候选区域网络RPN得到初步的矩形候选区域;
3)将矩形候选区域与输入图像的特征谱结合,得到输入图像中矩形候选区域特征后进入形边框调整步骤;
4)梯形边框调整步骤:将矩形候选区域特征f1输入神经网络得到6个输出,作为梯形边框变换参数 Δx、Δy分别表示梯形边框相对于矩形候选区域中心点的横、纵坐标偏移量,Δw、Δh表示梯形边框相对于矩形候选区域宽、高偏移量,θ1、θ2表示梯形边框纵向左、右两条边界与水平线的夹角;根据梯形边框变换参数将矩形候选区域调整为上下两底平行,两腰角度为θ1、θ2的梯形边框;
5)将矩形候选区域特征f1变换为梯形卷积特征谱f2:
坐标P表示变换前矩形候选区域内任一点坐标P=(xp,yp),R卷积核,pn为卷积核R中的点,w(pn)为点pn对应的卷积核的值,P'为变换后的坐标,P'=(xp',yp'), (x,y)为变换前矩形候选区域中心点坐标;其中,Q=P'-pn,函数G(q,Q)=max(0,1-|qx-Qx|)·max(0,1-|qy-Qy|),q表示矩形候选区域特征f1中所有点;qx、Qx、qy、Qy分别表示点q和Q的横纵坐标;
6)将梯形卷积特征谱f2作为检测步骤的输入特征来完成对输入图像的检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910559601.9A CN110334752B (zh) | 2019-06-26 | 2019-06-26 | 一种基于梯形卷积的不规则形状物体检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910559601.9A CN110334752B (zh) | 2019-06-26 | 2019-06-26 | 一种基于梯形卷积的不规则形状物体检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334752A CN110334752A (zh) | 2019-10-15 |
CN110334752B true CN110334752B (zh) | 2022-11-08 |
Family
ID=68142747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910559601.9A Active CN110334752B (zh) | 2019-06-26 | 2019-06-26 | 一种基于梯形卷积的不规则形状物体检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110334752B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738045B (zh) * | 2020-01-19 | 2024-04-19 | 中国科学院上海微系统与信息技术研究所 | 一种图像检测方法、装置、电子设备及存储介质 |
CN112084869B (zh) * | 2020-08-10 | 2023-04-07 | 北京航空航天大学 | 一种基于紧致四边形表示的建筑物目标检测方法 |
CN112270278A (zh) * | 2020-11-02 | 2021-01-26 | 重庆邮电大学 | 一种基于关键点的蓝顶房检测方法 |
WO2022266996A1 (zh) * | 2021-06-25 | 2022-12-29 | 烟台创迹软件有限公司 | 物体检知方法及物体检知装置 |
CN114419215A (zh) * | 2021-12-29 | 2022-04-29 | 网易(杭州)网络有限公司 | 体积云的处理方法、装置和电子设备 |
CN118823586A (zh) * | 2024-08-05 | 2024-10-22 | 宁夏大学 | 一种利用作物表型特征估算酿酒葡萄成熟度的方法及系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5364557A (en) * | 1991-11-27 | 1994-11-15 | Faris Sades M | Aligned cholesteric liquid crystal inks |
CN103077386A (zh) * | 2013-02-06 | 2013-05-01 | 北京中科虹霸科技有限公司 | 一种级联的视频流虹膜图像质量检测方法 |
CN103116746A (zh) * | 2013-03-08 | 2013-05-22 | 中国科学技术大学 | 一种基于多特征融合技术的视频火焰探测方法 |
CN104268591A (zh) * | 2014-09-19 | 2015-01-07 | 海信集团有限公司 | 一种面部关键点检测方法及装置 |
CN105488791A (zh) * | 2015-11-25 | 2016-04-13 | 北京奇虎科技有限公司 | 自然背景中图像边缘的定位方法及装置 |
CN106355188A (zh) * | 2015-07-13 | 2017-01-25 | 阿里巴巴集团控股有限公司 | 图像检测方法及装置 |
CN106971152A (zh) * | 2017-03-16 | 2017-07-21 | 天津大学 | 一种基于航拍图像的检测输电线路中鸟巢的方法 |
CN108875723A (zh) * | 2018-01-03 | 2018-11-23 | 北京旷视科技有限公司 | 对象检测方法、装置和系统及存储介质 |
CN109492416A (zh) * | 2019-01-07 | 2019-03-19 | 南京信息工程大学 | 一种基于安全区域的大数据图像保护方法和系统 |
CN109829398A (zh) * | 2019-01-16 | 2019-05-31 | 北京航空航天大学 | 一种基于三维卷积网络的视频中的目标检测方法 |
CN109846513A (zh) * | 2018-12-18 | 2019-06-07 | 深圳迈瑞生物医疗电子股份有限公司 | 超声成像方法、系统和图像测量方法、处理系统及介质 |
CN109902541A (zh) * | 2017-12-10 | 2019-06-18 | 彼乐智慧科技(北京)有限公司 | 一种图像识别的方法及系统 |
CN109902806A (zh) * | 2019-02-26 | 2019-06-18 | 清华大学 | 基于卷积神经网络的噪声图像目标边界框确定方法 |
CN109919146A (zh) * | 2019-02-02 | 2019-06-21 | 上海兑观信息科技技术有限公司 | 图片文字识别方法、装置及平台 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7386190B2 (en) * | 2004-04-30 | 2008-06-10 | Corel Tw Corp. | Method for image cropping |
-
2019
- 2019-06-26 CN CN201910559601.9A patent/CN110334752B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5364557A (en) * | 1991-11-27 | 1994-11-15 | Faris Sades M | Aligned cholesteric liquid crystal inks |
CN103077386A (zh) * | 2013-02-06 | 2013-05-01 | 北京中科虹霸科技有限公司 | 一种级联的视频流虹膜图像质量检测方法 |
CN103116746A (zh) * | 2013-03-08 | 2013-05-22 | 中国科学技术大学 | 一种基于多特征融合技术的视频火焰探测方法 |
CN104268591A (zh) * | 2014-09-19 | 2015-01-07 | 海信集团有限公司 | 一种面部关键点检测方法及装置 |
CN106355188A (zh) * | 2015-07-13 | 2017-01-25 | 阿里巴巴集团控股有限公司 | 图像检测方法及装置 |
CN105488791A (zh) * | 2015-11-25 | 2016-04-13 | 北京奇虎科技有限公司 | 自然背景中图像边缘的定位方法及装置 |
CN106971152A (zh) * | 2017-03-16 | 2017-07-21 | 天津大学 | 一种基于航拍图像的检测输电线路中鸟巢的方法 |
CN109902541A (zh) * | 2017-12-10 | 2019-06-18 | 彼乐智慧科技(北京)有限公司 | 一种图像识别的方法及系统 |
CN108875723A (zh) * | 2018-01-03 | 2018-11-23 | 北京旷视科技有限公司 | 对象检测方法、装置和系统及存储介质 |
CN109846513A (zh) * | 2018-12-18 | 2019-06-07 | 深圳迈瑞生物医疗电子股份有限公司 | 超声成像方法、系统和图像测量方法、处理系统及介质 |
CN109492416A (zh) * | 2019-01-07 | 2019-03-19 | 南京信息工程大学 | 一种基于安全区域的大数据图像保护方法和系统 |
CN109829398A (zh) * | 2019-01-16 | 2019-05-31 | 北京航空航天大学 | 一种基于三维卷积网络的视频中的目标检测方法 |
CN109919146A (zh) * | 2019-02-02 | 2019-06-21 | 上海兑观信息科技技术有限公司 | 图片文字识别方法、装置及平台 |
CN109902806A (zh) * | 2019-02-26 | 2019-06-18 | 清华大学 | 基于卷积神经网络的噪声图像目标边界框确定方法 |
Non-Patent Citations (5)
Title |
---|
Blind image quality assessment based on multi-channel features fusion and label transfer;Qingbo Wu;《IEEE Transactions on Circuits and Systems for Video Technology》;20151231;全文 * |
基于图像分割的目标尺寸特征测量;王颖等;《计算机技术与发展》;20171115(第02期);第197-201页 * |
基于深度学习的不规则特征识别检测技术;赵欣洋等;《轻工机械》;20190613(第03期);第65-70页 * |
水泥混凝土路面错台三维检测方法;孙朝云等;《长安大学学报(自然科学版)》;20160315(第02期);第5-12页 * |
高效视频编码及其感知质量评价理论与方法研究;吴庆波;《中国博士学位论文全文数据库 信息科技辑》;20160715;I136-53 * |
Also Published As
Publication number | Publication date |
---|---|
CN110334752A (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334752B (zh) | 一种基于梯形卷积的不规则形状物体检测方法 | |
CN109741356B (zh) | 一种亚像素边缘检测方法及系统 | |
CN108416753B (zh) | 一种基于非参数化交替方向乘子法的图像去噪算法 | |
CN116681636B (zh) | 基于卷积神经网络的轻量化红外与可见光图像融合方法 | |
CN102298773B (zh) | 一种形状自适应的非局部均值去噪方法 | |
CN103810739A (zh) | 一种图像文字变形动画的生成方法 | |
US8208757B2 (en) | Recognition system, recognition method, and recognition program | |
CN107909081A (zh) | 一种深度学习中图像数据集的快速获取和快速标定方法 | |
CN110400278A (zh) | 一种图像颜色和几何畸变的全自动校正方法、装置及设备 | |
CN106408597A (zh) | 基于邻域熵和一致性检测的sar图像配准方法 | |
CN111046923B (zh) | 一种基于边界框的图像目标检测方法、装置及存储介质 | |
CN110427997B (zh) | 面向复杂遥感影像背景的改进cva变化检测方法 | |
CN105631872B (zh) | 基于多特征点的遥感图像配准方法 | |
CN108959379A (zh) | 一种基于视觉显著区域和手绘草图的服装图像检索方法 | |
CN101976361A (zh) | 一种用于遥感影像的多核支持向量机分类方法 | |
CN104598929A (zh) | 一种hog特征快速提取方法 | |
CN103530645A (zh) | 基于局部二值模式和Zernike矩的纹理图像分类方法及系统 | |
CN108764235A (zh) | 神经网络模型、目标检测方法、设备及介质 | |
CN107301643A (zh) | 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法 | |
CN110569884A (zh) | 基于深度学习和形态学的高光谱遥感影像分类方法 | |
CN112801141A (zh) | 基于模板匹配和孪生神经网络优化的异源图像匹配方法 | |
CN103854254A (zh) | 一种基于自回归模型的任意比例图像插值方法 | |
CN102521591B (zh) | 一种复杂背景下小目标快速识别方法 | |
Zhang et al. | CatmullRom Splines-Based Regression for Image Forgery Localization | |
KR101334794B1 (ko) | 특징정보를 이용하는 꽃 인식 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |