Nothing Special   »   [go: up one dir, main page]

CN105389593A - 基于surf特征的图像物体识别方法 - Google Patents

基于surf特征的图像物体识别方法 Download PDF

Info

Publication number
CN105389593A
CN105389593A CN201510785408.9A CN201510785408A CN105389593A CN 105389593 A CN105389593 A CN 105389593A CN 201510785408 A CN201510785408 A CN 201510785408A CN 105389593 A CN105389593 A CN 105389593A
Authority
CN
China
Prior art keywords
sample
feature
tested
image
visual vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510785408.9A
Other languages
English (en)
Other versions
CN105389593B (zh
Inventor
蒋兴浩
孙锬锋
许可
姜华
郑辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DIGITAL CHINA (SHANGHAI) HOLDINGS Ltd
Shanghai Jiaotong University
Original Assignee
DIGITAL CHINA (SHANGHAI) HOLDINGS Ltd
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DIGITAL CHINA (SHANGHAI) HOLDINGS Ltd, Shanghai Jiaotong University filed Critical DIGITAL CHINA (SHANGHAI) HOLDINGS Ltd
Priority to CN201510785408.9A priority Critical patent/CN105389593B/zh
Publication of CN105389593A publication Critical patent/CN105389593A/zh
Application granted granted Critical
Publication of CN105389593B publication Critical patent/CN105389593B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于SURF特征的图像物体识别方法,首先对图像进行预处理,然后对图像提取SURF角点和SURF描述子描述图像特征,再通过PCA数据白化、降维对特征进行处理,处理后的特征通过Kmeans聚类建立词袋模型,利用词袋模型构建图像的视觉词汇直方图,最后利用非线性的支持向量机(SVM)分类方法进行训练,并完成对图像不同类别的划分。在训练阶段不同图像的分类模型建模完成以后,在测试阶段对测试集中的图像进行检测,实现了对不同图像物体识别的功能。本发明在识别率和速度上都具有优异性能,使之更为客观准确地反映出图像的内容,此外还对SVM分类器的分类结果进行优化,降低了分类器判断的错误率和训练样本类别的局限性。

Description

基于SURF特征的图像物体识别方法
技术领域
本发明涉及图像物体识别领域,具体地,涉及一种基于SURF(SpeedUpRobustFeature)特征和词袋模型的图像物体识别方法。
背景技术
图像识别和分类技术是计算机视觉和模式识别领域的一个重要的应用,在机械工业、物流运输、零售等行业,精确的图像物体识别技术可以将人们从繁重的劳动中解放出来,降低生产成本,提高工作效率。在日常生活中,人们可以快速准确的抓住物体的特征并识别物体,但对于计算机来说,自动识别物体却有着不小的困难。其原因在于图像中的物体受到拍摄角度、旋转变化、光照变化、尺度变化、拍摄质量等因素的影响。
现有的针对这些困难的解决方法是结合使用局部特征点、词袋模型以及分类器的方法。这种方法在一定程度上解决了物体识别的问题,但是其中带来的特征维数高,计算量大,不能满足实时性、且词袋模型效果不好。
经过检索发现,专利申请号:CN201210196526.2,名称为“基于SURF高效匹配核的人体检测方法”中提出:在不同图像尺度下提取SURF描述子特征点,随机采样提取特征点构成视觉词汇的初始向量基,对初始向量基使用带约束的奇异值分解获得最大核函数特征,对不同图像尺度下的最大核函数特征进行加权获得所有图像尺度下的特征,对得到的特征利用SVM(SupportVectorMachine支持向量机)分类器进行分类训练,最后得到检测分类器。该专利文献中计算多尺度的SURF特征,计算量大,且直接使用奇异值分解分解构建词典,对特征没有进一步的处理。
由刘鹏、叶志鹏、赵巍等在自动化学报2015,41(5):960-969发表的“一种多层次抽象语义决策图像分类方法”一文中提到了使用视觉词包(Bag-of-visual-words,BoVW词袋模型)模型生成视觉词典的建模方法。由袁安富、曹金燕、余莉在计算机应用与软件2015,32:186-189发表的“一种基于SURF特征的零件识别算法”一文中使用了SURF(SpeedUpRobustFeature)特征和ANN(ApproximateNearestNeighbor)近似最近邻算法识别零件的方法。本发明结合了以上两种方法的优势,并采取了神经网络领域的白化降维方法,对SURF特征与词袋模型的结合进行了改进与创新。
本发明中的方法没有采用多尺度训练,直接对图像进行去噪、尺寸归一化和中心裁剪预处理,利用PCA(PrincipalComponentsAnalysis)白化和降维对数据进行处理后使用Kmeans构建词袋模型,提高了训练和分类的速度,使视觉词汇之间稀疏性更强,得到了更好的分类效果。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于SURF特征的图像物体识别方法。
根据本发明提供的基于SURF特征的图像物体识别方法,包括如下步骤:
步骤a:对图像进行预处理,提取预处理后图像的局部兴趣点特征,将局部兴趣点特征进行聚类,根据聚类中心的结果建立词袋模型,通过词袋模型建立视觉词汇直方图得到图像的视觉词汇直方图特征;
步骤1:对每个训练样本进行类标签的标记,通过对带有类标签的所述训练样本执行步骤a的操作后得到所述训练样本的视觉词汇直方图特征,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过核函数将词汇直方图特征映射到特征空间,并在该核函数映射的特征空间中得到最优分类超平面;
步骤2:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间,在该特征空间中判断该待测样本的视觉词汇直方图特征位于训练完成的SVM分类器的最优分类超平面的哪一侧,统计待测样本属于某个类别的概率,确定所述待测样本所属的类别;
步骤3:对SVM分类器的分类结果进行矫正。
优选地,所述步骤a包括:
步骤a1:对图像进行预处理,即使用3*3的高斯卷积模板对图像进行高斯滤波,将图像尺寸归一化为512*512,并将图像做中心裁剪裁掉边缘的12*12像素;
步骤a2:使用OpenCV开源库函数中的类SurfFeatureDetector中的detect方法检测图像中的SURF快速鲁棒特征兴趣点,和类SurfDescriptorExtractor中的compute方法计算每个兴趣点的SURF描述特征矢量;
步骤a3:对特征矢量进行PCA主成分分析及白化处理,消除特征矢量之间的相关性,并对白化后的特征矢量进行降维处理;
步骤a4:使用Kmeans聚类方法对降维过的兴趣点特征进行聚类,设置K个聚类中心,聚类后使用这K个聚类中心作为视觉词汇建立词袋模型BOVW,即所述词袋模型BOVW中包含了K个视觉词汇;计算图像中的每个兴趣点与词袋模型中词汇的欧氏距离,确定兴趣点属于哪一类视觉词汇,并统计图像中每类视觉词汇出现的次数,建立图像的视觉词汇直方图作为整幅图像的内容表征。
优选地,所述步骤1包括:
步骤1.1:将需要分类的n种训练样本类别按照两两组合分成个分类器;
步骤1.2:每个训练样本进行步骤a的处理后得到对应训练样本的视觉词汇直方图特征,将训练样本的视觉词汇直方图特征和所述训练样本的类标签进行关联;
步骤1.3:选择高斯核函数进行非线性可分特征的映射分类,调整支持向量机SVM分类器和核函数的参数,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过高斯核函数将词汇直方图特征映射到特征空间,并在该高斯核函数映射的特征空间中得到最优分类超平面,该最优分类超平面将不同类标签的训练样本区分开来;其中,选择的高斯核函数如下:
K ( x , y ) = exp ( - x - y 2 2 σ 2 ) ;
式中:K(x,y)表示内积函数,x表示高维空间中的一个向量,y表示高维空间中的另一个向量,σ表示尺度参数。
优选地,所述步骤2包括:
步骤2.1:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间;
步骤2.2:在所述特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧;i类、j类训练样本构成的分类器记为SVMi,j,其中i,j∈(1,n),i、j分别表示两种不同类别的训练样本,n表示训练样本的种类数;若分类器的分类结果为i,则测试样本属于i类,i类投票加1;若分类器的分类结果为j,则测试样本属于j类,j类投票加1;
步骤2.3:统计待测样本属于某个类别的概率,确定所述待测样本所属的类别。
优选地,所述步骤3包括:当待测样本属于各个类别的概率均不超过0.5时,将该待测样本定义为无法判别的类别,用于对SVM分类器的分类结果进行矫正。
优选地,所述步骤2.2中的在特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧的判定公式如下:
S ( F j ) = sgn ( &Sigma; i = 1 N &alpha; i K ( F i , F j ) - b ) = 1 , S ( F j ) &GreaterEqual; 0 - 1 , S ( F j ) < 0 ;
式中:S(Fj)表示第j个待测样本的判定结果,sgn(·)表示符号函数运算(如果数字大于0,则Sgn返回1,数字等于0,则返回0,数字小于0,则返回-1),αi表示第i个训练样本的拉格朗日乘子,b为最优分类超平面的参数,K(Fi,Fj)表示高斯核函数,Fi表示样本空间中第i个训练样本的直方图特征,Fj表示第j个待测样本的直方图特征,N为样本空间中的样本总数;S(Fj)为+1时,表示第j个待测样本属于正样本类,S(Fj)为-1时,则表示第j个待测样本属于负样本类。
与现有技术相比,本发明具有如下的有益效果:
1、本发明首先对图像进行去噪、尺寸归一化、中心修剪的预处理,然后对图像提取SURF角点和SURF描述子描述图像特征,再通过PCA数据白化、降维对特征进行处理,处理后的特征通过Kmeans聚类建立词袋模型,利用词袋模型构建图像的视觉词汇直方图,最后利用非线性的支持向量机(SVM)分类方法进行训练,并完成对图像不同类别的划分,在训练阶段不同图像的分类模型建模完成以后,在测试阶段对测试集中的图像进行检测,实现了对不同图像物体识别的功能。
2、本发明中的基于SURF特征和词袋模型的分类框架在识别率和速度上都具有优异性能,使之更为客观准确地反映出图像的内容。
3、本发明还对SVM分类器的分类结果进行优化,认为分类后属于每类的概率都不超过0.5的图像属于无法判断类别,降低了分类器判断的错误率和训练样本类别的局限性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明提供的基于SURF特征的图像物体识别方法的处理流程图;
图2为本发明中对特征数据的白化与降维处理的流程图;
图3为本发明的词袋模型构建和词汇直方图构建的流程图;
图4为本发明的多类SVM组织结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本发明提供了一种基于SURF特征的图像物体识别方法,首先对图像进行去噪、尺寸归一化、中心修剪的预处理,然后对图像提取SURF角点和SURF描述子描述图像特征,再通过PCA数据白化、降维对特征进行处理,处理后的特征通过Kmeans聚类建立词袋模型,最后利用非线性的支持向量机(SVM)分类方法进行训练,并完成对图像不同类别的划分,在训练阶段不同图像的分类模型建模完成以后,在测试阶段对测试集中的图像进行检测,实现了对不同图像物体识别的功能
具体地,根据本发明提供的基于SURF特征的图像物体识别方法,包括如下步骤:
步骤a:对图像进行预处理,提取预处理后图像的局部兴趣点特征,将局部兴趣点特征进行聚类,根据聚类中心的结果建立词袋模型,通过词袋模型建立视觉词汇直方图得到图像的视觉词汇直方图特征;
步骤1:对每个训练样本进行类标签的标记,通过对带有类标签的所述训练样本执行步骤a的操作后得到所述训练样本的视觉词汇直方图特征,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过核函数将词汇直方图特征映射到特征空间,并在该核函数映射的特征空间中得到最优分类超平面;
步骤2:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间,在该特征空间中判断该待测样本的视觉词汇直方图特征位于训练完成的SVM分类器的最优分类超平面的哪一侧,统计待测样本属于某个类别的概率,确定所述待测样本所属的类别;
步骤3:对SVM分类器的分类结果进行矫正。
所述步骤a包括:
步骤a1:对图像进行预处理,即使用3*3的高斯卷积模板对图像进行高斯滤波,将图像尺寸归一化为512*512,并将图像做中心裁剪裁掉边缘的12*12像素;
步骤a2:使用OpenCV开源库函数中的类SurfFeatureDetector中的detect方法检测图像中的SURF快速鲁棒特征兴趣点,和类SurfDescriptorExtractor中的compute方法计算每个兴趣点的SURF描述特征矢量;
步骤a3:对特征矢量进行PCA主成分分析及白化处理,消除特征矢量之间的相关性,并对白化后的特征矢量进行降维处理;
步骤a4:使用Kmeans聚类方法对降维过的兴趣点特征进行聚类,设置K个聚类中心,聚类后使用这K个聚类中心作为视觉词汇建立词袋模型BOVW,即所述词袋模型BOVW中包含了K个视觉词汇;计算图像中的每个兴趣点与词袋模型中词汇的欧氏距离,确定兴趣点属于哪一类视觉词汇,并统计图像中每类视觉词汇出现的次数,建立图像的视觉词汇直方图作为整幅图像的内容表征。
所述步骤1包括:
步骤1.1:将需要分类的n种训练样本类别按照两两组合分成个分类器;
步骤1.2:每个训练样本进行步骤a的处理后得到对应训练样本的视觉词汇直方图特征,将训练样本的视觉词汇直方图特征和所述训练样本的类标签进行关联;
步骤1.3:选择高斯核函数进行非线性可分特征的映射分类,调整支持向量机SVM分类器和核函数的参数,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过高斯核函数将词汇直方图特征映射到特征空间,并在该高斯核函数映射的特征空间中得到最优分类超平面,该最优分类超平面将不同类标签的训练样本区分开来;其中,选择的高斯核函数如下:
K ( x , y ) = exp ( - x - y 2 2 &sigma; 2 ) ;
式中:K(x,y)表示内积函数,x表示高维空间中的一个向量,y表示高维空间中的另一个向量,σ表示尺度参数。
所述步骤2包括:
步骤2.1:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间;
步骤2.2:在所述特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧;i类、j类训练样本构成的分类器记为SVMi,j,其中i,j∈(1,n),i、j分别表示两种不同类别的训练样本,n表示训练样本的种类数;若分类器的分类结果为i,则测试样本属于i类,i类投票加1;若分类器的分类结果为j,则测试样本属于j类,j类投票加1;
步骤2.3:统计待测样本属于某个类别的概率,确定所述待测样本所属的类别。
所述步骤3包括:当待测样本属于各个类别的概率均不超过0.5时,将该待测样本定义为无法判别的类别,用于对SVM分类器的分类结果进行矫正。
所述步骤2.2中的在特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧的判定公式如下:
S ( F j ) = sgn ( &Sigma; i = 1 N &alpha; i K ( F i , F j ) - b ) = 1 , S ( F j ) &GreaterEqual; 0 - 1 , S ( F j ) < 0 ;
式中:S(Fj)表示第j个待测样本的判定结果,sgn(·)表示符号函数运算(如果数字大于0,则Sgn返回1,数字等于0,则返回0,数字小于0,则返回-1),αi表示第i个训练样本的拉格朗日乘子,b为最优分类超平面的参数,K(Fi,Fj)表示高斯核函数,Fi表示样本空间中第i个训练样本的直方图特征,Fj表示第j个待测样本的直方图特征,N为样本空间中的样本总数;S(Fj)为+1时,表示第j个待测样本属于正样本类,S(Fj)为-1时,则表示第j个待测样本属于负样本类。
更为具体地,如图1所示,本发明中的方法可分为图像预处理、特征提取、数据处理、构建词袋模型及视觉词汇直方图、组织SVM训练结构几个步骤。
一、图像预处理
图像预处理阶段,使用3*3的高斯卷积模板对图像进行高斯滤波,然后将图像尺寸归一化为512*512大小,最后将图像做中心裁剪,即裁掉边缘的12*12像素,这是由于拍摄者拍摄时主要角点在图像的中心部分,但边缘部分可能拍摄到一些干扰的物品,预处理后识别率明显提升。
二、特征提取
在特征提取阶段,使用OpenCV开源库函数中的类SurfFeatureDetector中的detect方法检测图像中的SURF角点,和类SurfDescriptorExtractor中的compute方法计算每个角点的特征。其原理是利用Hessian矩阵行列式的极大值检测角点,其中Hessian矩阵H(x,σ)定义如下:
H ( x , &sigma; ) = L x x ( X , &sigma; ) L x y ( X , &sigma; ) L x y ( X , &sigma; ) L y y ( X , &sigma; ) ;
式中:Lxx(X,σ)表示高斯二阶微分与图像I的卷积;Lyy(X,σ)表示高斯二阶微分与图像I的卷积;Lxy(X,σ)表示高斯二阶微分与图像I的卷积。利用高斯二阶微分与图像I的卷积结果(结果依次记为:Dxx,Dxy,Dyy)的近似二阶微分,计算得到Hessian矩阵行列式,计算公式如下:
Det(H)=DxxDyy-(0.9Dxy)2
即图像I上的每个点(x,y)的响应值计算公式为:
Det(H(x,y))=Dxx(x,y)Dyy(x,y)-(0.9Dxy(x,y))2
计算特征时在一个矩形区域来计算Haar小波响应,以特征点为中心,以20s为边长的矩形窗口为特征描述子计算使用的窗口,统计∑dx、∑|dx|、∑dy、∑|dy|形成的特征矢量。
三、数据处理
在数据处理阶段,首先对特征向量进行PCA白化处理,消除数据之间的相关性,这样就消除了建立词袋模型时训练出的视觉词汇之间的相关性。然后对白化后的特征向量进行降维,本发明中由64维降到32维,提高了训练和分类的速度,并且在识别准确率和误检率上与降维前几乎没有变化。
其原理是通过计算协方差矩阵,计算公式如下:
cov ( X , Y ) = &Sigma; i = 1 n ( X i - X &OverBar; ) ( Y i - Y &OverBar; ) n - 1 ;
再通过奇异值分解计算协方差矩阵的特征值,由大到小排列,再选择前n个特征值对应的特征矢量构成一个变换矩阵,最后,对于之前每一个n维的特征矢量x可以转换为n’维的新特征矢量z。
白化是指将数据x经过PCA降维为z后,可以看出z中每一维是独立的,满足白化条件,只需要将z中的每一维都除以标准差就可以。计算公式如下:
Z P C A , i = z r o t , i &lambda; i
式中:ZPCA,i表示白化后的第i个特征向量,zrot,i表示原始第i个特征向量,σ表示标准差。
四、构建词袋模型及视觉词汇直方图
在构建词袋模型及视觉词汇直方图阶段,首先使用Kmeans聚类算法对样本特征进行聚类,构建视觉词汇,本发明中聚类中心数量为200,然后利用视觉词汇构建每张图片的视觉直方图,构成200维的训练样本。
五、组织SVM训练结构
将所要分类的n种样本类别按照两两组合分成个分类器,根据训练阶段训练完成的最优分类超平面进行样本特征类标签的判定,若分类器SVMi,j其中i,j∈(1,n)的分类结果为i,则图像属于i类投票加一,若分类结果为j,则图像属于j类投票加一。这样统计所有分类器的投票结果,根据结果计算测试图像属于某类的概率。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (6)

1.一种基于SURF特征的图像物体识别方法,其特征在于,包括如下步骤:
步骤a:对图像进行预处理,提取预处理后图像的局部兴趣点特征,将局部兴趣点特征进行聚类,根据聚类中心的结果建立词袋模型,通过词袋模型建立视觉词汇直方图得到图像的视觉词汇直方图特征;
步骤1:对每个训练样本进行类标签的标记,通过对带有类标签的所述训练样本执行步骤a的操作后得到所述训练样本的视觉词汇直方图特征,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过核函数将词汇直方图特征映射到特征空间,并在该核函数映射的特征空间中得到最优分类超平面;
步骤2:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间,在该特征空间中判断该待测样本的视觉词汇直方图特征位于训练完成的SVM分类器的最优分类超平面的哪一侧,统计待测样本属于某个类别的概率,确定所述待测样本所属的类别;
步骤3:对SVM分类器的分类结果进行矫正。
2.根据权利要求1所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤a包括:
步骤a1:对图像进行预处理,即使用3*3的高斯卷积模板对图像进行高斯滤波,将图像尺寸归一化为512*512,并将图像做中心裁剪裁掉边缘的12*12像素;
步骤a2:使用OpenCV开源库函数中的类SurfFeatureDetector中的detect方法检测图像中的SURF快速鲁棒特征兴趣点,和类SurfDescriptorExtractor中的compute方法计算每个兴趣点的SURF描述特征矢量;
步骤a3:对特征矢量进行PCA主成分分析及白化处理,消除特征矢量之间的相关性,并对白化后的特征矢量进行降维处理;
步骤a4:使用Kmeans聚类方法对降维过的兴趣点特征进行聚类,设置K个聚类中心,聚类后使用这K个聚类中心作为视觉词汇建立词袋模型BOVW,即所述词袋模型BOVW中包含了K个视觉词汇;计算图像中的每个兴趣点与词袋模型中词汇的欧氏距离,确定兴趣点属于哪一类视觉词汇,并统计图像中每类视觉词汇出现的次数,建立图像的视觉词汇直方图作为整幅图像的内容表征。
3.根据权利要求1所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤1包括:
步骤1.1:将需要分类的n种训练样本类别按照两两组合分成个分类器;
步骤1.2:每个训练样本进行步骤a的处理后得到对应训练样本的视觉词汇直方图特征,将训练样本的视觉词汇直方图特征和所述训练样本的类标签进行关联;
步骤1.3:选择高斯核函数进行非线性可分特征的映射分类,调整支持向量机SVM分类器和核函数的参数,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过高斯核函数将词汇直方图特征映射到特征空间,并在该高斯核函数映射的特征空间中得到最优分类超平面,该最优分类超平面将不同类标签的训练样本区分开来;其中,选择的高斯核函数如下:
K ( x , y ) = exp ( - x - y 2 2 &sigma; 2 ) ;
式中:K(x,y)表示内积函数,x表示高维空间中的一个向量,y表示高维空间中的另一个向量,σ表示尺度参数。
4.根据权利要求1所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤2包括:
步骤2.1:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间;
步骤2.2:在所述特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧;i类、j类训练样本构成的分类器记为SVMi,j,其中i,j∈(1,n),i、j分别表示两种不同类别的训练样本,n表示训练样本的种类数;若分类器的分类结果为i,则测试样本属于i类,i类投票加1;若分类器的分类结果为j,则测试样本属于j类,j类投票加1;
步骤2.3:统计待测样本属于某个类别的概率,确定所述待测样本所属的类别。
5.根据权利要求1所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤3包括:当待测样本属于各个类别的概率均不超过0.5时,将该待测样本定义为无法判别的类别,用于对SVM分类器的分类结果进行矫正。
6.根据权利要求4所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤2.2中的在特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧的判定公式如下:
S ( F j ) = sgn ( &Sigma; i = 1 N &alpha; i K ( F i , F j ) - b ) = 1 , S ( F j ) &GreaterEqual; 0 - 1 , S ( F j ) < 0 ;
式中:S(Fj)表示第j个待测样本的判定结果,sgn(·)表示符号函数运算,αi表示第i个训练样本的拉格朗日乘子,b为最优分类超平面的参数,K(Fi,Fj)表示高斯核函数,Fi表示样本空间中第i个训练样本的直方图特征,Fj表示第j个待测样本的直方图特征,N为样本空间中的样本总数;S(Fj)为+1时,表示第j个待测样本属于正样本类,S(Fj)为-1时,则表示第j个待测样本属于负样本类。
CN201510785408.9A 2015-11-16 2015-11-16 基于surf特征的图像物体识别方法 Active CN105389593B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510785408.9A CN105389593B (zh) 2015-11-16 2015-11-16 基于surf特征的图像物体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510785408.9A CN105389593B (zh) 2015-11-16 2015-11-16 基于surf特征的图像物体识别方法

Publications (2)

Publication Number Publication Date
CN105389593A true CN105389593A (zh) 2016-03-09
CN105389593B CN105389593B (zh) 2019-01-11

Family

ID=55421863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510785408.9A Active CN105389593B (zh) 2015-11-16 2015-11-16 基于surf特征的图像物体识别方法

Country Status (1)

Country Link
CN (1) CN105389593B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529600A (zh) * 2016-11-16 2017-03-22 桂林理工大学 一种基于svm的高分辨率光学影像建筑物角点识别方法
CN106529427A (zh) * 2016-10-24 2017-03-22 合肥华凌股份有限公司 图像中目标物体识别方法、冰箱内食品识别方法及系统
CN106845534A (zh) * 2017-01-05 2017-06-13 北京大学深圳研究生院 一种基于数据压缩表示的支持向量机快速实现方法和装置
CN106980852A (zh) * 2017-03-22 2017-07-25 嘉兴闻达信息科技有限公司 基于角点检测与匹配的药品识别系统及其识别方法
CN107122801A (zh) * 2017-05-02 2017-09-01 北京小米移动软件有限公司 图像分类的方法和装置
CN107193965A (zh) * 2017-05-24 2017-09-22 哈尔滨工业大学 一种基于BoVW算法的快速室内定位方法
CN107240112A (zh) * 2017-06-28 2017-10-10 北京航空航天大学 一种复杂场景下个体x角点提取方法
CN107423768A (zh) * 2017-08-02 2017-12-01 上海应用技术大学 基于surf和pca结合的图像哈希序列生成方法
CN107480682A (zh) * 2017-08-25 2017-12-15 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN108268896A (zh) * 2018-01-18 2018-07-10 天津市国瑞数码安全系统股份有限公司 基于hsv与surf特征相结合的敏感图像识别方法
CN108304754A (zh) * 2017-03-02 2018-07-20 腾讯科技(深圳)有限公司 车型的识别方法和装置
CN108427955A (zh) * 2017-10-27 2018-08-21 平安科技(深圳)有限公司 电子装置、混乱样本整理方法和计算机可读存储介质
CN108564111A (zh) * 2018-03-26 2018-09-21 太原理工大学 一种基于邻域粗糙集特征选择的图像分类方法
CN108921006A (zh) * 2018-05-03 2018-11-30 西北大学 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法
CN109029450A (zh) * 2018-06-26 2018-12-18 重庆市勘测院 一种室内定位方法
CN109271542A (zh) * 2018-09-28 2019-01-25 百度在线网络技术(北京)有限公司 封面确定方法、装置、设备及可读存储介质
CN109445453A (zh) * 2018-09-12 2019-03-08 湖南农业大学 一种基于OpenCV的无人机实时压缩跟踪方法
CN110225239A (zh) * 2018-03-02 2019-09-10 佳能株式会社 电子设备及其控制方法和存储介质
CN111310712A (zh) * 2020-03-04 2020-06-19 杭州晟元数据安全技术股份有限公司 一种基于指纹词袋特征的快速搜索方法
CN112613563A (zh) * 2020-12-25 2021-04-06 福建福清核电有限公司 一种基于OpenCV的核电现场设备图像分类方法
CN112633296A (zh) * 2020-12-28 2021-04-09 常州微亿智造科技有限公司 一种基于聚类分析的视觉工业零部件明暗等级划分方法
CN113343550A (zh) * 2021-06-09 2021-09-03 上海交通大学 基于局部图像特征的局部放电故障的诊断方法
CN113657511A (zh) * 2021-02-02 2021-11-16 哈尔滨商业大学 一种商品图像特征描述方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008095A (zh) * 2013-02-25 2014-08-27 武汉三际物联网络科技有限公司 一种基于语义特征提取与匹配的物体识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008095A (zh) * 2013-02-25 2014-08-27 武汉三际物联网络科技有限公司 一种基于语义特征提取与匹配的物体识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘鹏 等: "一种多层次抽象语义决策图像分类方法", 《自动化学报》 *
袁安富 等: "一种基于SURF特征的零件识别算法", 《计算机应用与软件》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018077121A1 (zh) * 2016-10-24 2018-05-03 合肥美的智能科技有限公司 图像中目标物体识别方法、冰箱内食品识别方法及系统
CN106529427A (zh) * 2016-10-24 2017-03-22 合肥华凌股份有限公司 图像中目标物体识别方法、冰箱内食品识别方法及系统
CN106529600B (zh) * 2016-11-16 2019-06-04 桂林理工大学 一种基于svm的高分辨率光学影像建筑物角点识别方法
CN106529600A (zh) * 2016-11-16 2017-03-22 桂林理工大学 一种基于svm的高分辨率光学影像建筑物角点识别方法
CN106845534A (zh) * 2017-01-05 2017-06-13 北京大学深圳研究生院 一种基于数据压缩表示的支持向量机快速实现方法和装置
WO2018157862A1 (zh) * 2017-03-02 2018-09-07 腾讯科技(深圳)有限公司 车型的识别方法和装置、存储介质、电子装置
CN108304754A (zh) * 2017-03-02 2018-07-20 腾讯科技(深圳)有限公司 车型的识别方法和装置
CN106980852A (zh) * 2017-03-22 2017-07-25 嘉兴闻达信息科技有限公司 基于角点检测与匹配的药品识别系统及其识别方法
CN107122801B (zh) * 2017-05-02 2020-03-03 北京小米移动软件有限公司 图像分类的方法和装置
CN107122801A (zh) * 2017-05-02 2017-09-01 北京小米移动软件有限公司 图像分类的方法和装置
CN107193965B (zh) * 2017-05-24 2020-08-25 哈尔滨工业大学 一种基于BoVW算法的快速室内定位方法
CN107193965A (zh) * 2017-05-24 2017-09-22 哈尔滨工业大学 一种基于BoVW算法的快速室内定位方法
CN107240112A (zh) * 2017-06-28 2017-10-10 北京航空航天大学 一种复杂场景下个体x角点提取方法
CN107423768A (zh) * 2017-08-02 2017-12-01 上海应用技术大学 基于surf和pca结合的图像哈希序列生成方法
CN107480682A (zh) * 2017-08-25 2017-12-15 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN107480682B (zh) * 2017-08-25 2020-01-17 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN108427955B (zh) * 2017-10-27 2022-02-01 平安科技(深圳)有限公司 电子装置、混乱样本整理方法和计算机可读存储介质
CN108427955A (zh) * 2017-10-27 2018-08-21 平安科技(深圳)有限公司 电子装置、混乱样本整理方法和计算机可读存储介质
CN108268896A (zh) * 2018-01-18 2018-07-10 天津市国瑞数码安全系统股份有限公司 基于hsv与surf特征相结合的敏感图像识别方法
US10986409B2 (en) 2018-03-02 2021-04-20 Canon Kabushiki Kaisha Electronic apparatus enabling a user to recognize gradation of a raw image with high accuracy by checking the displayed raw histogram
CN110225239B (zh) * 2018-03-02 2021-11-16 佳能株式会社 电子设备及其控制方法和存储介质
CN110225239A (zh) * 2018-03-02 2019-09-10 佳能株式会社 电子设备及其控制方法和存储介质
CN108564111A (zh) * 2018-03-26 2018-09-21 太原理工大学 一种基于邻域粗糙集特征选择的图像分类方法
CN108921006B (zh) * 2018-05-03 2020-08-04 西北大学 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法
CN108921006A (zh) * 2018-05-03 2018-11-30 西北大学 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法
CN109029450A (zh) * 2018-06-26 2018-12-18 重庆市勘测院 一种室内定位方法
CN109445453A (zh) * 2018-09-12 2019-03-08 湖南农业大学 一种基于OpenCV的无人机实时压缩跟踪方法
CN109271542A (zh) * 2018-09-28 2019-01-25 百度在线网络技术(北京)有限公司 封面确定方法、装置、设备及可读存储介质
CN111310712A (zh) * 2020-03-04 2020-06-19 杭州晟元数据安全技术股份有限公司 一种基于指纹词袋特征的快速搜索方法
CN111310712B (zh) * 2020-03-04 2024-02-13 杭州晟元数据安全技术股份有限公司 一种基于指纹词袋特征的快速搜索方法
CN112613563A (zh) * 2020-12-25 2021-04-06 福建福清核电有限公司 一种基于OpenCV的核电现场设备图像分类方法
CN112633296A (zh) * 2020-12-28 2021-04-09 常州微亿智造科技有限公司 一种基于聚类分析的视觉工业零部件明暗等级划分方法
CN113657511A (zh) * 2021-02-02 2021-11-16 哈尔滨商业大学 一种商品图像特征描述方法
CN113657511B (zh) * 2021-02-02 2022-10-28 哈尔滨商业大学 一种商品图像特征描述方法
CN113343550A (zh) * 2021-06-09 2021-09-03 上海交通大学 基于局部图像特征的局部放电故障的诊断方法

Also Published As

Publication number Publication date
CN105389593B (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN105389593A (zh) 基于surf特征的图像物体识别方法
Liao et al. Textboxes: A fast text detector with a single deep neural network
Shahab et al. ICDAR 2011 robust reading competition challenge 2: Reading text in scene images
CN111414862B (zh) 基于神经网络融合关键点角度变化的表情识别方法
CN108664996A (zh) 一种基于深度学习的古文字识别方法及系统
CN102156885B (zh) 基于级联式码本生成的图像分类方法
CN102163281B (zh) 基于AdaBoost框架和头部颜色的实时人体检测方法
CN102156871B (zh) 基于类别相关的码本和分类器投票策略的图像分类方法
CN111126240B (zh) 一种三通道特征融合人脸识别方法
CN102663401B (zh) 一种图像特征提取和描述方法
CN102208038A (zh) 基于视觉词典的图像分类方法
CN104504383B (zh) 一种基于肤色和Adaboost算法的人脸检测方法
CN109376717A (zh) 人脸对比的身份识别方法、装置、电子设备及存储介质
Minetto et al. Snoopertext: A multiresolution system for text detection in complex visual scenes
CN105184266A (zh) 一种手指静脉图像识别方法
CN112101542A (zh) 机器学习模型的训练方法、装置、人脸的识别方法和装置
CN104156690A (zh) 一种基于图像空间金字塔特征包的手势识别方法
CN104978569A (zh) 一种基于稀疏表示的增量人脸识别方法
CN102298703B (zh) 一种基于投影残差的分类方法
CN101996326A (zh) 多类目标的检测装置及检测方法
CN103942572A (zh) 一种基于双向压缩数据空间维度缩减的面部表情特征提取方法和装置
CN107103289B (zh) 利用笔迹轮廓特征来进行笔迹鉴别的方法及系统
CN112016425B (zh) 一种基于深度学习的手写答案识别方法和系统
CN106326927B (zh) 一种鞋印新类别检测方法
Ali et al. A new design based-fusion of features to recognize Arabic handwritten characters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant