Nothing Special   »   [go: up one dir, main page]

CN101819141B - 基于近红外光谱与信息处理的玉米品种鉴别方法 - Google Patents

基于近红外光谱与信息处理的玉米品种鉴别方法 Download PDF

Info

Publication number
CN101819141B
CN101819141B CN 201010162316 CN201010162316A CN101819141B CN 101819141 B CN101819141 B CN 101819141B CN 201010162316 CN201010162316 CN 201010162316 CN 201010162316 A CN201010162316 A CN 201010162316A CN 101819141 B CN101819141 B CN 101819141B
Authority
CN
China
Prior art keywords
sample
training
obtains
near infrared
main shaft
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010162316
Other languages
English (en)
Other versions
CN101819141A (zh
Inventor
王徽蓉
李卫军
陈新亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Semiconductors of CAS
Original Assignee
Institute of Semiconductors of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Semiconductors of CAS filed Critical Institute of Semiconductors of CAS
Priority to CN 201010162316 priority Critical patent/CN101819141B/zh
Publication of CN101819141A publication Critical patent/CN101819141A/zh
Application granted granted Critical
Publication of CN101819141B publication Critical patent/CN101819141B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于近红外光谱与信息处理的玉米品种鉴别方法,该方法使用傅里叶变换漫反射近红外光谱仪采集玉米种子的光谱数据,根据光谱特点,采用归一化主成分分析,即将样本点在各主轴上的投影的平方和归一化,调整样本点在特征空间中的分布,并根据数据在各主轴上投影的散布情况调整主成分权重,最后采用最近邻分类方法进行分类。与传统化学鉴别方法相比,本发明提供的方法高效,快捷,并且无须专业人士操作。

Description

基于近红外光谱与信息处理的玉米品种鉴别方法
技术领域
本发明涉及玉米品种的鉴别技术领域,特别是一种基于近红外光谱与信息处理的玉米品种鉴别方法。
背景技术
现有的农作物品种鉴别方法有形态学方法、荧光扫描鉴定法、化学鉴定法和电泳鉴定法等。形态学方法所需鉴别时间长,且精度不高;荧光扫描鉴定法、化学鉴定法和DNA分子标记鉴定法鉴别精度高,但所需时间长,且鉴别成本较高,过程烦琐,因而不适宜对样品进行批量分析及快速鉴定。
近红外光谱是指在近红外取的吸收光谱,波长范围780nm~2500nm,近红外光谱可以反映出样品中有机分子含氢基团的特征信息,因此可以用近红外光谱分析对化合物中C-H、O-H、N-H等含氢原子团进行定量分析,进一步可以利用近红外光谱来鉴别农作物品种。
另外,近红外光谱具有穿透力强,不会对人体产生伤害,对环境没有污染以及高效快速,采集近红外光谱等操作无须专业人士等优点。
陈建等在光谱学与光谱分析杂志上发表的《基于近红外光谱技术和人工神经网络的玉米品种鉴别方法研究》,以及李晓丽等在光谱学与光谱分析杂志上发表的《基于可见/近红外光谱的水稻品种快速鉴别研究》均提到了使用近红外光谱与主成分分析的鉴别方法,但是,所用的主成分分析的分析方法只能适用于品种种类数目比较少的情况下。
为此,根据玉米种子光谱数据的特点,本发明提出了改进方法,在保证准确率的前提下将之推广到种类数目较多的情况。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的是为了提供一种快速高效、无污染、不会对人体产生伤害,无须专业人士即可实现的基于近红外光谱与信息处理的玉米品种鉴别方法,并改进现有方法只能在种类数目较少的情况下鉴别的缺点。
(二)技术方案
为达到上述目的,本发明提供了一种基于近红外光谱与信息处理的玉米品种鉴别方法,该方法包括:
获取光谱数据;
对训练样本集进行归一化主成分分析,并根据样本点在主轴上的散布情况调整主成分的权重;
训练得到的变换矩阵转置后与待测样本相乘并由权重系数进行加权,得到测试样本的样本特征;以及
使用最近邻分类方法为分类器进行分类;
其中,所述的归一化主成分分析,是将样本主成分分析得到的各主成分进行平方根归一化,具体包括:首先得到训练数据集合xj,j=1,...,s的协方差矩阵Cx,其中s为训练数据集合的个数,然后求出Cx从大到小排列的特征值λk以及满足条件 u l T u k = 1 , l = k 0 , l ≠ k 的特征向量uk,然后令
Figure GSB00000556624000022
为新的特征向量,将u′k按照λk的大小降序排列,并将其作为列组成归一化主成分分析的变换矩阵U,得到样本的特征数据为:yi=UTxi,主成分数目:25~35;
所述的根据样本点在主轴上的散布情况调整主成分的权重,是对主成分进行加权,加权系数 h n = Σ k ( β ‾ k - β ‾ ) 2 / Σ k Σ i ( β ki - β ‾ k ) 2 , 其中,βki表示第k类的第i样本在第n主轴上的投影值,
Figure GSB00000556624000024
表示第k类的所有训练样本在第n主轴上的投影平均值,
Figure GSB00000556624000025
表示所有训练样本在第n主轴上的投影平均值,加权后得到的样本特征为:zi=(h1yi1,h2yi2,...,hdyid),其中i表示某样本,d表示主成分的数目。
上述方案中,所述的获取光谱数据,使用傅立叶变换漫反射近红外光谱仪,谱区范围:4000~12000cm-1,扫描次数:64次,分辨率:8cm-1,对同一品种的玉米籽粒多次取样,每个参与训练的样本至少取样15次。
(三)有益效果
从上述技术方案可以看出,本发明具有以下有益效果:
本发明采用近红外光谱数据来对玉米品种进行鉴别,快速高效、无污染、不会对人体产生伤害,无须专业人士即可实现。采用改进的主成分分析方法分析数据特征,克服了传统的主成分分析方法鉴别正确率低(图3所示),只能适用于数目较少品种的鉴别的缺点。
附图说明
图1是本发明提供的基于近红外光谱与信息处理的玉米品种鉴别方法的流程图;
图2是训练样本协方差矩阵特征值的变化曲线;
图3是传统PCA与本发明所提方法随主成分数变化的识别正确率曲线;其中,传统PCA为虚线、圆形标识,本发明所提方法是实线、方块标识。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的目的是分为三步来实现的,图1是本发明提供的基于近红外光谱与信息处理的玉米品种鉴别方法的流程图,该方法包括以下步骤:
步骤1:获取光谱数据;
步骤2:对训练样本集进行归一化主成分分析,并根据样本点在主轴上的散布情况调整主成分的权重;
步骤3:使用最近邻分类方法为分类器进行分类。
上述步骤1中,所述的获取光谱数据,是使用傅立叶变换漫反射近红外光谱仪,谱区范围:4000~12000cm-1,扫描次数:64次,分辨率:8cm-1,对同一品种的玉米籽粒多次取样,每个参与训练的样本至少取样15次。
上述步骤2中,所述的归一化主成分分析,是将样本主成分分析得到的各主成分进行平方根归一化。具体包括:首先得到训练数据集合xj,j=1,...,s的协方差矩阵Cx,然后求出Cx从大到小排列的特征值λk以及满足条件 u l T u k = 1 , l = k 0 , l ≠ k 的特征向量uk,然后令
Figure GSB00000556624000042
为新的特征向量,将u′k按照λk的大小降序排列,并将其作为列组成归一化主成分分析的变换矩阵U,得到样本的特征数据为:yi=UTxi,主成分数目:25~35。
上述步骤2中,所述的根据样本点在主轴上的散布情况调整主成分的权重,是对主成分进行加权,加权系数 h n = Σ k ( β ‾ k - β ‾ ) 2 / Σ k Σ i ( β ki - β ‾ k ) 2 , 其中,βki表示第k类的第i样本在第n主轴上的投影值,
Figure GSB00000556624000044
表示第k类的所有训练样本在第n主轴上的投影平均值,
Figure GSB00000556624000045
表示所有训练样本在第n主轴上的投影平均值,加权后得到的样本特征为:zi=(h1yi1,h2yi2,...,hdyid),其中i表示某样本,d表示主成分的数目。
再次参照图1,介绍本发明实施例中基于近红外光谱与信息处理的玉米品种鉴别方法的流程图,具体包括以下步骤:
步骤1:光谱的采集。
采集需使用傅立叶变换漫反射近红外光谱仪,谱区范围:4000~12000cm-1,扫描次数:64次,分辨率:8cm-1。玉米品种共有37个,对同一品种的玉米籽粒多次取样,测量25次,每个品种共得到25个样本,数据长度为2075。选取其中30个品种,每个品种的15个样本组成训练集,共450个样本;该30个品种每个品种剩余的10个样本组成第一测试集,共300个样本;剩余没有参加训练的7个品种的所有样本组成第二测试集,共175个样本。
步骤2:训练过程。
首先对训练样本集进行归一化主成分分析。由所有的训练样本xj,j=1,...,s其中s=450,组成列向量的数据集合,维数2075,m是其均值向量: m = 1 s Σ j = 1 s x j , 协方差矩阵是: C x = 1 s Σ j = 1 s ( x j - m ) ( x j - m ) T , 求出协方差矩阵从大到小排列的特征值λk以及满足条件 u l T u k = 1 , l = k 0 , l ≠ k 的特征向量uk,令
Figure GSB00000556624000054
为新的特征向量,将u′k按照λk的大小降序排列,并将其作为列组成变换矩阵U(需保存该变换矩阵以备后续步骤使用),最后得到归一化主成分分析后的样本特征数据:yi=UTxi。主成分的数目定为31,累积贡献率99.99%。
其次,根据样本点在主轴上的散布情况调整主成分的权重(需保存此权重以备后续步骤使用),即对主成分进行加权,样本点的第n主成分的加权系数 h n = Σ k ( β ‾ k - β ‾ ) 2 / Σ k Σ i ( β ki - β ‾ k ) 2 , 其中βki表示第k类的第i样本在第n主轴上的投影值,
Figure GSB00000556624000056
表示第k类的所有训练样本在第n主轴上的投影平均值,
Figure GSB00000556624000057
表示所有训练样本在第n主轴上的投影平均值。加权后得到的样本特征为:zi=(h1yi1,h2yi2,...,h31yi31),其中i表示某样本。最后,将所有的训练样本特征建立模板库。
步骤3:识别过程。
训练得到的变换矩阵转置后与待测样本相乘并由权重系数进行加权,得到测试样本的样本特征,使用最近邻分类方法对提取的特征进行分类识别,先计算一个测试样本点到某一品种的训练样本集的最小距离,当最小距离小于某个阈值时,判定该测试样本点属于该品种。阈值的选择按照‘等误率’的原则,本实施例所取的阈值如下:将所有其他品种训练样本到某一品种的训练样本集的最小距离升序排列,选取第8个值作为该品种阈值。
步骤4:鉴别结果。
采用交叉验证的方式,共进行了10次测试,取平均值,训练集的30个品种,对第一测试集的300个样本中的同类样本的平均正确识别率为97.93%,对第一测试集的300个样本中的非同类样本的平均正确拒识率为97.61%;对第二测试集的175个样本(均为非同类样本)的平均正确拒识率为97.69%。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于近红外光谱与信息处理的玉米品种鉴别方法,其特征在于,该方法包括:
获取光谱数据;
对训练样本集进行归一化主成分分析,并根据样本点在主轴上的散布情况调整主成分的权重;
训练得到的变换矩阵转置后与待测样本相乘并由权重系数进行加权,得到测试样本的样本特征;以及
使用最近邻分类方法为分类器进行分类;
其中,所述的归一化主成分分析,是将样本主成分分析得到的各主成分进行平方根归一化,具体包括:首先得到训练数据集合xj,j=1,...,s的协方差矩阵Cx,其中s为训练数据集合的个数,然后求出Cx从大到小排列的特征值λk以及满足条件 u l T u k = 1 , l = k 0 , l ≠ k 的特征向量uk,然后令
Figure FSB00000556623900012
为新的特征向量,将u′k按照λk的大小降序排列,并将其作为列组成归一化主成分分析的变换矩阵U,得到样本的特征数据为:yi=UTxi,主成分数目:25~35;
所述的根据样本点在主轴上的散布情况调整主成分的权重,是对主成分进行加权,加权系数 h n = Σ k ( β ‾ k - β ‾ ) 2 / Σ k Σ i ( β ki - β ‾ k ) 2 , 其中,βki表示第k类的第i样本在第n主轴上的投影值,
Figure FSB00000556623900014
表示第k类的所有训练样本在第n主轴上的投影平均值,表示所有训练样本在第n主轴上的投影平均值,加权后得到的样本特征为:zi=(h1yi1,h2yi2,...,hdyid),其中i表示某样本,d表示主成分的数目。
2.根据权利要求1所述的基于近红外光谱与信息处理的玉米品种鉴别方法,其特征在于,所述的获取光谱数据,使用傅立叶变换漫反射近红外光谱仪,谱区范围:4000~12000cm-1,扫描次数:64次,分辨率:8cm-1,对同一品种的玉米籽粒多次取样,每个参与训练的样本至少取样15次。
CN 201010162316 2010-04-28 2010-04-28 基于近红外光谱与信息处理的玉米品种鉴别方法 Expired - Fee Related CN101819141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010162316 CN101819141B (zh) 2010-04-28 2010-04-28 基于近红外光谱与信息处理的玉米品种鉴别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010162316 CN101819141B (zh) 2010-04-28 2010-04-28 基于近红外光谱与信息处理的玉米品种鉴别方法

Publications (2)

Publication Number Publication Date
CN101819141A CN101819141A (zh) 2010-09-01
CN101819141B true CN101819141B (zh) 2012-04-25

Family

ID=42654317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010162316 Expired - Fee Related CN101819141B (zh) 2010-04-28 2010-04-28 基于近红外光谱与信息处理的玉米品种鉴别方法

Country Status (1)

Country Link
CN (1) CN101819141B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101936895B (zh) * 2010-09-02 2012-04-25 中南林业科技大学 一种稻米贮藏时间近红外光谱分析快速检测方法
CN102564993B (zh) * 2011-12-31 2015-07-15 江南大学 一种利用傅里叶变换红外光谱识别大米品种方法及其应用
CN104062262A (zh) * 2014-07-09 2014-09-24 中国科学院半导体研究所 一种基于近红外光谱的作物种子品种真实性鉴别方法
CN104198428B (zh) * 2014-08-21 2016-08-24 中国农业大学 带种衣剂种子真实性快速鉴定方法及系统
CN104374737A (zh) * 2014-10-30 2015-02-25 中国科学院半导体研究所 一种近红外定性鉴别方法
CN104376325A (zh) * 2014-10-30 2015-02-25 中国科学院半导体研究所 一种近红外定性分析模型的建立方法
CN104374739A (zh) * 2014-10-30 2015-02-25 中国科学院半导体研究所 一种基于近红外定性分析的种子品种真实性鉴别方法
CN105043998B (zh) * 2015-05-29 2018-01-02 中国农业大学 一种鉴别玉米单倍体的方法
CN105486659A (zh) * 2015-11-23 2016-04-13 中国农业大学 玉米种子品种真实性鉴别模型的构建方法及其应用
CN105678345B (zh) * 2016-03-07 2019-07-16 昆明理工大学 一种提高食用油掺杂光谱检测识别率的方法
CN106613913B (zh) * 2016-12-23 2018-07-20 天津农学院 玉米自交系组合选配的近红外-中红外快速筛选方法
CN107451603B (zh) * 2017-07-07 2020-01-10 中国农业大学 一种蝗虫龄期的识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1283791A (zh) * 1999-07-06 2001-02-14 中国石油化工集团公司 一种测定渣油组分含量的方法
CN101789075A (zh) * 2010-01-26 2010-07-28 哈尔滨工程大学 基于特征值归一化双向加权的手指静脉识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004079347A1 (en) * 2003-03-07 2004-09-16 Pfizer Products Inc. Method of analysis of nir data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1283791A (zh) * 1999-07-06 2001-02-14 中国石油化工集团公司 一种测定渣油组分含量的方法
CN101789075A (zh) * 2010-01-26 2010-07-28 哈尔滨工程大学 基于特征值归一化双向加权的手指静脉识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Wang HR et al.Feature Analysis and Discrimination of Varieties of Corn Based on Naar Infrared Spectra.《SPECTROSCOPY AND SPECTRAL ANALYSIS》.2010,第30卷(第12期),3213-3216. *
苏谦等.基于近红外光谱核仿生模式识别玉米品种快速鉴别方法.《光谱学与光谱分析》.2009,第29卷(第9期),2413-2416. *
蔡健荣等.利用近红外光谱技术识别不同种类的茶叶.《安徽农业科学》.2007,第35卷(第14期),4083-4084. *

Also Published As

Publication number Publication date
CN101819141A (zh) 2010-09-01

Similar Documents

Publication Publication Date Title
CN101819141B (zh) 基于近红外光谱与信息处理的玉米品种鉴别方法
CN104374738B (zh) 一种基于近红外提高鉴别结果的定性分析方法
Dell’Anna et al. Pollen discrimination and classification by Fourier transform infrared (FT-IR) microspectroscopy and machine learning
CN104374739A (zh) 一种基于近红外定性分析的种子品种真实性鉴别方法
CN101738373A (zh) 一种鉴别作物种子品种的方法
Mishra et al. Identification of citrus greening (HLB) using a VIS-NIR spectroscopy technique
CN105866056A (zh) 一种基于近红外光谱的杂交种纯度鉴别方法
CN109858477A (zh) 用深度森林在复杂环境中识别目标物的拉曼光谱分析方法
CN110378374B (zh) 一种模糊鉴别信息提取的茶叶近红外光谱分类方法
CN110378373B (zh) 一种模糊非相关线性鉴别分析的茶叶品种分类方法
CN103048273A (zh) 基于模糊聚类的水果近红外光谱分类方法
CN103344602A (zh) 一种基于近红外光谱的水稻种质真伪无损检测方法
CN106408012A (zh) 一种模糊鉴别聚类的茶叶红外光谱分类方法
CN110361356A (zh) 一种提高小麦水分预测精度的近红外光谱变量选择方法
CN109685098B (zh) 一种模糊簇间分离聚类的茶叶品种分类方法
CN105181650A (zh) 一种使用近红外光谱技术快速鉴别茶叶品种的方法
CN103278467A (zh) 一种植物叶片氮素丰缺快速无损高准确率的鉴别方法
CN107192686B (zh) 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法
Liu et al. Method for identifying transgenic cottons based on terahertz spectra and WLDA
CN116204831A (zh) 一种基于神经网络的道地性分析方法
CN108872128B (zh) 一种模糊非相关c均值聚类的茶叶红外光谱分类方法
CN108344701A (zh) 基于高光谱技术的石蜡等级定性分类与定量回归方法
CN107271394A (zh) 一种模糊Kohonen鉴别聚类网络的茶叶红外光谱分类方法
CN109685099B (zh) 一种光谱波段优选模糊聚类的苹果品种辨别方法
CN109001181B (zh) 一种拉曼光谱典型相关分析融合的食用油种类快速鉴别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120425

Termination date: 20130428