CN102768196A - 一种鉴别不同转基因水稻的方法 - Google Patents
一种鉴别不同转基因水稻的方法 Download PDFInfo
- Publication number
- CN102768196A CN102768196A CN2012102856296A CN201210285629A CN102768196A CN 102768196 A CN102768196 A CN 102768196A CN 2012102856296 A CN2012102856296 A CN 2012102856296A CN 201210285629 A CN201210285629 A CN 201210285629A CN 102768196 A CN102768196 A CN 102768196A
- Authority
- CN
- China
- Prior art keywords
- rice
- spectrum
- different transgenic
- paddy seed
- paddy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种鉴别转基因水稻的方法,包括以下步骤:(1)向水稻种子样本发射近红外光谱,并采集所有水稻种子样本的漫反射光谱信息;(2)分别对所有的水稻种子样本的漫反射光谱信息进行预处理,利用主成分分析法提取预处理后的特征光谱区段的光谱特征信息,选取主成分,并获取各个主成分的得分;(3)以所有水稻种子样本光谱信息对应的各个主成分得分作为输入,以水稻种子样本对应的转基因类型设定值作为输出,建立模型;(4)获取待测水稻种子光谱的各个主成分得分,将其带入(3)中所述模型,获得待测水稻种子转基因类型;水稻为转蛋白基因水稻和转调控基因水稻。本发明操作简单、鉴别精度高,可实现不同转基因水稻的快速、无损鉴别。
Description
技术领域
本发明属于转基因植物的检测领域,尤其涉及一种鉴别不同转基因水稻的方法。
背景技术
转基因技术是指将外源基因通过生物、物理或化学手段导入其它生物基因组,以获得外源基因稳定遗传和表达的遗传改良体。
水稻是我国第一大粮食作物,年产量约占粮食总产量的38%,其生产关系着国家的粮食安全。转基因技术突破了水稻传统育种的限制,为保障我国的粮食安全提供了新的途径。随着水稻基因工程技术的飞速发展,转基因水稻的研究成果斐然。近20年来,利用转基因技术已成功研发出了多种转基因水稻,获得了大量目标性状遗传和表达稳定、农艺性状优良的转基因水稻株系。与此同时,转基因成分的检测方法也越来越受到重视。
目前,转基因成分检测方法,可分为定性检测法和定量检测法。目前常用的转基因作物检测方法有PCR检测法、化学组织检测法、酶联免疫吸附法、外源基因整合鉴定法、Westren杂交法、生物测定检测法等。常规的一些转基因植物的检测方法已经不能满足目前快速、准确检测的需要,这些方法有的需要转膜、杂交,操作繁琐、费用高,有的不适合批量样本的检测,严重限制了其应用。转基因检测技术的发展趋势是操作简便、费用较低、适用性强。
授权公告号为CN 101343665的发明专利公开了一种转基因抗虫水稻的快速检测方法,其原理是采用4条特异引物及一种具有链置换活性的DNA聚合酶,在63~65℃对样品DNA模板进行扩增,短时间扩增出大量产物。其鉴定采用肉眼直接观察反应管内沉淀的混浊度或者通过加入SYBR Green颜色变化判断扩增与否;此方法涉及特异引物以及DNA的扩增,成本高,操作复杂,费时费力。
发明内容
本发明提供了一种鉴别不同转基因水稻的方法,该方法能够快速、无损、简便的实现不同转基因水稻的鉴别。
一种鉴别不同转基因水稻的方法,包括以下步骤:
(1)向水稻种子样本发射波数范围为4000~10000cm-1的近红外光谱,并采集所有水稻种子样本的漫反射光谱信息;
(2)分别对所有的水稻种子样本的漫反射光谱信息进行预处理,利用主成分分析法提取预处理后特征光谱区段的光谱特征信息,选取主成分,并获取各个主成分的得分;
(3)以所有水稻种子样本光谱信息对应的各个主成分得分作为输入,以水稻种子样本对应的转基因类型设定值作为输出,建立模型;
(4)根据步骤(1)~(2)获取待测水稻种子光谱的各个主成分得分,将其带入(3)中所述模型,获得待测水稻种子的转基因类型;
水稻为转蛋白基因水稻和转调控基因水稻。
水稻转入不同基因后,会引起水稻种子内部结构和组成的变化。水稻转入蛋白基因后,会引起水稻种子主要引起蛋白质结构的变化;而转入调控基因后,根据其调控的细胞代谢网络,会导致水稻种子蛋白质和淀粉等组分结构发生变化;因此,转蛋白基因水稻种子与转调控基因水稻种子的内部结构和组成方面存在着差别。
近红外光谱可记录物质中含氢基团C-H、O-H、N-H、S-H、P-H等振动的倍频和合频吸收,因而近红外光谱具有丰富的物质内部结构和组成信息。向不同转基因水稻种子发射近红外光谱后,会引起近红外吸收波长与强度的差别,但这种差别无法通过近红外光谱图进行肉眼识别,通过主成分分析减少光谱信息变量数目,建立水稻种子光谱信息与水稻转基因类型的关系模型,从而将两种转基因水稻图像信息间的细小差异进一步突出显示,转变为可识别的信号,最终实现水稻转基因的类型的快速鉴别。
步骤(1)中,所述水稻种子样本为转蛋白基因水稻种子样本和转调控基因水稻种子样本。
步骤(2)中,由于通过仪器采集的原始光谱中除包含有效信息外,还包含来自各方面因素所产生的噪声信号,这些噪声信号会对光谱信息产生干扰,从而影响模型的建立和对待测水稻转基因类型的预测;为了实现光谱噪音的滤除、数据的筛选以及消除其他因素对数据信息的影响,需要对光谱进行预处理。通过比较分析,预处理方法优选为常用的标准正态变换法。
选取不同波数范围的光谱数据具有不同的分类效果,确定具有较优分类效果的特征光谱区段就显得很重要(特征光谱区段的选择方法可参见:邓波,沈才洪,敖宗华,卢中明.2011.“基于主成分分析与近红外光谱技术的窖泥聚类研究”酿酒科技8:36-38.),所述特征光谱区段的波数最小值为4000cm-1,最大值为8000~10000cm-1,优选为波数范围为4000~10000cm-1或4000~8000cm-1光谱区段。
主成分分析(PCA)的目的是将光谱数据降维,把原变量转换成一组彼此正交的新变量的线性组合,消除了多变量共存中相互重叠的信息,同时,新变量能最大限度地表征原变量的数据结构特征。由于主成分分析法的新变量数量少、彼此不相关,更有利于对光谱信息的分析。主成分分析方法可在Unscrambler软件(由美国CAMO制造)上实现。
主成分的选取与原始信息的有效提取密切相关,在选择主成分时,取累计贡献率≥85%,但主成分选取不宜过多,否则会引入不必要的噪声并造成过拟合;通过比较分析,主成分数优选为4~8,更优选为5。
步骤(3)中,水稻种子样本对应的转基因类型为转蛋白基因和转调控基因,在模型中可设置转蛋白基因和转调控基因的设定值分别为-1和1。
基于多元回归算法建立模型,所述模型优选为偏最小二乘判别分析(PLS-DA)模型,PLS-DA法是基于PLS回归的一种判别分析方法,在构造因素时因考虑到了辅助矩阵以代码形式提供的类成员信息,因此具有高效的鉴别能力,可提高水稻转基因类型鉴别的精确度。
相对于现有技术,本发明的有益效果为:
(1)本发明操作简单、省时省力,仅需获取水稻种子的近红外光谱,即可进行转蛋白基因与转调控基因水稻的鉴别;
(2)本发明鉴别精度高、结果可靠,可实现转蛋白基因与转调控基因水稻的快速、无损鉴别。
附图说明
图1为实施例1转翻译控制肿瘤蛋白基因水稻种子和转Osmi166水稻种子预测值和实际值回归图。
具体实施方式
实施例1
1、建立模型
(1)分别选取40粒转翻译控制肿瘤蛋白(TCTP)基因水稻种子和40粒转Osmi166基因水稻种子作为水稻种子样本,利用Nicolet Nexus870(Thermo Corporation USA)傅里叶变换近红外光谱仪向水稻种子样本发射波数范围为4000~10000cm-1光谱区段的近红外光谱,利用OMNIC 6.0软件采集所有水稻种子样本的漫反射光谱信息;设置近红外光谱仪扫描次数32次,分辨率4cm-1。采集时室温控制在25℃左右,湿度保持稳定。
以上转TCTP基因水稻和转Osmi166基因水稻的获取方法为:转基因材料分别采用水稻的成熟胚为外植体诱导、培养愈伤组织,挑选胚性愈伤组织作为转化受体,通过包含植物表达载体p1301-TCTP和p1301-mi166的根癌农杆菌EHA105转化到水稻愈伤组织中,经一系列筛选分化得到转基因水稻。
(2)利用标准正态变换法分别对所有的水稻种子样本的漫反射光谱信息进行预处理,得到预处理后的光谱图;利用Unscrambler软件中的主成分分析法提取各个预处理后的光谱图中的光谱特征信息,选取主成分数为5,获取各个主成分的得分(如表1所示);
(3)以所有水稻种子样本光谱信息对应的各个主成分得分作为输入,以水稻种子样本对应的转基因类型设定值作为输出,建立PLS-DA模型;水稻种子样本对应的转基因类型设定值设置如下:转TCTP基因设定为-1,转Osmi166基因设定为1。限与篇幅,仅将其中20个水稻种子样本数据列于此,见表1。
表1用于模型建立的部分数据库
NO | X1 | X2 | X3 | X4 | X5 | Y |
1 | 1.6230 | 0.8200 | 0.6130 | -0.0850 | 0.4930 | 1 |
2 | 0.8760 | 0.7010 | -0.2860 | 1.6670 | 0.0733 | 1 |
3 | 0.3390 | -0.8490 | 0.0275 | 1.9930 | 0.0373 | 1 |
4 | 0.5080 | 1.8760 | 0.3170 | 0.4740 | 0.1760 | 1 |
5 | -0.5420 | 0.7380 | 0.3500 | 0.5940 | 0.3760 | 1 |
6 | -1.0030 | 1.6830 | 0.2240 | 0.7570 | 0.3030 | 1 |
7 | 1.2050 | 1.5220 | -0.0590 | 0.8140 | 0.1710 | 1 |
8 | 0.0797 | 2.1110 | -0.4970 | 0.6750 | 0.3870 | 1 |
9 | 1.4220 | 0.2360 | 0.7040 | -0.7710 | 0.6060 | 1 |
10 | 0.6080 | -0.0463 | 0.6880 | 0.4440 | 0.3470 | 1 |
11 | -2.7780 | 0.4380 | -0.0980 | -0.4110 | -0.4170 | -1 |
12 | 0.9840 | -1.3020 | -0.3780 | -1.6250 | 0.1420 | -1 |
13 | -2.3000 | 0.4800 | -0.6280 | -0.5490 | -0.0051 | -1 |
14 | -0.8610 | 0.6790 | -1.3220 | -0.9710 | 0.1920 | -1 |
15 | -4.9350 | 0.1070 | 0.3050 | -0.3020 | 0.2090 | -1 |
16 | -3.8930 | -0.2440 | 0.1530 | 0.1070 | 0.0142 | -1 |
17 | -2.9820 | -0.2130 | 0.3730 | -0.2720 | 0.1210 | -1 |
18 | -1.4700 | 0.7130 | -0.8950 | -0.5320 | 0.0643 | -1 |
19 | -1.2730 | -1.3330 | 0.0590 | -0.4230 | 0.3860 | -1 |
20 | -4.7630 | 0.6320 | 0.0477 | -0.3040 | 0.0771 | -1 |
其中,NO是指水稻种子样本的序号,X1、X2、X3、X4、X5分别对应每个主成分得分;Y为输出值。
2、利用模型预测校正集水稻种子样本的转基因类型
建立PLS-DA模型后,将1中根据步骤(1)~(3)获取的校正集中水稻种子样本的5个主成分得分,带入1中建立好的PLS-DA模型,得到输出值(如表2所示);通过输出值,根据以下原则来确定水稻种子样本的转基因类型:预测值小于0时,为转TCTP基因;预测值大于0时,为转Osmi166基因。限与篇幅,仅将其中20个水稻种子样本数据列于此,见表1。
表2校正集中水稻种子样本预测转基因类型以及实际转基因类型
NO | X1 | X2 | X3 | X4 | X5 | Y | S1 | S2 |
1 | 1.6230 | 0.8200 | 0.6130 | -0.0850 | 0.4930 | 1.374 | 1 | 1 |
2 | 0.8760 | 0.7010 | -0.2860 | 1.6670 | 0.0733 | 0.898 | 1 | 1 |
3 | 0.3390 | -0.8490 | 0.0275 | 1.9930 | 0.0373 | 0.49 | 1 | 1 |
4 | 0.5080 | 1.8760 | 0.3170 | 0.4740 | 0.1760 | 1.337 | 1 | 1 |
5 | -0.5420 | 0.7380 | 0.3500 | 0.5940 | 0.3760 | 0.754 | 1 | 1 |
6 | -1.0030 | 1.6830 | 0.2240 | 0.7570 | 0.3030 | 0.931 | 1 | 1 |
7 | 1.2050 | 1.5220 | -0.0590 | 0.8140 | 0.1710 | 1.217 | 1 | 1 |
8 | 0.0797 | 2.1110 | -0.4970 | 0.6750 | 0.3870 | 0.843 | 1 | 1 |
9 | 1.4220 | 0.2360 | 0.7040 | -0.7710 | 0.6060 | 0.966 | 1 | 1 |
10 | 0.6080 | -0.0463 | 0.6880 | 0.4440 | 0.3470 | 0.952 | 1 | 1 |
11 | -2.7780 | 0.4380 | -0.0980 | -0.4110 | -0.4170 | -0.948 | -1 | -1 |
12 | 0.9840 | -1.3020 | -0.3780 | -1.6250 | 0.1420 | -1.042 | -1 | -1 |
13 | -2.3000 | 0.4800 | -0.6280 | -0.5490 | -0.0051 | -1.103 | -1 | -1 |
14 | -0.8610 | 0.6790 | -1.3220 | -0.9710 | 0.1920 | -1.24 | -1 | -1 |
15 | -4.9350 | 0.1070 | 0.3050 | -0.3020 | 0.2090 | -1.079 | -1 | -1 |
16 | -3.8930 | -0.2440 | 0.1530 | 0.1070 | 0.0142 | -0.981 | -1 | -1 |
17 | -2.9820 | -0.2130 | 0.3730 | -0.2720 | 0.1210 | -0.649 | -1 | -1 |
18 | -1.4700 | 0.7130 | -0.8950 | -0.5320 | 0.0643 | -0.96 | -1 | -1 |
19 | -1.2730 | -1.3330 | 0.0590 | -0.4230 | 0.3860 | -0.819 | -1 | -1 |
20 | -4.7630 | 0.6320 | 0.0477 | -0.3040 | 0.0771 | -1.075 | -1 | -1 |
其中,NO是指水稻种子样本的序号,X1、X2、X3、X4、X5分别对应每个主成分得分;Y为输出值,S1为模型预测转基因类型,S2为实际转基因类型;S1、S2列中1代表转Osmi166基因,-1代表转TCTP基因。
通过数据分析可知:校正集决定系数R2 c为0.9133、校正集均方根误差RMSEC为0.2945,建立的PLS-DA模型对校正集水稻种子样本转基因类型的预测准确率达到97.5%。
3、利用模型预测验证集待测水稻种子的转基因类型
取40粒待测水稻种子,作为验证集,根据1中步骤(1)~(2)获取待测水稻种子的5个主成分得分,并将其带入建立好的PLS-DA模型,得到模型输出值Y;通过输出值Y,根据2中判定原则来确定待测水稻种子的转基因类型。限与篇幅,仅将其中25个水稻种子样本数据列于此,见表1。
表3验证集中待测水稻种子预测转基因类型及实际转基因类型
NO | X1 | X2 | X3 | X4 | X5 | Y | S1 | S2 |
1 | -3.1940 | -0.0246 | 0.5680 | 0.6910 | 0.1190 | 1.187 | 1 | 1 |
2 | -0.9550 | -0.3250 | -0.2370 | -0.0941 | 0.2170 | 0.534 | 1 | 1 |
3 | -2.5860 | -1.3260 | -0.3310 | -0.4150 | 0.1710 | 1.197 | 1 | 1 |
4 | -0.8770 | -0.4600 | -0.3000 | -0.1280 | 0.0461 | 0.699 | 1 | 1 |
5 | -1.0740 | -0.5260 | -0.0468 | 0.2600 | -0.3910 | 0.392 | 1 | 1 |
6 | 6.0830 | 0.7580 | -0.0266 | 0.4000 | -0.3790 | 0.746 | 1 | 1 |
7 | 0.9470 | 0.6280 | 0.2890 | 0.4180 | -0.6800 | 0.646 | 1 | 1 |
8 | 2.4750 | -0.9690 | -1.7330 | 0.4590 | -0.7900 | 0.988 | 1 | 1 |
9 | -2.8740 | -1.4840 | 0.1050 | 0.3070 | -0.7410 | 0.954 | 1 | 1 |
10 | 0.9160 | -0.2530 | -1.9800 | 0.0648 | -0.7220 | 0.911 | 1 | 1 |
11 | -2.2800 | 0.4390 | -0.5320 | -0.6690 | 0.3660 | 0.007 | 1 | 1 |
12 | -2.9120 | 0.3430 | -0.0748 | -0.5380 | 0.2920 | -0.725 | -1 | -1 |
13 | -3.4800 | 0.9220 | 0.2500 | -0.3640 | 0.1340 | -0.727 | -1 | -1 |
14 | -1.3380 | 2.0000 | -0.4440 | 0.0679 | 0.1250 | -0.844 | -1 | -1 |
15 | -1.1200 | 1.0580 | -0.5930 | 0.2060 | 0.1750 | -0.296 | -1 | -1 |
16 | -4.0120 | 0.7260 | -0.4360 | -0.2390 | 0.1910 | -1.080 | -1 | -1 |
17 | -0.0640 | 0.4540 | -0.4800 | -0.4110 | -0.2090 | -0.402 | -1 | -1 |
18 | 4.4500 | 1.2460 | 0.7370 | 0.1700 | 0.2260 | -1.158 | -1 | -1 |
19 | -2.2840 | -0.4590 | 0.7200 | 0.0400 | -0.0519 | -0.998 | -1 | -1 |
20 | 0.4420 | -0.2910 | 0.4850 | -0.5010 | 0.0025 | -0.630 | -1 | -1 |
21 | -1.7510 | -0.3590 | 0.3210 | -0.6690 | -0.0189 | -1.131 | -1 | -1 |
22 | 3.0030 | -0.5060 | 1.3220 | -0.2920 | 0.0045 | -0.664 | -1 | -1 |
23 | 6.5710 | -0.2190 | 0.2100 | -0.4990 | 0.3490 | -0.924 | -1 | -1 |
24 | -1.8030 | 0.7830 | 0.4310 | -1.0060 | -0.4620 | -0.873 | -1 | -1 |
25 | 3.6390 | -0.1820 | 0.5670 | 0.1990 | 0.0357 | -0.189 | -1 | -1 |
其中,NO是指待测水稻种子的序号,X1、X2、X3、X4、X5分别对应每个主成分得分;Y为输出值,S1为模型预测水稻转基因类型,S2为实际转基因类型;S1、S2列中1代表转Osmi166基因,-1代表转TCTP基因。
通过数据分析可知:验证集决定系数R2 p为0.7537、验证集均方根误差RMSEV为0.3873,建立的PLS-DA模型对验证集水稻种子转基因类型的预测准确率达到100%。转蛋白基因水稻种子和转调控基因水稻种子预测值和实际值回归图如图1所示。
实施例2
1、建立模型
(1)同实施例1。
(2)利用标准正态变换法分别对所有的水稻种子样本的漫反射光谱信息进行预处理,得到预处理后的光谱图;利用Unscrambler软件中的主成分分析法提取各个预处理后的波数范围为4000~8000cm-1光谱区段的光谱特征信息,选取主成分数为5,获取各个主成分的得分(如表4所示);
(3)以所有水稻种子样本光谱信息对应的各个主成分得分作为输入,以水稻种子样本对应的转基因类型设定值作为输出,建立PLS-DA模型;水稻种子样本对应的转基因类型设定值设置如下:转TCTP基因设定为-1,转Osmi166基因设定为1。限与篇幅,仅将其中20个水稻种子样本数据列于此,见表1。
表4用于模型建立的部分数据库
NO | X1 | X2 | X3 | X4 | X5 | Y |
1 | 1.4110 | 0.7400 | -0.7140 | 0.6140 | 0.0411 | 1 |
2 | -0.3160 | 0.0245 | 1.5630 | 0.6430 | 0.0120 | 1 |
3 | -0.1190 | -1.3690 | 1.3880 | 0.6690 | 0.1850 | 1 |
4 | -0.8650 | 0.5840 | -0.3370 | 0.6050 | 0.1600 | 1 |
5 | -1.3470 | -0.4010 | -0.5930 | 0.8450 | 0.1080 | 1 |
6 | -1.9950 | 0.7680 | 0.1840 | 0.2970 | 0.1400 | 1 |
7 | -0.6460 | -0.0797 | -0.0303 | 0.9520 | -0.0719 | 1 |
8 | -1.8930 | 0.4390 | 0.2280 | 0.5000 | 0.0346 | 1 |
9 | 1.8430 | 0.7110 | -1.5800 | 0.4490 | 0.1940 | 1 |
10 | 0.9390 | 0.0135 | -0.0620 | 0.3130 | 0.2290 | 1 |
11 | -3.0970 | -0.4460 | -0.7320 | 0.1430 | -0.5660 | -1 |
12 | 2.2770 | 0.4420 | -1.2760 | -0.3610 | -0.5080 | -1 |
13 | -2.5520 | 0.2020 | -0.4110 | -0.1150 | -0.6660 | -1 |
14 | -1.8480 | -0.1940 | -0.3970 | 0.0191 | -0.3450 | -1 |
15 | -4.5560 | 0.0037 | -0.9970 | -0.5330 | 0.3830 | -1 |
16 | -3.0010 | 0.5790 | -0.0049 | -0.5860 | -0.0458 | -1 |
17 | -2.2080 | 0.0203 | -0.9070 | -0.4950 | 0.1770 | -1 |
18 | -2.6490 | -0.6000 | -1.0040 | -0.1380 | 0.1520 | -1 |
19 | 0.2750 | 0.1660 | -0.7280 | -0.4900 | -0.1760 | -1 |
20 | -5.0850 | -0.3360 | -0.7440 | -1.0270 | 0.4480 | -1 |
其中,NO是指水稻种子样本的序号,X1、X2、X3、X4、X5分别对应每个主成分得分;Y为输出值。
2、利用模型预测校正集水稻种子样本的转基因类型
建立PLS-DA模型后,将1中根据步骤(1)~(2)获取的校正集中水稻种子样本的5个主成分得分,带入1中建立好的PLS-DA模型,得到输出值(如表5所示);通过输出值,根据以下原则来确定水稻种子样本的转基因类型:预测值小于0时,为转TCTP基因水稻;预测值大于0时,为转Osmi166基因水稻。限与篇幅,仅将其中20个水稻种子样本数据列于此,见表1。
表5校正集中水稻种子样本预测转基因类型以及实际转基因类型
NO | X1 | X2 | X3 | X4 | X5 | Y | S1 | S2 |
1 | 1.4110 | 0.7400 | -0.7140 | 0.6140 | 0.0411 | 1.18 | 1 | 1 |
2 | -0.3160 | 0.0245 | 1.5630 | 0.6430 | 0.0120 | 1.382 | 1 | 1 |
3 | -0.1190 | -1.3690 | 1.3880 | 0.6690 | 0.1850 | 0.672 | 1 | 1 |
4 | -0.8650 | 0.5840 | -0.3370 | 0.6050 | 0.1600 | 1.162 | 1 | 1 |
5 | -1.3470 | -0.4010 | -0.5930 | 0.8450 | 0.1080 | 0.571 | 1 | 1 |
6 | -1.9950 | 0.7680 | 0.1840 | 0.2970 | 0.1400 | 0.968 | 1 | 1 |
7 | -0.6460 | -0.0797 | -0.0303 | 0.9520 | -0.0719 | 0.938 | 1 | 1 |
8 | -1.8930 | 0.4390 | 0.2280 | 0.5000 | 0.0346 | 0.869 | 1 | 1 |
9 | 1.8430 | 0.7110 | -1.5800 | 0.4490 | 0.1940 | 0.893 | 1 | 1 |
10 | 0.9390 | 0.0135 | -0.0620 | 0.3130 | 0.2290 | 0.79 | 1 | 1 |
11 | -3.0970 | -0.4460 | -0.7320 | 0.1430 | -0.5660 | -1.515 | -1 | -1 |
12 | 2.2770 | 0.4420 | -1.2760 | -0.3610 | -0.5080 | -1.143 | -1 | -1 |
13 | -2.5520 | 0.2020 | -0.4110 | -0.1150 | -0.6660 | -1.364 | -1 | -1 |
14 | -1.8480 | -0.1940 | -0.3970 | 0.0191 | -0.3450 | -0.931 | -1 | -1 |
15 | -4.5560 | 0.0037 | -0.9970 | -0.5330 | 0.3830 | -0.904 | -1 | -1 |
16 | -3.0010 | 0.5790 | -0.0049 | -0.5860 | -0.0458 | -0.678 | -1 | -1 |
17 | -2.2080 | 0.0203 | -0.9070 | -0.4950 | 0.1770 | -0.887 | -1 | -1 |
18 | -2.6490 | -0.6000 | -1.0040 | -0.1380 | 0.1520 | -0.985 | -1 | -1 |
19 | 0.2750 | 0.1660 | -0.7280 | -0.4900 | -0.1760 | -0.991 | -1 | -1 |
20 | -5.0850 | -0.3360 | -0.7440 | -1.0270 | 0.4480 | -1.6 | -1 | -1 |
其中,NO是指水稻种子样本的序号,X1、X2、X3、X4、X5分别对应每个主成分得分;Y为输出值,S1为模型预测水稻转基因类型,S2为实际转基因类型;S1、S2列中1代表转Osmi166基因,-1代表转TCTP基因。
通过数据分析可知:校正集决定系数R2 c为0.8661、校正集均方根误差RMSEC为0.3659,建立的PLS-DA模型对校正集水稻样本的转基因类型预测准确率达到97.5%。
3、利用模型预测验证集待测水稻种子的转基因类型
取40粒待测水稻种子,作为验证集,根据1中步骤(1)~(2)获取待测水稻样本的5个主成分得分,并将其带入建立好的PLS-DA模型,得到模型输出值Y;通过输出值Y,根据2中判定原则来确定待测水稻种子的转基因类型。限于篇幅,仅将25个待测水稻种子的数据列于此,见表6。
表6验证集中待测水稻种子预测转基因类型及实际转基因类型
NO | X1 | X2 | X3 | X4 | X5 | Y | S1 | S2 |
1 | -3.7950 | -0.8270 | -0.8370 | 0.4470 | -0.3090 | 1.712 | 1 | 1 |
2 | -1.3110 | 0.1550 | 0.0528 | 0.1910 | -0.2240 | 0.758 | 1 | 1 |
3 | -4.0220 | -0.2180 | 0.0689 | -0.0595 | -0.2150 | 1.412 | 1 | 1 |
4 | -1.3720 | 0.2190 | -0.0569 | -0.2020 | -0.1410 | 0.694 | 1 | 1 |
5 | -1.4700 | -0.3390 | -0.3690 | 0.5780 | 0.2680 | 0.781 | 1 | 1 |
6 | 7.6490 | 0.3160 | -0.4390 | -0.1140 | 0.1930 | 0.668 | 1 | 1 |
7 | 1.8060 | -0.1220 | -0.4100 | -0.1300 | 0.2750 | 0.443 | 1 | 1 |
8 | 2.1550 | 1.4300 | -1.2250 | 0.4310 | 0.4170 | 1.046 | 1 | 1 |
9 | -4.3150 | -1.0810 | -0.7120 | -0.2540 | 0.3750 | 1.428 | 1 | 1 |
10 | 0.5810 | 2.3220 | -0.4140 | 0.1950 | 0.4790 | 0.901 | 1 | 1 |
11 | -2.6990 | 1.0370 | 1.1660 | 0.3620 | -0.6180 | 0.346 | 1 | 1 |
12 | -3.4760 | 0.3240 | 0.7330 | 0.0485 | -0.1110 | -0.724 | -1 | -1 |
13 | -3.8340 | 0.2810 | 0.3240 | -0.2790 | 0.0309 | -0.666 | -1 | -1 |
14 | -0.4220 | 1.7870 | -0.0233 | 0.0158 | 0.3690 | -0.945 | -1 | -1 |
15 | -0.7270 | 1.3120 | -0.3400 | 0.1740 | 0.0230 | -0.383 | -1 | -1 |
16 | -4.8090 | 1.0610 | 0.4520 | -0.8870 | 0.2880 | -0.697 | -1 | -1 |
17 | 0.0929 | 0.9650 | 0.6340 | 0.9340 | -0.3070 | -0.601 | -1 | -1 |
18 | 6.4890 | -0.2960 | 0.2520 | -0.2070 | 0.2730 | -1.151 | -1 | -1 |
19 | -2.8590 | -1.2470 | -0.0179 | 0.4550 | 0.2700 | -0.71 | -1 | -1 |
20 | 0.5420 | -0.6640 | 0.5930 | -0.0183 | 0.0189 | -1.207 | -1 | -1 |
21 | -2.2980 | -0.4770 | 0.7380 | -0.3180 | 0.1150 | -0.875 | -1 | -1 |
22 | 3.6530 | -1.8900 | 0.4100 | 0.0230 | 0.0287 | -0.566 | -1 | -1 |
23 | 7.3470 | -0.3400 | 0.5380 | 0.1560 | -0.3690 | -1.102 | -1 | -1 |
24 | -1.8120 | 0.0946 | 1.5050 | -0.7620 | 0.3660 | -1.139 | -1 | -1 |
25 | 4.4610 | -0.8640 | -0.2700 | 0.3220 | -0.1540 | -0.365 | -1 | -1 |
其中,NO是指待测水稻种子的序号,X1、X2、X3、X4、X5分别对应每个主成分得分;Y为输出值,S1为模型预测水稻转基因类型,S2为实际转基因类型;S1、S2列中1代表转Osmi166基因,-1代表转TCTP基因。
通过数据分析可知:验证集决定系数R2 p为0.8123、验证集均方根误差RMSEV为0.3799,建立的PLS-DA模型对验证集水稻种子的转基因类型预测准确率达到98.3%。
Claims (7)
1.一种鉴别不同转基因水稻的方法,其特征在于,包括以下步骤:
(1)向水稻种子样本发射波数范围为4000~10000cm-1的近红外光谱,并采集所有水稻种子样本的漫反射光谱信息;
(2)分别对所有的水稻种子样本的漫反射光谱信息进行预处理,利用主成分分析法提取预处理后特征光谱区段的光谱特征信息,选取主成分,并获取各个主成分的得分;
(3)以所有水稻种子样本光谱信息对应的各个主成分得分作为输入,以水稻种子样本对应的转基因类型设定值作为输出,建立模型;
(4)根据步骤(1)~(2)获取待测水稻种子光谱的各个主成分得分,将其带入(3)中所述模型,获得待测水稻种子的转基因类型;
水稻为转蛋白基因水稻和转调控基因水稻。
2.如权利要求1所述的鉴别不同转基因水稻的方法,其特征在于,步骤(2)中,预处理方法为标准正态变换法。
3.如权利要求1所述的鉴别不同转基因水稻的方法,其特征在于,步骤(2)中,所述特征光谱区段是波数范围为4000~10000cm-1的光谱区段。
4.如权利要求1所述的鉴别不同转基因水稻的方法,其特征在于,步骤(2)中,所述特征光谱区段是波数范围为4000~8000cm-1的光谱区段。
5.如权利要求1所述的鉴别不同转基因水稻的方法,其特征在于,步骤(2)中,主成分数为4~8。
6.如权利要求3或4所述的鉴别不同转基因水稻的方法,其特征在于,步骤(2)中,主成分数为5。
7.如权利要求1所述的鉴别不同转基因水稻的方法,其特征在于,步骤(3)中,所述模型为偏最小二乘判别分析模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102856296A CN102768196A (zh) | 2012-08-13 | 2012-08-13 | 一种鉴别不同转基因水稻的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102856296A CN102768196A (zh) | 2012-08-13 | 2012-08-13 | 一种鉴别不同转基因水稻的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102768196A true CN102768196A (zh) | 2012-11-07 |
Family
ID=47095672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012102856296A Pending CN102768196A (zh) | 2012-08-13 | 2012-08-13 | 一种鉴别不同转基因水稻的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102768196A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103472008A (zh) * | 2013-08-30 | 2013-12-25 | 黑龙江八一农垦大学 | 孵化前期近红外种蛋内鸡胚性别识别方法 |
CN104062262A (zh) * | 2014-07-09 | 2014-09-24 | 中国科学院半导体研究所 | 一种基于近红外光谱的作物种子品种真实性鉴别方法 |
CN105675534A (zh) * | 2016-03-25 | 2016-06-15 | 北京市农林科学院 | 一种抛光粮食的快速无损鉴别方法 |
CN106124445A (zh) * | 2016-06-16 | 2016-11-16 | 福州大学 | 一种快速、无损鉴别转基因大豆方法 |
CN106338488A (zh) * | 2016-10-31 | 2017-01-18 | 浙江大学 | 一种转基因豆奶粉的快速无损鉴别方法 |
CN106546553A (zh) * | 2016-10-31 | 2017-03-29 | 浙江大学 | 一种转基因大豆油的快速无损鉴别方法 |
CN108872133A (zh) * | 2018-08-31 | 2018-11-23 | 浙江大学 | 一种基于中红外光谱的转基因玉米鉴别方法 |
CN110632017A (zh) * | 2019-09-26 | 2019-12-31 | 中国疾病预防控制中心营养与健康所 | 一种基于形态分析的转基因大豆快速鉴别优化模型 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002340792A (ja) * | 2001-05-17 | 2002-11-27 | Opt Giken Kk | 高分子材料の密度測定方法 |
CN101059426A (zh) * | 2007-05-29 | 2007-10-24 | 浙江大学 | 基于近红外光谱技术无损测量茶叶中茶多酚含量的方法 |
JP2010112887A (ja) * | 2008-11-07 | 2010-05-20 | Astellas Pharma Inc | 主成分分析方法、主成分分析装置、異種品検出装置、主成分分析プログラム、及び、主成分分析プログラムが記録された記録媒体 |
CN102279168A (zh) * | 2011-07-20 | 2011-12-14 | 浙江大学 | 基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法 |
CN102087212B (zh) * | 2010-11-25 | 2012-07-04 | 西南大学 | 基于主成份分析的葛粉掺假鉴别方法 |
CN102590135A (zh) * | 2012-03-02 | 2012-07-18 | 中国计量学院 | 一种基于最小二乘支持向量机的除草剂鉴别方法 |
-
2012
- 2012-08-13 CN CN2012102856296A patent/CN102768196A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002340792A (ja) * | 2001-05-17 | 2002-11-27 | Opt Giken Kk | 高分子材料の密度測定方法 |
CN101059426A (zh) * | 2007-05-29 | 2007-10-24 | 浙江大学 | 基于近红外光谱技术无损测量茶叶中茶多酚含量的方法 |
JP2010112887A (ja) * | 2008-11-07 | 2010-05-20 | Astellas Pharma Inc | 主成分分析方法、主成分分析装置、異種品検出装置、主成分分析プログラム、及び、主成分分析プログラムが記録された記録媒体 |
CN102087212B (zh) * | 2010-11-25 | 2012-07-04 | 西南大学 | 基于主成份分析的葛粉掺假鉴别方法 |
CN102279168A (zh) * | 2011-07-20 | 2011-12-14 | 浙江大学 | 基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法 |
CN102590135A (zh) * | 2012-03-02 | 2012-07-18 | 中国计量学院 | 一种基于最小二乘支持向量机的除草剂鉴别方法 |
Non-Patent Citations (4)
Title |
---|
张龙: "植源性农产品溯源以及鉴别技术研究", 《万方学位论文数据库》 * |
张龙等: "近红外光谱和模式识别技术在西湖龙井与浙江龙井茶叶鉴别中的应用", 《红外》 * |
朱文超: "转基因水稻及其亲本叶片的可见/近红外光谱分析", 《光谱学与光谱分析》 * |
翟亚锋等: "基于仿生模式识别和近红外光谱的转基因小麦快速鉴别方法", 《光谱学与光谱分析》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103472008A (zh) * | 2013-08-30 | 2013-12-25 | 黑龙江八一农垦大学 | 孵化前期近红外种蛋内鸡胚性别识别方法 |
CN103472008B (zh) * | 2013-08-30 | 2016-06-08 | 黑龙江八一农垦大学 | 孵化前期近红外种蛋内鸡胚性别识别方法 |
CN104062262A (zh) * | 2014-07-09 | 2014-09-24 | 中国科学院半导体研究所 | 一种基于近红外光谱的作物种子品种真实性鉴别方法 |
CN105675534A (zh) * | 2016-03-25 | 2016-06-15 | 北京市农林科学院 | 一种抛光粮食的快速无损鉴别方法 |
CN106124445A (zh) * | 2016-06-16 | 2016-11-16 | 福州大学 | 一种快速、无损鉴别转基因大豆方法 |
CN106338488A (zh) * | 2016-10-31 | 2017-01-18 | 浙江大学 | 一种转基因豆奶粉的快速无损鉴别方法 |
CN106546553A (zh) * | 2016-10-31 | 2017-03-29 | 浙江大学 | 一种转基因大豆油的快速无损鉴别方法 |
CN108872133A (zh) * | 2018-08-31 | 2018-11-23 | 浙江大学 | 一种基于中红外光谱的转基因玉米鉴别方法 |
CN110632017A (zh) * | 2019-09-26 | 2019-12-31 | 中国疾病预防控制中心营养与健康所 | 一种基于形态分析的转基因大豆快速鉴别优化模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102768196A (zh) | 一种鉴别不同转基因水稻的方法 | |
CN102841072A (zh) | 基于近红外光谱鉴别转基因水稻和非转基因水稻的方法 | |
Feng et al. | Investigation on data fusion of multisource spectral data for rice leaf diseases identification using machine learning methods | |
De Roy et al. | Flow cytometry for fast microbial community fingerprinting | |
CN101819141B (zh) | 基于近红外光谱与信息处理的玉米品种鉴别方法 | |
EP2004834A2 (en) | Method for multivariate analysis in predicting a trait of interest | |
Liao et al. | Using SSR to evaluate the genetic diversity of potato cultivars from Yunnan province (SW China) | |
Meinen et al. | Root discrimination of closely related crop and weed species using FT MIR-ATR spectroscopy | |
CN105424645A (zh) | 基于主成分分析与Fish判别法快速鉴别临床致病菌的方法 | |
Scarsini et al. | Metabolite quantification by Fourier transform infrared spectroscopy in diatoms: proof of concept on Phaeodactylum tricornutum | |
Tao et al. | Use of line-scan Raman hyperspectral imaging to identify corn kernels infected with Aspergillus flavus | |
Wang et al. | Extraction and classification of origin characteristic peaks from rice Raman spectra by principal component analysis | |
Liu et al. | Method for identifying transgenic cottons based on terahertz spectra and WLDA | |
CN101692043A (zh) | 一种近红外光谱快速、无损伤鉴别人参种子的方法 | |
Cozzolino et al. | Comparison of near infrared and mid infrared spectroscopy to discriminate between wines produced by different Oenococcus Oeni strains after malolactic fermentation: A feasibility study | |
Junges et al. | Green analytical methodology for grape juice classification using FTIR spectroscopy combined with chemometrics | |
Rathna Priya et al. | Characterising corn grain using infrared imaging and spectroscopic techniques: a review | |
Lima et al. | Tachigali vulgaris energy forests: understanding spacing, age, and stem type effects on tree growth patterns and wood density | |
CN104458703B (zh) | 一种转基因水稻种子及其亲本的快速检测方法及其专用装置 | |
CN108342447B (zh) | 一种筛选与已知菌株表型相似的菌株的方法 | |
Xu et al. | Optimization of a Chlorella–Saccharomyces co–culture system for enhanced metabolite productivity | |
CN106546553A (zh) | 一种转基因大豆油的快速无损鉴别方法 | |
Santiago et al. | Path analysis and near-infrared spectroscopy in canola crop | |
Vendruscolo et al. | Genetic divergence in biomass sorghum genotypes through agronomic and physicalchemical characters. | |
CN104198409A (zh) | 一种基于可见近红外光谱技术的浸入式藻种鉴别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121107 |