CN117312968A - 一种盐碱农田土壤有机质含量的预测方法 - Google Patents
一种盐碱农田土壤有机质含量的预测方法 Download PDFInfo
- Publication number
- CN117312968A CN117312968A CN202311174232.4A CN202311174232A CN117312968A CN 117312968 A CN117312968 A CN 117312968A CN 202311174232 A CN202311174232 A CN 202311174232A CN 117312968 A CN117312968 A CN 117312968A
- Authority
- CN
- China
- Prior art keywords
- ref
- osc
- soil
- organic matter
- matter content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002689 soil Substances 0.000 title claims abstract description 66
- 239000005416 organic matter Substances 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000003513 alkali Substances 0.000 title claims abstract description 35
- 238000001228 spectrum Methods 0.000 claims abstract description 52
- 239000004016 soil organic matter Substances 0.000 claims abstract description 40
- 150000003839 salts Chemical class 0.000 claims abstract description 24
- 238000002310 reflectometry Methods 0.000 claims abstract description 18
- 230000009466 transformation Effects 0.000 claims abstract description 15
- 238000012706 support-vector machine Methods 0.000 claims abstract description 10
- 238000012937 correction Methods 0.000 claims abstract description 9
- 230000001419 dependent effect Effects 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 47
- 239000013598 vector Substances 0.000 claims description 37
- 230000003595 spectral effect Effects 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000010238 partial least squares regression Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000010220 Pearson correlation analysis Methods 0.000 claims description 6
- 238000012847 principal component analysis method Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims 1
- 238000005070 sampling Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007605 air drying Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007873 sieving Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000004383 yellowing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/55—Specular reflectivity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种盐碱农田土壤有机质含量预测方法,该方法包括步骤:计算土壤原始高光谱反射率Ref的正交信号校正(Ref‑OSC);对土壤原始高光谱反射率Ref和正交信号的Ref‑OSC进行分数阶微分变换,得到Ref‑FOD,Ref‑OSC‑FOD;分析Ref、Ref‑OSC、Ref‑FOD、Ref‑OSC‑FOD与土壤含盐量及土壤有机质含量的相关性;计算差值光谱指数DI;确定最优分数阶阶次;基于支持向量机(SVM)建立土壤有机质含量反演模型;对不同类型盐碱农田进行土壤有机质含量预测。本发明能够有效提高盐碱农田低含量有机质的估算精度,同时解决传统土壤有机质含量制图过于依赖实际样点问题。
Description
技术领域
本发明属于信息提取技术领域,具体涉及一种盐碱农田土壤有机质含量的预测方法,该方法能够消除土壤盐分因素的影响。
背景技术
土壤有机质含量是评价土壤肥力最重要的指标之一,对土壤质量提升有指导性意义。土壤有机质含量获取的传统方法是野外采集土壤样品,室内风干、研磨,采用外加热法进行测定,最后通过插值得到整个研究区的有机质含量分布图。
土壤有机质含量获取的传统方法的不足体现在:首先,费时费力,需要在每个采样点采集新鲜的土壤样品进行室内风干、研磨过筛、化学分析,耗时长,还需要有专业的操作人员,且某些采样点不易到达,限制了采样范围;其次,土壤有机质含量分布图的准确性过于依赖采样点分布及采样密度,在研究区范围过大采样点分布不均匀时,反演精度就会受到很大影响,样点过多耗时耗力,样点过少没有代表性;再次,宁夏引黄灌区盐碱地分布广,土壤有机质含量低,不易准确反演,且土壤水分对野外光谱反射率影响较大,显著弱化了反射率对土壤有机质的响应。
因此,需要提出一种盐碱农田土壤有机质含量的预测方法,适用于对土壤有机质含量低的盐碱农田进行有机质含量估算,能够获得较高反演精度,以解决现有表层盐分对野外光谱反射率影响大、低含量有机质反演技术不足的问题。
发明内容
本发明的目的在于提供一种盐碱农田土壤有机质含量的预测方法,能进一步提高盐碱农田低含量有机质的反演精度和效率。
本发明提供了一种盐碱农田土壤有机质含量的预测方法,包括如下步骤:
S1、采集盐碱农田的土壤样本,获取各土壤样本的原始高光谱反射率Ref,利用正交信号校正算法(OSC)对原始高光谱反射率Ref进行OSC变换,得到经过OSC变换的高光谱反射率Ref-OSC。
S2、利用G-L分数阶导数(G-L算法)对原始高光谱反射率Ref和经过OSC变换的高光谱反射率Ref-OSC进行分数阶微分变换,得到Ref-FOD和Ref-OSC-FOD。
S3、利用皮尔森相关性分析方法,计算步骤S1得到的Ref和Ref-OSC以及步骤S2得到的Ref-FOD和Ref-OSC-FOD分别与土壤含盐量以及土壤有机质含量的皮尔森相关性系数。
S4、基于每一阶分数阶微分变换后的光谱数据Ref-FOD和Ref-OSC-FOD,分别计算差值光谱指数DI。
S5、利用皮尔森相关性分析方法,计算差值光谱指数DI与土壤有机质含量的皮尔森相关性系数,取皮尔森相关性系数的绝对值最大时,确定为最优分数阶阶次。
S6、以最优分数阶阶次下的差值光谱指数DI为自变量,以土壤有机质含量为因变量,基于支持向量机(SVM)建立土壤有机质含量预测模型。
S7、用步骤S6建立的土壤有机质含量预测模型对不同类型盐碱农田进行土壤有机质含量预测,得到预测的土壤有机质含量。
进一步地,将步骤S1中所采集的土壤样本分为两个集合,其中部分样本用于建立土壤有机质含量预测模型,称为建模集,其余样本用来对所建立的预测模型进行精度验证,称为验证集。
进一步地,步骤S1中的所述对原始高光谱反射率Ref进行OSC变换包括如下步骤:
1)对光谱矩阵X(n×m)和待测样本矩阵Y(n×1)按照公式(1)做标准化预处理,其中,n为样本个数,m为光谱波段数;
z=(x-μ)/σ (1)
其中,z是标准化后的数据;x是原始数据;μ是原始数据均值;σ是原始数据标准差。下面所称光谱矩阵X都是标准化之后的光谱矩阵X。
2)用主成分分析法(PCA)对光谱矩阵X进行主成分分析,按照公式(2)计算光谱矩阵X的主成分得分向量t;按照重要性从高到低排序,选择第一个主成分得分向量t;
t=PC(X) (2)
其中,计算光谱矩阵X的主成分得分向量t时,通常会得到多个主成分得分向量,按照重要性从高到低排序,选择前f个作为进行正交处理的主成分,f被称为主因子数。
3)按照公式(3)将told对待测样本矩阵Y做正交化处理,得到tosc;
tosc=(I-Y(YY′)-1Y′)told (3)
其中,I为单位阵,Y′为Y标准化后的值,told为所选择的主成分得分向量t;
4)计算一个权重向量w,w为X与tosc利用偏最小二乘回归(PLS)算法、按照公式(4)计算得到的回归系数;
w=X-tosc (4)
其中,X-为PLS意义下的广义逆。
5)按照公式(5)计算新的得分向量tnew:
tnew=Xw (5)
6)判断新的tnew是否满足||tnew-told||/||tnew||<10-6,如果满足则继续执行步骤7),否则以得分向量tnew作为told,返回步骤3);
7)按照公式(6)计算载荷向量p;
p=XTt/(tTt) (6)
8)按照公式(7)从光谱矩阵X中将正交信号减去;
E=X-tPT (7)
其中P是由载荷向量p组成的载荷向量矩阵。
9)将E作为新的光谱矩阵,返回步骤2),开始计算新的t、p、w,直至循环完光谱矩阵X中所有的主因子数f,所述主因子数f为需正交处理的主成分的数量。
10)最终高光谱反射率Ref经OSC校正后的光谱矩阵Xosc按照公式(8)求出:
Xosc=E-tPT (8)
进一步地,在步骤S2中,利用公式(9)对原始高光谱反射率Ref和经过OSC变换的高光谱反射率Ref-OSC进行分数阶微分变换。
其中,x为自变量;α为阶数;Г(-α+1)和Г(-α+n+1)表示Gamma函数;n是微分上下限差。
进一步地,在步骤S3中,利用公式(10)计算与土壤有机质含量/土壤含盐量的皮尔森相关性系数:
其中,N为样本数量,A是有机质含量或含盐量,Ai为第i个有机质含量或含盐量,B是Ref、Ref-OSC、Ref-FOD和Ref-OSC-FOD四种光谱数据之一,Bi是第i个波段的Ref、Ref-OSC、Ref-FOD或Ref-OSC-FOD,μA为有机质含量或含盐量的平均值,μB为高光谱波段的平均值,RA是有机质含量或含盐量的标准差,RB是高光谱波段的标准差,R为皮尔逊相关性系数。
进一步地,在步骤S4中,利用公式(11)计算差值光谱指数DI。
DI=Ri α- Rj α (11)
其中,Rα为α阶微分的Ref-FOD或Ref-OSC-FOD;i和j为400~2400nm任意不等的两光谱波段。
进一步地,在步骤S5中确定的最优分数阶阶次为1.25阶。
进一步地,本发明的盐碱农田土壤有机质含量的预测方法还包括:
步骤S8、通过建模集决定系数(Rc 2)、均方根误差(RMSE1)和验证集决定系数(Rp 2)、均方根误差(RMSE2)和相对分析误差(RPD)对步骤S6建立的土壤有机质含量预测模型进行精度验证。
进一步地,在步骤S8中,利用公式(12)计算决定系数Rc 2和Rp 2。
利用公式(13)计算均方根误差RMSE1和RMSE2。
利用公式(14)计算相对分析误差RPD。
上述公式(12)-(14)中,x和分别为实测值和实测值的平均值,y和/>分别为预测值和预测值的平均值。yi为模型预测值;/>为模型实测值;/>为模型预测值的平均值;n为模型验证的样本数量;yRMSE为模型均方根误差。
本发明的有益效果是:
发明使用正交信号校正-分数阶微分法(OSC-FOD)有效消除土壤盐分对表层土壤反射率的影响,凸显低含量有机质敏感波段,能够有效提高盐碱农田低含量有机质的估算精度,同时解决传统土壤有机质含量制图过于依赖实际样点问题,减少野外采样的时间、人力、物力及财力,为野外高光谱数据的应用、盐碱农田低含量有机质的监测提供了新思路。
附图说明
图1是图示了光谱数据与含盐量(a)和有机质(b)的相关性的示意图。
图2是图示了基于FOD处理的光谱数据与有机质的相关性的示意图。
图3是支持向量机建模运行机理的示意图。
图4是基于Ref-OSC-FOD的SVR模型土壤有机质实测值(A)与预测值(B)插值图。
具体实施方式
现在将参考附图来详细描述本发明的示例性实施方式。应当理解,附图中示出和描述的实施方式仅仅是示例性的,意在阐释本发明的原理和精神,而并非限制本发明的范围。
本发明实施例提供了一种盐碱农田土壤有机质含量的预测方法,包括如下步骤:
S1、采集盐碱农田的土壤样本,获取各土壤样本的原始高光谱反射率Ref,利用正交信号校正算法(OSC)对原始高光谱反射率Ref进行OSC变换,得到经过OSC变换的高光谱反射率Ref-OSC。
正交信号校正法(OSC)主要用于近红外光谱矩阵的预处理,其基本思想是:利用数学上正交的方法,将原始光谱矩阵X中与待测品质Y不相关的部分信息滤除。也就是说,原始光谱矩阵X中被滤除的信息是与待测品质Y在数学上正交的。因此,正交信号校正法能确保被滤除掉的信息与待测品质无关。
宁夏引黄灌区是盐碱农田,本实施例采集宁夏引黄灌区盐碱农田462个土壤样本。将462个土壤样本随机分为两组,其中308个样本用于建立土壤有机质含量预测模型,称为建模集,其余154个样本用来对所建立的预测模型进行精度验证,称为验证集。本实施例的步骤S1中,对建模集中的308个土壤样本的原始高光谱反射率Ref进行OSC变换.,以有效去除土壤盐分对高光谱反射率的影响。
为了得到与Y正交的矢量,将光谱矩阵X分解为得分矩阵T和载荷矩阵PT,使T与Y正交化,即TTY=YTT=0。于是我们的问题就转化为如何求解与Y正交的矢量的问题。为了区分,分别用t、p、w表示OSC的得分向量、载荷向量和权重向量。
步骤S1中的所述对原始高光谱反射率Ref进行OSC变换进一步包括如下步骤:
1)对光谱矩阵X(n×m)和待测样本矩阵Y(n×1)按照公式(1)做标准化预处理,其中,n为样本个数,m为光谱波段数;
z=(x-μ)/σ (1)
其中,z是标准化后的数据;x是原始数据;μ是原始数据均值;σ是原始数据标准差。下面所称光谱矩阵X都是标准化之后的光谱矩阵X。
2)用主成分分析法(PCA)对光谱矩阵X进行主成分分析,按照公式(2)计算光谱矩阵X的主成分得分向量t;按照重要性从高到低排序,选择第一个主成分得分向量执行步骤3);
t=PC(X) (2)
其中,计算光谱矩阵X的主成分得分向量t时,通常会得到多个主成分得分向量,按照重要性从高到低排序,选择前f个作为进行正交处理的主成分,f被称为主因子数。
3)按照公式(3)将told对待测样本矩阵Y做正交化处理,得到tosc;
tosc=(I-Y(YY′)-1Y′)told (3)
其中,I为单位阵,Y′为Y标准化后的值,told为所选择的主成分得分向量t;
4)计算一个权重向量w,w为X与tosc利用偏最小二乘回归(PLS)算法、按照公式(4)计算得到的回归系数;
w=X-tosc (4)
其中,X-为PLS意义下的广义逆。
5)按照公式(5)计算新的得分向量tnew:
tnew=Xw (5)
6)判断新的tnew是否满足||tnew-told||/||tnew||<10-6,如果满足则继续执行步骤7),否则以得分向量tnew作为told,返回步骤3);
以上步骤3)-步骤6)迭代的目的是为了使tnew尽可能的接近于tosc,使得tosc既与Y正交,又能很好的综合X的信息。
7)按照公式(6)计算载荷向量p;
p=XTt/(tTt) (6)
其中,计算载荷向量p的目的是确保每个新的主成分与之前的主成分正交。
8)按照公式(7)从光谱矩阵X中将正交信号减去,得到新的光谱矩阵E;
E=X-tPT (7)
其中P是由载荷向量p组成的载荷向量矩阵。
9)将E作为新的光谱矩阵,返回步骤2),开始计算新的t、p、w,直至循环完光谱矩阵X中所有的主因子数f,所述主因子数f为需正交处理的主成分的数量。
需要注意的是,如果从原始的光谱矩阵X中减去许多OSC分量,将得到多元线性回归(MLR),因为所有与Y无关的信息都被删除了。然而仅使用两个或三个组件进行过滤不会导致这类问题。
10)最终高光谱反射率Ref经OSC校正后的光谱矩阵Xosc按照公式(8)求出:
Xosc=E-tPT (8)
此外,步骤S1中的所述对原始高光谱反射率Ref进行OSC变换还可以通过其他方式实现。例如,可以在The Unscrambler X 10.4软件通过Tasks→Transform→StandardNormal Variate实现,也可通过MATLAB软件进行编程实现。
S2、利用G-L分数阶导数(G-L算法)对原始高光谱反射率Ref和经过OSC变换的高光谱反射率Ref-OSC进行分数阶微分变换,得到Ref-FOD和Ref-OSC-FOD。利用公式(9)进行分数阶微分变换。
其中,x为自变量;α为阶数;Г(-α+1)和Г(-α+n+1)表示Gamma函数;n是微分上下限差。
本实施例中,计算0~2阶微分,间隔为0.25阶,其中,α=0.0表示原始光谱,α=1.0表示一阶微分,α=2.0则表示二阶微分。
S3、利用皮尔森相关性分析方法,计算步骤S1得到的Ref和Ref-OSC以及步骤S2得到的Ref-FOD和Ref-OSC-FOD分别与土壤含盐量以及土壤有机质含量的皮尔森相关性系数。
利用公式(10)计算皮尔森相关性系数:
其中,N为样本数量,A是有机质含量或含盐量,Ai为第i个有机质含量或含盐量,B是Ref、Ref-OSC、Ref-FOD和Ref-OSC-FOD四种光谱数据之一,Bi是第i个波段的Ref、Ref-OSC、Ref-FOD或Ref-OSC-FOD,μA为有机质含量或含盐量的平均值,μB为高光谱波段的平均值,RA是有机质含量或含盐量的标准差,RB是高光谱波段的标准差,R为皮尔逊相关性系数。
图1(a)图示了光谱数据与土壤含盐量的相关性,图1(b)图示了光谱数据与土壤有机质含量的相关性。
如图1所示,相较于原始高光谱反射率,经OSC和OSC-FOD处理后的高光谱数据与土壤含盐量的相关性明显降低,说明OSC和OSC-FOD算法能够有效去除高光谱数据中受含盐量影响的信息;相较于原始高光谱反射率,经OSC和OSC-FOD算法变换后的高光谱数据与土壤有机质含量的相关性得到明显增强。上述现象反映出经过OSC和OSC-FOD处理后,可以有效去除土壤含盐量因素的影响,同时还可以增强高光谱数据中与土壤有机质含量相关的信息,进而提高后期所建立的土壤有机质含量预测模型的精度。
S4、基于每一阶分数阶微分变换后的光谱数据Ref-FOD和Ref-OSC-FOD,分别计算差值光谱指数DI。
利用公式(11)计算差值光谱指数DI。
DI=Ri α- Rj α (11)
其中,Rα为α阶微分的Ref-FOD或Ref-OSC-FOD;i和j为400~2400nm任意不等的两光谱波段。
此处的差值光谱指数DI是把之前的一维光谱数据Ref-FOD和Ref-OSC-FOD,提升到了二维,得到两两不同波段间进行运算后得到的新光谱数据。
S5、利用皮尔森相关性分析方法,计算差值光谱指数DI与土壤有机质含量的皮尔森相关性系数,取皮尔森相关性系数的绝对值最大时,确定为最优分数阶阶次。
图2图示了基于FOD处理的光谱数据Ref-FOD和Ref-OSC-FOD与土壤有机质含量的相关性。与0阶(原始光谱)相比,Ref-FOD和Ref-OSC-FOD与土壤有机质含量间的相关性得到增强时的阶次为更优阶次。如图2所示,在分数阶为1.25阶时,皮尔森相关性系数的绝对值最大,也就是说,最优分数阶阶次为1.25阶,且此时Ref-OSC-FOD效果明显高于Ref-FOD。
S6、以最优分数阶阶次下的差值光谱指数DI为自变量,以土壤有机质含量为因变量,基于支持向量机(SVM)建立土壤有机质含量预测模型。
图3图示了支持向量机建模运行机理:输入数据,先利用核函数进行非线性变换,然后按照均方误差最小原则求最优解,最后得到分类决策函数y。
S7、用步骤S6建立的土壤有机质含量预测模型对不同类型盐碱农田进行土壤有机质含量预测,得到预测的土壤有机质含量。
本实施例中,对宁夏引黄灌区不同类型盐碱农田进行土壤有机质含量预测,结果如图4所示。图4(A)图示了基于Ref-OSC-FOD的SVR模型土壤有机质含量的实测值,图4(B)图示了基于Ref-OSC-FOD的SVR模型土壤有机质含量的预测值。
S8、通过建模集决定系数(Rc 2)、均方根误差(RMSE1)和验证集决定系数(Rp 2)、均方根误差(RMSE2)和相对分析误差(RPD)对步骤S6建立的土壤有机质含量预测模型进行精度验证。
本实施例共采集462个土壤样本,其中308个样本用于建立土壤有机质含量预测模型,称为建模集,其余154个土壤样本用来对所建立的预测模型进行精度验证,称为验证集。
利用公式(12)计算决定系数Rc 2和Rp 2。
利用公式(13)计算均方根误差RMSE1和RMSE2。
利用公式(14)计算相对分析误差RPD。
上述公式(12)-(14)中,x和分别为实测值和实测值的平均值,y和/>分别为预测值和预测值的平均值。yi为模型预测值;/>为模型实测值;/>为模型预测值的平均值;n为模型验证的样本数量;yRMSE为模型均方根误差。
R2越大、RMSE越小,则模型预测效果越佳。一般情况下,RPD≤1.4,表明模型的拟合性和稳定性非常差;1.4<RPD≤1.8,模型可以提供较为合理的预测结果;1.8<RPD≤2.0,模型的预测能力较好;RPD≥2.0,说明模型具有极好的预测能力。
为了客观评价步骤S6所建立的预测模型的模型精度,将其与未消除盐分因素的原始高光谱反射率Ref、正交信号校正的高光谱反射率Ref-OSC、经分数阶微分变换后的反射率Ref-FOD和Ref-OSC-FOD所筛选的波段反射率组成的DI的反演模型建模精度相比,结果如表1所示。
表1反射率不同处理方法下有机质反演模型的精度
如表1所示,直接用原始光谱反射率反演的有机质含量模型Rc 2、RMSE、RP 2和RPD分别为0.239、3.44、0.212和1.09;经OSC后的Rc 2、RMSE和RP 2分别为0.504、2.61和1.99;经FOD变换后的Rc 2、RMSE和RP 2分别为0.538、2.67和0.541;经OSC-FOD变换后建立的土壤有机质含量预测模型的Rc 2、RMSE、RP 2和RPD分别为0.746、2.35、0.784和2.05。可见,本实施例中的验证集决定系数Rp 2为0.784,相对分析误差RPD为2.05,说明所建立的预测模型具有较好的预测能力,进一步说明OSC算法可以有效去除盐分因素的影响,显著提高所建模型精度。
本发明实施例所建立的土壤有机质含量预测模型有效地提高了土壤有机质含量的反演精度,消除盐分影响后的模型反演能力显著提升,更适用于盐碱地区土壤有机质含量的反演。
上面结合实施例对本发明作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。本发明中未作详细描述的内容均可以采用现有技术。
Claims (9)
1.一种盐碱农田土壤有机质含量的预测方法,其特征在于,包括以下步骤:
S1、采集盐碱农田的土壤样本,获取各土壤样本的原始高光谱反射率Ref,利用正交信号校正算法(OSC)对原始高光谱反射率Ref进行OSC变换,得到经过OSC变换的高光谱反射率Ref-OSC;
S2、利用G-L分数阶导数(G-L算法)对原始高光谱反射率Ref和经过OSC变换的高光谱反射率Ref-OSC进行分数阶微分变换,得到Ref-FOD和Ref-OSC-FOD;
S3、利用皮尔森相关性分析方法,计算步骤S1得到的Ref和Ref-OSC以及步骤S2得到的Ref-FOD和Ref-OSC-FOD分别与土壤含盐量以及土壤有机质含量的皮尔森相关性系数;
S4、基于每一阶分数阶微分变换后的光谱数据Ref-FOD和Ref-OSC-FOD,分别计算差值光谱指数DI;
S5、利用皮尔森相关性分析方法,计算差值光谱指数DI与土壤有机质含量的皮尔森相关性系数,取皮尔森相关性系数的绝对值最大时,确定为最优分数阶阶次;
S6、以最优分数阶阶次下的差值光谱指数DI为自变量,以土壤有机质含量为因变量,基于支持向量机(SVM)建立土壤有机质含量预测模型;
S7、用步骤S6建立的土壤有机质含量预测模型对不同类型盐碱农田进行土壤有机质含量预测,得到预测的土壤有机质含量。
2.根据权利要求1所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,步骤S1中所采集的土壤样本分为两个集合,其中部分样本用于建立土壤有机质含量预测模型,称为建模集,其余样本用来对所建立的预测模型进行精度验证,称为验证集。
3.根据权利要求2所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,步骤S1包括以下步骤:
1)对光谱矩阵X(n×m)和待测样本矩阵Y(n×1)按照公式(1)做标准化预处理,其中,n为样本个数,m为光谱波段数;
z=(x-μ)/σ (1)
其中,z是标准化后的数据;x是原始数据;μ是原始数据均值;σ是原始数据标准差;下面所称光谱矩阵X都是标准化之后的光谱矩阵X;
2)用主成分分析法(PCA)对光谱矩阵X进行主成分分析,按照公式(2)计算光谱矩阵X的主成分得分向量t;按照重要性从高到低排序,选择第一个主成分得分向量t;
t=PC(X) (2)
其中,计算光谱矩阵X的主成分得分向量t时得到多个主成分得分向量,按照重要性从高到低排序,选择前f个作为进行正交处理的主成分,f被称为主因子数;
3)按照公式(3)将told对待测样本矩阵Y做正交化处理,得到tosc;
tosc=(I-Y(YY′)-1Y′)told (3)
其中,I为单位阵,Y′为Y标准化后的值,told为所选择的主成分得分向量t;
4)计算一个权重w,w为X与tosc利用偏最小二乘回归(PLS)算法、按照公式(4)计算得到的回归系数;
w=X-tosc (4)
其中,X-为PLS意义下的广义逆;
5)按照公式(5)计算新的得分向量tnew:
tnew=Xw (5)
6)判断新的tnew是否满足||tnew-told||/||tnew||<10-6,如果满足则继续执行步骤7),否则返回步骤3);
7)按照公式(6)计算载荷向量p;
p=XTt/(tTt) (6)
8)按照公式(7)从光谱矩阵X中将正交信号减去;
E=X-tPT (7)
其中P是由载荷向量p组成的载荷向量矩阵;
9)将E作为新的光谱矩阵,返回步骤2),开始计算新的t、p、w,直至循环完光谱矩阵X中所有的主因子数f,所述主因子数f为需正交处理的主成分的数量;
10)最终高光谱反射率Ref经OSC校正后的光谱矩阵Xosc按照公式(8)求出:
Xosc=E-tPT (8)。
4.根据权利要求1所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,在步骤S2中,利用公式(9)进行分数阶微分变换:
其中,x为自变量;α为阶数;Г(-α+1)和Г(-α+n+1)表示Gamma函数;n是微分上下限差。
5.根据权利要求1所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,在步骤S3中,利用公式(10)计算皮尔森相关性系数:
其中,N为样本数量,A是有机质含量或含盐量,Ai为第i个有机质含量或含盐量,B是Ref、Ref-OSC、Ref-FOD和Ref-OSC-FOD四种光谱数据之一,Bi是第i个波段的Ref、Ref-OSC、Ref-FOD或Ref-OSC-FOD,μA为有机质含量或含盐量的平均值,μB为高光谱波段的平均值,RA是有机质含量或含盐量的标准差,RB是高光谱波段的标准差,R为皮尔逊相关性系数。
6.根据权利要求1所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,在步骤S4中,利用公式(11)计算差值光谱指数DI;
DI=Ri α-Rj α (11)
其中,Rα为α阶微分的Ref-FOD或Ref-OSC-FOD;i和j为400~2400nm任意不等的两光谱波段。
7.根据权利要求1所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,在步骤S5中确定的最优分数阶阶次为1.25阶。
8.根据权利要求2所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,该方法还包括步骤S8、通过建模集决定系数(Rc 2)、均方根误差(RMSE1)和验证集决定系数(Rp 2)、均方根误差(RMSE2),以及相对分析误差(RPD)对步骤S6建立的土壤有机质含量预测模型进行精度验证。
9.根据权利要求8所述的一种盐碱农田土壤有机质含量的预测方法,其特征在于,在步骤S8中,利用公式(12)计算决定系数Rc 2和Rp 2;
利用公式(13)计算均方根误差RMSE1和RMSE2;
利用公式(14)计算相对分析误差RPD;
上述公式(12)-(14)中,x和分别为实测值和实测值的平均值,y和/>分别为预测值和预测值的平均值;yi为模型预测值;/>为模型实测值;/>为模型预测值的平均值;n为模型验证的样本数量;yRMSE为模型均方根误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311174232.4A CN117312968A (zh) | 2023-09-12 | 2023-09-12 | 一种盐碱农田土壤有机质含量的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311174232.4A CN117312968A (zh) | 2023-09-12 | 2023-09-12 | 一种盐碱农田土壤有机质含量的预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117312968A true CN117312968A (zh) | 2023-12-29 |
Family
ID=89254529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311174232.4A Pending CN117312968A (zh) | 2023-09-12 | 2023-09-12 | 一种盐碱农田土壤有机质含量的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117312968A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118397482A (zh) * | 2024-03-21 | 2024-07-26 | 中国科学院南京土壤研究所 | 一种基于聚类-混合的无人机高光谱土壤属性监测方法 |
CN118429564A (zh) * | 2024-07-03 | 2024-08-02 | 江西省地质局地理信息工程大队 | 基于机器学习的南方丘陵土壤三维建模方法 |
CN118443600A (zh) * | 2024-07-08 | 2024-08-06 | 中国科学院空天信息创新研究院 | 地-星光谱差分精配准的土壤有机质含量确定方法及装置 |
-
2023
- 2023-09-12 CN CN202311174232.4A patent/CN117312968A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118397482A (zh) * | 2024-03-21 | 2024-07-26 | 中国科学院南京土壤研究所 | 一种基于聚类-混合的无人机高光谱土壤属性监测方法 |
CN118429564A (zh) * | 2024-07-03 | 2024-08-02 | 江西省地质局地理信息工程大队 | 基于机器学习的南方丘陵土壤三维建模方法 |
CN118443600A (zh) * | 2024-07-08 | 2024-08-06 | 中国科学院空天信息创新研究院 | 地-星光谱差分精配准的土壤有机质含量确定方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117312968A (zh) | 一种盐碱农田土壤有机质含量的预测方法 | |
CN103854305B (zh) | 一种基于多尺度建模的模型传递方法 | |
CN107958267B (zh) | 一种基于光谱线性表示的油品性质预测方法 | |
CN104089911A (zh) | 基于一元线性回归的光谱模型传递方法 | |
CN106706553A (zh) | 一种快速无损测定玉米单籽粒直链淀粉含量的方法 | |
CN105486655A (zh) | 基于红外光谱智能鉴定模型的土壤有机质快速检测方法 | |
CN110987866A (zh) | 一种汽油性质评价方法及装置 | |
WO2020248961A1 (zh) | 一种无参考值的光谱波数选择方法 | |
CN105223140A (zh) | 同源物质的快速识别方法 | |
CN114611582A (zh) | 一种基于近红外光谱技术分析物质浓度的方法及系统 | |
CN112651173B (zh) | 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统 | |
CN111141809B (zh) | 一种基于非接触式电导信号的土壤养分离子含量检测方法 | |
CN114002162A (zh) | 土壤有机碳含量估算方法、设备、存储介质及程序产品 | |
CN111337452A (zh) | 一种验证光谱数据模型转移算法可行性的方法 | |
CN116818687B (zh) | 基于光谱引导集成学习的土壤有机碳光谱预测方法及装置 | |
CN109145403B (zh) | 一种基于样本共识的近红外光谱建模方法 | |
CN111896497A (zh) | 一种基于预测值的光谱数据修正方法 | |
CN113049526B (zh) | 一种基于太赫兹衰减全反射的玉米种子水分含量测定方法 | |
CN114062306B (zh) | 一种近红外光谱数据分段预处理方法 | |
CN115392305A (zh) | 基于改进时间卷积网络的土壤有机质含量高光谱建模方法 | |
CN114878508A (zh) | 一种基于高光谱成像土遗址文物表面含水量检测方法 | |
CN115015161A (zh) | 一种煤质成分预测方法 | |
Zhang et al. | Methodology for Regional Soil Organic Matter Prediction with Spectroscopy: Optimal Sample Grouping, Input Variables, and Prediction Model | |
CN114813631B (zh) | 小麦品种纯度检测方法、装置和电子设备 | |
CN111220565A (zh) | 一种基于cpls的红外光谱测量仪器标定迁移方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |