CN117521021A - 一种基于气候变化预测极寒天气的模型与方法 - Google Patents
一种基于气候变化预测极寒天气的模型与方法 Download PDFInfo
- Publication number
- CN117521021A CN117521021A CN202311440862.1A CN202311440862A CN117521021A CN 117521021 A CN117521021 A CN 117521021A CN 202311440862 A CN202311440862 A CN 202311440862A CN 117521021 A CN117521021 A CN 117521021A
- Authority
- CN
- China
- Prior art keywords
- air temperature
- cold weather
- model
- extremely cold
- climate change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008859 change Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000006870 function Effects 0.000 claims abstract description 80
- 238000002790 cross-validation Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 14
- 230000000694 effects Effects 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 42
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000007476 Maximum Likelihood Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 6
- 238000002759 z-score normalization Methods 0.000 claims description 6
- 238000003916 acid precipitation Methods 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000003628 erosive effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000005855 radiation Effects 0.000 claims description 3
- 238000011425 standardization method Methods 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000010801 machine learning Methods 0.000 abstract description 5
- 238000011160 research Methods 0.000 abstract description 5
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000007246 mechanism Effects 0.000 abstract description 3
- 238000004445 quantitative analysis Methods 0.000 abstract description 3
- 238000007619 statistical method Methods 0.000 abstract description 3
- 238000010276 construction Methods 0.000 abstract description 2
- 238000012502 risk assessment Methods 0.000 abstract description 2
- 230000006978 adaptation Effects 0.000 abstract 1
- 238000011156 evaluation Methods 0.000 description 9
- 238000000638 solvent extraction Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种基于气候变化预测极寒天气的模型与方法,包括:构建极寒天气现象指标以及气候变化指标;构建信息增益模型;构建基于Sigmoid函数的二分类回归预测模型;对基于Sigmoid函数的二分类回归预测模型进行求解;利用K折交叉验证模型对基于Sigmoid函数的二分类回归预测模型进行迭代训练,并使用常规评级指标评价模型效果。针对气候变化预测极寒天气进行定量分析和构建模型,充分利用多源数据并通过统计分析和机器学习技术实现了对极寒天气的准确预测,解决了影响极寒天气的因素之间相互作用机制不明确的问题,本发明的应用将对气候研究、风险评估与灾害管理、气候适应与可持续发展、决策支持和科学研究领域产生广泛而积极的影响。
Description
技术领域
本发明涉及环境科学领域,具体涉及一种基于气候变化预测极寒天气的模型与方法。
背景技术
气候变化是当前全球面临的重要挑战之一,寒冷气候条件下的极端天气事件对人类社会、经济和生态环境都带来了巨大影响。科学家们已经证实了气候变化与极端天气事件之间的关联,极寒天气事件通常受到多个复杂因素的影响,如大气环流、海洋表面温度、地表特征等,但这些因素之间的相互作用和影响机制并不完全清楚。
目前,已有的气候模型和预测方法主要用于分析气候变化的趋势和模式,包括全球气候模型、区域气候模型等。但对于气候变化的极寒天气预测,现有技术在量化分析和预测方面还存在一定的局限性;除此之外,对于极寒天气事件的研究相对较少且缺乏深入的定量分析和预测模型方法。
因此,本发明提出一种基于气候变化预测极寒天气的模型与方法,基于大量的观测数据和气候模拟结果,并且通过综合考虑多个关键因素,利用统计分析和机器学习技术构建了一个可靠的预测和分析模型,通过气候变化影响因素预测极寒天气出现的时间,除此之外,本发明还涉及一种针对气候变化和极寒天气事件的特定参数和指标的分析预测方法,使得对气候变化与极寒天气关系的评估更加全面和准确。
本发明提出的量化模型与方法、数据处理与模型构建技术以及特定参数与指标的分析方法将为气候研究和风险评估领域提供创新解决方案,产生更加积极而广泛的影响。
发明内容
本发明针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。
一种基于气候变化预测极寒天气的方法,包括:
S1:构建极寒天气现象指标以及气候变化指标;
S2:构建信息增益模型,具体地,通过所述极寒天气现象指标以及所述的气候变化指标划分得到气温数据集,计算所述气温数据集的混乱程度并进一步得到所述气温数据集的信息增益;
所述混乱程度的计算公式如下:
其中,X表示气温数据,p(xi)表示样本xi出现的概率,H(X)表示气温数据集的混乱程度;
所述信息增益的计算公式如下:
Gain(X,A)=H(X)-H(X|A),
其中,X、A均表示气温数据,H(X|A)为在已知随机变量A的条件下随机变量X的不确定性,H(X)表示所述气温数据集的混乱程度,Gain(X,A)表示数据A对数据X的信息增益;
S3:构建基于Sigmoid函数的二分类回归预测模型,具体地,对所述气温数据集的分类边界线建立回归公式,再通过Sigmoid函数映射影响气候变化的特征要素,并使用梯度上升法找到最佳拟合参数集,以所述分类边界线对所述最佳拟合参数集进行分类,得到基于Sigmoid函数的二分类回归预测模型;
S4:对S3所述基于Sigmoid函数的二分类回归预测模型进行求解,具体地,使用z-score标准化方法对所述影响气候变化的特征要素进行标准化处理,再根据所述影响气候变化的特征要素构建影响因素向量,并将所述影响因素向量输入到所述基于Sigmoid函数的二分类回归预测模型以得到所述影响气候变化的特征要素相应的回归系数;
所述z-score标准化的公式为:
其中,表示特征要素i标准化后的值、xi表示特征要素i的原始数据、μi表示特征要素i的平均数、σi表示特征要素i的标准差;
S5:利用K折交叉验证模型对所述基于Sigmoid函数的二分类回归预测模型进行迭代训练,并使用常规评级指标评价模型效果。
更进一步地,所述极寒天气现象指标是通过以下方式获取的:
提取某地区的月度平均最低气温,将出现极寒天气的月份标记为1,其余月份标记为0,作为极寒天气现象指标。
更进一步地,所述气候变化指标是通过以下方式获取的:
提取两段相同时间长度的全球气温数据并计算对应的平均气温,再计算所述平均气温的差值,将所述两段相同时间长度的全球气温数据对应的平均气温相对比,若平均温度提高则标记为1,若平均气温下降或平均气温不变,则标记为0,作为气候变化指标。
更进一步地,S3中需要把所述气温数据集中的数据输入到Sigmoid函数中进行计算,并将计算结果的数值映射到[0,1]区间以对所述气温数据集进行分类;
所述Sigmoid函数的计算公式为:
其中,x表示气温数据集中的数据,S(x)表示出现极寒天气的概率。
Sigmoid函数常被用作神经网络的激活函数,输出范围为(0,1),在数据传递的过程中不容易发散,能很好地表示预测概率问题,可以用来处理二分类问题,并且能够抑制误差。
更进一步地,S3中所述影响气候变化的特征要素需要构建成特征要素向量,并结合参数特征向量得到所述基于Sigmoid函数的二分类回归预测模型的概率函数;
所述概率函数为:
其中,x表示特征要素向量,θ表示参数特征向量,hθ(x)表示出现极寒天气现象的概率,hθ(x)的计算公式为:
其中,θT表示特征要素向量的系数,x表示特征要素向量。
更进一步地,S3所述最佳拟合参数是通过建立二分类关联的代价概率函数并求解所述代价概率函数的最大值对应的参数特征向量得到的;
所述代价概率函数为:
cost(hθ(x),y)=hθ(x)y(1-hθ(x))(1-y),
其中,x表示特征要素向量,y表示0-1向量,hθ(x)表示出现极寒天气现象的概率。
所述代价概率函数用于估量模型在训练集中的表现,表示预测值和真实值之间不一致的程度。
所述代价概率函数的作用在于确定函数中的最优参数,使得拟合数据点的误差达到最小,即拟合效果最好;可以帮助我们更好地衡量、训练和改进模型以使得适应各种不同的任务和问题。
更进一步地,所述代价概率函数的求解过程包括:对所述代价概率函数取对数得到对数似然函数,并通过最大似然估计进行参数求解找出能最大概率生成观测数据的参数以确定对所述基于Sigmoid函数的二分类回归预测模型进行最大似然估计的迭代方程;
所述对数似然函数为:
能最大概率生成观测数据的参数的计算公式为:
最终确定的对所述基于Sigmoid函数的二分类回归预测模型进行最大似然估计的迭代方程为:
其中,表示更新后的特征要素j系数的最大似然估计值,θj表示特征要素j的系数估计值,α表示收敛系数,S(θTx)表示出现极寒天气现象的概率,θT表示特征要素的系数向量,x表示特征要素的数值,y(i)表示在特征要素i的影响下是否出现极寒天气,x(i)、/>表示特征要素的数值,i、j表示特征要素向量的角标,hθ(x(i))表示出现极寒天气的概率。
更进一步地,在进行S4所述z-score标准化处理之前,还需要利用信息增益模型分别计算极寒天气现象指标和气候变化指标的原始信息熵和对应的信息增益。
信息增益用来进行决策树的划分属性选择,信息熵越小说明样本集合的纯度越高,信息增益越大使用某一属性进行划分所获得的纯度提升越大,即越应该被选做划分属性。
更进一步地,S4所述影响因素向量包括:气候变化平均差额、海洋表面平均温度、CO2浓度、总降雨降雪量、PM2.5空气质量指数(AQI)、空气湿度、土地侵蚀率、高温区间的地球表面面积占比(日最高气温高于32℃)、季度气温平均差额、时间要素(年)、时间要素(月)、地球辐射差额、酸雨发生率、森林覆盖率、人口增量。
更进一步地,S5所述K折交叉验证,是将所述气温数据集分成K个子样本,其中,一个单独的子样本作为验证模型的数据,剩下的K-1个子样本用来进行训练,并重复K次交叉验证以使得每一个子样本都能得到一次验证,再平均K次交叉验证的结果或使用其它结合方式得到单一估测以验证模型性能。
K折交叉验证被用于评估一个机器学习模型的表现,即重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。
K折交叉验证可以避免固定划分数据集的局限性、特殊性。
本发明的技术效果在于:本发明提出了一种基于气候变化预测极寒天气的模型与方法,针对气候变化预测极寒天气进行定量分析和构建模型,充分利用多源数据并通过统计分析和机器学习技术实现了对极寒天气的准确预测,解决了影响极寒天气的因素之间相互作用机制不明确的问题,揭示了一种新的数据处理和模型构建方法,以及特定参数与指标的分析方法,不仅为气候研究领域提供新的视角和工具,而且决策者可以更好地评估极寒天气事件的风险和潜在影响,从而制定更有效的灾害管理策略,减少潜在的经济和社会风险,除此之外,本发明也为可持续发展提供了重要参考。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。
图1是根据本发明的实施例提供的一种基于气候变化预测极寒天气的方法流程图。
图2是根据本发明的实施例提供的一种基于气候变化预测极寒天气的方法的极寒天气可视化图。
图3是根据本发明的实施例提供的一种基于气候变化预测极寒天气的方法的局部极寒地区温度与全球气温比较图。
图4是根据本发明的实施例提供的一种基于气候变化预测极寒天气的方法的随机梯度上升算法效率比较图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
图1是根据本发明的实施例提供的一种基于气候变化预测极寒天气的方法流程图。包括:
S1:构建极寒天气现象指标以及气候变化指标;
S2:构建信息增益模型,具体地,通过所述极寒天气现象指标以及所述的气候变化指标划分得到气温数据集,计算所述气温数据集的混乱程度并进一步得到所述气温数据集的信息增益;
所述混乱程度的计算公式如下:
其中,X表示气温数据,p(xi)表示样本xi出现的概率,H(X)表示气温数据集的混乱程度;
所述信息增益的计算公式如下:
Gain(X,A)=H(X)-H(X|A),
其中,X、A均表示气温数据,H(X|A)为在已知随机变量A的条件下随机变量X的不确定性,H(X)表示所述气温数据集的混乱程度,Gain(X,A)表示数据A对数据X的信息增益;
S3:构建基于Sigmoid函数的二分类回归预测模型,具体地,对所述气温数据集的分类边界线建立回归公式,再通过Sigmoid函数映射影响气候变化的特征要素,并使用梯度上升法找到最佳拟合参数集,以所述分类边界线对所述最佳拟合参数集进行分类,得到基于Sigmoid函数的二分类回归预测模型;
S4:对S3所述基于Sigmoid函数的二分类回归预测模型进行求解,具体地,使用z-score标准化方法对所述影响气候变化的特征要素进行标准化处理,再根据所述影响气候变化的特征要素构建影响因素向量,并将所述影响因素向量输入到所述基于Sigmoid函数的二分类回归预测模型以得到所述影响气候变化的特征要素相应的回归系数;
所述z-score标准化的公式为:
其中,表示特征要素i标准化后的值、xi表示特征要素i的原始数据、μi表示特征要素的平均数、σi表示特征要素i的标准差;
S5:利用K折交叉验证模型对所述基于Sigmoid函数的二分类回归预测模型进行迭代训练,并使用常规评级指标评价模型效果。
需要说明的是,所述极寒天气现象指标是通过以下方式获取的:
提取某地区的月度平均最低气温,将出现极寒天气的月份标记为1,其余月份标记为0,作为极寒天气现象指标。
在一个具体的实施例中,以某个局部地区代表基站的月度平均最低气温样本数据进行分析,根据寒冷程度等级表中的规定:气温在-40℃以下的是极寒天气,将该地区月平均最低气温在-40℃以下的月份标记为1,其余月份标记为0,作为极寒天气现象指标;
如图2所示,白色表示出现极寒天气,极寒天气在该地区中普遍出现于1月,2月和12月,且基本没有呈现出周期性特征。
可以理解的是,在图3中使用某个出现极寒天气地区的年份温度与全球平均年温度进行比较,年最低气温在-40℃以下的年份出现了极寒天气。
需要说明的是,所述气候变化指标是通过以下方式获取的:
提取两段相同时间长度的全球气温数据并计算对应的平均气温,再计算所述平均气温的差值,将所述两段相同时间长度的全球气温数据对应的平均气温相对比,若平均温度提高则标记为1,若平均气温下降或平均气温不变,则标记为0,作为气候变化指标。
在一个具体的实施例中,参照世界气象组织WMO规定,设定标准气候计算的时间长度为30年,计算每年对应的前30年的平均温度与前30-60年间的平均温度差值P(climate_change),
并将所述两段时间长度为30年的平均气温对比,若前30年的平均温度相对于前30-60年间的平均温度有所提高则标记为1,若前30年的平均气温相比于前30-60年间的平均温度有所下降或平均气温不变,则标记为0,得到表征长期天气特征的气候变化指标。
需要说明的是,极寒天气现象指标和气候变化指标均为布尔型变量,属于二分类问题。
需要说明的是,所述信息增益模型可以度量极寒天气现象指标和气候变化指标之间的不确定性,从而进一步寻找两者之间的关系,衡量极寒天气现象指标和气候变化指标之间的相互影响程度。
需要说明的是,在信息增益模型中,一个特征给系统带来的信息越多,则这个特征就越重要,对于一个特征而言,系统在有此特征和无此特征时信息量的差值即为此特征能给系统带来的信息量,差值越大,这个特征能为系统带来的信息就越多。
在一个具体的实施例中,若信息增益为正,则说明通过已知随机变量的划分能够使得数据集更加有序;信息增益越大,则说明已知随机变量对于另一个随机变量的分类能力更强。
需要说明的是,S3中需要把所述气温数据集中的数据输入到Sigmoid函数中进行计算,并将计算结果的数值映射到[0,1]区间以对所述气温数据集进行分类;
所述Sigmoid函数的计算公式为:
其中,x表示气温数据集中的数据,S(x)表示出现极寒天气的概率。
在一个具体的实施例中,Sigmoid函数值越接近1,则说明极寒天气现象出现的可能性越大;Sigmoid函数值越接近0,则说明极寒天气现象出现的可能性越小。
需要说明的是,Sigmoid函数常被用作神经网络的激活函数,输出范围为(0,1),在数据传递的过程中不容易发散,能很好地表示预测概率问题,以及处理二分类问题,并且能够抑制误差。
需要说明的是,S3中所述影响气候变化的特征要素需要构建成特征要素向量,并结合参数特征向量得到所述基于Sigmoid函数的二分类回归预测模型的概率函数;
所述概率函数为:
其中,x表示特征要素向量,θ表示参数特征向量,hθ(x)表示出现极寒天气现象的概率,hθ(x)的计算公式为:
其中,θT表示特征要素向量的系数,x表示特征要素向量。
需要说明的是,S3所述最佳拟合参数是通过建立二分类关联的代价概率函数并求解所述代价概率函数的最大值对应的参数特征向量得到的;
所述代价概率函数为:
cost(hθ(x),y)=hθ(x)y(1-hθ(x))(1-y),
其中,x表示特征要素向量,y表示0-1向量,hθ(x)表示出现极寒天气现象的概率。
在一个具体的实施例中,建立二分类关联的代价概率函数的目的在于求解代价概率函数最大值对应的参数特征向量[θ1,θ2,...,θn],即为最佳拟合参数。
需要说明的是,所述代价概率函数用于估量模型在训练集中的表现,表示预测值和真实值之间不一致的程度。
所述代价概率函数的作用在于确定函数中的最优参数,使得拟合数据点的误差达到最小,即拟合效果最好;可以帮助我们更好地衡量、训练和改进模型以使得适应各种不同的任务和问题。
需要说明的是,所述代价概率函数的求解过程包括:对所述代价概率函数取对数得到对数似然函数,并通过最大似然估计进行参数求解找出能最大概率生成观测数据的参数以确定对所述基于Sigmoid函数的二分类回归预测模型进行最大似然估计的迭代方程;
所述对数似然函数为:
能最大概率生成观测数据的参数的计算公式为:
最终确定的对所述基于Sigmoid函数的二分类回归预测模型进行最大似然估计的迭代方程为:
其中,表示更新后的特征要素j系数的最大似然估计值,θj表示特征要素j的系数估计值,α表示收敛系数,S(θTx)表示出现极寒天气现象的概率,θT表示特征要素的系数向量,x表示特征要素的数值,y(i)表示在特征要素i的影响下是否出现极寒天气,x(i)、/>表示特征要素的数值,i、j表示特征要素向量的角标,hθ(x(i))表示出现极寒天气的概率。
需要说明的是,收敛系数α的取值为定值,收敛系数α取值过小会造成参数收敛于局部最优解而非全局最优解;收敛系数α取值过大则会使得参数震荡,导致无法找到最优解。
需要说明的是,通过公式我们可以推导出:从而进一步得到:/>最终确定对模型进行最大似然估计的迭代方程为:/>
需要说明的是,在进行S4所述z-score标准化处理之前,还需要利用信息增益模型分别计算极寒天气现象指标和气候变化指标的原始信息熵和对应的信息增益。
信息增益用来进行决策树的划分属性选择,信息熵越小说明样本集合的纯度越高,信息增益越大使用某一属性进行划分所获得的纯度提升越大,即越应该被选做划分属性。
在一个具体的实施例中,计算上述获得的极寒天气现象指标以及气候变化指标对应的原始信息熵和对应的信息增益如下表所示:
表1信息增益模型计算结果
从表1中看出,可以看出极寒天气现象指标和气候变化指标之间的信息增益数值均较小,极寒天气现象指标对于气候变化指标的信息增益的值为负值,并且更加接近于0,说明按极寒天气现象指标分类下的气候变化指标混乱度上升,而按气候变化指标分类下的极寒天气现象指标更加有序;
可以理解的是,极寒天气现象的出现对于气候变化没有显著影响,而气候变化对于极寒天气现象的出现有着十分微小的影响。
需要说明的是,S4所述影响因素向量包括:气候变化平均差额、海洋表面平均温度、CO2浓度、总降雨降雪量、PM2.5空气质量指数(AQI)、空气湿度、土地侵蚀率、高温区间的地球表面面积占比(日最高气温高于32℃)、季度气温平均差额、时间要素(年)、时间要素(月)、地球辐射差额、酸雨发生率、森林覆盖率、人口增量。
需要说明的是,S5所述K折交叉验证,是将所述气温数据集分成K个子样本,其中,一个单独的子样本作为验证模型的数据,剩下的K-1个子样本用来进行训练,并重复K次交叉验证以使得每一个子样本都能得到一次验证,再平均K次交叉验证的结果或使用其它结合方式得到单一估测以验证模型性能。
需要说明的是,K折交叉验证被用于评估一个机器学习模型的表现,即重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。
在一个具体实施例中,参考图4,α设置为0.006,可以看出模型迭代次数在3000次才开始收敛,因此使用随机梯度上升方法进行对比测试,将α初始值设置更改为0.1,模型迭代100次后α乘以一个衰减系数(本例取值0.95)得到新的α,改进的随机梯度上升算法在模型迭代500次就开始收敛,并且参数震荡现象明显缓解。
在一个具体的实施例中,极寒天气现象指标主要分为两类:发生极寒天气(Y=1)和不发生极寒天气(Y=0),即Y={0,1};
经过最大迭代次数900次后,上述影响气候变化的特征因素分别对应的回归系数值如表2所述,回归公式截距为-0.21372697。
表2特征要素回归系数
使用5折交叉模型进行迭代训练并验证后,该模型的预测准确率为0.9743,使用常规评价指标对模型效果进行评价,具体评价指标见表3。
表3模型评价指标
precision | recall | f1-score | support | |
0-不发生极寒天气 | 1.00 | 0.91 | 0.95 | 15 |
1-发生极寒天气 | 0.97 | 1.00 | 0.98 | 1039 |
avg/total | 0.98 | 0.97 | 0.97 | 1054 |
其中,precison评价指标用于评价模型的精确率;recall评价指标用于评价模型的召回率;fl-score评价指标表示precision评价指标和recall评价指标的调和平均数,设置该指标的意义在于评价模型的预测效果是否准确且广泛;support评价指标表示支持数据量,即样本数量。
最后所应说明的是:以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种基于气候变化预测极寒天气的方法,其特征在于,包括:
S1:构建极寒天气现象指标以及气候变化指标;
S2:构建信息增益模型,具体地,通过所述极寒天气现象指标以及所述的气候变化指标划分得到气温数据集,计算所述气温数据集的混乱程度并进一步得到所述气温数据集的信息增益;
所述混乱程度的计算公式如下:
其中,X表示气温数据,p(xi)表示样本xi出现的概率,H(X)表示气温数据集的混乱程度;
所述信息增益的计算公式如下:
Gain(X,A)=H(X)-H(X|A),
其中,X、A均表示气温数据,H(X|A)为在已知随机变量A的条件下随机变量X的不确定性,H(X)表示所述气温数据集的混乱程度,Gain(X,A)表示数据A对数据X的信息增益;
S3:构建基于Sigmoid函数的二分类回归预测模型,具体地,对所述气温数据集的分类边界线建立回归公式,再通过Sigmoid函数映射影响气候变化的特征要素,并使用梯度上升法找到最佳拟合参数集,以所述分类边界线对所述最佳拟合参数集进行分类,得到基于Sigmoid函数的二分类回归预测模型;
S4:对S3所述基于Sigmoid函数的二分类回归预测模型进行求解,具体地,使用z-score标准化方法对所述影响气候变化的特征要素进行标准化处理,再根据所述影响气候变化的特征要素构建影响因素向量,并将所述影响因素向量输入到所述基于Sigmoid函数的二分类回归预测模型以得到所述影响气候变化的特征要素相应的回归系数;
所述z-score标准化的公式为:
其中,表示特征要素i标准化后的值、xi表示特征要素i的原始数据、μi表示特征要素的平均数、σi表示特征要素i的标准差;
S5:利用K折交叉验证模型对所述基于Sigmoid函数的二分类回归预测模型进行迭代训练,并使用常规评级指标评价模型效果。
2.根据权利要求1所述的方法,其特征在于,所述极寒天气现象指标是通过以下方式获取的:
提取某地区的月度平均最低气温,将出现极寒天气的月份标记为1,其余月份标记为0,作为极寒天气现象指标。
3.根据权利要求1所述的方法,其特征在于,所述气候变化指标是通过以下方式获取的:
提取两段相同时间长度的全球气温数据并计算对应的平均气温,再计算所述平均气温的差值,将所述两段相同时间长度的全球气温数据对应的平均气温相对比,若平均温度提高则标记为1,若平均气温下降或平均气温不变,则标记为0,作为气候变化指标。
4.根据权利要求1所述的方法,其特征在于,S3中需要把所述气温数据集中的数据输入到Sigmoid函数中进行计算,并将计算结果的数值映射到[0,1]区间以对所述气温数据集进行分类;
所述Sigmoid函数的计算公式为:
其中,x表示气温数据集中的数据,S(x)表示极寒天气出现的概率。
5.根据权利要求1所述的方法,其特征在于,S3中所述影响气候变化的特征要素需要构建成特征要素向量,并结合参数特征向量得到所述基于Sigmoid函数的二分类回归预测模型的概率函数;
所述概率函数为:
其中,x表示特征要素向量,θ表示参数特征向量,hθ(x)表示出现极寒天气现象的概率,hθ(x)的计算公式为:
其中,θT表示特征要素向量的系数,x表示特征要素向量。
6.根据权利要求1所述的方法,其特征在于,S3所述最佳拟合参数是通过建立二分类关联的代价概率函数并求解所述代价概率函数的最大值对应的参数特征向量得到的;
所述代价概率函数为:
cost(hθ(x),y)=hθ(x)y(1-hθ(x))(1-y),
其中,x表示特征要素向量,y表示0-1向量,hθ(x)表示出现极寒天气现象的概率。
7.根据权利要求6所述的方法,其特征在于,所述代价概率函数的求解过程包括:对所述代价概率函数取对数得到对数似然函数,并通过最大似然估计进行参数求解找出能最大概率生成观测数据的参数以确定对所述基于Sigmoid函数的二分类回归预测模型进行最大似然估计的迭代方程;
所述对数似然函数为:
能最大概率生成观测数据的参数的计算公式为:
最终确定的对所述基于Sigmoid函数的二分类回归预测模型进行最大似然估计的迭代方程为:
其中,表示更新后的特征要素j系数的最大似然估计值,θj表示特征要素j的系数估计值,α表示收敛系数,S(θTx)表示出现极寒天气现象的概率,θT表示特征要素的系数向量,x表示特征要素的数值,y(i)表示在特征要素i的影响下是否出现极寒天气,x(i)、/>表示特征要素的数值,i、j表示特征要素向量的角标,hθ(x(i))表示出现极寒天气的概率。
8.根据权利要求1所述的方法,其特征在于,在进行S4所述z-score标准化处理之前,还需要利用信息增益模型分别计算极寒天气现象指标和气候变化指标的原始信息熵和对应的信息增益。
9.根据权利要求1所述的方法,其特征在于,S4所述影响因素向量包括:气候变化平均差额、海洋表面平均温度、CO2浓度、总降雨降雪量、PM2.5空气质量指数(AQI)、空气湿度、土地侵蚀率、高温区间的地球表面面积占比(日最高气温高于32℃)、季度气温平均差额、时间要素(年)、时间要素(月)、地球辐射差额、酸雨发生率、森林覆盖率、人口增量。
10.根据权利要求1所述的方法,其特征在于,S5所述K折交叉验证,是将所述气温数据集分成K个子样本,其中,一个单独的子样本作为验证模型的数据,剩下的K-1个子样本用来进行训练,并重复K次交叉验证以使得每一个子样本都能得到一次验证,再平均K次交叉验证的结果或使用其它结合方式得到单一估测以验证模型性能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311440862.1A CN117521021A (zh) | 2023-11-01 | 2023-11-01 | 一种基于气候变化预测极寒天气的模型与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311440862.1A CN117521021A (zh) | 2023-11-01 | 2023-11-01 | 一种基于气候变化预测极寒天气的模型与方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117521021A true CN117521021A (zh) | 2024-02-06 |
Family
ID=89752333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311440862.1A Pending CN117521021A (zh) | 2023-11-01 | 2023-11-01 | 一种基于气候变化预测极寒天气的模型与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117521021A (zh) |
-
2023
- 2023-11-01 CN CN202311440862.1A patent/CN117521021A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113919448B (zh) | 一种任意时空位置二氧化碳浓度预测影响因素分析方法 | |
Kannan et al. | Prediction of daily rainfall state in a river basin using statistical downscaling from GCM output | |
Yalcintas et al. | An energy benchmarking model based on artificial neural network method utilizing US Commercial Buildings Energy Consumption Survey (CBECS) database | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN112506990B (zh) | 一种基于时空信息的水文数据异常检测方法 | |
CN111665575B (zh) | 一种基于统计动力的中长期降雨分级耦合预报方法及系统 | |
CN113408742B (zh) | 一种基于机器学习的高精度海表温度反演方法 | |
Hayden et al. | Statistical methods to develop rating models | |
Tian et al. | Energy characteristics of urban buildings: Assessment by machine learning | |
Collins | The operational complex quality control of radiosonde heights and temperatures at the National Centers for Environmental Prediction. Part I: Description of the method | |
CN113536373B (zh) | 一种脱敏气象数据的生成方法 | |
Lin et al. | A hybrid statistical downscaling method based on the classification of rainfall patterns | |
Zaidan et al. | Predicting atmospheric particle formation days by Bayesian classification of the time series features | |
Duc et al. | Verification in the presence of observation errors: Bayesian point of view | |
Zhang et al. | A weighted ensemble of regional climate projections for exploring the spatiotemporal evolution of multidimensional drought risks in a changing climate | |
CN117933497B (zh) | 一种基于tsa-arima-cnn的企业碳排放预测方法 | |
Vandeskog et al. | Quantile based modeling of diurnal temperature range with the five‐parameter lambda distribution | |
CN116258279B (zh) | 基于综合赋权的滑坡易发性评价方法和装置 | |
CN117521021A (zh) | 一种基于气候变化预测极寒天气的模型与方法 | |
CN117609731A (zh) | 一种基于因果推断的本科生毕业去向预测方法与可视分析系统 | |
CN116663404A (zh) | 一种耦合人工智能和贝叶斯理论的洪水预报方法及系统 | |
Carney et al. | Robust regional clustering and modeling of nonstationary summer temperature extremes across Germany | |
CN116613732A (zh) | 一种基于shap值选择策略的多元负荷预测方法及系统 | |
CN115293641A (zh) | 一种基于金融大数据的企业风险智能识别方法 | |
Wiedemann et al. | Benchmarking Regression Models Under Spatial Heterogeneity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |