Nothing Special   »   [go: up one dir, main page]

CN108491953B - 一种基于非线性理论的pm2.5预测与预警方法及系统 - Google Patents

一种基于非线性理论的pm2.5预测与预警方法及系统 Download PDF

Info

Publication number
CN108491953B
CN108491953B CN201810095420.0A CN201810095420A CN108491953B CN 108491953 B CN108491953 B CN 108491953B CN 201810095420 A CN201810095420 A CN 201810095420A CN 108491953 B CN108491953 B CN 108491953B
Authority
CN
China
Prior art keywords
prediction
train
training
model
predict
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810095420.0A
Other languages
English (en)
Other versions
CN108491953A (zh
Inventor
尹建光
彭飞
谢连科
臧玉魏
马新刚
韩悦
刘辉
王坤
巩泉泉
窦丹丹
张国英
李方伟
李佳煜
郭本祥
闫文晶
崔翔宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Electric Power Research Institute of State Grid Jilin Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201810095420.0A priority Critical patent/CN108491953B/zh
Publication of CN108491953A publication Critical patent/CN108491953A/zh
Application granted granted Critical
Publication of CN108491953B publication Critical patent/CN108491953B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于非线性理论的PM2.5预测与预警方法及系统,模型训练步骤和模型预测步骤;针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;构造预测模型;对预测模型进行训练;针对测试时序训练集,进行MLRC‑LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。本发明能够提供模型的可调参数,通过改变可调参数从而适应不同地区PM2.5浓度的预测预警工作。

Description

一种基于非线性理论的PM2.5预测与预警方法及系统
技术领域
本发明涉及空气质量预测与预警领域,特别是涉及一种基于非线性理论的PM2.5预测与预警方法及系统。
背景技术
雾霾的主要成分就是PM2.5,PM2.5是粒径小于2.5μm的颗粒物,是一种胶体混合物。 PM2.5的影响因素复杂,其浓度变化呈现出非线性特征。
目前大气污染物浓度预测方法主要有统计模型和确定性模型两类。其中,统计模型一般是基于历史数据建立空气质量与影响因素之间的关联模型,其优点在于对输入数据要求相对较低,但预测精度较低,难以反映区域空气质量且无法对污染成因以及来源等给出合理解释;数值模型则是依据不同尺度大气动力学理论,耦合大气物理和化学变化过程,建立多尺度类型大气污染物扩散模型,依靠计算机系统预报大气污染物浓度变化趋势和动态分布情况,其优点是能够对污染成因进行诊断,计算精确,能够对区域内大气污染物浓度进行预测,其局限性在于时效性污染排放数据获取困难,模型对数据要求高,实际操作困难较大。
鉴于数值预报所需成本消耗较高,存在较多的不确定因素,模型建立过程和数据需求要求较复杂,众多的研究倾向于以统计模型为主要手段开展大气污染物浓度预测,特别是针对单站点统计模型预报开展了大量的改进研究。很多研究者将传统的统计学方法与神经网络模型、自回归移动平均模型、多元线性回归模型相结合获得了较为理想的预测结果。
而从方法学的角度来看,自回归移动平均模型和多元线性回归模型均是线性模式,某些非线性的关系很难被精确预测,这种缺陷已在某些实例研究中体现出来;神经网络模型作为一种非线性映射方法,其多层感知模式使得神经网络模型在细微颗粒物浓度预测方面有良好的效果。但神经网络方法的学习速度通常比较慢,参数设定困难,并且容易陷入局部最优,推广能力差,而且预测效率较低。支持向量机(SVM)的出现克服了神经网络训练时间长、泛化能力差、易陷入局部极小等缺点。单步预测效果良好,但是在进行多步预测时,每步预测都需要上次预测的输出作为输入,在这种迭代的过程中,上一次的预测结果会影响在接下来时间点的预测结果,误差也就会逐步积累直到最后,预测效果逐步减弱。
综上所述,现有技术中对于PM2.5的预测问题,尚缺乏有效的解决方案。
发明内容
为了解决现有技术的不足,本发明提供了一种基于非线性理论的PM2.5预测与预警方法,该方法能够提供模型的可调参数,通过改变可调参数从而适应不同地区PM2.5浓度的预测预警工作。
一种基于非线性理论的PM2.5预测与预警方法,包括:
模型训练步骤和模型预测步骤;
针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;
对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;
然后构造基于多级残差修正的非线性最小二乘支持向量回归(AMLRC-LSSVR)的预测模型;
对AMLRC-LSSVR模型进行训练;
针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。
进一步的,所述预测模型可调参数为:小波分解层数s,最小二乘支持向量机回归的参数,包括核函数参数以及正则化参数γ,可通过遗传算法等方法来寻优获得。
进一步的,基于多级残差修正的非线性最小二乘支持向量回归(MLRC-LSSVR)预测模型描述如下:
训练输入:训练数据集(Xtrain,Ytrain)∈R(n-1)×2,其中,
Figure RE-GDA0001670433330000021
Figure RE-GDA0001670433330000022
预测输出:n+1时刻PM2.5污染物的预测浓度
Figure RE-GDA0001670433330000023
进一步的,所述模型训练步骤:
步骤1:对训练数据集中Xtrain进行coifN小波变换,得到m层高维输入训练矩阵X′train={X′train,1,X′train,2,...X′train,n-1},其中,
Figure RE-GDA0001670433330000024
i=1,2,...n-1,构造LSSVR 模型训练数据集(X′rain,Ytrain)∈R(n-1)×(m+2)
步骤2:基于训练数据集(X′train,Ytrain)对LSSVR模型进行训练,训练过程采用搜索效率较高的simplex方法和10折交叉验证,优化搜索LSSVR的高斯核函数关键参数,并得到LSSVR 训练终值Y′train
步骤3:计算LSSVR训练终值Y′train与Ytrain之间的R2相关系数R2(Y′train,Ytrain);
步骤4:如果R2相关系数R2(Y′train,Ytrain)小于预设的R2相关系数阈值,则计算训练残差向量并构造残差训练数据集(X′train,Ytrain=Ytrain-Y′train),并重复Step 2和Step 3,直至模型满足R2相关系数阈值,从而构造MLRC-LSSVR预测模型,通过额外k-1个LSSVR残差预测模型实现对预测残差的在线同步修正,其中,k为MLRC-LSSVR预测模型层级。
进一步的,所述模型预测过程的工作步骤描述如下:
步骤1:重构n时刻的预测数据集Xpredict={Xtrain,Xpredict},其中
Figure RE-GDA0001670433330000032
对Xpredict进行 coifN小波分解,得到n时刻的高维输入预测向量X′predict=(Am,predict,D1,predict,...Dm,predict);
步骤2:将高维输入预测向量X′predict输入MLRC-LSSVR预测模型,得到MLRC-LSSVR多级预测输出{Y′predict,RC1,predict,...RCk-1,predict},从而得到
Figure RE-GDA0001670433330000031
其中, RCj,predict为第j个LSSVR残差预测模型的预测输出。
步骤3:基于中心极限理论进行线性平滑和偏置修正,对残差(RCk-1,train,RCk-1,predict)进行方差估计,从而得到相应的预测置信上界YPpredict=Ypredict+RCPk-1,predict,其中,RCPk-1,predict为k-1级残差的97%置信估计方差;
重复步骤1-3的模型预测过程,可以实现PM2.5预测浓度的在线预测和置信上限估计。
此外,随着PM2.5浓度时序的不断更新,为了消除长期历史稳态偏置信息的冗余,所构造的AMLRC-LSSVR预测模型,可以结合时序区间更新数据定期重复上述训练过程,提高模型在线预测的有效性。
一种基于非线性理论的PM2.5预测与预警系统,包括:
数据处理单元,用于将PM2.5浓度时序数据分为训练时序数据集及测试时序训练集;
小波分解单元,用于对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;
支持向量回归预测单元,用于构造基于多级残差修正的非线性最小二乘支持向量回归 (AMLRC-LSSVR)的预测模型;对AMLRC-LSSVR模型进行训练;针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。
与现有技术相比,本发明的有益效果是:
本发明提供了多级残差修正的方法,能够避免误差的累积效应,提高预测精度;本发明针对预测结果进行方差分析,能够避免预测的不确定性问题;本发明能够提供模型的可调参数,通过改变可调参数从而适应不同地区PM2.5浓度的预测预警工作。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明的数据处理流程图;
图2小波分解示意图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
正如背景技术所介绍的,现有技术中存在PM2.5预测数据不准确的不足,为了解决如上的技术问题,本申请提出了一种基于非线性理论的PM2.5预测与预警方法。
本申请的一种典型的实施方式中,如图1所示,提供了一种基于非线性理论的PM2.5预测与预警方法,该一种基于非线性理论的PM2.5预测与预警方法具体步骤如下:
步骤1:针对PM2.5时序数据,利用小波分解进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息(趋势性,随机性以及周期性等信息)。
步骤2:构建基于自适应多级残差修正的非线性最小二乘支持向量回归(AMLRC-LSSVR) 预测模型,该步骤包括参数寻优、回归预测两部分,该部分具体操作步骤详见AMLRC-LSSVR 的描述;
步骤3:对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。
通过参数寻优单元可调节可调参数,提高模型对不同区域的普遍适应性,模型可调参数为:小波分解层数s,s选择主要根据经验,一般分解变量A即趋势性部分平滑后即可,最小二乘支持向量机回归的参数包括核函数参数以及正则化参数γ。
在选取核函数解决实际问题时,通常采用的方法有:一是利用专家的先验知识预先选定核函数;二是采用Cross-Validation方法,即在进行核函数选取时,分别试用不同的核函数,归纳误差最小的核函数就是最好的核函数,本发明以归纳误差最小为选择标准,详细操作步骤详见具体训练过程的描述。
(1)小波分解与特征提取
小波分解是采用有限长或快速衰减的振荡波形通过缩放和平移来表征信号,基于时间和频率的局部变换,进而有效地从信号(研究数据)中提取信息,较好的扩展了傅里叶变换的应用。选择具有振荡特性、能够迅速衰减到零的母小波函数生成函数族:
Figure RE-GDA0001670433330000051
式中ψa,τ(x)为小波基函数;x为PM2.5时间序列数据;τ平移参数,a为尺度参数。
实际工程应用中,由于计算机离散采样的特点,多采用离散小波变化,得到信号f(x)的离散小波变换WTf(p,q)及相应的重构公式:
Figure RE-GDA0001670433330000052
Figure RE-GDA0001670433330000053
式中,p,q分别是尺度因子和平移因子;ψ*(x)为ψ(x)的复共轭函数;c为与信号无关的常数。
对于小波分析的理解,可假定一个信号S通过三层分解来说明,分解树见图2。
在信号分析的过程中,采用不同的小波基函数作为处理工具,所得的结果有明显差异,要想得到高精度的预测结果,必须选择合理的小波基。目前在工程领域对于小波基的选取并没有一个明确的标准,大都依据经验或信号处理的目的来选取小波。一般在支撑长度、消失矩、正则性上权衡处理,考虑到将小波分解应用于PM2.5浓度时间序列的特征提取与预测中,特征提取与预测的实时性和时频局部化能力,本文结合小波基的性质,综合分析,coifN小波优势明显:在消失矩上,coifN小波可以通过更少的分级层数对原始信号进行有效分解,支撑长度较短,从而滤波器长度较短,小波分解计算量低,这样既能满足对信号的处理性能,又能够降低计算量,有助于提高在线预测效率。
(2)最小二乘支持向量回归(LSSVR)
最小二乘支持向量回归(LSSVR)是一种基于统计学习理论的建模方法,具有训练速度快、泛化性能较好拟合非线性函数能力强的特点。LSSVR是支持向量机回归(SVR)的一个重要分支,与支持向量机回归相似,训练算法为解凸二次优化问题,具有全局唯一解,它通过非线性映射φ(x)将输入空间映射到高维特征空间,在特征空间中求取最优先性函数。
LSSVR是SVR变形算法,Suykens将不等式约束转变为等式约束,将函数由误差和转变为平方和,求解算法由凸二次优化问题转变为求解线性方程组问题,求解变量个数由2n+1 个减少到n+1个,n为训练样本个数,因此LSSVR算法较SVR求解难度低,并且训练速度快。设训练数据集为
Figure RE-GDA0001670433330000061
输入xi∈Rd,输出yi∈R,则LSSVR可以表示为:
Figure RE-GDA0001670433330000062
s.t.yi=wTφ(xi)+b+ei,i=l,…,n (5)
式中φ(x)是输入空间到高位特征空间的非线性映射;w是权向量,表征模型的复杂度; e=[e1,e2,…,en]T是误差向量;γ∈R+是正则化参数。
为了解决这个约束优化问题,引入Lagrange函数和对偶优化,转变为求解式(6)所示的无约束优化问题。
Figure RE-GDA0001670433330000063
其中α为拉格朗日算子,分别对w,b,et和αt求偏导数,令偏导数为零消除w,et,得到如下方程组:
Figure RE-GDA0001670433330000064
式中y=[y1,……,yn];α=[α1,……,αn];L=[1,……,1]T是n×1矩阵;In是n×n单位矩阵; Kij=κ(xi,xj)=φ(xi)Tφ(xj),i,j=1,……,n;κ(xi,xj)是核函数。对于核函数采用遗传算法进行寻优,获得最优结果。
根据Suykens给出的算法,最终得到LSSVR模型预测函数如下所示:
Figure RE-GDA0001670433330000065
其中αi为拉格朗日算子,b常数,通过对PM2.5时序数据的统计回归可得到。
(3)构建基于多级残差修正的非线性最小二乘支持向量回归(AMLRC-LSSVR)预测模型
基于多级残差修正的非线性最小二乘支持向量回归(MLRC-LSSVR)预测模型可以描述如下:
训练输入:训练数据集(Xtrain,Ytrain)∈R(n-1)×2,其中,
Figure RE-GDA0001670433330000071
Figure RE-GDA0001670433330000072
Figure RE-GDA0001670433330000073
为第i个PM2.5时序数据。
预测输出:n+1时刻PM2.5污染物的预测浓度
Figure RE-GDA0001670433330000074
其工作原理主要包括模型训练过程和模型预测过程两部分。
模型训练过程的工作步骤描述如下:
步骤1:对训练数据集中Xtrain进行coifN小波变换,得到m层高维输入训练矩阵X′train={X′train,1,X′train,2,...X′train,n-1},(X′train,i为第i个PM2.5时序数据
Figure RE-GDA0001670433330000078
经过小波分解后的数据集合) 其中,
Figure RE-GDA0001670433330000075
(其中,A、D为小波分解后的分量),i=1,2,...n-1,构造LSSVR模型训练数据集(X′train,Ytrain)∈R(n-1)×(m+2)
步骤2:基于训练数据集(X′train,Ytrain)对LSSVR模型进行训练,训练过程采用搜索效率较高的simplex方法和10折交叉验证,优化搜索LSSVR的高斯核函数关键参数,并得到LSSVR 训练终值Y′train
步骤3:计算LSSVR训练终值Y′train与Ytrain之间的R2相关系数R2(Y′train,Ytrain);
步骤4:如果R2相关系数R2(Y′train,Ytrain)小于预设的R2相关系数阈值,则计算训练残差向量并构造残差训练数据集(X′train,Ytrain=Ytrain-Ytrain),并重复Step 2和Step 3,直至模型满足R2相关系数阈值,从而构造MLRC-LSSVR预测模型,通过额外k-1个LSSVR残差预测模型实现对预测残差的在线同步修正,其中,k为MLRC-LSSVR预测模型层级。
模型预测过程的工作步骤描述如下:
步骤1:重构n时刻的预测数据集Xpredict={Xtrain,Xpredict},其中
Figure RE-GDA0001670433330000076
对Xpredict进行 coifN小波分解,得到n时刻的高维输入预测向量X′tredict=(Am,predict,D1,predict,...Dm,predict);
步骤2:将高维输入预测向量X′predict输入MLRC-LSSVR预测模型,得到MLRC-LSSVR多级预测输出{Y′predict,RC1,predict,...RCk-1,predict},从而得到
Figure RE-GDA0001670433330000077
其中, RCj,predict为第j个LSSVR残差预测模型的预测输出。
步骤3:基于中心极限理论进行线性平滑和偏置修正,对残差(RCk-1,train,RCk-1,predict)进行方差估计,从而得到相应的预测置信上界YPpredict=Ypredict+RCPk-1,predict,其中,RCPk-1,predict为k-1级残差的97%置信估计方差;
重复步骤1-3的模型预测过程,可以实现PM2.5预测浓度的在线预测和置信上限估计。此外,随着PM2.5浓度时序的不断更新,为了消除长期历史稳态偏置信息的冗余,所构造的 AMLRC-LSSVR预测模型,可以结合时序区间更新数据定期重复上述训练过程,提高模型在线预测的有效性。
该发明涵盖数据处理单元(将数据分为训练数据集、测试集两部分)、小波分解单元和支持向量回归预测(包括核函数寻优、残差计算与预测等)等单元,并提供模型的可调参数(小波基函数的选择、分解层数等),通过改变可调参数从而适应不同地区PM2.5浓度的预测预警工作。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (4)

1.一种基于非线性理论的PM2.5预测与预警方法,其特征是,包括:
模型训练步骤和模型预测步骤;
针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;
对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;
然后构造基于多级残差修正的非线性最小二乘支持向量回归MLRC-LSSVR的预测模型;
对MLRC-LSSVR模型进行训练;所述模型训练步骤:
步骤1:对训练数据集中Xtrain进行coifN小波变换,得到m层高维输入训练矩阵X′train={X′train,1,X′train,2,...X′train,n-1},其中,
Figure FDA0003392940710000013
构造LSSVR模型训练数据集(X′train,Ytrain)∈R(n-1)×(m+2)
步骤2:基于训练数据集(X′train,Ytrain)对LSSVR模型进行训练,训练过程采用搜索效率较高的simplex方法和10折交叉验证,优化搜索LSSVR的高斯核函数关键参数,并得到LSSVR训练终值Y′train
步骤3:计算LSSVR训练终值Y′train与Ytrain之间的R2相关系数R2(Y′train,Ytrain);
步骤4:如果R2相关系数R2(Y′train,Ytrain)小于预设的R2相关系数阈值,则计算训练残差向量并构造残差训练数据集(X′train,Ytrain=Ytrain-Y′train),并重复步骤2和步骤3,直至模型满足R2相关系数阈值,从而构造MLRC-LSSVR预测模型,通过额外k-1个LSSVR残差预测模型实现对预测残差的在线同步修正,其中,k为MLRC-LSSVR预测模型层级;
针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果;所述模型预测过程的工作步骤描述如下:
步骤1:重构n时刻的预测数据集Xpredict={Xtrain,Xpredict},其中
Figure FDA0003392940710000011
对Xpredict进行coifN小波分解,得到n时刻的高维输入预测向量X′predict=(Am,predict,D1,predict,...Dm,predict);
步骤2:将高维输入预测向量X′predict输入MLRC-LSSVR预测模型,得到MLRC-LSSVR多级预测输出{Y′predict,RC1,predict,...RCk-1,predict},从而得到
Figure FDA0003392940710000012
其中,RCj,predict为第j个LSSVR残差预测模型的预测输出;
步骤3:基于中心极限理论进行线性平滑和偏置修正,对残差(RCk-1,train,RCk-1,predict)进行方差估计,从而得到相应的预测置信上界YPpredict=Ypredict+RCPk-1,predict,其中,RCPk-1,predict为k-1级残差的97%置信估计方差;
重复步骤1-3的模型预测过程,实现PM2.5预测浓度的在线预测和置信上限估计。
2.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,所述预测模型可调参数为:小波分解层数s,最小二乘支持向量机回归的参数,包括核函数参数以及正则化参数γ,可通过遗传算法来寻优获得。
3.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,基于多级残差修正的非线性最小二乘支持向量回归MLRC-LSSVR预测模型描述如下:
训练输入:训练数据集(Xtrain,Ytrain)∈R(n-1)×2,其中,
Figure FDA0003392940710000021
Figure FDA0003392940710000022
预测输出:n+1时刻PM2.5污染物的预测浓度
Figure FDA0003392940710000023
4.一种基于非线性理论的PM2.5预测与预警系统,其特征是,包括
数据处理单元,用于将PM2.5浓度时序数据分为训练时序数据集及测试时序训练集;
小波分解单元,用于对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;
支持向量回归预测单元,用于构造基于多级残差修正的非线性最小二乘支持向量回归MLRC-LSSVR的预测模型;对MLRC-LSSVR模型进行训练;所述模型训练步骤:
步骤1:对训练数据集中Xtrain进行coifN小波变换,得到m层高维输入训练矩阵X′train={X′train,1,X′train,2,...X′train,n-1},其中,
Figure FDA0003392940710000024
构造LSSVR模型训练数据集(X′train,Ytrain)∈R(n-1)×(m+2)
步骤2:基于训练数据集(X′train,Ytrain)对LSSVR模型进行训练,训练过程采用搜索效率较高的simplex方法和10折交叉验证,优化搜索LSSVR的高斯核函数关键参数,并得到LSSVR训练终值Y′train
步骤3:计算LSSVR训练终值Y′train与Ytrain之间的R2相关系数R2(Y′train,Ytrain);
步骤4:如果R2相关系数R2(Y′train,Ytrain)小于预设的R2相关系数阈值,则计算训练残差向量并构造残差训练数据集(X′train,Ytrain=Ytrain-Y′train),并重复步骤2和步骤3,直至模型满足R2相关系数阈值,从而构造MLRC-LSSVR预测模型,通过额外k-1个LSSVR残差预测模型实现对预测残差的在线同步修正,其中,k为MLRC-LSSVR预测模型层级;
针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果;所述模型预测过程的工作步骤描述如下:
步骤1:重构n时刻的预测数据集Xpredict={Xtrain,Xpredict},其中
Figure FDA0003392940710000031
对Xpredict进行coifN小波分解,得到n时刻的高维输入预测向量X′predict=(Am,predict,D1,predict,...Dm,predict);
步骤2:将高维输入预测向量X′predict输入MLRC-LSSVR预测模型,得到MLRC-LSSVR多级预测输出{Y′predict,RC1,predict,...RCk-1,predict},从而得到
Figure FDA0003392940710000032
其中,RCj,predict为第j个LSSVR残差预测模型的预测输出;
步骤3:基于中心极限理论进行线性平滑和偏置修正,对残差(RCk-1,train,RCk-1,predict)进行方差估计,从而得到相应的预测置信上界YPpredict=Ypredict+RCPk-1,predict,其中,RCPk-1,predict为k-1级残差的97%置信估计方差;
重复步骤1-3的模型预测过程,实现PM2.5预测浓度的在线预测和置信上限估计。
CN201810095420.0A 2018-01-31 2018-01-31 一种基于非线性理论的pm2.5预测与预警方法及系统 Active CN108491953B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810095420.0A CN108491953B (zh) 2018-01-31 2018-01-31 一种基于非线性理论的pm2.5预测与预警方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810095420.0A CN108491953B (zh) 2018-01-31 2018-01-31 一种基于非线性理论的pm2.5预测与预警方法及系统

Publications (2)

Publication Number Publication Date
CN108491953A CN108491953A (zh) 2018-09-04
CN108491953B true CN108491953B (zh) 2022-02-25

Family

ID=63343976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810095420.0A Active CN108491953B (zh) 2018-01-31 2018-01-31 一种基于非线性理论的pm2.5预测与预警方法及系统

Country Status (1)

Country Link
CN (1) CN108491953B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858696A (zh) * 2019-01-30 2019-06-07 山东万钢信息科技有限公司 一种城市环境污染预测方法及系统
DE102019207059A1 (de) * 2019-05-15 2020-11-19 Siemens Aktiengesellschaft Verfahren zur Validierung von Systemparametern eines Energiesystems, Verfahren zum Betrieb eines Energiesystems sowie Energiemanagementsystem für ein Energiesystem
CN110992101A (zh) * 2019-12-05 2020-04-10 中国铁道科学研究院集团有限公司电子计算技术研究所 车站广告媒体资源价值及收益预测回归方法及预测模型
CN111598156B (zh) * 2020-05-14 2024-07-19 北京工业大学 基于多源异构数据融合的pm2.5预测方法
CN113532263B (zh) * 2021-06-09 2022-09-20 厦门大学 一种面向柔性传感器时序性能变化的关节角度预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008278A (zh) * 2014-05-14 2014-08-27 昆明理工大学 一种基于特征向量和最小二乘支持向量机的pm25浓度预测方法
CN105184012A (zh) * 2015-09-28 2015-12-23 宁波大学 一种区域空气pm2.5浓度预测方法
CN106599520A (zh) * 2016-12-31 2017-04-26 中国科学技术大学 一种基于lstm‑rnn模型的空气污染物浓度预报方法
CN107609718A (zh) * 2017-10-18 2018-01-19 仲恺农业工程学院 一种养殖水体中溶解氧的预测方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10726954B2 (en) * 2015-04-22 2020-07-28 Reciprocal Labs Corporation Predictive modeling of respiratory disease risk and events
US11195125B2 (en) * 2016-04-27 2021-12-07 International Business Machines Corporation Pollution prediction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008278A (zh) * 2014-05-14 2014-08-27 昆明理工大学 一种基于特征向量和最小二乘支持向量机的pm25浓度预测方法
CN105184012A (zh) * 2015-09-28 2015-12-23 宁波大学 一种区域空气pm2.5浓度预测方法
CN106599520A (zh) * 2016-12-31 2017-04-26 中国科学技术大学 一种基于lstm‑rnn模型的空气污染物浓度预报方法
CN107609718A (zh) * 2017-10-18 2018-01-19 仲恺农业工程学院 一种养殖水体中溶解氧的预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于小波分解与自适应多级残差修正的最小二乘支持向量回归预测模型的PM2.5浓度预测";尹建光 等;《环境科学学报》;20180301;第38卷(第5期);第2090-2098页 *
"基于支持向量回归的PM2.5浓度实时预报";朱亚杰 等;《测绘科学》;20151215;第41卷(第1期);第12-17,22页 *

Also Published As

Publication number Publication date
CN108491953A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN108491953B (zh) 一种基于非线性理论的pm2.5预测与预警方法及系统
Olu-Ajayi et al. Building energy consumption prediction for residential buildings using deep learning and other machine learning techniques
Bokde et al. A novel imputation methodology for time series based on pattern sequence forecasting
AU2009353036B2 (en) Systems and methods for the quantitative estimate of production-forecast uncertainty
WO2016101628A1 (zh) 一种数据建模中的数据处理方法及装置
Gramacy et al. Parameter space exploration with Gaussian process trees
CN106649658B (zh) 针对用户角色无差异对待和数据稀疏的推荐系统及方法
CN108595414A (zh) 基于源汇空间变量推理的土壤重金属企业污染源识别方法
CN104537415A (zh) 一种基于压缩感知和dros-elm的非线性过程工业故障预测及识别方法
CN101944141A (zh) 一种高效的基于模糊聚类自适应径向基全局优化方法
CN103413038A (zh) 基于矢量量化的长期直觉模糊时间序列预测方法
CN115407038A (zh) 一种基于水质预警点选址的城市供水管网水质监测方法
CN116107279A (zh) 基于注意力深度神经网络的流程工业能耗多目标优化方法
Jemai et al. FBWN: An architecture of fast beta wavelet networks for image classification
Garai et al. An MRA Based MLR Model for Forecasting Indian Annual Rainfall Using Large Scale Climate Indices
Georgescu Joint propagation of ontological and epistemic uncertainty across risk assessment and fuzzy time series models
Chaolong et al. Study of railway track irregularity standard deviation time series based on data mining and linear model
CN109670695B (zh) 基于离群数据挖掘的机械产品加工工序异常并行检测方法
CN104361409A (zh) 基于作物旱情组合预测模型的灌溉控制方法及系统
Cardinali et al. Locally stationary wavelet packet processes: basis selection and model fitting
CN117829322A (zh) 基于周期性时间序列与多维度的关联型数据预测方法
CN105911016A (zh) 一种原油光谱性质的非线性建模方法
Xing et al. A Decomposition‐Ensemble Approach with Denoising Strategy for PM2. 5 Concentration Forecasting
EP3690670B1 (en) Data processing system
Gugnani et al. A deep learning model for air quality forecasting based on 1d convolution and bilstm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 250003 No. 2000, Wang Yue Road, Shizhong District, Ji'nan, Shandong

Patentee after: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID SHANDONG ELECTRIC POWER Co.

Patentee after: STATE GRID CORPORATION OF CHINA

Address before: 250003 No. 2000, Wang Yue Road, Shizhong District, Ji'nan, Shandong

Patentee before: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID SHANDONG ELECTRIC POWER Co.

Patentee before: State Grid Corporation of China

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20221128

Address after: 250003 No. 2000, Wang Yue Road, Shizhong District, Ji'nan, Shandong

Patentee after: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID SHANDONG ELECTRIC POWER Co.

Patentee after: JILIN PROVINCE ELECTRIC POWER RESEARCH INSTITUTE OF JILIN ELECTRIC POWER Co.,Ltd.

Patentee after: STATE GRID CORPORATION OF CHINA

Address before: 250003 No. 2000, Wang Yue Road, Shizhong District, Ji'nan, Shandong

Patentee before: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID SHANDONG ELECTRIC POWER Co.

Patentee before: STATE GRID CORPORATION OF CHINA

TR01 Transfer of patent right