CN113011660A - 空气质量预测方法、系统及存储介质 - Google Patents
空气质量预测方法、系统及存储介质 Download PDFInfo
- Publication number
- CN113011660A CN113011660A CN202110311316.2A CN202110311316A CN113011660A CN 113011660 A CN113011660 A CN 113011660A CN 202110311316 A CN202110311316 A CN 202110311316A CN 113011660 A CN113011660 A CN 113011660A
- Authority
- CN
- China
- Prior art keywords
- air quality
- neural network
- quality data
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 58
- 238000013528 artificial neural network Methods 0.000 claims abstract description 52
- 238000003062 neural network model Methods 0.000 claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 230000002068 genetic effect Effects 0.000 claims abstract description 21
- 239000000809 air pollutant Substances 0.000 claims abstract description 10
- 231100001243 air pollutant Toxicity 0.000 claims abstract description 10
- 238000005457 optimization Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 210000002364 input neuron Anatomy 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 claims description 4
- 238000012847 principal component analysis method Methods 0.000 claims description 4
- 210000004205 output neuron Anatomy 0.000 claims description 3
- 230000009467 reduction Effects 0.000 abstract description 2
- 239000003344 environmental pollutant Substances 0.000 description 11
- 231100000719 pollutant Toxicity 0.000 description 11
- 238000000513 principal component analysis Methods 0.000 description 7
- 230000007613 environmental effect Effects 0.000 description 6
- 239000007789 gas Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- MWUXSHHQAYIFBG-UHFFFAOYSA-N nitrogen oxide Inorganic materials O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 208000037466 short stature, oligodontia, dysmorphic facies, and motor delay Diseases 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- XTQHKBHJIVJGKJ-UHFFFAOYSA-N sulfur monoxide Chemical class S=O XTQHKBHJIVJGKJ-UHFFFAOYSA-N 0.000 description 1
- 229910052815 sulfur oxide Inorganic materials 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Physiology (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供了一种空气质量预测方法、系统及存储介质,包括以下步骤:获取一历史时间段的目标空气质量数据,所述目标空气质量数据包括空气污染物浓度和空气质量指数;建立一用于训练所述目标空气质量数据的神经网络模型;将所述目标空气质量数据输入至所述神经网络模型中进行训练,生成一空气质量预测模型;输入一时刻的空气质量数据至所述空气质量预测模型中确定下一时刻的空气质量数据。本发明通过对空气质量数据进行主成分分进行降维,再结合基于遗传算法优化的神经网络进行预测,够有效的降低迭代次数和均方误差,提高预测的准确率。
Description
技术领域
本发明涉及空气质量指数预测技术领域,具体地,涉及一种空气质量预测方法、系统及存储介质。
背景技术
空气环境中的主要污染物是一氧化碳、臭氧、氮氧化合物、硫氧化物,可吸入颗粒物、细颗粒物等。在我国,为了改善人们生活和居住环境,保障居民自身健康发展,规范环境空气质量的标准分级,污染物项目及取值时间等,从我国的具体实际国情出发,在2010年1月1日以后,全国各城市都采用我国环保部门定制的环境空气质量指数新标准,《环境空气质量标准》(GB 3095-2012)和《环境空气质量指数(AQI)技术规定(试行)》(HJ 633-2012)国家标准,本发明所采用的城市环境空气质量标准即为此标准。
目前大气污染物预测主要分为机理模型和统计模型两类。机理模型即通过大气污染物的产生、转换、扩散的物理化学过程进行建模,如CMAQ模型,而由于其相相关过程比较复杂,建模难度大,预测的精度难以提升。统计模型即通过历史数据,捕捉数据特征,得到污染物变化规律,现有的这类模型包括BP神经网络,SWM,MLR等。对于模式识别算法而言,Zaromb和Stetter提出采用灵敏度部分重叠气体传感器阵列解决气体传感器的交叉敏和选择性问题以来,人们对气体传感器阵列的信号处理技术研究表现了很大的兴趣,先后研究了变换最小方差法(TLS)、局部模型构造法(PMB)、主成分分析法(PCA)等传统的模式识别方法,以及误差反向传播神经网络(BP)、自适应共振神经网络(ART)、自组织特征映射神经网络(SOFM)等人工神经网络方法,这些方法普遍运用于对气体传感器阵列的设计上。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种空气质量预测方法、系统及存储介质,能够有效的降低迭代次数和均方误差。
根据本发明提供的空气质量预测方法,包括以下步骤:
步骤S1:获取一历史时间段的目标空气质量数据,所述目标空气质量数据包括空气污染物浓度和空气质量指数;
步骤S2:建立一用于训练所述目标空气质量数据的神经网络模型;
步骤S3:将所述目标空气质量数据输入至所述神经网络模型中进行训练,生成一空气质量预测模型;
步骤S4:输入一时刻的空气质量数据至所述空气质量预测模型中确定下一时刻的空气质量数据。
优选地,所述步骤S1包括如下步骤:
步骤S101:通过空气质量检测装置对空气进行数据采集生成为空气模拟信号;
步骤S102:将所述空气模拟信号输入到信号放大电路中,并于调制解调器内进行调整,输出空气数字信号,即空气质量数据;
步骤S103:对所述空气质量数据采用主成分分析法对所述空气质量数据进行相关性分析,用以筛选出相关性较高的因子,进而生成目标空气质量数据。
优选地,所述步骤S3包括如下步骤:
步骤S301:根据所述空气质量数据构建一样本集;
步骤S302:随机划分所述样本集为训练样本和测试样本;
步骤S303:顺序读取所述空气质量数据,并分批输入所述目标空气质量数据至所述神经网络模型的输入模块中,以执行训练操作;
步骤S304:初级模型构建步骤,在训练过程中对所述神经网络模型的网络参数权重进行调整,以获得训练后的空气质量预测模型;
步骤S305:采用均方根误差和平均绝对误差作为检验模型准确的标准,输入所述测试样本至所述训练模型中进行验证操作;
步骤S306:初级模型优化步骤,根据所述验证步骤的验证结果对所述训练模型再次进行训练,以获得所述空气质量预测模型。
优选地,所述网络参数包括:学习速率、最小误差、迭代次数、输入神经元的个数、输出神经元的个数以及隐藏层的个数。
优选地,所述步骤S304包括如下步骤:
步骤S3041:对神经网络模型进行多次训练以选择合适的网络参数;
步骤S3042:采用ReLU函数作为所述神经网络模型中输入层到隐藏层的激活函数,采用梯度下降算法作为所述神经网络模型的隐藏层到输出层的函数;
步骤S3043:通过遗传算法优化神经网络的权值,采取适应度函数,不断更新神经网络模型以寻求全局最优解。
优选地,所述使用遗传算法优化神经网络的权值的步骤中,具体包括如下步骤:
判断所述神经网络模型是否达到收敛的标准,若是,则输出新种群结果并结束,若否,并执行如下步骤;
遵循适应度越高选择概率越大的原则,选择个体的父方和母方进行遗传操作,采用的遗传算子包括比例选择运算、单点交叉运算以及基本位变异运算。
优选地,所述步骤S103包括如下步骤:
步骤S1031:对所述空气质量数据去中心化;
步骤S1032:计算所述空气质量数据的协方差矩阵,并对进行特征值分解,取出最大的个体特征值对应的特征向量;
步骤S1033:将所述特征向量标准化之后组成特征向量矩阵W,根据特征向量矩阵W组成目标空气质量数据。
优选地,所述神经网络模块包括输入层、隐含层以及输出层;
所述输入层,用于将接收到的目标空气质量数据传递至隐含层;
所述隐含层,用于对所述目标空气质量数据训练学习后再传至输出层输出。
根据本发明提供的空气质量预测系统,包括以下模块:
数据获取模块,用于获取一历史时间段的目标空气质量数据,所述目标空气质量数据包括空气污染物浓度和空气质量指数;
模型建立模块,用于建立一用于训练所述目标空气质量数据的神经网络模型;
模型训练模块,用于将所述目标空气质量数据输入至所述神经网络模型中进行训练,生成一空气质量预测模型;
数据预测模块,用于输入一时刻的空气质量数据至所述空气质量预测模型中确定下一时刻的空气质量数据。
根据本发明提供的存储介质,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行所述的空气质量预测方法。
与现有技术相比,本发明具有如下的有益效果:
本发明通过对空气质量数据进行主成分分析(PCA)进行降维,再结合基于遗传算法优化的神经网络进行预测,够有效的降低迭代次数和均方误差,提高预测的准确率;本发明能够控制神经网络的迭代次数更小,学习效率更高,误差反向传播中的均方误差有效减小,预测出的空气质量指数与测试集的匹配度较高。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中空气质量预测方法的步骤流程图;
图2为本发明实施例中空气质量检测装置的工作流程图;
图3为本发明实施例中空气污染物监测装置的工作腔截面示意图
图4为现有技术中传统BP神经网络训练下的RMSE拟合曲线图;
图5为本发明实施例中遗传算法优化的BP神经网络训练下的RMSE拟合曲线图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
图1为本发明实施例中空气质量预测方法的步骤流程图,如图1所示,本发明提供的空气质量预测方法,包括以下步骤:
步骤S1:获取一历史时间段的目标空气质量数据,所述目标空气质量数据包括空气污染物浓度和空气质量指数;
图2为本发明实施例中空气质量检测装置的工作流程图,如图2所示,所述步骤S1包括如下步骤:
步骤S101:通过空气质量检测装置对空气进行数据采集生成为空气模拟信号;
步骤S102:将所述空气模拟信号输入到信号放大电路中,并于调制解调器内进行调整,输出空气数字信号,即空气质量数据;
步骤S103:对所述空气质量数据采用主成分分析法对所述空气质量数据进行相关性分析,用以筛选出相关性较高的因子,进而生成目标空气质量数据。
在本发明实施例中,所述步骤S103包括如下步骤:
步骤S1031:对所述空气质量数据去中心化;
步骤S1032:计算所述空气质量数据的协方差矩阵,并对进行特征值分解,取出最大的个体特征值对应的特征向量;
步骤S1033:将所述特征向量标准化之后组成特征向量矩阵W,根据特征向量矩阵W组成目标空气质量数据。
在本发明实施例中,采用带有气体传感器阵列的空气检测装置收集区域内空气,空气进入检测装置后,通过气敏传感器阵列并分析空气中各个污染物的含量,并将气味信号通过滤波器和调制解调器转化为计算机可以识别的数字信号。将关注点从单一化的AQI指数转移到研究PM2.5、PM10、SO2、NO、O3、CO浓度,将日平均浓度作为预测的重点,提升了数据集的维度,也增大了数据集的非线性关系。
把污染数据和气象数据作为模型的输入数据,研究各污染物与AQI指数的相关性,除去地相关度的气象数据,减少模型预测的复杂性和不确定性,从而降低模型预测准确性的负面影响。
使用主成分分析法(PCA)对数据进行相关性分析,对数据进行降维,计算相关性并筛选出相关性较高的因子,作为神经网络的输入神经元。主成分分析首先要对样本去中心化,利用样本的均值与其数据集样本方差做差值运算。利用ReLU激活函数与BP神经网络结合解决了梯度消失的问题,利用遗传算法对神经网络的阈值进行优化,解决了BP神经网络寻找局部最优解的缺陷,能够在全局寻求预测的最优解,最终达到减少神经网络迭代次数,减少均方误差提升空气质量预测准确率的效果。
针对实际中的空气污染物预测问题,潜在的气压、温度等变化因素过多,数据集存在着很强的非线性关系,采样的数据存在着冗余的问题。首先要对选择的数据集进行降维处理,提取数据中的主要特征量。
第一步对样本去中心化,并计算样本的协方差矩阵XXT,去中心化的公式如下:
对协方差矩阵进行特征值的分解,其中xj表示样本值,m取出表示样本的总量。最大的n’个特征值对应的特征向量(ω1ω2,,,,ωn′)将这些特征向量标准化之后组成特征向量矩阵W。根据标准化的矩阵组成新的样本集,最终形成输入数据集,同时划分测试集和训练集。
对样本集中的每一个样本xi转化为新的样本zi=WTxi,最终得到输出样本集D′。
根据成分累计贡献率达到90%以上的原则,使用Matlab软件进行仿真处理,得出数据集的特征值、贡献率和累计贡献率。
最终筛选出PM2.5、PM10、SO2、NO四种空气污染物因子作为神经网络的输入神经元,由此设定为BP神经网络的输入层数为4。
经过主成分分析,选择贡献率累计达到90%以上的因子作为相关因子,选出PM2.5、PM10、SO2、NO四种污染物作为输入值进行神经网络训练。
将主成分分析得到相关性较高的4中污染因素对AQI指数进行计算。利用单个项目的空气质量分指数值的最大值最小值差值,与污染物浓度限值高位值和低位值差值进行比值计算,最终的带每一种污染物的空气质量分指数。
步骤S2:建立一用于训练所述目标空气质量数据的神经网络模型;
步骤S3:将所述目标空气质量数据输入至所述神经网络模型中进行训练,生成一空气质量预测模型;
在本发明实施例中,所述步骤S3包括如下步骤:
步骤S301:根据所述空气质量数据构建一样本集;
步骤S302:随机划分所述样本集为训练样本和测试样本;
步骤S303:顺序读取所述空气质量数据,并分批输入所述空气质量数据至所述神经网络模型的输入模块中,以执行训练操作;
步骤S304:初级模型构建步骤,在训练过程中对所述神经网络模型的网络参数权重进行调整,以获得训练后的训练模型;
步骤S305:采用均方根误差(RMSE)和平均绝对误差(MAE)作为检验模型准确的标准,输入所述测试样本至所述训练模型中进行验证操作;
步骤S306:初级模型优化步骤,根据所述验证步骤的验证结果对所述训练模型再次进行训练,以获得所述空气质量预测模型。
在本发明实施例中,所述步骤S304包括如下步骤:
步骤S3041:对神经网络模型进行多次训练选择合适的网络参数;
步骤S3042:采用ReLU函数作为所述神经网络模型中输入层到隐藏层的激活函数,采用梯度下降算法作为所述神经网络模型的隐藏层到输出层的函数;
步骤S3043:通过遗传算法优化神经网络的权值,采取适应度函数,不断更新神经网络模型以寻求全局最优解。
在本发明实施例中,所述网络参数包括:学习速率、最小误差、迭代次数、输入神经元的个数、输出神经元的个数以及隐藏层的个数。
所述使用遗传算法优化神经网络的权值的步骤中,具体包括如下步骤:
判断所述神经网络模型是否达到收敛的标准,若是,则输出新种群结果并结束若否,并执行如下步骤;
遵循适应度越高选择概率越大的原则,选择个体的父方和母方进行遗传操作,具体的遗传算子包括比例选择运算、单点交叉运算以及基本位变异运算。
本发明实施例中,BP神经网络是采用误差反向传播算法来构建的一种人工神经网络。神经网络的学习过程包括两个阶段:信息的正向传播和误差的反向传播,正因为BP神经网络具有良好的误差反向传播特性,所以本发明选用BP神经网络算法来构建预测模型。由于最终选择出4种相关因子作为神经网络的输入层神经元,选取前100组的数据作为训练集之后83组作为验证集。隐藏层的神经元利用经验公式进行设计,其中m为隐藏层节点数,n为输入层节点数,α为1~10之间的调节常数:
四种污染物具有较强的非线性关系,为了更好的对空气污染物进行划分,设计激活函数,由于ReLU自带稀疏性限制,它已经慢慢取代了sigmod,使用ReLU激活函数能够提升网络的预测精度,本发明使用改进的ReLU激活函数。相对于sigmiod函数来说,ReLU函数能够有效的解决梯度消失的问题,ReLU是单调函数,适用于神经网络的收敛问题,更加符合生物神经元的特征。但是缺乏上限设置,因此本发明为激活函数设置了ReLU6经验函数,表达式为:
f(x)=min(6,max(0,x))
其中x表示的是样本变量,隐藏层到输出层使用的函数为非线性的拟合函数,利用梯度下降算法更新权重,更新的权值使用迭代前的权值减去学习因子可以,可得出梯度下降法的公式为对权值优化的公式如下:
最后输出值为空气质量指数AQI的数值,输入层的神经元数为4。
将选取的训练集中样本数据进行归一化的处理,并对神经网络进行构造并配置网络参数,本实验设置的训练次数为1000,学习速率为0.01,训练目标的最小误差为0.0001,参数配置好后即可对神经网络进行训练。
利用遗传算法对神经网络进行权值的优化,先用GA算法优化权值和种群个数对原始数据进行寻优,寻求全局最优解。
Bp神经网络预测的输出与期望输出的平方和误差越小的种群个体适应度越强,把从数据集中与最优解进行映射的过程叫做适应度计算。适应度函数需要设计得当,避免出现个体差异太小,多样性遭到破坏,陷入局部峰值的现象。本发明选取指数变换的方法来设计适应度函数。
BP神经网络的主要目的就是反复修正权值和阈值,使得误差值达到最小。将训练集放入遗传算法优化的BP神经网络进行训练,输出预测结果与测试集数据进行对比,得出期望值和预测值的拟合曲线,评价预测效果的标准采用均方根误差(RMSE)和平均绝对误差(MAE)作为检验模型准确的标准。
评价预测效果的标准采用均方根误差(RMSE)和平均绝对误差(MAE)作为检验模型准确的标准,RMSE与MAE越小说明预测模型的效果越好。
步骤S4:输入一时刻的空气质量数据至所述空气质量预测模型中确定下一时刻的空气质量数据。
在本发明实施例中,所述神经网络模块由输入层、隐含层以及输出层;
所述输入层,用于将接收到的目标空气质量数据传递至隐含层;
所述隐含层,用于对所述目标空气质量数据训练学习后再传至输出层输出。
本发明实施例中,本发明提供的空气质量预测系统,包括以下模块:
数据获取模块,用于获取一历史时间段的目标空气质量数据,所述空气质量数据包括空气污染物浓度和空气质量指数;
模型建立模块,用于建立一用于训练所述目标空气质量数据的神经网络模型;
模型训练模块,用于将所述目标空气质量数据输入至所述神经网络模型中进行训练,生成一空气质量预测模型;
数据预测模块,用于输入一时刻的空气质量数据至所述空气质量预测模型中确定下一时刻的空气质量数据。
在本发明实施例中,本发明还提供一种存储介质,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行所述的空气质量预测方法。
实施实例:
在训练的前3代,BP神经网络在训练、交叉验证和测试的拟合曲线走势基本相同,从迭代次数进行4代之后3条拟合曲线开始产生明显的走势分歧,测试和验证在迭代过程中的误差趋于稳定,反观神经网络在训练时的表现在4代以后则出现了明显的梯度变化。均方误差达到最小值是在训练次数第12次出现,而最优验证性能的最小值best值与目标值也存在着差距。经过GA优化过的BP神经网络则在均方误差曲线上显示出更好的性能,首先训练的迭代次数为8次,相比于传统BP神经网络来说训练时间更短,说明优化后的的神经网络学习效率更高,而BP神经网络现在训练、交叉验证和测试中的拟合曲线走势大致相同,在均方误差达到最小值时,训练达到的均方误差与期望的均方值也趋于吻合。
经过预测结果分析得出使用遗传算法优化的BP神经网络,迭代次数比未优化的的神经网络更少,说明神经网络的学习效率有所提升。均方误差与平均绝对误差相较于未优化的神经网络明显减小,而经过遗传算法优化的BP神经网络现在训练、交叉验证和测试中的拟合曲线走势大致相同。对于预测数据的最值以及拐点值的预测情况表现优秀。
运行GA_BP神经网络预测模型,得到预测值和期望值的拟合曲线如图5所示,可以观测该网络模型的预测能力较好,AQI指数的预测值与期望实际值的变化趋势大致相同,对于前后AQI指数变化较大的点可能会出现误差波动情况,对连续几天AQI指数变化均匀的点,误差波动也趋于缓和。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (10)
1.一种空气质量预测方法,其特征在于,包括以下步骤:
步骤S1:获取一历史时间段的目标空气质量数据,所述目标空气质量数据包括空气污染物浓度和空气质量指数;
步骤S2:建立一用于训练所述目标空气质量数据的神经网络模型;
步骤S3:将所述目标空气质量数据输入至所述神经网络模型中进行训练,生成一空气质量预测模型;
步骤S4:输入一时刻的空气质量数据至所述空气质量预测模型中确定下一时刻的空气质量数据。
2.根据权利要求1所述的空气质量预测方法,其特征在于,所述步骤S1包括如下步骤:
步骤S101:通过空气质量检测装置对空气进行数据采集生成为空气模拟信号;
步骤S102:将所述空气模拟信号输入到信号放大电路中,并于调制解调器内进行调整,输出空气数字信号,即空气质量数据;
步骤S103:对所述空气质量数据采用主成分分析法对所述空气质量数据进行相关性分析,用以筛选出相关性较高的因子,进而生成目标空气质量数据。
3.根据权利要求1所述的空气质量预测方法,其特征在于,所述步骤S3包括如下步骤:
步骤S301:根据所述空气质量数据构建一样本集;
步骤S302:随机划分所述样本集为训练样本和测试样本;
步骤S303:顺序读取所述空气质量数据,并分批输入所述目标空气质量数据至所述神经网络模型的输入模块中,以执行训练操作;
步骤S304:初级模型构建步骤,在训练过程中对所述神经网络模型的网络参数权重进行调整,以获得训练后的空气质量预测模型;
步骤S305:采用均方根误差和平均绝对误差作为检验模型准确的标准,输入所述测试样本至所述训练模型中进行验证操作;
步骤S306:初级模型优化步骤,根据所述验证步骤的验证结果对所述训练模型再次进行训练,以获得所述空气质量预测模型。
4.根据权利要求1所述的空气质量预测方法,其特征在于,所述网络参数包括:学习速率、最小误差、迭代次数、输入神经元的个数、输出神经元的个数以及隐藏层的个数。
5.权利要求3所述的空气质量预测方法,其特征在于,所述步骤S304包括如下步骤:
步骤S3041:对神经网络模型进行多次训练以选择合适的网络参数;
步骤S3042:采用ReLU函数作为所述神经网络模型中输入层到隐藏层的激活函数,采用梯度下降算法作为所述神经网络模型的隐藏层到输出层的函数;
步骤S3043:通过遗传算法优化神经网络的权值,采取适应度函数,不断更新神经网络模型以寻求全局最优解。
6.据权利要求5所述的空气质量预测方法,其特征在于,
所述使用遗传算法优化神经网络的权值的步骤中,具体包括如下步骤:
判断所述神经网络模型是否达到收敛的标准,若是,则输出新种群结果并结束,若否,并执行如下步骤;
遵循适应度越高选择概率越大的原则,选择个体的父方和母方进行遗传操作,采用的遗传算子包括比例选择运算、单点交叉运算以及基本位变异运算。
7.权利要求2所述的空气质量预测方法,其特征在于,所述步骤S103包括如下步骤:
步骤S1031:对所述空气质量数据去中心化;
步骤S1032:计算所述空气质量数据的协方差矩阵,并对进行特征值分解,取出最大的个体特征值对应的特征向量;
步骤S1033:将所述特征向量标准化之后组成特征向量矩阵W,根据特征向量矩阵W组成目标空气质量数据。
8.权利要求3所述的空气质量预测方法,其特征在于,
所述神经网络模块包括输入层、隐含层以及输出层;
所述输入层,用于将接收到的目标空气质量数据传递至隐含层;
所述隐含层,用于对所述目标空气质量数据训练学习后再传至输出层输出。
9.一种空气质量预测系统,其特征在于,包括以下模块:
数据获取模块,用于获取一历史时间段的目标空气质量数据,所述目标空气质量数据包括空气污染物浓度和空气质量指数;
模型建立模块,用于建立一用于训练所述目标空气质量数据的神经网络模型;
模型训练模块,用于将所述目标空气质量数据输入至所述神经网络模型中进行训练,生成一空气质量预测模型;
数据预测模块,用于输入一时刻的空气质量数据至所述空气质量预测模型中确定下一时刻的空气质量数据。
10.一种存储介质,其特征在于,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行权利要求1至9任一项所述的空气质量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311316.2A CN113011660A (zh) | 2021-03-23 | 2021-03-23 | 空气质量预测方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311316.2A CN113011660A (zh) | 2021-03-23 | 2021-03-23 | 空气质量预测方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113011660A true CN113011660A (zh) | 2021-06-22 |
Family
ID=76405801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110311316.2A Pending CN113011660A (zh) | 2021-03-23 | 2021-03-23 | 空气质量预测方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011660A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610297A (zh) * | 2021-08-06 | 2021-11-05 | 浙江工业大学之江学院 | 空气质量预测方法、装置、设备及存储介质 |
CN114707743A (zh) * | 2022-04-15 | 2022-07-05 | 西安邮电大学 | 基于自适应门控循环神经网络的空气质量预测方法及系统 |
CN114781538A (zh) * | 2022-05-07 | 2022-07-22 | 东莞理工学院 | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 |
CN115096357A (zh) * | 2022-06-07 | 2022-09-23 | 大连理工大学 | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 |
CN115656446A (zh) * | 2022-12-26 | 2023-01-31 | 沃客森信息科技(常州)有限公司 | 一种基于物联网的空气质量检测系统及方法 |
CN116307212A (zh) * | 2023-03-24 | 2023-06-23 | 淮阴工学院 | 一种新型空气质量预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103581188A (zh) * | 2013-11-05 | 2014-02-12 | 中国科学院计算技术研究所 | 一种网络安全态势预测方法及系统 |
CN106056210A (zh) * | 2016-06-07 | 2016-10-26 | 浙江工业大学 | 一种基于混合神经网络的pm2.5浓度值预测方法 |
CN106920007A (zh) * | 2017-02-27 | 2017-07-04 | 北京工业大学 | 基于二阶自组织模糊神经网络的pm2.5智能预测方法 |
CN108898261A (zh) * | 2018-07-24 | 2018-11-27 | 深圳市源广浩电子有限公司 | 一种基于环保大数据的空气质量监测方法及系统 |
CN110363347A (zh) * | 2019-07-12 | 2019-10-22 | 江苏天长环保科技有限公司 | 基于决策树索引的神经网络预测空气质量的方法 |
-
2021
- 2021-03-23 CN CN202110311316.2A patent/CN113011660A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103581188A (zh) * | 2013-11-05 | 2014-02-12 | 中国科学院计算技术研究所 | 一种网络安全态势预测方法及系统 |
CN106056210A (zh) * | 2016-06-07 | 2016-10-26 | 浙江工业大学 | 一种基于混合神经网络的pm2.5浓度值预测方法 |
CN106920007A (zh) * | 2017-02-27 | 2017-07-04 | 北京工业大学 | 基于二阶自组织模糊神经网络的pm2.5智能预测方法 |
CN108898261A (zh) * | 2018-07-24 | 2018-11-27 | 深圳市源广浩电子有限公司 | 一种基于环保大数据的空气质量监测方法及系统 |
CN110363347A (zh) * | 2019-07-12 | 2019-10-22 | 江苏天长环保科技有限公司 | 基于决策树索引的神经网络预测空气质量的方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610297A (zh) * | 2021-08-06 | 2021-11-05 | 浙江工业大学之江学院 | 空气质量预测方法、装置、设备及存储介质 |
CN114707743A (zh) * | 2022-04-15 | 2022-07-05 | 西安邮电大学 | 基于自适应门控循环神经网络的空气质量预测方法及系统 |
CN114781538A (zh) * | 2022-05-07 | 2022-07-22 | 东莞理工学院 | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 |
CN115096357A (zh) * | 2022-06-07 | 2022-09-23 | 大连理工大学 | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 |
CN115656446A (zh) * | 2022-12-26 | 2023-01-31 | 沃客森信息科技(常州)有限公司 | 一种基于物联网的空气质量检测系统及方法 |
CN116307212A (zh) * | 2023-03-24 | 2023-06-23 | 淮阴工学院 | 一种新型空气质量预测方法及系统 |
CN116307212B (zh) * | 2023-03-24 | 2023-12-19 | 淮阴工学院 | 一种空气质量预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113011660A (zh) | 空气质量预测方法、系统及存储介质 | |
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN108491970B (zh) | 一种基于rbf神经网络的大气污染物浓度预测方法 | |
CN108399201B (zh) | 一种基于循环神经网络的Web用户访问路径预测方法 | |
CN108426812B (zh) | 一种基于记忆神经网络的pm2.5浓度值预测方法 | |
CN113919448A (zh) | 一种任意时空位置二氧化碳浓度预测影响因素分析方法 | |
CN110674604A (zh) | 基于多维时序帧卷积lstm的变压器dga数据预测方法 | |
CN111814956B (zh) | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 | |
CN110083125B (zh) | 一种基于深度学习的机床热误差建模方法 | |
CN109992921A (zh) | 一种燃煤电厂锅炉热效率的在线软测量方法及系统 | |
CN108399470B (zh) | 一种基于多示例遗传神经网络的室内pm2.5预测方法 | |
CN112668775A (zh) | 一种基于时序卷积网络算法的空气质量预测方法 | |
CN111369057A (zh) | 一种基于深度学习的空气质量预测优化方法及系统 | |
CN109377440B (zh) | 一种基于多任务集成学习器的pm2.5和o3浓度协同预测方法 | |
CN117171546A (zh) | 一种结合污染扩散指数的城市空气质量预测方法 | |
CN114781538A (zh) | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 | |
CN115034129B (zh) | 一种面向火电厂脱硝装置的NOx排放浓度软测量方法 | |
CN114169374A (zh) | 一种斜拉桥斜拉索损伤识别方法及电子设备 | |
Lu et al. | Quality-relevant feature extraction method based on teacher-student uncertainty autoencoder and its application to soft sensors | |
CN117370766A (zh) | 一种基于深度学习的卫星任务规划方案评估方法 | |
CN113281229A (zh) | 一种基于小样本下多模型自适应大气pm2.5浓度预测方法 | |
CN116468166A (zh) | 一种深度学习径流量预测模型及方法 | |
CN114217025B (zh) | 评估空气质量浓度预测中气象数据对其影响的分析方法 | |
CN118350678B (zh) | 基于物联网与大数据的水环境监测数据处理方法及系统 | |
CN115096357A (zh) | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210622 |