CN112734128B - 一种基于优化rbf的7日电力负荷峰值预测方法 - Google Patents
一种基于优化rbf的7日电力负荷峰值预测方法 Download PDFInfo
- Publication number
- CN112734128B CN112734128B CN202110073909.XA CN202110073909A CN112734128B CN 112734128 B CN112734128 B CN 112734128B CN 202110073909 A CN202110073909 A CN 202110073909A CN 112734128 B CN112734128 B CN 112734128B
- Authority
- CN
- China
- Prior art keywords
- data
- value
- power load
- prediction
- load
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 31
- 238000012795 verification Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 24
- 230000002068 genetic effect Effects 0.000 claims abstract description 22
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000007405 data analysis Methods 0.000 claims abstract description 7
- 210000000349 chromosome Anatomy 0.000 claims description 58
- 238000013528 artificial neural network Methods 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 34
- 230000002159 abnormal effect Effects 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 28
- 230000000737 periodic effect Effects 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 16
- 238000003062 neural network model Methods 0.000 claims description 10
- 238000011160 research Methods 0.000 claims description 9
- 230000009191 jumping Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 5
- 238000011835 investigation Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 31
- 238000004590 computer program Methods 0.000 description 9
- 238000013523 data management Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Water Supply & Treatment (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
Abstract
本发明提供了一种基于优化RBF的7日电力负荷峰值预测方法,包含数据采集、数据分析及数据预处理;划分数据集为训练集和验证集;基于训练集,利用遗传算法对RBF网络进行参数优化,确定适用在本发明的电力负荷峰值预测中RBF网络的中心向量、中心点宽度和权重这三个参数的最优值,并将训练集作为输入,基于优化的RBF网络来预测未来7日的电力负荷峰值,根据模型输出的7天的电力负荷峰值与验证集做比较,结合平均绝对误差MAE和均方根误差RMSE两个指标,得到模型的预测准确度。通过本发明的预测方法,提高了预测准确性和时效性,预测效果较现有电力负荷预测方法更好。
Description
技术领域
本发明涉及电力系统规划和调度等领域,具体涉及一种基于优化RBF的7日电力负荷峰值预测方法。
背景技术
伴随着电力设备的各方面影响,使得电力负荷预测有着极高的商业和研究价值。准确地预测短期的电力负荷,能够使电力公司及时调整负荷设备,减少资源浪费,提高性能和电力网络的稳定性。电力负荷预测其本质是寻找负荷数据集之间的隐含关系,利用已知的离散数据建立拟合模型,推测未来某一时刻或某一时间段内的数据值。短期电力负荷预测技术一般主要用来预测未来1天至1周的电力负荷,其预测的精度直接影响到电力市场下各运营商的经济成本,因而在现代电力需求侧管理当中占有重要地位。
目前有关短期电力负荷预测的研究已经小有建树,但所用方法针对性较强,普适性较差。因此短期电力负荷研究仍然面临部分问题:(1)数据源异构且维度差异较大,在采集数据时,数据结构不同,数据精度也存在差异;此外,负载数据的维度可能会包含风力、湿度、温度等其他可能影响负荷的因素,导致各地区之间的数据维度差异较大;(2)时序性的负荷数据之间的关系复杂,预测难度较大。电力负荷数据为时序性的数据流,由于影响负荷数据的因素较多,因此数据之间的关系较难模拟;电力负荷数据呈动态变化,也是因为颇多的不确定因素影响,给电力负荷预测带来困难;(3)短期电力负荷预测对时效性要求更高,短期电力负荷预测需要测量未来一周乃至一天的负荷数据,不仅对硬件方面有要求,也对模型的收敛时间和计算速度都有较高的要求。
现有的短期电力负荷预测技术一般主要用来预测未来1天至1周的电力负荷,且数据源异构且维度差异较大、时序性的负荷数据之间的关系复杂,预测难度较大;其次,传统的电力负荷预测方法,例如回归分析、灰色模型、支持向量机、神经网络、时间序列等,但其预测精度和预测时效性无法满足要求;另外,国内外专家将具有快速计算能力、自学习能力的BP或RBF神经网络用于电力负荷预测研究,但RBF神经网络算法的训练模型受参数影响,其训练速度、收敛结果带有不确定性,且容易陷入局部最优结果,预测准确性和时效性不足。
发明内容
针对现有技术中所存在的不足,本发明提出一种基于优化RBF的7日电力负荷峰值预测方法,仅以电力负荷时序数据作为输入,减少其他因素的影响比重,克服了现有短期电力负荷预测方法中数据源异构且维度差异较大的缺陷;并通过遗传算法来优化RBF网络,确定适用在本发明的电力负荷峰值预测中RBF网络的参数,并基于优化的RBF网络来预测7日的电力负荷峰值,提高了电力负荷峰值预测方法的准确性和时效性,解决了现有技术中短期电力负荷预测技术中存在的数据源异构且维度差异较大、时序性的负荷数据之间的关系复杂,预测难度较大、预测准确性和时效性不足的技术问题。
为实现上述目的,本发明采用了如下的技术方案:
一种基于优化RBF的7日电力负荷峰值预测方法,其特征在于,包括如下步骤:
步骤S1、获取历史电力负荷数据集;
步骤S2、数据分析:获取的电力负荷数据间具有很强的时间相关性,呈现出平稳的周期性变化,通过绘制电力负荷曲线图,得到电力负荷数据的一些普适特性,包括波动性,连续性,周期性,掌握电力负荷的周周期性和日周期性规律,为短期电力负荷预测的研究提供更准确的数据支撑;
步骤S3、数据预处理:
步骤S31、补齐缺失数据:负荷值应该为正整数,若为负数或“0”,则视为数据丢失,利用前一天当前时刻的负荷值与当天前一时刻的负荷值组合的方式处理缺失数据,具体公式如下:
X(d,t)=aX(d-1,t)+a′X(d,t-1) (1.1)
其中,X(d,t)表示d日期t时刻的电力负荷数据值,a、a′分别表示对应的数据的权重;
步骤S32、处理异常数据:利用电力负荷数据的周期性特性进行垂直和水平两个方面上的异常数据的排查与修正,其中,
垂直处理方法:利用负荷数据与前一天同一时刻的历史数据有较强的关联性,根据当前数据与前一天同一时刻的历史数据进行误差计算,若超过阈值,则根据当天负荷平均值与前一天当前历史数据值按比例计算后进行替换;具体计算过程如下:
首先判断当前数据是否是异常数据,计算:
|(X(d,t)-X(d-1,t))/X(d,t)|=θ1(t) (1.2)
θ1(t)>ρ1 (1.3)
其中X(d,t)表示d日期t时刻的电力负荷数据值,θ1(t)为数据间的绝对变化率,ρ1为阈值,若θ1(t)超过阈值ρ1,表示当前为异常数据;否则表示为正常数据;对异常数进行垂直处理按照式1.4和式1.5进行:
X(d,t)=b1X(d-1,t)+b2X(d+1,t)+b3K(d-1)+b4K(d+1) (1.4)
其中为b1、b2、b3、b4为权重,K(d)为日期d的平均负荷值,n为[0,24]的正整数;对电力负荷数据集中相邻两天同一时刻的数据按照式1.2计算θ1(t),得到θ1(t)取值范围,θ1(t)大于1时则表示负荷数据较上一天同一时刻增长或减少逾1倍,根据θ1(t)的取值分布和电力负荷数据特征,确定ρ1的值;
水平处理方法:根据相邻两个时刻的负荷值进行误差判定,若相差超过一定阈值,则判定为误差数据,根据负荷曲线的连续性,将其替换为相邻数据的平均值,具体计算过程如下:
若d日期t时刻的电力负荷数据值与相邻负荷值计算绝对误差:
判断绝对误差是否在阈值范围内:
若式1.7中任意一个判断成立,则该点为异常点,需要按照式1.8进行水平平滑处理;若式1.7中皆不成立,则为正常数据;
其中,X(d,t)表示d日期t时刻的电力负荷数据值,θ2(t)、θ3(t)为当前时刻分别与前、后时刻的误差变化率,ρ2为阈值;根据式1.6对原始电力负荷数据进行前后时刻误差变化率计算,根据θ2(t)、θ3(t)的取值范围和分布情况,得到阈值ρ2;
步骤S33、数据标准化:对完成缺失、异常处理后的数据集进行z-score标准化处理;
步骤S4、划分数据集为训练集和验证集;
步骤S5、优化RBF神经网络电力负荷日峰值预测模型:基于GA算法对RBF神经网络进行参数优化,得到优化RBF神经网络模型电力负荷日峰值预测模型;待优化参数包括:中心向量、中心点宽度和权重;
参数优化流程如下:
S51:将RBF神经网络中的待优化参数进行初始化,采用实数方式对其编码,使其变为长度为10的染色体序列;
S52:确定遗传算法中个体的适应度函数,利用预测与验证数据之间的均方根误差作为个体的适应度值,适应度函数的计算方式如下:
其中,N为预测数据集大小,x′i为预测数据,yi为验证数据;
S53:初始化遗传算法中的概率pc、概率pm,种群数量,确定自适应度值函数;
S54:以概率pc对当前种群中的染色体进行交换产生子代染色体,未进行交换的染色体直接进行复制;
S55:以概率pm根据当代染色体突变为子代染色体,并将新的个体插入种群中;
S56:计算个体的适应度值,若达到跳出条件则进行下一步,否则跳转到S55;
S57:输出遗传算法中的最优解,将其解码,将所得值作为RBF网络的参数;
步骤S6、利用训练集作为输入,至优化RBF神经网络模型电力负荷日峰值预测模型,模型预测输出为7天的电力负荷峰值;再根据模型输出的7天电力负荷峰值与验证集做比较,结合平均绝对误差MAE和均方根误差RMSE两个指标,计算得到模型的预测准确度。
步骤S33具体为:利用原始数据的均值和标准差进行数据标准化,需要首先计算样本的均值和标准差,具体计算方法如下:
其中,x表示原始数据值,x′i表示归一化后数据值,表示原始样本的均值,δ表示原始样本的标准差。
遗传算法的具体迭代步骤如下:
(1)将特征进行编码,一组特征对应一个染色体,染色体即为对应的解;
(2)初始化染色体,设置染色体数量;
(3)计算个体的适应度值;
(4)交换:由交换概率pc选择两个染色体作为父代进行交换,交换的部分为两者相异的部分,产生子代染色体;
(5)选择:根据适应度值,从当前种群中选择优良个体进行下一代繁殖,使得最优的前几个解均被保留在种群中;
(6)变异:以较小的概率pm随机改变染色体中的某个值,模仿自然界中新个体的产生;
(7)判断是否达到最大迭代次数或最小适应度值;若是,继续下一步;否则跳转到(3);
(8)终止迭代,将染色体解码,得到最优解。
RBF神经网络结构由输入层、隐含层、输出层构成,其中隐含层仅有一层,其隐含层节点采用径向基函数作为激活函数;RBF神经网络中,输入层节点仅负责信息传输;输入层到隐含层之间通过非线性变化实现数据从低维到高维的映射,隐含层利用径向基函数构成高维的映射空间,确定了径向基函数的中心点即可确定映射关系;隐含层到输出层之间使用线性映射,即根据隐含层节点输出进行权重加权得到输出层节点输出;
径向基函数为高斯函数,计算公式如1.13式所示:
其中,x表示n维输入向量,ci为第i个函数的中心,维度同n,σi为第i个中心点的宽度,||·||表示欧式范数。
设隐含层节点个数为I,输出层第k个节点的输出为Ok,则其计算公式如下:
其中,ωik为隐含层到输出层的映射权重。
一种基于优化RBF的7日电力负荷峰值预测装置,其特征在于,包括如下模块:
数据获取模块、获取历史电力负荷数据集;
数据分析模块:获取的电力负荷数据间具有很强的时间相关性,呈现出平稳的周期性变化,通过绘制电力负荷曲线图,得到电力负荷数据的一些普适特性,包括波动性,连续性,周期性,掌握电力负荷的周周期性和日周期性规律,为短期电力负荷预测的研究提供更准确的数据支撑;
数据预处理模块:
补齐缺失数据:负荷值应该为正整数,若为负数或“0”,则视为数据丢失,利用前一天当前时刻的负荷值与当天前一时刻的负荷值组合的方式处理缺失数据,具体公式如下:
X(d,t)=aX(d-1,t)+a′X(d,t-1) (1.1)
其中,X(d,t)表示d日期t时刻的电力负荷数据值,a、a′分别表示对应的数据的权重;
处理异常数据:利用电力负荷数据的周期性特性进行垂直和水平两个方面上的异常数据的排查与修正,其中,
垂直处理方法:利用负荷数据与前一天同一时刻的历史数据有较强的关联性,根据当前数据与前一天同一时刻的历史数据进行误差计算,若超过阈值,则根据当天负荷平均值与前一天当前历史数据值按比例计算后进行替换;具体计算过程如下:
首先判断当前数据是否是异常数据,计算:
|(X(d,t)-X(d-1,t))/X(d,t)|=θ1(t) (1.2)
θ1(t)>ρ1 (1.3)
其中X(d,t)表示d日期t时刻的电力负荷数据值,θ1(t)为数据间的绝对变化率,ρ1为阈值,若θ1(t)超过阈值ρ1,表示当前为异常数据;否则表示为正常数据;对异常数进行垂直处理按照式1.4和式1.5进行:
X(d,t)=b1X(d-1,t)+b2X(d+1,t)+b3K(d-1)+b4K(d+1) (1.4)
其中为b1、b2、b3、b4为权重,K(d)为日期d的平均负荷值,n为[0,24]的正整数;对电力负荷数据集中相邻两天同一时刻的数据按照式1.2计算θ1(t),得到θ1(t)取值范围,θ1(t)大于1时则表示负荷数据较上一天同一时刻增长或减少逾1倍,根据θ1(t)的取值分布和电力负荷数据特征,确定ρ1的值;
水平处理方法:根据相邻两个时刻的负荷值进行误差判定,若相差超过一定阈值,则判定为误差数据,根据负荷曲线的连续性,将其替换为相邻数据的平均值,具体计算过程如下:
若d日期t时刻的电力负荷数据值与相邻负荷值计算绝对误差:
判断绝对误差是否在阈值范围内:
若式1.7中任意一个判断成立,则该点为异常点,需要按照式1.8进行水平平滑处理;若式1.7中皆不成立,则为正常数据;
其中,X(d,t)表示d日期t时刻的电力负荷数据值,θ2(t)、θ3(t)为当前时刻分别与前、后时刻的误差变化率,ρ2为阈值;根据式1.6对原始电力负荷数据进行前后时刻误差变化率计算,根据θ2(t)、θ3(t)的取值范围和分布情况,得到阈值ρ2;
数据标准化:对完成缺失、异常处理后的数据集进行z-score标准化处理;
数据划分模块、划分数据集为训练集和验证集;
预测模型构建模块、优化RBF神经网络电力负荷日峰值预测模型:基于GA算法对RBF神经网络进行参数优化,得到优化RBF神经网络模型电力负荷日峰值预测模型;待优化参数包括:中心向量、中心点宽度和权重;
参数优化流程如下:
将RBF神经网络中的待优化参数进行初始化,采用实数方式对其编码,使其变为长度为10的染色体序列;
确定遗传算法中个体的适应度函数,利用预测与验证数据之间的均方根误差作为个体的适应度值,适应度函数的计算方式如下:
其中,N为预测数据集大小,x′i为预测数据,yi为验证数据;
初始化遗传算法中的概率pc、概率pm,种群数量,确定自适应度值函数;
以概率pc对当前种群中的染色体进行交换产生子代染色体,未进行交换的染色体直接进行复制;
以概率pm根据当代染色体突变为子代染色体,并将新的个体插入种群中;
计算个体的适应度值,若达到跳出条件则进行下一步,否则跳转到S55;
输出遗传算法中的最优解,将其解码,将所得值作为RBF网络的参数;
利用训练集作为输入,至优化RBF神经网络模型电力负荷日峰值预测模型,模型预测输出为7天的电力负荷峰值;再根据模型输出的7天电力负荷峰值与验证集做比较,结合平均绝对误差MAE和均方根误差RMSE两个指标,计算得到模型的预测准确度。
相比于现有技术,本发明具有如下有益效果:
1.本发明仅以电力负荷时序数据作为输入,减少其他因素的影响比重,克服了现有短期电力负荷预测方法中数据源异构且维度差异较大的缺陷。
2.本发明通过对负荷数据进行分析,获取的电力负荷数据间具有很强的时间相关性,呈现出平稳的周期性变化,通过绘制电力负荷曲线图,得到电力负荷数据的一些普适特性,包括波动性,连续性,周期性,掌握电力负荷的周周期性和日周期性规律,为短期电力负荷预测的研究提供更准确的数据支撑。另外,对历史负荷数据进行数据预处理操作,包括缺失数据补齐、异常数据排查与修正、数据标准化,获得了有效的数据,消除了误差或缺失数据对预测结果的影响,此外,对历史负荷数据进行标准化处理克服了电力负荷数据波动性较大的缺陷,使得神经网络在训练过程中,保证节点的输出值在激活函数的适合范围内。
3.本发明利用遗传算法对RBF神经网络进行参数优化,确定适用在本发明的7日电力负荷峰值预测中RBF网络的中心向量、中心点宽度和权重这三个参数的最优值,并基于优化的RBF网络来预测未来7日的电力负荷峰值,相对于现有的基于RBF以及基于BP的电力负荷预测方法,大大提高了预测精准性和时效性。
附图说明
图1为本发明的基于优化RBF的7日电力负荷峰值预测方法的流程示意图;
图2为智能电网架构图;
图3为2017年6月14日-16日电力负荷缺失数据处理前后对比图;
图4为RBF模型与GA-RBF模型预测误差率曲线图;
图5为BP模型与GA-RBF模型预测误差率曲线图。
具体实施方式
下面结合附图及实施例对本发明中的技术方案进一步说明。
如图1所示,本发明提出了一种基于优化LSTM网络的24点电力负荷值7日预测方法,包含以下步骤;
步骤S1、获取历史电力负荷数据集;
用户用电数据、设备负载数据都可以直接传回电力公司的智能系统中,方便企业进行管理和营销。智能电网涵盖供给侧两端的大量数据,还能捕捉设备的实时运行状态,数据量庞大、数据种类多样。智能电网大数据架构平台由三个层级组成,分别为应用层,数据管理层,传感量测层,如图2所示。传感量测层将采集到的原始电力数据和天气、设备负荷等附加数据传回资源池中,向上层数据管理层提供支撑;数据管理层完成去除噪声、冗余、去重等工作,将数据存入分布式数据管理库中,保证数据的可靠性;应用层利用大数据技术完成资源的统筹调配、系统监控和安全保证、预测及能耗预警,提高电源、电网、用电侧的资源利用率。
实验数据来源于重庆电网敖山变电站1#主变压器的电力负荷数据,数据集采样间隔为60分钟,即每日24点负荷值。数据集包含了从2014年11月27日至2017年12月31日3年多的负荷数据,共计27144条。
步骤S2、数据分析:获取的电力负荷数据间具有很强的时间相关性,呈现出平稳的周期性变化,通过绘制电力负荷曲线图,得到电力负荷数据的一些普适特性,包括波动性,连续性,周期性,掌握电力负荷的周周期性和日周期性规律,为短期电力负荷预测的研究提供更准确的数据支撑。
步骤S3、数据预处理:
步骤S31、补齐缺失数据:负荷值应该为正整数,若为负数或“0”,则视为数据丢失,利用前一天当前时刻的负荷值与当天前一时刻的负荷值组合的方式处理缺失数据,具体公式如下:
X(d,t)=aX(d-1,t)+a′X(d,t-1) (1.1)
其中,X(d,t)表示d日期t时刻的电力负荷数据值,a、a′分别表示对应的数据的权重,本实施例中都取0.5。
将缺失数据补齐,以2017年6月14日、6月15日和6月16日的数据作为实例分析,在进行缺失数据处理前,负荷曲线如图3(a)所示,由图可以看出,6月15日数据在9点之后出现了缺失,6月16日数据也在0点到3点出现了缺失。处理后数据如图3(b)所示,可见经过缺失数据补齐后,负荷曲线基本符合上述的电力负荷数据特征。
步骤S32、处理异常数据:利用电力负荷数据的周期性特性进行垂直和水平两个方面上的异常数据的排查与修正,其中,
垂直处理方法:利用负荷数据与前一天同一时刻的历史数据有较强的关联性,根据当前数据与前一天同一时刻的历史数据进行误差计算,若超过阈值,则根据当天负荷平均值与前一天当前历史数据值按比例计算后进行替换;具体计算过程如下:
首先判断当前数据是否是异常数据,计算:
|(X(d,t)-X(d-1,t))/X(d,t)|=θ1(t) (1.2)
θ1(t)>ρ1 (1.3)
其中X(d,t)表示d日期t时刻的电力负荷数据值,θ1(t)为数据间的绝对变化率,ρ1为阈值,若θ1(t)超过阈值ρ1,表示当前为异常数据;否则表示为正常数据;对异常数进行垂直处理按照式1.4和式1.5进行:
X(d,t)=b1X(d-1,t)+b2X(d+1,t)+b3K(d-1)+b4K(d+1) (1.4)
其中为b1、b2、b3、b4为权重,取0.25,K(d)为日期d的平均负荷值,n为[0,24]的正整数,本实施例n取24;对电力负荷数据集中相邻两天同一时刻的数据按照式1.2计算θ1(t),得到θ1(t)取值范围,θ1(t)大于1时则表示负荷数据较上一天同一时刻增长或减少逾1倍,根据θ1(t)的取值分布和电力负荷数据特征,确定ρ1的值;
水平处理方法:根据相邻两个时刻的负荷值进行误差判定,若相差超过一定阈值,则判定为误差数据,根据负荷曲线的连续性,将其替换为相邻数据的平均值,具体计算过程如下:
若d日期t时刻的电力负荷数据值与相邻负荷值计算绝对误差:
判断绝对误差是否在阈值范围内:
若式1.7中任意一个判断成立,则该点为异常点,需要按照式1.8进行水平平滑处理;若式1.7中皆不成立,则为正常数据;
其中,X(d,t)表示d日期t时刻的电力负荷数据值,θ2(t)、θ3(t)为当前时刻分别与前、后时刻的误差变化率,ρ2为阈值;根据式1.6对原始电力负荷数据进行前后时刻误差变化率计算,根据θ2(t)、θ3(t)的取值范围和分布情况,得到阈值ρ2;
经过对原始数据进行缺失和异常数据处理之后,能够替换掉由于人工计算失误、设备故障或线路检修等原因造成的“毛刺”数据,得到更为科学的历史数据样本。利用上述方法对原始电力负荷数据集进行处理后,异常和缺失数据经过处理后已基本符合电力负荷数据曲线的特性。
步骤S33、数据标准化:对完成缺失、异常处理后的数据集进行z-score标准化处理;
步骤S33具体为:其中,x表示原始数据值,x′i表示归一化后数据值,表示原始样本的均值,δ表示原始样本的标准差。
利用原始数据的均值和标准差进行数据标准化,需要首先计算样本的均值和标准差,具体计算方法如下:
步骤S4、划分数据集为训练集和验证集。
数据集分割是将实验所用的处理后的重庆电网敖山变电站1#主变压器的电力负荷数据集,取连续40天的每日电力负荷峰值数据构成实验样本。利用2014年11月27日-2017年12月31日3年多的负荷日峰值数据进行预测未来一周内的每日电力负荷峰值。训练集以40天为滑动窗口在日峰值负荷数据集上随机连续提取,验证集为训练集后7天的负荷峰值,预测集同样为训练集后7天峰值数据,例如:训练集取2016年4月1日至5月10日的峰值数据,则应预测5月11日至18日的峰值数据,验证集也应取5月11日至18日的日峰值数据。
步骤S5、优化RBF神经网络电力负荷日峰值预测模型:基于GA算法对RBF神经网络进行参数优化,得到优化RBF神经网络模型电力负荷日峰值预测模型;待优化参数包括:中心向量、中心点宽度和权重;
参数优化流程如下:
S51:将RBF神经网络中的待优化参数进行初始化,采用实数方式对其编码,使其变为长度为10的染色体序列;
S52:确定遗传算法中个体的适应度函数,利用预测与验证数据之间的均方根误差作为个体的适应度值,适应度函数的计算方式如下:
其中,N为预测数据集大小,x′i为预测数据,yi为验证数据;
S53:初始化遗传算法中的概率pc、概率pm,种群数量,确定自适应度值函数;
S54:以概率pc对当前种群中的染色体进行交换产生子代染色体,未进行交换的染色体直接进行复制;
S55:以概率pm根据当代染色体突变为子代染色体,并将新的个体插入种群中;
S56:计算个体的适应度值,若达到跳出条件则进行下一步,否则跳转到S55;
S57:输出遗传算法中的最优解,将其解码,将所得值作为RBF网络的参数。
其中,遗传算法的具体迭代步骤如下:
(1)将特征进行编码,一组特征对应一个染色体,染色体即为对应的解;
(2)初始化染色体,设置染色体数量;
(3)计算个体的适应度值;
(4)交换:由交换概率pc选择两个染色体作为父代进行交换,交换的部分为两者相异的部分,产生子代染色体;
(5)选择:根据适应度值,从当前种群中选择优良个体进行下一代繁殖,使得最优的前几个解均被保留在种群中;
(6)变异:以较小的概率pm随机改变染色体中的某个值,模仿自然界中新个体的产生;
(7)判断是否达到最大迭代次数或最小适应度值;若是,继续下一步;否则跳转到(3);
(8)终止迭代,将染色体解码,得到最优解。
RBF神经网络结构:
RBF神经网络结构由输入层、隐含层、输出层构成,其中隐含层仅有一层,其隐含层节点采用径向基函数作为激活函数;RBF神经网络中,输入层节点仅负责信息传输;输入层到隐含层之间通过非线性变化实现数据从低维到高维的映射,隐含层利用径向基函数构成高维的映射空间,确定了径向基函数的中心点即可确定映射关系;隐含层到输出层之间使用线性映射,即根据隐含层节点输出进行权重加权得到输出层节点输出;
径向基函数为高斯函数,计算公式如1.13式所示:
其中,x表示n维输入向量,ci为第i个函数的中心,维度同n,σi为第i个中心点的宽度,||·||表示欧式范数。
设隐含层节点个数为I,输出层第k个节点的输出为Ok,则其计算公式如下:
其中,ωik为隐含层到输出层的映射权重。
RBF神经网络学习方式:
RBF神经网络在构建训练模型时需要确定3个参数:中心向量ci、中心点宽度σi和权重ωik。这三个参数的选择对RBF神经网络的训练能力有至关重要的影响作用。中心向量ci会影响网络的大小,中心点宽度σi影响映射的范围,原则上需覆盖整个样本的训练空间,权重ωik则直接影响输出误差。
常见的中心向量的选取方法有:随机选取、K-means聚类算法、有监督的选取和正交最小二乘法4种。随机选取法顾名思义就是随机选取输入向量作为中心点,最为简单但无法避免将噪声数作为中心点的可能。K-means聚类算法通过在原始分类中不断加入新样本并更新样本均值作为中心点,该方法能够考虑样本的全部特征,但容易在分类过程中陷入局部最优。有监督的方法是在训练过程中通过计算偏置和修正学习不断更新参数,使输出值与期望值之间的误差最小化,整体推导过程与BP神经网络推导过程相同,可以看做是一种特殊的BP神经网络。有监督的方法不仅可以确定RBF网络的中心向量,还能确定中心点宽度和权重,在日常使用中应用较多,但这种方法学习复杂,计算耗时,学习速度较低。正交最小二乘法(OLS)是最为常用的RBF网络中心向量选取法,也是本发明所用方法。
OLS方法通过计算隐含层节点的回归算子,分析回归算子对误差的影响,使输出值尽可能接近期望值。具体计算过程如下:
假设xn为n维输入向量,Yn为n维期望向量,隐含层节点数为I,Yn可以表示为:
其中,径向基函数Ri称为回归算子,en为期望值与输出值之间的误差。
用矩阵表示式1.15:
Y=RW+e (1.16)
又有,R=PA,将R进行正交三角分解为矩阵P和A,P为n×m阶矩阵,A为m阶上三角矩阵,式1.16可以写为:
Y=RW+e=PAW+e (1.17)其中,令g=AW,则有g的最小二乘解:
使用施密特正交化法减少中心与样本的距离对误差e的影响,则有精度εi:
设δ为设定的误差阈值,当时,迭代结束,当前网络中心向量ci和权重ωik确定。否则重新选取中心向量进行计算。
步骤S6、利用训练集作为输入,至优化RBF神经网络模型电力负荷日峰值预测模型,模型预测输出为7天的电力负荷峰值;再根据模型输出的7天电力负荷峰值与验证集做比较,结合平均绝对误差MAE和均方根误差RMSE两个指标,计算得到模型的预测准确度。
本具体实施例中,实验模型基于Matlab R2019a搭建,根据本发明图1所示的预测模型框架,实验前设置GA-RBF模型中的染色体数量为30、交换概率pc为0.6、变异概率pm为0.001和最大迭代次数10000。
以预测2017年9月12日至9月18日7日的电力负荷日峰值为例,将其每日预测结果记录于表1,并绘制两种模型的预测结果误差率曲线对比图如图4所示。
表1优化前后RBF模型的电力负荷日峰值预测数据
误差率为真实值与测量值之间的绝对差除真实值得到的比。通过表1和图4可以看出,RBF模型本身具有非常优秀的函数逼近能力。使用优化后的GA-RBF模型进行电力负荷日峰值预测,其预测数据集基本能够与期望数据集吻合,模型的预测能力优秀,预测误差小。证明了使用GA遗传算法对RBF神经网络进行优化具有可行性,能够在一定程度上提升模型预测的准确度。
采用上述同样的实验数据,利用BP网络对比优化后的GA-RBF模型,由于输入输出均为1维的电力负荷峰值数据,所以设BP模型输入输出层节点均为1,隐含层1层,隐含层节点数设为3,初始化权重为[0,1]之间的随机数。得到预测数据如表2所示,预测误差率如图5所示:
表2 GA-RBF对比BP模型的电力负荷日峰值预测数据
对BP和GA-RBF模型进行误差分析,计算两种模型的评价指标如表3所示。
表3 BP和GA-RBF模型预测误差对比
根据表2和表3,可以看出,BP模型进行电力负荷日峰值预测准确度不错,与验证集的误差不大。但经过误差分析可以看出,GA-RBF的MSE指标更小,表明相比于BP模型的预测结果误差更小;R2指标更接近1,表明其与验证集曲线更加拟合,即更接近验证集。综上,GA-RBF模型的预测准确度高于BP模型。
为了证明实验具有良好的泛化性,随机抽取10组数据,对比优化前的RBF模型和优化后的GA-RBF模型进行时间跨度为一周的电力负荷日峰值预测,得到两种模型的误差对比数据如表4所示。
表4.4 BRF和GA-RBF两种模型预测一周的电力负荷日峰值预测误差数据Table4.4Forecast error data of daily peak load of one week by BRF and GA-RBFmodels
由表4可知,基于RBF模型的预测结果其与验证集数据计算MSE,值基本在0.3至0.6之间,决定系数R2基本稳定于0.8至0.9的范围内;优化后的GA-RBF模型其预测结果表明,MSE明显降低在0.1左右,决定系数R2基本在0.9以上。可以看出,基于RBF网络的日峰值电力负荷预测的实验准确度不错,但优化后的GA-RBF模型在MSE和决定系数R2两个评价指标上的表现均优于前者。实验结果说明,参数优化后的GA-RBF模型在短期电力日峰值预测上的预测准确度相比于优化前的RBF模型更精确。且模型降低了人为因素对模型预测结果的干扰程度,使得模型更具有泛化型。
以上实验结果表明,将RBF神经网络作为短期电力负荷日峰值的预测模型,其本身的学习能力就能取得不错的预测结果,但优化后的GA-RBF模型其预测结果更准确,实验过程更加自动化,更符合短期电力负荷预测的发展趋势。
一种基于优化RBF的7日电力负荷峰值预测装置,其特征在于,包括如下模块:
数据获取模块、获取历史电力负荷数据集;
数据分析模块:获取的电力负荷数据间具有很强的时间相关性,呈现出平稳的周期性变化,通过绘制电力负荷曲线图,得到电力负荷数据的一些普适特性,包括波动性,连续性,周期性,掌握电力负荷的周周期性和日周期性规律,为短期电力负荷预测的研究提供更准确的数据支撑;
数据预处理模块:
补齐缺失数据:负荷值应该为正整数,若为负数或“0”,则视为数据丢失,利用前一天当前时刻的负荷值与当天前一时刻的负荷值组合的方式处理缺失数据,具体公式如下:
X(d,t)=aX(d-1,t)+a′X(d,t-1) (1.1)
其中,X(d,t)表示d日期t时刻的电力负荷数据值,a、a′分别表示对应的数据的权重;
处理异常数据:利用电力负荷数据的周期性特性进行垂直和水平两个方面上的异常数据的排查与修正,其中,
垂直处理方法:利用负荷数据与前一天同一时刻的历史数据有较强的关联性,根据当前数据与前一天同一时刻的历史数据进行误差计算,若超过阈值,则根据当天负荷平均值与前一天当前历史数据值按比例计算后进行替换;具体计算过程如下:
首先判断当前数据是否是异常数据,计算:
|(X(d,t)-X(d-1,t))/X(d,t)|=θ1(t) (1.2)
θ1(t)>ρ1 (1.3)
其中X(d,t)表示d日期t时刻的电力负荷数据值,θ1(t)为数据间的绝对变化率,ρ1为阈值,若θ1(t)超过阈值ρ1,表示当前为异常数据;否则表示为正常数据;对异常数进行垂直处理按照式1.4和式1.5进行:
X(d,t)=b1X(d-1,t)+b2X(d+1,t)+b3K(d-1)+b4K(d+1) (1.4)
其中为b1、b2、b3、b4为权重,K(d)为日期d的平均负荷值,n为[0,24]的正整数;对电力负荷数据集中相邻两天同一时刻的数据按照式1.2计算θ1(t),得到θ1(t)取值范围,θ1(t)大于1时则表示负荷数据较上一天同一时刻增长或减少逾1倍,根据θ1(t)的取值分布和电力负荷数据特征,确定ρ1的值;
水平处理方法:根据相邻两个时刻的负荷值进行误差判定,若相差超过一定阈值,则判定为误差数据,根据负荷曲线的连续性,将其替换为相邻数据的平均值,具体计算过程如下:
若d日期t时刻的电力负荷数据值与相邻负荷值计算绝对误差:
判断绝对误差是否在阈值范围内:
若式1.7中任意一个判断成立,则该点为异常点,需要按照式1.8进行水平平滑处理;若式1.7中皆不成立,则为正常数据;
其中,X(d,t)表示d日期t时刻的电力负荷数据值,θ2(t)、θ3(t)为当前时刻分别与前、后时刻的误差变化率,ρ2为阈值;根据式1.6对原始电力负荷数据进行前后时刻误差变化率计算,根据θ2(t)、θ3(t)的取值范围和分布情况,得到阈值ρ2;
数据标准化:对完成缺失、异常处理后的数据集进行z-score标准化处理;
数据划分模块、划分数据集为训练集和验证集;
预测模型构建模块、优化RBF神经网络电力负荷日峰值预测模型:基于GA算法对RBF神经网络进行参数优化,得到优化RBF神经网络模型电力负荷日峰值预测模型;待优化参数包括:中心向量、中心点宽度和权重;
参数优化流程如下:
将RBF神经网络中的待优化参数进行初始化,采用实数方式对其编码,使其变为长度为10的染色体序列;
确定遗传算法中个体的适应度函数,利用预测与验证数据之间的均方根误差作为个体的适应度值,适应度函数的计算方式如下:
其中,N为预测数据集大小,x′i为预测数据,yi为验证数据;
初始化遗传算法中的概率pc、概率pm,种群数量,确定自适应度值函数;
以概率pc对当前种群中的染色体进行交换产生子代染色体,未进行交换的染色体直接进行复制;
以概率pm根据当代染色体突变为子代染色体,并将新的个体插入种群中;
计算个体的适应度值,若达到跳出条件则进行下一步,否则跳转到S55;
输出遗传算法中的最优解,将其解码,将所得值作为RBF网络的参数;
利用训练集作为输入,至优化RBF神经网络模型电力负荷日峰值预测模型,模型预测输出为7天的电力负荷峰值;再根据模型输出的7天电力负荷峰值与验证集做比较,结合平均绝对误差MAE和均方根误差RMSE两个指标,计算得到模型的预测准确度。
上述基于优化RBF的7日电力负荷峰值预测装置可以实现为一种计算机程序的形式,该计算机程序可以在计算机设备上运行。
该计算机设备可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
该非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行一种基于优化RBF的7日电力负荷峰值预测方法。
该处理器用于提供计算和控制能力,以支撑整个计算机设备的运行。
该内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行一种基于优化RBF的7日电力负荷峰值预测方法。
该网络接口用于与其它设备进行网络通信。本领域技术人员可以理解,上述计算机设备结构仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括其他部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器用于运行存储在存储器中的计算机程序,该程序实现实施例一所述的一种基于优化RBF的7日电力负荷峰值预测。
应当理解,在本申请实施例中,处理器可以是中央处理单元(Central ProcessingUnit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行实施例一所述的一种基于优化RBF的7日电力负荷峰值预测方法。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (5)
1.一种基于优化RBF的7日电力负荷峰值预测方法,其特征在于,包括如下步骤:
步骤S1、获取历史电力负荷数据集;
步骤S2、数据分析;
步骤S3、数据预处理;
步骤S4、划分数据集为训练集和验证集;
步骤S5、优化RBF神经网络电力负荷日峰值预测模型:基于GA算法对RBF神经网络进行参数优化,得到优化RBF神经网络模型电力负荷日峰值预测模型;待优化参数包括:中心向量、中心点宽度和权重;
参数优化流程如下:
S51:将RBF神经网络中的待优化参数进行初始化,采用实数方式对其编码,使其变为长度为10的染色体序列;
S52:确定遗传算法中个体的适应度函数,利用预测与验证数据之间的均方根误差作为个体的适应度值,适应度函数的计算方式如下:
其中,N为预测数据集大小,xi′为预测数据,yi为验证数据;
S53:初始化遗传算法中的概率pc、概率pm,种群数量,确定自适应度值函数;
S54:以概率pc对当前种群中的染色体进行交换产生子代染色体,未进行交换的染色体直接进行复制;
S55:以概率pm根据当代染色体突变为子代染色体,并将新的个体插入种群中;
S56:计算个体的适应度值,若达到跳出条件则进行下一步,否则跳转到S55;
S57:输出遗传算法中的最优解,将其解码,将所得值作为RBF网络的参数;
其中,遗传算法的具体迭代步骤如下:
(1)将特征进行编码,一组特征对应一个染色体,染色体即为对应的解;
(2)初始化染色体,设置染色体数量;
(3)计算个体的适应度值;
(4)交换:由交换概率pc选择两个染色体作为父代进行交换,交换的部分为两者相异的部分,产生子代染色体;
(5)选择:根据适应度值,从当前种群中选择优良个体进行下一代繁殖,使得最优的前几个解均被保留在种群中;
(6)变异:以较小的概率pm随机改变染色体中的某个值,模仿自然界中新个体的产生;
(7)判断是否达到最大迭代次数或最小适应度值;若是,继续下一步;否则跳转到(3);
(8)终止迭代,将染色体解码,得到最优解;
其中,RBF神经网络结构由输入层、隐含层、输出层构成,其中隐含层仅有一层,其隐含层节点采用径向基函数作为激活函数;RBF神经网络中,输入层节点仅负责信息传输;输入层到隐含层之间通过非线性变化实现数据从低维到高维的映射,隐含层利用径向基函数构成高维的映射空间,确定了径向基函数的中心点即可确定映射关系;隐含层到输出层之间使用线性映射,即根据隐含层节点输出进行权重加权得到输出层节点输出;
径向基函数为高斯函数,计算公式如下:
其中,x表示n维输入向量,ci为第i个函数的中心,维度同n,σi为第i个中心点的宽度,||·||表示欧式范数;
设隐含层节点个数为I,输出层第k个节点的输出为Ok,则其计算公式如下:
其中,ωik为隐含层到输出层的映射权重;
步骤S6、利用训练集作为输入,至优化RBF神经网络模型电力负荷日峰值预测模型,模型预测输出为7天的电力负荷峰值;再根据模型输出的7天电力负荷峰值与验证集做比较,结合平均绝对误差MAE和均方根误差RMSE两个指标,计算得到模型的预测准确度。
2.根据权利要求1所述的基于优化RBF的7日电力负荷峰值预测方法,其特征在于,数据分析包括:获取的电力负荷数据间具有很强的时间相关性,呈现出平稳的周期性变化,通过绘制电力负荷曲线图,得到电力负荷数据的一些普适特性,包括波动性,连续性,周期性,掌握电力负荷的周周期性和日周期性规律,为短期电力负荷预测的研究提供更准确的数据支撑。
3.根据权利要求1所述的基于优化RBF的7日电力负荷峰值预测方法,其特征在于,步骤S3、数据预处理包括:
步骤S31、补齐缺失数据:负荷值应该为正整数,若为负数或“0”,则视为数据丢失,利用前一天当前时刻的负荷值与当天前一时刻的负荷值组合的方式处理缺失数据,具体公式如下:
X(d,t)=aX(d-1,t)+a′X(d,t-1)(1.1)
其中,X(d,t)表示d日期t时刻的电力负荷数据值,a、a′分别表示对应的数据的权重;
步骤S32、处理异常数据:利用电力负荷数据的周期性特性进行垂直和水平两个方面上的异常数据的排查与修正,其中,
垂直处理方法:利用负荷数据与前一天同一时刻的历史数据有较强的关联性,根据当前数据与前一天同一时刻的历史数据进行误差计算,若超过阈值,则根据当天负荷平均值与前一天当前历史数据值按比例计算后进行替换;具体计算过程如下:
首先判断当前数据是否是异常数据,计算:
|(X(d,t)-X(d-1,t))/X(d,t)|=θ1(t)(1.2)
θ1(t)>ρ1(1.3)
其中X(d,t)表示d日期t时刻的电力负荷数据值,θ1(t)为数据间的绝对变化率,ρ1为阈值,若θ1(t)超过阈值ρ1,表示当前为异常数据;否则表示为正常数据;对异常数进行垂直处理按照式1.4和式1.5进行:
X(d,t)=b1X(d-1,t)+b2X(d+1,t)+b3K(d-1)+b4K(d+1)(1.4)
其中,b1、b2、b3、b4为权重,K(d)为日期d的平均负荷值,n为[0,24]的正整数;对电力负荷数据集中相邻两天同一时刻的数据按照式1.2计算θ1(t),得到θ1(t)取值范围,θ1(t)大于1时则表示负荷数据较上一天同一时刻增长或减少逾1倍,根据θ1(t)的取值分布和电力负荷数据特征,确定ρ1的值;
水平处理方法:根据相邻两个时刻的负荷值进行误差判定,若相差超过一定阈值,则判定为误差数据,根据负荷曲线的连续性,将其替换为相邻数据的平均值,具体计算过程如下:
若d日期t时刻的电力负荷数据值与相邻负荷值计算绝对误差:
判断绝对误差是否在阈值范围内:
若式1.7中任意一个判断成立,则该点为异常点,需要按照式1.8进行水平平滑处理;若式1.7中皆不成立,则为正常数据;
其中,X(d,t)表示d日期t时刻的电力负荷数据值,θ2(t)、θ3(t)为当前时刻分别与前、后时刻的误差变化率,ρ2为阈值;根据式1.6对原始电力负荷数据进行前后时刻误差变化率计算,根据θ2(t)、θ3(t)的取值范围和分布情况,得到阈值ρ2;
步骤S33、数据标准化:对完成缺失、异常处理后的数据集进行z-score标准化处理。
4.根据权利要求3所述的基于优化RBF的7日电力负荷峰值预测方法,其特征在于,步骤S33具体为:利用原始数据的均值和标准差进行数据标准化,需要首先计算样本的均值和标准差,具体计算方法如下:
其中,x表示原始数据值,xi′表示归一化后数据值,表示原始样本的均值,δ表示原始样本的标准差。
5.一种基于优化RBF的7日电力负荷峰值预测装置,所述装置执行如权利要求1-4任一项所述的基于优化RBF的7日电力负荷峰值预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110073909.XA CN112734128B (zh) | 2021-01-19 | 2021-01-19 | 一种基于优化rbf的7日电力负荷峰值预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110073909.XA CN112734128B (zh) | 2021-01-19 | 2021-01-19 | 一种基于优化rbf的7日电力负荷峰值预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112734128A CN112734128A (zh) | 2021-04-30 |
CN112734128B true CN112734128B (zh) | 2023-08-29 |
Family
ID=75592743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110073909.XA Active CN112734128B (zh) | 2021-01-19 | 2021-01-19 | 一种基于优化rbf的7日电力负荷峰值预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112734128B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111056B (zh) * | 2021-05-08 | 2021-10-22 | 中国水利水电科学研究院 | 一种城市洪涝积水监测数据清洗方法 |
CN113673864B (zh) * | 2021-08-19 | 2024-08-13 | 中国石油化工股份有限公司 | 一种能源自动分输方法 |
CN114048923B (zh) * | 2021-11-29 | 2024-07-05 | 国网北京市电力公司 | 负荷曲线的生成方法、装置、存储介质及电子设备 |
CN114178326B (zh) * | 2021-12-02 | 2024-09-03 | 北京首钢自动化信息技术有限公司 | 一种检测设备的控制方法、装置及计算机设备 |
CN114971090A (zh) * | 2022-07-27 | 2022-08-30 | 中国电力科学研究院有限公司 | 一种电供暖负荷预测方法、系统、设备和介质 |
CN116431355B (zh) * | 2023-06-13 | 2023-08-22 | 方心科技股份有限公司 | 一种基于电力领域超算平台的计算负载预测方法及系统 |
CN116960989B (zh) * | 2023-09-20 | 2023-12-01 | 云南电投绿能科技有限公司 | 一种发电站的电力负荷预测方法、装置、设备及存储介质 |
CN117405975B (zh) * | 2023-12-14 | 2024-03-22 | 深圳鹏城新能科技有限公司 | 一种pv面板绝缘电阻检测方法、系统及介质 |
CN117575369B (zh) * | 2024-01-16 | 2024-03-29 | 山东建筑大学 | 一种乡村建筑群能耗预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105913175A (zh) * | 2016-04-07 | 2016-08-31 | 哈尔滨理工大学 | 基于改进神经网络算法的智能电网短期负荷预测方法 |
CN107730041A (zh) * | 2017-10-12 | 2018-02-23 | 东华大学 | 基于改进的遗传小波神经网络的短期电力负荷预测方法 |
CN108876054A (zh) * | 2018-07-06 | 2018-11-23 | 国网河南省电力公司郑州供电公司 | 基于改进遗传算法优化极限学习机的短期电力负荷预测方法 |
WO2019162859A1 (en) * | 2018-02-21 | 2019-08-29 | Telefonaktiebolaget Lm Ericsson (Publ) | Workload modeling for cloud systems |
CN111783953A (zh) * | 2020-06-30 | 2020-10-16 | 重庆大学 | 一种基于优化lstm网络的24点电力负荷值7日预测方法 |
-
2021
- 2021-01-19 CN CN202110073909.XA patent/CN112734128B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105913175A (zh) * | 2016-04-07 | 2016-08-31 | 哈尔滨理工大学 | 基于改进神经网络算法的智能电网短期负荷预测方法 |
CN107730041A (zh) * | 2017-10-12 | 2018-02-23 | 东华大学 | 基于改进的遗传小波神经网络的短期电力负荷预测方法 |
WO2019162859A1 (en) * | 2018-02-21 | 2019-08-29 | Telefonaktiebolaget Lm Ericsson (Publ) | Workload modeling for cloud systems |
CN108876054A (zh) * | 2018-07-06 | 2018-11-23 | 国网河南省电力公司郑州供电公司 | 基于改进遗传算法优化极限学习机的短期电力负荷预测方法 |
CN111783953A (zh) * | 2020-06-30 | 2020-10-16 | 重庆大学 | 一种基于优化lstm网络的24点电力负荷值7日预测方法 |
Non-Patent Citations (1)
Title |
---|
基于GA-RBF神经网络的电力系统短期负荷预测;李婧等;《上海电力学院学报》;第35卷(第3期);第205-210页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112734128A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112734128B (zh) | 一种基于优化rbf的7日电力负荷峰值预测方法 | |
CN111783953B (zh) | 一种基于优化lstm网络的24点电力负荷值7日预测方法 | |
CN112488395B (zh) | 一种配电网线损预测方法及系统 | |
CN112508275A (zh) | 一种基于聚类和趋势指标的配电网线路负荷预测方法和设备 | |
CN114548509B (zh) | 一种多能源系统多类型负荷联合预测方法及系统 | |
CN116031888B (zh) | 基于动态负荷预测的潮流优化方法、系统及存储介质 | |
CN114154716B (zh) | 一种基于图神经网络的企业能耗预测方法及装置 | |
CN114330934A (zh) | 一种模型参数自适应的gru新能源短期发电功率预测方法 | |
CN117674119A (zh) | 电网运行风险评估方法、装置、计算机设备和存储介质 | |
CN118017502A (zh) | 基于数字孪生的配电算力预测方法、系统及介质 | |
Zhu et al. | Research on PSO‐ARMA‐SVR Short‐Term Electricity Consumption Forecast Based on the Particle Swarm Algorithm | |
CN116702992A (zh) | 一种发电功率预测方法、装置、电子设备及存储介质 | |
CN115204698A (zh) | 一种低压台区供电稳定性的实时分析方法 | |
CN110516792A (zh) | 基于小波分解和浅层神经网络的非平稳时间序列预测方法 | |
Gao et al. | Establishment of Economic Forecasting Model of High‐tech Industry Based on Genetic Optimization Neural Network | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN118194147A (zh) | 一种基于数据融合的多业务数据监测方法 | |
Zhu et al. | End-to-end topology-aware machine learning for power system reliability assessment | |
CN111160715A (zh) | 基于bp神经网络新旧动能转换绩效评价方法和装置 | |
KR102664053B1 (ko) | 기계학습 기반 선로부하 예측모델 해석 장치 및 방법 | |
CN117134315A (zh) | 一种基于bert算法的配电变压器负荷预测方法及装置 | |
CN112581311B (zh) | 一种多风电场聚合后出力长期波动特性预测方法及系统 | |
CN115514315A (zh) | 一种基于优化gru模型的分布式光伏电站pr预测方法 | |
CN115118015A (zh) | 一种基于融合终端的台区供电稳定性监测系统 | |
Shen et al. | An interval analysis scheme based on empirical error and MCMC to quantify uncertainty of wind speed |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |