Nothing Special   »   [go: up one dir, main page]

CN112396207A - 一种基于大数据的电力负荷预测方法 - Google Patents

一种基于大数据的电力负荷预测方法 Download PDF

Info

Publication number
CN112396207A
CN112396207A CN201910755495.1A CN201910755495A CN112396207A CN 112396207 A CN112396207 A CN 112396207A CN 201910755495 A CN201910755495 A CN 201910755495A CN 112396207 A CN112396207 A CN 112396207A
Authority
CN
China
Prior art keywords
load
data
feature
power load
day
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910755495.1A
Other languages
English (en)
Inventor
杨涛
柳伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201910755495.1A priority Critical patent/CN112396207A/zh
Publication of CN112396207A publication Critical patent/CN112396207A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的电力负荷预测方法,采集历史负荷数据以及负荷影响因素并进行预处理,所述负荷影响因素包括星期属性、节日属性和温度;根据预处理的数据集构建初始特征集,采用F‑score特征选择方法进行特征选择,所述初始特征集的特征向量包括15个特征,包括:预测日前12天的每日日均负荷数据、预测日的星期属性、预测日的节日属性、预测日的日最高温度;根据选择的特征集确定训练样本集,训练基于支持向量机回归的电力负荷预测模型;对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。本发明考虑历史负荷数据以及负荷影响因素,并从中提取最具特征的元素训练支持向量机回归模型,提高了预测的精度和速度。

Description

一种基于大数据的电力负荷预测方法
技术领域
本发明涉及负荷预测技术,具体涉及一种基于大数据的电力负荷预测方法。
背景技术
负荷预测是根据已知的用电条件,结合运行特性、增容决策、自然条件和社会影响等诸多因素,在满足一定精度要求的条件下,确定未来某特定时刻的负荷数据的方法,对电网动态状态估计、负荷调度和经济性等方面具有重要意义。由于负荷本身的不确定性和复杂性,准确的负荷特性分析和预测模型建立是提高预测精度的关键所在。支持向量机因能较好地解决小样本、非线性、高维数等难题,被广泛应用到电力负荷预测等回归问题中。然而电力负荷数据量大,含有很多的噪声,如果直接用来训练支持向量机模型,计算规模大,预测的精度也低。
发明内容
本发明的目的在于提供一种基于大数据的电力负荷预测方法。
实现本发明目的的技术解决方案为:一种基于大数据的电力负荷预测方法,包括如下步骤:
步骤1、采集历史负荷数据以及负荷影响因素并进行预处理,所述负荷影响因素包括星期属性、节日属性和温度;
步骤2、根据预处理的数据集构建初始特征集,采用F-score特征选择方法进行特征选择,所述初始特征集的特征向量包括15个特征,包括:预测日前12天的每日日均负荷数据、预测日的星期属性、预测日的节日属性、预测日的日最高温度;
步骤3、根据选择的特征集确定训练样本集,训练基于支持向量机回归的电力负荷预测模型;
步骤4、对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。
本发明与现有技术相比,其显著优点在于:考虑历史负荷数据以及负荷影响因素,并从中提取最具特征的元素训练支持向量机回归模型,提高了预测的精度和速度。
附图说明
图1为本发明基于大数据的电力负荷预测方法的流程图。
图2为本发明实施例中电力负荷预测值与实际值的对比图。
具体实施方式
下面结合附图和具体实施方式,进一步说明本发明方案。
如图1所示,基于大数据的电力负荷预测方法,包括以下步骤:
步骤1、历史数据采集和预处理
采集历史负荷数据以及负荷影响因素。负荷影响因素包括星期属性、节日属性和温度。获取历史数据后,对历史数据进行预处理。在预处理过程中,进行异常负荷数据处理、负荷数据归一化处理、负荷影响因素量化处理。
步骤1.1:异常负荷处理
将负荷数据中波动较大的负荷值及个别缺失的负荷值视为异常数据。负荷具有横向连续性,即前后两个时刻的负荷值不会出现跳跃。利用负荷的横向连续性来识别波动较大的负荷值,当待识别的负荷数据超出前后两个时刻的负荷数据20%,将该数据剔除。对于剔除值和缺失值,取前后两时刻负荷的平均值替代。
步骤1.2:负荷数据归一化处理
对异常负荷处理后的数据进行归一化处理,通过线性变换将数据归一化至[0,1]中,以优化负荷预测的速度和准确率。归一化处理如式(1):
Figure BDA0002168581340000021
其中,xi'为第i个归一化的负荷数据,xi为第i个历史负荷数据,min为历史负荷数据中的最小值,max为历史负荷数据中的最大值。
步骤1.3:负荷影响因素量化处理
负荷影响因素包括星期属性、节日属性和温度。由于星期二至星期四的负荷数据有极大的相似性。因此,在对星期属性的量化处理时,将星期数据映射到[0,1]上,星期一映射为0.1,星期二至星期四均映射为0.2,星期五映射为0.3,星期六映射为0.6,星期日映射为0.8。重大节假日包括元旦、五一、国庆、春节。在对于节日属性的量化处理时,将重大节假日映射为1.0,非重大节假日映射为0.0。对温度的量化处理,采取和负荷数据同样的归一化处理方式。
步骤2、特征选择
特征选择是从初始特征集中选取可以代表初始特征集全部或大部分信息的最优特征子集,消除冗余特征从而改善预测模型的精度和泛化能力。针对短期负荷预测,特征选择即为从海量数据中提取出最具特征的因素用到负荷预测需求中。本发明采用F-score特征选择方法减少输入特征维数,加快挖掘过程。
根据步骤1得到的数据集构建初始特征集,初始特征集中每日的特征向量包括15个特征,依次为:预测日前12天的每日日均负荷数据;预测日的星期属性,对应于星期一至星期日;预测日的节日属性,对应于重大节假日和非重大节假日;预测日的日最高温度。对构建出的初始特征集使用F-score算法进行计算,计算各个特征的F值,舍弃F值小于设定阈值的特征,以此去除辨别力影响不大的冗余特征。
步骤3、建立支持向量机回归的电力负荷预测模型
将SVM由分类问题推广至回归问题可以得到支持向量回归(SupportVectorRegression,SVR),通过寻求最优超平面,使所有样本点离超平面的“总偏差”最小。该方法可应用于电力负荷回归预测。
根据步骤2确定的特征集,得到训练样本集{(x1,y1),(x2,y2),…,(xn,yn)},其中输入向量xi为第i个样本的特征数据,xi∈X,X为输入空间;yi为第i个样本的目标输出负荷值,yi∈Y,Y为输出空间;i=1,2,…,n,n为样本个数。训练样本集输入向量与输出值之间为非线性关系,因此,SVM不是直接寻找输入输出关系,而是通过非线性映射
Figure BDA0002168581340000032
将输入空间映射到高维特征空间中,然后在此高维空间中作负荷预测线性回归,具体为:
输入向量与输出值输出非线性拟合函数如式(2):
f(x)=wφ(x)+b 式(2)
其中,w为权重值,b为偏置。
非线性映射以内积
Figure BDA0002168581340000033
的形式出现,通过核函数来替换先行空间中的内积,记
Figure BDA0002168581340000034
K(x,x′)表示支持向量机采用的核函数。本发明选取核函数为径向基(RBF)核函数,具体形式如式(3):
Figure BDA0002168581340000031
其中,σ为核宽度系数。
SVM用于回归问题时,所寻求的最优超平面使所有样本点离超平面的“总偏差”最小。此时,负荷回归预测问题转化为约束优化问题,优化目标如式(4):
Figure BDA0002168581340000041
式中引入松弛因子ξi和ξi *以度量训练样本的偏离程度系数ε,构造容错惩罚系数C以控制超出误差的样本惩罚程度,式(4)的约束条件为式(5):
Figure BDA0002168581340000042
采用libsvm中的gridregression.py寻找惩罚系数C、偏离程度系数ε、核宽度系数σ最优参数,确定模型参数。
引进拉格朗日函数,利用libsvm中的svm-train实现对训练样本集的训练,得到偏置b和拉格朗日因子αi、αi *,训练好的电力负荷预测模型如式(6):
Figure BDA0002168581340000043
步骤4、进行电力负荷预测
对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。将测试数据集输入libsvm中的svm-predict进行计算,输出预测负荷值。
实施例
为了验证本发明方案的有效性,进行如下仿真实验。
1)历史数据预处理
取用江苏某市2018年全年的用电数据,一天24小时,每15分钟采样一次,每天96个采样点,计算每日的负荷平均值。在预处理过程中,进行异常负荷数据处理、负荷数据归一化处理、负荷影响因素量化处理。总数据为两部分,一部分是用来训练模型的训练数据集,另一部分是用来评估训练后的模型的测试数据集。
2)特征选择
经由计算,预测日前12天的每日日均负荷和预测日的最高温度特征向量得分大。去除特征向量得分较小的星期属性和节日属性,以13个特征向量替代原有的15个输入变量构成新的特征集。
3)建立支持向量机回归的电力负荷预测模型
选用RBF核函数,基于支持向量机(SVM)实现的开源库libsvm,建立支持向量机回归的电力负荷预测模型。
4)进行电力负荷预测
对该市2018年三月中两周的每日平均负荷进行预测,将输出的预测负荷结果值与真实值均还原为归一化前的值,绘出电力负荷预测值与真实值的对比曲线,如图2所示。由曲线明显可以看出基于以上步骤的SVM负荷预测方法有较高的精度,预测效果好。

Claims (4)

1.一种基于大数据的电力负荷预测方法,其特征在于,包括如下步骤:
步骤1、采集历史负荷数据以及负荷影响因素并进行预处理,所述负荷影响因素包括星期属性、节日属性和温度;
步骤2、根据预处理的数据集构建初始特征集,采用F-score特征选择方法进行特征选择,所述初始特征集的特征向量包括15个特征,包括:预测日前12天的每日日均负荷数据、预测日的星期属性、预测日的节日属性、预测日的日最高温度;
步骤3、根据选择的特征集确定训练样本集,训练基于支持向量机回归的电力负荷预测模型;
步骤4、对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。
2.根据权利要求1所述的基于大数据的电力负荷预测方法,其特征在于,步骤1中,预处理包括:异常负荷数据处理、负荷数据归一化处理、负荷影响因素量化处理,具体方法为:
步骤1.1:异常负荷处理
将负荷数据中波动较大的负荷值及个别缺失的负荷值视为异常数据;利用负荷的横向连续性来识别波动较大的负荷值,当待识别的负荷数据超出前后两个时刻的负荷数据20%,将该数据剔除;对于剔除值和缺失值,取前后两时刻负荷的平均值替代;
步骤1.2:负荷数据归一化处理
对异常负荷处理后的数据进行归一化处理,通过线性变换将数据归一化至[0,1]中,归一化处理如式(1):
Figure FDA0002168581330000011
其中,xi'为第i个归一化的负荷数据,xi为第i个历史负荷数据,min为历史负荷数据中的最小值,max为历史负荷数据中的最大值;
步骤1.3:负荷影响因素量化处理
由于星期二至星期四的负荷数据有极大的相似性,在对星期属性的量化处理时,将星期数据映射到[0,1]上,星期一映射为0.1,星期二至星期四均映射为0.2,星期五映射为0.3,星期六映射为0.6,星期日映射为0.8;
重大节假日包括元旦、五一、国庆、春节,在对于节日属性的量化处理时,将重大节假日映射为1.0,非重大节假日映射为0.0;
对温度的量化处理,采取和负荷数据同样的归一化处理方式。
3.根据权利要求1所述的基于大数据的电力负荷预测方法,其特征在于,步骤2中,进行特征选择时,对构建出的初始特征集使用F-score算法进行计算,计算各个特征的F值,并舍弃F值小于设定阈值的特征。
4.根据权利要求1所述的基于大数据的电力负荷预测方法,其特征在于,步骤3中,选用RBF核函数,建立支持向量机回归的电力负荷预测模型。
CN201910755495.1A 2019-08-15 2019-08-15 一种基于大数据的电力负荷预测方法 Pending CN112396207A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910755495.1A CN112396207A (zh) 2019-08-15 2019-08-15 一种基于大数据的电力负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910755495.1A CN112396207A (zh) 2019-08-15 2019-08-15 一种基于大数据的电力负荷预测方法

Publications (1)

Publication Number Publication Date
CN112396207A true CN112396207A (zh) 2021-02-23

Family

ID=74601889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910755495.1A Pending CN112396207A (zh) 2019-08-15 2019-08-15 一种基于大数据的电力负荷预测方法

Country Status (1)

Country Link
CN (1) CN112396207A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011680A (zh) * 2021-04-16 2021-06-22 西安建筑科技大学 一种电力负荷预测方法及系统
CN113435663A (zh) * 2021-07-15 2021-09-24 国网冀北电力有限公司唐山供电公司 一种考虑电动汽车充电负荷影响的cnn-lstm联合负荷预测方法
CN114742263A (zh) * 2022-03-02 2022-07-12 北京百度网讯科技有限公司 负荷预测方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013005465A (ja) * 2011-06-10 2013-01-07 Azbil Corp 負荷量予測装置、負荷量予測方法および負荷量予測プログラム
CN106446091A (zh) * 2016-09-13 2017-02-22 北京协力筑成金融信息服务股份有限公司 一种多源时序数据的预处理方法和装置
CN108460213A (zh) * 2018-03-07 2018-08-28 燕山大学 基于多聚类原型的t-s模型对炉腹煤气量的预测方法及程序

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013005465A (ja) * 2011-06-10 2013-01-07 Azbil Corp 負荷量予測装置、負荷量予測方法および負荷量予測プログラム
CN106446091A (zh) * 2016-09-13 2017-02-22 北京协力筑成金融信息服务股份有限公司 一种多源时序数据的预处理方法和装置
CN108460213A (zh) * 2018-03-07 2018-08-28 燕山大学 基于多聚类原型的t-s模型对炉腹煤气量的预测方法及程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖蔚: "基于支持向量机的短期电力负荷预测方法研究", <中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑> *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011680A (zh) * 2021-04-16 2021-06-22 西安建筑科技大学 一种电力负荷预测方法及系统
CN113435663A (zh) * 2021-07-15 2021-09-24 国网冀北电力有限公司唐山供电公司 一种考虑电动汽车充电负荷影响的cnn-lstm联合负荷预测方法
CN114742263A (zh) * 2022-03-02 2022-07-12 北京百度网讯科技有限公司 负荷预测方法、装置、电子设备及存储介质
CN114742263B (zh) * 2022-03-02 2024-03-01 北京百度网讯科技有限公司 负荷预测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109740648B (zh) 电力负荷异常数据识别方法、装置和计算机设备
Kurniadi et al. The prediction of scholarship recipients in higher education using k-Nearest neighbor algorithm
CN112396207A (zh) 一种基于大数据的电力负荷预测方法
CN111967688A (zh) 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法
CN110212524A (zh) 一种区域电力负荷预测方法
CN116821809B (zh) 基于人工智能的生命体征数据采集系统
US20210397956A1 (en) Activity level measurement using deep learning and machine learning
CN117975204B (zh) 一种模型训练方法、缺陷检测方法以及相关装置
CN116451142A (zh) 一种基于机器学习算法的水质传感器故障检测方法
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN116959725A (zh) 一种多模态数据融合的疾病风险预测方法
Liu et al. Stock price trend prediction model based on deep residual network and stock price graph
Zheng et al. Autism classification based on logistic regression model
CN108830405B (zh) 基于多指标动态匹配的实时电力负荷预测系统及其方法
CN109800782A (zh) 一种基于模糊knn算法的电网故障检测方法及装置
CN111507528A (zh) 一种基于cnn-lstm的股票长期趋势预测方法
CN117373247B (zh) 一种新型etc卡休眠预测诊断方法、系统及可存储介质
Kirshners et al. A comparative analysis of short time series processing methods
Kumar et al. Utilizing Machine Learning Algorithms for Rainfall Analysis
Dutta et al. Early & accurate forecasting of mid term wind energy based on PCA empowered supervised regression model
CN116245212A (zh) 基于pca-lstm的电力数据异常检测与预测方法及系统
CN114168578A (zh) 一种基于聚类和近邻算法的日负荷数据缺失值插补方法
Huang Research on the Google Stock Price Prediction Based on SVR, Random Forest, and KNN Models
Govindraj et al. Comparison of Machine Learning Techniques for Prediction of Diabetes
Liu et al. Short-term Load Forecasting Approach with SVM and Similar Days Based on United Data Mining Technology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210223

RJ01 Rejection of invention patent application after publication