CN112396207A - 一种基于大数据的电力负荷预测方法 - Google Patents
一种基于大数据的电力负荷预测方法 Download PDFInfo
- Publication number
- CN112396207A CN112396207A CN201910755495.1A CN201910755495A CN112396207A CN 112396207 A CN112396207 A CN 112396207A CN 201910755495 A CN201910755495 A CN 201910755495A CN 112396207 A CN112396207 A CN 112396207A
- Authority
- CN
- China
- Prior art keywords
- load
- data
- feature
- power load
- day
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000012706 support-vector machine Methods 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 10
- 238000010187 selection method Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 19
- 238000010606 normalization Methods 0.000 claims description 11
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000011002 quantification Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000013277 forecasting method Methods 0.000 claims 3
- 238000000605 extraction Methods 0.000 claims 1
- 238000003672 processing method Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract 2
- 230000002354 daily effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010074864 Factor XI Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于大数据的电力负荷预测方法,采集历史负荷数据以及负荷影响因素并进行预处理,所述负荷影响因素包括星期属性、节日属性和温度;根据预处理的数据集构建初始特征集,采用F‑score特征选择方法进行特征选择,所述初始特征集的特征向量包括15个特征,包括:预测日前12天的每日日均负荷数据、预测日的星期属性、预测日的节日属性、预测日的日最高温度;根据选择的特征集确定训练样本集,训练基于支持向量机回归的电力负荷预测模型;对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。本发明考虑历史负荷数据以及负荷影响因素,并从中提取最具特征的元素训练支持向量机回归模型,提高了预测的精度和速度。
Description
技术领域
本发明涉及负荷预测技术,具体涉及一种基于大数据的电力负荷预测方法。
背景技术
负荷预测是根据已知的用电条件,结合运行特性、增容决策、自然条件和社会影响等诸多因素,在满足一定精度要求的条件下,确定未来某特定时刻的负荷数据的方法,对电网动态状态估计、负荷调度和经济性等方面具有重要意义。由于负荷本身的不确定性和复杂性,准确的负荷特性分析和预测模型建立是提高预测精度的关键所在。支持向量机因能较好地解决小样本、非线性、高维数等难题,被广泛应用到电力负荷预测等回归问题中。然而电力负荷数据量大,含有很多的噪声,如果直接用来训练支持向量机模型,计算规模大,预测的精度也低。
发明内容
本发明的目的在于提供一种基于大数据的电力负荷预测方法。
实现本发明目的的技术解决方案为:一种基于大数据的电力负荷预测方法,包括如下步骤:
步骤1、采集历史负荷数据以及负荷影响因素并进行预处理,所述负荷影响因素包括星期属性、节日属性和温度;
步骤2、根据预处理的数据集构建初始特征集,采用F-score特征选择方法进行特征选择,所述初始特征集的特征向量包括15个特征,包括:预测日前12天的每日日均负荷数据、预测日的星期属性、预测日的节日属性、预测日的日最高温度;
步骤3、根据选择的特征集确定训练样本集,训练基于支持向量机回归的电力负荷预测模型;
步骤4、对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。
本发明与现有技术相比,其显著优点在于:考虑历史负荷数据以及负荷影响因素,并从中提取最具特征的元素训练支持向量机回归模型,提高了预测的精度和速度。
附图说明
图1为本发明基于大数据的电力负荷预测方法的流程图。
图2为本发明实施例中电力负荷预测值与实际值的对比图。
具体实施方式
下面结合附图和具体实施方式,进一步说明本发明方案。
如图1所示,基于大数据的电力负荷预测方法,包括以下步骤:
步骤1、历史数据采集和预处理
采集历史负荷数据以及负荷影响因素。负荷影响因素包括星期属性、节日属性和温度。获取历史数据后,对历史数据进行预处理。在预处理过程中,进行异常负荷数据处理、负荷数据归一化处理、负荷影响因素量化处理。
步骤1.1:异常负荷处理
将负荷数据中波动较大的负荷值及个别缺失的负荷值视为异常数据。负荷具有横向连续性,即前后两个时刻的负荷值不会出现跳跃。利用负荷的横向连续性来识别波动较大的负荷值,当待识别的负荷数据超出前后两个时刻的负荷数据20%,将该数据剔除。对于剔除值和缺失值,取前后两时刻负荷的平均值替代。
步骤1.2:负荷数据归一化处理
对异常负荷处理后的数据进行归一化处理,通过线性变换将数据归一化至[0,1]中,以优化负荷预测的速度和准确率。归一化处理如式(1):
其中,xi'为第i个归一化的负荷数据,xi为第i个历史负荷数据,min为历史负荷数据中的最小值,max为历史负荷数据中的最大值。
步骤1.3:负荷影响因素量化处理
负荷影响因素包括星期属性、节日属性和温度。由于星期二至星期四的负荷数据有极大的相似性。因此,在对星期属性的量化处理时,将星期数据映射到[0,1]上,星期一映射为0.1,星期二至星期四均映射为0.2,星期五映射为0.3,星期六映射为0.6,星期日映射为0.8。重大节假日包括元旦、五一、国庆、春节。在对于节日属性的量化处理时,将重大节假日映射为1.0,非重大节假日映射为0.0。对温度的量化处理,采取和负荷数据同样的归一化处理方式。
步骤2、特征选择
特征选择是从初始特征集中选取可以代表初始特征集全部或大部分信息的最优特征子集,消除冗余特征从而改善预测模型的精度和泛化能力。针对短期负荷预测,特征选择即为从海量数据中提取出最具特征的因素用到负荷预测需求中。本发明采用F-score特征选择方法减少输入特征维数,加快挖掘过程。
根据步骤1得到的数据集构建初始特征集,初始特征集中每日的特征向量包括15个特征,依次为:预测日前12天的每日日均负荷数据;预测日的星期属性,对应于星期一至星期日;预测日的节日属性,对应于重大节假日和非重大节假日;预测日的日最高温度。对构建出的初始特征集使用F-score算法进行计算,计算各个特征的F值,舍弃F值小于设定阈值的特征,以此去除辨别力影响不大的冗余特征。
步骤3、建立支持向量机回归的电力负荷预测模型
将SVM由分类问题推广至回归问题可以得到支持向量回归(SupportVectorRegression,SVR),通过寻求最优超平面,使所有样本点离超平面的“总偏差”最小。该方法可应用于电力负荷回归预测。
根据步骤2确定的特征集,得到训练样本集{(x1,y1),(x2,y2),…,(xn,yn)},其中输入向量xi为第i个样本的特征数据,xi∈X,X为输入空间;yi为第i个样本的目标输出负荷值,yi∈Y,Y为输出空间;i=1,2,…,n,n为样本个数。训练样本集输入向量与输出值之间为非线性关系,因此,SVM不是直接寻找输入输出关系,而是通过非线性映射将输入空间映射到高维特征空间中,然后在此高维空间中作负荷预测线性回归,具体为:
输入向量与输出值输出非线性拟合函数如式(2):
f(x)=wφ(x)+b 式(2)
其中,w为权重值,b为偏置。
其中,σ为核宽度系数。
SVM用于回归问题时,所寻求的最优超平面使所有样本点离超平面的“总偏差”最小。此时,负荷回归预测问题转化为约束优化问题,优化目标如式(4):
式中引入松弛因子ξi和ξi *以度量训练样本的偏离程度系数ε,构造容错惩罚系数C以控制超出误差的样本惩罚程度,式(4)的约束条件为式(5):
采用libsvm中的gridregression.py寻找惩罚系数C、偏离程度系数ε、核宽度系数σ最优参数,确定模型参数。
引进拉格朗日函数,利用libsvm中的svm-train实现对训练样本集的训练,得到偏置b和拉格朗日因子αi、αi *,训练好的电力负荷预测模型如式(6):
步骤4、进行电力负荷预测
对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。将测试数据集输入libsvm中的svm-predict进行计算,输出预测负荷值。
实施例
为了验证本发明方案的有效性,进行如下仿真实验。
1)历史数据预处理
取用江苏某市2018年全年的用电数据,一天24小时,每15分钟采样一次,每天96个采样点,计算每日的负荷平均值。在预处理过程中,进行异常负荷数据处理、负荷数据归一化处理、负荷影响因素量化处理。总数据为两部分,一部分是用来训练模型的训练数据集,另一部分是用来评估训练后的模型的测试数据集。
2)特征选择
经由计算,预测日前12天的每日日均负荷和预测日的最高温度特征向量得分大。去除特征向量得分较小的星期属性和节日属性,以13个特征向量替代原有的15个输入变量构成新的特征集。
3)建立支持向量机回归的电力负荷预测模型
选用RBF核函数,基于支持向量机(SVM)实现的开源库libsvm,建立支持向量机回归的电力负荷预测模型。
4)进行电力负荷预测
对该市2018年三月中两周的每日平均负荷进行预测,将输出的预测负荷结果值与真实值均还原为归一化前的值,绘出电力负荷预测值与真实值的对比曲线,如图2所示。由曲线明显可以看出基于以上步骤的SVM负荷预测方法有较高的精度,预测效果好。
Claims (4)
1.一种基于大数据的电力负荷预测方法,其特征在于,包括如下步骤:
步骤1、采集历史负荷数据以及负荷影响因素并进行预处理,所述负荷影响因素包括星期属性、节日属性和温度;
步骤2、根据预处理的数据集构建初始特征集,采用F-score特征选择方法进行特征选择,所述初始特征集的特征向量包括15个特征,包括:预测日前12天的每日日均负荷数据、预测日的星期属性、预测日的节日属性、预测日的日最高温度;
步骤3、根据选择的特征集确定训练样本集,训练基于支持向量机回归的电力负荷预测模型;
步骤4、对待测数据集进行特征提取,基于电力负荷预测模型进行电力负荷预测。
2.根据权利要求1所述的基于大数据的电力负荷预测方法,其特征在于,步骤1中,预处理包括:异常负荷数据处理、负荷数据归一化处理、负荷影响因素量化处理,具体方法为:
步骤1.1:异常负荷处理
将负荷数据中波动较大的负荷值及个别缺失的负荷值视为异常数据;利用负荷的横向连续性来识别波动较大的负荷值,当待识别的负荷数据超出前后两个时刻的负荷数据20%,将该数据剔除;对于剔除值和缺失值,取前后两时刻负荷的平均值替代;
步骤1.2:负荷数据归一化处理
对异常负荷处理后的数据进行归一化处理,通过线性变换将数据归一化至[0,1]中,归一化处理如式(1):
其中,xi'为第i个归一化的负荷数据,xi为第i个历史负荷数据,min为历史负荷数据中的最小值,max为历史负荷数据中的最大值;
步骤1.3:负荷影响因素量化处理
由于星期二至星期四的负荷数据有极大的相似性,在对星期属性的量化处理时,将星期数据映射到[0,1]上,星期一映射为0.1,星期二至星期四均映射为0.2,星期五映射为0.3,星期六映射为0.6,星期日映射为0.8;
重大节假日包括元旦、五一、国庆、春节,在对于节日属性的量化处理时,将重大节假日映射为1.0,非重大节假日映射为0.0;
对温度的量化处理,采取和负荷数据同样的归一化处理方式。
3.根据权利要求1所述的基于大数据的电力负荷预测方法,其特征在于,步骤2中,进行特征选择时,对构建出的初始特征集使用F-score算法进行计算,计算各个特征的F值,并舍弃F值小于设定阈值的特征。
4.根据权利要求1所述的基于大数据的电力负荷预测方法,其特征在于,步骤3中,选用RBF核函数,建立支持向量机回归的电力负荷预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910755495.1A CN112396207A (zh) | 2019-08-15 | 2019-08-15 | 一种基于大数据的电力负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910755495.1A CN112396207A (zh) | 2019-08-15 | 2019-08-15 | 一种基于大数据的电力负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112396207A true CN112396207A (zh) | 2021-02-23 |
Family
ID=74601889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910755495.1A Pending CN112396207A (zh) | 2019-08-15 | 2019-08-15 | 一种基于大数据的电力负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112396207A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011680A (zh) * | 2021-04-16 | 2021-06-22 | 西安建筑科技大学 | 一种电力负荷预测方法及系统 |
CN113435663A (zh) * | 2021-07-15 | 2021-09-24 | 国网冀北电力有限公司唐山供电公司 | 一种考虑电动汽车充电负荷影响的cnn-lstm联合负荷预测方法 |
CN114742263A (zh) * | 2022-03-02 | 2022-07-12 | 北京百度网讯科技有限公司 | 负荷预测方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013005465A (ja) * | 2011-06-10 | 2013-01-07 | Azbil Corp | 負荷量予測装置、負荷量予測方法および負荷量予測プログラム |
CN106446091A (zh) * | 2016-09-13 | 2017-02-22 | 北京协力筑成金融信息服务股份有限公司 | 一种多源时序数据的预处理方法和装置 |
CN108460213A (zh) * | 2018-03-07 | 2018-08-28 | 燕山大学 | 基于多聚类原型的t-s模型对炉腹煤气量的预测方法及程序 |
-
2019
- 2019-08-15 CN CN201910755495.1A patent/CN112396207A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013005465A (ja) * | 2011-06-10 | 2013-01-07 | Azbil Corp | 負荷量予測装置、負荷量予測方法および負荷量予測プログラム |
CN106446091A (zh) * | 2016-09-13 | 2017-02-22 | 北京协力筑成金融信息服务股份有限公司 | 一种多源时序数据的预处理方法和装置 |
CN108460213A (zh) * | 2018-03-07 | 2018-08-28 | 燕山大学 | 基于多聚类原型的t-s模型对炉腹煤气量的预测方法及程序 |
Non-Patent Citations (1)
Title |
---|
肖蔚: "基于支持向量机的短期电力负荷预测方法研究", <中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑> * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011680A (zh) * | 2021-04-16 | 2021-06-22 | 西安建筑科技大学 | 一种电力负荷预测方法及系统 |
CN113435663A (zh) * | 2021-07-15 | 2021-09-24 | 国网冀北电力有限公司唐山供电公司 | 一种考虑电动汽车充电负荷影响的cnn-lstm联合负荷预测方法 |
CN114742263A (zh) * | 2022-03-02 | 2022-07-12 | 北京百度网讯科技有限公司 | 负荷预测方法、装置、电子设备及存储介质 |
CN114742263B (zh) * | 2022-03-02 | 2024-03-01 | 北京百度网讯科技有限公司 | 负荷预测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740648B (zh) | 电力负荷异常数据识别方法、装置和计算机设备 | |
Kurniadi et al. | The prediction of scholarship recipients in higher education using k-Nearest neighbor algorithm | |
CN112396207A (zh) | 一种基于大数据的电力负荷预测方法 | |
CN111967688A (zh) | 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法 | |
CN110212524A (zh) | 一种区域电力负荷预测方法 | |
CN116821809B (zh) | 基于人工智能的生命体征数据采集系统 | |
US20210397956A1 (en) | Activity level measurement using deep learning and machine learning | |
CN117975204B (zh) | 一种模型训练方法、缺陷检测方法以及相关装置 | |
CN116451142A (zh) | 一种基于机器学习算法的水质传感器故障检测方法 | |
CN114912720A (zh) | 基于记忆网络电力负荷预测方法、装置、终端及存储介质 | |
CN116959725A (zh) | 一种多模态数据融合的疾病风险预测方法 | |
Liu et al. | Stock price trend prediction model based on deep residual network and stock price graph | |
Zheng et al. | Autism classification based on logistic regression model | |
CN108830405B (zh) | 基于多指标动态匹配的实时电力负荷预测系统及其方法 | |
CN109800782A (zh) | 一种基于模糊knn算法的电网故障检测方法及装置 | |
CN111507528A (zh) | 一种基于cnn-lstm的股票长期趋势预测方法 | |
CN117373247B (zh) | 一种新型etc卡休眠预测诊断方法、系统及可存储介质 | |
Kirshners et al. | A comparative analysis of short time series processing methods | |
Kumar et al. | Utilizing Machine Learning Algorithms for Rainfall Analysis | |
Dutta et al. | Early & accurate forecasting of mid term wind energy based on PCA empowered supervised regression model | |
CN116245212A (zh) | 基于pca-lstm的电力数据异常检测与预测方法及系统 | |
CN114168578A (zh) | 一种基于聚类和近邻算法的日负荷数据缺失值插补方法 | |
Huang | Research on the Google Stock Price Prediction Based on SVR, Random Forest, and KNN Models | |
Govindraj et al. | Comparison of Machine Learning Techniques for Prediction of Diabetes | |
Liu et al. | Short-term Load Forecasting Approach with SVM and Similar Days Based on United Data Mining Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210223 |
|
RJ01 | Rejection of invention patent application after publication |