CN117522066A - 一种基于调峰电源设备组合预测的联合优化方法及系统 - Google Patents
一种基于调峰电源设备组合预测的联合优化方法及系统 Download PDFInfo
- Publication number
- CN117522066A CN117522066A CN202311580471.XA CN202311580471A CN117522066A CN 117522066 A CN117522066 A CN 117522066A CN 202311580471 A CN202311580471 A CN 202311580471A CN 117522066 A CN117522066 A CN 117522066A
- Authority
- CN
- China
- Prior art keywords
- model
- early warning
- parameters
- prediction
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000005457 optimization Methods 0.000 title claims abstract description 40
- 238000012706 support-vector machine Methods 0.000 claims abstract description 48
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims abstract description 42
- 238000003062 neural network model Methods 0.000 claims abstract description 40
- 238000007637 random forest analysis Methods 0.000 claims abstract description 40
- 230000004927 fusion Effects 0.000 claims abstract description 25
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 34
- 238000012549 training Methods 0.000 claims description 29
- 239000002245 particle Substances 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 20
- 230000002776 aggregation Effects 0.000 claims description 12
- 238000004220 aggregation Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000000295 complement effect Effects 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000007418 data mining Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010977 unit operation Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06312—Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Public Health (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
Abstract
本发明公开了一种基于调峰电源设备组合预测的联合优化方法及系统,涉及水电机组状态监测技术领域。根据水电机组参数的不同特征,建立ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测和加权平均,得到预测参数;再将预测参数输入支持向量机SVM模型和XGBoost模型进行水电机组故障分类预警,采用加权证据理论方法将预警结果进行信息融合得到最终故障分类预警结果。通过多种模型的计算融合,克服了单一模型分类预警准确性不足,可靠性可信度低的问题,实现了准确可信的调峰电源设备尤其是水电机组设备的参数预测和状态预警,为电力设备安全稳定运行给予了有力支持。
Description
技术领域
本发明属于水电机组状态监测技术领域,具体涉及一种基于调峰电源设备组合预测的联合优化方法及系统。
背景技术
水电机组是电力系统的关键设备之一,其运行状态关乎电网能否可靠供电。因此运用可靠的状态监测技术进行分析,并对其未来的运行状态进行预测,及时获知故障信息,杜绝事故的进一步蔓延,避免重大电力事故发生,从而保证水电机组的正常运行,对于电网调峰供电具有重要意义。
但是,传统的水电机组诊断方法依赖设备的理论知识和人为经验,普适性较差、效率低下,无法有效地对水电机组状态作出预测和及时反映预警。而基于数据挖掘的状态监测方法主要有三大类,其中,统计分析方法受限于统计分析理论,只对特定数据集有较高精度,泛化性较差;信号处理方法通过提取时频域特征参数对系统状态进行表征,但时频变换容易出现信息的损失;基于机器学习的设备监测方法很多,但是存在单一预测模型监测分类通用性较差,预测可靠性可信度不足的问题。所以,上述人工或基于数据挖掘的检测方法并不能较好的广泛地用于水电机组运行状态的准确可靠预测。
因此,如何提出一种多模型组合的水电机组运行状态预测方法,从而提高水电机组运行状态预测可靠性和可信度,是本领域技术人员亟需解决的技术问题。
发明内容
有鉴于此,本发明提供了一种基于调峰电源设备组合预测的联合优化方法及系统,以数据挖掘的方式,实现对调峰电源设备尤其是水电机组设备的参数预测和状态预警,从而提高水电机组运行状态预测的可靠性和可信度。
为了实现上述目的,本发明提供如下技术方案:
本发明公开了一种基于调峰电源设备组合预测的联合优化方法,具体步骤如下:
获取水电机组的内部工作参数、外部环境参数以及电网负荷参数,构建数据表;
根据所述数据表,确定初始数据集;
根据初始数据集中数据的线性特征、非线性特征和复杂特征,构建ARIMA模型、随机森林模型、LSTM神经网络模型,进行参数预测;计算组合权重,对预测参数进行加权平均,得到最终输出结果,作为预测数据集;
将多种不同类型的水电机组故障定义为一个故障空间,并结合初始数据集,分别搭建支持向量机SVM模型和XGBoost模型,使用寻优算法对两个模型的参数进行优化;根据预测数据集和故障空间,对水电机组的故障进行分类和预警,分别得到初始预警结果;将所述初始预警结果进行信息融合,输出最终状态预警结果。
进一步的,所述内部工作参数包括:水轮机的进水压强、振动、摆渡系数数据,发电机转子的交流阻抗、磁极系数数据,变压器中的油温和气体浓度数据;所述部环境参数,包括:气温、地面温度、相对湿度、平均风速数据;所述电网负荷参数,包括:运行电压、有功功率、无功功率;然后,根据各参数获取时间构建数据表。
进一步的,所述确定初始数据集,包括:首先,判断数据表中缺失值占样本量总量的比例,当所占比例大于阈值时,采用插补法补全数据集中的缺失值,小于阈值时,采用删除法直接删除缺失值;再,进行异常值处理;然后,采用Z-score方法进行数据标准化;最后,采用袋外数据特征置换法进行特征提取,得到初始数据集。
进一步的,所述构建ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测,包括:
选取初始数据集中具有线性特征的参数,构建ARIMA模型并训练,利用训练好的ARIMA模型进行参数预测;选取初始数据集中具有非线性特征的参数,构建随机森林模型并训练,利用训练好的随机森林模型进行参数预测;选取初始数据集中具有复杂特征的参数,构建LSTM神经网络模型并训练,利用训练好的LSTM神经网络模型进行参数预测;
所述计算组合权重,对预测参数进行加权平均,得到最终输出结果,包括:
利用拟合优度算法分配ARIMA模型、随机森林模型、LSTM神经网络模型的权重值,首先计算拟合优度算法的可决系数p,p的正常取值范围为[0,1],其计算公式为:
其中,为第i个参数预测数值,/>为真实值的平均值,zi为第i个参数真实值,n为预测参数总个数;
然后,使用tangent函数对可决系数p进行优化,最后得到优化后的组合权重计算公式:
其中,wj代表第j个子模型的组合权重,zj代表第j个子模型的p值,h(zj)代表第j个子模型使用tangent函数变换后的p值;
根据权重值wj,计算ARIMA模型、随机森林模型、LSTM神经网络模型的预测参数加权平均值得到最终输出结果,作为预测数据集。
进一步的,所述ARIMA模型由引入差分操作的同时由自回归模型和移动平均模型组成,其初始化系数包含自回归项数和滑动平均项数;所述随机森林模型选择Bootstrap采样来构建每个基础决策树;所述LSTM神经网络模型使用随机梯度下降Adam算法优化,损失函数为交叉熵函数。
进一步的,所述故障空间为Θ{F1,F2,…,F10}作为水电机组故障辨识框架;
所述支持向量机SVM模型的构建,采用网格寻优方法,粗略选择惩罚参数c和核函数参数g;然后采用K-折交叉验证方法,选取最优的c值和g值作为支持向量机SVM模型的最优参数;
所述XGBoost模型的构建,采用自适应粒子群优化算法不断更新XGBoost模型的基学习器个数、学习率、最大树深度,确定最优化参数;
所述初始预警结果包括:利用优化好的支持向量机SVM模型和XGBoost模型,以预测数据集参数预测模型的最终输出结果作为输入,对水电机组的故障进行分类预警,分别得到两个初始预警结果;
所述最终状态预警结果为:通过加权证据方法,对两个初始预警结果进行信息融合,得到的水电机组状态预警结果。
进一步的,所述K-折交叉验证方法,具体为:将初始数据集中数据分为k个子集,其中k-1个子集作为训练子集,1子集个作为测试子集,选取一组c和g的值进行支持向量机SVM模型训练,并计算测试子集测试结果的均方误差MSE,计算选取多组不同的c和g值的MSE,以MSE最小值原则选取最优的c值和g值。
进一步的,所述自适应粒子群优化算法,具体为:
确定自适应粒子群优化算法的惯性权重w值,其公式为:
其中,wmax和wwin分别表示惯性权重的最大和最小值,k为当前迭代次数,kmax为最大迭代次数;
根据粒子群的进化程度和聚集程度,对自适应粒子群优化算法的惯性权重进行动态更新,改进后的自适应惯性权重更新公式为:
w*=win-(win-wmin)*evol+(wmax-win)*aggr
其中,w*表示自适应惯性权重,win表示初始惯性权重值,evol和aggr分别为进化程度和聚集程度。
进一步的,所述加权证据方法,具体为:
定义两个初始预警结果中每一种水电机组故障有两种待组合证据体E1,E2,对应基本概率分配函数分别为m1、m2,对应焦元分别为Ap、Bq,Ap、Bq的公共焦元为C,m1、m2之间的冲突程度系数为H,则融合公式为:
其中,为证据源对焦元的平均支持程度。
通过融合公式,分别融合得到不同类型水电机组故障的预警结果。
进一步的,还包括通过计算平均精度指标,评估水电机组状态预警性能,所述平均精度指标包括:平均准确率、查准率、查全率和调和均值F1-score。
本发明还公开了一种基于调峰电源设备组合预测的联合优化系统,包括:
数据获取模块:获取水电机组的内部工作参数、外部环境参数以及电网负荷参数,构建数据表;
数据预处理模块:根据所述数据表,确定初始数据集;
参数预测模块:根据初始数据集中数据的线性特征、非线性特征和复杂特征,构建ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测;计算组合权重,对预测参数进行加权平均,得到最终输出结果,作为预测数据集;
状态预警模块:将多种不同类型的水电机组故障定义为一个故障空间,并结合初始数据集,分别搭建支持向量机SVM模型和XGBoost模型,使用寻优算法对两个模型的参数进行优化;根据预测数据集和故障空间,对水电机组的故障进行分类和预警,分别得到初始预警结果;将所述初始预警结果进行信息融合,输出最终状态预警结果。
进一步的,所述参数预测模块包括:
ARIMA模型单元:选取初始数据集中具有线性特征的参数,构建ARIMA模型并训练,利用训练好的ARIMA模型进行参数预测;
随机森林模型单元:选取初始数据集中具有非线性特征的参数,构建随机森林模型并训练,利用训练好的随机森林模型进行参数预测;
LSTM神经网络模型单元:选取初始数据集中具有复杂特征的参数,构建LSTM神经网络模型并训练,利用训练好的LSTM神经网络模型进行参数预测;
组合权重单元:利用拟合优度算法分配ARIMA模型、随机森林模型、LSTM神经网络模型的权重值,并根据权重值,计算ARIMA模型、随机森林模型、LSTM神经网络模型的预测参数加权平均值得到最终输出结果,作为预测数据集。
进一步的,所述状态预警模块包括:
SVM模型单元:采用网格寻优方法,粗略选择惩罚参数c和核函数参数g;然后采用K-折交叉验证方法,选取最优的c值和g值作为支持向量机SVM模型的最优参数,以预测数据集作为输入,对水电机组的故障进行分类预警;
XGBoost模型单元:采用自适应粒子群优化算法不断更新XGBoost模型的基学习器个数、学习率、最大树深度,确定最优化参数,以预测数据集作为输入,对水电机组的故障进行分类预警;
预警结果融合单元:通过加权证据方法,对SVM模型单元和XGBoost模型单元得到的初始预警结果进行信息融合,得到水电机组最终状态预警结果。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于调峰电源设备组合预测的联合优化方法及系统,通过对水电机组的历史参数数据进行预处理和特征提取,根据线性特征、非线性特征以及复杂特征进行分类,分别建立不同的参数预测模型进行参数预测和加权融合,能够更准确地预测水电机组相关参数的未来数据。通过将预测参数输入支持向量机SVM模型和XGBoost模型进行水电机组故障预警,采用加权证据理论思想将二者预警结果进行信息融合,进一步提供了水电机组预警的准确性和可信度,多种模型的融合,克服了单一的预测模型的可靠性不足,分类预警准确性和可信度低的问题,以数据挖掘的方式,实现对调峰电源设备尤其是水电机组设备的参数预测和状态预警,为水电机组及电力系统的安全稳定运行给予了有力支持。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明的整体流程示意图。
图2为本发明的状态预警流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于调峰电源设备组合预测的联合优化方法,整体流程如图1所示,具体步骤如下:
获取水电机组的内部工作参数、外部环境参数以及电网负荷参数,构建数据表。
对数据表中的数据进行预处理和特征提取得到初始数据集。
构建参数预测模型,根据初始数据集中数据的线性特征、非线性特征和复杂特征,构建ARIMA模型、随机森林模型、LSTM神经网络模型,进行参数预测;计算组合权重,对预测参数进行加权平均,得到最终输出结果,作为预测数据集。
构建状态预警模型,将多种不同类型的水电机组故障定义为一个故障空间,并结合初始数据集,分别搭建支持向量机SVM模型和XGBoost模型,使用寻优算法对两个模型的参数进行优化;根据预测数据集和故障空间,对水电机组的故障进行分类和预警,分别得到初始预警结果;对两种模型的初始预警结果进行信息融合,输出最终状态预警结果。
本发明的一个实施例中,获取水电机组内部工作参数,包括:水轮机的进水压强、振动、摆渡系数数据,发电机转子的交流阻抗、磁极系数数据,变压器中的油温和气体浓度数据;获取水电机组外部环境参数,包括:气温、地面温度、相对湿度、平均风速数据;获取电网负荷参数,包括:运行电压、有功功率、无功功率。然后,根据各参数获取时间构建数据表,数据表见表1。
表1数据表
本发明的一个实施例中,确定初始数据集还包括:
首先,判断数据表中缺失值占样本量总量的比例,当所占比例大于阈值时,采用插补法中的统计法,即采用同一类别对应数据的均值进行补全,从而补全数据集中的缺失值;小于阈值时,采用删除法直接删除缺失值。在缺失样本较多时,样本量较少,采用插补法可以保证一定的样本数量,确保数据集中参数数量,保证训练模型的准确性,在缺失样本较少时,样本数量本申存在一定冗余,直接删除法可以减少插补法所带来的额外计算量。
再进行异常值处理,对于不存在水电机组故障的样本,对异常值直接进行删除操作,对于存在水电机组故障的样本,保留异常值。
然后,采用Z-score方法进行数据标准化,其转换函数为:
其中,μ为所有样本数据的均值;σ为所有样本数据的标准差,x*为标准化后的数值,x是处理前的数值。
最后,采用袋外数据特征置换法进行特征提取,得到初始数据集。
本发明的一个实施例中,构建ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测,包括:
选取初始数据集中具有线性特征的参数,构建ARIMA模型并训练,利用训练好的ARIMA模型进行参数预测;例如水轮机的输出功率与进水压力成正比,在正常工作范围内通常具有线性特征。选取初始数据集中具有非线性特征的参数,构建随机森林模型并训练,利用训练好的随机森林模型进行参数预测;例如,油箱中气体浓度通常具有非线性特征,该参数受到温度、压力和油质量等多个因素影响。选取初始数据集中具有复杂特征的参数,构建LSTM神经网络模型并训练,利用训练好的LSTM神经网络模型进行参数预测;例如,摆度系数与水轮机等设备的结构和运行条件有关,难以通过线性或非线性模型描述,具有复杂特征。单一的预测模型往往侧重于处理参数的线性或非线性特征,难以识别出所有的关系,结合多种模型,构建组合状态预测模型,以取得比单一模型更好的效果。
ARIMA模型由引入差分操作的同时由自回归模型和移动平均模型组成,其初始化系数包含自回归项数,即自由回归模型的阶数,还包含滑动平均项数。
随机森林模型将多棵CART回归树的预测值取平均后再输出,本发明中选择的回归树的数量为100-200之间,采样方法选择Bootstrap采样来构建每个基础决策树,最小样本数目设置为数据大小的1%。
LSTM神经网络模型的输入维数为9,输出维数为1,隐层神经元个数为15,使用随机梯度下降Adam算法优化,损失函数为交叉熵函数。本发明采用深度学习库TensorFlow构建LSTM预测模型,后端采用基于C++开发的TensorFlow-GPU开源框架。将数据按照一定比例进行划分,其中4000组特征数据作为训练集样本,120组数据作为测试集样本。LSTM模型构建时对比不同层数下的预测效果,选取合适的隐藏层层数,确定模型相关参数,其中神经元个数为15,步长为10,学习率为0.01,Dropout的比例为0.5。
利用拟合优度算法分配ARIMA模型、随机森林模型、LSTM神经网络模型的权重值,首先计算拟合优度算法的可决系数p,p的正常取值范围为[0,1],其计算公式为:
其中,为第i个参数预测数值,/>为真实值的平均值,zi为第i个参数真实值,n为预测参数总个数。
然后,使用tangent函数对可决系数p进行优化,从而对预测效果进行差异放大,最后得到优化后的组合权重计算公式:
其中,wj代表第j个子模型的组合权重,zj代表第j个子模型的p值,h(zj)代表第j个子模型使用tangent函数变换后的p值。
根据权重值wj,计算ARIMA模型、随机森林模型、LSTM神经网络模型的预测参数加权平均值得到最终输出结果,作为预测数据集。
如图2所示,本申请的一个实施例中,还包括:
将多种不同类型的水电机组故障定义为一个空间Θ{F1,F2,…,F10}作为辨识框架。
支持向量机SVM模型的构建,采用网格寻优方法,粗略选择惩罚参数c和核函数参数g;然后采用K-折交叉验证方法,选取最优的c值和g值作为支持向量机SVM模型的最优参数;
XGBoost模型的构建,采用自适应粒子群优化算法不断更新XGBoost模型的基学习器个数、学习率、最大树深度,确定最优化参数;
初始预警结果包括:利用优化好的支持向量机SVM模型和XGBoost模型,以预测数据集作为输入,对水电机组的故障进行分类预警,分别得到两个初始预警结果;
最终状态预警结果为:采用加权证据方法,对两个初始预警结果进行信息融合,得到最终的水电机组状态预警结果。
其中,K-折交叉验证方法,具体为:
采用K-折交叉验证方法,选取最优的c值和g值,具体为:将初始数据集中数据分为k个子集,其中k-1个子集作为训练子集,1子集个作为测试子集,选取一组c和g的值进行支持向量机SVM模型训练,并计算测试子集测试结果的均方误差MSE,计算选取多组不同的c和g值的MSE,以MSE最小值原则选取最优的c值和g值。本发明中取K=4,即4折交叉验证方法,首先把水电机组的数据样本分类成4组子集,将前3组样本作为训练集,最后1组样本用于测试,然后循环多次,每次都得出一个均方误差MSE;将数据进行10次训练,且每次训练后将得到的数据进行整理分析,然后将10次的MSE取平均值;最后以MSE最小原则选取c值和g值作为SVM建模的最优参数。
自适应粒子群优化算法,具体为:
确定自适应粒子群优化算法的惯性权重w值,其公式为:
其中,wmax和wwin分别表示惯性权重的最大和最小值,k为当前迭代次数,kmax为最大迭代次数。
惯性权重ω是平衡算法局部和全局搜索的关键参数,较大的ω具有较强的全局搜索能力,但是容易越过最优解,而较小的ω局部搜索能力较强,但是容易陷入局部最优。根据粒子群的进化程度和聚集程度,对自适应粒子群优化算法的惯性权重进行动态更新,优化粒子在搜索空间中的运动过程,改进后的自适应惯性权重更新公式为:
w*=win-(win-wmin)*evol+(wmax-win)*aggr
其中,w*表示自适应惯性权重,win表示初始惯性权重值,evol和aggr分别为进化程度和聚集程度。
进化程度公式为:
式中,evol在[0,1]范围内表示粒子群的进化程度;e为自然常数;ck和ck-1分别表示第k次和第k-1次迭代所带来的适应度变化量。当本次变化量比上一次要大时,表明全局最优解还有较大的提升空间,进化程度evol会取得较小的值,并且规定在ck-1=0时,evol取得最小值0;反之,evol取得最小值1;特殊的,当ck-1=0且ck=0时,全局最优解位置连续多次迭代都没有发生变化,规定此时的evol为1,粒子群的进化程度达到最大。
聚集程度公式为:
其中,aggr在[0,1]范围内表示粒子群的聚集程度;N代表每个子空间所含有的粒子数(N1、N2、N3…Nn),log函数的底数等于子空间个数n。当所有粒子被平均分配到每一个子空间中,即N1=N2=N3=…Nn,aggr取得最小值0,此时粒子群的聚集程度最低;当所有粒子都在同一个子空间中,即存在Ni=N时,aggr取得最大值1,此时粒子群的聚集程度最高。
加权证据方法,具体为:
定义两个初始预警结果中每一种水电机组故障有两种待组合证据体E1,E2,对应基本概率分配函数分别为m1、m2,对应焦元分别为Ap、Bq,Ap、Bq的公共焦元为C,m1、m2之间的冲突程度系数为H,则融合公式为:
其中,为证据源对焦元的平均支持程度,等于0时表示其中一个诊断模型输出结果不属于水电机组故障空间。
通过融合公式,分别融合得到不同类型水电机组故障的预警结果。
本申请的一个实施例中,还包括通过计算平均精度指标,评估水电机组状态预警性能,平均精度指标包括:平均准确率、查准率、查全率和调和均值F1-score,其中:
平均准确率=(真正例+真负例)/总样本数;
查准率是指模型正确预测为正类别的样本数占所有预测为正类别的样本数的比例,查准率衡量了模型在所有正类别样本中的正确率,计算公式如下:
查准率=真正例/(真正例+假正例);
查全率是指模型正确预测为正类别的样本数占所有真正正类别样本数的比例,查全率衡量了模型识别出的正类别样本占总正类别样本的比例,计算公式如下:
查全率=真正例/(真正例+假负例);
F1-score是查准率和查全率的调和均值,它综合考虑了模型的精确性和召回率,用于平衡两者之间的关系,计算公式如下:
F1-score=2*(查准率*查全率)/(查准率+查全率)。
本发明的一个实施例公开了一种基于调峰电源设备组合预测的联合优化系统,包括:
数据获取模块:获取水电机组的内部工作参数、外部环境参数以及电网负荷参数,构建数据表;
数据预处理模块:根据数据表,确定初始数据集;
参数预测模块:根据初始数据集中数据的线性特征、非线性特征和复杂特征,构建ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测;计算组合权重,对预测参数进行加权平均,得到最终输出结果,作为预测数据集;
状态预警模块:将多种不同类型的水电机组故障定义为一个故障空间,并结合初始数据集,分别搭建支持向量机SVM模型和XGBoost模型,使用寻优算法对两个模型的参数进行优化;根据预测数据集和故障空间,对水电机组的故障进行分类和预警,分别得到初始预警结果;将初始预警结果进行信息融合,输出最终状态预警结果。
本发明的一个实施例中,参数预测模块包括:
ARIMA模型单元:选取初始数据集中具有线性特征的参数,构建ARIMA模型并训练,利用训练好的ARIMA模型进行参数预测;
随机森林模型单元:选取初始数据集中具有非线性特征的参数,构建随机森林模型并训练,利用训练好的随机森林模型进行参数预测;
LSTM神经网络模型单元:选取初始数据集中具有复杂特征的参数,构建LSTM神经网络模型并训练,利用训练好的LSTM神经网络模型进行参数预测;
组合权重单元:利用拟合优度算法分配ARIMA模型、随机森林模型、LSTM神经网络模型的权重值,并根据权重值,计算ARIMA模型、随机森林模型、LSTM神经网络模型的预测参数加权平均值得到最终输出结果,作为预测数据集。
本发明的一个实施例中,状态预警模块包括:
SVM模型单元:采用网格寻优方法,粗略选择惩罚参数c和核函数参数g;然后采用K-折交叉验证方法,选取最优的c值和g值作为支持向量机SVM模型的最优参数,以预测数据集作为输入,对水电机组的故障进行分类预警;
XGBoost模型单元:采用自适应粒子群优化算法不断更新XGBoost模型的基学习器个数、学习率、最大树深度,确定最优化参数,以预测数据集作为输入,对水电机组的故障进行分类预警;
预警结果融合单元:通过加权证据方法,对SVM模型单元和XGBoost模型单元得到的初始预警结果进行信息融合,得到水电机组最终状态预警结果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于调峰电源设备组合预测的联合优化方法,其特征在于,具体步骤如下:
获取水电机组的内部工作参数、外部环境参数以及电网负荷参数,构建数据表;
根据所述数据表,确定初始数据集;
根据初始数据集中数据的线性特征、非线性特征和复杂特征,构建ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测;计算组合权重,对预测参数进行加权平均,得到最终输出结果,作为预测数据集;
将多种不同类型的水电机组故障定义为一个故障空间,并结合初始数据集,分别搭建支持向量机SVM模型和XGBoost模型,使用寻优算法对两个模型的参数进行优化;根据预测数据集和故障空间,对水电机组的故障进行分类和预警,分别得到初始预警结果;将所述初始预警结果进行信息融合,输出最终状态预警结果。
2.根据权利要求1所述的一种基于调峰电源设备组合预测的联合优化方法,其特征在于,所述内部工作参数包括:水轮机的进水压强、振动、摆渡系数数据,发电机转子的交流阻抗、磁极系数数据,变压器中的油温和气体浓度数据;所述部环境参数,包括:气温、地面温度、相对湿度、平均风速数据;所述电网负荷参数,包括:运行电压、有功功率、无功功率;
根据各参数获取时间构建数据表。
3.根据权利要求1所述的一种基于调峰电源设备组合预测的联合优化方法,其特征在于,所述确定初始数据集,包括:
首先,判断数据表中缺失值占样本量总量的比例,当所占比例大于阈值时,采用插补法补全数据集中的缺失值,小于阈值时,采用删除法直接删除缺失值;再,进行异常值处理;然后,采用Z-score方法进行数据标准化;最后,采用袋外数据特征置换法进行特征提取,得到初始数据集。
4.根据权利要求1所述的一种基于调峰电源设备组合预测的联合优化方法,其特征在于,所述构建ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测,包括:
选取初始数据集中具有线性特征的参数,构建ARIMA模型并训练,利用训练好的ARIMA模型进行参数预测;选取初始数据集中具有非线性特征的参数,构建随机森林模型并训练,利用训练好的随机森林模型进行参数预测;选取初始数据集中具有复杂特征的参数,构建LSTM神经网络模型并训练,利用训练好的LSTM神经网络模型进行参数预测;
所述计算组合权重,对预测参数进行加权平均,得到最终输出结果,包括:
利用拟合优度算法分配ARIMA模型、随机森林模型、LSTM神经网络模型的权重值,首先计算拟合优度算法的可决系数p,p的正常取值范围为[0,1],其计算公式为:
其中,为第i个参数预测数值,/>为真实值的平均值,zi为第i个参数真实值,n为预测参数总个数;
然后,使用tangent函数对可决系数p进行优化,最后得到优化后的组合权重计算公式:
其中,wj代表第j个子模型的组合权重,zj代表第j个子模型的p值,h(zj)代表第j个子模型使用tangent函数变换后的p值;
根据权重值wj,计算ARIMA模型、随机森林模型、LSTM神经网络模型的预测参数加权平均值得到最终输出结果,作为预测数据集。
5.根据权利要求4所述的一种基于调峰电源设备组合预测的联合优化方法,其特征在于,
所述ARIMA模型由引入差分操作的同时由自回归模型和移动平均模型组成,其初始化系数包含自回归项数和滑动平均项数;
所述随机森林模型选择Bootstrap采样来构建每个基础决策树;
所述LSTM神经网络模型使用随机梯度下降Adam算法优化,损失函数为交叉熵函数。
6.根据权利要求1所述的一种基于调峰电源设备组合预测的联合优化方法,其特征在于,
所述故障空间为Θ{F1,F2,…,F10}作为水电机组故障辨识框架;
所述支持向量机SVM模型的构建,采用网格寻优方法,粗略选择惩罚参数c和核函数参数g;然后采用K-折交叉验证方法,选取最优的c值和g值作为支持向量机SVM模型的最优参数;
所述XGBoost模型的构建,采用自适应粒子群优化算法不断更新XGBoost模型的基学习器个数、学习率、最大树深度,确定最优化参数;
所述初始预警结果包括:利用优化好的支持向量机SVM模型和XGBoost模型,以预测数据集作为输入,对水电机组的故障进行分类预警,分别得到初始预警结果;
所述最终状态预警结果为:通过加权证据方法,对两个初始预警结果进行信息融合,得到的水电机组状态预警结果
所述K-折交叉验证方法,具体为:
将初始数据集中数据分为k个子集,其中k-1个子集作为训练子集,1子集个作为测试子集,选取一组c和g的值进行支持向量机SVM模型训练,并计算测试子集测试结果的均方误差MSE,计算选取多组不同的c和g值的MSE,以MSE最小值原则选取最优的c值和g值;
所述自适应粒子群优化算法,具体为:
确定自适应粒子群优化算法的惯性权重w值,其公式为:
其中,wmax和wwin分别表示惯性权重的最大和最小值,k为当前迭代次数,kmax为最大迭代次数;
根据粒子群的进化程度和聚集程度,对自适应粒子群优化算法的惯性权重进行动态更新,改进后的自适应惯性权重更新公式为:
w*=win-(win-wmin)*evol+(wmax-win)*aggr
其中,w*表示自适应惯性权重,win表示初始惯性权重值,evol和aggr分别为进化程度和聚集程度;
所述加权证据方法,具体为:
定义所述两个初始预警结果中每一种水电机组故障有两种待组合证据体E1,E2,对应基本概率分配函数分别为m1、m2,对应焦元分别为Ap、Bq,Ap、Bq的公共焦元为C,m1、m2之间的冲突程度系数为H,则融合公式为:
其中,为证据源对焦元的平均支持程度;
通过融合公式,分别融合得到不同类型水电机组故障的预警结果。
7.根据权利要求1所述的一种基于调峰电源设备组合预测的联合优化方法,其特征在于,还包括通过计算平均精度指标,评估水电机组状态预警性能,所述平均精度指标包括:平均准确率、查准率、查全率和调和均值F1-score。
8.一种基于调峰电源设备组合预测的联合优化系统,其特征在于,包括:
数据获取模块:获取水电机组的内部工作参数、外部环境参数以及电网负荷参数,构建数据表;
数据预处理模块:根据所述数据表,确定初始数据集;
参数预测模块:根据初始数据集中数据的线性特征、非线性特征和复杂特征,构建ARIMA模型、随机森林模型、LSTM神经网络模型进行参数预测;计算组合权重,对预测参数进行加权平均,得到最终输出结果,作为预测数据集;
状态预警模块:将多种不同类型的水电机组故障定义为一个故障空间,并结合初始数据集,分别搭建支持向量机SVM模型和XGBoost模型,使用寻优算法对两个模型的参数进行优化;根据预测数据集和故障空间,对水电机组的故障进行分类和预警,分别得到初始预警结果;将所述初始预警结果进行信息融合,输出最终状态预警结果。
9.根据权利要求8所述的一种基于调峰电源设备组合预测的联合优化系统,其特征在于,所述参数预测模块包括:
ARIMA模型单元:选取初始数据集中具有线性特征的参数,构建ARIMA模型并训练,利用训练好的ARIMA模型进行参数预测;
随机森林模型单元:选取初始数据集中具有非线性特征的参数,构建随机森林模型并训练,利用训练好的随机森林模型进行参数预测;
LSTM神经网络模型单元:选取初始数据集中具有复杂特征的参数,构建LSTM神经网络模型并训练,利用训练好的LSTM神经网络模型进行参数预测;
组合权重单元:利用拟合优度算法分配ARIMA模型、随机森林模型、LSTM神经网络模型的权重值,并根据权重值,计算ARIMA模型、随机森林模型、LSTM神经网络模型的预测参数加权平均值得到最终输出结果,作为预测数据集。
10.根据权利要求8所述的一种基于调峰电源设备组合预测的联合优化系统,其特征在于,所述状态预警模块包括:
SVM模型单元:采用网格寻优方法,粗略选择惩罚参数c和核函数参数g;然后采用K-折交叉验证方法,选取最优的c值和g值作为支持向量机SVM模型的最优参数,以预测数据集作为输入,对水电机组的故障进行分类预警;
XGBoost模型单元:采用自适应粒子群优化算法不断更新XGBoost模型的基学习器个数、学习率、最大树深度,确定最优化参数,以预测数据集作为输入,对水电机组的故障进行分类预警;
预警结果融合单元:通过加权证据方法,对SVM模型单元和XGBoost模型单元得到的初始预警结果进行信息融合,得到水电机组最终状态预警结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311580471.XA CN117522066A (zh) | 2023-11-24 | 2023-11-24 | 一种基于调峰电源设备组合预测的联合优化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311580471.XA CN117522066A (zh) | 2023-11-24 | 2023-11-24 | 一种基于调峰电源设备组合预测的联合优化方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117522066A true CN117522066A (zh) | 2024-02-06 |
Family
ID=89751055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311580471.XA Pending CN117522066A (zh) | 2023-11-24 | 2023-11-24 | 一种基于调峰电源设备组合预测的联合优化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117522066A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118152884A (zh) * | 2024-03-21 | 2024-06-07 | 北京溥络数智科技有限责任公司 | 化工罐量预测方法、装置和化工罐实时监测系统 |
-
2023
- 2023-11-24 CN CN202311580471.XA patent/CN117522066A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118152884A (zh) * | 2024-03-21 | 2024-06-07 | 北京溥络数智科技有限责任公司 | 化工罐量预测方法、装置和化工罐实时监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tian | Short-term wind speed prediction based on LMD and improved FA optimized combined kernel function LSSVM | |
Shao et al. | Nickel price forecast based on the LSTM neural network optimized by the improved PSO algorithm | |
CN116307652A (zh) | 一种智能电网人工智能资源分配方法 | |
CN110826774A (zh) | 母线负荷预测方法、装置、计算机设备及存储介质 | |
Kaboli et al. | An expression-driven approach for long-term electric power consumption forecasting | |
Kosana et al. | Hybrid wind speed prediction framework using data pre-processing strategy based autoencoder network | |
CN115358437A (zh) | 基于卷积神经网络的供电负荷预测方法 | |
CN111697560B (zh) | 一种基于lstm预测电力系统负荷的方法及系统 | |
Han et al. | Deep belief rule based photovoltaic power forecasting method with interpretability | |
CN117522066A (zh) | 一种基于调峰电源设备组合预测的联合优化方法及系统 | |
CN111461565A (zh) | 一种电力调控下的电源侧发电性能评估方法 | |
CN111738483A (zh) | 基于聚类和深层信念网络的电网降损优化方法及系统 | |
Kıran et al. | Tree-seed programming for modelling of Turkey electricity energy demand | |
Xu et al. | Short-term electricity consumption forecasting method for residential users based on cluster classification and backpropagation neural network | |
CN114372558A (zh) | 基于多模型融合的居民用电负荷预测方法、介质及设备 | |
Wang et al. | Cloud computing and extreme learning machine for a distributed energy consumption forecasting in equipment-manufacturing enterprises | |
CN114240069A (zh) | 一种基于回归学习与特征挖掘的电网在线风险计算方法 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
Zhai et al. | Combining PSO-SVR and Random Forest Based Feature Selection for Day-ahead Peak Load Forecasting. | |
Bin et al. | Simple and effective fault diagnosis method of power lithium-ion battery based on GWA-DBN | |
CN114234392B (zh) | 一种基于改进pso-lstm的空调负荷精细预测方法 | |
Qian et al. | Deep learning-based short-term wind power prediction considering various factors | |
CN116611911A (zh) | 基于支持向量机的信用风险预测方法及装置 | |
CN116500480A (zh) | 一种基于特征迁移学习混合模型的智能电池健康监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |