CN116595445A - 基于随机森林特征优选和改进支持向量机的变压器故障诊断方法 - Google Patents
基于随机森林特征优选和改进支持向量机的变压器故障诊断方法 Download PDFInfo
- Publication number
- CN116595445A CN116595445A CN202310415308.1A CN202310415308A CN116595445A CN 116595445 A CN116595445 A CN 116595445A CN 202310415308 A CN202310415308 A CN 202310415308A CN 116595445 A CN116595445 A CN 116595445A
- Authority
- CN
- China
- Prior art keywords
- svm
- value
- feature
- function
- transformer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 30
- 238000005457 optimization Methods 0.000 title claims abstract description 29
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 17
- 230000006870 function Effects 0.000 claims abstract description 73
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 238000012360 testing method Methods 0.000 claims abstract description 8
- 238000012163 sequencing technique Methods 0.000 claims abstract description 7
- 239000003921 oil Substances 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 241000254173 Coleoptera Species 0.000 claims description 37
- 238000003066 decision tree Methods 0.000 claims description 23
- 239000007789 gas Substances 0.000 claims description 10
- 230000009977 dual effect Effects 0.000 claims description 8
- 230000006872 improvement Effects 0.000 claims description 8
- 238000013021 overheating Methods 0.000 claims description 5
- 238000010845 search algorithm Methods 0.000 claims description 4
- 239000004215 Carbon black (E152) Substances 0.000 claims description 3
- 241001481710 Cerambycidae Species 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 229930195733 hydrocarbon Natural products 0.000 claims description 3
- 150000002430 hydrocarbons Chemical class 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims 2
- 239000012535 impurity Substances 0.000 claims 2
- 238000003491 array Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 description 7
- 230000002411 adverse Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004868 gas analysis Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/12—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing
- G01R31/1227—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/12—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing
- G01R31/1227—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials
- G01R31/1263—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials of solid or fluid materials, e.g. insulation films, bulk material; of semiconductors or LV electronic components or parts; of cable, line or wire insulation
- G01R31/1281—Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing of components, parts or materials of solid or fluid materials, e.g. insulation films, bulk material; of semiconductors or LV electronic components or parts; of cable, line or wire insulation of liquids or gases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,选取多种油中溶解气体,生成多维DGA待选特征集;对所有已获得的DGA待选特征集归一化预处理;对随机森林RF参数进行设置,并训练随机森林RF模型,输出多维DGA待选特征量的平均值基尼指标下降MDG值并排序;结合MDG值,SVM对待选特征量优选;设置BAS参数;通过训练集来对SVM中的惩罚因子及核函数进行寻优改进,建立BAS‑SVM变压器DGA故障诊断模型;引入测试集到建立的BAS‑SVM变压器DGA故障诊断模型中,输出对应的故障类型。本发明方法通过随机森林RF对待选特征量进行优选,去除冗余信息,BAS算法对SVM的惩罚因子和核函数进行寻优,加强SVM的全局搜索能力,提高了对变压器故障诊断的准确性。
Description
技术领域
本发明涉及变压器故障诊断技术领域,具体涉及一种基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法。
背景技术
变压器是供电系统的关键设备之一,保证变压器安全平稳的工作是保证供电正常工作和电源安全可靠的前提。而在变压器的实际运行中,电力系统因各种原因导致的突发故障以及变压器自身的设备老化问题,都会对变压器的运行造成严重的不良影响,当这种影响对设备造成的损害达到一定的程度,就会造成变压器的运行故障发生。
目前对于变压器故障诊断国内外学者已经做出了一定的研究,考虑到故障数据获取的便捷性以及故障数据反映真实故障状态的能力,通常采用油中溶解气体分析DGA技术来提取变压器的故障主要特征信息,该方法可以更好的反映故障的实际情况。
传统的DGA方式虽然并不依赖于大量的样本训练,不过由于如今的变压器工作条件已经越来越复杂,在复杂工作下冗余的特征信号会对变压器的故障诊断产生不良影响,从而大大地降低了诊断的准确性。在诊断方面,深度神经网络、贝叶斯网络、极限学习机被广泛用作电力变压器的诊断方法,但这些算法也受到自身的限制,如人工神经网络等可能容易发生局部最优解的情况;而贝叶斯网络的先验概率模型也很容易使得分类与判断时产生一定错误;极限学习机具有较快速的机器学习功能,但安全性不足。
发明内容
为解决现有技术中变压器故障诊断冗余信息过多、分类效果不佳的问题。本发明提供一种基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,通过随机森林RF对待选特征量进行优选,去除冗余信息,BAS算法对SVM的惩罚因子和核函数进行寻优,加强支持向量机SVM的全局搜索能力,提高变压器故障诊断精度。
本发明采取的技术方案为:
基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,包括以下步骤:
步骤1:选取多种油中溶解气体,生成多维DGA待选特征集;
步骤2:预处理步骤1生成的DGA待选特征集,对所有已获得的DGA待选特征集归一化,用训练集和测试集进行区分;
步骤3:对随机森林RF参数进行设置,并训练随机森林RF模型,输出多维DGA待选特征量的平均值基尼指标下降MDG值并排序;
步骤4:结合得到的平均值基尼指标下降MDG值,SVM对待选特征量优选;
步骤5:设置天牛须搜索算法BAS的迭代次数,空间维度,初始位置的范围;
步骤6:通过训练集来对SVM中的惩罚因子及核函数进行寻优改进,建立BAS-SVM变压器DGA故障诊断模型;
步骤7:引入测试集到步骤6建立的BAS-SVM变压器DGA故障诊断模型中,输出对应的故障类型。
所述步骤1中,定义了7种不同的变压器运行状态:正常(normal,N)、低能放电(lowenergy discharge,LED)、高能放电(high energy discharge,HED)、局部放电(partialdischarge,PD)、中低温过热(thermal fault of low and medium temperature,LMT)、高温过热(thermal fault of high temperature,HT)、放电兼过热(Discharge andoverheating,DAO);
以5种DGA诊断气体:H2、CH4、C2H6、C2H4、C2H2,总烃THC为基础,共生成22维待选输入特征量。
所述步骤3中,随机森林RF对输入特征量的平均值基尼不纯度GI进行计算,得到平均值基尼指标下降(Mean Decrease in Gini,MDG)指标,通过平均值基尼指标下降判断节点的不纯度以衡量特征信息的重要程度,根据MDG值即可对优选结果做出判断。
假定获得的故障样本(xj,yj)的数量为D个,j=1,2,3...W;
其中:xj代表变压器设备的W维输入特征量,yj代表故障类型,为训练样本的输出值;在计算输入特征量xj的重要度时,以一棵决策树i为起始节点,计算xj在第i课决策树的GI值:
通过计算随机森林RF中每棵决策树对应的GI值并取平均值,得到MDG值,就能够得到输入特征量xj的重要性。
式中,N为决策树的数量,输入特征量的MDG值越大,重要程度越高。
所述步骤4包括以下步骤:
步骤4.1:通过引入松弛变量ξj以及惩罚因子C后,得到SVM最小化优化模型,SVM最小化优化模型的目标函数和约束条件为:
式中,M(xj)为输入特征量xj的MDG值;b为偏置;ω为权重向量;C表示惩罚因子;ξj表示松弛变量;
步骤4.2:运用对偶基本原理,引入拉格朗日函数以及乘子αj,得到SVM的对偶问题优化模型:
Q(α)表示拉格朗日函数;αi表示拉格朗日乘子;yj代表故障类型;M(xi)为输入特征量xi的MDG值;i表示第i课决策树;
由K-T条件可得,αj需满足:
αj[yj(ωM(xj)+b)-1+ξj]=0;
当αj≠0时,满足对应样本为支持向量。
对上述问题求解后的最优分类函数表示为:
式中,K(xi,xj)表示核函数,本发明采用高斯核函数(radial basis function,RBF)。RBF表达式为:
K(xi,xj)=exp(-h||xi-xj||2)h<0;
式中,h为核函数。
步骤4.3:得到MDG值结合SVM对待选特征量优选,具体如下:
通过RF对信息集中进行优选,设置RF的决策树数量为N=300,对22维特征量的重要度进行排序,
假定获得的22维特征量样本(xj,yj)的数量为D个,j=1,2,3...W,其中xj代表变压器设备的W维输入特征,yj代表故障类型,为训练样本的输出值。在计算特征信息xj的重要度时,以一棵决策树i为起始节点,计算xj在第i课决策树的GI值:
通过计算RF中每棵决策树对应的GI值并取平均值,得到MDG值,就可以得到特征信息xj的重要性:
式中,N为决策树的数量N=300,设置。输入量的MDG值越大,重要程度越高。
在排序的基础上,将故障样本输入SVM模型中,运用对偶基本原理,引入拉格朗日函数以及乘子αj,得到SVM的对偶问题优化模型:
Q(α)表示拉格朗日函数,αi表示拉格朗日乘子,yj代表故障类型,M(xi)为输入特征量,xi的MDG值,i表示第i课决策树。
由K-T条件可得,αj需满足:
αj[yj(ωM(xj)+b)-1+ξj]=0;
当αj≠0时,满足对应样本为支持向量。
对上述问题求解后的最优分类函数表示为:
式中,K(xi,xj)表示核函数,本发明采用高斯核函数(radial basis function,RBF)。RBF表达式为:
K(xi,xj)=exp(-h||xi-xj||2)h<0;
式中,h为核函数。
通过SVM模型对排序后22维的特征量进行故障诊断,得到最终的特征量优选结果。所述步骤5中,建立BAS算法模型,包括如下步骤:
S5.1:建立天牛须的随机变量,并做归一化数据处理:
式中,k为空间维度;rands(k,1)随机生成一个k行1列的矩阵,且其中的各元素范围在-1到1之间。
S5.2:经过第t次迭代后,左右天牛须的空间坐标表示为:
式中,xlt和xrt分别为左右天牛须第t次迭代时的坐标,d0表示触须的间距,x为质心位置。表示随即单位向量;n表示迭代次数;
S5.3:设适应度函数为f(),则左右触须的最适应度函数值分别为:
f(xr)表示右触须的适应度函数;f(xl)表示左触须的适应度函数;fright表示右触须的适应度函数值;fleft表示左触须的适应度函数值;
S5.4:天牛的空间位置表示为:
式中,sign()表示符号函数,δt为第t次迭代时的步长因子;xt-1表示第t-1次迭代时天牛须的位置;xt表示第t次迭代时天牛须的位置;
所述步骤5:设置天牛须搜索算法BAS的迭代次数,空间维度,初始位置的范围:
设置空间维度K=10,最大迭代次数E=100,惩罚因子C和核函数h从[0.01,1000]随机选取。
所述步骤6中,BAS-SVM变压器DGA故障诊断模型,故障诊断流程包括如下步骤,如图6所示:
S6.1、构建天牛须随机朝向向量,定义空间维度k;
S6.2、设置算法的步长因子δ,其表达式为:
δt=δt-1·eta(t=0,1,2,…,n);
式中,eta取[0,1]之间靠近1的值,本发明取eta=0.95。
δt表示第t次迭代时的步长因子δt-1表示第t-1次迭代时的步长因子t表示迭代次数n表示第n次迭代;
S6.3、设置适应度评价函数:
式中:N为训练样本数;tsim(i)为第i个样本输出值;yi为第i个样本的实际值。
S6.4、重新定义天牛须位置:从[-0.5,0.5]中随机选取一个数字设点为新的天牛须起始点,并将新的起始点输入bestX进行存储;再计算新的起始点适应度,将新的函数值输入bestY进行储存;最后,对新的左右天牛须坐标进行确定;
S6.5、更新bestX和bestY:通过f(xr)和f(xl)计算得到左右天牛须的位置,接着对SVM的惩罚因子C和核函数h更新,同时利用计算实时记录bestX和bestY,其中:
bestX表示天牛的位置,bestY表示适应度函数值;
S6.6、迭代停止:如果计算得到的适应度函数值与预设的精度条件相一致,则执行S6.7,否则,返回S6.4进一步对天牛须位置更新。
S6.7、得到最优解:最优解即为支持向量机优化的惩罚因素C和核函数h。
所述步骤7中,故障类型包括正常(N)、低能放电(LED)、高能放电(HED)、局部放电(PD)、中低温过热(LMT)、高温过热(HT)、放电兼过热(DAO)。
本发明一种基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,技术效果如下:
1)本发明利用随机森林RF算法,可以有效地处理具有冗余数据的高维特征输入样本,并能够评估变压器故障类型的各个特征在分类问题上的重要性,实现重要度排序。
2)本发明方法通过随机森林RF对待选特征量进行优选,去除冗余信息,BAS算法对SVM的惩罚因子和核函数进行寻优,加强SVM的全局搜索能力,提高了对变压器故障诊断的准确性。
3)通过仿真结果表明,BAS-SVM故障诊断模型对比PSO-SVM和ABC-SVM,故障诊断准确率分别高出5.55%和8.89%,诊断用时相对减少了3.64和1.62秒。验证了本发明的有效性和可行性。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为变压器故障诊断流程图。
图2为特征量重要度评分及分类准确率图。
图3为适应度曲线变化趋势图。
图4为感应取能系统结构图。
图5为BAS-SVM故障诊断结果图。
图6为BAS-SVM故障诊断流程图。
具体实施方式
基于随机森林特征优选和改进支持向量机的变压器故障诊断方法,包括以下步骤:
S1、构建天牛须随机朝向向量,定义空间维度k;
S2、设置算法的步长因子δ,其表达式为:
δt=δt-1·eta(t=0,1,2,…,n);
式中,eta取[0,1]之间靠近1的值,本发明取eta=0.95。
δt表示第t次迭代时的步长因子;δt-1表示第t-1次迭代时的步长因子;表示迭代次数;n表示第n次迭代;
S3、设置适应度评价函数:
式中:N为训练样本数;tsim(i)为第i个样本输出值;yi为第i个样本的实际值。
S4、重新定义天牛须位置:从[-0.5,0.5]中随机选取一个数字设点为新的天牛须起始点,并将新的起始点输入bestX进行存储;再计算新的起始点适应度,将新的函数值输入bestY进行储存;最后,对新的左右天牛须坐标进行确定;
S5、更新bestX和bestY:通过f(xr)和f(xl)计算得到左右天牛须的位置,接着对SVM的惩罚因子C和核函数h更新,同时利用计算实时记录bestX和bestY。其中:bestX表示天牛的位置;bestY表示适应度函数值;
S6、迭代停止:如果计算得到的适应度函数值与预设的精度条件相一致,则执行S7,否则,返回S4进一步对天牛须位置更新。
S7、得到最优解:最优解即为支持向量机优化的惩罚因素C和核函数h。
表1输入气体待选特征量
表1是输入气体待选特征量,本发明定义了7种不同的变压器运行状态:正常(normal,N)、低能放电(low energy discharge,LED)、高能放电(high energy discharge,HED)、局部放电(partial discharge,PD)、中低温过热(thermal fault of low andmedium temperature,LMT)、高温过热(thermal fault of high temperature,HT)、放电兼过热(Discharge and overheating,DAO)。通过常见的5种DGA诊断气体(H2、CH4、C2H6、C2H4、C2H2)、总烃THC为基础,共生成22种特征气体建立待选特征集。
图1是变压器故障诊断流程图。其诊断流程如下:
(1)以相关比值法构造故障特征的方法为基础,选取5种典型的油中溶解气体生成22维DGA待选输入量;
(2)预处理生成的待选特征集,对所有已获得的数据集归一化,用训练集和测试集进行区分;
(3)对RF参数进行设置,通过得到的样本训练RF模型,输出22维待选特征量的MDG值并排序;
(4)结合得到的MDG值,SVM对待选特征量优选;
(5)设置BAS的迭代次数,空间维度,初始位置的范围;
(6)通过训练集来对BAS-SVM进行寻优的方式,来建立BAS-SVM变压器DGA故障诊断模型;
(7)引入测试集到DGA故障诊断模型中,输出对应的故障类型。
由表1所确定的22维变压器故障待选特征,建立需要的DGA故障特征数据库,通过对得到的数据进行归一化处理,可以避免信息冗余的现象,并通过RF对已处理过的信息集中进行优选,设置RF的决策树数量为N=300,22维特征量的重要度和不同输入特征子集数量时的分类准确率如图2所示。
由图2可以得到,当输入特征量的维数较少时,诊断模型将无法获得特征量的关键信息,准确率降低;随着输入特征数量的逐渐增多,准确率也随之提高,峰值为82.38%,此时的输入特征量达到10个。当输入特征量上升至16个时,准确率开始降低,但继续增加后又趋于平稳,在20个特征量全部输入后准确率为77.67%,这说明了在特征量增加到一定个数带来的冗余信息对模型的分类性能产生了一定的负面影响。
通过图2的结果,选择RF排序后的前10种特征作为本飞发明诊断模型的最优输入特征。定义样本诊断准确率为:
式中,Nright表示正确诊断的样本总数;Nall表示测试样本总数。通过上式来验证优选出的10维特征相较于传统DGA数据、无编码比值法、以及三比值法的有效性,具体情况见表2所示。
表2不同特征选择方法的诊断准确率
由表2可知,三比值法、无编码比值法、常用DGA数据、RF特征优选出的10维特征量的总样本准确率分别为60.95%、76.05%、57.76%、82.38%。其中优选后的特征针对HED故障,诊断准确率为100%,证明了待选特征量在经过RF特征优选方案后对于提高故障诊断的准确率具有很显著的效果。
BAS算法通过对SVM中的核函数与惩罚因子优化,可以提高诊断模型的准确率。通过BAS-SVM诊断模型对上述的10种输入特征量进行诊断,对模型中的各项参数进行设置:空间维度K=10,最大迭代次数E=100,惩罚因子C和核函数h从[0.01,1000]随机选取。其适应度变化曲线如图3所示。BAS-SVM的诊断结果如图4所示。
由图3可得,两条适应度曲线都随迭代次数的增加而收敛,其中最佳适应度在第20次达到最优。由图4可得,相较于表2的故障诊断准确率82.38%,经过BAS算法参数优化的SVM模型的准确率达到了92.22%,提高了9.84%。
为验证本发明所研究的BAS-SVM算法的优势,将上述优选的10维特征变量分别用于其它主流的SVM故障诊断方法,本发明采用粒子群极限学习机(PSO-SVM)和蜂群极限学习机(ABC-SVM)进行对比实验,三种算法对应的适应度曲线变化如图5所示。由图5可知,3种方法的对比中,BAS-SVM的收敛速度与寻优能力相较于其他两种算法都有明显的优势。3种算法的诊断准确率与运行时间对比如表3所示。
表3 3种改进的SVM智能算法的性能对比
由上表3可知,对相同的故障集样本,BAS-SVM的诊断用时更少,准确率得到提升,其中,对LED和PD的故障诊断准确率均达到了100%。
Claims (8)
1.基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于,包括以下步骤:
步骤1:选取多种油中溶解气体,生成多维DGA待选特征集;
步骤2:预处理步骤1生成的DGA待选特征集,对所有已获得的DGA待选特征集归一化,用训练集和测试集进行区分;
步骤3:对随机森林RF参数进行设置,并训练随机森林RF模型,输出多维DGA待选特征量的平均值基尼指标下降MDG值并排序;
步骤4:结合得到的平均值基尼指标下降MDG值,SVM对待选特征量优选;
步骤5:设置天牛须搜索算法BAS的迭代次数,空间维度,初始位置的范围;
步骤6:通过训练集来对SVM中的惩罚因子及核函数进行寻优改进,建立BAS-SVM变压器DGA故障诊断模型;
步骤7:引入测试集到步骤6建立的BAS-SVM变压器DGA故障诊断模型中,输出对应的故障类型。
2.根据权利要求1所述基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于:所述步骤1中,定义了7种不同的变压器运行状态:正常、低能放电、高能放电、局部放电、中低温过热、高温过热、放电兼过热;
以5种DGA诊断气体:H2、CH4、C2H6、C2H4、C2H2,总烃THC为基础,共生成22维待选输入特征量。
3.根据权利要求1所述基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于:所述步骤3中,随机森林RF对输入特征量的平均值基尼不纯度GI进行计算,得到平均值基尼指标下降指标,通过平均值基尼指标下降判断节点的不纯度以衡量特征信息的重要程度,根据MDG值即可对优选结果做出判断;
设获得的故障样本(xj,yj)的数量为D个,j=1,2,3...W;
其中:xj代表变压器设备的W维输入特征量,yj代表故障类型,为训练样本的输出值;在计算输入特征量xj的重要度时,以一棵决策树i为起始节点,计算xj在第i课决策树的GI值:
通过计算随机森林RF中每棵决策树对应的GI值并取平均值,得到MDG值,就能够得到输入特征量xj的重要性;
式中,N为决策树的数量,输入特征量的MDG值越大,重要程度越高。
4.根据权利要求1所述基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于:所述步骤4包括以下步骤:
步骤4.1:通过引入松弛变量ξj以及惩罚因子C后,得到SVM最小化优化模型,SVM最小化优化模型的目标函数和约束条件为:
式中,M(xj)为输入特征量xj的MDG值;b为偏置;ω为权重向量;C表示惩罚因子;ξj表示松弛变量;
步骤4.2:运用对偶基本原理,引入拉格朗日函数以及乘子αj,得到SVM的对偶问题优化模型:
Q(α)表示拉格朗日函数;αi表示拉格朗日乘子;yj代表故障类型;M(xi)为输入特征量xi的MDG值;i表示第i课决策树;
由K-T条件可得,αj需满足:
αj[yj(ωM(xj)+b)-1+ξj]=0;
当αj≠0时,满足对应样本为支持向量;
对上述问题求解后的最优分类函数表示为:
式中,K(xi,xj)表示核函数,采用高斯核函数(radial basis function,RBF);RBF表达式为:
K(xi,xj)=exp(-h||xi-xj||2)h<0;
式中,h为核函数;
步骤4.3:得到MDG值结合SVM对待选特征量优选,具体如下:
通过RF对信息集中进行优选,设置RF的决策树数量为N=300,对22维特征量的重要度进行排序,
设获得的22维特征量样本(xj,yj)的数量为D个,j=1,2,3...W,其中xj代表变压器设备的W维输入特征,yj代表故障类型,为训练样本的输出值;在计算特征信息xj的重要度时,以一棵决策树i为起始节点,计算xj在第i课决策树的GI值:
通过计算RF中每棵决策树对应的GI值并取平均值,得到MDG值,就可以得到特征信息xj的重要性:
式中,N为决策树的数量N=300,设置;输入量的MDG值越大,重要程度越高;
在排序的基础上,将故障样本输入SVM模型中,运用对偶基本原理,引入拉格朗日函数以及乘子αj,得到SVM的对偶问题优化模型:
Q(α)表示拉格朗日函数,αi表示拉格朗日乘子,yj代表故障类型,M(xi)为输入特征量,xi的MDG值,i表示第i课决策树;
由K-T条件可得,αj需满足:
αj[yj(ωM(xj)+b)-1+ξj]=0;
当αj≠0时,满足对应样本为支持向量;
对上述问题求解后的最优分类函数表示为:
式中,K(xi,xj)表示核函数,采用高斯核函数(radial basis function,RBF);RBF表达式为:
K(xi,xj)=exp(-h||xi-xj||2)h<0;
式中,h为核函数;
通过SVM模型对排序后22维的特征量进行故障诊断,得到最终的特征量优选结果。
5.根据权利要求1所述基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于:所述步骤5中,建立BAS算法模型,包括如下步骤:
S5.1:建立天牛须的随机变量,并做归一化数据处理:
式中,k为空间维度;rands(k,1)随机生成一个k行1列的矩阵,且其中的各元素范围在-1到1之间;
S5.2:经过第t次迭代后,左右天牛须的空间坐标表示为:
式中,xlt和xrt分别为左右天牛须第t次迭代时的坐标,d0表示触须的间距,x为质心位置;表示随即单位向量;n表示迭代次数;
S5.3:设适应度函数为f(),则左右触须的最适应度函数值分别为:
f(xr)表示右触须的适应度函数;f(xl)表示左触须的适应度函数;fright表示右触须的适应度函数值;fleft表示左触须的适应度函数值;
S5.4:天牛的空间位置表示为:
式中,sign()表示符号函数,δt为第t次迭代时的步长因子;xt-1表示第t-1次迭代时天牛须的位置;xt表示第t次迭代时天牛须的位置。
6.根据权利要求1所述基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于:所述步骤5:设置天牛须搜索算法BAS的迭代次数,空间维度,初始位置的范围,具体如下:
设置空间维度K=10,最大迭代次数E=100,惩罚因子C和核函数h从[0.01,1000]随机选取。
7.根据权利要求1所述基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于:所述步骤6中,BAS-SVM变压器DGA故障诊断模型,故障诊断流程包括如下步骤:
S6.1、构建天牛须随机朝向向量,定义空间维度k;
S6.2、设置算法的步长因子δ,其表达式为:
δt=δt-1·eta(t=0,1,2,…,n);
式中,eta取[0,1]之间靠近1的值;
δt表示第t次迭代时的步长因子δt-1表示第t-1次迭代时的步长因子t表示迭代次数n表示第n次迭代;
S6.3、设置适应度评价函数:
式中:N为训练样本数;tsim(i)为第i个样本输出值;yi为第i个样本的实际值;
S6.4、重新定义天牛须位置:从[-0.5,0.5]中随机选取一个数字设点为新的天牛须起始点,并将新的起始点输入bestX进行存储;再计算新的起始点适应度,将新的函数值输入bestY进行储存;最后,对新的左右天牛须坐标进行确定;
S6.5、更新bestX和bestY:通过f(xr)和f(xl)计算得到左右天牛须的位置,接着对SVM的惩罚因子C和核函数h更新,同时利用计算实时记录bestX和bestY,其中:bestX表示天牛的位置,bestY表示适应度函数值;
S6.6、迭代停止:如果计算得到的适应度函数值与预设的精度条件相一致,则执行S6.7,否则,返回S6.4进一步对天牛须位置更新;
S6.7、得到最优解:最优解即为支持向量机优化的惩罚因素C和核函数h。
8.根据权利要求1所述基于随机森林RF特征优选和改进支持向量机SVM的变压器故障诊断方法,其特征在于:所述步骤7中,故障类型包括正常、低能放电、高能放电、局部放电、中低温过热、高温过热、放电兼过热。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310415308.1A CN116595445A (zh) | 2023-04-17 | 2023-04-17 | 基于随机森林特征优选和改进支持向量机的变压器故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310415308.1A CN116595445A (zh) | 2023-04-17 | 2023-04-17 | 基于随机森林特征优选和改进支持向量机的变压器故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116595445A true CN116595445A (zh) | 2023-08-15 |
Family
ID=87599844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310415308.1A Pending CN116595445A (zh) | 2023-04-17 | 2023-04-17 | 基于随机森林特征优选和改进支持向量机的变压器故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116595445A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117150374A (zh) * | 2023-10-27 | 2023-12-01 | 国网江西省电力有限公司电力科学研究院 | 一种基于特征重要性排序的变压器故障辨识方法及系统 |
CN117349786A (zh) * | 2023-09-11 | 2024-01-05 | 国网湖北省电力有限公司宜昌供电公司 | 基于数据均衡的证据融合变压器故障诊断方法 |
CN117454140A (zh) * | 2023-11-09 | 2024-01-26 | 西北农林科技大学 | 一种变压器绕组故障分类方法、装置、设备和介质 |
-
2023
- 2023-04-17 CN CN202310415308.1A patent/CN116595445A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349786A (zh) * | 2023-09-11 | 2024-01-05 | 国网湖北省电力有限公司宜昌供电公司 | 基于数据均衡的证据融合变压器故障诊断方法 |
CN117150374A (zh) * | 2023-10-27 | 2023-12-01 | 国网江西省电力有限公司电力科学研究院 | 一种基于特征重要性排序的变压器故障辨识方法及系统 |
CN117454140A (zh) * | 2023-11-09 | 2024-01-26 | 西北农林科技大学 | 一种变压器绕组故障分类方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116595445A (zh) | 基于随机森林特征优选和改进支持向量机的变压器故障诊断方法 | |
CN110596492B (zh) | 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法 | |
CN111444247B (zh) | 一种基于kpi指标的根因定位方法、装置及存储介质 | |
CN112116058B (zh) | 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 | |
CN111598150B (zh) | 一种计及运行状态等级的变压器故障诊断方法 | |
CN111722046B (zh) | 一种基于深度森林模型的变压器故障诊断方法 | |
CN107784325A (zh) | 基于数据驱动增量融合的螺旋式故障诊断模型 | |
CN105930901A (zh) | 一种基于rbpnn的变压器故障诊断方法 | |
US20210334658A1 (en) | Method for performing clustering on power system operation modes based on sparse autoencoder | |
CN112147432A (zh) | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统 | |
CN109145948A (zh) | 一种基于集成学习的注塑机堵料异常检测方法 | |
CN111340248A (zh) | 一种基于智能集成算法的变压器故障诊断方法及系统 | |
CN116010884A (zh) | 基于主成分分析的SSA-LightGBM油浸式变压器的故障诊断方法 | |
CN115577639A (zh) | 基于麻雀搜索法优化支持向量机的变压器故障诊断方法 | |
CN117272116B (zh) | 一种基于loras平衡数据集的变压器故障诊断方法 | |
CN114372693B (zh) | 一种基于云模型和改进ds证据理论的变压器故障诊断方法 | |
CN113949549B (zh) | 一种面向入侵和攻击防御的实时流量异常检测方法 | |
CN112748372A (zh) | 一种人工蜂群优化极限学习机的变压器故障诊断方法 | |
CN116562114A (zh) | 一种基于图卷积神经网络的电力变压器故障诊断方法 | |
Hallaji et al. | Detection of malicious SCADA communications via multi-subspace feature selection | |
CN116306226B (zh) | 一种燃料电池性能退化预测方法 | |
CN111275204B (zh) | 一种基于混合采样和集成学习的变压器状态识别方法 | |
CN117235565A (zh) | 一种变压器故障诊断模型构建方法和装置 | |
CN109116833B (zh) | 基于改进果蝇-蝙蝠算法的机械故障诊断方法 | |
CN110851959A (zh) | 一种融合深度学习和分位数回归的风速区间预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |