CN110097297B - 一种多维度窃电态势智能感知方法、系统、设备及介质 - Google Patents
一种多维度窃电态势智能感知方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN110097297B CN110097297B CN201910423619.6A CN201910423619A CN110097297B CN 110097297 B CN110097297 B CN 110097297B CN 201910423619 A CN201910423619 A CN 201910423619A CN 110097297 B CN110097297 B CN 110097297B
- Authority
- CN
- China
- Prior art keywords
- electricity
- data
- power
- stealing
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 277
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 93
- 238000003745 diagnosis Methods 0.000 claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 17
- 238000012216 screening Methods 0.000 claims abstract description 12
- 230000008901 benefit Effects 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims description 34
- 230000002159 abnormal effect Effects 0.000 claims description 28
- 230000001932 seasonal effect Effects 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 13
- 238000007477 logistic regression Methods 0.000 claims description 13
- 238000007689 inspection Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013139 quantization Methods 0.000 claims description 10
- 230000002441 reversible effect Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 8
- 230000007423 decrease Effects 0.000 claims description 7
- 238000000819 phase cycle Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 230000003068 static effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000007613 environmental effect Effects 0.000 claims description 5
- 230000003442 weekly effect Effects 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000003754 machining Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 15
- 239000013598 vector Substances 0.000 description 9
- 238000010276 construction Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 230000002265 prevention Effects 0.000 description 6
- 238000003064 k means clustering Methods 0.000 description 5
- 230000007123 defense Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000012821 model calculation Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种多维度窃电态势智能感知方法,包括步骤:基于不同系统获取不同地区典型行业用户的电力原始数据;构造不同典型行业用户的聚类因子,通过聚类算法对电力原始数据分析,生成典型行业的用电特征曲线,建立典型行业用电矩阵化数据集;构建初始特征,对电力原始数据中对应特征量进行选择及提取,生成反窃电专家样本库;以典型行业用电矩阵化数据集与反窃电专家样本库为基础,构建反窃电诊断模型;对典型行业用户的电力原始数据进行筛选,再输入至反窃电诊断模型以分析用户的窃电情况。本发明还相应公开了一种与上述方法相对应的系统、介质及设备。本发明的方法、系统、设备及介质均具有快速精准识别窃电用户等优点。
Description
技术领域
本发明主要涉及电力系统窃电检测技术领域,特指一种多维度窃电态势智能感知方法、系统、设备及介质。
背景技术
随着经济发展,社会用电需求不断增加,一些不法经营者、个体私营业主为谋取暴利,置国家法律、法规于不顾,不择手段地窃取国家电能,窃电问题成为困扰电力企业的一项难题。窃电行为不仅会对供电企业的经济利润造成重大流失,扰乱了正常的供电秩序,另外窃电分子的违规、不法操作可能会损坏供电设备,造成人员伤亡,给安全用电带来了严重威胁。随着科学技术的发展,窃电手段不断翻新,窃电案件出现设备智能化、行为隐蔽化、实施规模化、手段专业化、窃电职业化、宣传网络化的特点,窃电违法犯罪整体呈现蔓延和扩大趋势。窃电行为不仅损害了国家和电力经营企业的经济利益,还危及电网正常运行,阻碍电力工业正常发展。因此,窃电问题仍是一个亟待解决的难题。
在大数据时代背景下,基于各个系统所采集的大量电力数据,分析用户的统计数据,对计量、用电异常进行定位,将能极大地提高反窃电的效率。然而,目前基于营销业务应用系统、用电信息采集系统、一体化线损系统等的窃电态势技术研究还处于初步阶段,大多数选取功率或有功电量作为窃电判据中的电气参考量,对因窃电而引起的电气参量的变化规律分析不足,缺乏辨识窃电现象的理论依据。随着智能电能表“全覆盖、全采集、全费控”工程的逐步完成,实现了对所有供电用户的用电信息的实时采集和监控,结合气象和经济等多行业的数据监测和分析,为基于数据驱动的异常用电行为检测提供了基础。然而,所获取的海量数据中含有大量冗余信息,窃电行为识别模型的复杂性及硬件实现的复杂程度会随着特征空间维数的增加而快速增加,而且含有大量冗余信息的特征往往会对模型的识别性能产生很大影响。因此,研究开展客户侧窃电态势感知及智能预警关键技术研究,不仅具有明确的理论意义,也具有相当重要的应用价值。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种快速精准识别窃电用户的多维度窃电态势智能感知方法、系统、设备及介质。
为解决上述技术问题,本发明提出的技术方案为:
一种多维度窃电态势智能感知方法,包括步骤:
基于营销业务系统、用电信息采集系统、一体化电量及线损管理系统、季节性气象和社会经济信息,获取不同地区典型行业用户的历史电力原始数据;
构造不同典型行业用户的聚类因子,通过聚类算法对电力原始数据分析,生成典型行业的用电特征曲线,建立典型行业用电矩阵化数据集;
构建初始特征,对电力原始数据中对应特征量进行选择及提取,生成反窃电专家样本库;
以典型行业用电矩阵化数据集与反窃电专家样本库为基础,构建反窃电诊断模型;
对典型行业用户的电力原始数据进行筛选,再输入至反窃电诊断模型以分析用户的窃电情况。
作为上述技术方案的进一步改进:
通过功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数波动率、用电量变化率、线损波动、客户信用、气象特征或社会经济中的一种或多种构造聚类因子。
反窃电专家样本库的特征量包括电量趋势下降指标、功率与电流相关性指标、计量反极性指标、功率因数相关性指标、电流不平衡相关性指标、线损波动性指标、事件类指标、信用类指标或负载类指标中的一种或多种。
所述电量趋势下降指标的数据源为系统的电量数据;所述功率与电流相关性指标的数据源为三相三线的A、C相二次侧电流和三相四线中的三相二次侧电流;所述计量反极性指标的数据源为各系统的负荷数据;所述功率因数相关性指标的数据源为功率因数曲线和电流曲线;所述电流不平衡相关性指标的数据源为三相三线用户电流数据;所述线损波动性指标的数据源为线路日线损数据;所述事件类指标的数据源为事件数据,所述事件数据包括开盖事件或开箱事件或磁场干扰或相序异常或电表停电、上电记录或电能表倒走;所述信用类的数据源为营销系统信用记录数据;所述负载类指标的数据源为负荷数据和营销业务系统的用户容量数据。
初始特征包括初始静态特征、营销业务特征、用电基础特征、用电加工特征、异常事件或外部环境特征中的一种或多种;所述初始静态特征的特征量包括接线方式、供电方式、行业类别、用电性质或运行容量中的一种或多种;所述营销业务特征的特征量包括增减容、暂停、历年逾期欠费、计量故障或违窃记录中的一种或多种;所述用电基础特征的特征量包括有功功率、带时间无功功率、分相电压、分相电流或功率因数中的一种或多种;所述用电加工特征的特征量包括峰谷差、日用电波形、日平均用电量、月平均用电量、负载率、电流平衡率、电压平衡率或功率因数波动率中的一种或多种;所述异常事件的特征量包括开盖事件、开箱时间、恒定电磁干扰事件、相序异常或停上电事件中的一种或多种;所述外部环境特征的特征量包括气象信息或/和社会经济情况。
聚类算法包括K-means聚类算法或/和DBSCAN聚类算法中的一种或多种;以典型行业用电矩阵化数据集与反窃电专家样本库为基础,通过BP神经网络、XGBoost算法、逻辑回归算法或离群点算法中的一种或多种,构建反窃电诊断模型。
获取不同地区典型行业用户的历史电力原始数据,再对其进行预处理,所述预处理包括数据筛选、数据清洗和数据转换。
本发明还公开了一种多维度窃电态势智能感知系统,包括数据获取模块,用于基于营销业务系统、用电信息采集系统、一体化电量及线损管理系统、季节性气象和社会经济信息,获取不同地区典型行业用户的历史电力原始数据;
典型行业用电矩阵化数据集生成模块,用于构造不同典型行业用户的聚类因子,通过聚类算法对电力原始数据分析,生成典型行业的用电特征曲线,建立典型行业用电矩阵化数据集;
反窃电专家样本库生成模块,用于构建初始特征,对电力原始数据中对应特征量进行选择及提取,生成反窃电专家样本库;
反窃电诊断模型构建模块,用于以典型行业用电矩阵化数据集与反窃电专家样本库为基础,构建反窃电诊断模型;
数据处理模块,用于对典型行业用户的电力原始数据进行筛选,再输入至反窃电诊断模型以分析用户的窃电情况。
本发明进一步公开了一种移动介质设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述多维度窃电态势智能感知方法的步骤。
本发明进一步公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的多维度窃电态势智能感知方法的步骤。
与现有技术相比,本发明的优点在于:
本发明的多维度窃电态势智能感知方法,结合疑似窃电用户的基础数据、用电特性、客户信用、季节性用电量和线损波动数据,采用大数据挖掘技术,如BP神经网络、离群点算法等实现电力公司营销数据的融会贯通,挖掘用户窃电行为,降低用电检查人员工作强度,充分利用数据的关联信息,提升反窃电准确性;解决目前反窃电手段智能化水平低、防御技术单一的问题,通过反窃电主动防御技术等功能设计实现窃电分析、取证、鉴定一体化,提升反窃电智能化水平,提高稽查效率;基于深度动态反窃电诊断模型集,经过分析一段时间内的嫌疑用户具有相同的特征情况(行业、区域、用电类型、窃电手段等),通过大数据技术分析技术,实现对窃电嫌疑户进行概率推测和风险预警,精准识别窃电用户。
本发明的多维度窃电态势智能感知方法,能够快速、精准定位窃电用户,有效规范工作流程,提高查窃效率,降低查窃工作人员工作量,解放的人力资源。通过采集用电信息采集系统、营销业务应用系统等各种信息数据,进行典型用电行为的分析,构建反窃电预警模型,实现窃电预警准确率达到80%以上,并且减少人员操作和巡视,降低运营成本,及时发现窃电行为,减少窃电带来的损失。
本发明的多维度窃电态势智能感知方法,基于组合不同算法的优势,可以提高模型训练、应用的准确性;反窃电诊断模型需采用多种算法来分别分析,然后采用综合决策的方法给出用户判别结果。同时反窃电诊断模型根据现场反窃电查处反馈的结果定时自动开展自学习,并自动修改模型的内部参数,提高反窃电智能推演与风险预警评估效果。
本发明同时还提供了一种多维度窃电态势智能感知系统,移动介质设备及介质,均具有上述优点,在此不再赘述。
附图说明
图1为本发明的方法流程图。
图2为本发明的反窃电诊断模型框架图。
图3为本发明中电量均势示意图。
图4为本发明中电流与功率关系示意图。
图5为本发明中BP神经网络示意图。
图6为本发明中XGBoost算法示意图。
图7为本发明中逻辑回归算法示意图。
图8为本发明中用电量与线损率波动关系图。
图9为本发明中行业负荷特性图。
图10为本发明中季节性用电特性图。
图11为本发明中湿度与用电量相关性示意图。
具体实施方式
以下结合说明书附图和具体实施例对本发明作进一步描述。
如图1所示,本实施例的多维度窃电态势智能感知方法,包括步骤:
基于营销业务系统、用电信息采集系统、一体化电量及线损管理系统、季节性气象和社会经济信息,获取不同地区典型行业用户的历史电力原始数据;
构造不同典型行业用户的聚类因子,通过聚类算法对电力原始数据分析,生成典型行业的用电特征曲线,建立典型行业用电矩阵化数据集;
构建初始特征,对电力原始数据中对应特征量进行选择及提取,生成反窃电专家样本库;
以典型行业用电矩阵化数据集与反窃电专家样本库为基础,构建反窃电诊断模型;
对典型行业用户的电力原始数据进行筛选,再输入至反窃电诊断模型以分析用户的窃电情况。
本发明的多维度窃电态势智能感知方法,侧重点在于反窃电诊断模型的构建,结合疑似窃电用户的基础数据、用电特性、客户信用、季节性用电量和线损波动数据,采用大数据挖掘技术,如BP神经网络、离群点算法等实现电力公司营销数据的融会贯通,挖掘用户窃电行为,降低用电检查人员工作强度,充分利用数据的关联信息,提升反窃电准确性;解决目前反窃电手段智能化水平低、防御技术单一的问题,通过反窃电主动防御技术等功能设计实现窃电分析、取证、鉴定一体化,提升反窃电智能化水平,提高稽查效率;基于深度动态反窃电诊断模型集,经过分析一段时间内的嫌疑用户具有相同的特征情况(行业、区域、用电类型、窃电手段等),通过大数据技术分析技术,实现对窃电嫌疑户进行概率推测和风险预警,精准识别窃电用户。
另外,将预处理后的用户数据先与行业正常用电特征进行比较,筛选出相对于行业用电特性存在用电异常的用户,再把经过行业用电特征筛选的用户数据,与反窃电专家样本库进行比较,得出窃电嫌疑度较高的用户清单和嫌疑用户分析结果,并引用客户历史用电信用情况、季节性电量、线损情况等多维度窃电态势感知技术,对嫌疑用户进行研判,使输出结果更加准确。通过反窃电诊断模型计算得出的嫌疑用户清单,经过现场排后确认窃电情况。结合分析嫌疑用户的用电行为、客户信用、季节性电量、线损波动,对其发起风险预警分析,并形成预警分析结果和明细清单。
本实施例中,通过功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数波动率、用电量变化率、线损波动、客户信用、气象特征或社会经济中的一种或多种构造聚类因子。
本实施例中,反窃电专家样本库的特征量包括电量趋势下降指标、功率与电流相关性指标、计量反极性指标、功率因数相关性指标、电流不平衡相关性指标、线损波动性指标、事件类指标、信用类指标或负载类指标中的一种或多种。
本实施例中,电量趋势下降指标的数据源为系统的电量数据;功率与电流相关性指标的数据源为三相三线的A、C相二次侧电流和三相四线中的三相二次侧电流;计量反极性指标的数据源为各系统的负荷数据;功率因数相关性指标的数据源为功率因数曲线和电流曲线;电流不平衡相关性指标的数据源为三相三线用户电流数据;线损波动性指标的数据源为线路日线损数据;事件类指标的数据源为事件数据,事件数据包括开盖事件或开箱事件或磁场干扰或相序异常或电表停电、上电记录或电能表倒走;信用类的数据源为营销系统信用记录数据;负载类指标的数据源为负荷数据和营销业务系统的用户容量数据。
本实施例中,初始特征包括初始静态特征、营销业务特征、用电基础特征、用电加工特征、异常事件或外部环境特征中的一种或多种;初始静态特征的特征量包括接线方式、供电方式、行业类别、用电性质或运行容量中的一种或多种;营销业务特征的特征量包括增减容、暂停、历年逾期欠费、计量故障或违窃记录中的一种或多种;用电基础特征的特征量包括有功功率、带时间无功功率、分相电压、分相电流或功率因数中的一种或多种;用电加工特征的特征量包括峰谷差、日用电波形、日平均用电量、月平均用电量、负载率、电流平衡率、电压平衡率或功率因数波动率中的一种或多种;异常事件的特征量包括开盖事件、开箱时间、恒定电磁干扰事件、相序异常或停上电事件中的一种或多种;外部环境特征的特征量包括气象信息或/和社会经济情况。
本实施例中,聚类算法包括K-means聚类算法或/和DBSCAN聚类算法中的一种或多种;以典型行业用电矩阵化数据集与反窃电专家样本库为基础,通过BP神经网络、XGBoost算法、逻辑回归算法或离群点算法中的一种或多种,构建反窃电诊断模型。由于不同行业的用电特性存在着一定的差异性,仅通过单个算法并不能表征窃电数据的所有特征,基于组合不同算法的优势,可以提高模型训练、应用的准确性;反窃电诊断模型需采用多种算法来分别分析,然后采用综合决策的方法给出用户判别结果。同时反窃电诊断模型集需根据现场反窃电查处反馈的结果定时自动开展自学习,并自动修改模型的内部参数,提高反窃电智能推演与风险预警评估效果。
本实施例中,获取不同地区典型行业用户的历史电力原始数据,再对其进行预处理,预处理包括数据筛选、数据清洗和数据转换。用于建模的异常数据、缺项数据以及不准确数据的预处理是关键点。从营销业务应用系统、用电信息采集系统、一体化线损系统中抽取数据时,原始数据中存在着大量异常数据、缺项数据以及不准确数据,导致挖掘结果的偏差及模型评价的正确性,所以需要进行数据筛选、数据清洗、数据转换等数据预处理过程,保障用于建模数据的准确科学合理,确保典型行业用电矩阵化数据集及反窃电诊断模型的准确性。具体地,通过数据清洗的方式剔除掉营销业务应用系统的档案类数据中的异常因素,进而使得剩下的数据精简有效。通过数据清洗的方式剔除短时间内重复上报或者逻辑错误的采集事件,进而排除异常事件的影响;通过数据转换的方式将用电信息采集系统的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据的原始数据进行无量纲和归一化处理得到编码后的数据。当然,上述只是对预处理中的部分处理过程进行描述,并不对此进行限定,在其它实施例中,也可以根据实际需求进行增补。
下面结合一具体实施例对上述方法进行补充详细说明:
基于营销业务系统、用电信息采集系统、一体化电量及线损管理系统、季节性气象、社会经济等信息,对不同地区的典型行业,选择聚类因子和聚类算法选型,形成典型行业用电矩阵化数据集;下面对上述各名词及步骤进行详细说明:
(1)基于不同行业、地区建立典型行业用电矩阵化数据集
不同行业的用电特性,以及同一行业下不同用户由于规模、行业、地区等差异展现出用电特征也不同。典型行业用电矩阵化数据集的建立是探索典型行业的窃电特征的差异性、规律性、相关性以及趋势性的重要方法,同时也为反窃电诊断模型提供了重要的指标基础。
1)典型行业确定
典型行业是指窃电多发或者可能多发的行业,典型行业的构建和选择如下:
对历年违约窃电历史数据进行统计分析,按照案例数量进行排序,选择违约窃电分布较多的行业。
专家根据经验和窃电技术发展跟踪,选择当地反窃电重点行业作为典型行业。
典型行业分类需在营销系统行业分类的基础上,根据各地域行业用户的分布、负荷特征的相似性等对营销行业进行归并,构建适合的反窃电工作的行业分类,并与营销行业建立关联关系。例如:根据上述分析方法,根据行业上下级关系整理得出某一地区的如下窃电典型行业树,如下表1窃电行业分布表所示。
表1窃电行业分布表
2)聚类因子选择
为了反映典型行业日峰谷特征、工作日用电特征、季节性用电特征、客户信用特征、气象特征、社会经济信息;构造聚类因子包括:功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数、日用电量等特征作为聚类的因子。
其中典型行业聚类因子由两部分组成:
数据曲线作为聚类因子,通过聚类算法生成的不同行业的用电曲线,并且包含其特征所属类别建立的用电特征库。
多个用电特征值组合生成的聚类因子,所建立的特征库。该行业用电特征库的记录主要包括:平均功率、日功率波动率、三相不平衡率、负载率、功率因数波动率、用电量变化率、线损波动、客户信用、气象特征、社会经济和聚类后的类别。
对不同的聚类因子采取了相同的标准化处理,即:
上式中,Pi为i用户的不同的聚类因子。
3)聚类算法选型
基于已标准化的聚类因子,比较了不同的聚类算法在不同行业的实用性后,使用的主要聚类算法包括距离判定的K-means聚类算法和基于密度DBSCAN聚类算法。其中K-means聚类算法能够直观反映出不同行业的负荷特征,而DBSCAN聚类算法处理不同大小和不同形状的簇(一组数据对象的集合)等优点。通过聚类算法确定了不同行业的日、周、季节等不同维度的用电特征,从而构成了不同行业的用电特征曲线。其中K-means聚类算法属于无监督学习算法中的一种,根据特征之间的距离(常用欧式距离)作为聚类的准则,算法设计原理简单;需要设置一个参数K。DBSCAN聚类算法是一种基于密度的聚类算法,通过密度可达关系导出的最大密度相连的样本集合作为其一个类别,可发现任意形状的空间聚类;不需设置过多聚类参数。
4)典型行业用电矩阵化数据集
典型行业+地区:日峰谷用电特征,包括用电波形、峰谷差、负荷率等;
典型行业+地区:工作日休息日周用电特征,包括:周用电波形,波动率等;
典型行业+地区:季节性年用电特征,包括:年度用电波形、季节差、波动率等;
典型行业+地区:线损波动特征,包括:线损异常,波动率等;
典型行业+地区:客户信用特征;
典型行业+地区:气象与行业电量关联特征。包括:最高气温、最低气温、平均气温、总云量、日照时数、降水量、相对湿度;
典型行业+地区:行业社会经济特征,包括:高能耗行业、电费成本占企业成本比重较高行业。
本实施例中,初始特征构建、特征提取与选择、通过窃电数据特征量对其进行动态验证,生成反窃电专家样本库。基于不同分类算法的优化组合,建立反窃电诊断模型。具体如下:
(1)研究窃电特征量的构建与提取,生成反窃电专家库
专家样本库建立包括初始特征构建、特征提取与选择、生成反窃电专家样本库。
1)初始特征构建
专家特征库构建如下初始特征(表2所示)
表2初始特征构建
2)特征提取与选择
特征提取与选择,特征选择剔除不相关或者冗余的特征,减少无效特征的个数,减少模型训练的时间,提高模型的精确度。通过用采数据、营销数据、一体化线损数据构建的多维度特征向量,包括功率与电流相关性指标、开盖/开箱次数、线损变化率、信用评级等指标,需要进行对其进行处理才能作为反窃电诊断模型集的输入。经过对特征量的提取形成反窃电专家样本库,其中主要的特征量包括为:电量趋势下降、功率与电流相关性、计量反极性、功率因数相关性、电流不平衡相关性、线损波动性、事件类、信用类、负载类等10大类指标,主要的特征提取方法说明如下:
①电量趋势下降指标:电量趋势下降指标可以反应通过改变计量回路进行窃电的特征,作为模型的特征指标,
1)数据源:采集系统电量数据(剔除春节及长假数据)
2)提取方法:其量化公式为:
式中,kl为当天下降趋势指标,fi为当天电量,f1为前后几天电量,αi为权重,d为前后天数。
通过数据挖掘的方法进行特征量的提取。通过日电量曲线和下降趋势方法,进行用电量下降趋势分析,如图3所示。
②电流相关指标
分析‘采用电表接线板串接电阻等欠流法’进行窃电的用户具备以下电流特征:该类用户窃电后电流持续出现‘电流失流’特征。
1)数据源:
三相三线:A、C相二次侧电流
三相四线:A、B、C相二次侧电流
2)提取方法:电流失流:三相电流中任一相或两相小于启动电流,且其他相线负荷电流大于5%额定(基本)电流的工况称为失流。
三相三线:AC相中任一相电流小于0.5%额定(基本)电流,另一相电流不小于5%额定(基本)电流。
三相四线:任一相电流小于0.5%额定(基本)电流,另两相中至少一相电流不小于10%额定(基本)电流。
电流与功率之间是正相关关系:相同倍率下建立的电流与功率之间的线性回归系数是一致的。如图4(电流与功率关系)所示,从数据的平均值可以看出,平均电流相近时,平均功率存在较大的差异。从图上可以看出,功率相同时电流相差很大,表明虽然增加了用电,但是计量功率没有改变。
③计量反极性指标
分析“采用改变电压/电流回路接法等移相法”进行窃电的用户均具备以下负荷特征:对比窃电前后负荷特性,发现该类用户窃电后负荷持续出现‘功率反极性’特征。
1)数据源:采集系统负荷数据
2)提取方法:异常发生次数越多,该事件可靠性越高,将周期内发生异常点的占比作为模型的特征指标,其量化公式为:
式中,K为异常发生点数,Q为有效数据点数。
④功率因数相关性指标
对生产型的用户从电能计量装置上反映出来的有功和无功电量的比例是相对稳定的,窃电行为可能通过移相法改变有功、无功功率,改变功率因数,我们从曲线点功率因数对功率因数进行量化分析。
1)数据源:功率因数曲线、电流曲线
2)提取方法:计量方式三相三线和三相四线的用户,以功率因数曲线和电流曲线数据进行分析,分析量化过程如下:功率因数与电流波动率相关性的量化公式为:
式中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差,X为电流波动率,Y为功率因数。协方差Cov(X,Y)为:
式中,表示电流波动率的平均值,/>表示功率因数平均值。
⑤电流不平衡相关性指标
三相负荷平衡才能保证用户的电能质量,是安全供电的基础,是节约能耗、降损降价的基础,但是存在通过移相法等窃电方法对某相施加影响导致三相不平衡的情况。
1)数据源:三相三线用户电流数据
注:三相四线用户存在较多三相不平衡用电现象,暂时剔除,并剔除低负载情形下的数据扰动干扰。
2)提取方法:分析量化过程如下:
a)电流不平衡度是表征某一时间点分相负载的情况,X为三相不平衡率,其量化公式为:
X=max(In-Ip)/Ip (6)
式中,In为分相电流,Ip为三相电流平均值。
b)负荷率是指用户运行功率与其运行容量之比,量化公式为:
Y=S/Se (7)
式中,S为某一点有功功率(kW);Se为运行容量(kW);Y为负荷率。
c)对一个用户来说,生产一般具备连续性和相似性,在一定的负载水平内三相电流呈现相关系数,量化公式为:
式中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差,X为电流不平衡率,Y为负荷率。其中
式中,Cov(X,Y)表示协方差,表示电流不平衡度平均值,/>表示负荷率平均值。
⑥线损波动性指标
线损率是用于衡量供电线路的损失比例,可作为用户线损率的参考值,若用户发生窃电,则分析周期内的线损率会上升。
1)数据源:线路日线损数据;
2)判定规则:由于用户的用电量存在波动,单纯以当天的线损率上升作为窃电特征则误差过大,所以考虑前后N天的线损率平均值,判断其增长率是否大于阀值K,若线损率的增加大于阀值K,则具有窃电的可能性。
对统计当天设定前后N天为统计窗口期,首先分别计算统计当天与前N天之间的线损率平均值Vi 1和统计当天与后5天之间的线损率平均值Vi 2,若Vi 1比Vi 2的增长率大于阀值K,则认为具有一定的窃电嫌疑。
Y(i)=(Vi 1-Vi 2)/Vi 2 (10)
特征指标量化是将线损增长率Y和理论线损值G进行加权处理来量化线损指标:
E=αY+βG (11)
式中,α为Y所占权重,建议为40%。β为G所占权重,建议为60%;线路线损率超8%判定为异常。
⑦事件类指标
根据现场采集设备和计量设备上传的事件类数据进行判断,若有相关事件发生,则很大程度上提高了用电异常的概率。
1)数据源:用电信息采集系统中采集到事件数据,事件类指标相关的主要有以下几类:
2)提取方法:
特征指标量化:(a)开盖,开箱,磁场干扰,相序异常,电表停上电记录等事件类:该计量点周期内是否产生事件进行指标量化处理:
(b)电能表倒走:根据该计量点周期内倒走次数进行指标量化处理:
式中,k为近周期内记录数。
⑧信用类
信用类指标不能直接作为判定窃电的依据,但可以作为窃电行为的辅助判定条件。
1)数据源:营销系统信用记录数据
2)提取方法:信用类数据包含窃电记录、欠费记录,将最近3年内发生窃电/欠费记录数进行指标量化处理:
式中,k为近3年发生窃电(欠费)记录数。
⑨负载率指标
用电用户在周期内的负载情况的突变。
数据源:采集系统的负荷数据和营销系统的用户容量数据等
2)提取方法:用户周期内平均负载率进行指标量化处理:
式中,n为周期内采集点数,fi为负载率。
⑩外部环境
经济指标:社会经济波动系数等。
环境指标:每周、每月的降雨次数、季节性、环境温度等。
数据源:采集系统用电量数据;社会其它单位系统或者手工输入。
提取方法:用户所在的行业数据与社会其它数据相比较,是否存在相互背离的现象。
(3)构建深度动态反窃电诊断模型
反窃电诊断模型是采用由多种算法来分别分析,然后采用综合决策的方法给出用户判别结果。模型选择的算法由BP神经网络、XGBoost算法、逻辑回归算法、离群点算法,其优势主要表现为:BP神经网络通过隐含层非线性变换能较好解决特征向量之间的非线性关系;XGBoost算法是优化的分类树模型;逻辑回归能够以特征向量之间保持独立同分布为先验信息的前提下给出分类结果的概率;离群点算法是针对电量波动率的分析,反映窃电的变化趋势。以下对各算法做简要介绍:
1)BP神经网络
BP神经网络通过隐含层中非线性函数对反窃电指标的映射,使得其变得线性可分,在输入神经网络前,各指标需进行归一化处理。基于BP神经网络反窃电的算法如图5所示。
模型采用具有多输入单输出的三层BP神经网络作为用户窃电嫌疑系统计算模型,其中神经网络参数的学习是基于Delta学习准则。通过神经网络算法输出用户的疑似窃电的概率,即窃电嫌疑系数,其区间范围为[0,1]。当窃电嫌疑系数越大时,该用户窃电的可能性就越大。
2)XGBoost算法
XGBoost算法是具有CART决策树算法和集成算法的优点,将其应用到反窃电分析中能够直观反映出特征的分裂阈值;采用XGBoost算法对窃电相关的特征指标的分割如图6所示,通过XGBoost模型能够挖掘窃电指标的内在关联关系,并且给出了用户疑似嫌疑的概率。
3)逻辑回归算法
逻辑回归模型是通过对窃电特征向量进行了非线性映射到[0,1]空间上,且以概率形式给出用户窃电嫌疑的概率,其中非线性Sigmoid函数形式如下所示:
式中,Z是输入特征向量的线性组合,模型系数采用的梯度下降法训练得到,为了保证逻辑回归具有较好的鲁棒性,对模型加入含有L2惩罚项。通过Sigmoid映射后的特征图如图7所示:通过对特征映射后的图像,得到疑似窃电的概率,概率越大表明了越具有窃电嫌疑。
4)离群点算法
通过对已发现窃电的专变用户计算其相应的电量波动率,利用优化的基于距离的离群点算法将窃电嫌疑数据从海量数据中筛选出来进行分析处理,提出了电量波动系数:CV=σ/μ,其中σ代表样本的标准差,μ代表样本的均值,该系数的意义在于:
①离群点算法能发现更合适的质心,便于准确挖掘窃电嫌疑点;
②设置合适的波动系数阈值,样本波动系数小于阈值采用离群点算法,大于等于阈值时采用聚类分析,这样做的目的在于解决离群点算法对于波动程度大的样本不适用的问题。
在对数据样本进行必要的预处理后,采用离群点算法挖掘异常嫌疑数据。在此过程中,采用电量波动和求两次均值的方法得到该样本的“标准值”,以“标准值”为条件筛选离群点,筛选出离群点以后,选择最长连续的一段报警时间设置连续7天异常,第7天开始报警的条件得到系数f(报警1天f=0.1;报警2天,f=0.2,……,报警不少于10天,f=1),窃电疑似度Sd=p×f(p为离群点算法参数)。在实际算法操作的过程中,所分析样本的周期可设定为3个月,这是因为样本越长受跨季度导致误报的影响越大,样本周期太短则不能满足算法根据样本变化趋势信息来分析窃电可能的要求。
最后,建立的反窃电诊断模型的框架如图2所示:
1)特征指标的选取
通过输入不同的特征向量,首先采用序列向后选择(SBS)算法对特征向量的筛选、规约,选取对模型影响、贡献度较大的指标构成的集合作为训练集。
2)分类算法的选择
选择的算法包括XGBoost、BP神经网络、逻辑回归,其中不同的分类模型的训练方法都采用K-Fold交叉验证,不同的算法在训练、测试的过程中剔除了分类错误的训练数据集合,使得最终选取的模型精度的不低于0.9。
3)反窃电诊断模型集的建立
通过对不同算法的综合决策分析,确定了不同算法的权重的分配,构造一组组合最优的分类作为窃电诊断的方法。
反窃电预警模型对多种算法的优势进行了组合,其中组合的模型包括:XGBoost、BP神经网络、逻辑回归算法以及离群点算法,输出结果表现形式为:
窃电嫌疑P=λ1fbp+λ2fxgb+λflogic+λfsubb (17)
其中,λi,i∈(1,2,3,4)为算法权重,fbp、fxgb、flogic、fsubb分别为BP神经网络、XGBoost、逻辑回归算法以及离群点算法。
由于用电行业的差异性,其模型的组合系数也需要进行调整,初始化设置不同的算法是等概率的,根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数λi,进行更新,即与稽查结果复合的权重赋予较大值,反之更新权重变小减小其对结果的贡献度。
在上述基础上,进行多维度窃电态势智能推演与风险预警评估:
1)基于线损波动情况分析的判断
线损率的波动除了电量统计不准确外,主要原因是线路、台区下属用户存在窃电现象或者用电异常的情况,通过线损率(台区线损率、线路线损率)的波动分析,并结合相同时间内的相应线路、台区下的用户用电情况,分析用户用电量情况与线损率波动情况是否存在相似性,得出用户的窃电嫌疑情况。如图8所示(图中左侧上方为线损曲线,下方为用户日用电量),通过分析可发现该用户的用电量波动和台区线损率的波动情况耦合度较高,追溯该用户日用电量、所在台区供电量等历史数据,未发现明显数据质量问题,同时发现用户平均日用电量为1度左右,相较于其它同类型用户偏低。该用户的日用电量与所在台区的管理线损呈现强相关性,因此将该用户定位为高窃电嫌疑用户。
2)基于用电行为分析的判断
每个行业负荷都有其特有的特性,通过聚类算法可生成的不同行业的用电曲线,并且包含其特征所属类别建立特征行为。即该特征库包含了行业的含有几种负荷曲线。即该特征库包含:日峰谷用电特征类别;工作日休息日周用电特征类别;
对某一行业的用电特征进行聚类分析,构建行业的用电特征库,主要包括用电负荷,周工作特征等,并重点对典型行业用户进一步进行分析。
如纺织行业通过聚类发现有如下特征,如图9所示(不同曲线对应不同聚类类别)。
3)基于季节性用电特征分析的判断:季节性用电是指受季节影响随之变化的用电情况,主要体现在与农业相关的企业,如糖加工、排灌等农业用电企业。从负荷特性上看,农业用电在日内的变化相对较小,但在月内,尤其在季度内和年度内,负荷变化很大,呈现出很不均衡的特点。例如排涝用电,冬季负荷很小,负荷率在0.1左右,而夏季负荷很大,负荷率高达0.8以上,差别很大。季节性用电行业有特殊的用电特征,如图10所示(左侧上方曲线为异常用户负载率;下方为行业负载率):
通过用户与所在行业的季节性用电情况进行比较,在用电高峰季节单用户存在用电负荷不变或者反面下降的情况,则视为窃电高嫌疑度用户。由上图可看出某异常用户的用电特征与整体行业存在明显的差异,经现场核查,该用户私自将电源接入农排线路,用于进行小作坊生产,属于“高价低接”违约用电。
4)基于外部环境(温度)变化分析的判断
一般来说气温对用电量的影响主要集中在冬季和夏季,其中主要影响用电量的为非工业用电用户,如低压居民、服务性商业用电用户等,其变化规律相对比较固定,在夏季气温越高用户电量越大,在冬季气温越低用户用电量也越大。如图11所示:
经过分析如果一用电量较大的非工业用电用户,长期用电量较为均匀,或者与气温变化成反向关系,则存在窃电嫌疑度相对较高。
在反窃电诊断模型集自动分析的基础上,结合客户的用电行为、历史信用、季节性用电特征、所在线路的线损波动等多维度用电特性,开展窃电态势智能推演与风险预警评估。
通过反窃电诊断模型集计算得出的嫌疑用户清单,经过现场排后确认窃电或者违约用电的情况。经过分析一段时间内的嫌疑用户具有相同的特征情况(行业、区域、用电类型、窃电手段等),则对此特征情况下的客户主动发起风险预警分析,并形成预警分析结果和明细清单。
经过现场排查确认用电异常用户,对已确认窃电用户的行业、区域、用电类型、窃电手段等特征进行分析,判断是否有相同的特征情况,如有窃电用户有高度相似的特征情况,则发起风险预警评估,并确认是否需要发起预警用户现场检查,如需要现场检查则生成检查用户清单。
在动态反窃电诊断模型集上,基于用电行为、客户信用、季节电量、线损波动等开展窃电态势智能推演与风险预警评估。
针对模型计算输出的结果进一步进行辅助研判,使得出的最终结果更加准确。具体方法如下:
经过模型分析后,得出疑似用户清单,进一步获取此用户的模型计算特征量和疑似窃电时间段内的异常事件;对用户进一步进行用电行为分析,经过辅助研判,如果符合用电行为异常条件,则修改模型计算结果并形成最终的反窃电嫌疑用户报告;如果经过分析,不符合用电行为异常条件,则维护模型计算结果并形成最终反窃电嫌疑用户报告。辅助研判修改方法:
其中,P为研判后疑似度,p1是模型原疑似度,n是用户符合辅助判断中各类型的总数,Li是附件1表中对应的相关系数,k是预设的辅助研判参与系数。
在上基础上,对模型进行优化及主动预警自学习:对反窃电诊断模型提供的清单进行现场验证,并把现场的窃电行为报告按要求和统一格式形成窃电案例进行反馈,诊断模型定时自动开展自学习,并自动修改模型的内部参数,达到反窃电诊断模型自学习、自动优化的效果。
本发明还公开了一种多维度窃电态势智能感知系统,包括
数据获取模块,用于基于营销业务系统、用电信息采集系统、一体化电量及线损管理系统、季节性气象和社会经济信息,获取不同地区典型行业用户的历史电力原始数据;
典型行业用电矩阵化数据集生成模块,用于构造不同典型行业用户的聚类因子,通过聚类算法对电力原始数据分析,生成典型行业的用电特征曲线,建立典型行业用电矩阵化数据集;
反窃电专家样本库生成模块,用于构建初始特征,对电力原始数据中对应特征量进行选择及提取,生成反窃电专家样本库;
反窃电诊断模型构建模块,用于以典型行业用电矩阵化数据集与反窃电专家样本库为基础,构建反窃电诊断模型;
数据处理模块,用于对典型行业用户的电力原始数据进行筛选,再输入至反窃电诊断模型以分析用户的窃电情况。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里不再赘述。
本发明还公开了一种移动介质设备,包括:存储器,用于存储计算机程序;处理器,用于执行计算机程序时实现如上所述的多维度窃电态势智能感知方法的步骤。
由于移动介质设备部分的实施例与方法部分的实施例相互对应,因此移动介质设备部分的实施例请参见方法部分的实施例的描述,这里不再赘述。
本发明还公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上所述的多维度窃电态势智能感知方法的步骤。
由于介质部分的实施例与方法部分的实施例相互对应,因此介质部分的实施例请参见方法部分的实施例的描述,这里不再赘述。
虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围的情况下,都可利用上述揭示的技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。
Claims (6)
1.一种多维度窃电态势智能感知方法,其特征在于,包括步骤:
基于营销业务系统、用电信息采集系统、一体化电量及线损管理系统、季节性气象和社会经济信息,获取不同地区典型行业用户的历史电力原始数据;
构造不同典型行业用户的聚类因子,通过聚类算法对电力原始数据分析,生成典型行业的用电特征曲线,建立典型行业用电矩阵化数据集;
构建初始特征,对电力原始数据中对应特征量进行选择及提取,生成反窃电专家样本库;
以典型行业用电矩阵化数据集与反窃电专家样本库为基础,构建反窃电诊断模型;
对典型行业用户的电力原始数据进行筛选,再输入至反窃电诊断模型以分析用户的窃电情况;
通过功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数波动率、用电量变化率、线损波动、客户信用、气象特征或社会经济中的一种或多种构造聚类因子;
反窃电专家样本库的特征量包括电量趋势下降指标、功率与电流相关性指标、计量反极性指标、功率因数相关性指标、电流不平衡相关性指标、线损波动性指标、事件类指标、信用类指标或负载类指标中的一种或多种;
所述电量趋势下降指标的数据源为系统的电量数据;所述功率与电流相关性指标的数据源为三相三线的A、C相二次侧电流和三相四线中的三相二次侧电流;所述计量反极性指标的数据源为各系统的负荷数据;所述功率因数相关性指标的数据源为功率因数曲线和电流曲线;所述电流不平衡相关性指标的数据源为三相三线用户电流数据;所述线损波动性指标的数据源为线路日线损数据;所述事件类指标的数据源为事件数据,所述事件数据包括开盖事件或开箱事件或磁场干扰或相序异常或电表停电、上电记录或电能表倒走;所述信用类的数据源为营销系统信用记录数据;所述负载类指标的数据源为负荷数据和营销业务系统的用户容量数据;
具体地,电量趋势下降指标的量化公式为:
式中,为当天下降趋势指标,/>为当天电量,/>为前后几天电量,/>为权重,/>为前后天数;
计量反极性指标E的量化公式为:
式中,K为异常发生点数,Q为有效数据点数;
功率因数相关性指标以功率因数曲线和电流曲线数据进行分析,分析量化过程如下:
功率因数与电流波动率相关性的量化公式为:
式中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差,X为电流波动率,Y为功率因数;协方差Cov(X,Y)为:
式中,表示电流波动率的平均值,/>表示功率因数平均值;
电流不平衡相关性指标的分析量化过程如下:
a)电流不平衡度是表征某一时间点分相负载的情况,X为三相不平衡率,其量化公式为:
式中,In为分相电流,Ip为三相电流平均值;
b)负荷率是指用户运行功率与其运行容量之比,量化公式为:
式中,S为某一点有功功率(kW);Se为运行容量(kW);Y为负荷率;
c)对一个用户来说,生产一般具备连续性和相似性,在一定的负载水平内三相电流呈现相关系数,量化公式为:
式中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差,X为电流不平衡率,Y为负荷率;其中
式中,Cov(X,Y)表示协方差,表示电流不平衡度平均值,/>表示负荷率平均值;
反窃电诊断模型对多种算法的优势进行了组合,其中组合的模型包括:XGBoost、BP神经网络、逻辑回归算法以及离群点算法,输出结果表现形式为:
窃电嫌疑
其中,为算法权重,/>、/>、/>、/>分别为BP神经网络、XGBoost、逻辑回归算法以及离群点算法;
由于用电行业的差异性,其模型的组合系数也需要进行调整,初始化设置不同的算法是等概率的,根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数进行更新,即与稽查结果复合的权重赋予较大值,反之更新权重变小,减小其对结果的贡献度。
2.根据权利要求1所述的多维度窃电态势智能感知方法,其特征在于,初始特征包括初始静态特征、营销业务特征、用电基础特征、用电加工特征、异常事件或外部环境特征中的一种或多种;所述初始静态特征的特征量包括接线方式、供电方式、行业类别、用电性质或运行容量中的一种或多种;所述营销业务特征的特征量包括增减容、暂停、历年逾期欠费、计量故障或违窃记录中的一种或多种;所述用电基础特征的特征量包括有功功率、带时间无功功率、分相电压、分相电流或功率因数中的一种或多种;所述用电加工特征的特征量包括峰谷差、日用电波形、日平均用电量、月平均用电量、负载率、电流平衡率、电压平衡率或功率因数波动率中的一种或多种;所述异常事件的特征量包括开盖事件、开箱时间、恒定电磁干扰事件、相序异常或停上电事件中的一种或多种;所述外部环境特征的特征量包括气象信息或/和社会经济情况。
3.根据权利要求1所述的多维度窃电态势智能感知方法,其特征在于,获取不同地区典型行业用户的历史电力原始数据,再对其进行预处理,所述预处理包括数据筛选、数据清洗和数据转换。
4.一种多维度窃电态势智能感知系统,用于执行如权利要求1-3中任意一项的多维度窃电态势智能感知方法的步骤,其特征在于,包括数据获取模块,用于基于营销业务系统、用电信息采集系统、一体化电量及线损管理系统、季节性气象和社会经济信息,获取不同地区典型行业用户的历史电力原始数据;
典型行业用电矩阵化数据集生成模块,用于构造不同典型行业用户的聚类因子,通过聚类算法对电力原始数据分析,生成典型行业的用电特征曲线,建立典型行业用电矩阵化数据集;
反窃电专家样本库生成模块,用于构建初始特征,对电力原始数据中对应特征量进行选择及提取,生成反窃电专家样本库;
反窃电诊断模型构建模块,用于以典型行业用电矩阵化数据集与反窃电专家样本库为基础,构建反窃电诊断模型;
数据处理模块,用于对典型行业用户的电力原始数据进行筛选,再输入至反窃电诊断模型以分析用户的窃电情况。
5.一种移动介质设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3中任意一项所述的多维度窃电态势智能感知方法的步骤。
6. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3中任意一项所述的多维度窃电态势智能感知方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910423619.6A CN110097297B (zh) | 2019-05-21 | 2019-05-21 | 一种多维度窃电态势智能感知方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910423619.6A CN110097297B (zh) | 2019-05-21 | 2019-05-21 | 一种多维度窃电态势智能感知方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110097297A CN110097297A (zh) | 2019-08-06 |
CN110097297B true CN110097297B (zh) | 2023-08-22 |
Family
ID=67448748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910423619.6A Active CN110097297B (zh) | 2019-05-21 | 2019-05-21 | 一种多维度窃电态势智能感知方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110097297B (zh) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110223196B (zh) * | 2019-06-04 | 2021-08-31 | 国网浙江省电力有限公司营销服务中心 | 基于典型行业特征库和反窃电样本库的反窃电分析方法 |
CN110750760B (zh) * | 2019-09-16 | 2023-05-02 | 东南大学 | 一种基于态势感知和控制图的异常理论线损检测方法 |
CN110687361A (zh) * | 2019-09-20 | 2020-01-14 | 中国电力科学研究院有限公司 | 一种用于识别低压配网台区相序的方法及系统 |
CN110991477A (zh) * | 2019-10-29 | 2020-04-10 | 中国电力科学研究院有限公司 | 一种识别电力系统异常行业用户和异常用电行为的方法和系统 |
CN110968838A (zh) * | 2019-11-29 | 2020-04-07 | 国网吉林省电力有限公司电力科学研究院 | 基于智能电能表开盖事件的用电异常分析方法 |
CN111144540A (zh) * | 2019-12-05 | 2020-05-12 | 国网山东省电力公司电力科学研究院 | 反窃电仿真数据集的生成方法 |
CN111080476A (zh) * | 2019-12-06 | 2020-04-28 | 江苏瑞中数据股份有限公司 | 一种基于数据中台的用户窃电行为分析预警方法 |
CN111539843B (zh) * | 2020-04-17 | 2022-07-12 | 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) | 基于数据驱动的反窃电智能预警方法 |
CN111612221B (zh) * | 2020-04-29 | 2022-07-15 | 杭州拓深科技有限公司 | 一种基于电流指纹技术的工厂工效统计方法 |
CN111552682A (zh) * | 2020-05-11 | 2020-08-18 | 国网上海市电力公司 | 一种基于专家模型库的窃电类型诊断方法 |
CN111798333A (zh) * | 2020-06-12 | 2020-10-20 | 国网山东省电力公司电力科学研究院 | 一种用能评估与用电安全分析方法和系统 |
CN111948448A (zh) * | 2020-08-20 | 2020-11-17 | 国网河北省电力有限公司沧州供电分公司 | 基于专家知识库的反窃电系统 |
CN112101471A (zh) * | 2020-09-21 | 2020-12-18 | 国网辽宁省电力有限公司电力科学研究院 | 窃电概率预警分析方法 |
CN112415310B (zh) * | 2020-11-06 | 2023-05-02 | 天津天大求实电力新技术股份有限公司 | 面向用户侧窃电行为识别分析方法及应用 |
CN112345996B (zh) * | 2020-11-09 | 2022-02-15 | 南京新联电子股份有限公司 | 一种基于边缘计算的能源控制器回路事件生成方法 |
CN112614012A (zh) * | 2020-12-11 | 2021-04-06 | 国网北京市电力公司 | 用户窃电识别方法及装置 |
CN112685461A (zh) * | 2020-12-15 | 2021-04-20 | 国网吉林省电力有限公司电力科学研究院 | 一种基于预判模型的窃电用户判断方法 |
CN112884000A (zh) * | 2021-01-15 | 2021-06-01 | 国网河南省电力公司营销服务中心 | 一种基于数据挖掘的用电检查智能诊断方法及诊断系统 |
CN112836738B (zh) * | 2021-01-29 | 2023-05-05 | 华能国际电力股份有限公司 | 基于bp神经网络的窃电行为检测方法 |
CN113128024B (zh) * | 2021-03-17 | 2023-02-07 | 国网山东省电力公司济南供电公司 | 一种基于大数据分析的低压窃电客户及窃电手段确定方法 |
CN113222624B (zh) * | 2021-05-31 | 2022-03-18 | 江苏新智合电力技术有限公司 | 一种反窃电智能分析方法及系统 |
CN113362199B (zh) * | 2021-06-15 | 2022-12-02 | 国网河南省电力公司许昌市建安供电公司 | 基于用户采集电量与台区线损相关性的窃电用户核查方法 |
CN113642002B (zh) * | 2021-07-28 | 2024-02-02 | 上海纽盾科技股份有限公司 | 用于云数据安全事件的快速定位态势感知方法及系统 |
CN113570388B (zh) * | 2021-07-30 | 2024-06-14 | 广东电网有限责任公司 | 一种远程反窃电检查方法、装置、计算机设备和存储介质 |
CN113792477B (zh) * | 2021-08-18 | 2024-06-07 | 珠海派诺科技股份有限公司 | 一种用电异常识别方法、系统、装置和火灾预警系统 |
CN113884734B (zh) * | 2021-10-27 | 2024-04-19 | 广东电网有限责任公司 | 一种非侵入式用电异常诊断方法及装置 |
CN113947504B (zh) * | 2021-11-11 | 2024-07-30 | 国网辽宁省电力有限公司营销服务中心 | 一种基于随机森林法的窃电分析方法及其系统 |
CN115267422A (zh) * | 2022-07-01 | 2022-11-01 | 国网山西省电力公司吕梁供电公司 | 一种用于复杂配电网线路故障的感知诊断定位方法 |
CN115329565B (zh) * | 2022-08-09 | 2023-04-07 | 中国电力科学研究院有限公司 | 一种用于复杂电磁场环境的综合评价方法及系统 |
CN115650006B (zh) * | 2022-10-24 | 2023-12-12 | 昆山广联发通信服务有限公司 | 一种基于大数据的电梯安全监测预警方法及系统 |
CN116029480B (zh) * | 2023-03-28 | 2023-07-14 | 广东电网有限责任公司 | 代理购电测算方法及其系统 |
CN116701947B (zh) * | 2023-08-02 | 2023-11-03 | 成都汉度科技有限公司 | 一种窃电行为检测方法及系统 |
CN116862116B (zh) * | 2023-09-05 | 2024-07-30 | 国网天津市电力公司营销服务中心 | 一种反窃电智能预警方法、系统、电子设备和存储介质 |
CN117196540A (zh) * | 2023-11-06 | 2023-12-08 | 国网天津市电力公司营销服务中心 | 一种台区运行状态识别方法、系统、设备及存储介质 |
CN117787572B (zh) * | 2024-02-27 | 2024-05-17 | 国网山西省电力公司临汾供电公司 | 一种异常用电用户识别方法、装置、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1544698A1 (de) * | 2003-12-19 | 2005-06-22 | Ford Global Technologies, LLC, A subsidary of Ford Motor Company | Vorrichtung und Verfahren zur Kontrolle eines Bordnetzes |
CN107145966A (zh) * | 2017-04-12 | 2017-09-08 | 山大地纬软件股份有限公司 | 基于逻辑回归概率分析优化模型的反窃电分析预警方法 |
CN107742127A (zh) * | 2017-10-19 | 2018-02-27 | 国网辽宁省电力有限公司 | 一种改进的防窃电智能预警系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109446193A (zh) * | 2018-11-13 | 2019-03-08 | 国网宁夏电力有限公司电力科学研究院 | 反窃电模型生成方法及装置 |
-
2019
- 2019-05-21 CN CN201910423619.6A patent/CN110097297B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1544698A1 (de) * | 2003-12-19 | 2005-06-22 | Ford Global Technologies, LLC, A subsidary of Ford Motor Company | Vorrichtung und Verfahren zur Kontrolle eines Bordnetzes |
CN107145966A (zh) * | 2017-04-12 | 2017-09-08 | 山大地纬软件股份有限公司 | 基于逻辑回归概率分析优化模型的反窃电分析预警方法 |
CN107742127A (zh) * | 2017-10-19 | 2018-02-27 | 国网辽宁省电力有限公司 | 一种改进的防窃电智能预警系统及方法 |
Non-Patent Citations (1)
Title |
---|
配用电信息数据下的用户异常用电行为辨识;方晴程;《中国优秀硕士论文 工程科技Ⅱ辑》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110097297A (zh) | 2019-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN110223196B (zh) | 基于典型行业特征库和反窃电样本库的反窃电分析方法 | |
Xia et al. | Detection methods in smart meters for electricity thefts: A survey | |
CN110824270B (zh) | 结合台区线损和异常事件的窃电用户辨识方法及装置 | |
Zhang et al. | Forecasting residential energy consumption: Single household perspective | |
Ahmad et al. | Review of various modeling techniques for the detection of electricity theft in smart grid environment | |
Angelos et al. | Detection and identification of abnormalities in customer consumptions in power distribution systems | |
Cody et al. | Decision tree learning for fraud detection in consumer energy consumption | |
Jota et al. | Building load management using cluster and statistical analyses | |
CN106093707B (zh) | 智能防窃电分析系统的数据处理方法 | |
CN110222991B (zh) | 基于rf-gbdt的计量装置故障诊断方法 | |
CN110634080A (zh) | 异常用电检测方法、装置、设备及计算机可读存储介质 | |
JP2003242212A (ja) | ユーティリティの消費特性が類似する曜日を決定する装置および方法 | |
CN111008193B (zh) | 一种数据清洗与质量评价方法及系统 | |
CN103678766A (zh) | 一种基于pso算法的异常用电客户检测方法 | |
CN111291076A (zh) | 基于大数据的异常用水监测报警系统及其构建方法 | |
CN110675020A (zh) | 一种基于大数据的高价低接用户识别方法 | |
CN113392910A (zh) | 一种判断违约用电与窃电的多维度智能分析经验算法和分类算法 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN106651093A (zh) | 一种用于低压集抄系统的智能复核管控方法 | |
CN115409120A (zh) | 一种基于数据驱动的用户窃电行为检测辅助方法 | |
Poudel et al. | Artificial intelligence for energy fraud detection: a review | |
CN118194202A (zh) | 基于横向联邦的窃电识别算法及其原型系统 | |
CN115146715B (zh) | 用电安全隐患诊断方法、装置、设备及存储介质 | |
CN111489073A (zh) | 一种基于分类算法的用户用电廉情预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |