CN106570778A - 一种基于大数据的数据集成与线损分析计算的方法 - Google Patents
一种基于大数据的数据集成与线损分析计算的方法 Download PDFInfo
- Publication number
- CN106570778A CN106570778A CN201610895912.9A CN201610895912A CN106570778A CN 106570778 A CN106570778 A CN 106570778A CN 201610895912 A CN201610895912 A CN 201610895912A CN 106570778 A CN106570778 A CN 106570778A
- Authority
- CN
- China
- Prior art keywords
- line loss
- spl
- electricity
- same period
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 21
- 230000010354 integration Effects 0.000 title claims abstract description 13
- 238000004458 analytical method Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000009826 distribution Methods 0.000 claims abstract description 13
- 230000005611 electricity Effects 0.000 claims description 102
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 46
- 238000000205 computational method Methods 0.000 claims description 33
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 238000012384 transportation and delivery Methods 0.000 claims description 16
- 230000005540 biological transmission Effects 0.000 claims description 15
- 230000014509 gene expression Effects 0.000 claims description 12
- 230000001360 synchronised effect Effects 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000007873 sieving Methods 0.000 claims description 4
- 238000007726 management method Methods 0.000 abstract description 17
- 230000008569 process Effects 0.000 abstract description 6
- 230000004927 fusion Effects 0.000 abstract description 3
- 238000010276 construction Methods 0.000 abstract 1
- 238000012544 monitoring process Methods 0.000 abstract 1
- 230000002547 anomalous effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002844 continuous effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于大数据的数据集成与线损分析计算的方法,包括:步骤0000,获取电力数据;步骤1000,对所述电力数据进行集成;步骤2000,根据步骤1000的电力数据计算电力线损;步骤3000,对步骤2000获取的电力线损进行异常分析。本发明可以充分利用电力数据,对其进行深入分析,提供大量的高附加值服务,实现电量源头采集、线损自动生成、指标全过程监控、业务全方位贯通协同,实现电量与线损管理标准化、智能化、精益化和自动化,有力支撑公司坚强智能电网、现代配电网建设。
Description
技术领域
本发明涉及电力信息领域,特别涉及一种基于大数据的数据集成与线损分析计算的方法。
背景技术
坚强智能电网、三集五大两中心的迅速发展使信息通信技术正以前所未有的广度、深度与电网生产、企业管理快速融合。目前,国家电网公司已初步建成了国内领先、国际一流的信息集成平台。随着三地集中式数据中心的陆续投运,一级部署业务应用范围的拓展,结构化和非结构化数据平台的上线运行,电网业务数据从总量和种类上都已初具规模,随着智能电表的逐步普及,电网业务数据从时效性层面进一步丰富和拓展,大数据的“量类时”特性,已在海量、实时的电网业务数据中进一步凸显,电力大数据分析迫在眉睫。
大数据将给各行各业带来变革性机会,在医疗行业、能源行业、通信行业、零售业都有成功的应用案例。当前,国家电网公司涉及数据大致分为三类:一是电网生产数据,如发电量、电压稳定性等方面的数据;二是电网运营数据,如交易电价、售电量、用电客户等方面的数据;三是企业管理数据,如ERP、一体化平台、协同办公等方面的数据。
发明内容
本发明为解决上述问题,提供了一种基于大数据的数据集成与线损分析计算的方法,其特征在于,包括以下步骤:
步骤0000,获取电力数据;
步骤1000,对所述电力数据进行集成;
步骤2000,根据步骤1000的电力数据计算电力线损;
步骤3000,对步骤2000获取的电力线损进行异常分析。
特别的,所述步骤1000中使用正则表达式对电力数据进行集成。
特别的,所述骤2000进一步包括:步骤2200,将数据存储到分布式文件系统中;
步骤2400,读取所述分布式文件系统文件进行电量计算,将计算结果及电量数据存储到非结构化数据库中;
步骤2600,省公司层级完成电量计算后,通过数据中心将非结构化数据上传到总部非结构化数据库中,实时监听计算任务列表;
步骤2800,获取所述电量数据及线损计算模型,进行线损计算。
特别的,所述步骤3000进一步包括:
步骤3200,获取电量及线损等数据信息;
步骤3400,计算供售的同期系数;
步骤3600,筛选异常数据;
步骤3700,利用贝叶斯法则计算异常概率值;
步骤3800,计算电量与线损的相关系数;
步骤3900,判断线损是否异常。
本发明可以充分利用电力数据,对其进行深入分析,提供大量的高附加值服务,实现电量源头采集、线损自动生成、指标全过程监控、业务全方位贯通协同,实现电量与线损管理标准化、智能化、精益化和自动化,有力支撑公司坚强智能电网、现代配电网建设。
附图说明
图1业务系统命名规则示例图
图2分区域线损计算流程图
图3分压线损计算流程图
图4分元件线损计算流程图
图5分台区线损计算流程图
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明涉及的基本概念:
线损:线损是电能从发电厂传输到用户过程中,在输电、变电、配电和用电各环节中所产生的电能损耗,主要由技术线损与管理线损两部分构成。
技术线损:技术线损是指经由输变配售设施所产生的损耗,技术线损可通过理论计算来获得;管理线损:管理线损是指在输变配售过程中由于计量、抄表、窃电及其他管理不善造成的电能损失。
线损率:线损率是在一定时期内电能损耗占供电量的比率。
线损率是衡量电网技术经济性的重要指标,它综合反映了电力系统规划设计、生产运行和经营管理的技术经济水平。
线损管理:线损管理是指为确定和达到电网降损节能目标,所开展的各项管理活动的总称。
线损管理作为电网经营企业一项重要的经营管理内容,应以“技术线损最优,管理线损最小”为宗旨,以深化线损“四分”(分区、分压、分元件、分台区)管理为重点,实现从结果管理向过程管理的转变,切实规范管理流程,提高线损管理水平。
本发明实施例一公开了一种基于大数据的数据集成与线损分析计算的方法,其特征在于,包括以下步骤:
步骤0000,获取电力数据;
步骤1000,对所述电力数据进行集成;
步骤2000,根据步骤1000的电力数据计算电力线损;
步骤3000,对步骤2000获取的电力线损进行异常分析。
本发明实施例二公开了一种基于大数据的数据集成与线损分析计算的方法,其特征在于,包括以下步骤:
步骤0000,获取电力数据,具体方法为:
通过ETL与设备(资产)运维精益化管理集成,获取设备台账数据、设备状态数据;通过ETL与调度应用管理系统集成,获取省级公司的电网结构数据和拓扑数据;通过UAPI与电能量采集系统集成,获取关口表计档案、关口表底数据;通过UAPI与调度管理系统集成,获取遥信数据、遥测数据;通过UAPI与用电信息采集系统集成获取用户表计数据、表计表底数据;通过ETL与营销应用系统集成,获取台区、用户档案数据、表计数据、发行电量数据;通过
WebService与电网GIS平台集成,获取营配贯通数据、GIS组件服务。
步骤1000,对所述电力数据进行集成,具体方法为:
采用正则表达式模式库实现跨专业、多态的数据横向集成。在横向集成各专业系统的电网设备档案信息中,各专业系统以文本类型为主但名称不一致,直接影响线损系统数据集成。由于正则表达式具有较强的表达能力,能够描述更为广泛的关联特征,因此正则表达式匹配替代精确字符串匹配成为各专业系统横向集成的主要手段。本发明采用正则表达式进行匹配,JAVA内置的正则表达式基本满足要求,也可将匹配规则写成PERL脚本,其对文本的处理更加全面。通过数据治理工具定义正则表达式模式库,其中的关键词可以成组进行,关联关系实现正则表达式匹配从而将各个业务系统抽取上来数据进行集成。前期通过与各专业系统命名规则梳理形成对应匹配关系,但是前期梳理的匹配表达式中的关键词需要进行动态修改后存放在数据治理工具的正则表达式模式库中。命名规则示例可见附图1。
使用这种集成方法的优点在于:能够解决一体化电量与线损管理系统接入六大业务系统四大数据平台,各专业系统的部署方式与一体化电量与线损管理系统不一样,且各单位不同程度上存在源头数据标准和格式不一致问题。考虑源头数据的多态性,采用正则表达式模式库匹配关联数据设计思想,攻克了源头数据差异大,跨专业壁垒多等难题,实现了业务数据的横向融合,实现与发展部、营销部、运检部、调控中心、信通部相关专业信息系统业务数据的集成。
步骤2000,根据步骤1000的电力数据计算电力线损,所述骤2000进一步包括:
步骤2200,将数据存储到分布式文件系统中,优选为将海量数据及档案数据存储到Hadoop的分布式文件系统(HDFS)中;
步骤2400,读取所述分布式文件系统文件进行电量计算,将计算结果及电量数据存储到非结构化数据库中,优选为利用Spark内存计算的优势,结合Hadoop组件读取HDFS文件进行电量计算,将计算的表底及电量数据存储到非结构化数据库(Nosql)中;
步骤2600,省公司层级完成电量计算后,通过数据中心将非结构化数据上传到总部非结构化数据库中,实时监听计算任务列表,优选为省公司层级将电量计算完成后,通过数据中心将非结构化数据上传到总部Nosql中,使用Kettle自动创建Kettle Job,实时监听计算任务列表;步骤2800,获取所述电量数据及线损计算模型,进行线损计算,优选为利用Kettle转换组件,读取Nosql电量数据及线损计算模型存储到HDFS中,调用Spark Job使用MapReduce进行线损计算;
特别的,所述线损计算包括但不仅限于第一线损,第二线损,第三线损和第四线损,
其中第一线损为分区域线损,包括月统计分区线损率、月同期分区线损率、日同期分区线损率;月统计分区线损率计算方法为:
其中为月统计分区线损率,为地区月统计供电量,为地区营销发行电量,SPLzn为地区供电量;
月同期分区线损率计算方法为:
其中为月同期分区线损率,为地区月同期供电量,为地区营销分段电量合计;
日同期分区线损率计算方法为:
其中为月同期分区线损率,为地区日同期供电量,为地区同期日售电量合计;
其中地区供电量计算方法为:
其中为地区电厂上网电量,为上级供入电量,为同级供入电量;需要特别说明的是,月度统计线损和同期线损的供电量抄表例日默认为1日,如果不一致时需要在关口计量点上调整;
第二线损为分压线损,包括月统计分压线损率、月同期分压线损率、日分压同期线损率;
月统计分压线损率计算方法为:
其中为月统计分压线损率,为地区转入电量,为地区转出电量,为地区分压售电量;
月同期分压线损率计算方法为:
其中为月同期分压线损率,为地区营销分段售电量合计;
日同期分压线损率计算方法为:
其中为月同期分压线损率,为地区分压日售电量合计;
其中地区转入电量计算方法为:
其中INPother为其他单位转入电量,INPself为本单位其他电压等级转入电量,为其他电压等级反送电量,为下级单位同电压等级反送电量;
其中地区转出电量计算方法为:
其中OUTPother为其他单位转入电量,OUTPself为本单位其他电压等级转入电量,为其他电压等级反送电量,为下级单位同电压等级反送电量;
需要特别说明的是,月度统计线损和同期线损的供电量抄表和区域线损计算一致,分压供电量、售电量之和与区域线损应一致。
第三线损为分元件线损,包括站损率、主变损耗率、母线损耗率和输电线路损耗率;
站损率计算方法为:
其中为站损率,为站输入电量,为站输出电量;
主变损耗率计算方法为:
其中为主变损耗率,为主变输入电量,为主变输出电量;
母线损耗率计算方法为:
其中为母线损耗率,为母线输入电量,为母线输出电量;
输电线路损耗率计算方法为:
其中为输电线路损耗率,为线路输入电量,为线路输出电量;
第四线损为分台区线损,包括台区月统计线损率、台区月同期线损率和台区日同期线损率;
台区月统计线损率计算方法为:
其中为台区月统计线损率,为台区月统计供电量,为台区用户发行电量,表示对所有台区用户发行电量求和;
台区月同期线损率计算方法为:
其中为台区月同期线损率,为台区月同期供电量,为台区月同期售电量,表示对所有台区月同期售电量求和;
台区日同期线损率计算方法为:
其中为台区日同期线损率,为台区日同期供电量,为台区日同期售电量,表示对所有台区日同期售电量求和。
步骤3000,对步骤2000获取的电力线损进行异常分析,所述步骤3000进一步包括:
步骤3200,获取电量及线损等数据信息;
步骤3400,计算供售的同期系数,
线损率指标具有敏感性,特别是同期线损率能够动态实时反映电网运行盈亏状态。线损率计算涉及发、购、输、配、用多个环节,通过多种计算模型汇总数千万的计量点电量生成,线损率反映问题相对直观,但发现问题及定位问题十分困难。采用大数据技术和数学模型相结合是定位线损异常的有效措施,大数据解决线损异常定位的效率瓶颈问题,数学模型解决线损异常定位的算法优化问题,全面提高线损异常定位的实用性和可靠性。
同期系数分析方法
判定原理
统计线损供售数据不同期,造成线损结果数据失真,无法真实反映线损情况。同期线损结果受抄表手段影响,很难做到电量计算完全准确。同期系数利用同期线损结果和统计线损结果相比对,能够反映供售数据的同期程度,同期程度越大线损率的精确度就越高,反映线损管理规范化和标准化水平就越高,如果同期系数较低,可能在管理线损上存在问题。
计算方法
当供、售电量抄表不同期时,供、售电当月上下表底之间日期并集之间的天数为同期天数,当月天数为。
当供、售电量抄表不同期时,供、售电当月上下表底之间日期并集之间的电量为同期电量为,上表底为,下表底为,=()*倍率;当月电量为,上表底为,下表底为,=()*倍率。
系数T=注:=1
结果应用
这里的系数T就是同期系数,同期系数越大,越接近于1,则供、售电抄表的同期程度越高,线损的的精准程度则越高。反之,同期系数越低,可能配网管理线损上有隐患和漏洞,特别需要核对发行电量是否有误抄表现象。
步骤3600,筛选异常数据,具体方法为:
利用四分位模型计算出四分位差,四分位差越小,说明中间部分的数据越集中;四分位数越大,则意味着中间部分的数据越分散。我们运用四分位数模型检测关口计量点日电量突变情况,把超出规定范围内的数据确定为异常数据。
四分位差计算算法
选取n天日电量作为一组数据,将n项数据从小到大排列:
Q2为n个数组成的数列的中数;
当n为奇数时,中数Q2将该数列分为数量相等的两组数,每组有(n-1)/2个数,Q1为第一组(n-1)/2个数的中数,Q3为为第二组(n+1)/2个数的中数;
当n为偶数时,中数Q2将该数列分为数量相等的两组数,每组有n/2数,Q1为第一组n/2个数的中数,Q3为为第二组n/2个数的中数。
结果应用
把Q1作为正确数据的最小值,Q3作为正确数据最大值,当选取的这组数据中存在小于最小值的50%或大于最大值50%的数据,则这组数据就定为异常数据。
另一种筛选异常数据的方法:
假设数据集合为{DTf|f∈[1,g]},其中DTf为数据集合中第f个数据,为g数据集合中数据数量,如果数据小于第一阈值或者大于第二阈值,那么此数据为异常数据。
第一阈值
第二阈值
步骤3700,利用贝叶斯法则计算异常概率值,具体方法为:
贝叶斯法则原理
事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述。运用贝叶斯法则计算当知道异常现象A发生在多种异常事件B发生的条件下的概率,来计算多种异常事件B在异常现象A发生的条件下的概率。
配网异常概率计算
假设A事件为90%-100%的高损台区,共有M台区线损率为90%-100%,B事件为造成高损的事件组成{B1、B2、B3、…、Bn},这些事件分别包含的台区数为{m_1、m_2、m_3…m_n};
P(A/B1)=(B1事件造成高损的概率)
P(B1)=(B1事件概率)
根据贝叶斯公式,得出出现A事件时B1事件发生概率
P(B1/A)=
朴素贝叶斯分类器
朴素贝叶斯分类器的工作流程如下:
1:设D为样本训练集;每一个样本X是由n个属性值组成的,X=(x1,x2,…xn);对应的属性集为A1,A2,A3…An;
2:假设有m个类标签:C1,C2,…Cm.对于某待分类元X,朴素分类器会把P(Ci|X)(i=1,2,…m)值最大的那个类标签Ci认为是X的类别,即朴素贝叶斯分类器预测出X属于类Ci,当且仅当
P(Ci|X)>P(Cj|X)(1≤j≤m,j≠i).因此我们的目标就是找出P(Ci|X)中的最大值。
P(Ci|X)=P(X|Ci)P(Ci)/P(X)
对于给定的样本集,P(X)是常数,跟某个具体的类标签没有关联,所以要想找出P(Ci|X)的最大值也就是找出P(X|Ci)P(Ci)的最大值:
如果我们不知道P(Ci)的值,我们可以假设P(C1)=P(C2)=…=P(Cm),当然P(Ci)可以通过估计值来代替,P(Ci)=|Ci,D|/|D|
其中|D|为样本总数,|Ci,D|为D中属于类Ci的样本数。
3:如果n的值特别大,也就是说样本元有很多属性,那么对于P(X|Ci)的计算会相当复杂。所以在朴素贝叶斯中进行了一个假设:即对于样本元中的每个属性,它们都互相条件独立。
所以有:
对于P(xi|Ci)我们可以从训练集中算出来,其中xi代表在某个具体样本中对应属性Ai的值。P(xi|Ci)的计算分为两种情况:
1):如果属性Ai的值是分类变量(离散变量),那么P(xi|Ci)等于训练样本空间|D|中,属于类Ci并且对应属性Ai的值等于xi的数目除以样本空间中属于类Ci的样本数目。
2):如果Ai的值是连续型的变量,则P(xi|Ci)的计算会根据高斯分布来计算,设其中均值为μ,标准方差为σ:
P(X|Ci)=g(xk,μCi,σCi);
4:为了预测X所属的类标签,我们根据前面的步骤可以算出每一个类标签Ci对应的P(X|Ci)P(Ci)值,当某一个类标签Ci有:
P(X|Ci)P(Ci)>P(X|Cj)P(Cj)对于任意j:1≤j≤m,j≠i
则我们认为X属于类标签Ci.
结果应用
经以上计算出的P(B1/A)就是在异常事件B1在异常现象A发生的条件下的概率值,同理可以求出B2、B3等异常事件的概率,则概率值最大的异常事件就是异常现象A出现的情况下发生异常情况可能性最大的。
步骤3800,计算电量与线损的相关系数;
相关系数模型
相关系数是用以反映变量之间相关关系密切程度及其相关方向的统计指标,利用相关系数的性质,可以找出线损波动与那个台区电量波动呈相关程度及其相关方向,从而提高了降损效率。相关系数计算
给定两组向量x1和x2(替换之前x的为x1,y为x2),x1维度为p1,x2维度为p2,默认p1≤p2。形式化表示如下:
Σ是x的协方差矩阵;左上角是x1自己的协方差矩阵;右上角是Cov(x1,x2);左下角是Cov(x2,x1),也是Σ12的转置;右下角是x2的协方差矩阵。
从x1和x2的整体入手,定义
u=αTx 1v=bTx2
可以算出u和v的方差和协方差:
Var(u)=αTΣ11αVar(v)=bTΣ22b Cov(u,v)=αTΣ12b
最后,相关系数Corr(u,v)可以用以下公式计算得到:
线损与电量相关系数应用
假设线损率为X,电量为Y,计算X与Y的相关系数ρ_XY,选取一组线损率与电量,用四分位法剔除异常数据(高损、负损),剔除电量为0的数据,计算线损率与台区电量的相关系数ρ_XY,在满足相关性的条件下,ρ_XY为正数时,成正相关,ρ_XY为负数时,成负相关。
步骤3900,判断线损是否异常,具体方法为:
计算异常指数ψ=ln(eη*COR*e(1-η)*Corr)*P,其中COR为同期系数,Corr为相关系数,P为异常发生概率,η为预设实数常量,且η∈[0,1];
如果异常指数ψ∈[0.78,1],则判断线损异常。
其他与方法相同之处在此不赘述,详情请参照方法说明部分。
本发明实施例可以充分利用电力数据,对其进行深入分析,提供大量的高附加值服务,实现电量源头采集、线损自动生成、指标全过程监控、业务全方位贯通协同,实现电量与线损管理标准化、智能化、精益化和自动化,有力支撑公司坚强智能电网、现代配电网建设。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (5)
1.一种基于大数据的数据集成与线损分析计算的方法,其特征在于,包括以下步骤:
步骤0000,获取电力数据;
步骤1000,对所述电力数据进行集成;
步骤2000,根据步骤1000的电力数据计算电力线损;
步骤3000,对步骤2000获取的电力线损进行异常分析。
2.根据权利要求1所述的基于大数据的数据集成与线损分析计算的方法,其特征在于,所述步骤1000中使用正则表达式对电力数据进行集成。
3.根据权利要求1所述的基于大数据的数据集成与线损分析计算的方法,其特征在于,所述骤2000进一步包括:
步骤2200,将数据存储到分布式文件系统中;
步骤2400,读取所述分布式文件系统文件进行电量计算,将计算结果及电量数据存储到非结构化数据库中;
步骤2600,省公司层级完成电量计算后,通过数据中心将非结构化数据上传到总部非结构化数据库中,实时监听计算任务列表;
步骤2800,获取所述电量数据及线损计算模型,进行线损计算。
4.根据权利要求1所述的基于大数据的数据集成与线损分析计算的方法,其特征在于,所述步骤3000进一步包括:
步骤3200,获取电量及线损等数据信息;
步骤3400,计算供售的同期系数;
步骤3600,筛选异常数据;
步骤3700,利用贝叶斯法则计算异常概率值;
步骤3800,计算电量与线损的相关系数;
步骤3900,判断线损是否异常。
5.根据权利要求1所述的基于大数据的数据集成与线损分析计算的方法,其特征在于,所述步骤2800所述线损计算包括但不仅限于第一线损,第二线损,第三线损和第四线损;
其中第一线损为分区域线损,包括月统计分区线损率、月同期分区线损率、日同期分区线损率;
月统计分区线损率计算方法为:
其中为月统计分区线损率,为地区月统计供电量,为地区营销发行电量,SPLzn为地区供电量;
月同期分区线损率计算方法为:
其中为月同期分区线损率,为地区月同期供电量,为地区营销分段电量合计;
日同期分区线损率计算方法为:
其中为月同期分区线损率,为地区日同期供电量,为地区同期日售电量合计;
其中地区供电量计算方法为:
其中为地区电厂上网电量,为上级供入电量,为同级供入电量;
第二线损为分压线损,包括月统计分压线损率、月同期分压线损率、日分压同期线损率;
月统计分压线损率计算方法为:
其中为月统计分压线损率,为地区转入电量,为地区转出电量,为地区分压售电量;
月同期分压线损率计算方法为:
其中为月同期分压线损率,为地区营销分段售电量合计;
日同期分压线损率计算方法为:
其中为月同期分压线损率,为地区分压日售电量合计;
其中地区转入电量计算方法为:
其中INPother为其他单位转入电量,INPself为本单位其他电压等级转入电量,为其他电压等级反送电量,为下级单位同电压等级反送电量;
其中地区转出电量计算方法为:
其中OUTPother为其他单位转入电量,OUTPself为本单位其他电压等级转入电量,为其他电压等级反送电量,为下级单位同电压等级反送电量;
第三线损为分元件线损,包括站损率、主变损耗率、母线损耗率和输电线路损耗率;
站损率计算方法为:
其中为站损率,为站输入电量,为站输出电量;
主变损耗率计算方法为:
其中为主变损耗率,为主变输入电量,为主变输出电量;
母线损耗率计算方法为:
其中为母线损耗率,为母线输入电量,为母线输出电量;
输电线路损耗率计算方法为:
其中为输电线路损耗率,为线路输入电量,为线路输出电量;
第四线损为分台区线损,包括台区月统计线损率、台区月同期线损率和台区日同期线损率;
台区月统计线损率计算方法为:
其中为台区月统计线损率,为台区月统计供电量,为台区用户发行电量,表示对所有台区用户发行电量求和;
台区月同期线损率计算方法为:
其中为台区月同期线损率,为台区月同期供电量,为台区月同期售电量,表示对所有台区月同期售电量求和;
台区日同期线损率计算方法为:
其中为台区日同期线损率,为台区日同期供电量,为台区日同期售电量,表示对所有台区日同期售电量求和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610895912.9A CN106570778B (zh) | 2016-10-14 | 2016-10-14 | 一种基于大数据的数据集成与线损分析计算的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610895912.9A CN106570778B (zh) | 2016-10-14 | 2016-10-14 | 一种基于大数据的数据集成与线损分析计算的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106570778A true CN106570778A (zh) | 2017-04-19 |
CN106570778B CN106570778B (zh) | 2017-10-31 |
Family
ID=58532847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610895912.9A Active CN106570778B (zh) | 2016-10-14 | 2016-10-14 | 一种基于大数据的数据集成与线损分析计算的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106570778B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527114A (zh) * | 2017-08-09 | 2017-12-29 | 国网信通亿力科技有限责任公司 | 一种基于大数据的线路台区异常分析方法 |
CN107832855A (zh) * | 2017-09-14 | 2018-03-23 | 北京中恒博瑞数字电力科技有限公司 | 基于相关性分析的线损多源诊断方法及系统 |
CN107862467A (zh) * | 2017-11-23 | 2018-03-30 | 国网辽宁省电力有限公司 | 一种基于大数据平台的电网综合数据指标监测方法及系统 |
CN108090636A (zh) * | 2018-02-09 | 2018-05-29 | 国网江苏省电力有限公司电力科学研究院 | 一种基于分压线损模型的线损率趋势预测方法 |
CN108710990A (zh) * | 2018-04-19 | 2018-10-26 | 国网天津市电力公司 | 基于同期数据的线变台户多级线损分析方法及系统 |
CN109977535A (zh) * | 2019-03-22 | 2019-07-05 | 南方电网科学研究院有限责任公司 | 一种线损异常诊断方法、装置、设备及可读存储介质 |
CN110174577A (zh) * | 2019-07-05 | 2019-08-27 | 广东电网有限责任公司 | 一种用于10kV及以上母线的线损异常判别方法 |
CN110188122A (zh) * | 2019-05-15 | 2019-08-30 | 电子科技大学 | 一种用于不同线损行为间的关联关系分析方法 |
CN110320445A (zh) * | 2019-07-05 | 2019-10-11 | 广东电网有限责任公司 | 一种用于110kV及以上母线的线损异常判别方法 |
CN110703009A (zh) * | 2019-09-23 | 2020-01-17 | 国网辽宁省电力有限公司丹东供电公司 | 台区线损率异常分析及处理方法 |
CN110736888A (zh) * | 2019-10-24 | 2020-01-31 | 国网上海市电力公司 | 一种用户用电行为异常的监测方法 |
CN110991825A (zh) * | 2019-11-18 | 2020-04-10 | 国网浙江宁波市鄞州区供电有限公司 | 基于大数据的线损判定方法 |
CN111507013A (zh) * | 2020-04-27 | 2020-08-07 | 国网山西省电力公司 | 一种面向电力系统线损故障定位实现方法 |
CN112241806A (zh) * | 2020-07-31 | 2021-01-19 | 深圳市综合交通运行指挥中心 | 道路破损概率预测方法、装置终端设备及可读存储介质 |
CN112666420A (zh) * | 2021-03-18 | 2021-04-16 | 国网山东省电力公司安丘市供电公司 | 输变电设备线损异常检测方法、系统、终端及存储介质 |
CN113156358A (zh) * | 2021-03-19 | 2021-07-23 | 国网陕西省电力公司营销服务中心(计量中心) | 一种架空输电线路异常线损分析方法及系统 |
CN113469486A (zh) * | 2021-04-19 | 2021-10-01 | 国网河北省电力有限公司电力科学研究院 | 一种线路负损及高损的分析方法 |
CN114441892A (zh) * | 2021-12-27 | 2022-05-06 | 国网江西省电力有限公司电力科学研究院 | 一种10kV线路异常线损配电变压器定位方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102545213A (zh) * | 2012-01-11 | 2012-07-04 | 藁城市供电公司 | 电网线损实时管理系统及方法 |
CN105260944A (zh) * | 2015-10-10 | 2016-01-20 | 燕山大学 | 一种基于lssvm算法与关联规则挖掘的统计线损计算方法 |
-
2016
- 2016-10-14 CN CN201610895912.9A patent/CN106570778B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102545213A (zh) * | 2012-01-11 | 2012-07-04 | 藁城市供电公司 | 电网线损实时管理系统及方法 |
CN105260944A (zh) * | 2015-10-10 | 2016-01-20 | 燕山大学 | 一种基于lssvm算法与关联规则挖掘的统计线损计算方法 |
Non-Patent Citations (2)
Title |
---|
冷华 等: "基于功率或电量预测的智能配电网统计线损同期化方法", 《电力系统保护与控制》 * |
胡军伟 等: "正则表达式在Web信息抽取中的应用", 《北京信息科技大学学报》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527114B (zh) * | 2017-08-09 | 2019-04-23 | 国网信通亿力科技有限责任公司 | 一种基于大数据的线路台区异常分析方法 |
CN107527114A (zh) * | 2017-08-09 | 2017-12-29 | 国网信通亿力科技有限责任公司 | 一种基于大数据的线路台区异常分析方法 |
CN107832855B (zh) * | 2017-09-14 | 2020-08-21 | 北京中恒博瑞数字电力科技有限公司 | 基于相关性分析的线损多源诊断方法及系统 |
CN107832855A (zh) * | 2017-09-14 | 2018-03-23 | 北京中恒博瑞数字电力科技有限公司 | 基于相关性分析的线损多源诊断方法及系统 |
CN107862467A (zh) * | 2017-11-23 | 2018-03-30 | 国网辽宁省电力有限公司 | 一种基于大数据平台的电网综合数据指标监测方法及系统 |
CN108090636A (zh) * | 2018-02-09 | 2018-05-29 | 国网江苏省电力有限公司电力科学研究院 | 一种基于分压线损模型的线损率趋势预测方法 |
CN108090636B (zh) * | 2018-02-09 | 2021-06-08 | 国网江苏省电力有限公司电力科学研究院 | 一种基于分压线损模型的线损率趋势预测方法 |
CN108710990A (zh) * | 2018-04-19 | 2018-10-26 | 国网天津市电力公司 | 基于同期数据的线变台户多级线损分析方法及系统 |
CN109977535A (zh) * | 2019-03-22 | 2019-07-05 | 南方电网科学研究院有限责任公司 | 一种线损异常诊断方法、装置、设备及可读存储介质 |
CN109977535B (zh) * | 2019-03-22 | 2023-05-02 | 南方电网科学研究院有限责任公司 | 一种线损异常诊断方法、装置、设备及可读存储介质 |
CN110188122A (zh) * | 2019-05-15 | 2019-08-30 | 电子科技大学 | 一种用于不同线损行为间的关联关系分析方法 |
CN110174577B (zh) * | 2019-07-05 | 2021-05-28 | 广东电网有限责任公司 | 一种用于10kV及以上母线的线损异常判别方法 |
CN110174577A (zh) * | 2019-07-05 | 2019-08-27 | 广东电网有限责任公司 | 一种用于10kV及以上母线的线损异常判别方法 |
CN110320445B (zh) * | 2019-07-05 | 2021-05-28 | 广东电网有限责任公司 | 一种用于110kV及以上母线的线损异常判别方法 |
CN110320445A (zh) * | 2019-07-05 | 2019-10-11 | 广东电网有限责任公司 | 一种用于110kV及以上母线的线损异常判别方法 |
CN110703009B (zh) * | 2019-09-23 | 2022-03-18 | 国网辽宁省电力有限公司丹东供电公司 | 台区线损率异常分析及处理方法 |
CN110703009A (zh) * | 2019-09-23 | 2020-01-17 | 国网辽宁省电力有限公司丹东供电公司 | 台区线损率异常分析及处理方法 |
CN110736888A (zh) * | 2019-10-24 | 2020-01-31 | 国网上海市电力公司 | 一种用户用电行为异常的监测方法 |
CN110991825A (zh) * | 2019-11-18 | 2020-04-10 | 国网浙江宁波市鄞州区供电有限公司 | 基于大数据的线损判定方法 |
CN111507013A (zh) * | 2020-04-27 | 2020-08-07 | 国网山西省电力公司 | 一种面向电力系统线损故障定位实现方法 |
CN112241806A (zh) * | 2020-07-31 | 2021-01-19 | 深圳市综合交通运行指挥中心 | 道路破损概率预测方法、装置终端设备及可读存储介质 |
CN112666420A (zh) * | 2021-03-18 | 2021-04-16 | 国网山东省电力公司安丘市供电公司 | 输变电设备线损异常检测方法、系统、终端及存储介质 |
CN113156358A (zh) * | 2021-03-19 | 2021-07-23 | 国网陕西省电力公司营销服务中心(计量中心) | 一种架空输电线路异常线损分析方法及系统 |
CN113156358B (zh) * | 2021-03-19 | 2023-09-22 | 国网陕西省电力公司营销服务中心(计量中心) | 一种架空输电线路异常线损分析方法及系统 |
CN113469486A (zh) * | 2021-04-19 | 2021-10-01 | 国网河北省电力有限公司电力科学研究院 | 一种线路负损及高损的分析方法 |
CN114441892A (zh) * | 2021-12-27 | 2022-05-06 | 国网江西省电力有限公司电力科学研究院 | 一种10kV线路异常线损配电变压器定位方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106570778B (zh) | 2017-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570778B (zh) | 一种基于大数据的数据集成与线损分析计算的方法 | |
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN110390465A (zh) | 业务数据的风控分析处理方法、装置和计算机设备 | |
US20150161545A1 (en) | Visualization of spare parts inventory | |
CN111552686B (zh) | 一种电力数据质量评估方法及其装置 | |
CN112860769B (zh) | 一种能源规划数据管理系统 | |
CN113516417A (zh) | 基于智能建模的业务评估方法、装置、电子设备及介质 | |
CN104574141A (zh) | 一种业务影响度分析方法 | |
CN112651534B (zh) | 一种预测资源供应链需求量的方法、装置及存储介质 | |
CN112052966A (zh) | 基于现场抢修工单的电力客户满意度分析系统和方法 | |
CN113590607A (zh) | 一种基于报表因子的电力营销报表实现方法和系统 | |
CN115269958A (zh) | 互联网可靠性数据信息采集分析系统 | |
CN116843378A (zh) | 一种基于深度学习的五金配件供应预测方法及系统 | |
CN113852204A (zh) | 一种于数字孪生的变电站三维全景监视系统及方法 | |
CN112102003A (zh) | 基于大数据平台用电客户核心资源管理系统及方法 | |
CN115617784A (zh) | 一种信息化配电的数据处理系统及其处理方法 | |
CN115730749A (zh) | 基于融合电力数据的电力调度风险预警方法及装置 | |
CN115409120A (zh) | 一种基于数据驱动的用户窃电行为检测辅助方法 | |
CN117155771B (zh) | 一种基于工业物联网的设备集群故障溯源方法及装置 | |
CN114372835B (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 | |
CN111127186A (zh) | 一种基于大数据技术的客户信用等级评价体系的使用方法 | |
CN116862209A (zh) | 一种新能源汽车充电设施管理方法及系统 | |
CN115908082A (zh) | 基于用电特征指标的企业排污监控方法及装置 | |
CN113537519B (zh) | 一种识别异常设备的方法和装置 | |
CN115544276A (zh) | 计量装置知识图谱构建方法和计量装置档案核查方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |