Nothing Special   »   [go: up one dir, main page]

CN108268997A - 一种电网变电站数据质量考核方法 - Google Patents

一种电网变电站数据质量考核方法 Download PDF

Info

Publication number
CN108268997A
CN108268997A CN201711186150.6A CN201711186150A CN108268997A CN 108268997 A CN108268997 A CN 108268997A CN 201711186150 A CN201711186150 A CN 201711186150A CN 108268997 A CN108268997 A CN 108268997A
Authority
CN
China
Prior art keywords
data
quality
identification
rule
refers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711186150.6A
Other languages
English (en)
Inventor
李润秋
陈振光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NARI Group Corp
Economic and Technological Research Institute of State Grid Shaanxi Electric Power Co Ltd
Original Assignee
NARI Group Corp
Economic and Technological Research Institute of State Grid Shaanxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NARI Group Corp, Economic and Technological Research Institute of State Grid Shaanxi Electric Power Co Ltd filed Critical NARI Group Corp
Priority to CN201711186150.6A priority Critical patent/CN108268997A/zh
Publication of CN108268997A publication Critical patent/CN108268997A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于电网调度自动化系统技术领域,公开了一种电网变电站数据质量考核方法。本发明通过配置规则,实现自动识别数据质量、问题定位、问题纠错等功能,帮助管理人员快速发现、判断、解决数据中存在的质量问题。本发明能够为电网高级应用提供高质量高可靠的数据支撑,满足日常关键指标的考核要求,完善了量测数据质量考核体系。

Description

一种电网变电站数据质量考核方法
技术领域
本发明属于电网调度自动化系统技术领域,具体是涉及一种电网变电站数据质量考核的方法。
背景技术
随着电网智能化建设的飞速发展和生产业务系统采集量测数据的持续积累,基础数据已成为电网生产指挥、运行分析控制以及各种生产管理工作的重要信息来源。越来越多的管理决策、市场营销和客户服务都建立在面向量测数据的分析基础上,其质量的好坏对于电网安全、优质、经济运行具有重要的意义,对实现大电网智能调度、分析决策和智能控制起着关键作用。
然而,在数据的采集、数据的处理等过程中,由于传输通道、后台计算服务、存储架构以及其他相关因素,不可避免的产生数据质量问题,如:遥信误动、数据延迟上送、采集数据项缺失、数据跳变、毛刺等。这些数据质量问题严重影响了基于此量测数据相关应用以辅助决策的准确性,降低工作效率,增加工作成本。
为此,《基于电网调度自动化基础数据质量整治的探讨》(作者李贺平、王倩,“机械与自动化”,2013,11:98-99)提出了影响数据质量的几大方面因素。《电力调度自动化技术中基础数据质量综合分析与整治》(作者翟璇、攀红克,“数字技术与应用”,2011,12:166-167)主要针对存在的数据质量问题,提出了一些整治对策,主要采取人工的检测和预防的方式。《基于CIM/E的电网调度系统数据质量优化方法》(作者丁盛舟、李永光、杜鹏、孟鑫等,“电力系统保护与控制”,2016,44(3):129-131)则提出了基于CIM/E的数据质量优化方法,在一定程度上提升了数据质量。但是,总体而言,这些文献仍未能为辅助管理人员快速发现、判断并解决数据中存在的质量问题提供显著帮助。
发明内容
本发明目的是:为了克服现有技术中存在的不足,本发明提供一种电网变电站数据质量考核的方法。该方法能够为电网应用提供高质量高可靠的量测数据支撑,完善量测数据质量考核体系,辅助运维人员及时定位问题并纠错,分析问题原因,对过程数据和源头数据进行消缺。
具体地说,本发明是采用以下技术方案实现的,包括以下步骤:
1)针对电网变电站多源数据,提供多源数据适配器以及ETL工具,配置源端系统一个或者多个数据库参数,根据数据源类型选择数据源驱动适配器,连接数据库,并进行连通验证,预览数据;
2)选择启动使用的内置简单识别规则,根据需要界面配置规则识别所需参数,结合业务逻辑,编写识别数据问题的脚本规则并保存启用,通过打包成插件后进行加载启用实现嵌入式逻辑判断;
3)配置问题识别流程,然后设置每个流程节点包含的识别规则,并设置相应节点规则执行的顺序,接着设置流程执行周期的触发时间,设置相应流程执行后识别问题结果及关联明细表名和数据存放周期等,最后设置流程执行日志参数;
通过以上设置,识别相关日志,进行问题记录,得到过程数据明细;
4)查看问题统计图表,按照问题分类、时间及模型维度展现问题分布;
查看问题明细,从识别流程、识别规则、模型维度时间查看问题明细;
5)首先查看对应原始数据记录,接着查看过程关联数据明细,最后分析流程日志记录,从而对问题进行精准定位;
6)针对具体问题,提供纠错工具,给出问题消缺手段和预估建议,提供包括历史同期、线性茶汁、最近历史、人工置数在内的多种数据预估补救方法,辅助完成异常数据的修补,同时提供批量配置等操作手段,辅助人工介入快速完成纠错工作。
上述技术方案的进一步特征在于,所述步骤1)中的数据库包括关系数据库、实时数据库或HBase数据库。
上述技术方案的进一步特征在于,所述步骤2)中,对数据质量进行完整性、一致性、有效性、及时性、唯一性以及精确性的识别,其中:
所述完整性,是指数据是否存在缺失记录或者缺失字段;
所述一致性,是指同一实体的同一属性的值在不同系统或数据集中是否一致;
所述有效性,是指数据是否满足用户定义的条件或者在一定的阈值范围内;
所述及时性,是指数据操作的及时和快速;
所述唯一性,是指数据是否存在重复记录;
所述精确性,是指数据是否与其对应的客观实体的特征相一致。
本发明的有益效果如下:本发明通过数据质量的识别、展现以及辅助纠错等,能够帮助管理人员快速发现、判断、解决数据中存在的质量问题,为高级应用提供高质量高可靠的数据支撑,满足日常关键指标的考核要求,完善了量测数据质量考核体系。
附图说明
图1是本发明方法的示意图。
具体实施方式
下面结合实施例并参照附图对本发明作进一步详细描述。
实施例1:
本发明的一个实施例,其主要步骤如图1所示。
步骤1:配置数据源。针对电网变电站多源数据,提供多源数据适配器以及ETL工具,满足数据质量检查分析对多种类型数据源的访问、抽取等需求。通过ETL工具、JDBC配置源端系统一个或者多个数据库的连接地址、端口等参数,根据数据源类型选择数据源驱动适配器,连接数据库,并进行连通验证,预览数据。数据库包括关系数据库、实时数据库或HBase数据库。数据质量分析采用分布式缓存、大数据处理技术,storm、spark steaming等流处理,spark内存并行计算、kafka分布式消息队列等,满足大规模量测数据质量识别需求
步骤2:规则配置。选择启动使用的内置简单识别规则,根据需要界面人工配置规则识别所需参数,结合业务逻辑,编写识别数据问题的脚本规则并保存启用,而基于负责业务逻辑识别的问题,需要实现特定接口打包成插件后进行加载启用实现嵌入式逻辑判断。采用脚本解析组件、嵌入式程序加载组件等多种组件支持多类型规则的配置。
根据电网调度数据的特性,数据质量度量规则主要包括完整性、一致性、有效性、及时性、唯一性以及精确性等六个方面。
1)完整性:描述数据是否存在缺失记录或者缺失字段;如:数据采集项缺失、数据项空值等。
2)一致性:描述同一实体的同一属性的值在不同系统或数据集中是否一致;如:多源系统相同字段数值一致性判断、遥信变位与SOE时间不一致、交流线段两端数据不一致等。
3)有效性:描述数据是否满足用户定义的条件或者在一定的阈值范围内;如:数据越限、毛刺、数据跳变、母线不平衡等。
4)及时性:描述数据刷新、修改和提取等操作的及时性和快速性;如:电网数据上送及时性等。
5)唯一性:描述数据是否存在重复记录;如:数据字段重复、同一数据在规定频率内多次送入等。
6)精确性:描述数据是否与其对应的客观实体的特征相一致。如:EMS开关、刀闸等设备遥信误动等。
步骤3:问题记录。首先配置问题识别流程,然后设置每个流程节点包含的识别规则,并设置该节点规则执行的顺序,接着设置流程执行周期的触发时间,设置该流程执行后识别问题结果及关联明细表名和数据存放周期等,最后设置流程执行日志参数。通过以上设置,识别相关日志,进行问题记录,得到过程数据明细。
在数据质量问题识别过程中,由简单到复杂,主要分为以下5个层次:
1)简单识别。如:数据空值、字段重复等。
2)配置规则识别、结合模型简单识别。如:多源字段不一致、遥测越限等。
3)复杂业务逻辑识别。如:遥信误动等。
4)结合模型的复杂业务逻辑识别。如:开关遥测不一致、数据跳变等。
5)人工介入识别。根据前四层的识别,对识别结果进行核实。
识别过程如下:首先选择识别的维度,包括:区域、电压等级、变电站、设备类型、量测类型等,然后根据内置判断规则、人工配置规则、嵌入式逻辑判断进行识别。
步骤4:问题展示。查看问题统计图表,按照问题分类、时间及模型维度展现问题分布;查看问题明细,从识别流程、识别规则、模型维度时间等角度查看问题明细。采用报表组件、统计组件及纠错组件通过查询服务、SQL接口统计展现识别问题的结果。
步骤5:问题定位。首先查看对应原始数据记录,接着查看过程关联数据明细,最后分析流程日志记录,从而对问题进行精准定位。
步骤6:问题纠错。针对具体问题,提供纠错工具,给出问题消缺手段和预估建议,提供历史同期、线性茶汁、最近历史、人工置数等多种数据预估补救方法,辅助完成异常数据的修补,同时提供批量配置等操作手段,辅助人工介入快速完成纠错工作。
总而言之,本实施例的方法,面向调度等量测数据,通过配置规则,自动识别数据质量问题,可采用单机、服务器以及两级部署模式,适用于供电电压检测系统、调度自动化系统、全业务数据中心等涉及量测数据业务系统。通过数据质量的识别、展现以及辅助纠错等,能够帮助管理人员快速发现、判断、解决数据中存在的质量问题,为高级应用提供高质量高可靠的数据支撑,满足日常关键指标的考核要求,完善了量测数据质量考核体系。
虽然本发明已以较佳实施例公开如上,但实施例并不是用来限定本发明的。在不脱离本发明之精神和范围内,所做的任何等效变化或润饰,同样属于本发明之保护范围。因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

Claims (3)

1.一种电网变电站数据质量考核方法,其特征在于,包括以下步骤:
1)针对电网变电站多源数据,提供多源数据适配器以及ETL工具,配置源端系统一个或者多个数据库参数,根据数据源类型选择数据源驱动适配器,连接数据库,并进行连通验证,预览数据;
2)选择启动使用的内置简单识别规则,根据需要界面配置规则识别所需参数,结合业务逻辑,编写识别数据问题的脚本规则并保存启用,通过打包成插件后进行加载启用实现嵌入式逻辑判断;
3)配置问题识别流程,然后设置每个流程节点包含的识别规则,并设置相应节点规则执行的顺序,接着设置流程执行周期的触发时间,设置相应流程执行后识别问题结果及关联明细表名和数据存放周期等,最后设置流程执行日志参数;
通过以上设置,识别相关日志,进行问题记录,得到过程数据明细;
4)查看问题统计图表,按照问题分类、时间及模型维度展现问题分布;
查看问题明细,从识别流程、识别规则、模型维度时间查看问题明细;
5)首先查看对应原始数据记录,接着查看过程关联数据明细,最后分析流程日志记录,从而对问题进行精准定位;
6)针对具体问题,提供纠错工具,给出问题消缺手段和预估建议,提供包括历史同期、线性茶汁、最近历史、人工置数在内的多种数据预估补救方法,辅助完成异常数据的修补,同时提供批量配置等操作手段,辅助人工介入快速完成纠错工作。
2.根据权利要求1所述的电网变电站数据质量考核方法,其特征在于,所述步骤1)中的数据库包括关系数据库、实时数据库或HBase数据库。
3.根据权利要求1所述的电网变电站数据质量考核方法,其特征在于,所述步骤2)中,对数据质量进行完整性、一致性、有效性、及时性、唯一性以及精确性的识别,其中:
所述完整性,是指数据是否存在缺失记录或者缺失字段;
所述一致性,是指同一实体的同一属性的值在不同系统或数据集中是否一致;
所述有效性,是指数据是否满足用户定义的条件或者在一定的阈值范围内;
所述及时性,是指数据操作的及时和快速;
所述唯一性,是指数据是否存在重复记录;
所述精确性,是指数据是否与其对应的客观实体的特征相一致。
CN201711186150.6A 2017-11-23 2017-11-23 一种电网变电站数据质量考核方法 Pending CN108268997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711186150.6A CN108268997A (zh) 2017-11-23 2017-11-23 一种电网变电站数据质量考核方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711186150.6A CN108268997A (zh) 2017-11-23 2017-11-23 一种电网变电站数据质量考核方法

Publications (1)

Publication Number Publication Date
CN108268997A true CN108268997A (zh) 2018-07-10

Family

ID=62770879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711186150.6A Pending CN108268997A (zh) 2017-11-23 2017-11-23 一种电网变电站数据质量考核方法

Country Status (1)

Country Link
CN (1) CN108268997A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947833A (zh) * 2019-02-27 2019-06-28 浪潮软件集团有限公司 一种基于b/s架构的数据质量管理方法
CN110347741A (zh) * 2019-07-18 2019-10-18 普元信息技术股份有限公司 大数据处理过程中有效提升输出成果数据质量的系统及其控制方法
CN111221956A (zh) * 2019-12-26 2020-06-02 国网宁夏电力有限公司中卫供电公司 一种电力管理系统pms配网设备数据质量核查方法
CN111552686A (zh) * 2020-05-08 2020-08-18 国网四川省电力公司信息通信公司 一种电力数据质量评估方法及其装置
CN112541832A (zh) * 2020-11-27 2021-03-23 江苏瑞中数据股份有限公司 一种基于数据中台的数据质量管理平台
CN114168573A (zh) * 2020-09-10 2022-03-11 广东电网有限责任公司东莞供电局 一种基于可编排组件的数据质量治理技术
CN114169654A (zh) * 2020-09-10 2022-03-11 广东电网有限责任公司东莞供电局 一种以数据质量为核心的电网调度数据治理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571403A (zh) * 2010-12-31 2012-07-11 北京亿阳信通软件研究院有限公司 通用数据质量管控适配器的实现方法和装置
CN104850635A (zh) * 2015-05-24 2015-08-19 华东电网有限公司 一种多数据源环境下数据缺失自动检查及集中监控方法
CN106339509A (zh) * 2016-10-26 2017-01-18 国网山东省电力公司临沂供电公司 一种基于大数据技术的电网运营数据共享系统
CN106557991A (zh) * 2016-11-04 2017-04-05 广东电网有限责任公司电力科学研究院 电压监测数据平台
CN106600114A (zh) * 2016-11-25 2017-04-26 国网河南省电力公司电力科学研究院 一种采集运维系统多维度质量评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571403A (zh) * 2010-12-31 2012-07-11 北京亿阳信通软件研究院有限公司 通用数据质量管控适配器的实现方法和装置
CN104850635A (zh) * 2015-05-24 2015-08-19 华东电网有限公司 一种多数据源环境下数据缺失自动检查及集中监控方法
CN106339509A (zh) * 2016-10-26 2017-01-18 国网山东省电力公司临沂供电公司 一种基于大数据技术的电网运营数据共享系统
CN106557991A (zh) * 2016-11-04 2017-04-05 广东电网有限责任公司电力科学研究院 电压监测数据平台
CN106600114A (zh) * 2016-11-25 2017-04-26 国网河南省电力公司电力科学研究院 一种采集运维系统多维度质量评价方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947833A (zh) * 2019-02-27 2019-06-28 浪潮软件集团有限公司 一种基于b/s架构的数据质量管理方法
CN110347741A (zh) * 2019-07-18 2019-10-18 普元信息技术股份有限公司 大数据处理过程中有效提升输出成果数据质量的系统及其控制方法
CN110347741B (zh) * 2019-07-18 2023-05-05 普元信息技术股份有限公司 大数据处理过程中有效提升输出成果数据质量的系统及其控制方法
CN111221956A (zh) * 2019-12-26 2020-06-02 国网宁夏电力有限公司中卫供电公司 一种电力管理系统pms配网设备数据质量核查方法
CN111552686A (zh) * 2020-05-08 2020-08-18 国网四川省电力公司信息通信公司 一种电力数据质量评估方法及其装置
CN111552686B (zh) * 2020-05-08 2023-05-16 国网四川省电力公司信息通信公司 一种电力数据质量评估方法及其装置
CN114168573A (zh) * 2020-09-10 2022-03-11 广东电网有限责任公司东莞供电局 一种基于可编排组件的数据质量治理技术
CN114169654A (zh) * 2020-09-10 2022-03-11 广东电网有限责任公司东莞供电局 一种以数据质量为核心的电网调度数据治理方法
CN112541832A (zh) * 2020-11-27 2021-03-23 江苏瑞中数据股份有限公司 一种基于数据中台的数据质量管理平台

Similar Documents

Publication Publication Date Title
CN108268997A (zh) 一种电网变电站数据质量考核方法
AU2022204116B2 (en) Verification method for electrical grid measurement data
CN106019084B (zh) 基于配用电数据关联的中压配电网断线故障诊断方法
CN106815373B (zh) 基于bi分析的配网抢修大数据展示方法及系统
CN106124935A (zh) 中低压配电网络故障定位方法
CN103679554B (zh) 电网事故分闸辅助分析方法
CN111160791A (zh) 一种基于gbdt算法及因素融合的异常用户识别方法
CN108647328B (zh) 可靠性停电事件采集完整性分析与自动补全方法
CN108010305B (zh) 一种综合能源管理平台数据采集故障的自诊断方法
CN101499659B (zh) 基于基尔霍夫电流定律的变电站分布式状态估计方法
CN105119282A (zh) 一种电网理论线损在线计算系统及方法
CN102800030B (zh) 地区电网继电保护设备综合可靠性互动迭代评估方法
CN110738415A (zh) 基于用电采集系统和离群点算法的窃电用户分析方法
CN110555619A (zh) 一种基于智能配电网的供电能力评估方法
CN103631245A (zh) 一种配电终端缺陷诊断系统及方法
CN112366690B (zh) 一种基于强同步电压特征匹配的低压台区横向节点关系识别方法
CN111274056B (zh) 智能电能表故障库的自学习方法与装置
CN111984656B (zh) 智能变电站自动化设备基础数据关键参数校核方法及系统
CN104834305A (zh) 基于dms系统的配网自动化终端遥测异常分析系统及方法
CN110703183A (zh) 一种智能电能表故障数据分析方法及系统
CN109272249A (zh) 一种基于台区识别仪的台区线损消缺方法
CN112821566B (zh) 一种配网故障遥控介入处理的智能统计方法及装置
CN109687592A (zh) 变电站信息显示控制方法、装置及电子设备
CN114421617A (zh) 一种基于配网运行监测数据的中压故障研判方法
CN112446619B (zh) 配电网抢修处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180710

RJ01 Rejection of invention patent application after publication