CN111340253B - 一种主网检修申请单的解析方法及系统 - Google Patents
一种主网检修申请单的解析方法及系统 Download PDFInfo
- Publication number
- CN111340253B CN111340253B CN202010097010.7A CN202010097010A CN111340253B CN 111340253 B CN111340253 B CN 111340253B CN 202010097010 A CN202010097010 A CN 202010097010A CN 111340253 B CN111340253 B CN 111340253B
- Authority
- CN
- China
- Prior art keywords
- equipment
- text
- application form
- semantic
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 54
- 238000004458 analytical method Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 50
- 238000012544 monitoring process Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003491 array Methods 0.000 claims description 2
- 230000008521 reorganization Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- KZNIFHPLKGYRTM-UHFFFAOYSA-N apigenin Chemical compound C1=CC(O)=CC=C1C1=CC(=O)C2=C(O)C=C(O)C=C2O1 KZNIFHPLKGYRTM-UHFFFAOYSA-N 0.000 description 2
- 229940117893 apigenin Drugs 0.000 description 2
- XADJWCRESPGUTB-UHFFFAOYSA-N apigenin Natural products C1=CC(O)=CC=C1C1=CC(=O)C2=CC(O)=C(O)C=C2O1 XADJWCRESPGUTB-UHFFFAOYSA-N 0.000 description 2
- 235000008714 apigenin Nutrition 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003796 beauty Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提出了一种主网检修申请单的解析方法及系统,解析方法包括如下步骤:获取电网设备模型,获取检修申请单;根据电网设备模型,以设备名称作为识别词,建立设备词典;根据设备命名规则和设备状态规则,建立包含检修设备、安全措施内容的文本解析模型;根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到电网设备对象化信息。通过依据设备命名规则和设备状态规则建立文本解析模型,将检修人员输入的文本信息进行了重新排序并解析语义,提取文本信息中的关键内容,生成对应的文本数据的对象化信息,可以实现快捷准确的解析结果。
Description
技术领域
本公开涉及电力系统相关技术领域,具体的说,是涉及一种主网检修申请单的解析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,并不必然构成在先技术。
电网设备的检修分为计划检修和临时检修,计划检修是按照预先编制的检修计划进行检修,临时检修是在电网设备发生缺陷或故障时进行检修。检修人员根据检修目的和范围,在主网调控操作管理平台填写检修申请单,提交给相关单位部门和领导进行审核审批,检修设备一般包括线路、主变、母线、电容器、开关、刀闸和PT,安全措施一般是将检修范围的设备转到冷备用或检修状态。
调度班是检修申请单流转过程中的最重要环节,检修申请单流转到调度班人员后,调度班人员根据检修申请单的检修设备和安全措施,对检修范围的设备进行停电、送电等调度操作。
检修工作多样化,检修人员在检修申请单包含检修设备、检修的安全措施等多种信息,检修单中有些项次设置了选择信息,通过选择信息可以直接选择对象化信息,主网调控操作管理平台可以直接识别对象化信息对应的检修任务输出识别结果,检修单中有的内容是检修申请人员直接输入的文字信息,主网调控操作管理平台就不能直接输出解析结果,需要调度人员对检修单进行人工校核,浪费校核时间。或者,由于检修申请单中的设备对象化信息不完善,主网调控操作管理平台一般只能根据已知的设备对象化信息对检修申请单进行校核,校核结果无法保证准确性和完整性。因此,在检修申请单流转到调度班人员时,有的调度班人员忽略平台的校核结果,根据操作规则和自己的经验对检修申请单进行校核,一方面主观因素较强,容易出差错,另一方面效率低下,大大降低了调度人员的工作效率。
发明内容
本公开为了解决上述问题,提出了一种主网检修申请单的解析方法及系统,从主站监控系统获取电网设备模型,从主网调控操作管理平台获取检修申请单,以设备命名规则、设备状态规则为依据,采用文本解析算法,对检修申请单的检修设备、安全措施进行对象化识别,将识别结果返回给主网调控操作管理平台。
为了实现上述目的,本公开采用如下技术方案:
一个或多个实施例提供了一种主网检修申请单的解析方法,包括如下步骤:
获取电网设备模型,获取检修申请单;
根据电网设备模型,以设备名称作为识别词,建立设备词典;
根据设备命名规则和设备状态规则,建立包含检修设备、安全措施内容的文本解析模型;
根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到电网设备对象化信息。
一个或多个实施例提供了一种主网检修申请单的解析系统,包括:
读取模块:用于获取电网设备模型,获取检修申请单;
设备词典建立模块:用于根据电网设备模型,以设备名称作为识别词,建立设备词典;
文本解析模型建立模块:用于根据设备命名规则、设备状态规则,建立包含检修设备、安全措施内容的文本解析模型;
解析模块:用于根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到电网设备对象化信息。
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法所述的步骤。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法所述的步骤。
与现有技术相比,本公开的有益效果为:
(1)本公开从主站监控系统获取电网设备模型,从主网调控操作管理平台获取检修申请单,以设备命名规则、设备状态规则为依据,采用文本解析算法,对检修申请单的检修设备、安全措施进行对象化识别,将识别结果返回给主网调控操作管理平台,使其能够得到完整准确的设备对象化信息,实现自动化解析检修申请单。
(2)不同检修人员对于设备的对象化数据了解不同,不同人员对于同一检修的描述文本存在差异,通过依据设备命名规则和设备状态规则建立文本解析模型,将检修人员输入的文本信息进行了重新排序并解析语义,提取文本信息中的关键内容,生成对应的文本数据的对象化信息,可以实现快捷准确的解析。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的限定。
图1是本公开实施例1解析方法的流程图;
图2是本公开实施例2的系统框图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。需要说明的是,在不冲突的情况下,本公开中的各个实施例及实施例中的特征可以相互组合。下面将结合附图对实施例进行详细描述。
技术术语解释
对象化信息:电力系统模型基于IEC 61970及CIM/E标准定义对象及相互关系。需要从通用性角度出发,面向电网、设备、元件、系统、控制断面、组织机构、设备状态、设备操作、公用对象等电力调度相关元素的通用数据对象进行建模,对电力调控业务对象和对象之间关系进行抽象建模和分表设计,为调控管理业务提供通用的基础信息模型。电力调度数据对象需要在多级调度系统间(纵向)和跨专业(横向)进行全局共享,为了避免重复和无效冗余,数据对象ID编码规则具备全局唯一性。ID作为电网数据对象的唯一标识在其全生命周期和全局应用范围内具有不变性,即ID一经产生不随数据对象属性变化而改变。ID作为调度系统各应用间横、纵向交互的身份确认码使用,同时不改变原有应用自身的唯一标识。
对申请单文本进行解析,能够得到的对象种类包括变电站、线路、设备、电压等级、设备状态,这些对象在文本语境中分别表达一定的语义,包括操作地点、操作设备、连接设备、操作前状态、操作后状态,将语义名称和数据对象组成的结构化信息,就是文本的对象化信息。
实施例1
在一个或多个实施方式中公开的技术方案中,如图1所示,一种主网检修申请单的解析方法,包括如下步骤:
步骤1、获取电网设备模型,获取检修申请单;
步骤2、根据电网设备模型,以设备名称作为识别词,建立设备词典。
步骤3、根据设备命名规则、设备状态规则,建立包含检修设备、安全措施内容的文本解析模型;
步骤4、根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到设备对象化信息并输出。
步骤1中获取电网设备模型,可以直接连接电力系统的主站监控系统,监视主站监控系统导出电网设备模型的文件夹,发现设备更新文件自动读取文件数据。从电力系统的主站监控系统中调取电网设备模型,能够涵盖电力系统的所有电力设备,覆盖面广,可以提供准确的设备字典,便于提供检索模型。
主站监控系统作为电网生产系统,设备模型符合通用标准IEC61970,并且设备模型完善。主站监控系统能够每天定时将电网设备模型导出成符合通用标准IEC61970的文件,将文本传送到指定的服务器和文件夹。可以通过监视该文件夹,发现文件则自动读取文件数据,将文件更新到本系统的数据库中。
获取检修申请单的方法,可以为定时从主网调控操作管理平台获取检修申请单,并保存在本系统的数据库中。
作为进一步的技术方案,步骤2中,设备词典采用Trie树结构,提高词典的检索效率。
Trie树又称单词查找树,是一种树形结构,是一种哈希树的变种。用于统计,排序和保存大量的字符串(但不仅限于字符串),Trie树利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高,特点是:根节点不包含字符,除根节点外每一个节点都只包含一个字符;从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串;每个节点的所有子节点包含的字符都不相同。
步骤3为文本解析模型的构建步骤:文本解析模型可以为对文本信息分词后进行短语组合、语义提取的规则模型,可选的,本实施例可以根据用户的设备名称、术语规则进行定义,可以包括语义类型域、短语模式集和语义模式集。
1)、语义类型域用于定义在文本信息中出现的词语的语义类型,包括设备类型、设备状态类型以及技术术语。
每个词语(或短语)在文本语境中表达某种意义,语义类型就是对文本语境中词语意义的分类,根据词语识别的数据对象,与词语的语义类型,共同组成数据结构,是文本的对象化信息。
2)、短语模式集用于定义设备名称的各种组合模式。例如杆上开关及刀闸、杆上连接配变的熔断器:
10kV芹岭支线#48-1杆芹岭#8配变跌落式熔断器;
10kV庵后线#88杆Z-La07开关及P-La089刀闸;
分词后的词语数组分别是:
[10kV][芹岭支线][#48-1杆][芹岭#8配变][跌落式熔断器];
[10kV][庵后线][#88杆][Z-La07开关][及][P-La089刀闸];
用词义类型定义短语模式:
[电压等级][线路][杆塔][配变][熔断器];
[电压等级][线路][杆塔][开关][及][刀闸];
3)、语义模式集用于定义检修设备、安全措施文本中抽取语义的规则。例如:
[10kV向工业线(南靖)#14杆处902线路][转][检修];
[解除][110kV丁厝变10kV杨厝I回906开关][重合闸保护];
[拔出][角美配电室10kV多棱Ⅰ线#12杆][电缆头];
用语义类型定义语义抽取模式:
[设备][转][目的状态];
[操作][设备][保护类型];
[操作][设备][元件类型];
步骤4中,根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到设备对象化信息的方法,包括如下步骤:
步骤41、基于步骤2中获得的设备词典(Trie树),采用最大匹配算法,对文本进行查词典分词,得到申请单中的文本信息对应的词语数组A;
步骤42、基于设备名称短语模式集,对词语数组A进行模式匹配,将匹配后获得的子数组a进行短语组合,得到组合后的词语数组B;
步骤43、基于语义模式集,对词语数组B进行语义模式匹配,根据匹配的语义模式,抽取词语数组B的设备对象、目的状态语义,生成设备对象化信息。
综上,本实施例的方法具有如下优点:
(1)本公开从主站监控系统获取电网设备模型,从主网调控操作管理平台获取检修申请单,以设备命名规则、设备状态规则为依据,采用文本解析算法,对检修申请单的检修设备、安全措施进行对象化识别,将识别结果返回给主网调控操作管理平台,使其能够得到完整准确的设备对象化信息,实现自动化解析检修申请单。
(2)本公开的解析方法从电力系统的主站监控系统中调取电网设备模型,能够涵盖电力系统的所有电力设备,覆盖面广,可以提供准确的设备字典,便于提供检索模型。并且采用Trie树结构,提高词典的检索效率。
(3)不同检修人员对于设备的对象化数据了解不同,不同人员对于同一检修的描述文本存在差异,通过依据设备命名规则和设备状态规则建立文本解析模型,将检修人员输入的文本信息进行了重新排序并解析语义,提取文本信息中的关键内容,生成对应的文本数据的对象化信息,可以实现快捷准确的解析。最终将识别的设备对象化信息发送给主网调控操作管理平台,可以实现自动化的检修申请单的检修,提高了校核的准确性,并减少了人工成本。
实施例2
本实施例提供一种主网检修申请单的解析系统,包括:
读取模块:用于获取电网设备模型,获取检修申请单;
设备词典建立模块:用于根据电网设备模型,以设备名称作为识别词,建立设备词典;
文本解析模型建立模块:用于根据设备命名规则、设备状态规则,建立包含检修设备、安全措施内容的文本解析模型;
解析模块:用于根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到电网设备对象化信息。
进一步的文本解析模型包括语义类型域、短语模式集和语义模式集;
语义类型域用于定义在文本信息中出现的词语的语义类型,包括设备类型、设备状态类型以及技术术语;
短语模式集用于定义设备名称的各种组合模式;
语义模式集语义模式集用于定义检修设备、安全措施文本中抽取语义的规则。
所述解析模块包括:
分词模块:被配置为实现基于获得的设备词典,采用最大匹配算法,对文本进行查词典分词,得到申请单中的文本信息对应的词语数组A;
词语重组模块:被配置为实现基于设备名称短语模式集,对词语数组A进行模式匹配,将匹配后获得的子数组a进行短语组合,得到组合后的词语数组B;
对象化信息生成模块:被配置为实现基于语义模式集,对词语数组B进行语义模式匹配,根据匹配的语义模式,抽取词语数组B的设备对象和目的状态语义,生成设备对象化信息。
实施例3
本实施例提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1的方法所述的步骤。
实施例4
本实施例提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1的方法所述的步骤。
本公开所提出的电子设备可以是移动终端以及非移动终端,非移动终端包括台式计算机,移动终端包括智能手机(Smart Phone,如Android手机、IOS手机等)、智能眼镜、智能手表、智能手环、平板电脑、笔记本电脑、个人数字助理等可以进行无线通信的移动互联网设备。
应理解,在本公开中,该处理器可以是中央处理单元CPU,该处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本公开所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外一点,所显示或讨论的相互之间的耦合或者直接耦合或者通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (7)
1.一种主网检修申请单的解析方法,其特征是,包括如下步骤:
获取电网设备模型,获取检修申请单;
根据电网设备模型,以设备名称作为识别词,建立设备词典;
根据设备命名规则和设备状态规则,建立包含检修设备、安全措施内容的文本解析模型;文本解析模型包括语义类型域、短语模式集和语义模式集;语义类型域用于定义在文本信息中出现的词语的语义类型,包括设备类型、设备状态类型以及技术术语;短语模式集用于定义设备名称的各种组合模式;语义模式集用于定义检修设备、安全措施文本中抽取语义的规则;
根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到电网设备对象化信息,包括如下步骤:基于获得的设备词典,采用最大匹配算法,对文本进行查词典分词,得到申请单中的文本信息对应的词语数组A;基于设备名称短语模式集,对词语数组A进行模式匹配,将匹配后获得的子数组a进行短语组合,得到组合后的词语数组B;基于语义模式集,对词语数组B进行语义模式匹配,根据匹配的语义模式,抽取词语数组B的设备对象和目的状态语义,生成设备对象化信息。
2.如权利要求1所述的一种主网检修申请单的解析方法,其特征是:电网设备模型从电力系统的主站监控系统中调取,实时监视主站监控系统导出电网设备模型的文件夹,自动读取文件数据。
3.如权利要求1所述的一种主网检修申请单的解析方法,其特征是:设备词典采用Trie树结构。
4.如权利要求1所述的一种主网检修申请单的解析方法,其特征是:文本解析模型为对文本信息分词后进行短语组合、语义提取的规则模型,根据用户的设备名称、术语规则进行定义。
5.一种主网检修申请单的解析系统,其特征是,包括:
读取模块:用于获取电网设备模型,获取检修申请单;
设备词典建立模块:用于根据电网设备模型,以设备名称作为识别词,建立设备词典;
文本解析模型建立模块:用于根据设备命名规则、设备状态规则,建立包含检修设备、安全措施内容的文本解析模型;文本解析模型包括语义类型域、短语模式集和语义模式集;语义类型域用于定义在文本信息中出现的词语的语义类型,包括设备类型、设备状态类型以及技术术语;短语模式集用于定义设备名称的各种组合模式;语义模式集用于定义检修设备、安全措施文本中抽取语义的规则;
解析模块:用于根据文本解析模型和设备词典,采用文本解析算法对检修申请单中的具体文本信息进行解析,得到电网设备对象化信息;所述解析模块包括:
分词模块:被配置为实现基于获得的设备词典,采用最大匹配算法,对文本进行查词典分词,得到申请单中的文本信息对应的词语数组A;
词语重组模块:被配置为实现基于设备名称短语模式集,对词语数组A进行模式匹配,将匹配后获得的子数组a进行短语组合,得到组合后的词语数组B;
对象化信息生成模块:被配置为实现基于语义模式集,对词语数组B进行语义模式匹配,根据匹配的语义模式,抽取词语数组B的设备对象和目的状态语义,生成设备对象化信息。
6.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-4任一项方法所述的步骤。
7.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-4任一项方法所述的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010097010.7A CN111340253B (zh) | 2020-02-17 | 2020-02-17 | 一种主网检修申请单的解析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010097010.7A CN111340253B (zh) | 2020-02-17 | 2020-02-17 | 一种主网检修申请单的解析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111340253A CN111340253A (zh) | 2020-06-26 |
CN111340253B true CN111340253B (zh) | 2023-12-29 |
Family
ID=71185272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010097010.7A Active CN111340253B (zh) | 2020-02-17 | 2020-02-17 | 一种主网检修申请单的解析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111340253B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111832977A (zh) * | 2020-07-30 | 2020-10-27 | 广东电网有限责任公司 | 一种基于自然语言解析的检修申请自动成票方法 |
CN112528627B (zh) * | 2020-12-16 | 2022-10-04 | 中国南方电网有限责任公司 | 一种基于自然语言处理的检修意见识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133443A (zh) * | 2014-07-25 | 2014-11-05 | 国家电网公司 | 一种由电网检修申请单自动生成电网调度操作票的方法 |
CN109376353A (zh) * | 2018-09-04 | 2019-02-22 | 国家电网公司华东分部 | 一种基于自然语言处理的电网启动操作票生成装置及方法 |
-
2020
- 2020-02-17 CN CN202010097010.7A patent/CN111340253B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133443A (zh) * | 2014-07-25 | 2014-11-05 | 国家电网公司 | 一种由电网检修申请单自动生成电网调度操作票的方法 |
CN109376353A (zh) * | 2018-09-04 | 2019-02-22 | 国家电网公司华东分部 | 一种基于自然语言处理的电网启动操作票生成装置及方法 |
Non-Patent Citations (1)
Title |
---|
王适乾.电力调度控制系统中语义解析技术研究.《中国优秀硕士学位论文全文数据库(工程科技II辑)》.2019,摘要、第17-19页、第21-24页、第45-52页、第57-69页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111340253A (zh) | 2020-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112905804B (zh) | 一种电网调度知识图谱的动态更新方法及装置 | |
CN112860872A (zh) | 基于自学习的配电网操作票语义合规性的校验方法及系统 | |
CN108595523B (zh) | 设备数据检索模型构建方法、装置及计算机设备 | |
CN112527997B (zh) | 一种基于电网领域调度场景知识图谱的智能问答方法及系统 | |
CN111340253B (zh) | 一种主网检修申请单的解析方法及系统 | |
CN108446396B (zh) | 一种基于改进型cim模型的电力数据处理方法 | |
CN113095050A (zh) | 一种智能成票方法、系统、设备及存储介质 | |
CN111241488A (zh) | 一种基于全信息数据流的配网保护定值整定系统 | |
CN111667108A (zh) | 一种配网抢修时长预测方法 | |
CN113570345B (zh) | 一种基于施工项目电路图的停电范围自动识别系统 | |
CN116703114A (zh) | 一种电力调度数据分类存储方法、系统、装置及介质 | |
CN117453690A (zh) | 电网数据仓库的数据处理方法、装置和计算机介质 | |
CN112395716A (zh) | 一种基于多源异构生产数据的配电网拓扑结构生成方法 | |
CN115658981A (zh) | 一种设备数据采集方法、系统、终端设备及存储介质 | |
CN113987164A (zh) | 一种基于领域事件知识图谱的项目研判方法及装置 | |
CN114417010A (zh) | 面向实时工作流的知识图谱构建方法、装置和存储介质 | |
CN111352818B (zh) | 应用程序性能分析方法、装置、存储介质及电子设备 | |
CN107748819A (zh) | 一种基于自然语言处理的电气二次设备建模方法及系统 | |
CN112507129A (zh) | 配电网作业文件的内容变动处理方法及相关设备 | |
CN111143296A (zh) | 变电站scd文件分类方法、装置、终端及存储介质 | |
CN110866217A (zh) | 一种交叉报表的识别方法、装置、存储介质及电子设备 | |
CN111143622A (zh) | 基于大数据平台的故障数据集构建方法 | |
CN115545578B (zh) | 一种电力调度操作指令信息抽取方法及系统 | |
CN117875948B (zh) | 基于设备的电网检修事件确定方法、装置、设备和介质 | |
CN111723549B (zh) | 省间和省内电力市场的模型嵌套与信息交互方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |