Nothing Special   »   [go: up one dir, main page]

CN108364187A - 一种基于停电敏感特性的停电敏感用户确定方法和系统 - Google Patents

一种基于停电敏感特性的停电敏感用户确定方法和系统 Download PDF

Info

Publication number
CN108364187A
CN108364187A CN201711386567.7A CN201711386567A CN108364187A CN 108364187 A CN108364187 A CN 108364187A CN 201711386567 A CN201711386567 A CN 201711386567A CN 108364187 A CN108364187 A CN 108364187A
Authority
CN
China
Prior art keywords
power failure
power
model
failure sensitive
sensitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711386567.7A
Other languages
English (en)
Inventor
刘洋
匙光
宋伟
慕群
张士然
杨峰
刘刚
王骏
李平舟
章鹿华
王占东
高迪
王畅
刘扬
陈广宇
李孟兴
孙雷
王健
郭栋
王海燕
和娟
李莉
李明怡
孔庆泽
付钧波
李超
马健
郑秀秀
李晓婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Chengde Power Supply Co of State Grid Jibei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Chengde Power Supply Co of State Grid Jibei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Chengde Power Supply Co of State Grid Jibei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201711386567.7A priority Critical patent/CN108364187A/zh
Publication of CN108364187A publication Critical patent/CN108364187A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于停电敏感特性的停电敏感用户确定方法和系统,该方法和系统具体为对供电过程中的停电业务进行分析,得到多个停电敏感特征;提取每个停电敏感特征的特征数据;利用预设算法特征数据进行模型训练,得到停电敏感模型;利用停电敏感模型对电力用户进行计算,从中得到停电敏感用户。在电力企业通过上述方法和系统有效地从自己的电力用户中确定出停电敏感用户后,从而可对其提供更为优质的电力服务。

Description

一种基于停电敏感特性的停电敏感用户确定方法和系统
技术领域
本申请涉及电力技术领域,更具体地说,涉及一种基于停电敏感特性的 停电敏感用户确定方法和系统。
背景技术
为了对电力用户提供更为优良的供电服务,需要基于停电的管理分析, 主动对停电敏感客户群提供主动服务,减少电力用户在信息未知情况下的话 务请求,通过管理和主动服务降低客户呼入电话量。
为了向停电敏感客户群中的相应敏感用户提供系统主动的服务,需要能 够根据相应数据确定敏感用户,在电力用户的数量、种类极大增加的情况下, 原先那种人工走访和经验确定的方法已经难以适应形势要求,有必要开发一 种客观高效的方法以确定停电敏感用户,以便向其提供更为优质的电力服务。
发明内容
有鉴于此,本申请提供一种基于停电敏感特性的停电敏感用户确定方法 和系统,用于在电力用户中确定停电敏感用户,以向其提供更为优质的电力 服务。
为了实现上述目的,现提出的方案如下:
一种基于停电敏感特性的停电敏感用户确定方法,包括步骤:
对供电过程中的停电业务进行分析,得到多个停电敏感特征;
提取每个所述停电敏感特征的特征数据;
利用预设算法所述特征数据进行模型训练,得到停电敏感模型;
利用所述停电敏感模型对电力用户进行计算,从中得到停电敏感用户。
可选的,所述多个停电敏感特征包括用户停电响应行为特征、停电事件 特征和用户特征。
可选的,所述用户特征包括用户档案和用户用电特征。
可选的,所述预设算法为层次分析算法或机器学习算法。
一种基于停电敏感特性的停电敏感用户确定系统,包括:
特征分析模块,用于对供电过程中的停电业务进行分析,得到多个停电 敏感特征;
数据提取模块,用于提取每个所述停电敏感特征的特征数据;
模型训练模块,用于利用预设算法所述特征数据进行模型训练,得到停 电敏感模型;
用户计算模块,用于利用所述停电敏感模型对电力用户进行计算,从中 得到停电敏感用户。
可选的,所述多个停电敏感特征包括用户停电响应行为特征、停电事件 特征和用户特征。
可选的,所述用户特征包括用户档案和用户用电特征。
可选的,所述预设算法为层次分析算法或机器学习算法。
从上述的技术方案可以看出,本申请公开了一种基于停电敏感特性的停 电敏感用户确定方法和系统,该方法和系统具体为对供电过程中的停电业务 进行分析,得到多个停电敏感特征;提取每个停电敏感特征的特征数据;利 用预设算法特征数据进行模型训练,得到停电敏感模型;利用停电敏感模型 对电力用户进行计算,从中得到停电敏感用户。在电力企业通过上述方法和 系统有效地从自己的电力用户中确定出停电敏感用户后,从而可对其提供更 为优质的电力服务。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于停电敏感特性的停电敏感用户确定 方法的步骤流程图;
图2为本申请实施例提供的一种基于停电敏感特性的停电敏感用户确定 系统的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而 不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
图1为本申请提供的一种基于停电敏感特性的停电敏感用户确定方法的 步骤流程图。
如图1所示,本实施例提供的停电敏感用户确定方法用于从电力企业的 众多电力用户中确定出停电敏感用户,以便对其进行更为优质的服务,该确 定方法具体包括步骤:
S101:对供电过程中的停电业务进行分析。
通过对停电业务中的具体分析,从中得到停电业务的多个停电敏感特征。 这些停电敏感特征具体为用户停电响应行为特征、停电时间特征和用户特征。
其中,用户特征具体包括用户档案和用户用电特征。
用户档案为基本的用户档案信息,例如电压等级、合同容量、所属行业、 居民/非居民、所属线路台区、城乡标志、计量方式、电源类型等。还包括电 力公司对客户的等级划分,例如是否重要用户、是否保电用户等。
数据项:电压等级、合同容量、所属行业、居民/非居民、所属线路台区、 城乡标志、计量方式、电源类型、是否重要用户、是否保电用户,典型数据 项包括下表中的内容:
用户用电特征主要为用户的电量电费、最大负荷和负荷率、以及历史欠 缴费信息,建议追溯至少完整一年的数据。
用户用电数据:
数据项:月电量、月电费
用户负荷数据:
数据项:月最大负荷,月平均负荷率
典型数据项包括:
另外,上述特征还可以包括历史停电明细数据,包括停电时间(起始终 止时间)、停电范围、停电类型、停电原因、停电线段等。
数据项:不同停电类型的月停电次数、月停电时长、月停电发生日占比、 月停电时间段占比等
典型数据项包括:
用户停电响应行为特征指的是用户针对停电行为的咨询、投诉和建议等 历史停电响应行为。
用户针对用电的所有咨询、投诉、建议等行为数据。
停电影响行为数据:
数据项:月停电咨询次数、月停电投诉次数、月停电计划查询次数、月 停电建议册数
典型数据项包括:
S102:提取每个停电敏感特征的特征数据。
在分析出上述多个停电敏感特征后,对每个特征进行特征数据提取,具 体为从每个特征的具体组成元素中将其量化指标进行提取,以便得到真实反 映停电敏感特征的量化数据。
特征数据提取主要方法如下:a)统计值,如平均值、方差、偏度、峰度; b)机器学习算法,如傅里叶变换、小波分析,利用这些获取用户日电量波动 变化情况,从而获得内部的一些特征;c)模型融合,将多个机器学习算法获 得的预测结果作为特征,成为新特征进入训练中。
特征检验主要方法如下:a)分布检验,正态检验、卡方检验;b)特征 降维,如利用主成分分析找出与电费关系紧密的属性,帮助更好预测下月电 费时间;c)机器算法选择,如利用决策树进行特征重要性判断,实现特征选 择。
提取的特征数据作为输入开展机器学习,为提升迭代速度先选定样本数 据开展特征数据提取工作,模型相对成熟后再扩展至全部数据进行特征数据 提取。
采集特征数据后需开展数据清洗与转换工作,通过缺失值处理、错误值 修正、数据平滑、数据规范化等方法降低数据噪声,有利于节省模型训练时 间,提升模型准确性。
S103:利用预设算法对特征数据进行模型训练。
通过预设算法和特征数据,经过相应的模型训练,从而得到停电敏感模 型。这里的预设算法可以为层次分析算法或者机器学习算法。
层次分析法(Analytic Hierarchy Process,简称AHP)是将与决策总是 有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量 分析的决策方法。该方法是美国运筹学家匹茨堡大学教授萨蒂于20世纪70 年代初,在为美国国防部研究"根据各个工业部门对国家福利的贡献大小而进 行电力分配"课题时,应用网络系统理论和多目标综合评价方法,提出的一种 层次权重决策分析方法。
层次分析法是将决策问题按总目标、各层子目标、评价准则直至具体的 备投方案的顺序分解为不同的层次结构,然后得用求解判断矩阵特征向量的 办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和 的方法递阶归并各备择方案对总目标的最终权重,此最终权重最大者即为最 优方案。这里所谓“优先权重”是一种相对的量度,它表明各备择方案在某 一特点的评价准则或子目标,标下优越程度的相对量度,以及各子目标对上 一层目标而言重要程度的相对量度。层次分析法比较适合于具有分层交错评 价指标的目标系统,而且目标值又难于定量描述的决策问题。其用法是构造 判断矩阵,求出其最大特征值。及其所对应的特征向量W,归一化后,即为某 一层次指标对于上一层次某相关指标的相对重要性权值。
常用的模型算法包括层次分析模型法、熵权判别法、变异离差法、灰色 关联模型等。
层次分析模型(Analytic Hierarchy Process,AHP)是一种定性和定量 相结合的系统化、层次化的建模技术,它是将半定性、半定量问题转化为定 量问题的行之有效的一种方法,是人们的思维过程层次化。
填写判断矩阵:基于以构建的区域负荷特征模型入参,结合业务经验, 填写判断矩阵G(n×n)(判断矩阵为正互反矩阵);
矩阵一致性处理:通过对判断矩阵G(n×n)进行一系列的调整处理,形成 满足一致性检验标准的矩阵H(n×n);
计算指标权重:按照标准的权重计算规则,对矩阵H(n×n)进行处理, 得到权重向量w(n);
输出并保存权重向量w(n)。
注:判断矩阵G(n×n)中每个元素gij的填写标准:gij对应的横向指标i相 较于纵向元素j的重要程度。具体见下表:
判断标准 gij 判断标准 gij
同等重要 1 同等不重要 1
稍显重要 3 稍显不重要 1/3
较为重要 5 较为不重要 1/5
明显重要 7 明显不重要 1/7
强烈重要 9 强烈不重要 1/9
基于模型业务流程,详细介绍层次分析模型的算法实现过程:
①填写判断矩阵:判断矩阵是一个n×n的方阵, n等于评分指标的个数,矩阵具有以下属性:gii=1;gij>0;1≤i,j ≤n.
②矩阵一致性处理:
K(n×n),其中kij=log10(gij);
L(n×n),其中
H(n×n),其中
③计算指标权重
M(n),其中
w(n),其中
熵权判别法:熵最先由香农引入信息论,现已在工程技术、社会经济等 领域得到比较广泛的应用。其基本思路是根据指标变异性的大小来确定客观 权重。一般来说,某个指标的信息熵Ej越小,表明指标值的变异程度越大, 提供的信息量越多,在综合评价中所起的作用越大,其权重也越大。相反, 某个指标的信息熵Ej越大,表明指标值的变异程度越小,提供的信息量越少, 在综合评价中所起的作用越小,其权重也越小。
①抽取标准化数据:标准化数据矩阵是一个m× n的方阵,m等于样本的个数,n等于评分指标的个数,矩阵具有以下属性: rij∈[0,1];1≤i≤n;1≤j≤m.
②计算概率矩阵:P(m×n),其中
③计算指标的信息熵:C(n),其中1≤i≤n.
④计算指标权重:w(n),其中1≤i≤n.
变异离差法的思路与熵权判别模型相似。通常,某个指标的标准差越大, 表明指标值的变异程度越大,提供的信息量越多,在综合评价中所起的作用 越大,其权重也越大。相反,某个指标的标准差越小,表明指标值的变异程 度越小,提供的信息量越少,在综合评价中所起的作用越小,其权重也应越 小。
①抽取标准化数据:标准化数据矩阵R(m×n)同上.
②计算指标均值及标准差:
A(n),其中1≤i≤n;
V(n),其中1≤i≤n;
③计算指标的变异离差:C(n),其中ci=ai/vi,1≤i≤n.
④计算指标权重:w(n),其中1≤i≤n.
灰色关联模型把灰关联聚类分析和聚类思想方法进行融汇、扩充,将关 联度的数值演化成评估对象的亲和度而用于聚类分析。
①生成权向量矩阵:选择不同模型生成的权重向量w(n)i,i∈[1,7],指标 权重表示为wij,i∈[1,7],j∈[1,n];多组权重向量组成权重矩阵w(m×n),其 中:wij表示第i个模型下指标j的权重;
②计算综合权重:根据灰色关联算法计算指标综合权重。
模型算法可以分为4个步骤:
生成权重矩阵
权重矩阵w(m×n),其中:wij表示第i个模型下指标j的权重,
求每个指标权重平均值
权重平均值
求不同模型下指标权重的绝对偏差
指标绝对偏差
注:当时,sij统一用1代替。
计算指标综合权重
W(n)为综合权重向量,其中且Wj满足
机器学习是基于数据结构建立数学模型并运行模型进行预测分析的技术 方法,主要通过某种算法指导计算机利用已知数据得出适当的模型,并利用 此模型对新的情境给出判断的过程。
机器学习主要分为监督学习、无监督学习和半监督学习三类。监督学习 需要因变量已知的训练集,通过训练集构造和训练模型;无监督学习是指模 型的构建和训练不依赖因变量已知的训练集,通常采用聚类的方式对数据的 某些属性进行聚类,依据聚类的结果进行分析,从而构建模型;半监督学习 介于监督学习和无监督学习之间,从少部分因变量已知的数据中进行监督学 习以获取规则建立模型,同时通过大量因变量未知的数据获取数据集内在结 构,达到提高模型性能的目的。
当前常用的机器学习算法包括逻辑回归(LR)、决策树(DT)、随机森 林(RF)、支持向量机(SVC)等。
逻辑回归(logistic Regression)是广义线性模型的一种,其基本原理 是通过对数几率函数(logit函数)将线性回归模型的计算结果转化为符合 logistic概率分布的条件概率形式,通过比较预测样本属于各分类的概率的 大小,确定样本的分类。
逻辑回归可以表现为如下的条件概率形式:
p(Y=1|x)=exp(w·x+b)/[1+exp(w·x+b)]
p(y=0|x)=1/[1+exp(w·x+b)]
其中x为输入样本特征,w为线性回归权重,b为线性回归偏移量。
决策树模型是一种描述对实例进行分类的树形结构。决策树由节点 (node)和有向边(directed edge)组成。节点有两种类型:内部节点(internal node)和叶节点(leafnode)。内部节点表示一个特征或属性,叶节点表示 一个类。
用决策树分类,从根节点开始,对实例的某一特征进行测试,根据测试 结果,将实例分配到其子节点。此时,每一个子节点对应着该特征的一个取 值。如此递归地对实例进行测试并分配,直到达到叶节点。最后将实例分配 到叶节点的类中。
决策树学习主要利用信息论中的信息增益(information gain)原理, 寻找数据集中有最大信息量的变量,建立数据的一个节点,再根据变量的不 同值建立树的分枝,每个分枝子集中重复建树的下层结果和分枝的过程,一 直到完成建立整株决策树。决策树的每一条路径代表一个分类规则,与其它 分类模型相比,决策树的最大优势在于模型图形化,让使用者容易了解,模 型解释也非常简单而容易。
随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。
随机森林的构建方法为:第一,从原始的数据集中采取有放回的抽样, 构造与原始数据集样本数量相同的子数据集。不同子数据集的元素可以重复, 同一个子数据集中的元素也可以重复。第二,利用子数据集来构建子决策树, 将这个数据放到每个子决策树中,每个子决策树输出一个结果。第三,通过 对子决策树分类预测的结果的众数进行统计,获得分类结果。
支持向量机模型是定义在特征空间上的间隔最大的线性分类器。其基本 原理为以一个超平面划分参数空间对样本进行分类。
超平面定义为:
*w*·x+b
相应的决策函数为:
f(x)=sign(w*x+b)
以二分类问题为例,当样本点位于分类超平面正类一侧,即为正类,若 样本点位于分类超平面负类一侧,则为负类,当样本点距离非超平面越远, 则分类可信度越高。支持向量机通过确定距离分类超平面最近的n个样本点, 称为支持向量,通过最大化支持向量与分类超平面之间的距离,获得的超平 面即为最优分类超平面。通过该最优超平面对样本进行分类,即支持向量机 模型。
S104:利用停电敏感模型对电力用户进行计算。
在得到上述停电敏感模型后,将电力企业的当前的所有的电力用户输入 其中进行计算,根据相应的预设阈值进行判断,从而从中可以得到停电敏感 用户。
从上述技术方案可以看出,本实施例提供了一种基于停电敏感特性的停 电敏感用户确定方法,该方法具体为对供电过程中的停电业务进行分析,得 到多个停电敏感特征;提取每个停电敏感特征的特征数据;利用预设算法特 征数据进行模型训练,得到停电敏感模型;利用停电敏感模型对电力用户进 行计算,从中得到停电敏感用户。在电力企业通过上述方法有效地从自己的 电力用户中确定出停电敏感用户后,从而可对其提供更为优质的电力服务。
实施例二
图2为本申请提供的一种基于停电敏感特性的停电敏感用户确定系统的 结构框图。
如图1所示,本实施例提供的停电敏感用户确定系统用于从电力企业的 众多电力用户中确定出停电敏感用户,以便对其进行更为优质的服务,该确 定系统具体包括特征分析模块10、数据提取模块20、模型训练模块30和用 户计算模块40。
特征分析模块用于对供电过程中的停电业务进行分析。
通过对停电业务中的具体分析,从中得到停电业务的多个停电敏感特征。 这些停电敏感特征具体为用户停电响应行为特征、停电时间特征和用户特征。
其中,用户特征具体包括用户档案和用户用电特征。
用户档案为基本的用户档案信息,例如电压等级、合同容量、所属行业、 居民/非居民、所属线路台区、城乡标志、计量方式、电源类型等。还包括电 力公司对客户的等级划分,例如是否重要用户、是否保电用户等。
数据项:电压等级、合同容量、所属行业、居民/非居民、所属线路台区、 城乡标志、计量方式、电源类型、是否重要用户、是否保电用户,典型数据 项包括下表中的内容:
用户用电特征主要为用户的电量电费、最大负荷和负荷率、以及历史欠 缴费信息,建议追溯至少完整一年的数据。
用户用电数据:
数据项:月电量、月电费
用户负荷数据:
数据项:月最大负荷,月平均负荷率
典型数据项包括:
另外,上述特征还可以包括历史停电明细数据,包括停电时间(起始终 止时间)、停电范围、停电类型、停电原因、停电线段等。
数据项:不同停电类型的月停电次数、月停电时长、月停电发生日占比、 月停电时间段占比等
典型数据项包括:
用户停电响应行为特征指的是用户针对停电行为的咨询、投诉和建议等 历史停电响应行为。
用户针对用电的所有咨询、投诉、建议等行为数据。
停电影响行为数据:
数据项:月停电咨询次数、月停电投诉次数、月停电计划查询次数、月 停电建议册数
典型数据项包括:
数据提取模块用于提取每个停电敏感特征的特征数据。
在分析出上述多个停电敏感特征后,对每个特征进行特征数据提取,具 体为从每个特征的具体组成元素中将其量化指标进行提取,以便得到真实反 映停电敏感特征的量化数据。
特征数据提取主要方法如下:a)统计值,如平均值、方差、偏度、峰度; b)机器学习算法,如傅里叶变换、小波分析,利用这些获取用户日电量波动 变化情况,从而获得内部的一些特征;c)模型融合,将多个机器学习算法获 得的预测结果作为特征,成为新特征进入训练中。
特征检验主要方法如下:a)分布检验,正态检验、卡方检验;b)特征 降维,如利用主成分分析找出与电费关系紧密的属性,帮助更好预测下月电 费时间;c)机器算法选择,如利用决策树进行特征重要性判断,实现特征选 择。
提取的特征数据作为输入开展机器学习,为提升迭代速度先选定样本数 据开展特征数据提取工作,模型相对成熟后再扩展至全部数据进行特征数据 提取。
采集特征数据后需开展数据清洗与转换工作,通过缺失值处理、错误值 修正、数据平滑、数据规范化等方法降低数据噪声,有利于节省模型训练时 间,提升模型准确性。
模型训练模块用于利用预设算法对特征数据进行模型训练。
通过预设算法和特征数据,经过相应的模型训练,从而得到停电敏感模 型。这里的预设算法可以为层次分析算法或者机器学习算法。
层次分析法(Analytic Hierarchy Process,简称AHP)是将与决策总是 有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量 分析的决策方法。该方法是美国运筹学家匹茨堡大学教授萨蒂于20世纪70 年代初,在为美国国防部研究"根据各个工业部门对国家福利的贡献大小而进 行电力分配"课题时,应用网络系统理论和多目标综合评价方法,提出的一种 层次权重决策分析方法。
层次分析法是将决策问题按总目标、各层子目标、评价准则直至具体的 备投方案的顺序分解为不同的层次结构,然后得用求解判断矩阵特征向量的 办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和 的方法递阶归并各备择方案对总目标的最终权重,此最终权重最大者即为最 优方案。这里所谓“优先权重”是一种相对的量度,它表明各备择方案在某 一特点的评价准则或子目标,标下优越程度的相对量度,以及各子目标对上 一层目标而言重要程度的相对量度。层次分析法比较适合于具有分层交错评 价指标的目标系统,而且目标值又难于定量描述的决策问题。其用法是构造 判断矩阵,求出其最大特征值。及其所对应的特征向量W,归一化后,即为某 一层次指标对于上一层次某相关指标的相对重要性权值。
常用的模型算法包括层次分析模型法、熵权判别法、变异离差法、灰色 关联模型等。
层次分析模型(Analytic Hierarchy Process,AHP)是一种定性和定量 相结合的系统化、层次化的建模技术,它是将半定性、半定量问题转化为定 量问题的行之有效的一种方法,是人们的思维过程层次化。
填写判断矩阵:基于以构建的区域负荷特征模型入参,结合业务经验, 填写判断矩阵G(n×n)(判断矩阵为正互反矩阵);
矩阵一致性处理:通过对判断矩阵G(n×n)进行一系列的调整处理,形成 满足一致性检验标准的矩阵H(n×n);
计算指标权重:按照标准的权重计算规则,对矩阵H(n×n)进行处理, 得到权重向量w(n);
输出并保存权重向量w(n)。
注:判断矩阵G(n×n)中每个元素gij的填写标准:gij对应的横向指标i相 较于纵向元素j的重要程度。具体见下表:
判断标准 gij 判断标准 gij
同等重要 1 同等不重要 1
稍显重要 3 稍显不重要 1/3
较为重要 5 较为不重要 1/5
明显重要 7 明显不重要 1/7
强烈重要 9 强烈不重要 1/9
基于模型业务流程,详细介绍层次分析模型的算法实现过程:
①填写判断矩阵:判断矩阵是一个n×n的方阵, n等于评分指标的个数,矩阵具有以下属性:gii=1;gij>0;1≤i,j ≤n.
②矩阵一致性处理:
K(n×n),其中kij=log10(gij);
L(n×n),其中
H(n×n),其中
③计算指标权重
M(n),其中
w(n),其中
熵权判别法:熵最先由香农引入信息论,现已在工程技术、社会经济等 领域得到比较广泛的应用。其基本思路是根据指标变异性的大小来确定客观 权重。一般来说,某个指标的信息熵Ej越小,表明指标值的变异程度越大, 提供的信息量越多,在综合评价中所起的作用越大,其权重也越大。相反, 某个指标的信息熵Ej越大,表明指标值的变异程度越小,提供的信息量越少, 在综合评价中所起的作用越小,其权重也越小。
①抽取标准化数据:标准化数据矩阵是一个m× n的方阵,m等于样本的个数,n等于评分指标的个数,矩阵具有以下属性: rij∈[0,1];1≤i≤n;1≤j≤m.
②计算概率矩阵:P(m×n),其中
③计算指标的信息熵:C(n),其中1≤i≤n.
④计算指标权重:w(n),其中1≤i≤n.
变异离差法的思路与熵权判别模型相似。通常,某个指标的标准差越大, 表明指标值的变异程度越大,提供的信息量越多,在综合评价中所起的作用 越大,其权重也越大。相反,某个指标的标准差越小,表明指标值的变异程 度越小,提供的信息量越少,在综合评价中所起的作用越小,其权重也应越 小。
①抽取标准化数据:标准化数据矩阵R(m×n)同上.
②计算指标均值及标准差:
A(n),其中1≤i≤n;
V(n),其中1≤i≤n;
③计算指标的变异离差:C(n),其中ci=ai/vi,1≤i≤n.
④计算指标权重:w(n),其中1≤i≤n.
灰色关联模型把灰关联聚类分析和聚类思想方法进行融汇、扩充,将关 联度的数值演化成评估对象的亲和度而用于聚类分析。
①生成权向量矩阵:选择不同模型生成的权重向量w(n)i,i∈[1,7],指标 权重表示为wij,i∈[1,7],j∈[1,n];多组权重向量组成权重矩阵w(m×n),其 中:wij表示第i个模型下指标j的权重;
②计算综合权重:根据灰色关联算法计算指标综合权重。
模型算法可以分为4个步骤:
生成权重矩阵
权重矩阵w(m×n),其中:wij表示第i个模型下指标j的权重,
求每个指标权重平均值
权重平均值
求不同模型下指标权重的绝对偏差
指标绝对偏差
注:当时,sij统一用1代替。
计算指标综合权重
W(n)为综合权重向量,其中且Wj满足
机器学习是基于数据结构建立数学模型并运行模型进行预测分析的技术 方法,主要通过某种算法指导计算机利用已知数据得出适当的模型,并利用 此模型对新的情境给出判断的过程。
机器学习主要分为监督学习、无监督学习和半监督学习三类。监督学习 需要因变量已知的训练集,通过训练集构造和训练模型;无监督学习是指模 型的构建和训练不依赖因变量已知的训练集,通常采用聚类的方式对数据的 某些属性进行聚类,依据聚类的结果进行分析,从而构建模型;半监督学习 介于监督学习和无监督学习之间,从少部分因变量已知的数据中进行监督学 习以获取规则建立模型,同时通过大量因变量未知的数据获取数据集内在结 构,达到提高模型性能的目的。
当前常用的机器学习算法包括逻辑回归(LR)、决策树(DT)、随机森 林(RF)、支持向量机(SVC)等。
逻辑回归(logistic Regression)是广义线性模型的一种,其基本原理 是通过对数几率函数(logit函数)将线性回归模型的计算结果转化为符合 logistic概率分布的条件概率形式,通过比较预测样本属于各分类的概率的 大小,确定样本的分类。
逻辑回归可以表现为如下的条件概率形式:
p(Y=1|x)=exp(w·x+b)/[1+exp(w·x+b)]
p(y=0|x)=1/[1+exp(w·x+b)]
其中x为输入样本特征,w为线性回归权重,b为线性回归偏移量。
决策树模型是一种描述对实例进行分类的树形结构。决策树由节点 (node)和有向边(directed edge)组成。节点有两种类型:内部节点(internal node)和叶节点(leafnode)。内部节点表示一个特征或属性,叶节点表示 一个类。
用决策树分类,从根节点开始,对实例的某一特征进行测试,根据测试 结果,将实例分配到其子节点。此时,每一个子节点对应着该特征的一个取 值。如此递归地对实例进行测试并分配,直到达到叶节点。最后将实例分配 到叶节点的类中。
决策树学习主要利用信息论中的信息增益(information gain)原理, 寻找数据集中有最大信息量的变量,建立数据的一个节点,再根据变量的不 同值建立树的分枝,每个分枝子集中重复建树的下层结果和分枝的过程,一 直到完成建立整株决策树。决策树的每一条路径代表一个分类规则,与其它 分类模型相比,决策树的最大优势在于模型图形化,让使用者容易了解,模 型解释也非常简单而容易。
随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。
随机森林的构建方法为:第一,从原始的数据集中采取有放回的抽样, 构造与原始数据集样本数量相同的子数据集。不同子数据集的元素可以重复, 同一个子数据集中的元素也可以重复。第二,利用子数据集来构建子决策树, 将这个数据放到每个子决策树中,每个子决策树输出一个结果。第三,通过 对子决策树分类预测的结果的众数进行统计,获得分类结果。
支持向量机模型是定义在特征空间上的间隔最大的线性分类器。其基本 原理为以一个超平面划分参数空间对样本进行分类。
超平面定义为:
*w*·x+b
相应的决策函数为:
f(x)=sign(w*x+b)
以二分类问题为例,当样本点位于分类超平面正类一侧,即为正类,若 样本点位于分类超平面负类一侧,则为负类,当样本点距离非超平面越远, 则分类可信度越高。支持向量机通过确定距离分类超平面最近的n个样本点, 称为支持向量,通过最大化支持向量与分类超平面之间的距离,获得的超平 面即为最优分类超平面。通过该最优超平面对样本进行分类,即支持向量机 模型。
用户计算模块用于利用停电敏感模型对电力用户进行计算。
在得到上述停电敏感模型后,将电力企业的当前的所有的电力用户输入 其中进行计算,根据相应的预设阈值进行判断,从而从中可以得到停电敏感 用户。
从上述技术方案可以看出,本实施例提供了一种基于停电敏感特性的停 电敏感用户确定系统,该系统具体为对供电过程中的停电业务进行分析,得 到多个停电敏感特征;提取每个停电敏感特征的特征数据;利用预设算法特 征数据进行模型训练,得到停电敏感模型;利用停电敏感模型对电力用户进 行计算,从中得到停电敏感用户。在电力企业通过上述系统有效地从自己的 电力用户中确定出停电敏感用户后,从而可对其提供更为优质的电力服务。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明 的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见 即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装 置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全 软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例 可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质 (包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产 品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算 机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实 现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图 中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专 用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一 个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指 令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个 方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终 端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存 储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流 程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备 上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算 机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于 实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定 的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦 得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以, 所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有 变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语 仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求 或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术 语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而 使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素, 而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物 品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终 端设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个 例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助 理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据 本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述, 本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种基于停电敏感特性的停电敏感用户确定方法,其特征在于,包括步骤:
对供电过程中的停电业务进行分析,得到多个停电敏感特征;
提取每个所述停电敏感特征的特征数据;
利用预设算法所述特征数据进行模型训练,得到停电敏感模型;
利用所述停电敏感模型对电力用户进行计算,从中得到停电敏感用户。
2.如权利要求1所述的停电敏感用户确定方法,其特征在于,所述多个停电敏感特征包括用户停电响应行为特征、停电事件特征和用户特征。
3.如权利要求2所述的停电敏感用户确定方法,其特征在于,所述用户特征包括用户档案和用户用电特征。
4.如权利要求1所述的停电敏感用户确定方法,其特征在于,所述预设算法为层次分析算法或机器学习算法。
5.一种基于停电敏感特性的停电敏感用户确定系统,其特征在于,包括:
特征分析模块,用于对供电过程中的停电业务进行分析,得到多个停电敏感特征;
数据提取模块,用于提取每个所述停电敏感特征的特征数据;
模型训练模块,用于利用预设算法所述特征数据进行模型训练,得到停电敏感模型;
用户计算模块,用于利用所述停电敏感模型对电力用户进行计算,从中得到停电敏感用户。
6.如权利要求5所述的停电敏感用户确定系统,其特征在于,所述多个停电敏感特征包括用户停电响应行为特征、停电事件特征和用户特征。
7.如权利要求6所述的停电敏感用户确定系统,其特征在于,所述用户特征包括用户档案和用户用电特征。
8.如权利要求5所述的停电敏感用户确定系统,其特征在于,所述预设算法为层次分析算法或机器学习算法。
CN201711386567.7A 2017-12-20 2017-12-20 一种基于停电敏感特性的停电敏感用户确定方法和系统 Pending CN108364187A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711386567.7A CN108364187A (zh) 2017-12-20 2017-12-20 一种基于停电敏感特性的停电敏感用户确定方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711386567.7A CN108364187A (zh) 2017-12-20 2017-12-20 一种基于停电敏感特性的停电敏感用户确定方法和系统

Publications (1)

Publication Number Publication Date
CN108364187A true CN108364187A (zh) 2018-08-03

Family

ID=63010401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711386567.7A Pending CN108364187A (zh) 2017-12-20 2017-12-20 一种基于停电敏感特性的停电敏感用户确定方法和系统

Country Status (1)

Country Link
CN (1) CN108364187A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304990A (zh) * 2017-12-27 2018-07-20 广东电网有限责任公司信息中心 一种停电敏感预判方法和系统
CN109325640A (zh) * 2018-12-07 2019-02-12 中山大学 用户价值预测方法、装置、存储介质及设备
CN109949178A (zh) * 2019-02-22 2019-06-28 国网安徽省电力公司 一种基于支持向量机中压配网停电事件判断及补全方法
CN110119881A (zh) * 2019-04-12 2019-08-13 国网河北省电力有限公司邢台供电分公司 基于用电感知的电力决策方法、装置及终端
CN110598933A (zh) * 2019-09-16 2019-12-20 广东电网有限责任公司 一种停电敏感用户管理方法、系统及相关组件
CN111311321A (zh) * 2020-02-14 2020-06-19 北京百度网讯科技有限公司 用户消费行为预测模型训练方法、装置、设备及存储介质
CN111652313A (zh) * 2020-06-04 2020-09-11 重庆东电通信技术有限公司 基于聚类分析的多源异构数据挖掘方法
CN112418541A (zh) * 2020-12-02 2021-02-26 国网浙江省电力有限公司营销服务中心 一种用于预测评价客户停电敏感度的方法
CN112862172A (zh) * 2021-01-29 2021-05-28 国网河南省电力公司漯河供电公司 国网95598停电投诉预测方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202232A (zh) * 2016-06-27 2016-12-07 中国南方电网有限责任公司电网技术研究中心 一种停电事件的分析方法及装置
CN106980929A (zh) * 2017-01-05 2017-07-25 国网福建省电力有限公司 一种基于随机森林的停电投诉风险预测方法
CN107220732A (zh) * 2017-05-31 2017-09-29 福州大学 一种基于梯度提升树的停电投诉风险预测方法
CN107392479A (zh) * 2017-07-27 2017-11-24 国网河南省电力公司电力科学研究院 基于逻辑回归模型的电力客户停电敏感度评分卡实施方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202232A (zh) * 2016-06-27 2016-12-07 中国南方电网有限责任公司电网技术研究中心 一种停电事件的分析方法及装置
CN106980929A (zh) * 2017-01-05 2017-07-25 国网福建省电力有限公司 一种基于随机森林的停电投诉风险预测方法
CN107220732A (zh) * 2017-05-31 2017-09-29 福州大学 一种基于梯度提升树的停电投诉风险预测方法
CN107392479A (zh) * 2017-07-27 2017-11-24 国网河南省电力公司电力科学研究院 基于逻辑回归模型的电力客户停电敏感度评分卡实施方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304990B (zh) * 2017-12-27 2021-10-19 广东电网有限责任公司信息中心 一种停电敏感预判方法和系统
CN108304990A (zh) * 2017-12-27 2018-07-20 广东电网有限责任公司信息中心 一种停电敏感预判方法和系统
CN109325640A (zh) * 2018-12-07 2019-02-12 中山大学 用户价值预测方法、装置、存储介质及设备
CN109325640B (zh) * 2018-12-07 2022-04-26 中山大学 用户价值预测方法、装置、存储介质及设备
CN109949178A (zh) * 2019-02-22 2019-06-28 国网安徽省电力公司 一种基于支持向量机中压配网停电事件判断及补全方法
CN109949178B (zh) * 2019-02-22 2023-06-16 国网安徽省电力公司 一种基于支持向量机中压配网停电事件判断及补全方法
CN110119881A (zh) * 2019-04-12 2019-08-13 国网河北省电力有限公司邢台供电分公司 基于用电感知的电力决策方法、装置及终端
CN110598933A (zh) * 2019-09-16 2019-12-20 广东电网有限责任公司 一种停电敏感用户管理方法、系统及相关组件
CN111311321A (zh) * 2020-02-14 2020-06-19 北京百度网讯科技有限公司 用户消费行为预测模型训练方法、装置、设备及存储介质
CN111652313A (zh) * 2020-06-04 2020-09-11 重庆东电通信技术有限公司 基于聚类分析的多源异构数据挖掘方法
CN112418541A (zh) * 2020-12-02 2021-02-26 国网浙江省电力有限公司营销服务中心 一种用于预测评价客户停电敏感度的方法
CN112862172A (zh) * 2021-01-29 2021-05-28 国网河南省电力公司漯河供电公司 国网95598停电投诉预测方法、装置、计算机设备和存储介质
CN112862172B (zh) * 2021-01-29 2024-05-28 国网河南省电力公司漯河供电公司 国网95598停电投诉预测方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108364187A (zh) 一种基于停电敏感特性的停电敏感用户确定方法和系统
Ali et al. A data-driven approach for multi-scale GIS-based building energy modeling for analysis, planning and support decision making
Dong et al. Hourly energy consumption prediction of an office building based on ensemble learning and energy consumption pattern classification
Sheu Dynamic relief-demand management for emergency logistics operations under large-scale disasters
CN104239968B (zh) 一种快速模糊粗糙集短期负荷预测方法
CN116187640B (zh) 一种基于网格多属性画像体系的配电网规划方法及装置
Mohammadian et al. Data-driven classifier for extreme outage prediction based on Bayes decision theory
CN109063945A (zh) 一种基于价值评估体系的售电公司360度客户画像构建方法
CN107392479A (zh) 基于逻辑回归模型的电力客户停电敏感度评分卡实施方法
CN103632203A (zh) 一种基于综合评价的配电网供电区域划分方法
CN107507038A (zh) 一种基于stacking和bagging算法的电费敏感用户分析方法
Ghodousi et al. Analyzing public participant data to evaluate citizen satisfaction and to prioritize their needs via K-means, FCM and ICA
CN108171369A (zh) 基于客户用电差异化特性的短期负荷组合预测方法
Panapakidis et al. Implementation of modified versions of the K-means algorithm in power load curves profiling
Georgantzinos et al. A modeling framework for incorporating DEA efficiency into set covering, packing, and partitioning formulations
CN112288172A (zh) 台区线损率的预测方法、装置
Li et al. Predicting the future development scale of high-speed rail through the urban scaling law
Prilistya et al. Tourism demand time series forecasting: A systematic literature review
Onile et al. A comparative study on graph-based ranking algorithms for consumer-oriented demand side management
CN114372835B (zh) 综合能源服务潜力客户识别方法、系统及计算机设备
CN116796906A (zh) 基于数据融合的电力配电网投资预测分析系统及方法
CN116662860A (zh) 一种基于能源大数据的用户画像与分类方法
CN114139847A (zh) 智能配电网建设目标的重要度评价方法、装置、设备
Zhao et al. An intelligent evaluation method to analyze the competitiveness of airlines
Maniar et al. Two-stage load profiling of HV feeders of a distribution system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180803

RJ01 Rejection of invention patent application after publication