Nothing Special   »   [go: up one dir, main page]

CN111861781A - 一种居民用电行为聚类中的特征优选方法及系统 - Google Patents

一种居民用电行为聚类中的特征优选方法及系统 Download PDF

Info

Publication number
CN111861781A
CN111861781A CN202010132423.4A CN202010132423A CN111861781A CN 111861781 A CN111861781 A CN 111861781A CN 202010132423 A CN202010132423 A CN 202010132423A CN 111861781 A CN111861781 A CN 111861781A
Authority
CN
China
Prior art keywords
feature
cluster
electricity consumption
evaluation
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010132423.4A
Other languages
English (en)
Inventor
夏飞
张洁
张传林
龚春阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University of Electric Power
Original Assignee
Shanghai University of Electric Power
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai University of Electric Power filed Critical Shanghai University of Electric Power
Priority to CN202010132423.4A priority Critical patent/CN111861781A/zh
Publication of CN111861781A publication Critical patent/CN111861781A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Water Supply & Treatment (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种居民用电行为聚类中的特征优选方法及系统,包括,采集数据并构建原始特征集;构建评价函数;基于评价函数对原始特征集进行筛选;对密度峰值算法进行改进;基于改进的密度峰值算法进行聚类分析。本发明的有益效果:通过对用电特征和气象因素特征共同构成的原始特征集的优选,构成能够实现较好效果的计算量最少的最优特征子集并进行聚类分析,从而完成用户用电模式的分类研究,通过优选合适样本用户集的用电特征集,不仅能大大减少分析时所需计算的数据,降低计算量,同时能有效地提高分析性能。

Description

一种居民用电行为聚类中的特征优选方法及系统
技术领域
本发明涉及的技术领域,尤其涉及一种居民用电行为聚类中的特征优选方 法及系统。
背景技术
近年来,随着我国用电信息采集系统的快速发展,电力系统中的智能电表 得到广泛应用,电力公司可获取的用户用电数据已成海量趋势,因此,基于海 量用电数据的用户用电行为聚类分析变得日益重要。
为了实现用电数据的处理与分析,需要从大量数据中提取相应的特征,利 用用电特征进行聚类,实现数据分析,而数据越多,数据处理的时间及计算的 复杂程度就越高,同时聚类效果也越难保证
在传统的针对用户用电行为的研究当中,并未提出如何选择特征,即进行 聚类的特征集并没有进行优选,这对待分析的用户负荷的有效性还并未确定, 有待验证。并且对于居民用户负荷来说,不仅受到常规使用的受负荷率、日峰 谷差率等典型用电特征的影响,还受温度、雨水、压强等典型气象特征因素的 影响。因此,传统方法仅基于常用用电特征进行聚类分析的方式,数据计算量 大且准确性不够,有待改进。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较 佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或 省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略 不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的一个技术问题是:提出一种居民用电行为聚类中的特 征优选方法,能够对原始特征进行筛选,从而降低分析时的计算量并提高分析 准确性。
为解决上述技术问题,本发明提供如下技术方案:一种居民用电行为聚类 中的特征优选方法,包括,采集数据并构建原始特征集;构建评价函数;基于 评价函数对原始特征集进行筛选;对密度峰值算法进行改进;基于改进的密度 峰值算法进行聚类分析。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:所述原始特征集包括用电特征和气象特征,用电特征还包括峰谷特性变 化指标、用电特征变化指标和日用电特征指标;气象特征还包括平均温、最高 温、最低温、雨水、风向、风速、压强和湿度。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:所述评价函数的构建包括轮廓系数指标,其计算公式为,
Figure BDA0002396158760000021
其中,i为原始数据集X中的一个样本,a(xi)表示xi到同一簇内其他对象 之间的平均距离,b(xi)表示xi到其余类簇的最小平均距离。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:所述评价函数还包括贝叶斯信息准则函数,其计算公式为,
Figure BDA0002396158760000022
其中,k为聚类模型中聚类簇的个数,n为样本的数量,
Figure BDA0002396158760000023
为似然函数, 其公式为,
Figure BDA0002396158760000024
其中,SC和SC*分别为聚类评价指标的最优值及实际输出的评价指标值。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:所述评价函数还包括相关系数ρxy,其计算公式为,
Figure BDA0002396158760000025
其中,cov(x,y)为特征x与y的协方差,σx和σy分别为特征x与y的标准差, ρxy的取值范围为[-1,1]。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:所述评价函数的公式为,
Figure BDA0002396158760000026
其中,Z(x)为特征x的评价值,B'(x)为特征x进行归一化后的贝叶斯信息 准则值,ρxy为相关系数。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:述最优特征子集通过特征优选进行构建,特征优选还包括,计算原始特 征库X中各特征的评价值;筛选特征构成最优特征子集Y;计算最优特征子集 Y的评价值R;评价值R是否小于设定阈值,若小于则输出最终的最优特征子 集Y。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:所述评价值R的计算公式为,
Figure BDA0002396158760000031
其中,评价值R为原始特征库X中最优特征的评价值与最优特征子集Y 的评价值的比值,当R小于设定阈值时停止选择。
作为本发明所述的居民用电行为聚类中的特征优选方法的一种优选方案, 其中:所述改进的密度峰值算法包括以下步骤,根据聚类评价指标SC,利用 布谷鸟搜索算法对截断距离进行优化;利用异常值检测的思想,采用高斯分布 实现聚类中心的自动选择。
本发明解决的另一个技术问题是:提出一种居民用电行为聚类中的特征优 选系统,使上述方法能够依托于该系统实现。
为解决上述技术问题,本发明提供如下技术方案:一种居民用电行为聚类 中的特征优选系统,包括,采集模块,所述采集模块用于采集和构建原始特征 集;筛选模块,所述筛选模块能够构建评价函数并对原始特征集数据进行筛选; 聚类分析模块,所述聚类分析模块对筛选后的数据进行聚类。
本发明的有益效果:通过对用电特征和气象因素特征共同构成的原始特征 集的优选,构成能够实现较好效果的计算量最少的最优特征子集并进行聚类分 析,从而完成用户用电模式的分类研究,通过优选合适样本用户集的用电特征 集,不仅能大大减少分析时所需计算的数据,降低计算量,同时能有效地提高 分析性能。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需 要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的 一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下, 还可以根据这些附图获得其它的附图。其中:
图1为本发明第一种实施例所述居民用电行为聚类中的特征优选方法的整 体流程示意图;
图2为本发明第一种实施例所述构建最优特征子集流程示意图;
图3为本发明第一种实施例中实验的特征挑选过程的准确率变化趋势图;
图4为本发明第二种实施例所述居民用电行为聚类中的特征优选系统的整 体结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书 附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的 一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员 在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的 保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明 还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不 违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例 的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少 一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在 一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施 例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明, 表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例, 其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及 深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等 指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述 本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、 以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第 一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广 义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械 连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件 内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在 本发明中的具体含义。
实施例1
参照图1的示意,示意为一种居民用电行为聚类中的特征优选方法的流程 示意图,该方法具体包括以下步骤,
S1:采集数据并构建原始特征集。其中,所述原始特征集包括用电特征和 气象特征,用电特征还包括峰谷特性变化指标、用电特征变化指标和日用电特 征指标;气象特征还包括平均温、最高温、最低温、雨水、风向、风速、压强 和湿度。采集过程可以通过居民电表和气象网站等获取数据。
具体的,参照下表1所示,用电特征为居民用电负荷的相关特征指标,峰 谷特性变化指标包括峰期负载率、平期负载率和谷期负载率;用电特征变化指 标包括负荷率、峰谷差和峰谷差率;日用电特征指标是以日为单位表述用电特 征的指标,包括日用电负荷、日平均负荷、日最大负荷和日最小负荷。
表1:用电特征指标
Figure BDA0002396158760000051
Figure BDA0002396158760000061
表1定义中的P代表用电负荷,peak、fl、val分别表示峰期、平期、谷期, sum、av、max、min分别代表负荷总值、均值、最大值和最小值。
气象因素也是影响用户用电行为的隐藏特征,通常有气温、降水、湿度、 风力等影响,典型的气象因素特征参照下表2所示,
表2:用电特征指标
Figure BDA0002396158760000062
本实施例在研究用户用电行为时,同时考虑用电特征和气象特征的综合影 响,共18个特征指标,构建原始特征集X。
S2:构建评价函数对原始特征集进行筛选。由于特征指标种类多、采集到 的数据量大,因此要对原始特征集X中的特征进行优选,本实施例通过构建评 价函数的方法进行最优特征选择。
本实施例中基于轮廓系数指标、BIC信息准则和相关系数构建新的评价函 数,所述轮廓系数指标,
其中,轮廓系数指标用于评估聚类效果,将原始特征集X分为J个类簇, C={C1,C2,...,CJ},则原始特征集X中的某一样本i的轮廓系数指标计算公式为,
Figure BDA0002396158760000063
其中,i为原始数据集X中的一个样本,a(xi)表示xi到同一簇内其他对象 之间的平均距离,b(xi)表示xi到其余类簇的最小平均距离。
基于信息量的贝叶斯信息准则用于评价特征的有效性,其计算公式为,
Figure BDA0002396158760000064
其中,k为聚类模型中聚类簇的个数,n为样本的数量,
Figure BDA0002396158760000071
为似然函数, 其公式为,
Figure BDA0002396158760000072
其中,SC和SC*分别为聚类评价指标的最优值及实际输出的评价指标值。
相关系数ρxy用来表征两个特征间的关联程度,其计算公式为,
Figure BDA0002396158760000073
其中,cov(x,y)为特征x与y的协方差,σx和σy分别为特征x与y的标准差, ρxy的取值范围为[-1,1],ρxy的绝对值越接近于1,则说明二者的相关性越大。
所述评价函数的公式为,
Figure BDA0002396158760000074
其中,Z(x)为特征x的评价值,B'(x)为特征x进行归一化后的贝叶斯信息 准则值,ρxy为相关系数。
S3:选择符合条件的数据构成最优特征子集。
由于原始特征集X中的每个特征对聚类分析的影响效果是不同的,并且在 分析过程中有些特征所提供的信息可能存在重复和冗余。因此对原始数据集进 行优选,选择有效的特征指标去映射用电数据,得到最优特征子集再进行聚类 分析,既能够除去多余的特征指标,简化计算,又能够提高分析性能。
为了得到最优特征子集,既需要考虑特征的有效性,又需要考虑各特征之 间的互补性。本实施例综合考虑特征的有效性及各特征间的相关性构建进行特 征优选的评价函数,
所述特征优选还包括以下步骤,
计算原始特征库X中各特征的评价值;
筛选特征构成最优特征子集Y;
计算最优特征子集Y的评价值R;
评价值R是否小于设定阈值,若小于则输出最终的最优特征子集Y。
具体的,原始特征库中的各特征利用此评价函数进行计算时,评价值越小, 则说明该特征对用电行为分析影响越大,效果越好。
进行特征挑选时,要从原始特征集X中选出评价值较小的特征构成最优特 征子集。特征优选过程具体如下:首先计算出原始特征库中各特征的评价值, 然后利用启发式序列前向搜索法对特征进行逐个选取,从空集开始,每次挑选 出评价值最小的特征放入最优特征子集中,直到最优特征子集满足停止条件。 构建最优特征子集Y的流程图如图2所示。所选出的特征可以表示为:
y=argmin{Z(x)}
最优特征子集Y的评价集可以表示为:
Figure BDA0002396158760000081
其中,Z(Y)为最优特征子集Y的评价值,其为该子集中所有特征的评价值 之和。特征挑选终止的判别条件为,原始特征库X中所剩余特征的有效性远小 于其所带来的冗余性时则停止选择,即需要计算评价值R,所述评价值R的计 算公式为,
Figure BDA0002396158760000082
其中,评价值R为原始特征库X中最优特征的评价值与最优特征子集Y 的评价值的比值,当R小于设定阈值时停止选择。
S4:对密度峰值算法进行改进;
S5:基于改进的密度峰值算法进行聚类分析。
由于传统的密度峰值算法冗余性较大,人为选择聚类中心也包含了主观性, 因此基于上述不足,本文提出了改进的密度峰值法,主要工作为包括根据聚类 评价指标SC,利用布谷鸟搜索算法对截断距离进行优化;以及利用异常值检 测的思想,采用高斯分布实现聚类中心的自动选择。
具体的,利用布谷鸟优化的密度峰值聚类算法还包括以下步骤,
初始化种群;
运行CFSFDP聚类算法,得到SC指标;
保留当前的SC指标为最优;
计算下一代对应的SC指标,若优于上一代,则将此时的dc值保留至下一 代,否则原来的dc值保持不变;
产生随机数p,将其与被发现概率Pa做比较,若大于Pa则更新,否则保持 不变;
若保持当前最优解不变或者满足了最大迭代次数,则输出相应的SC指标 和截断距离dc,算法结束,否则转到该算法的第二步。
本实施例中利用正态分布作为异常值检测的模型,实现自动确定聚类中心, 还包括以下步骤,
计算出每个数据点的局部密度ρ和距离δ,并将其标准化;
计算出每个数据点的簇中心权值γ,计算公式如下,
γ=ρ′δ′
其中,ρ'和δ'分别为标准化后的局部密度ρ和距离δ。
根据下式计算每个数据点的均值和方差,
Figure BDA0002396158760000092
Figure BDA0002396158760000093
根据3σ原则,确定异常点,即自动选择出聚类中心。
场景一:
为了验证本实施例中所述居民用电行为聚类中的特征优选方法的实际效 果,选用5类典型日负荷曲线共515条,每类各103条进行聚类分析实验,利 用分类的准确率来衡量聚类效果的好坏。本实验在单台CPU为2.6GHZ,内存 为16GB,操作系统64位的个人计算机上完成,并使用Matlab R2018a进行算 法测试。
首先根据提出的特征优选策略,对原始特征集进行挑选。最优特征子集从 空集开始,依次挑选评价值最小的特征。首先,进行第一次特征挑选时,计算 各特征指标的评价值,如下表1所示。
表1:第一次特征挑选时各指标的评价值
特征编号 1 2 3 4 5 6
评价值 3.99E-11 1.21E-09 1.84E-16 7.91E-11 2.39E-10 3.07E-10
特征编号 7 8 9 10 11 12
评价值 0 3.07E-09 7.51E-10 3.30E-11 5.24E-09 7.05E-09
特征编号 13 14 15 16 17 18
评价值 6.90E-09 8.98E-23 1.85E-20 3.57E-24 6.12E-09 2.15E-17
特征挑选时,应选择评价值最小的特征放入最优特征子集中,根据表1, 第一次应选择评价值最小的日用电负荷,即编号7。接着,进行第二次特征挑 选,过程与第一次类似,只是已挑选出来的日用电负荷特征不需要再进行评价 值的计算,其余各特征指标的评价值,如下表2所示。
表2:第二次特征挑选时各指标的评价值
特征编号 1 2 3 4 5 6
评价值 6.32E-09 1.42E-08 1.39E-08 2.76E-21 7.04E-16 9.31E-10
特征编号 7 8 9 10 11 12
评价值 / 1.36E-08 7.27E-23 1.67E-15 8.98E-20 2.47E-10
特征编号 13 14 15 16 17 18
评价值 9.59E-11 1.27E-10 1.04E-08 3.07E-09 3.37E-11 7.55E-10
与第一次挑选类似,选择评价值最小的特征,根据上表2,日最大负荷, 即编号9被挑选出来,此时,特征优选子集由日用电负荷和日最大负荷两个特 征构成。
第三次、第四次等后续的特征挑选与上述过程类似,这里不再进行赘述。 最终,通过本实施例提出的特征优选方法,特征挑选的顺序依次为编号 7,9,4,11,5,10,17,13,14,12,18,6,2,16,15,8,3,2,如果按照此顺序依次挑选特征至最优 特征子集中,进行聚类分析时准确率的变化趋势如下图3所示。
利用本实施例提出的特征优选方法,当选择了7个特征后满足终止条件, 不再进行选择,最终选出的最优特征子集为编号7,9,4,11,5,10,17的特征。并且 从图3中可以看出,随着最优特征子集中所选特征的增加,聚类分析的准确率 逐渐上升,但是当特征数达到7时,继续增加特征,此时聚类准确率出现了下 降。因此可以看出,采用本实施例所提的特征优选策略选择出的特征,进行聚 类分析时可以得到有效可靠的结果。
另外,为了验证本实施例特征优选方法中改进的密度峰值算法进行聚类, 与传统的基于欧氏距离的密度峰值进行聚类的效果差异,
表3:不同方法性能对比
Figure BDA0002396158760000101
表3可知,对最优特征子集,采用本实施例提供的改进密度峰值法进行聚 类分析,在保持时间性能的基础上提高了聚类准确率。
实施例2
参照图4的示意,示意为本实施例提出的一种居民用电行为聚类中的特征 优选系统的原理结构示意图,上述实施例提出的居民用电行为聚类中的特征优 选方法能够依托于该系统实现。
具体的,该系统包括采集模块100、筛选模块200和聚类分析模块300,其 中,
采集模块100用于采集和构建原始特征集;
筛选模块200能够构建评价函数并对原始特征集数据进行筛选;
聚类分析模块300对筛选后的数据进行聚类。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或 者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述 方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存 储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预 定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以 高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要, 该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释 的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外 指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合) 可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共 同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算 机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可 由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实 现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计 算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通 信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读 代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或 写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质 或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此 外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括 结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述 的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发 明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用 于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性 存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在 本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产 生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算 机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件 或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、 处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例, 在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存 在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分 布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结 构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个 数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的 另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系 统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参 照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可 以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精 神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种居民用电行为聚类中的特征优选方法,其特征在于:包括,
采集数据并构建原始特征集;
构建评价函数;
基于评价函数对原始特征集进行筛选;
对密度峰值算法进行改进;
基于改进的密度峰值算法进行聚类分析。
2.如权利要求1所述的居民用电行为聚类中的特征优选方法,其特征在于:所述原始特征集包括用电特征和气象特征,
用电特征还包括峰谷特性变化指标、用电特征变化指标和日用电特征指标;气象特征还包括平均温、最高温、最低温、雨水、风向、风速、压强和湿度。
3.如权利要求1或2所述的居民用电行为聚类中的特征优选方法,其特征在于:所述评价函数的构建包括轮廓系数指标,其计算公式为,
Figure FDA0002396158750000011
其中,i为原始数据集X中的一个样本,a(xi)表示xi到同一簇内其他对象之间的平均距离,b(xi)表示xi到其余类簇的最小平均距离。
4.如权利要求3所述的居民用电行为聚类中的特征优选方法,其特征在于:所述评价函数还包括贝叶斯信息准则函数,其计算公式为,
Figure FDA0002396158750000012
其中,k为聚类模型中聚类簇的个数,n为样本的数量,
Figure FDA0002396158750000013
为似然函数,其公式为,
Figure FDA0002396158750000014
其中,SC和SC*分别为聚类评价指标的最优值及实际输出的评价指标值。
5.如权利要求4所述的居民用电行为聚类中的特征优选方法,其特征在于:所述评价函数还包括相关系数ρxy,其计算公式为,
Figure FDA0002396158750000015
其中,cov(x,y)为特征x与y的协方差,σx和σy分别为特征x与y的标准差,ρxy的取值范围为[-1,1]。
6.如权利要求4或5所述的居民用电行为聚类中的特征优选方法,其特征在于:所述评价函数的公式为,
Figure FDA0002396158750000021
其中,Z(x)为特征x的评价值,B'(x)为特征x进行归一化后的贝叶斯信息准则值,ρxy为相关系数。
7.如权利要求6所述的居民用电行为聚类中的特征优选方法,其特征在于:所述最优特征子集通过特征优选进行构建,特征优选还包括,
计算原始特征库X中各特征的评价值;
筛选特征构成最优特征子集Y;
计算最优特征子集Y的评价值R;
评价值R是否小于设定阈值,若小于则输出最终的最优特征子集Y。
8.如权利要求7所述的居民用电行为聚类中的特征优选方法,其特征在于:所述评价值R的计算公式为,
Figure FDA0002396158750000022
其中,评价值R为原始特征库X中最优特征的评价值与最优特征子集Y的评价值的比值,当R小于设定阈值时停止选择。
9.如权利要求7或8所述的居民用电行为聚类中的特征优选方法,其特征在于:所述改进的密度峰值算法包括以下步骤,
根据聚类评价指标SC,利用布谷鸟搜索算法对截断距离进行优化;
利用异常值检测的思想,采用高斯分布实现聚类中心的自动选择。
10.一种居民用电行为聚类中的特征优选系统,其特征在于:包括,
采集模块(100),所述采集模块(100)用于采集和构建原始特征集;
筛选模块(200),所述筛选模块(200)能够构建评价函数并对原始特征集数据进行筛选;
聚类分析模块(300),所述聚类分析模块(300)对筛选后的数据进行聚类。
CN202010132423.4A 2020-02-29 2020-02-29 一种居民用电行为聚类中的特征优选方法及系统 Pending CN111861781A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010132423.4A CN111861781A (zh) 2020-02-29 2020-02-29 一种居民用电行为聚类中的特征优选方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010132423.4A CN111861781A (zh) 2020-02-29 2020-02-29 一种居民用电行为聚类中的特征优选方法及系统

Publications (1)

Publication Number Publication Date
CN111861781A true CN111861781A (zh) 2020-10-30

Family

ID=72985939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010132423.4A Pending CN111861781A (zh) 2020-02-29 2020-02-29 一种居民用电行为聚类中的特征优选方法及系统

Country Status (1)

Country Link
CN (1) CN111861781A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365164A (zh) * 2020-11-13 2021-02-12 国网江苏省电力有限公司扬州供电分公司 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法
CN112906790A (zh) * 2021-02-20 2021-06-04 国网江苏省电力有限公司营销服务中心 一种基于用电数据的独居老人识别方法和系统
CN112926645A (zh) * 2021-02-22 2021-06-08 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法
CN113191453A (zh) * 2021-05-24 2021-07-30 国网四川省电力公司经济技术研究院 一种基于dae网络特征的用电行为画像生成方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765194A (zh) * 2018-05-29 2018-11-06 深圳源广安智能科技有限公司 一种有效的居民用电行为分析系统
CN108960657A (zh) * 2018-07-13 2018-12-07 国网上海市电力公司 一种基于特征优选的楼宇负荷特性分析方法
CN109883691A (zh) * 2019-01-21 2019-06-14 太原科技大学 核估计和随机滤波集成的齿轮剩余寿命预测方法
CN110825723A (zh) * 2019-10-09 2020-02-21 上海电力大学 一种基于用电负荷分析的居民用户分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765194A (zh) * 2018-05-29 2018-11-06 深圳源广安智能科技有限公司 一种有效的居民用电行为分析系统
CN108960657A (zh) * 2018-07-13 2018-12-07 国网上海市电力公司 一种基于特征优选的楼宇负荷特性分析方法
CN109883691A (zh) * 2019-01-21 2019-06-14 太原科技大学 核估计和随机滤波集成的齿轮剩余寿命预测方法
CN110825723A (zh) * 2019-10-09 2020-02-21 上海电力大学 一种基于用电负荷分析的居民用户分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
曾兴东,林荣恒,邹华,张勇: "面向配电网故障数据的 BIC 评估后向选择方法", 《北京邮电大学学报》, vol. 40, no. 3, pages 104 - 108 *
曾兴东;林荣恒;邹华;张勇;: "面向配电网故障数据的BIC评估后向选择方法", 北京邮电大学学报, no. 03, pages 104 - 108 *
郑虹,周丽媛,韩旭明: "布谷鸟优化的密度峰值快速搜索聚类算法", 《长春工业大学学报》, vol. 39, no. 3, pages 253 - 259 *
陆俊,朱炎平,彭文昊,孙毅: "智能用电用户行为分析特征优选策略", 《电力系统自动化》, vol. 41, no. 5, pages 58 - 62 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365164A (zh) * 2020-11-13 2021-02-12 国网江苏省电力有限公司扬州供电分公司 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法
CN112365164B (zh) * 2020-11-13 2023-09-12 国网江苏省电力有限公司扬州供电分公司 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法
CN112906790A (zh) * 2021-02-20 2021-06-04 国网江苏省电力有限公司营销服务中心 一种基于用电数据的独居老人识别方法和系统
CN112906790B (zh) * 2021-02-20 2023-08-18 国网江苏省电力有限公司营销服务中心 一种基于用电数据的独居老人识别方法和系统
CN112926645A (zh) * 2021-02-22 2021-06-08 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法
CN113191453A (zh) * 2021-05-24 2021-07-30 国网四川省电力公司经济技术研究院 一种基于dae网络特征的用电行为画像生成方法及系统
CN113191453B (zh) * 2021-05-24 2022-04-22 国网四川省电力公司经济技术研究院 一种基于dae网络特征的用电行为画像生成方法及系统

Similar Documents

Publication Publication Date Title
CN111861781A (zh) 一种居民用电行为聚类中的特征优选方法及系统
CN108733631A (zh) 一种数据评估方法、装置、终端设备及存储介质
CN111832796B (zh) 一种针对居民用电负荷模式的精细分类及预测方法及系统
CN109657891B (zh) 一种基于自适应k-means++算法的负荷特性分析方法
CN117113235B (zh) 一种云计算数据中心能耗优化方法及系统
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN108280236A (zh) 一种基于LargeVis的随机森林可视化数据分析方法
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN118171180A (zh) 基于人工智能的设备状态预测方法和装置
CN112215268A (zh) 一种灾害天气卫星云图分类方法和装置
CN115329880A (zh) 气象特征提取方法、装置、计算机设备和存储介质
CN113094448B (zh) 住宅空置状态的分析方法及分析装置、电子设备
CN110472659A (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
CN114648060A (zh) 基于机器学习的故障信号规范化处理及分类方法
CN117408394B (zh) 电力系统的碳排放因子预测方法、装置及电子设备
CN116258279B (zh) 基于综合赋权的滑坡易发性评价方法和装置
CN117933316A (zh) 一种基于可解释贝叶斯卷积网络的地下水位概率预报方法
CN111459926A (zh) 一种园区综合能源异常数据识别方法
CN111612289B (zh) 基于新能源多场景风险特征导向的电力系统风险评估方法
CN116541780A (zh) 输电线路舞动预警方法、装置、设备及存储介质
CN114706751A (zh) 一种基于改进smote的软件缺陷预测方法
CN116010831A (zh) 一种基于潜在决策结果的组合聚类场景缩减方法及系统
CN111127184A (zh) 一种分布式组合信用评估方法
CN116955117B (zh) 基于数据可视化增强的电脑散热器性能分析系统
CN115330397B (zh) 智能合约风险预测方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination