Nothing Special   »   [go: up one dir, main page]

CN103927545B - 聚类方法及相关装置 - Google Patents

聚类方法及相关装置 Download PDF

Info

Publication number
CN103927545B
CN103927545B CN201410096608.9A CN201410096608A CN103927545B CN 103927545 B CN103927545 B CN 103927545B CN 201410096608 A CN201410096608 A CN 201410096608A CN 103927545 B CN103927545 B CN 103927545B
Authority
CN
China
Prior art keywords
distance
weight
class
equations
weight coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410096608.9A
Other languages
English (en)
Other versions
CN103927545A (zh
Inventor
陈志军
张波
张涛
王琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201410096608.9A priority Critical patent/CN103927545B/zh
Publication of CN103927545A publication Critical patent/CN103927545A/zh
Priority to PCT/CN2014/082884 priority patent/WO2015135277A1/zh
Priority to RU2015129671A priority patent/RU2630373C2/ru
Priority to MX2014011016A priority patent/MX346698B/es
Priority to JP2016506779A priority patent/JP6051336B2/ja
Priority to KR1020147026522A priority patent/KR101639502B1/ko
Priority to US14/526,477 priority patent/US20150262033A1/en
Priority to EP15154051.5A priority patent/EP2919136A1/en
Application granted granted Critical
Publication of CN103927545B publication Critical patent/CN103927545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本公开实施例公开了一种聚类方法及相关装置,所述聚类方法根据对象间的距离对应的权重系数获得类之间的权重距离,权重系数根据两个对象间的相似性确定,即对对象间的距离赋予权重;然后,合并权重距离符合合并条件的类,直到合并后的类的数量与合并前的类的数量相同时终止,得到聚类结果。由于所述权重距离与两个对象的相似性相关联,从而使不同的对象间距离的贡献不同,相似性越大对应的贡献也就越大,因此,提高了聚类结果的准确率。

Description

聚类方法及相关装置
技术领域
本公开涉及计算机技术领域,特别是涉及一种聚类方法及相关装置。
背景技术
聚类是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程,即将对象分类到不同的类或者簇的过程,同一个类中的对象有很大的相似性,不同类中的对象有很大的相异性。层次聚类方法是对给定的对象进行层次分解,直到满足某种终止条件。凝聚的层次聚类方法是一种自底向上的策略,首先将每个对象看作一个类,然后合并这些类成为越来越大的类,直到满足某个终止条件。大部分层次聚类方法属于此类,只是类间相似度的定义不同。
例如,当聚类方法用于图片的分类时,将属于同一个人的图片分为一类,相关的聚类方法仅采用类与类之间的距离度量两张人脸之间的相似度,各个对象间的距离对相似度度量的贡献基本相同,导致此种聚类方法的聚类结果准确率较低。
发明内容
为克服相关技术中存在的问题,本公开提供一种聚类方法及相关装置。
为了解决上述技术问题,本公开实施例公开了如下技术方案:
根据本公开实施例的第一方面,提供一种聚类方法,包括:
针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间距离对应的两个对象之间的相似性确定;根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;当存在能合并的类时,将全部能合并的类各自进行合并,并返回执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果。
结合第一方面,在第一方面的第一种可能的实现方式中,所述方法还包括:
根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系;根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,采用如下方式:
查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个对象的概率;确定所述概率为所述对象间距离对应的权重系数。
结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述权重距离为第一类与第二类之间的权重距离;所述针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,采用如下方式:
根据所述第一类的全部对象与所述第二类的全部对象之间的距离,及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离;获取所述第二类到所述第一类的第二单向权重距离;根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,根据所述第一类的全部对象与所述第二类的全部对象之间的距离及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离,采用如下方式:
获取所述第一类内任一对象与所述第二类的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离;
获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离;
根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;
根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述权重距离对应的权重系数,获得所述第一类到所述第二类之间的第一单向权重距离。
根据本公开实施例的第二方面,提供一种聚类装置,包括:
获取单元,用于针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间距离对应的两个对象间的相似性确定;
判断单元,用于根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;
合并单元,用于当存在能合并的类时,将全部能合并的类各自进行合并,所述获取单元执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果。
结合第二方面,在第二方面的第一种可能的实现方式中,所述装置还包括:
统计单元,用于根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系;
确定单元,用于根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述确定单元包括:
查询子单元,用于查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个人的概率;
确定子单元,用于确定所述概率为所述对象间距离对应的权重系数。
结合第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述权重距离为第一类与第二类之间的权重距离,所述获取单元包括:
第一获取子单元,用于获取所述第一类内的任一对象与所述第二类内的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
第二获取子单元,用于针对所述第一类的全部对象,根据所述相似性最大的距离及对应的第一权重系数,获得所述第一类到所述第二类的第一单向权重距离;
第三获取子单元,用于获取所述第二类到所述第一类的第二单向权重距离;
第四获取子单元,用于根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式中,所述第二获取子单元包括:
第五获取子单元,获取所述第一类内任一对象与所述第二类的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
第六获取子单元,用于根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离;
第七获取子单元,用于获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离;
第八获取子单元,用于根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;
第九获取子单元,用于根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述权重距离对应的权重系数,获得所述第一类到所述第二类之间的第一单向权重距离。
根据本公开实施例的第三方面,提供一种终端设备,包括:
处理器;用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间距离对应的两个对象间的相似性确定;
根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;
当两个类能合并时,将全部能合并的类各自进行合并,并返回执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果。
本公开的实施例提供的技术方案可以包括以下有益效果:所述聚类方法根据对象间的距离对应的权重系数获得类之间的权重距离,权重系数根据两个对象的相似性确定,即对对象间的距离赋予权重;然后,合并权重距离符合合并条件的类,直到合并后的类的数量与合并前的类的数量相同时终止,得到聚类结果。由于所述权重距离与两个对象的相似性相关联,使不同的对象间距离的贡献不同,相似性越大对应的贡献也就越大,因此,提高聚类结果的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种聚类方法的流程图。
图2是根据一示例性实施例示出的图1中的步骤S110的流程图;
图3是根据一示例性实施例示出的图2中的步骤S111的流程图;
图4是根据一示例性实施例示出的获得权重系数的流程图;
图5是根据一示例性实施例示出的一种聚类装置的示意图;
图6是根据一示例性实施例示出的另一种聚类装置的示意图;
图7是根据一示例性实施例示出的一种终端设备的框图;
图8是根据一示例性实施例示出的一种服务器的框图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
图1是根据一示例性实施例示出的一种聚类方法流程图。如图1所示,所述聚类方法可以包括以下步骤:
在步骤S110中,针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间的相似性确定。
假设对象是人脸图像,本公开提供的所述聚类方法能够将属于同一个人的图像聚集在一起形成一个聚类。将人脸图像中的特征转换成一组向量,因此,对象间的距离即向量之间的距离。当然,本公开所提供的聚类方法还可以适用于除图片之外的其它的数据。
在进行聚类之前,首先进行初始化,将每个对象归为一类,计算类与类之间的距离,即类所包含的对象之间的距离(例如,余弦相似度、欧式距离等)。
对象间的相似性越大,对应的权重系数越大;反之,对象间的相似性越小,对应的权重系数越小。例如,可以根据对象间距离对应的两个对象是否是同一对象的概率确定所述权重系数。或者,利用加权核函数w=f(d)获得权重系数,其中,w是权重系数,d是对象间距离,例如,或者,还可以利用预设阈值得到权重系数,此处不一一列举。
在本公开的一个实施例中,如图2所示,步骤S110可以包括下述的步骤S111~S113:
在步骤S111中,根据所述第一类的全部对象与所述第二类的全部对象之间的距离,及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离。
在本公开的一个实施例中,如图3所示,所述步骤S111可以包括下述步骤S1111~S1115:
在步骤S1111中,获取所述第一类内的任一对象与所述第二类内的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数。
假设,第一类标记为A与第二类标记为B,计算类A和类B之间的权重距离,首先,计算类A中的任一对象Ai与类B中的全部对象之间的距离d(Ai,B),并获得对象Ai与类B中全部对象之间相似性最大的距离。本实施例中采用的是余弦相似度,因此,最大余弦相似度dmax(Ai,B)对应的对象间的相似性最大。
在本公开一示例性实施例中,所述权重系数可以根据对象间距离对应的两个对象是否是同一对象的概率得到,如图4所示,可以包括以下步骤:
在步骤S100中,根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系。
例如,在人脸识别中,根据高维特征计算出的两个人脸图像的余弦相似度cosθ的范围是[0,1],根据大量的人脸图像统计数据得出,当余弦相似度在[0.45,1]范围内时,两个对象是同一个人的概率基本是98%;当余弦相似度在[0.35,0.45)范围内时,两对象是同一个人的概率基本是70%;当余弦相似度在[0.25,0.35)范围内时,两对象是同一个人的概率基本是40%;当余弦相似度在[0.15,0.25)范围内时,两对象是同一个人的概率基本是10%;当余弦相似度在[0,0.15)范围内时,两对象是同一个人的概率基本是0.1%;
根据上述的统计结果,可以采用以下的公式(1)描述权重系数与余弦相似度之间的关系:
公式(1)是根据余弦相似度与两个对象是否是同一个人的概率之间的对应关系。其它类型的距离,根据距离对应的概率之间的关系推导,此处不再赘述。
在步骤S200中,根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定。
获得对象间距离,然后判断所述对象间距离在公式(1)中的哪个区间内,最终根据公式(1)确定所述对象间距离及权重系数之间的映射关系;根据上述方式获得dmax(Ai,B)对应的权重系数为W(dmax(Ai,B))。
在步骤S1112中,根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离(最大余弦相似度);
根据公式(2)得到Ai与类B之间的最小权重距离
在步骤S1113中,获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离。
假设类A中的对象Ai与类B中的对象b之间的距离最大,根据公式(3)获取对象Ai与类B中的除对象b之外的其余各对象之间的平均权重距离
在步骤S1114中,根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;
由Ai与类B之间的最小权重距离和平均权重距离根据公式(4)得到对象Ai到类B的权重距离
在步骤S1115中,根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述相似性最大的距离对应的权重系数,获得所述第一类到所述第二类之间的第一单向权重距离。
根据公式(5)得到类A与类B之间的第一单向权重距离S(A,B):
公式(5)中,W(dmax(Ai,B))表示类A中的对象Ai与类B中的全部对象之间最大余弦相似度(最小距离)dmax(Ai,B)对应的权重系数。
在步骤S112中,获取所述第二类到所述第一类的第二单向权重距离;
计算得到类B到类A的第二单向权重距离S(B,A),根据计算类A到类B的第一单向权重距离相似,此处不再赘述。
在步骤S113中,根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
根据公式(6)计算得到类A与类B之间的权重距离H(A,B):
在步骤S120中,根据两个类之间的权重距离及预设距离阈值,判断是否存在能够合并的类。当存在能合并的类时,执行步骤S130;当不存在能合并的类时,执行步骤S140。
所述预设距离阈值可以根据不同对象的数据类型设定,而且,根据计算得到的对象间的距离的类型(例如,余弦相似度、欧式距离等)设定,例如,对象是人脸图像,且对象间的距离为余弦相似度,则距离阈值可以设定为0.3~0.35。
计算权重距离时采用的类间距离的类型不同,判断两个类是否能合并的条件也不同:
当根据类之间的余弦相似度获得类的权重距离时,判断两个类之间的权重距离是否不小于所述预设距离阈值,如果两个类之间的权重距离不小于所述预设距离阈值,则表明两个类的相似性较大可以合并。
当类间的权重距离由欧式距离或其它距离计算得到时,判断两个类之间的权重距离是否不大于预设距离阈值,如果两个类之间的权重距离不大于所述预设距离阈值,则表明两个类的相似性较大可以合并。
本公开实施例提供的权重距离利用类间最小权重距离和平均权重距离得到,这样,既能够向对象较多的类偏袒,又能兼顾到对象不多的类,非常符合人脸聚类的特点,因此,采用所述权重距离进行聚类能够提高聚类准确率。
当两个类能合并时,在步骤S130中,将全部能合并的类各自进行合并。
在步骤S140中,判断合并后类的数量是否比合并前类的数量少,如果是,则返回执行步骤S110;否则,进入步骤S150。
当合并后类的数量小于合并前类的数量时,返回执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,即没有能够合并的类,得到聚类结果。
在步骤S150中,得到聚类结果。
聚集到一个类中的对象的相似性很大,相异性很小。以人脸图像为对象,聚集到一类的人脸图像是同一个人的图像。
本公开实施例提供的聚类方法,根据对象间的距离对应的权重系数获得类之间的权重距离,权重系数根据两个对象的相似性确定,即对对象间的距离赋予权重;然后,合并权重距离符合合并条件的类,直到合并后的类的数量与合并前的类的数量相同时终止,得到聚类结果。由于所述权重距离与两个对象的相似性相关联,使得对象的相似性不同,相应的对聚类结果的贡献不同,相似性越大对应的贡献也就越大,因此,提高了聚类结果的准确率。
图5是根据一示例性实施例示出的一种聚类装置示意图。参照图5,该装置包括获取单元100、判断单元200和合并单元300。
所述获取单元100被配置为针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间距离对应的两个对象的相似性确定。
所述获取单元100可以包括第一获取子单元、第二获取子单元、第三获取子单元和第四获取子单元;
所述第一获取子单元被配置为获取所述第一类内的任一对象与所述第二类内的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
所述第二获取子单元被配置为针对所述第一类的全部对象,根据所述相似性最大的距离及对应的第一权重系数,获得所述第一类到所述第二类的第一单向权重距离;
在本公开的一个实施例中,所述第二获取子单元可以包括:第五获取子单元、第六获取子单元、第七获取子单元、第八获取子单元和第九获取子单元;
所述第五获取子单元被配置为获取所述第一类内任一对象与所述第二类的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
所述第六获取子单元被配置为根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离;
所述第七获取子单元被配置为获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离;
所述第八获取子单元被配置为根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;
所述第九获取子单元被配置为根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述权重距离对应的权重系数,获得所述第一类到所述第二类之间的第一单向权重距离。
所述第三获取子单元被配置为获取所述第二类到所述第一类的第二单向权重距离;
所述第四获取子单元被配置为根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
所述判断单元200被配置为根据两个类之间的权重距离及预设距离阈值,判断两个类是否能够合并类。
所述合并单元300被配置为当两个类能合并时,将全部能合并的类各自进行合并,并使所述获取单元执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,即没有能够合并的类,得到聚类结果。
本公开实施例提供的聚类装置,由获取单元根据对象间的距离对应的权重系数获得类之间的权重距离,权重系数根据两个对象的相似性确定,即对对象间的距离赋予权重;在判断单元根据权重距离判断出可合并的类后,由合并单元合并权重距离符合合并条件的类,直到合并后的类的数量与合并前的类的数量相同时终止,得到聚类结果。由于所述权重距离与两个对象的相似性相关联,使对象的相似性不同,对应的对聚类结果的贡献也不同,相似性越大对应的贡献也就越大,因此,提高了聚类结果的准确率。
图6是根据一示例性实施例示出的另一种聚类装置示意图。参照图6,所述装置包括统计单元400、确定单元500、获取单元100、判断单元200和合并单元300。其中,名称及标号与图5所示的实施例相同的单元其功能也相同,本实施例中不再赘述。
所述统计单元400被配置为根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系。
所述确定单元500被配置为根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定。
所述确定单元可以包括查询子单元和确定子单元:
所述查询子单元被配置为查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个人的概率。
所述确定子单元被配置为确定所述概率为所述对象间距离对应的权重系数。
与所述确定单元500相连的所述获取单元300根据对象间距离对应的权重系数得到两个类之间的权重距离。
本公开实施例提供的聚类装置首先根据大量的样本对象获得对象间距离与两个对象是否是同一个对象的概率确定对应的权重系数,然后获得类间的权重距离,根据权重距离判断出能够合并的类,并合并所述能够合并的类,直到合并前后类的数量不变,得到聚类结果。由于所述权重距离与两个对象是否是同一对象的概率相关联,能够考虑两个对象是否是同一对象的概率随两对象间的距离变化情况,从而使不同的对象间距离的贡献不同,概率值越大对应的贡献也就越大,因此,所述聚类方法能够提高聚类结果的准确率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种用于聚类的终端设备800的框图。例如,终端设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,终端设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制终端设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在终端设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为终端设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为终端设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述终端设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当终端设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为终端设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为终端设备800的显示器和小键盘,传感器组件814还可以检测终端设备800或终端设备800一个组件的位置改变,用户与终端设备800接触的存在或不存在,终端设备800方位或加速/减速和终端设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于终端设备800和其他设备之间有线或无线方式的通信。终端设备800可以接入基于通信标准的无线网络,如WiFi,2G、3G或4G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,终端设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由终端设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种聚类方法,所述方法包括:
针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间距离对应的两个对象的相似性确定;根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;当存在能合并的类时,将全部能合并的类各自进行合并,并返回执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果。
可选地,所述方法还包括:根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系;根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定。
可选地,根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,采用如下方式:
查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个对象的概率;确定所述概率为所述对象间距离对应的权重系数。
可选地,所述权重距离为第一类与第二类之间的权重距离;所述针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,采用如下方式:
根据所述第一类的全部对象与所述第二类的全部对象之间的距离,及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离;获取所述第二类到所述第一类的第二单向权重距离;根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
可选地,根据所述第一类的全部对象与所述第二类的全部对象之间的距离及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离,采用如下方式:
获取所述第一类内任一对象与所述第二类的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离;获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离;根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述权重距离对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离。
图8是本发明实施例中服务器的结构示意图。例如,该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对终端设备中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如存储器1932或存储介质1930,上述指令可由终端设备的处理器1922执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行一种聚类方法,所述方法包括:
针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间距离对应的两个对象的相似性确定;
根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;
当存在能合并的类时,将全部能合并的类各自进行合并,并返回执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果。
可选地,所述方法还包括:根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系;根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定。
可选地,根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,采用如下方式:
查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个对象的概率;确定所述概率为所述对象间距离对应的权重系数。
可选地,所述权重距离为第一类与第二类之间的权重距离;所述针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,采用如下方式:
根据所述第一类的全部对象与所述第二类的全部对象之间的距离,及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离;获取所述第二类到所述第一类的第二单向权重距离;根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
可选地,根据所述第一类的全部对象与所述第二类的全部对象之间的距离及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离,采用如下方式:
获取所述第一类内任一对象与所述第二类的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离;获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离;根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述权重距离对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种聚类方法,其特征在于,包括:
针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间的相似性确定;
根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;
当存在能合并的类时,将全部能合并的类各自进行合并,并返回执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果;
根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系;
根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定;
根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,采用如下方式:
查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个对象的概率;
确定所述概率为所述对象间距离对应的权重系数。
2.根据权利要求1所述的方法,其特征在于,所述权重距离为第一类与第二类之间的权重距离;所述针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,采用如下方式:
根据所述第一类的全部对象与所述第二类的全部对象之间的距离,及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离;
获取所述第二类到所述第一类的第二单向权重距离;
根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
3.根据权利要求2所述的方法,其特征在于,根据所述第一类的全部对象与所述第二类的全部对象之间的距离及对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离,采用如下方式:
获取所述第一类内任一对象与所述第二类的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离;
获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离;
根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;
根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述权重距离对应的权重系数,获得所述第一类到所述第二类的第一单向权重距离。
4.一种聚类装置,其特征在于,包括:
获取单元,用于针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间的相似性确定;
判断单元,用于根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;
合并单元,用于当存在能合并的类时,将全部能合并的类各自进行合并,并控制所述获取单元执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果;
统计单元,用于根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系;
确定单元,用于根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定;
所述确定单元包括:
查询子单元,用于查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个对象的概率;
确定子单元,用于确定所述概率为所述对象间距离对应的权重系数。
5.根据权利要求4所述的装置,其特征在于,所述权重距离为第一类与第二类之间的权重距离,所述获取单元包括:
第一获取子单元,用于获取所述第一类内的任一对象与所述第二类内的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
第二获取子单元,用于针对所述第一类的全部对象,根据所述相似性最大的距离及对应的第一权重系数,获得所述第一类到所述第二类的第一单向权重距离;
第三获取子单元,用于获取所述第二类到所述第一类的第二单向权重距离;
第四获取子单元,用于根据所述第一单向权重距离和所述第二单向权重距离,得到所述第一类与所述第二类的权重距离。
6.根据权利要求5所述的装置,其特征在于,所述第二获取子单元包括:
第五获取子单元,获取所述第一类内任一对象与所述第二类的全部对象之间相似性最大的距离,以及所述相似性最大的距离对应的第一权重系数;
第六获取子单元,用于根据所述相似性最大的距离与对应的第一权重系数的乘积,得到所述第一类中的对象与所述第二类的全部对象之间的最小权重距离;
第七获取子单元,用于获取所述第一类中的对象与所述第二类中除相似性最大的距离对应的对象之外的其它对象之间距离的平均权重距离;
第八获取子单元,用于根据所述最小权重距离和所述平均权重距离得到所述第一类中的所述对象与所述第二类之间的权重距离;
第九获取子单元,用于根据所述第一类中的全部对象与所述第二类之间的权重距离,以及所述权重距离对应的权重系数,获得所述第一类到所述第二类之间的第一单向权重距离。
7.一种终端设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离,所述权重系数根据所述对象间的相似性确定;
根据两个类之间的权重距离及预设距离阈值,判断是否存在能合并的类;
当两个类能合并时,将全部能合并的类各自进行合并,并返回执行针对全部待合并的类,根据对象间距离对应的权重系数得到两个类之间的权重距离的步骤,直到合并后类的数量与合并前类的数量相同,得到聚类结果;
根据样本对象统计得到对象间距离与两个对象是否是同一对象的概率之间的对应关系;
根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,所述权重系数根据所述概率确定;
根据所述对应关系,确定所述对象间距离与权重系数之间的映射关系,采用如下方式:
查询所述对应关系,获得所述对象间距离对应的两个对象是否是同一个对象的概率;
确定所述概率为所述对象间距离对应的权重系数。
CN201410096608.9A 2014-03-14 2014-03-14 聚类方法及相关装置 Active CN103927545B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201410096608.9A CN103927545B (zh) 2014-03-14 2014-03-14 聚类方法及相关装置
JP2016506779A JP6051336B2 (ja) 2014-03-14 2014-07-24 クラスタリング方法、クラスタリング装置、端末装置、プログラム及び記録媒体
RU2015129671A RU2630373C2 (ru) 2014-03-14 2014-07-24 Способ и устройство для кластеризации
MX2014011016A MX346698B (es) 2014-03-14 2014-07-24 Metodo y dispositivo de agrupamiento.
PCT/CN2014/082884 WO2015135277A1 (zh) 2014-03-14 2014-07-24 聚类方法及相关装置
KR1020147026522A KR101639502B1 (ko) 2014-03-14 2014-07-24 클러스터링 방법, 관련장치, 프로그램 및 기록매체
US14/526,477 US20150262033A1 (en) 2014-03-14 2014-10-28 Method and terminal device for clustering
EP15154051.5A EP2919136A1 (en) 2014-03-14 2015-02-06 Method and device for clustering

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410096608.9A CN103927545B (zh) 2014-03-14 2014-03-14 聚类方法及相关装置

Publications (2)

Publication Number Publication Date
CN103927545A CN103927545A (zh) 2014-07-16
CN103927545B true CN103927545B (zh) 2017-10-17

Family

ID=51145761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410096608.9A Active CN103927545B (zh) 2014-03-14 2014-03-14 聚类方法及相关装置

Country Status (7)

Country Link
EP (1) EP2919136A1 (zh)
JP (1) JP6051336B2 (zh)
KR (1) KR101639502B1 (zh)
CN (1) CN103927545B (zh)
MX (1) MX346698B (zh)
RU (1) RU2630373C2 (zh)
WO (1) WO2015135277A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927545B (zh) * 2014-03-14 2017-10-17 小米科技有限责任公司 聚类方法及相关装置
CN105488467B (zh) * 2015-11-26 2019-07-23 小米科技有限责任公司 图片分类方法及装置
CN107092618A (zh) * 2016-10-27 2017-08-25 北京小度信息科技有限公司 一种信息处理方法及装置
CN109469919B (zh) * 2018-11-12 2020-07-28 南京工程学院 一种基于权重聚类的电站空预器堵灰监测方法
CN111310834B (zh) * 2020-02-19 2024-05-28 深圳市商汤科技有限公司 数据处理方法及装置、处理器、电子设备、存储介质
CN111415151A (zh) * 2020-03-10 2020-07-14 支付宝(杭州)信息技术有限公司 连锁商户的识别方法、装置、电子设备及存储介质
CN112132111A (zh) * 2020-10-10 2020-12-25 安徽江淮汽车集团股份有限公司 泊车典型场景的提取方法、设备、存储介质及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881032A (zh) * 2012-09-14 2013-01-16 北京理工大学 一种基于改进算法的图片拼接方法
CN103136355A (zh) * 2013-03-05 2013-06-05 电子科技大学 一种基于自动阈值鱼群算法的文本聚类方法
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100312331B1 (ko) * 1998-02-14 2001-12-28 이계철 내용기반영상검색방법및장치
US7664735B2 (en) * 2004-04-30 2010-02-16 Microsoft Corporation Method and system for ranking documents of a search result to improve diversity and information richness
US7809192B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for recognizing objects from images and identifying relevancy amongst images and information
KR100824698B1 (ko) * 2006-08-25 2008-04-24 인하대학교 산학협력단 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반영역 가중치 방법
KR100804678B1 (ko) * 2007-01-04 2008-02-20 삼성전자주식회사 비디오 인물별 신 분류 방법 및 그 시스템
RU2345414C1 (ru) * 2007-08-10 2009-01-27 Общество с ограниченной ответственностью "Рекогмишн" Способ построения системы индексирования для поиска объектов на цифровых изображениях
JP5526955B2 (ja) * 2010-04-09 2014-06-18 ソニー株式会社 顔クラスタリング装置、顔クラスタリング方法、及びプログラム
WO2011152821A1 (en) * 2010-06-01 2011-12-08 Hewlett-Packard Development Company, L.P. Clustering images
WO2012089902A1 (en) * 2010-12-30 2012-07-05 Nokia Corporation Method, apparatus, and computer program product for image clustering
US20120294540A1 (en) * 2011-05-17 2012-11-22 Microsoft Corporation Rank order-based image clustering
CN103927545B (zh) * 2014-03-14 2017-10-17 小米科技有限责任公司 聚类方法及相关装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881032A (zh) * 2012-09-14 2013-01-16 北京理工大学 一种基于改进算法的图片拼接方法
CN103136355A (zh) * 2013-03-05 2013-06-05 电子科技大学 一种基于自动阈值鱼群算法的文本聚类方法
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法

Also Published As

Publication number Publication date
KR20150117201A (ko) 2015-10-19
MX2014011016A (es) 2016-02-19
RU2630373C2 (ru) 2017-09-07
JP2016517110A (ja) 2016-06-09
CN103927545A (zh) 2014-07-16
JP6051336B2 (ja) 2016-12-27
EP2919136A1 (en) 2015-09-16
RU2015129671A (ru) 2017-04-27
KR101639502B1 (ko) 2016-07-22
MX346698B (es) 2017-03-28
WO2015135277A1 (zh) 2015-09-17

Similar Documents

Publication Publication Date Title
CN103927545B (zh) 聚类方法及相关装置
CN103914518B (zh) 聚类方法及相关装置
US9773105B2 (en) Device security using user interaction anomaly detection
CN103902689B (zh) 聚类方法、增量聚类方法及相关装置
CN105590094B (zh) 确定人体数量的方法及装置
CN103944804B (zh) 推荐联系人的方法及装置
CN107133576A (zh) 用户年龄识别方法及装置
CN105631403A (zh) 人脸识别方法及装置
CN106155504A (zh) 模组唤醒方法及装置
CN103902654B (zh) 聚类方法、装置及终端设备
WO2015127801A1 (zh) 聚类方法、装置及终端设备
CN109543066A (zh) 视频推荐方法、装置和计算机可读存储介质
US11475879B2 (en) Method and device for evaluating quality of content, electronic equipment, and storage medium
CN105100197B (zh) 安装应用的方法及装置
CN104954543A (zh) 自动报警方法、装置及移动终端
CN104077563B (zh) 人脸识别方法和装置
CN105162984B (zh) 电话号码识别方法及装置
CN110532345A (zh) 一种未标注数据的处理方法、装置及存储介质
CN112101216A (zh) 人脸识别方法、装置、设备及存储介质
JP2016517110A5 (zh)
CN105302877B (zh) 用于短信领域分类的方法、短信领域识别方法及装置
CN109145876A (zh) 图像分类方法、装置、电子设备及存储介质
CN112884040B (zh) 训练样本数据的优化方法、系统、存储介质及电子设备
CN111797746A (zh) 人脸识别方法、装置及计算机可读存储介质
CN106331225A (zh) 触控响应方法及移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant