Nothing Special   »   [go: up one dir, main page]

CN109068272B - 相似用户识别方法、装置、设备及可读存储介质 - Google Patents

相似用户识别方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN109068272B
CN109068272B CN201811005730.5A CN201811005730A CN109068272B CN 109068272 B CN109068272 B CN 109068272B CN 201811005730 A CN201811005730 A CN 201811005730A CN 109068272 B CN109068272 B CN 109068272B
Authority
CN
China
Prior art keywords
wireless access
access point
fingerprint
point fingerprint
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811005730.5A
Other languages
English (en)
Other versions
CN109068272A (zh
Inventor
秦博
段航
孙翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201811005730.5A priority Critical patent/CN109068272B/zh
Publication of CN109068272A publication Critical patent/CN109068272A/zh
Application granted granted Critical
Publication of CN109068272B publication Critical patent/CN109068272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/02Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
    • H04W84/10Small scale networks; Flat hierarchical networks
    • H04W84/12WLAN [Wireless Local Area Networks]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种相似用户识别方法、装置、设备及可读存储介质,将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;计算所述无线接入点指纹特征向量之间的相似度;依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。解决了现有技术中因用户在不同消费场景下产生相同位置而不能实现更精准的相似用户识别的问题。

Description

相似用户识别方法、装置、设备及可读存储介质
技术领域
本发明实施例涉及电子技术领域,尤其涉及一种相似用户识别方法、装置、设备及可读存储介质。
背景技术
在社交应用和购物应用普及的同时,产生大量的用户数据,其中根据用户数据进行用户相似度分析是用户行为分析比较重要的一个方面。
现有技术中,主要通过获取提取用户通信行为发生的位置和时间,计算用户相对于基站的常用指数,并根据此提取用户常用基站的特征向量,进而计算不同用户之间的相似度指数。
然而,上述方法虽然具有应用的普遍性,但是由于基站覆盖范围较广,因此基站特征向量对于用户行为的表征并不精确,会造成同一商场下不同消费场景产生相同位置的问题。
发明内容
本发明提供一种相似用户识别方法,以解决在先技术中因用户在不同消费场景下产生相同位置而不能实现更精准的相似用户识别的问题。
根据本发明的第一方面,提供了一种相似用户识别方法,所述方法包括:
将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;
根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;
在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;
计算所述无线接入点指纹特征向量之间的相似度;
依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
根据本发明的第二方面,提供了一种相似用户识别装置,所述装置包括:
聚类模块,用于将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;
排序模块,用于根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;
特征向量确定模块,用于在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;
相似度计算模块,用于计算所述无线接入点指纹特征向量之间的相似度;
相似用户确定模块,用于依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
根据本发明的第三方面,提供了一种设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如前述的相似用户识别方法。
根据本发明的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述的相似用户识别方法。
本发明实施例提供的一种相似用户识别方法、装置、设备及可读存储介质,将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;计算所述无线接入点指纹特征向量之间的相似度;依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。解决了现有技术中对用户行为表征不够精确,导致用户在不同消费场景下产生相同位置的问题。具备更适合室内场景,且更细分了用户场景,提高用户相似度判定精度的有益效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种相似用户识别方法的步骤流程图;
图2是本发明实施例提供的一种相似用户识别方法的步骤流程图;
图3是本发明实施例提供的一种相似用户识别装置的结构图;
图4是本发明实施例提供的一种相似用户识别装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面首先介绍一下本发明实施例中涉及到的术语:
Wi-Fi指纹:GPS难以解决室内环境下的一些定位问题,大部分室内环境下都存在WiFi,因此利用WiFi进行定位无需额外部署硬件设备,是一个非常节省成本的方法。由于信号的严重衰减和多径效应,通用的室外定位设施(比如GPS)并不能在建筑物内有效地工作。定位准确性也是一个问题,GPS也许可以指出移动设备在哪一个建筑物,但是室内场景下,人们希望得到更精确的室内位置,这需要更精密的地图信息和更高的定位精度。基于无线信号的定位方法首先考虑的是使用WiFi(基于IEEE802.11标准的WLAN)作为基础定位设施。
但是WiFi信号并不是为定位而设计的,通常是单天线、带宽小,室内复杂的信号传播环境使得传统的基于到达时间/到达时间差(TOA/TDOA)的测距方法难以实现,基于到达信号角度的方法也同样难以实现,如果在WiFi网络中安装能定向的天线又需要额外的花费。因此,近年来大家详细研究的主要是位置指纹方法。
WiFi广泛使用在家庭、旅馆、咖啡馆、机场、商场等各类大型或小型建筑物内,这样使得WiFi成为定位领域中一个最引人注目的无线技术。通常,一个WiFi系统由一些固定的接入点(AP)组成,它们部署在在室内一些便于安装的位置,系统或网络管理员通常知道这些AP的位置。能连接WiFi的移动设备(比如笔记本电脑、移动电话)相互之间可以直接或间接地(通过AP)通信,因此可以考虑在通信功能外同时实现定位功能。
其中,“位置指纹”把实际环境中的位置和某种“指纹”联系起来,一个位置对应一个独特的指纹。在这里可以是一个Wi-Fi热点对应一个独特的指纹,并映射一个特定的位置,这个指纹可以是单维或多维的,比如待定位设备在接收或者发送信息,那么指纹可以是这个信息或信号的一个特征或多个特征(最常见的是信号强度)。如果待定位设备是在发送信号,由一些固定的接收设备感知待定位设备的信号或信息然后给它定位,这种方式常常叫做远程定位或者网络定位。如果是待定位设备接收一些固定的发送设备的信号或信息,然后根据这些检测到的特征来估计自身的位置,这种方式可称为自身定位。待定位移动设备也许会把它检测到的特征传达给网络中的服务器节点,服务器可以利用它所能获得的所有信息来估计移动设备的位置,这种方式可称为混合定位。在所有的这些方式中,都需要把感知到的信号特征拿去匹配一个数据库中的信号特征,这个过程可以看作一个模式识别的问题。
位置指纹可以是多种类型的,任何“位置独特”的(对区分位置有帮助的)特征都能被用来作为一个位置指纹。比如某个位置上通信信号的多径结构、某个位置上是否能检测到接入点或基站、某个位置上检测到的来自基站信号的RSS(接收信号强度)、某个位置上通信时信号的往返时间或延迟,这些都能作为一个位置指纹,或者也可以将其组合起来作为位置指纹。下面我们介绍两种最常用的信号特征:多径结构、RSS。
实施例一
参照图1,其示出了一种相似用户识别方法的步骤流程图,其具体步骤如下:
步骤101,将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇。
本发明实施例中,在用户携带移动终端在一应用场景中进行商业行为时,由于移动终端会定期的获取用户的定位数据,其中,GPS解决方案以及它所生成的经纬度标签是目前地理位置数据的公认标准,也是大部分智能手机获得用户地理位置的基本方式。只要用户打开GPS定位功能,手机即可获得相关数据,当移动设备的GPS芯片不能接收到GPS信号时,移动设备就需要与它所连接的手机信号塔通讯和估算它与信号塔之间的距离以不断报告它的地理位置,然而通过这种方法获得的地理位置数据不如纯粹的GPS数据精确。本申请中实施例中以Wi-Fi连接为例,利用的Wi-Fi连接获取用户定位数据的方法,是一种能够精确获得地理位置数据的方法,但是需要用到有效的Wi-Fi热点,Wi-Fi的地址与GPS坐标是一一对应的,它可以准确地标示出用户所处的位置,并且在很多用户消费场所,很多零售商提供免费的Wi-Fi热点,通过随机提取针对用户当前位置的各Wi-Fi热点中的Wi-Fi指纹数据,并进行聚类,生成各Wi-Fi指纹类别。
其中,在本申请中利用各Wi-Fi指纹数据之间的余弦相似度进行聚类,然而在实际应用中,聚类方法不限,本发明实施例对此不加以限制。
步骤102,根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序。
本发明实施例中,在得到Wi-Fi指纹数据的聚类结果后,根据每个类别中的Wi-Fi指纹数据的数目进行从高到低的排序。
步骤103,在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量。
本发明实施例中,在步骤102得到的排序结果中,筛选其中前M个类别,并且每个类别中的Wi-Fi指纹数据超过第一预设数据PrintVal的类别,作为用户的Wi-Fi指纹类特征。
步骤104,计算所述无线接入点指纹特征向量之间的相似度。
本发明实施例中,根据如下公式计算任意两个指纹类特征之间的相似度:
Figure BDA0001783953210000061
其中,S为用户a与b的Wi-Fi指纹特征之间的相似度,Wa与Wb为用户a与b的Wi-Fi指纹类,Wa·Wb为指纹的余弦相似度,xa与yb分别为指纹Wa,Wb的指纹数量。
步骤105,依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
本发明实施例中,根据上述步骤计算两个指纹类特征之间的相似度,可以得知对应用户之间的相似度,如果该相似度S大于预设值,那么就认为两个用户具备相似的行为特征。
可以理解地,本发明实施例中的无线接入点是以WiFi为例来进行说明的,在实际应用中,也有可能通过蓝牙、手机热点等方式进行无线接入,对比本发明实施例不加以限制。
综上所述,本发明实施例提供的一种相似用户识别方法,将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;计算所述无线接入点指纹特征向量之间的相似度;依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。解决了现有技术中对用户行为表征不够精确,导致用户在不同消费场景下产生相同位置的问题。具备更适合室内场景,且更细分了用户场景,提高用户相似度判定精度的有益效果。
实施例二
参照图2,其示出了一种相似用户识别方法的步骤流程图,其具体步骤如下:
步骤201,获取用户的网络定位数据。
本发明实施例中,当用户在室内场景中进行活动时,通过Wi-Fi热点获取用户的网络定位数据,并提取其中的Wi-Fi指纹数据,并且去除无效的Wi-Fi,例如移动Wi-Fi,大型Wi-Fi,信号强度弱的Wi-Fi等。
步骤202,从所述网络定位数据中提取对应的无线接入点指纹数据以及上报时间。
本发明实施例中,在网络定位数据中提取对应的Wi-Fi指纹数据时,同时提取该网络定位数据的上报时间。
具体的,每一个无线AP(路由器)都有一个全球唯一的MAC地址,并且一般来说无线AP在一段时间内不会移动,当设备在开启Wi-Fi的情况下,即可扫描并收集周围的AP信号,无论是否加密,或者是否已连接,甚至信号强度不足以显示在无线信号列表中,都可以获取到AP广播出来的MAC地址,设备将这些能够标示AP的数据发送到位置服务器,服务器检索出每一个AP的地理位置,并结合每个信号的强弱程度,计算出设备的地理位置并返回到用户设备,位置服务商要不断更新、补充自己的数据库,以保证数据的准确性,当提取当前用户设备的位置数据时,同时获取当前的网络时间。
步骤203,根据所述上报时间计算各所述无线接入点指纹数据的时间间隔。
本发明实施例中,通过提取的每个Wi-Fi指纹数据以及对应的上报时间,计算其中的时间间隔,如果时间间隔小于预设时间间隔的,就不保留,例如,两个定位时间间隔小于一秒,则后一个获取的定位数据不进行保留,因为在实际应用中,一秒钟的时间不足以用户的定位数据进行较大程度的变更。
当然,在实际应用中,预设时间由相关技术人员根据实际需求进行设定,本发明实施例对此不加以限制。
步骤204,提取所述时间间隔大于预设时间间隔且信号强度大于预设强度的无线接入点指纹数据,生成预设无线接入点指纹数据库。
本发明实施例中,针对当前用户的位置获取的多个不同Wi-Fi热点的Wi-Fi指纹数据,将其中时间间隔大于预设时间间隔,并且信号强度足够的Wi-Fi指纹数据存储,生成一个预设Wi-Fi指纹数据库。
步骤205,在所述预设无线接入点指纹数据库中随机选取第二预设数目个无线接入点指纹数据。
步骤206,根据所述第二预设数目个无线接入点指纹数据之间的第一余弦相似度与预设阈值的关系,生成初始无线接入点指纹簇。
本发明实施例中,在生成的Wi-Fi预设指纹数据库中随机选取N个指纹数据作为N个指纹聚类,每个类包含的指纹数目为1,分别计算N个指纹类之间的相似度,若该相似度超过预设阈值,则确认两个类之间相似,将它们合并为一个类,直到所有N个类之间都比对完毕,最后得到Nf个初始指纹聚类,由于类别的合并,Nf小于等于N。
优选的,步骤206,具体包括:子步骤A1-A4;
子步骤A1,将所述第二预设数目个无线接入点指纹数据设置为第二预设数目个初始无线接入点指纹簇,每个初始无线接入点指纹簇包含一个所述无线接入点指纹数据;
子步骤A2,计算所述初始无线接入点指纹簇之间的第一余弦相似度;
子步骤A3,将余弦相似度大于预设阈值的所述初始无线接入点指纹簇合并为一个初始无线接入点指纹簇;
子步骤A4,将余弦相似度小于所述预设阈值的所述初始无线接入点指纹簇保持不变。
具体的,在Wi-Fi预设指纹数据库中随机选取N个Wi-Fi指纹数据作为N个指纹聚类,即每个类包含的Wi-Fi指纹数目为1,然后分别计算这N个指纹类之间的余弦相似度,例如,若指纹聚类簇clusterA与指纹聚类簇clusterB的指纹的余弦相似度SKnn超过预设阀值VWeight,则把指纹聚类簇clusterA与指纹聚类簇clusterB合并为一个指纹聚类,并选取指纹聚类簇clusterA中的Wi-Fi指纹数据作为指纹类的特征,并把clusterA的指纹数目增加1,在将指纹聚类簇clusterC与合并后指纹聚类簇clusterA计算余弦相似度,若若指纹聚类簇clusterA与指纹聚类簇clusterC的指纹的余弦相似度SKnn超过预设阀值VWeight,则将指纹聚类簇clusterC与指纹聚类簇clusterA合并,仍然将指纹聚类簇clusterA中的Wi-Fi指纹数据作为指纹类的特征,保持两个指纹聚类不变,与其他的指纹聚类计算余弦相似度后,并把clusterA的指纹数目增加1,此时,clusterA的指纹数目为3,若指纹聚类簇clusterA与指纹聚类簇clusterB的指纹的余弦相似度SKnn未超过预设阀值VWeight,则保持两个聚类不变,然后再与其他再与预设阈值VWeight进行对比,并重复执行上述描述的合并步骤。
以此类推,将N个指纹聚类簇互相之间计算余弦相似度,将余弦相似度超过预设阈值的聚类进行合并,未超过预设阈值的保持不变,最后得到Nf个初始指纹聚类,其中Nf小于或者等于N。
步骤207,分别计算所述预设无线接入点指纹数据库中剩余的所述无线接入点指纹数据与所述各初始无线接入点指纹簇中原始无线接入点指纹数据之间的第二余弦相似度。
步骤208,根据所述第二余弦相似度与所述预设阈值的关系,将所述无线接入点指纹数据聚类成多个无线接入点指纹簇。
本发明实施例中,在得到Nf个初始Wi-Fi指纹聚类后,将在预设Wi-Fi指纹数据库中剩余的其他Wi-Fi指纹数据,逐一与Nf个初始指纹聚类计算余弦相似度,即第二余弦相似度,然后与预设阈值进行比较,根据比较结果将各Wi-Fi指纹数据进行聚类,直到所有Wi-Fi指纹数据都聚类完成。
优选的,步骤208,具体包括:子步骤B1-B2;
子步骤B1,若所述第二余弦相似度大于所述预设阈值,则将所述无线接入点指纹数据添加到对应的所述初始无线接入点指纹簇中,生成一个无线接入点指纹簇;
子步骤B2,若所述余弦相似度小于预设阈值,则将所述无线接入点指纹数据设置为新的无线接入点指纹簇。
具体的,例如,计算其他Wi-Fi指纹printA分别与此Nf个Wi-Fi指纹类的余弦相似度SKnn,选取相似度最大的Wi-Fi指纹类ClusterA。若两Wi-Fi指纹的余弦相似度超过阀值VWeight,则ClusterA包含的指纹数目增加1;若小于阀值VWeight,则新增一个以printA为指纹特征的指纹类ClusterB,ClusterB包含的指纹数目为1。重复上述聚类步骤,直到所有在预设Wi-Fi指纹数据库中的Wi-Fi指纹数据都分配到各自所属的指纹类。
步骤209,根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序。
此步骤与步骤102相同,在此不再详述。
步骤210,在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量。
本发明实施例中,当所有的Wi-Fi指纹都聚类完成以后,根据每个Wi-Fi指纹类别中包含的指纹数目,从高向低排序,提取前MCluster个,且数目NPrint超过PrintVal的类Wi-FiCluster,作为用户的Wi-Fi指纹类特征。
步骤211,计算所述无线接入点指纹特征向量之间的相似度。
此步骤与步骤104相同,在此不再详述。
步骤212,依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
此步骤与步骤105相同,在此不再详述。
综上所述,本发明实施例提供的一种相似用户识别方法,获取用户的网络定位数据;从所述网络定位数据中提取对应的无线接入点指纹数据以及上报时间;根据所述上报时间计算各所述无线接入点指纹数据的时间间隔;提取所述时间间隔大于预设时间间隔且信号强度大于预设强度的无线接入点指纹数据,生成预设无线接入点指纹数据库。将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;计算所述无线接入点指纹特征向量之间的相似度;依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。解决了现有技术中对用户行为表征不够精确,导致用户在不同消费场景下产生相同位置的问题。具备更适合室内场景,且更细分了用户场景,提高用户相似度判定精度的有益效果。
实施例三
参照图3,其示出了一种相似用户识别装置的结构框图,其具体如下:
聚类模块301,用于将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;
排序模块302,用于根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;
特征向量确定模块303,用于在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;
相似度计算模块304,用于计算所述无线接入点指纹特征向量之间的相似度;
相似用户确定模块305,用于依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
参照图4,其示出了基于图3实施例的另一种相似用户识别装置的结构框图,其具体如下:
定位数据获取模块306,用于获取用户的网络定位数据;
无线接入点指纹数据和上报时间提取模块307,用于从所述网络定位数据中提取对应的无线接入点指纹数据以及上报时间;
时间间隔计算模块308,用于根据所述上报时间计算各所述无线接入点指纹数据的时间间隔;
预设无线接入点指纹数据库生成模块309,用于提取所述时间间隔大于预设时间间隔且信号强度大于预设强度的无线接入点指纹数据,生成预设无线接入点指纹数据库。
聚类模块301,用于将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;
优选的,所述聚类模块301,包括:
无线接入点指纹数据选取子模块3011,用于在所述预设无线接入点指纹数据库中随机选取第二预设数目个无线接入点指纹数据;
初始无线接入点指纹簇生成子模块3012,用于根据所述第二预设数目个无线接入点指纹数据之间的第一余弦相似度与预设阈值的关系,生成初始无线接入点指纹簇;
优选的,所述初始无线接入点指纹簇生成子模块3012,包括:
初始无线接入点指纹簇设置单元,用于将所述第二预设数目个无线接入点指纹数据设置为第二预设数目个初始无线接入点指纹簇,每个初始无线接入点指纹簇包含一个所述无线接入点指纹数据;
第一余弦相似度计算单元,用于计算所述初始无线接入点指纹簇之间的第一余弦相似度;
合并单元,用于将余弦相似度大于预设阈值的所述初始无线接入点指纹簇合并为一个初始无线接入点指纹簇;
初始无线接入点指纹簇保留单元,用于将余弦相似度小于所述预设阈值的所述初始无线接入点指纹簇保持不变。
第二余弦相似度计算子模块3013,用于分别计算所述预设无线接入点指纹数据库中剩余的所述无线接入点指纹数据与所述各初始无线接入点指纹簇中原始无线接入点指纹数据之间的第二余弦相似度;
聚类子模块3014,用于根据所述第二余弦相似度与所述预设阈值的关系,将所述无线接入点指纹数据聚类成多个无线接入点指纹簇。
优选的,所述聚类子模块3014,包括:
无线接入点指纹类别生成单元,用于若所述第二余弦相似度大于所述预设阈值,则将所述无线接入点指纹数据添加到对应的所述初始无线接入点指纹簇中,生成一个无线接入点指纹簇;
无线接入点指纹类别设置单元,用于若所述余弦相似度小于预设阈值,则将所述无线接入点指纹数据设置为新的无线接入点指纹簇。
排序模块302,用于根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;
特征向量确定模块303,用于在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;
相似度计算模块304,用于计算所述无线接入点指纹特征向量之间的相似度;
相似用户确定模块305,用于依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
本发明实施例还提供一种设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上述的一个或多个所述的相似用户识别方法。
本发明实施例还提供一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如所述的相似用户识别方法。
综上所述,本发明实施例提供的一种相似用户识别装置,通过定位数据获取模块,用于获取用户的网络定位数据;之后,通过无线接入点指纹数据和上报时间提取模块,用于从所述网络定位数据中提取对应的无线接入点指纹数据以及上报时间;再利用时间间隔计算模块,用于根据所述上报时间计算各所述无线接入点指纹数据的时间间隔;之后利用预设无线接入点指纹数据库生成模块,用于提取所述时间间隔大于预设时间间隔且信号强度大于预设强度的无线接入点指纹数据,生成预设无线接入点指纹数据库。聚类模块,用于将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;通过排序模块,用于根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;以及通过特征向量确定模块,用于在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;还有通过相似度计算模块,用于计算所述无线接入点指纹特征向量之间的相似度;最后通过相似用户确定模块,用于依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。解决了现有技术中对用户行为表征不够精确,导致用户在不同消费场景下产生相同位置的问题。具备更适合室内场景,且更细分了用户场景,提高用户相似度判定精度的有益效果。
其具有如下优点:
其一:不使用用户位置,而使用Wi-Fi指纹进行聚类,作为用户特征点,更适合室内场景。
其二,根据不同用户Wi-Fi指纹特征向量的相似度计算用户相似度,更细分了用户场景,用户判定精度较高。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的支付信息处理设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序商品数据)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (12)

1.一种相似用户识别方法,其特征在于,所述方法包括:
将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;
根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;
在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;
计算所述无线接入点指纹特征向量之间的相似度;
依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
2.根据权利要求1所述的方法,其特征在于,在所述将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇的步骤之前,还包括:
获取用户的网络定位数据;
从所述网络定位数据中提取对应的无线接入点指纹数据以及上报时间;
根据所述上报时间计算各无线接入点指纹数据的时间间隔;
提取所述时间间隔大于预设时间间隔且信号强度大于预设强度的无线接入点指纹数据,生成预设无线接入点指纹数据库。
3.根据权利要求1所述的方法,其特征在于,所述将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇的步骤,包括:
在所述预设无线接入点指纹数据库中随机选取第二预设数目个无线接入点指纹数据;
根据所述第二预设数目个无线接入点指纹数据之间的第一余弦相似度与预设阈值的关系,生成初始无线接入点指纹簇;
分别计算所述预设无线接入点指纹数据库中剩余的所述无线接入点指纹数据与原始无线接入点指纹数据之间的第二余弦相似度,所述原始无线接入点指纹数据是所述初始无线接入点指纹簇中的指纹数据;
根据所述第二余弦相似度与所述预设阈值的关系,将所述无线接入点指纹数据聚类成多个无线接入点指纹簇。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第二预设数目个无线接入点指纹数据之间的第一余弦相似度与预设阈值的关系,生成初始无线接入点指纹簇的步骤,包括:
将所述第二预设数目个无线接入点指纹数据设置为第二预设数目个初始无线接入点指纹簇,每个初始无线接入点指纹簇包含一个所述无线接入点指纹数据;
计算所述初始无线接入点指纹簇之间的第一余弦相似度;
将余弦相似度大于预设阈值的所述初始无线接入点指纹簇合并为一个初始无线接入点指纹簇;
将余弦相似度小于所述预设阈值的所述初始无线接入点指纹簇保持不变。
5.根据权利要求3所述的方法,其特征在于,所述根据所述第二余弦相似度与所述预设阈值的关系,将所述无线接入点指纹数据聚类成多个无线接入点指纹簇的步骤,包括:
若所述第二余弦相似度大于所述预设阈值,则将所述无线接入点指纹数据添加到对应的所述初始无线接入点指纹簇中,生成一个无线接入点指纹簇;
若所述余弦相似度小于预设阈值,则将所述无线接入点指纹数据设置为新的无线接入点指纹簇。
6.一种相似用户识别装置,其特征在于,所述装置包括:
聚类模块,用于将预设无线接入点指纹数据库中的各所述无线接入点指纹数据聚类成多个无线接入点指纹簇;
排序模块,用于根据各所述无线接入点指纹簇中的无线接入点指纹数据的数目,将所述指纹簇进行排序;
特征向量确定模块,用于在排序结果中提取前预设簇数,且所述指纹簇中所述无线接入点指纹数据的数目大于第一预设数目的无线接入点指纹簇,作为用户的无线接入点指纹特征向量;
相似度计算模块,用于计算所述无线接入点指纹特征向量之间的相似度;
相似用户确定模块,用于依据所述无线接入点指纹特征向量之间的相似度确定对应用户之间的相似度。
7.根据权利要求6所述的装置,其特征在于,还包括:
定位数据获取模块,用于获取用户的网络定位数据;
无线接入点指纹数据和上报时间提取模块,用于从所述网络定位数据中提取对应的无线接入点指纹数据以及上报时间;
时间间隔计算模块,用于根据所述上报时间计算各所述无线接入点指纹数据的时间间隔;
预设无线接入点指纹数据库生成模块,用于提取所述时间间隔大于预设时间间隔且信号强度大于预设强度的无线接入点指纹数据,生成预设无线接入点指纹数据库。
8.根据权利要求6所述的装置,其特征在于,所述聚类模块,包括:
无线接入点指纹数据选取子模块,用于在所述预设无线接入点指纹数据库中随机选取第二预设数目个无线接入点指纹数据;
初始无线接入点指纹簇生成子模块,用于根据所述第二预设数目个无线接入点指纹数据之间的第一余弦相似度与预设阈值的关系,生成初始无线接入点指纹簇;
第二余弦相似度计算子模块,用于分别计算所述预设无线接入点指纹数据库中剩余的所述无线接入点指纹数据与原始无线接入点指纹数据之间的第二余弦相似度,所述原始无线接入点指纹数据是所述初始无线接入点指纹簇中的指纹数据;
聚类子模块,用于根据所述第二余弦相似度与所述预设阈值的关系,将所述无线接入点指纹数据聚类成多个无线接入点指纹簇。
9.根据权利要求8所述的装置,其特征在于,所述初始无线接入点指纹类别生成子模块,包括:
初始无线接入点指纹簇设置单元,用于将所述第二预设数目个无线接入点指纹数据设置为第二预设数目个初始无线接入点指纹簇,每个初始无线接入点指纹簇包含一个所述无线接入点指纹数据;
第一余弦相似度计算单元,用于计算所述初始无线接入点指纹簇之间的第一余弦相似度;
合并单元,用于将余弦相似度大于预设阈值的所述初始无线接入点指纹簇合并为一个初始无线接入点指纹簇;
初始无线接入点指纹簇保留单元,用于将余弦相似度小于所述预设阈值的所述初始无线接入点指纹簇保持不变。
10.根据权利要求8所述的装置,所述聚类子模块,包括:
无线接入点指纹类别生成单元,用于若所述第二余弦相似度大于所述预设阈值,则将所述无线接入点指纹数据添加到对应的所述初始无线接入点指纹簇中,生成一个无线接入点指纹簇;
无线接入点指纹类别设置单元,用于若所述余弦相似度小于预设阈值,则将所述无线接入点指纹数据设置为新的无线接入点指纹簇。
11.一种设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中一个或多个所述的相似用户识别方法。
12.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-5中一个或多个所述的相似用户识别方法。
CN201811005730.5A 2018-08-30 2018-08-30 相似用户识别方法、装置、设备及可读存储介质 Active CN109068272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811005730.5A CN109068272B (zh) 2018-08-30 2018-08-30 相似用户识别方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811005730.5A CN109068272B (zh) 2018-08-30 2018-08-30 相似用户识别方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN109068272A CN109068272A (zh) 2018-12-21
CN109068272B true CN109068272B (zh) 2021-01-08

Family

ID=64758782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811005730.5A Active CN109068272B (zh) 2018-08-30 2018-08-30 相似用户识别方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN109068272B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245132B (zh) * 2019-06-12 2023-10-31 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机可读存储介质和计算机设备
CN112508466A (zh) * 2019-08-26 2021-03-16 北京三快在线科技有限公司 位置识别的方法、装置、计算机可读存储介质及电子设备
CN110730432B (zh) * 2019-10-21 2021-01-08 深圳市名通科技股份有限公司 邻近用户识别方法、终端及可读存储介质
CN112738724B (zh) * 2020-12-17 2022-09-23 福建新大陆软件工程有限公司 一种区域目标人群的精准识别方法、装置、设备和介质
CN113840392B (zh) * 2021-09-17 2023-09-22 杭州云深科技有限公司 用户亲密度的确定方法、装置、计算机设备及存储介质
CN115766204B (zh) * 2022-11-14 2024-04-26 电子科技大学 一种针对加密流量的动态ip设备标识系统及方法
CN117237804B (zh) * 2023-09-15 2024-02-13 江苏三棱智慧物联发展股份有限公司 基于联邦学习的烟火识别系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102638888A (zh) * 2012-03-19 2012-08-15 华中科技大学 基于信号统计的室内定位指纹分组方法
CN103476115A (zh) * 2013-09-22 2013-12-25 中国地质大学(武汉) 一种基于AP集相似度的Wi-Fi指纹定位方法
CN104684083A (zh) * 2015-03-26 2015-06-03 哈尔滨工业大学 一种基于分簇思想的ap选择方法
CN106060779A (zh) * 2016-07-18 2016-10-26 北京方位捷讯科技有限公司 指纹特征匹配方法及装置
CN206272854U (zh) * 2016-11-14 2017-06-20 成都信息工程大学 一种基于WiFi网络连接记录的社交关系构建装置
CN107835498A (zh) * 2017-10-18 2018-03-23 上海掌门科技有限公司 一种用于管理用户的方法与设备
CN108234686A (zh) * 2017-12-20 2018-06-29 中国联合网络通信集团有限公司 一种室内外判定的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9846801B2 (en) * 2015-11-16 2017-12-19 MorphoTrak, LLC Minutiae grouping for distorted fingerprint matching

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102638888A (zh) * 2012-03-19 2012-08-15 华中科技大学 基于信号统计的室内定位指纹分组方法
CN103476115A (zh) * 2013-09-22 2013-12-25 中国地质大学(武汉) 一种基于AP集相似度的Wi-Fi指纹定位方法
CN104684083A (zh) * 2015-03-26 2015-06-03 哈尔滨工业大学 一种基于分簇思想的ap选择方法
CN106060779A (zh) * 2016-07-18 2016-10-26 北京方位捷讯科技有限公司 指纹特征匹配方法及装置
CN206272854U (zh) * 2016-11-14 2017-06-20 成都信息工程大学 一种基于WiFi网络连接记录的社交关系构建装置
CN107835498A (zh) * 2017-10-18 2018-03-23 上海掌门科技有限公司 一种用于管理用户的方法与设备
CN108234686A (zh) * 2017-12-20 2018-06-29 中国联合网络通信集团有限公司 一种室内外判定的方法和装置

Also Published As

Publication number Publication date
CN109068272A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN109068272B (zh) 相似用户识别方法、装置、设备及可读存储介质
US9918297B2 (en) Location measuring method and apparatus using access point for wireless local area network service and method for estimating location coordinate of access point
EP2676501B1 (en) Methods, apparatuses and computer program products for providing a private and efficient geolocation system
Pei et al. Using inquiry-based Bluetooth RSSI probability distributions for indoor positioning
CN104010364B (zh) 用于确定基站的估计的地理位置的方法和系统
KR101627544B1 (ko) 와이파이 신호 맵 구축 장치 및 방법
US9077548B2 (en) Method and apparatus for providing differential location-based service using access point
US7389114B2 (en) Estimating the location of inexpensive wireless terminals by using signal strength measurements
US8862154B2 (en) Location measuring method and apparatus using access point for wireless local area network service
US20140211691A1 (en) System and method for choosing suitable access points in quips autarkic deployment
US9380472B2 (en) Method and apparatus for updating access point information for location measurement
CN108450060B (zh) 基于wi-fi接入点的定位方法、设备
CN109275090B (zh) 信息处理方法、装置、终端及存储介质
WO2014180219A1 (zh) 一种定位方法、装置、终端和计算机存储介质
CN104661300B (zh) 定位方法、装置、系统及移动终端
Gholoobi et al. RSS based localization using a new WKNN approach
US20140228058A1 (en) System for estimating position of base station and method of estimating position of base station by the same
CN103404177A (zh) 用于定位的节点和方法
CN107071708A (zh) 智能移动终端被动无线信号采集及定位方法
US20160174147A1 (en) Access point selection for mobile device positioning
CN111757284B (zh) 一种室内入口定位方法及电子设备
KR101202194B1 (ko) 휴대용단말기의 위치 결정 시스템 및 방법
CN113905438B (zh) 场景标识生成方法、定位方法、装置及电子设备
Abhishek et al. Performance analysis of received signal strength based Wi-Fi indoor positioning algorithms
CN110692260A (zh) 终端设备定位系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant