CN111177473B - 人员关系分析方法、装置和可读存储介质 - Google Patents
人员关系分析方法、装置和可读存储介质 Download PDFInfo
- Publication number
- CN111177473B CN111177473B CN201811347828.9A CN201811347828A CN111177473B CN 111177473 B CN111177473 B CN 111177473B CN 201811347828 A CN201811347828 A CN 201811347828A CN 111177473 B CN111177473 B CN 111177473B
- Authority
- CN
- China
- Prior art keywords
- target person
- suspected target
- score
- determining
- personnel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 32
- 230000006399 behavior Effects 0.000 claims description 116
- 238000013145 classification model Methods 0.000 claims description 27
- 230000004308 accommodation Effects 0.000 description 16
- 238000012360 testing method Methods 0.000 description 14
- 238000012549 training Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 12
- 230000008569 process Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 230000003542 behavioural effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 208000011231 Crohn disease Diseases 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种人员关系分析方法、装置和可读存储介质,属于计算机技术领域。该方法包括:获取多个人员的行为数据;基于所述多个人员的行为数据,确定关系网络,所述关系网络包括点和边,所述点用于表示人员,所述边用于表示人员之间存在关联关系;基于所述多个人员的行为数据,获取每个点的初始分数,所述初始分数用于表示对应的人员属于目标人员的概率;基于所述关联关系,更新各个所述点的初始分数,得到各个所述点的最终分数;采用社区发现算法,将所述关系网络划分为多个社区;根据各个所述社区中的点的最终分数,确定疑似目标人员集合。该方法可以确定出无记录的人员所构成的目标人员集合。
Description
技术领域
本公开涉及计算机技术领域,特别涉及一种人员关系分析方法、装置和可读存储介质。
背景技术
随着大量社会记录电子化、数据化,采用这些数据来对社会治安进行提前防治已成为社会发展的趋势。
目前,主要利用有记录的目标人员或者重点疑似目标人员的社交关系网络来从他们的社交关系圈中挖掘潜在的目标人员。首先,获取有记录的目标人员或者重点疑似目标人员的社交关系,然后根据社交关系建立关系网络,接着采用社区发现算法对关系网络进行划分,得到多个社区,目标人员或者重点疑似目标人员所属的社区即为疑似目标人员集合,最后,在疑似目标人员集合中发现潜在的疑似目标人员。
可见,这种确定疑似目标人员的方式必须依赖于给定的目标人员或疑似目标人员,无法确定出仅由无记录的人员构成的目标人员集合。
发明内容
本公开提供了一种人员关系分析方法、装置和可读存储介质,能够确定出无记录的人员构成的目标人员集合。所述技术方案如下:
一方面,提供了一种人员关系分析方法,该方法包括:
获取多个人员的行为数据;
基于所述多个人员的行为数据,确定关系网络,所述关系网络包括点和边,所述点用于表示人员,所述边用于表示人员之间存在关联关系;
基于所述多个人员的行为数据,获取每个点的初始分数,所述初始分数用于表示对应的人员属于目标人员的概率;
基于所述关联关系,更新各个所述点的初始分数,得到各个所述点的最终分数;
采用社区发现算法,将所述关系网络划分为多个社区;
根据各个所述社区中的点的最终分数,确定疑似目标人员集合。
可选地,所述基于所述多个人员的行为数据,获取每个点的初始分数,包括:
基于所述多个人员的行为数据,确定各个所述人员对应的点的预测分数;
根据所述多个人员的记录数据,对各个点的所述预测分数进行更新,得到每个点的初始分数。
可选地,所述基于所述多个人员的行为数据,确定各个所述人员对应的点的预测分数,包括:
对所述多个人员的行为数据进行特征提取;
将提取到的特征输入行为分类模型,并将所述行为分类模型的输出作为各个所述人员对应的点的预测分数。
可选地,所述根据所述多个人员的记录数据,对各个点的所述预测分数进行更新,得到每个点的初始分数,包括:
当所述人员没有记录时,将所述预测分数作为对应的点的初始分数;
当所述人员有记录时,将所述预测分数与预设值之和作为对应的点的初始分数。
可选地,所述基于所述关联关系,更新各个所述点的初始分数,得到各个所述点的最终分数,包括:
采用页面排序PageRank算法,更新各个所述点的初始分数,得到各个所述点的最终分数。
可选地,所述根据各个所述社区所包含的点的最终分数,确定疑似目标人员集合,包括:
将各个所述社区按照各个社区所包含的点的最终分数之和的平均值进行从大到小的排序;
将排序在前的设定数量的社区确定为疑似目标人员集合。
可选地,所述方法还包括:
基于所述疑似目标人员集合中各个成员的属性信息,确定所述疑似目标人员集合的属性特征;
确定所述疑似目标人员集合的基本特征,所述基本特征包括成员数量、边数、密度中的至少一种;
基于所述属性特征和所述基本特征,确定所述疑似目标人员集合是否为目标人员集合。
另一方面,提供了一种人员关系分析装置,所述装置包括:
行为数据获取模块,用于获取多个人员的行为数据;
关系网络确定模块,用于基于所述行为数据获取模块获取的所述多个人员的行为数据,确定关系网络,所述关系网络包括点和边,所述点用于表示人员,所述边用于表示人员之间存在关联关系;
初始分数获取模块,用于基于所述行为数据获取模块获取的所述多个人员的行为数据,获取每个点的初始分数,所述初始分数用于表示对应的人员属于目标人员的概率;
分数更新模块,用于基于所述关联关系,更新各个所述点的初始分数,得到各个所述点的最终分数;
社区划分模块,用于采用社区发现算法,将所述关系网络确定模块确定的所述关系网络划分为多个社区;
第一人员关系分析模块,用于根据所述社区划分模块划分出的各个所述社区中的点的最终分数,确定疑似目标人员集合。
可选地,所述初始分数获取模块,包括:
分数预测子模块,用于基于所述多个人员的行为数据,确定各个所述人员对应的点的预测分数;
初始分数确定子模块,用于根据所述多个人员的记录数据,对各个点的所述预测分数进行更新,得到每个点的初始分数。
可选地,所述分数预测子模块,用于对所述多个人员的行为数据进行特征提取;将提取到的特征输入行为分类模型,并将所述行为分类模型的输出作为各个所述人员对应的点的预测分数。
可选地,所述初始分数确定子模块,用于当所述人员没有记录时,将所述预测分数作为对应的点的初始分数;当所述人员有记录时,将所述预测分数与预设值之和作为对应的点的初始分数。
可选地,所述分数更新模块,用于采用页面排序PageRank算法,更新各个所述点的初始分数,得到各个所述点的最终分数。
可选地,所述第一人员关系分析模块,包括:
排序子模块,用于将各个所述社区按照各个社区所包含的点的最终分数之和的平均值进行从大到小的排序;
确定子模块,用于将排序在前的设定数量的社区确定为疑似目标人员集合。
可选地,所述装置还包括:
属性特征确定模块,用于基于所述疑似目标人员集合中各个成员的属性信息,确定所述疑似目标人员集合的属性特征;
基本特征确定模块,用于确定所述疑似目标人员集合的基本特征,所述基本特征包括成员数量、边数、密度中的至少一种;
第二人员关系分析模块,用于基于所述属性特征确定模块确定的所述属性特征和所述基本特征确定模块确定的所述基本特征,确定所述疑似目标人员集合是否为目标人员集合。
另一方面,提供了一种人员关系分析装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现前述人员关系分析方法。
另一方面,提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现前述人员关系分析方法。
本公开实施例提供的技术方案至少包括以下有益效果:
本公开基于人员的行为数据获取对应的人员属于目标人员的概率,并用关系网络中的点的初始分数来表示该概率,然后基于关系网络中的点之间的关联关系更新该初始分数,得到各个点的最终分数,并且根据关系网络中的各个社区所包含的点的最终分数来确定疑似目标人员集合。可见,该方法依赖于人员的行为数据从关系网络的各个社区中找出疑似目标人员集合,不依赖于给定的目标人员或者疑似目标人员,不仅可以确定出包含有记录的人员的疑似目标人员集合,也可以确定出无记录人员构成的疑似目标人员集合。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1示出了本公开实施例提供的人员关系分析方法的流程图;
图2示出了本公开实施例提供的人员关系分析方法的流程图;
图3示出了本公开实施例提供的人员关系分析装置的结构框图;
图4示出了本公开实施例提供的初始分数获取模块的结构框图;
图5示出了本公开实施例提供的人员关系分析模块的结构框图;
图6示出了本公开一个实施例提供的人员关系分析装置的结构框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
参见图1,其示出了本公开实施例提供的人员关系分析方法的流程图,该方法包括:
步骤101:获取多个人员的行为数据。
其中,人员的行为数据可以包括行为类型、行为属性信息、人员的属性信息等。
行为类型包括但不限于住宿、乘坐交通工具、通信、典当、转账等。
行为属性信息包括但不限于行为发生时间、行为持续时间、行为发生频率、行为发生地点等。行为发生时间是指相应的行为所发生的时间,例如,住宿的时间,所乘坐的交通工具的发车时间、通话时间等。行为持续时间为整个行为维持的时段,例如,对于住宿而言,行为持续时间是指入住到离店之间的时间;对于通话而言,行为持续时间是指电话接通到挂断之间的时间。行为发生频率可以是设定周期内行为发生的次数,例如一周内通话次数等。行为发生地点可以是行为发生的实际物理地点,例如住宿的酒店名称、住宿的酒店所在的街道名称、交通工具的班次等。
人员的属性信息包括但不限于人员的年龄、性别、身高等。
步骤102:基于人员的行为数据,确定关系网络。
关系网络包括点和边,点用于表示人员,边用于表示人员之间存在关联关系。
步骤103:基于多个人员的行为数据,获取每个点的初始分数,初始分数用于表示对应的人员属于目标人员的概率。
步骤104:基于关联关系,更新各个点的初始分数,得到各个点的最终分数;
步骤105:采用社区发现算法,将关系网络划分为多个社区;
步骤106:根据各个社区中的点的最终分数,确定疑似目标人员集合。
需要说明的是,步骤102和步骤103之间没有先后顺序,可以同时执行。
本公开基于人员的行为数据获取对应的人员属于目标人员的概率,并用关系网络中的点的初始分数来表示该概率,然后基于关系网络中的点之间的关联关系更新该初始分数,得到各个点的最终分数,并且根据关系网络中的各个社区所包含的点的最终分数来确定疑似目标人员集合。可见,该方法依赖于人员的行为数据从关系网络的各个社区中找出疑似目标人员集合,不依赖于给定的目标人员或者疑似目标人员,不仅可以确定出包含有记录的人员的疑似目标人员集合,也可以确定出无记录的人员构成的疑似目标人员集合。
参见图2,其示出了本公开另一个实施例提供的人员关系分析方法的流程图,该方法包括:
步骤201:获取多个人员的行为数据。
其中,人员的行为数据可以包括行为类型、行为属性信息。行为类型包括但不限于住宿、乘坐交通工具、通信、典当、转账等。行为属性信息包括但不限于行为发生时间、行为持续时间、行为发生频率、行为发生地点等。行为发生时间是指相应的行为所发生的时间,例如,住宿的时间,所乘坐的交通工具的发车时间、通话时间等。行为持续时间为整个行为维持的时段,例如,对于住宿而言,行为持续时间是指入住到离店之间的时间;对于通话而言,行为持续时间是指电话接通到挂断之间的时间。行为发生频率可以是设定周期内行为发生的次数,例如一周内通话次数等。行为发生地点可以是行为发生的实际物理地点,例如住宿的酒店名称、住宿的酒店所在的街道名称、交通工具的班次等。
可选地,人员的行为数据还可以包括人员的属性信息。人员的属性信息包括但不限于人员的年龄、性别、身高等。
人员的行为数据可以由第三方提供、通过网络获取或者自行采集,也可以是这三种方式中的至少两种的结合。第三方获取比如从公安机关获取、通过网络获取比如获取物联网信息。
行为数据的数据类型包括但不限于文本、图片、视频等,可以是其中任意一种,也可以是其中任意两种的组合。
步骤202:基于多个人员的行为数据,确定关系网络。
关系网络包括点和边,点用于表示人员,边用于表示人员之间存在关联关系。在同一行为下,具有该行为的人员相互之间会因具有相同的行为而产生关联关系,因此,可以建立一种人员作为点、关联关系作为连接两点的边的网络结构,即关系网络。其中,人员之间存在关联关系包括但不限于,不同的人员同一时段出现在相同的地点,不同的人员之间存在通信关系、交易关系等。例如,住宿关系网络中,人为点,同一天入住同一宾馆的行为可以作为边。通信关系网络中,人为点,通话、短信、邮件等通信行为可以作为边。
关系网络可以为单一行为类型对应的关系网络,例如前述住宿关系网络,也可以为多种行为类型对应的关系网络,例如住宿关系网络与通信关系网络的结合。在单一行为类型对应的关系网络中,一条边对应一种关联关系。在多种行为类型对应的关系网络中,一条边可能对应一种关联关系,也可能对应至少两种关联关系。
可选地,确定关系网络时,除了确定点和边以外,还可以确定对应的边的权重。
示例性地,当关系网络为多种行为类型对应的关系网络时,边的权重可以为该边对应的关联关系的权重之和。在这种情况下,当人员之间存在至少两种关联关系时,边的权重可以等于该边对应的关联关系的权重之和。例如,人员A和人员B之间既存在住宿关系,也存在交易关系,则人员A和人员B之间的边的权重等于通信关系的权重和交易关系的权重之和。示例性地,不同关联关系对应的权重可以为设定值。不同关联关系对应的权重可以相同也可以不同。
进一步地,所有行为类型对应的关联关系的权重之和可以等于1。例如,若存在三种行为类型,住宿、交易和通信,且三种行为类型对应的关联关系的权重分别为1/3,则当人员A和人员B之间存在交易和住宿这两种关联关系时,人员A和人员B之间的边的权重为2/3。
可替代地,在确定边的权重时也可以不区分边对应的关联关系的类型,即只要存在关联关系,无论是一种还是多种,均表示该边的权重为设定值,例如1。
可选地,在本公开实施例中,边可以全部是有向的,也可以全部是无向的。例如,对于通信关系,若对应的边是无向的,则在通信双方之间存在一条无向边;若对应的边是有向的,则可以存在一条由通信发起方指向通信接收方的边。又例如,对于交易关系,若对应的边是无向的,则在通信双方之间存在一条无向边;若对应的边是有向的,则可以存在一条由卖方指向买方(或者买方指向卖方)的边。又例如,对于不同的人员同一时段出现在相同的地点的关联关系,若对应的边是无向的,则在不同的人员同一时段出现在相同的地点的人员中任意两个人员之间存在无向边;若对应的边是有向的,则在不同的人员同一时段出现在相同的地点的人员中任意两个人员之间存在一条相互指向的边。
步骤203:基于多个人员的行为数据,确定关系网络中各个点的初始分数。
其中,初始分数可以表示对应的人员属于目标人员的概率。
在一种实现方式中,可以对各个人员的行为数据分别进行特征提取,然后将提取到的特征输入行为分类模型,并将行为分类模型的输出作为各个人员对应的点的预测分数,该预测分数即为各个人员对应的点的初始分数。
可选地,在另一种实现方式中,该步骤203可以包括:
第一步、基于多个人员的行为数据,确定各个人员对应的点的预测分数,该步骤的具体实现过程可以参见前一种实现方式,在此不再赘述;
第二步、根据多个人员的记录数据,对各个点的预测分数进行更新,得到每个点的初始分数。
其中,记录数据可以包括有记录的人员的信息。该记录用于指示人员是否属于目标人员。
示例性地,根据多个人员的记录数据,对各个点的预测分数进行更新,得到每个点的初始分数,包括:
当人员没有记录时,将预测分数作为对应的点的初始分数;
当人员有记录时,将预测分数与预设值之和作为对应的点的初始分数。
该预设值可以根据经验设置,例如可以为1。在根据记录数据对各个点的预测分数更新之后,有记录的人员的初始分数高于没有记录的人员的初始分数。这样,使得对人员个体的初始分数的判断更为准确,进而有利于提高最终分数的准确度。
示例性地,行为分类模型可以采用机器学习的分类算法实现,例如随机森林、逻辑斯特回归、支持向量机等。
在调用行为分类模型得到预测分数之前,需要先对行为分类模型进行训练。训练过程可以如下:
首先,获得训练集和测试集。训练集中包括多个训练样本,多个训练样本中既包含有记录的人员,又包含无记录的人员。测试集中包括多个测试样本,同样地,多个测试样本中既包含有记录的人员,又包含无记录的人员。训练样本和数据样本可以采用以下方式获取:通过对海量人员(包括有记录的人员和无记录的人员)的行为数据进行特征提取,得到样本全集,从样本全集中选择部分样本作为训练样本,从样本全集中选择部分样本作为测试样本。这里的海量可以为百万级,或者千万级。
然后,采用训练集中的训练样本对行为分类模型进行训练。
最后,采用测试集中的测试样本对行为分类模型进行测试,若测试结果合格,则完成训练;若测试结果不合格,则继续进行训练,直至测试结果合格。
实现时,可以同时训练得到多个不同类型的行为分类模型(例如基于不同的分类算法的分类模型),根据各个行为分类模型的测试结果,选择测试结果最准确的行为分类模型作为实际使用的行为分类模型。
需要说明的是,本公开对步骤202和步骤203的执行顺序不做限制,可以先后执行,也可以同时执行。
步骤204:基于关联关系,更新各个点的初始分数,得到各个点的最终分数。
该步骤204可以基于页面排序(PageRank)算法实现,PageRank算法可以根据网络结构来对带有初始分数的点进行打分,采用PageRank算法打分后的点的最终分数可以显示出该点在网络结构中的重要程度。
可选地,本公开实施例中,每个点的PageRank值可以基于以下公式(1)计算:
r(i)=[∑j∈B(i)r(j)/N(j)]*q+(1-q)/N (1)
公式(1)中,i表示关系网络中的任意一点,r(i)表示点i的PageRank值,j表示与点i存在关联关系的点,B(i)为关系网络中与点i存在关联关系的点j的集合,r(j)表示点j的PageRank值。
进一步地,当关系网络中边均为无向边时,j为关系网络中的点且j与i之间存在边,N(j)表示点j所连接的边的数量;当关系网络中边均为有向边时,j为关系网络中的点且关系网络中存在由j指向i的边,N(j)表示点j的出边的数量,点j的出边为由点j指向点j以外的其他点的边。
q为设定的系数,q表示关系网络中,与i存在关联关系的点再次与i发生关联关系的概率,1-q表示关系网络中未与任何其他点发生关联关系的点与其他的点发生关联关系的概率,例如可以为0.85,在本公开实施例中,未与任何其他点发生关联关系的点与其他任意一点发生关联关系的概率相等;N为关系网络中点的数量。
需要说明的是,各个点的初始PageRank值即为各个点的初始分数。各个点的PageRank值构成的列向量即为下文中的R。
相应地,该步骤204可以包括以下步骤:
第一步、基于关联关系,确定关系网络的邻接矩阵P1,该邻接矩阵P1表示该关系网络中点之间的关系。
该邻接矩阵P1为N*N矩阵,其中,N为关系网络中的节点数量,Pij表示该邻接矩阵P1中第i行第j列的元素,第i行第j列的元素的取值可以为关系网络中第i点到第j点的边对应的值。示例性地,如果存在第i点到第j点的边,则Pij=x,否则,Pij=0。其中,x可以为第i点到第j点的边的权重,x的值可以由关系网络的类型确定。例如,若关系网络为单一行为类型对应的关系网络,则x可以等于1。又例如,若关系网络为至少两种行为类型对应的关系网络,x可以等于对应的边的权重。至少两种行为类型对应的关系网络中边的权重的确定方式可以参见步骤202,在此不再赘述。或者,x也可以与关系网络的网络类型无关,也与关系网络中的边是否有权重无关,只要存在第i点到第j点的边,x就等于1。
需要说明的是,对于无向的边,可以认为是有向的边的特例,即Pij=Pji。
第二步、将邻接矩阵的每一行除以该行非零元素的数量,得到概率矩阵P2。概率矩阵P2记录的是第i点到第j点发生关联关系的概率。
第三步、按照公式(2)计算矩阵A。
A=q*P3+(1-q)eet/N (2)
公式(2)中,q为公式(1)中的设定的系数,P3为概率矩阵P2的转置矩阵,et为N维全1行列式,则eet为所有元素均为1的N*N矩阵,N为关系网络中点的数量。
第四步、按照公式(3)进行迭代计算:
Rn+1=A*Rn (3)
公式(3)中,Rn为第n次迭代时,各个点的分数组成的列向量,R0为各个点的初始分数构成的列向量,A为第三步的计算结果。
若|Rn+1-Rn|<θ,迭代结束,Rn+1即为各个点的最终分数构成的列向量,θ为设定值,可以小于0。
本公开通过采用PageRank算法来更新各个点的初始分数,从而使得各个点的最终分数能够更好地反应相应人员的行为特征。
步骤205:采用社区发现算法,将关系网络划分为多个社区。
其中,社区发现算法是指,在关系网络中用于发现关系更为紧密的子网络(又称为子图)的算法。本公开实施例可以采用的社区发现算法包括但不限于Louvain算法、GN(Girvan-Newman)算法和FN(Fast Newman)算法等。
这里的三种算法均为基于模块度的社区发现算法。模块度是描述社区内紧密程度的值,模块度越大表示社区划分的质量越好。模块度可以定义为,所有社区内部的边数占网络总边数的比值减去随机网络中同样的社区分配所形成的所有社区内部的边数占网络总边数的比值的大小。
进一步地,模块度可以采用以下公式(4)计算。
公式(4)中,m为关系网络中边的总数量或者所有边的权重之和,ki表示所有指向点i的边的权重之和,kj表示所有指向点j的边的权重之和,Aij表示点i和点j之间的边的权重,ci表示点i所属的社区标识,cj表示点j所属的社区标识,σ(ci,cj)为克罗内科函数,若点i和点j属于同一个社区,则σ(ci,cj)=1,否则,σ(ci,cj)=0。
采用Louvain算法对关系网络进行划分的过程可以如下:
第一步、将关系网络中的每个点作为一个社区,对于每个点,遍历该点的所有邻居节点,衡量把该点加入其邻居节点所在的社区所带来的模块度的收益,即模块度增量deltaQ,并选择收益最大且大于0的邻居节点所在的社区加入,重复该过程,直到每个点的社区归属不再发生变化。
实现时,可以认为每个点加入其邻居节点所在的社区所带来的模块度的收益不大于0时,每个点的社区归属不再发生变化。
其中,模块度增量delta Q(即模块度的收益)即把一个点放入一个社区C前后模块度的变化值,可以等于该点加入到社区C之后的模块度减去该点作为独立社区和社区C的模块度。
第二步、将第一步中形成的每个社区作为一个新的点,社区内的边的权重转化为新的点的环权重(即将社区内点之间的边的权重之和作为自己到自己的边的权重),社区间的边的权重转化为新的点间的边权重(即将两个社区间的边的权重之和作为新的点之间的边的权重),重复第一步。
重复第二步和第一步,直到模块度不再发生变化。
GN算法是由Grivan和Newman所提出的一种图论经典算法。基本思想就是:同一社区内成员的联系多,不同社区的成员之间联系少。采用GN算法对关系网络进行划分的过程可以如下:
第一步、计算当前关系网络中每条边的边介数和当前关系网络的Q值(即前述模块度),并存储Q值和当前关系网络中社区划分情况,其中,边介数为关系网络中通过此边的两点之间最短路径的数量;
第二步、除去边介数最高的边;
第三步、计算当前关系网络的Q值,如果现在的Q值比原来的Q值大,则将现在的Q值和网络中社区划分情况存储更新,否则,进行下一次网络划分;
第四步、所有边分割完毕,返回当前的Q值和社区划分情况。
FN算法是GN算法的升级版本。采用FN算法对关系网络进行划分的过程可以如下:
第一步、将关系网络中的每个点都初始化为社区;
第二步、分别计算各个社区对合并后的模块度增量,社区对为之间存在相连的边的两个社区;例如,存在四个社区A、B、C、D,A与B、C、D之间分别存在边,B和D之间存在边,C和D之间也存在边,则社区A和B组成一个社区对,社区A和C组成一个社区对,社区A和D组成一个社区对,社区B和D组成一个社区对,社区C和D组成一个社区对,相应的,分别计算各个社区对合并后的模块度增量包括:计算社区A和社区B合并后的模块度增量,计算社区A和社区C合并后的模块度增量,社区A和社区D合并后的模块度增量,计算社区B和社区D合并后的模块度增量,计算社区C和社区D合并后的模块度增量。
第三步、合并模块度增量最大的社区对;
第四步、重复第二步和第三步,直到只剩下一个社区为止,将模块度值最大时的社区划分作为关系网络最终的社区划分。
步骤206:将各个社区按照各个社区所包含的点的最终分数之和的平均值进行从大到小的排序。
步骤207:将排序在前的设定数量的社区确定为疑似目标人员集合。
社区中所包含的点的最终分数之和的平均值越大,表明该社区中的人员成为目标人员集合的可能性越高。
在本实施例中,单个疑似目标人员集合所包含的人员的数量大于或者等于2。
通过步骤206至207,即可实现根据各个社区中的点的最终分数,确定疑似目标人员集合。
可选地,该方法还包括:
步骤208:从疑似目标人员集合中筛选出目标人员集合。
实现时,该步骤可以通过人工实现,此时,从疑似目标人员集合中筛选出目标人员集合,可以包括:
输出排序在前的设定数量的社区的信息,社区的信息包括所包含的人员的属性信息等;
接收输入的选择指令,选择指令用于指示筛选出的目标人员集合;
输出筛选出的目标人员集合的信息,例如成员信息等。
进一步地,可以根据疑似目标人员集合中的成员的属性信息对疑似目标人员集合进行进一步判定,确定疑似目标人员集合是否为目标人员集合。
示例性地,根据疑似目标人员集合中的成员的属性信息对疑似目标人员集合进行进一步判定,确定疑似目标人员集合是否为目标人员集合,可以采用以下方式:
基于疑似目标人员集合中各个成员的属性信息,确定疑似目标人员集合的属性特征,其中,成员的属性信息参见步骤201中的人员的属性信息,在此省略详细描述;
确定疑似目标人员集合的基本特征,该基本特征包括成员数量、边数、密度中的至少一种,其中,成员数量可以为疑似目标人员集合所对应的社区所包含的点的数量,边数可以为疑似目标人员集合所对应的社区所包含的边数,密度可以为疑似目标人员集合所对应的社区所包含的边数与关系网络中最多具有的边数的比值;
基于疑似目标人员集合的属性特征和疑似目标人员集合的基本特征,确定疑似目标人员集合是否为目标人员集合。
在本公开实施例中,疑似目标人员集合的属性特征包括但不限于平均年龄、成员性别分布信息(例如男性数量、女性数量)、成员地域分布信息(例如各个地区所包含的成员数量)、成员年龄分布信息(各个年龄段所包含的成员数量)、年龄地域分布信息(各个地区中各个年龄段所包含的成员数量)等,可以为其中的一种或多种。这里的地区可以为省、市、县等行政划分区域,也可以为人为划分的地理区域。
可选地,基于疑似目标人员集合中各个成员的属性信息,确定疑似目标人员集合的属性特征,可以采用以下方式中的一种或多种:
将具有相同属性值的成员数量之和,作为疑似目标人员集合的属性特征,例如,将相同性别的成员数量之和,作为疑似目标人员集合的属性特征;
将属性值之和的平均值,作为疑似目标人员集合的属性特征,例如,将年龄的平均值作为疑似目标人员集合的年龄属性值;
按照至少一种属性为各个成员分类,并将每种类别的成员分布数量,作为疑似目标人员集合的属性特征,例如,按照地区为各个成员分类,将各个地区的成员数量,作为疑似目标人员集合的属性特征,即将地区和成员数量的对应关系,作为疑似目标人员集合的属性特征,又例如,按照年龄段为各个成员分类,将各个年龄段的成员数量,作为疑似目标人员集合的属性特征,即将年龄段和成员数量的对应关系,作为疑似目标人员集合的属性特征;再例如,按照地区和年龄为各个成员分类,将各个地区中不同年龄段的成员数量作为疑似目标人员集合的属性特征。
可选地,基于疑似目标人员集合的属性特征和疑似目标人员集合的基本特征,确定疑似目标人员集合是否为目标人员集合,可以人为根据经验确定,也可以采用分类模型确定,该分类模型的输入为疑似目标人员集合的属性特征和基本特征,输出表示是否是目标人员集合。可选地,分类模型可以采用机器学习的分类算法实现,例如随机森林、逻辑斯特回归、支持向量机等。这里的分类模型的训练方式与前述行为分类模型的获取方式相似,区别仅在于训练样本和测试样本的选取不同,在此省略详细描述。
需要说明的是,本公开实施例中,疑似目标人员集合可以为疑似犯罪团伙,目标人员集合可以为最终确定的犯罪团伙。在确定犯罪团伙的过程中,记录数据可以为犯案数据,记录数据可以由第三方提供,例如公安机关。当然,本公开实施例提供的人员关系分析方法还可以用于确定其他的人员集合,例如驴友团队,某领域的学术研究组织,以及各种民间组织等。
本公开基于人员的行为数据获取对应的人员属于目标人员的概率,并用关系网络中的点的初始分数来表示该概率,然后基于关系网络中的点之间的关联关系更新该初始分数,得到各个点的最终分数,并且根据关系网络中的各个社区所包含的点的最终分数来确定疑似目标人员集合。可见,该方法依赖于人员的行为数据从关系网络的各个社区中找出疑似目标人员集合,不依赖于给定的目标人员或者疑似目标人员,不仅可以确定出包含有记录的人员的疑似目标人员集合,也可以确定出无记录的人员构成的疑似目标人员集合。
下述为本公开装置实施例,对于装置实施例中未详尽描述的细节,可以参考上述方法实施例。
请参考图3,其示出了本公开一个实施例提供的人员关系分析装置300的结构框图。该装置包括:行为数据获取模块301、关系网络确定模块302、初始分数获取模块303、分数更新模块304、社区划分模块305和第一人员关系分析模块306。
其中,行为数据获取模块301用于获取多个人员的行为数据。关系网络确定模块302用于基于行为数据获取模块301获取的多个人员的行为数据,确定关系网络,该关系网络包括点和边,点用于表示人员,边用于表示人员之间存在关联关系。初始分数获取模块303用于基于行为数据获取模块301获取的多个人员的行为数据,获取每个点的初始分数,初始分数用于表示对应的人员属于目标人员的概率。分数更新模块304用于基于关联关系,更新各个点的初始分数,得到各个点的最终分数。社区划分模块305用于采用社区发现算法,将关系网络确定模块302确定的关系网络划分为多个社区。第一人员关系分析模块306用于根据社区划分模块划分出的各个社区中的点的最终分数,确定疑似目标人员集合。
可选地,初始分数获取模块303包括:分数预测子模块3031和初始分数确定子模块3032。分数预测子模块3031用于基于多个人员的行为数据,确定各个人员对应的点的预测分数。初始分数确定子模块3032用于根据多个人员的记录数据,对各个点的预测分数进行更新,得到每个点的初始分数。
可选地,分数预测子模块3031用于对多个人员的行为数据进行特征提取;将提取到的特征输入行为分类模型,并将行为分类模型的输出作为各个人员对应的点的预测分数。
可选地,初始分数确定子模块3032用于当人员没有记录时,将预测分数作为对应的点的初始分数;当人员有记录时,将预测分数与预设值之和作为对应的点的初始分数。
可选地,分数更新模块304用于采用页面排序PageRank算法,更新各个点的初始分数,得到各个点的最终分数。
可选地,第一人员关系分析模块306包括:排序子模块3061和确定子模块3062。排序子模块3061用于将各个社区按照各个社区所包含的点的最终分数之和的平均值进行从大到小的排序;确定子模块3062用于将排序在前的设定数量的社区确定为疑似目标人员集合。
可选地,该装置还可以包括:属性特征确定模块307、基本特征确定模块308和第二人员关系分析模块309。其中,属性特征确定模块307用于基于疑似目标人员集合中各个成员的属性信息,确定疑似目标人员集合的属性特征。基本特征确定模块308用于确定疑似目标人员集合的基本特征,基本特征包括成员数量、边数、密度中的至少一种。第二人员关系分析模块309用于基于属性特征确定模块307确定的属性特征和基本特征确定模块308确定的基本特征,确定疑似目标人员集合是否为目标人员集合。
本公开基于人员的行为数据获取对应的人员属于目标人员的概率,并用关系网络中的点的初始分数来表示该概率,然后基于关系网络中的点之间的关联关系更新该初始分数,得到各个点的最终分数,并且根据关系网络中的各个社区所包含的点的最终分数来确定疑似目标人员集合。可见,该方法依赖于人员的行为数据从关系网络的各个社区中找出疑似目标人员集合,不依赖于给定的目标人员或者疑似目标人员,不仅可以确定出包含有记录的人员的疑似目标人员集合,也可以确定出无记录的人员构成的疑似目标人员集合。
参见图4,其示出了本公开实施例提供的一种人员关系分析装置的结构示意图。该装置可能是服务器或者终端,具体来讲:
该装置700包括中央处理单元(CPU)701、包括随机存取存储器(RAM)702和只读存储器(ROM)703的系统存储器704,以及连接系统存储器704和中央处理单元701的系统总线705。装置700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)706,和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。
基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中显示器708和输入设备709都通过连接到系统总线705的输入输出控制器710连接到中央处理单元701。基本输入/输出系统706还可以包括输入输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。大容量存储设备707及其相关联的计算机可读介质为装置700提供非易失性存储。也就是说,大容量存储设备707可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。
根据本公开的各种实施例,装置700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即装置700可以通过连接在系统总线705上的网络接口单元711连接到网络712,或者说,也可以使用网络接口单元711来连接到其他类型的网络或远程计算机系统(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。所述一个或者一个以上程序包含用于进行图1至2其中任一所提供的人员关系分析方法的指令。
本公开实施例还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由人员关系分析装置的处理器执行时,使得人员关系分析装置能够执行图1至2其中任一提供的人员关系分析方法。
一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行进行图1至2其中任一提供的人员关系分析方法的指令。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。
Claims (10)
1.一种人员关系分析方法,其特征在于,所述方法包括:
获取多个人员的行为数据;
基于所述多个人员的行为数据,确定关系网络,所述关系网络包括点和边,所述点用于表示人员,所述边用于表示人员之间存在关联关系;
对所述多个人员的行为数据进行特征提取;
将提取到的特征输入行为分类模型,并将所述行为分类模型的输出作为各个所述人员对应的点的预测分数;
当所述人员没有记录时,将所述预测分数作为对应的点的初始分数,所述记录用于指示所述人员是否属于目标人员;
当所述人员有记录时,将所述预测分数与预设值之和作为对应的点的初始分数,所述初始分数用于表示对应的人员属于目标人员的概率;
基于所述关联关系,更新各个所述点的初始分数,得到各个所述点的最终分数;
采用社区发现算法,将所述关系网络划分为多个社区;
根据各个所述社区中的点的最终分数,确定疑似目标人员集合;
基于所述疑似目标人员集合中各个成员的属性信息,确定疑似目标人员集合的属性特征;
确定所述疑似目标人员集合的基本特征,所述基本特征包括成员数量、边数、密度中的至少一种,其中,所述成员数量为所述疑似目标人员集合所对应的社区所包含的点的数量,所述边数为疑似目标人员集合所对应的社区所包含的边数,所述密度为所述疑似目标人员集合所对应的社区所包含的边数与关系网络中最多具有的边数的比值;
基于所述疑似目标人员集合的属性特征和所述疑似目标人员集合的基本特征,确定所述疑似目标人员集合是否为目标人员集合。
2.根据权利要求1所述的方法,其特征在于,所述基于所述关联关系,更新各个所述点的初始分数,得到各个所述点的最终分数,包括:
采用页面排序PageRank算法,更新各个所述点的初始分数,得到各个所述点的最终分数。
3.根据权利要求1所述的方法,其特征在于,所述根据各个所述社区所包含的点的最终分数,确定疑似目标人员集合,包括:
将各个所述社区按照各个社区所包含的点的最终分数之和的平均值进行从大到小的排序;
将排序在前的设定数量的社区确定为疑似目标人员集合。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
基于所述疑似目标人员集合中各个成员的属性信息,确定所述疑似目标人员集合的属性特征;
确定所述疑似目标人员集合的基本特征,所述基本特征包括成员数量、边数、密度中的至少一种;
基于所述属性特征和所述基本特征,确定所述疑似目标人员集合是否为目标人员集合。
5.一种人员关系分析装置,其特征在于,所述装置包括:
行为数据获取模块,用于获取多个人员的行为数据;
关系网络确定模块,用于基于所述行为数据获取模块获取的所述多个人员的行为数据,确定关系网络,所述关系网络包括点和边,所述点用于表示人员,所述边用于表示人员之间存在关联关系;
初始分数获取模块,用于对所述多个人员的行为数据进行特征提取;将提取到的特征输入行为分类模型,并将所述行为分类模型的输出作为各个所述人员对应的点的预测分数;当所述人员没有记录时,将所述预测分数作为对应的点的初始分数,所述记录用于指示所述人员是否属于目标人员;当所述人员有记录时,将所述预测分数与预设值之和作为对应的点的初始分数,所述初始分数用于表示对应的人员属于目标人员的概率;
分数更新模块,用于基于所述关联关系,更新各个所述点的初始分数,得到各个所述点的最终分数;
社区划分模块,用于采用社区发现算法,将所述关系网络确定模块确定的所述关系网络划分为多个社区;
第一人员关系分析模块,用于根据所述社区划分模块划分出的各个所述社区中的点的最终分数,确定疑似目标人员集合;基于所述疑似目标人员集合中各个成员的属性信息,确定疑似目标人员集合的属性特征;确定所述疑似目标人员集合的基本特征,所述基本特征包括成员数量、边数、密度中的至少一种,其中,所述成员数量为所述疑似目标人员集合所对应的社区所包含的点的数量,所述边数为疑似目标人员集合所对应的社区所包含的边数,所述密度为所述疑似目标人员集合所对应的社区所包含的边数与关系网络中最多具有的边数的比值;基于所述疑似目标人员集合的属性特征和所述疑似目标人员集合的基本特征,确定所述疑似目标人员集合是否为目标人员集合。
6.根据权利要求5所述的装置,其特征在于,所述分数更新模块,用于采用页面排序PageRank算法,更新各个所述点的初始分数,得到各个所述点的最终分数。
7.根据权利要求5所述的装置,其特征在于,所述第一人员关系分析模块,包括:
排序子模块,用于将各个所述社区按照各个社区所包含的点的最终分数之和的平均值进行从大到小的排序;
确定子模块,用于将排序在前的设定数量的社区确定为疑似目标人员集合。
8.根据权利要求5至7任一项所述的装置,其特征在于,所述装置还包括:
属性特征确定模块,用于基于所述疑似目标人员集合中各个成员的属性信息,确定所述疑似目标人员集合的属性特征;
基本特征确定模块,用于确定所述疑似目标人员集合的基本特征,所述基本特征包括成员数量、边数、密度中的至少一种;
第二人员关系分析模块,用于基于所述属性特征确定模块确定的所述属性特征和所述基本特征确定模块确定的所述基本特征,确定所述疑似目标人员集合是否为目标人员集合。
9.一种人员关系分析装置,其特征在于,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至4任一项所述的人员关系分析方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1至4任一项所述的人员关系分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811347828.9A CN111177473B (zh) | 2018-11-13 | 2018-11-13 | 人员关系分析方法、装置和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811347828.9A CN111177473B (zh) | 2018-11-13 | 2018-11-13 | 人员关系分析方法、装置和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111177473A CN111177473A (zh) | 2020-05-19 |
CN111177473B true CN111177473B (zh) | 2023-11-14 |
Family
ID=70653656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811347828.9A Active CN111177473B (zh) | 2018-11-13 | 2018-11-13 | 人员关系分析方法、装置和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111177473B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639251B (zh) * | 2020-06-16 | 2023-09-29 | 李忠耘 | 信息检索方法和装置 |
CN111784530A (zh) * | 2020-07-09 | 2020-10-16 | 浙江军盾信息科技有限公司 | 关系网络构建方法、装置、计算机设备和存储介质 |
CN111860655B (zh) * | 2020-07-23 | 2023-05-30 | 中国联合网络通信集团有限公司 | 用户的处理方法、装置和设备 |
CN112667679B (zh) * | 2020-12-17 | 2024-02-13 | 中国工商银行股份有限公司 | 数据关系的确定方法、装置和服务器 |
CN113139483B (zh) * | 2021-04-28 | 2023-09-29 | 北京百度网讯科技有限公司 | 人体行为识别方法、装置、设备、存储介质以及程序产品 |
CN113407594A (zh) * | 2021-06-18 | 2021-09-17 | 重庆紫光华山智安科技有限公司 | 一种融合关系分析方法及系统 |
CN113643824B (zh) * | 2021-07-19 | 2024-03-26 | 南京理工大学 | 基于γ-疑似感染社区模型的疑似流行病感染人员搜索方法 |
CN116662682B (zh) * | 2023-05-22 | 2024-02-20 | 全景智联(武汉)科技有限公司 | 目标人群的确定方法、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408149A (zh) * | 2014-12-04 | 2015-03-11 | 威海北洋电气集团股份有限公司 | 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统 |
CN106776897A (zh) * | 2016-11-29 | 2017-05-31 | 中国农业银行股份有限公司 | 一种用户画像标签确定方法及装置 |
CN106780263A (zh) * | 2017-01-13 | 2017-05-31 | 中电科新型智慧城市研究院有限公司 | 基于大数据平台的高危人员分析和识别方法 |
WO2018077039A1 (zh) * | 2016-10-27 | 2018-05-03 | 腾讯科技(深圳)有限公司 | 社区发现方法、装置、服务器及计算机存储介质 |
CN108197224A (zh) * | 2017-12-28 | 2018-06-22 | 广州虎牙信息科技有限公司 | 用户群分类方法、存储介质以及终端 |
CN108255977A (zh) * | 2017-12-27 | 2018-07-06 | 东软集团股份有限公司 | 关系预测方法、装置、计算机可读存储介质及电子设备 |
CN108648094A (zh) * | 2018-05-08 | 2018-10-12 | 阿里巴巴集团控股有限公司 | 一种社区发现方法、装置以及设备 |
-
2018
- 2018-11-13 CN CN201811347828.9A patent/CN111177473B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408149A (zh) * | 2014-12-04 | 2015-03-11 | 威海北洋电气集团股份有限公司 | 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统 |
WO2018077039A1 (zh) * | 2016-10-27 | 2018-05-03 | 腾讯科技(深圳)有限公司 | 社区发现方法、装置、服务器及计算机存储介质 |
CN106776897A (zh) * | 2016-11-29 | 2017-05-31 | 中国农业银行股份有限公司 | 一种用户画像标签确定方法及装置 |
CN106780263A (zh) * | 2017-01-13 | 2017-05-31 | 中电科新型智慧城市研究院有限公司 | 基于大数据平台的高危人员分析和识别方法 |
CN108255977A (zh) * | 2017-12-27 | 2018-07-06 | 东软集团股份有限公司 | 关系预测方法、装置、计算机可读存储介质及电子设备 |
CN108197224A (zh) * | 2017-12-28 | 2018-06-22 | 广州虎牙信息科技有限公司 | 用户群分类方法、存储介质以及终端 |
CN108648094A (zh) * | 2018-05-08 | 2018-10-12 | 阿里巴巴集团控股有限公司 | 一种社区发现方法、装置以及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111177473A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177473B (zh) | 人员关系分析方法、装置和可读存储介质 | |
CN111309824A (zh) | 实体关系图谱显示方法及系统 | |
WO2017202006A1 (zh) | 数据处理方法和装置、计算机存储介质 | |
CN108108821A (zh) | 模型训练方法及装置 | |
CN108921221A (zh) | 用户特征的生成方法、装置、设备及存储介质 | |
CN110889450B (zh) | 超参数调优、模型构建方法和装置 | |
CN115659177A (zh) | 数据推荐模型的生成方法、装置和计算机设备 | |
Huynh et al. | Context-similarity collaborative filtering recommendation | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN111274485A (zh) | 一种基于社区发现的个性化推荐方法 | |
CN112214775A (zh) | 对图数据的注入式攻击方法、装置、介质及电子设备 | |
CN110889759A (zh) | 信用数据的确定方法、装置及存储介质 | |
Gul et al. | A systematic analysis of link prediction in complex network | |
CN109992676B (zh) | 一种跨媒体资源检索方法及检索系统 | |
CN112785005A (zh) | 多目标任务的辅助决策方法、装置、计算机设备及介质 | |
US10313457B2 (en) | Collaborative filtering in directed graph | |
CN109656433B (zh) | 类目信息处理方法、装置、计算机设备和存储介质 | |
CN113256024B (zh) | 一种融合群体行为的用户行为预测方法 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
WO2023049280A1 (en) | Systems and methods to screen a predictive model for risks of the predictive model | |
CN114418120A (zh) | 联邦树模型的数据处理方法、装置、设备及存储介质 | |
WO2024139461A1 (zh) | 机器学习模型的训练方法、装置、设备及存储介质 | |
CN115660786A (zh) | 服务推荐方法、装置、计算机设备、存储介质和程序产品 | |
CN117216548A (zh) | 推荐数据评估模型的构建方法、推荐数据评估方法和装置 | |
Tella | A Movie Recommendation System Based on Game Theoretic Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |