CN106326345A - 一种基于用户行为的社交网络中朋友关系挖掘方法 - Google Patents
一种基于用户行为的社交网络中朋友关系挖掘方法 Download PDFInfo
- Publication number
- CN106326345A CN106326345A CN201610638825.5A CN201610638825A CN106326345A CN 106326345 A CN106326345 A CN 106326345A CN 201610638825 A CN201610638825 A CN 201610638825A CN 106326345 A CN106326345 A CN 106326345A
- Authority
- CN
- China
- Prior art keywords
- user
- restaurant
- network
- users
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005065 mining Methods 0.000 title abstract 4
- 238000002790 cross-validation Methods 0.000 claims abstract description 11
- 238000010801 machine learning Methods 0.000 claims abstract description 8
- 230000011273 social behavior Effects 0.000 claims abstract description 7
- 235000019640 taste Nutrition 0.000 claims description 47
- 238000012546 transfer Methods 0.000 claims description 33
- 239000000284 extract Substances 0.000 claims description 10
- 230000003542 behavioural effect Effects 0.000 claims description 6
- 235000012054 meals Nutrition 0.000 claims description 5
- 230000006978 adaptation Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 3
- 230000002349 favourable effect Effects 0.000 abstract 1
- 238000013507 mapping Methods 0.000 abstract 1
- 230000007704 transition Effects 0.000 abstract 1
- 238000012795 verification Methods 0.000 abstract 1
- 241001269238 Data Species 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000009412 basement excavation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000031708 Saprospiraceae Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于用户行为的社交网络中朋友关系挖掘方法,包括以下步骤:1)通过用户已有社交行为的记录数据,分别建立二分图与有向转移网络,即用户—餐馆和用户—口味;2)根据网络拓扑关系,分别提取关于节点或连边的具有表征两两用户之间社交行为的特征变量;3)采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;4)取10次验证结果的平均值作为模型的最终评价成绩。本发明将人们的社交行为映射到网络中,用网络拓扑特征反映社交行为的共性变量,使得预测用户之间朋友关系的结果具有较高精确度,既有利于引导用户寻找合适的新朋友,也有助于商家推荐更有价值的信息。
Description
技术领域
本发明涉及数据挖掘与推荐系统领域,特别是涉及一种基于用户行为的社交网络中朋友关系挖掘方法。
背景技术
国内社交网络兴起于2005年前后,模仿Friendster、Facebook等美国社交平台应用,校内网(后来的人人网)、51.com、豆瓣网、若邻网、天际网等一批社交网站在这一时期先后上线服务。尤其是在2008年开心网推出的“朋友买卖”、“抢车位”、“偷菜”等社交网络游戏,让开心网在白领群体中迅速蹿红,直追当时的社交平台“老大”人人网。社交平台经过十多年的发展,如今国内主流平台——微信与微博,他们集社交、购物、理财于一身,功能愈加全面化。
六度空间理论指出:我们和任何一个陌生人之间所间隔的人不会超过六个,即我们最多通过五个中间人去认识一个陌生人。近年来社交工具越来越多地渗入到人们的日常生活中来,滴滴打车、美团外卖均可通过社交平台找到小伙伴进行拼单,六度空间理论无时无刻地发生在我们身边。而推荐系统的作用就在于尽快帮助用户们在社交平台上找到他们最热衷的信息或朋友。
专利201410025336.3将社交网络映射到一个无向网络,存在弊端:因为往往大多数人转发名人的消息,但名人根本不认识这些人,所以他们两两之间只有单向连边,从而导致推荐结果无法保持较高的准确率与召回率水平。专利201310689161.1需要用到关联好友数据,以及用户的所属公司、所属行业或学校等个人隐私数据,所以该专利技术只适用于在具有大数据处理能力的公司进行朋友关系的挖掘,对于那些需要了解用户的朋友关系的普通公司而言,他们很难获取用户之间的朋友关系网络。鉴于以上缺陷,本发明提取二分图的静态指标、与时序有向转移网络的动态指标共同作为用户间行为的特征,利用机器学习算法挖掘用户之间的朋友关系,弥补了缺失用户关系网络的不利影响,具有较好的推荐结果。
发明内容
为了克服传统朋友关系预测模型在准确率与召回率上无法保持两者均处在较高的水平的不足,本发明提出一种兼顾准确率与召回率、预测效果良好的基于用户行为的社交网络中朋友关系挖掘方法。
本发明解决其技术问题所采用的技术方案如下:
一种基于用户行为的社交网络中朋友关系挖掘方法,包括以下步骤:
S1:通过用户已有行为的记录数据,分别建立出两类二分图与有向转移网络,即用户—餐馆地区,用户—口味标签;
S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户的节点相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;
S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;
S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩。
进一步,所述步骤S1中,用到的餐馆地区不是原数据集里的餐馆所在城市或州信息,因为这两个地理特征过于宽泛,无法量化反映用户选择餐馆时的地区移动模式。所以本发明利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的地区聚类簇,从而归纳出各个餐馆所属的地区特征。
再进一步,所述步骤S1中,建立二分图方法,构建用户—餐馆地区二分图、以及用户—口味标签二分图,建立用户—餐馆二分图的过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户,Y=[y1,y2,…yn]表示各个餐馆聚类簇,若用户xi去过餐馆聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆聚类簇;同理,用户—口味标签二分图G(X,E2,T)。
所述步骤S1中,建立有向转移网络方法,构建用户之间关于餐馆地区、以及口味标签的有向转移网络,建立用户—餐馆地区有向转移网络的过程如下:定义两个用户之间的有向转移网络其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆聚类簇集合,根据原数据集已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边表示用户xi指向用户xj。有向连边的权重,根据用户xi,xj去该餐馆yi*=yj*的最小次数而定。若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,构建用户之间的口味标签时序有向转移网络
所述步骤S2中,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:
S2-1:根据二分图,求得两两用户之间的行为偏好相似度,例如在图2所示的用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆聚类簇yj的次数,则用户xi去餐馆聚类簇yj的概率为
根据不相关熵的定义,餐馆聚类簇yj的熵为
Ej值越大,表示餐馆聚类簇yj越受用户青睐。
用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为
同理,可得用户—口味标签二分图G(X,E2,T)的两两用户之间选择餐馆,在共同口味上的相似度特征taste_similarij;
S2-2:根据有向转移网络,求得两两用户之间的行为影响,例如在用户—餐馆地区有向转移网络中,用户xj对用户xi关于选择餐馆的影响定义为
其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi行为的影响,
βj表示用户xj去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii,Oi分别是网络中用户xi的入度邻居与出度邻居,即选择就餐地理位置时,用户xi的影响用户集与被影响用户集;同理,可得用户—口味标签有向转移网络中的关于选择口味的影响。
所述步骤S3中,采用机器学习分类器模型xgboost,由于在实际用户关系网络中两两朋友之间的1值连边数量非常少,占所有连边数量(1值连边与0值连边的总数)的小于3%,故对训练数据中的非朋友数据数量降采样至大致与朋友数据数量相当。训练分类器模型时,所有样本数据通过10折交叉验证增强分类模型的泛化能力。
本发明提取了静态二分图的节点相似度特征,与动态有向转移网络的有向连边属性特征,静态指标用于反映用户行为的偏好,动态指标用于映射用户之间的影响,两者相辅相成地表征了社交网络中用户的社交模式,根据这些模式采用机器学习分类器模型算法,挖掘社交网络中的用户关系(即用户关系网络中未知的连边状态)。最终的预测结果较高,能有效满足实际使用的要求。
本发明的适用对象是类似美团外卖、滴滴打车或饿了么这类具有完整用户行为数据,但没有用户身份等隐私数据的O2O商家。本发明以研究yelp餐饮社交平台的用户朋友关系为例,原始数据记录了各用户的历史行为。行为数据包括用户的用餐餐馆、用餐时间、用餐地区以及餐馆口味等信息。同时原始数据已知用户之间的朋友关系,若两个用户是朋友关系,则标签数据设为1,反之则为0,由此形成一张社交平台用户关系网络,这可以用于进行算法验证。
本发明的有益效果为:兼顾准确率与召回率、预测效果良好。
附图说明
图1为本发明实施例的基于用户行为的社交网络中朋友关系挖掘的流程图;
图2为本发明实施例的用户—餐馆地区二分图;
图3为本发明实施例的用户—餐馆地区有向转移网络。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1~图3,一种基于用户行为的社交网络中朋友关系挖掘方法,本发明使用yelp官方公开的数据进行用户朋友推荐系统的建模分析,原始数据记录了各个用户的历史行为信息,以本专利研究yelp用户为例,其行为数据包括用户的用餐餐馆、用餐时间、用餐地点(城市、州、经纬度)以及餐馆口味等信息。在用户数据中已知用户之间的朋友关系,若两个用户是朋友关系,则标签数据设为1,反之则为0,此用户之间的朋友关系数据只作为训练与测试推荐系统模型的标签数据,不用于提取特征。
本发明分为以下四个步骤:
S1:通过用户已有行为的记录数据,分别建立出两类二分图与时序有向转移网络,即用户—餐馆地区,用户—口味标签;
S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户的节点相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的时序有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;
S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;
S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩。
所述步骤S1中用到的餐馆地区不是原数据集里的餐馆所在城市或州信息,因为这两个地理特征过于宽泛,无法量化反映用户选择餐馆时的地区移动模式。所以本发明利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的地区聚类簇,从而归纳出各个餐馆所属的地区特征。
所述步骤S1中,建立二分图方法,例如建立用户—餐馆地区二分图,过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户,Y=[y1,y2,…yn]表示各个餐馆聚类簇,若用户xi去过餐馆聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆聚类簇。图2所示为4个yelp用户关于n个餐馆聚类簇的选择情况;同理,可构建用户—口味标签二分图G(X,E2,T),其中X=[x1,x2,…xm]表示各个用户,T=[t1,t2,…tp]表示各个口味标签,若用户xi吃过口味tj,则用有权连边e′ij表示该用户吃过几次该口味。
所述步骤S1中,建立有向转移网络方法,例如建立用户—餐馆地区有向转移网络如图3所示,过程如下:定义两个用户之间的有向转移网络其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆聚类簇集合,根据原数据集已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边表示用户xi指向用户xj。有向连边的权重,根据用户xi,xj去该餐馆yi*=yj*的最小次数而定。若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,可构建用户之间的口味标签时序有向转移网络其中xi,xj分别表示用户xi,xj,{Ti},{Tj}分别表示用户xi,xj吃过的口味标签集合,根据原数据集已知各用户的用餐餐馆口味标签与相应用餐的时间,若用户xi,xj吃过相同的口味ti*=tj*,且用户xi去吃该口味的时间先于用户xj,则用有向连边表示用户xi指向用户xj。有向连边的权重,根据用户xi,xj吃过该口味ti*=tj*的最小次数而定。
所述步骤S2,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:
S2-1:根据二分图,求得两两用户之间的行为偏好相似度,例如在图2所示的用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆聚类簇yj的次数,则用户xi去餐馆聚类簇yj的概率为
根据不相关熵的定义,餐馆聚类簇yj的熵为
Ej值越大,表示餐馆聚类簇yj越受用户青睐。
用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为
同理,在用户—口味标签二分图G(X,E2,T)中,可构建链接矩阵D′∈R4×p,d′ij表示用户xi吃过口味tj的次数,则用户xi去吃口味tj的概率为
根据不相关熵的定义,口味tj的熵为
Ej′值越大,表示口味tj越受用户欢迎。
则用户xi,xj选择餐馆在口味上的相似度特征taste_similarij定义为
S2-2:根据有向转移网络,求得两两用户之间的行为影响,例如在用户—餐馆地区有向转移网络中,借鉴PageRank网页排名算法的思想,用户xj对用户xi关于选择餐馆的影响定义为
其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi的影响,
βj表示用户xj打算去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii,Oi分别是网络中用户xi的入度邻居与出度邻居,即选择就餐地理位置时,用户xi的影响用户集与被影响用户集。
同理,在用户—口味标签有向转移网络中,用户xj对用户xi关于选择就餐口味的影响定义为
其中a′ij表示在历史记录中,用户xj选择就餐口味对用户xi的影响,
βj′表示用户xj打算去吃历史记录之外的其他就餐口味的概率,Nt表示数据集中所有口味标签的总数,Ii′,Oi′分别是网络中用户xi的入度邻居与出度邻居,即选择就餐口味时,用户xi的影响用户集与被影响用户集。
在所述步骤S3与S4过程中,由于在用户关系网络中两两朋友之间的1值连边数量非常少,占所有连边数量(1值连边与0值连边)的小于3%,故对训练数据中的非朋友数据数量欠采样至大致与朋友数据数量相当。随后训练分类器模型时,采用机器学习分类模型——xgboost分类器,通过10折交叉验证增强分类模型的泛化能力。10折交叉验证,就是将全体样本分割成10个子样本,一个单独的子样本被保留作为验证模型的数据,其他9个样本用来训练分类器模型。交叉验证重复10次,每个子样本验证一次,平均10次的验证结果作为该分类器模型的最终评价成绩。
如上所述为本发明在yelp餐饮平台的用户朋友关系挖掘方法的实施例介绍,本发明提取静态二分图的节点相似度特征与动态有向转移网络的有向连边属性特征,采用机器学习分类器模型,最终的预测结果较高,达到了实际使用的要求。对发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。
Claims (5)
1.一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述挖掘方法包括以下步骤:
S1:通过用户已有行为的记录数据,分别建立出两类二分图与有向转移网络,即用户—餐馆地区,用户—口味标签;
S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户的节点相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;
S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;
S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩。
2.如权利要求1所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述步骤S1中,利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的地区聚类簇,从而归纳出各个餐馆所属的地区特征。
3.如权利要求1或2所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述步骤S1中,建立二分图方法,构建用户—餐馆地区二分图、以及用户—口味标签二分图,建立用户—餐馆二分图的过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户,Y=[y1,y2,…yn]表示各个餐馆聚类簇,若用户xi去过餐馆聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆聚类簇;同理,用户—口味标签二分图G(X,E2,T)。
4.如权利要求3所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所所述步骤S1中,建立有向转移网络方法,构建用户之间关于餐馆地区、以及口味标签的有向转移网络,建立用户—餐馆地区有向转移网络的过程如下:定义两个用户之间的有向转移网络其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆聚类簇集合,根据原数据集已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边表示用户xi指向用户xj,有向连边的权重,根据用户xi,xj去该餐馆yi*=yj*的最小次数而定,若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,构建用户之间的口味标签时序有向转移网络
5.如权利要求1或2所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所所述步骤S2中,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:
S2-1:根据二分图,求得两两用户之间的行为偏好相似度,在用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆聚类簇yj的次数,则用户xi去餐馆聚类簇yj的概率为
根据不相关熵的定义,餐馆聚类簇yj的熵为
Ej值越大,表示餐馆聚类簇yj越受用户青睐,
用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为
同理,可得用户—口味标签二分图G(X,E2,T)的两两用户之间选择餐馆,在共同口味上的相似度特征taste_similarij;
S2-2:根据有向转移网络,求得两两用户之间的行为影响,在用户—餐馆地区有向转移网络中,用户xj对用户xi关于选择餐馆的影响定义为
其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi行为的影响,
βj表示用户xj去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii,Oi分别是网络中用户xi的入度邻居与出度邻居,即选择就餐地理位置时,用户xi的影响用户集与被影响用户集;同理,可得用户—口味标签有向转移网络中的关于选择口味的影响。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610638825.5A CN106326345B (zh) | 2016-08-08 | 2016-08-08 | 一种基于用户行为的社交网络中朋友关系挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610638825.5A CN106326345B (zh) | 2016-08-08 | 2016-08-08 | 一种基于用户行为的社交网络中朋友关系挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106326345A true CN106326345A (zh) | 2017-01-11 |
CN106326345B CN106326345B (zh) | 2019-11-01 |
Family
ID=57739890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610638825.5A Active CN106326345B (zh) | 2016-08-08 | 2016-08-08 | 一种基于用户行为的社交网络中朋友关系挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106326345B (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934489A (zh) * | 2017-02-22 | 2017-07-07 | 南京邮电大学 | 一种面向复杂网络的时序链路预测方法 |
CN106992966A (zh) * | 2017-02-28 | 2017-07-28 | 浙江工业大学 | 一种针对真假消息的网络信息传播实现方法 |
CN107688628A (zh) * | 2017-08-21 | 2018-02-13 | 北京金堤科技有限公司 | 关系组数据常用分组构建方法及装置 |
CN107909038A (zh) * | 2017-11-16 | 2018-04-13 | 北京邮电大学 | 一种社交关系分类模型训练方法、装置、电子设备及介质 |
CN108322473A (zh) * | 2018-02-12 | 2018-07-24 | 北京京东金融科技控股有限公司 | 用户行为分析方法与装置 |
CN108491465A (zh) * | 2018-03-06 | 2018-09-04 | 北京腾云天下科技有限公司 | 一种人群扩散方法及计算设备 |
CN108629671A (zh) * | 2018-05-14 | 2018-10-09 | 浙江工业大学 | 一种融合用户行为信息的餐馆推荐方法 |
CN108650614A (zh) * | 2018-03-19 | 2018-10-12 | 复旦大学 | 一种自动推断社会关系的移动用户位置预测方法与装置 |
CN108768718A (zh) * | 2018-05-23 | 2018-11-06 | 湖南女子学院 | 基于熵增的二分网络模块识别方法、系统及存储介质 |
CN109299978A (zh) * | 2018-09-13 | 2019-02-01 | 口碑(上海)信息技术有限公司 | 一种菜品推荐方法、装置以及设备 |
CN109754274A (zh) * | 2017-11-06 | 2019-05-14 | 北京京东尚科信息技术有限公司 | 一种确定目标对象的方法和装置 |
CN109872242A (zh) * | 2019-01-30 | 2019-06-11 | 北京字节跳动网络技术有限公司 | 信息推送方法和装置 |
CN110059795A (zh) * | 2018-01-18 | 2019-07-26 | 中国科学院声学研究所 | 一种融合地理位置与时间特征的移动用户节点组网方法 |
TWI670608B (zh) * | 2018-06-08 | 2019-09-01 | 林勁璋 | 拓樸圖的產生方法及其產生裝置 |
CN110309360A (zh) * | 2019-06-13 | 2019-10-08 | 山东大学 | 一种短视频的话题标签个性化推荐方法及系统 |
CN111104609A (zh) * | 2018-10-26 | 2020-05-05 | 百度在线网络技术(北京)有限公司 | 人际关系的预测方法及其装置、计算机程序、存储介质 |
CN111258994A (zh) * | 2020-01-09 | 2020-06-09 | 华中师范大学 | 一种面向学生校园卡行为数据构建社交网络的方法 |
CN111652451A (zh) * | 2020-08-06 | 2020-09-11 | 腾讯科技(深圳)有限公司 | 社交关系的获取方法和装置及存储介质 |
CN114091614A (zh) * | 2021-11-26 | 2022-02-25 | 中国银联股份有限公司 | 一种实体标签关联预测方法、装置及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110234594A1 (en) * | 2010-03-26 | 2011-09-29 | Microsoft Corporation | Graph clustering |
CN103761665A (zh) * | 2014-01-10 | 2014-04-30 | 东南大学 | 一种电子商务网站中顾客好友关系网络的挖掘方法 |
CN103795613A (zh) * | 2014-01-16 | 2014-05-14 | 西北工业大学 | 一种在线社交网络中朋友关系预测的方法 |
US20140317033A1 (en) * | 2013-04-23 | 2014-10-23 | International Business Machines Corporation | Predictive and descriptive analysis on relations graphs with heterogeneous entities |
CN105190682A (zh) * | 2013-03-01 | 2015-12-23 | 谷歌公司 | 基于内容发现社交联系 |
-
2016
- 2016-08-08 CN CN201610638825.5A patent/CN106326345B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110234594A1 (en) * | 2010-03-26 | 2011-09-29 | Microsoft Corporation | Graph clustering |
CN105190682A (zh) * | 2013-03-01 | 2015-12-23 | 谷歌公司 | 基于内容发现社交联系 |
US20140317033A1 (en) * | 2013-04-23 | 2014-10-23 | International Business Machines Corporation | Predictive and descriptive analysis on relations graphs with heterogeneous entities |
CN103761665A (zh) * | 2014-01-10 | 2014-04-30 | 东南大学 | 一种电子商务网站中顾客好友关系网络的挖掘方法 |
CN103795613A (zh) * | 2014-01-16 | 2014-05-14 | 西北工业大学 | 一种在线社交网络中朋友关系预测的方法 |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934489A (zh) * | 2017-02-22 | 2017-07-07 | 南京邮电大学 | 一种面向复杂网络的时序链路预测方法 |
CN106992966A (zh) * | 2017-02-28 | 2017-07-28 | 浙江工业大学 | 一种针对真假消息的网络信息传播实现方法 |
CN106992966B (zh) * | 2017-02-28 | 2020-01-10 | 浙江工业大学 | 一种针对真假消息的网络信息传播实现方法 |
CN107688628B (zh) * | 2017-08-21 | 2019-04-05 | 北京金堤科技有限公司 | 关系组数据常用分组构建方法及装置 |
CN107688628A (zh) * | 2017-08-21 | 2018-02-13 | 北京金堤科技有限公司 | 关系组数据常用分组构建方法及装置 |
CN109754274A (zh) * | 2017-11-06 | 2019-05-14 | 北京京东尚科信息技术有限公司 | 一种确定目标对象的方法和装置 |
CN107909038A (zh) * | 2017-11-16 | 2018-04-13 | 北京邮电大学 | 一种社交关系分类模型训练方法、装置、电子设备及介质 |
CN107909038B (zh) * | 2017-11-16 | 2022-01-28 | 北京邮电大学 | 一种社交关系分类模型训练方法、装置、电子设备及介质 |
CN110059795A (zh) * | 2018-01-18 | 2019-07-26 | 中国科学院声学研究所 | 一种融合地理位置与时间特征的移动用户节点组网方法 |
CN108322473A (zh) * | 2018-02-12 | 2018-07-24 | 北京京东金融科技控股有限公司 | 用户行为分析方法与装置 |
CN108491465A (zh) * | 2018-03-06 | 2018-09-04 | 北京腾云天下科技有限公司 | 一种人群扩散方法及计算设备 |
CN108491465B (zh) * | 2018-03-06 | 2020-10-16 | 北京腾云天下科技有限公司 | 一种人群扩散方法及计算设备 |
CN108650614A (zh) * | 2018-03-19 | 2018-10-12 | 复旦大学 | 一种自动推断社会关系的移动用户位置预测方法与装置 |
CN108650614B (zh) * | 2018-03-19 | 2020-07-28 | 复旦大学 | 一种自动推断社会关系的移动用户位置预测方法与装置 |
CN108629671A (zh) * | 2018-05-14 | 2018-10-09 | 浙江工业大学 | 一种融合用户行为信息的餐馆推荐方法 |
CN108629671B (zh) * | 2018-05-14 | 2021-10-29 | 浙江工业大学 | 一种融合用户行为信息的餐馆推荐方法 |
CN108768718A (zh) * | 2018-05-23 | 2018-11-06 | 湖南女子学院 | 基于熵增的二分网络模块识别方法、系统及存储介质 |
TWI670608B (zh) * | 2018-06-08 | 2019-09-01 | 林勁璋 | 拓樸圖的產生方法及其產生裝置 |
CN109299978A (zh) * | 2018-09-13 | 2019-02-01 | 口碑(上海)信息技术有限公司 | 一种菜品推荐方法、装置以及设备 |
CN111104609B (zh) * | 2018-10-26 | 2023-10-10 | 百度在线网络技术(北京)有限公司 | 人际关系的预测方法及其装置、存储介质 |
CN111104609A (zh) * | 2018-10-26 | 2020-05-05 | 百度在线网络技术(北京)有限公司 | 人际关系的预测方法及其装置、计算机程序、存储介质 |
CN109872242A (zh) * | 2019-01-30 | 2019-06-11 | 北京字节跳动网络技术有限公司 | 信息推送方法和装置 |
CN109872242B (zh) * | 2019-01-30 | 2020-10-13 | 北京字节跳动网络技术有限公司 | 信息推送方法和装置 |
CN110309360A (zh) * | 2019-06-13 | 2019-10-08 | 山东大学 | 一种短视频的话题标签个性化推荐方法及系统 |
CN111258994A (zh) * | 2020-01-09 | 2020-06-09 | 华中师范大学 | 一种面向学生校园卡行为数据构建社交网络的方法 |
CN111652451A (zh) * | 2020-08-06 | 2020-09-11 | 腾讯科技(深圳)有限公司 | 社交关系的获取方法和装置及存储介质 |
CN114091614A (zh) * | 2021-11-26 | 2022-02-25 | 中国银联股份有限公司 | 一种实体标签关联预测方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106326345B (zh) | 2019-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106326345A (zh) | 一种基于用户行为的社交网络中朋友关系挖掘方法 | |
Park et al. | Influence of the ‘slow city’brand association on the behavioural intention of potential tourists | |
CN104615616B (zh) | 群组推荐方法和系统 | |
CN103795613B (zh) | 一种在线社交网络中朋友关系预测的方法 | |
CN109241454B (zh) | 一种将社交网络和图像内容融合的兴趣点推荐方法 | |
CN104462592B (zh) | 基于不确定语义的社交网用户行为关系推演系统及方法 | |
CN103823888B (zh) | 一种基于节点亲密度的社交网站好友推荐方法 | |
CN104133817A (zh) | 网络社区交互方法、装置及网络社区平台 | |
CN107330798A (zh) | 一种基于种子节点传播的社交网络间用户身份识别方法 | |
CN105612514A (zh) | 通过将语境线索与图像关联进行图像分类的系统和方法 | |
CN101510856A (zh) | 一种sns网络中成员关系圈的提取方法和装置 | |
CN104239399A (zh) | 社交网络中的潜在好友推荐方法 | |
CN108647800A (zh) | 一种基于节点嵌入的在线社交网络用户缺失属性预测方法 | |
CN111191099B (zh) | 一种基于社交媒体的用户活动类型识别方法 | |
CN109213831A (zh) | 事件检测方法和装置、计算设备及存储介质 | |
CN109214863A (zh) | 一种基于快递数据预测城市房屋需求的方法 | |
Gadar et al. | The Settlement Structure Is Reflected in Personal Investments: Distance‐Dependent Network Modularity‐Based Measurement of Regional Attractiveness | |
CN108629671A (zh) | 一种融合用户行为信息的餐馆推荐方法 | |
Haandrikman et al. | Explaining spatial homogamy. Compositional, spatial and regional cultural determinants of regional patterns of spatial homogamy in the Netherlands | |
CN106055664A (zh) | 一种基于用户评论的ugc垃圾内容过滤方法及系统 | |
Miah et al. | A social media analytics perspective for human‐oriented smart city planning and management | |
CN105141508B (zh) | 一种基于近邻关系的微博系统朋友推荐方法 | |
Vaca-Ramírez et al. | Systematic assessment of the quality of fit of the stochastic block model for empirical networks | |
Zhang et al. | Inference method for cultural diffusion patterns using a field model | |
CN107977397A (zh) | 基于深度学习的互联网用户注意力指数计算方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |