Nothing Special   »   [go: up one dir, main page]

CN103744917A - 混合推荐方法及系统 - Google Patents

混合推荐方法及系统 Download PDF

Info

Publication number
CN103744917A
CN103744917A CN201310737345.0A CN201310737345A CN103744917A CN 103744917 A CN103744917 A CN 103744917A CN 201310737345 A CN201310737345 A CN 201310737345A CN 103744917 A CN103744917 A CN 103744917A
Authority
CN
China
Prior art keywords
user
degree
interest
algorithm
various dimensions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310737345.0A
Other languages
English (en)
Other versions
CN103744917B (zh
Inventor
姜立宇
张霞
韩宇
王菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201310737345.0A priority Critical patent/CN103744917B/zh
Publication of CN103744917A publication Critical patent/CN103744917A/zh
Application granted granted Critical
Publication of CN103744917B publication Critical patent/CN103744917B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种混合推荐方法及系统,其中方法包括将数据库中的用户数据分为单维度用户特征值和多维度用户特征值;采用贝叶斯平均算法对单维度用户特征值进行计算,获得用户的推荐算法兴趣度;采用朴素贝叶斯模型对多维度用户特征值进行计算,获得用户的推荐算法兴趣度;根据单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度,确定推荐列表,并将推荐列表推荐给数据库的用户。利用本发明,能够解决用户的推荐算法兴趣度预测准确率低、计算评估不同用户的推荐算法兴趣度和训练用户兴趣模型的时间瓶颈的问题。

Description

混合推荐方法及系统
技术领域
本发明涉及推荐技术领域,更为具体地,涉及一种混合推荐方法及系统。
背景技术
推荐技术发展至今已有十余年的历史,其间众多的推荐算法被提出并在业界应用。经过大量实践,人们发现似乎没有任何一种方法可以适用于所有场景,因为每种推荐算法都有自身难以逾越的局限性。
面对各种推荐算法的局限,业内推出了混合推荐技术,目前混合推荐技术有很多,如:加权混合推荐技术、交叉调和混合推荐技术等。图1示出了传统的混合推荐技术的流程,如图1所示,传统的混合推荐技术的流程包括:
S110:开始;
S120:用户浏览目标商务网站;
S130:网站向推荐系统发送请求;
S140:推荐系统外部接口;
S150:推荐算法;其中,在推荐算法中会调用A和B,A即商品信息数据库,B用户行为及用户信息数据库;
S160:是否使用混合推荐策略,若是,则执行S180;若否,则执行S170;
S170:混合推荐策略组件;
S180:推荐列表;
S190:结束。
上述为传统的混合推荐技术的整个流程,目前,主流的混合推荐策略包括:加权型混合推荐技术、分级型混合推荐技术、交叉型混合推荐技术、推荐模型混合技术等。
但是上述这些混合推荐技术都存在一些共性的问题。
由于上述推荐系统对所有用户的推荐算法混合策略是相同的,而该策略可能并不适用于所有用户。比如:某系统提供了多种推荐算法系统,采用分级混合策略,优先展现准确率较高的推荐算法生成的结果,后续加入召回率较高的其他算法的结果。对于最终推荐结果(Top-N)的推荐列表,兴趣单一的用户会对推荐结果感到满意;而兴趣广泛的用户总是优先看到他感兴趣的一个方面,随着时间的推移,会不可避免地导致用户的算法兴趣度预测准确率低、新颖度不够,并且推荐系统需要完成推荐的时间增加,从而降低用户对推荐结果的满意度。
因此,现在需要一种新的混合推荐技术解决上述出现的问题。
发明内容
鉴于上述问题,本发明的目的是提供一种混合推荐方法及系统,以解决用户的推荐算法兴趣度预测准确率低、计算评估不同用户的推荐算法兴趣度和训练用户兴趣模型的时间瓶颈的问题。
一方面,本发明提供一种混合推荐方法,包括将数据库中的用户数据分为单维度用户特征值和多维度用户特征值;
采用贝叶斯平均算法对单维度用户特征值进行计算,获得单维度用户的推荐算法兴趣度;以及,
采用朴素贝叶斯模型对多维度用户特征值进行计算,建立多维度用户兴趣模型,并对多维度用户兴趣模型进行训练,获得多维度用户的推荐算法兴趣度;
根据单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度,确定推荐列表,并将推荐列表推荐给数据库的用户。
此外,优选的方案是,在根据单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度确定推荐列表的过程中,通过混合推荐策略组件对单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度进行融合,获得数据库的用户对每个推荐算法的兴趣度,根据每个推荐算法的兴趣度获得每个推荐算法在所有推荐算法中的比例,确定推荐列表。
此外,优选的方案是,在采用贝叶斯平均算法对单维度用户特征值进行计算的过程中,采用并行计算方法计算单维度用户的推荐算法兴趣度;
在采用朴素贝叶斯模型对多维度用户特征值进行计算的过程中,采用并行计算方法计算多维度用户的推荐算法兴趣度。
此外,优选的方案是,在采用贝叶斯平均算法对单维度用户特征值进行计算的过程中,
贝叶斯平均算法公式为:
X ‾ = C × m + Σ i = 1 n x i n + C
其中,C为一个自行设定的常数;
m为数据库中项目的平均值;
n为所述项目的数据数量;
x为每个数据的值;
上述公式中,m为先验概率,每个x的值都是一个调整因子,随着n的增加,项目的值
Figure BDA0000447912940000032
将不断趋向其正确的值。
此外,优选的方案是,在采用朴素贝叶斯模型对多维度用户特征值进行计算的过程中,
朴素贝叶斯模型公式为:
P ( C | X ) = P ( X | C ) × P ( C ) P ( X )
其中,C为目标事件;X为特征值;
P(C|X)为X条件下C发生的概率;
P(X|C)为C条件下X发生的概率;
P(C)为C的概率;
P(X)为X的概率。
另一方面,本发明还提供一种混合推荐系统,包括:
数据库区分单元,用于将数据库中的用户数据分为单维度用户特征值和多维度用户特征值;
贝叶斯平均算法计算单元,用于采用贝叶斯平均算法对单维度用户特征值进行计算,获得单维度用户的推荐算法兴趣度;
朴素贝叶斯模型计算单元,用于采用朴素贝叶斯模型对多维度用户特征值进行计算,建立多维度用户兴趣模型,并对多维度用户兴趣模型进行训练,获得多维度用户的推荐算法兴趣度;
算法推荐单元,用于根据单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度,确定推荐列表,并将推荐列表推荐给数据库的用户。
从上面的技术方案可知,本发明提供的混合推荐方法及系统,能够计算评估不同用户的推荐算法兴趣度,通过采用贝叶斯平均算法获得单维度用户的推荐算法兴趣度,能够提高单维度用户的算法兴趣预测的准确率;通过采用朴素贝叶斯模型获得多维度用户的推荐算法兴趣度,采用朴素贝叶斯学习能够挖掘用户群隐性的算法兴趣,提高用户的算法兴趣预测精准度;通过并行计算能够缩短训练用户兴趣模型的时间和兴趣预测评估的时间。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为传统的混合推荐技术的流程示意图;
图2为根据本发明实施例的混合推荐方法的流程示意图;
图3为根据本发明实施例的混合推荐系统的逻辑结构框图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。以下将结合附图对本发明的具体实施例进行详细描述。
在前述传统的混合推荐技术中,推荐系统外部接口收到请求后,调用推荐算法,并将计算结果(Top-N)发送给混合推荐策略组件。如果推荐算法单一,直接将结果展示在推荐列表上。如果采用多种推荐算法,混合推荐策略组件会根据固定策略将各算法生成结果进行融合,推荐列表展示最终融合后的推荐结果。针对前述传统的混合推荐技术存在的算法推荐率不准确、推荐系统灵活等问题,本发明提出了一种个性化混合推荐技术,此技术能够根据用户数据计算用户对算法的兴趣程度,从而自动的调整各算法生成结果所占推荐列表的比例,为用户提供个性化的混合推荐。
在本发明中,用户浏览目标商务网站时,网站向推荐系统请求推荐结果,推荐系统外部接口收到请求后调用推荐算法。本发明的个性化混合推荐策略组件根据用户自身的兴趣倾向来确定用户最终的推荐列表,训练数据源来自于用户行为及用户信息数据库。
以下将结合附图对本发明的具体实施例进行详细描述。图2示出了根据本发明实施例的混合推荐方法的流程;如图2所示,本发明提供一种混合推荐方法,具体推荐方法包括:
S210:将数据库中的用户数据分为单维度用户特征值和多维度用户特征值。
具体地,在本发明中,根据推荐系统业务环境,选取计算推荐算法兴趣度的特征值,该特征值可以是单维度用户数据,也可以是多维度用户数据。数据库包括用户行为数据和用户信息数据。
在本发明中,将用户的数据分为两大类:一类为单维度用户特征值,如用户对推荐内容的点击、评分、收藏等,此类数据的特点是能够直观的确定用户的算法兴趣偏好;另一类为多维度用户特征值,如用户的年龄、性别、住址等不能通过直观判断确定用户算法喜好的数据。
也就是说,单维度用户特征值能够直观判断用户对推荐算法兴趣度的用户信息,通常为用户的行为数据或用户反馈的信息;多维度用户特征值为多维的、隐形的、通常不能够直观判断用户对推荐算法兴趣度的用户信息。
S220:采用贝叶斯平均算法对单维度用户特征值进行计算,获得单维度用户的推荐算法兴趣度。
具体地,本发明采用贝叶斯平均算法的思想,对单维度用户特征值进行优化和修正。其核心思想是将冷启动单维度用户的兴趣拉近到大众兴趣,并通过单维度用户数据的完善不断地修正其兴趣点,使计算结果越来越靠近用户真实的兴趣。
需要说明的是,用户冷启动指当新用户到来时,没有此用户的行为数据或信息数据,所以无法根据此用户的历史行为或用户信息预测其兴趣,从而无法借此给此用户做个性化推荐。
假设在推荐过程中提供三种推荐算法A、B、C。展现给最终用户的是混合三种算法生成的推荐列表。怎样获得用户对哪种算法推荐的结果最感兴趣?有多种方法能够获取,其中,一种简单的方法:即计算用户点击率,具体方法如下:
在每种算法暴露推荐结果个数相同的情况下,被目标用户点击的次数最多的算法,越受该用户喜爱。设用户对算法A的点击数为CA,同理得到对B和C的点击数CB、CC;这样,通过CA,CB和CC可动态调整算法暴露生成结果的个数;算法A推荐个数占推荐列表总个数的百分比PA为:
P A = C A C A + C B + C C    ①
然而,点击率这类数据受环境影响较大,并不能完全客观的反应用户喜好。比点击率更好的解决方案是通过用户对推荐物品的评分判断用户喜好。假设用户U对推荐的结果评分如下(打分区间在1-5):
Figure BDA0000447912940000063
同理可计算WB和WC。使用评分的好处是评分由用户自身决定,避免的环境对用户操作的影响。
P A = W A W A + W B + W C    ②
平均值W并不能客观的反应用户对算法的喜好。原因在于,类似于n次伯努利试验,随着实验次数的增加,最终的概率会趋向其期望P。即随着用户对算法A产生的项目的评分的增加,W趋近与其真实喜好,评分次数过少会导致W的值不可靠。
本发明借鉴贝叶斯平均算法思想来解决平均值W在冷启动状态下可信度不足的问题。贝叶斯平均较多的适用于排名问题。它借鉴了贝叶斯推理(Bayesian Inference)的思想:在不确定结果的情况下,先估计一个值,然后通过新信息的不断修正,使它越来越接近正确的值。
贝叶斯平均算法一般形式:
X ‾ = C × m + Σ i = 1 n x i n + C    ③
其中,C为一个自行设定的常数;
m为数据库中项目的平均值;
n为所述项目的数据数量;
x为每个数据的值。
上述公式③中,m为先验概率,每个x的值都是一个调整因子,随着n的增加,该项目的值
Figure BDA0000447912940000072
将不断趋向其正确的值。
借鉴公式③的思想,对公式②中的WA进行修正优化,优化结果如下:
W A ′ = T A ‾ × W A ‾ + T A × W A T A ‾ + T A    ④
其中,
Figure BDA0000447912940000074
为算法A的用户平均评分次数;
Figure BDA0000447912940000075
为算法A的用户平均评分;
TA为目标用户对算法A的平均评分次数;
WA为目标用户对算法A的平均评分。
通过公式④可以计算目标用户的先验概率兴趣倾向WA′、WB′和WC′,并且随着用户行为数据的增加不断的修正,使其不断的趋近真实兴趣喜好。
在本发明中,采用贝叶斯平均算法计算用户的推荐算法兴趣度。该方法适用于能够直观判断用户算法喜好的单维度用户行为的数据,如用户对算法推荐结果的评分等。该算法能够解决冷启动用户在行为数据较少时带来的预测结果置信度不高的问题,以提高用户算法兴趣预测的准确率。
上述过程的计算是建立在“用户评分越高,用户对算法的兴趣程度越高”的假设基础之上,显然,这个假设是成立的。然而有些信息不能使用该方法进行计算。如:一个服装销售网站中,其用户的喜好跟其年龄和性别有很大的关联。而通过我们不能直观的确定某年龄段某性别的用户适合哪几种推荐算法,他们对那种推荐算法的感兴趣程度更高。而往往,这些信息会起到关键性的作用。因此,就采用下面的方法进行推荐:
S230:采用朴素贝叶斯模型对多维度用户特征值进行计算,建立多维度用户兴趣模型,并对多维度用户兴趣模型进行训练,获得多维度用户的推荐算法兴趣度。
具体地,本发明运用机器学习中的朴素贝叶斯模型,通过多维度用户的历史数据训练用户兴趣模型,并计算用户的推荐算法兴趣度。
贝叶斯概率模型一般形式:
P ( C | X ) = P ( X | C ) × P ( C ) P ( X )    ⑤
在上述公式⑤中,C为目标事件;X为特征值;
P(C|X)为X条件下C发生的概率;
P(X|C)为C条件下X发生的概率;
P(C)为C的概率;P(X)为X的概率。
在本发明的一个具体实施例中,以用户年龄作为特征变量为例。假设目标用户U的年龄为a,推荐过程中提供两种推荐算法A、B,则用户U对算法A感兴趣的概率为P(A|a),同理得到对算法B的感兴趣概率为P(B|a)。由公式⑤得到用户U对算法A感兴趣的概率为P(A|a):
P ( A | a ) = P ( a | A ) × P ( A ) P ( a )    ⑥
需要说明的是,上述公式⑥只关心公式中的分子部分,因为分母不依赖于C而且特征a的值是给定的,于是分母可以认为是一个常数。
先验概率P(A)不是一个分布函数,仅仅是一个值,它表达了样本空间中各个类的样本所占数量的比例。依据大数定理,当训练集中样本数量足够多且来自于样本空间的随机选取时,可以以训练集中各类样本所占的比例来估计P(A)的值。因此,在这里可以使P(A)等于算法A的暴露的推荐结果个数的平均值,公式如下:
P ( A ) = W A ‾ W A ‾ + W B ‾    ⑦
Figure BDA0000447912940000092
Figure BDA0000447912940000093
分别为算法A和算法B的平均评分;
P(a|A)是以某种(如正态分布)形式分布的概率密度函数,需要从训练集中样本特征的分布情况进行估计;估计方法可以分为参数估计和非参数估计。常用方法是概率的极大似然估计。
这里目标用户的年龄服从正态分布;因此,P(a|A)表示的公式如下:
P ( a | A ) = 1 2 π σ 2 2 Exp ( a - μ ) 2 2 σ 2    ⑧
其中,μ为对算法A感兴趣的用户的年龄的期望;
σ2为对算法A感兴趣的用户的年龄的方差。
年龄的期望和方差可以通过网站的历史数据训练得到,由公式⑦和公式⑧,可计算年龄为a的用户U的对算法A的感兴趣程度为P(a|A)×P(A)。同理,得到U对算法B的感兴趣程度。
上述是特征变量唯一的计算过程,更一般的情况,用户信息为多维特征变量。则根据朴素贝叶斯模型得到:
P ( C | F 1 , . . . , F n ) = P ( C ) × P ( F 1 , . . . , F n | C ) P ( F 1 , . . . , F n ) ∝ P ( C ) × P ( F 1 | C ) . . . P ( F n | C )    ⑨
上述公式⑨中的P(Fi|C|计算方法同公式⑧。
上述公式⑨前半段为朴素贝叶斯的一般形式,F1,…,Fn为多维度用户特征值;后半段是不考虑分母情况下的公式表示。
从以上可以看出,该朴素贝叶斯模型在用户信息较多的情况下,能综合各维度信息对用户的推荐算法倾向做出预测。在本发明中,采用机器学习的朴素贝叶斯模型训练学习隐性用户信息,此类信息往往是多维度的。通过该模型能够挖掘用户群隐性的推荐算法兴趣度,提高兴趣预测精准度。通过该模型计算的结果可以与贝叶斯平均算法结果进行融合或补充。朴素贝叶斯模型和贝叶斯平均算法都有坚实的数学基础和理论模型;并且贝叶斯平均算法和朴素贝叶斯模型在机器学习、概率统计、数据挖掘等领域得到了广泛的应用。
在本发明中,数据库中的数据分为单维度用户特征值和多维度用户特征值,特征值的选取由具体业务场景决定;然后根据选取的特征值再确定采用哪种方法对特征值进行学习。
需要说明的是:朴素贝叶斯算法适用的特征值数量不仅限于多维度信息。单维度特征值同样可以使用朴素贝叶斯模型预测用户对推荐算法的兴趣度。这里的单维度特征值是指用户信息的特征值,比较确切的说法是:在具体业务场景中,只提供单一维度的特征值,但是此用户本身存在很多其他要考虑的隐含信息;因此在实际应用中,采用朴素贝叶斯算法对其进行计算。在实际的应用中,特征值的数量一般都大于1。上述单维度用户特征值采用朴素贝叶斯算法的一个具体实施例如下:
预测房租时,可以将房屋面积作为单一特征值预测房租价格,房屋面积越大,租金越高。而在实际应用中,为了提高准确率,往往会将房屋的地理位置、房屋的设施、房屋的房间数等信息作为特征值进行计算。也就是说,房屋的地理位置、房屋的设施、房屋的房间数等是除房屋面积之外的预测房租的必要的隐含信息。其中,特征值选取的方法并不限于本发明实施例中所描述的选取方法,还可以根据具体的业务场景灵活选取特征值。
贝叶斯平均算法与采用单一维度特征值的朴素贝叶斯模型不同之处在于:贝叶斯平均算法的特征值一般为用户的行为数据或者用户的反馈信息。这类数据的特点是,存在冷启动并且不断的在增加,在数据量不足的情况下,预测结果不可信,因此本发明采用贝叶斯平均算法对数据进行修正,并且随着用户行为的不断增加使其不断的趋近真实兴趣喜好。朴素贝叶斯模型的特征值一般为用户的属性信息;如用户的年龄、性别等。针对此类信息,本发明采用机器学习中的朴素贝叶斯建立监督模型-用户兴趣模型,并根据训练后的模型,预测用户对算法的兴趣度。综合上述步骤S220和步骤S230,本发明在采用贝叶斯平均算法对单维度用户特征值进行计算的过程中,采用并行计算方法计算单维度用户的推荐算法兴趣度;并且,在采用朴素贝叶斯模型对多维度用户特征值进行计算的过程中,采用并行计算方法计算多维度用户的推荐算法兴趣度。
需要说明的是,为了提高个性化混合推荐技术的性能,本发明提出采用并行计算框架计算用户的算法兴趣倾向。其优势在于能够处理计算海量的系统信息。对于大多数在线系统,用户的数量和用户的行为信息是在不断增加的。用户的个性化兴趣建模是和用户的数量级密切相关的。如果用户数量过于庞大,会使计算用户的兴趣模型的时间成指数级增加,不能及时对用户的算法兴趣模型进行更新,直接影响推荐系统性能指标。
参数估计和其中的先验概率需要对系统中的用户数据进行统计。这些参数的获得都可以使用分布式并行的框架计算得到。
以上述朴素贝叶斯算法中的参数估计为例(公式⑧),用户对算法A的兴趣度的期望和方差可以通过并行计算框架实现;其公式如下:
μ A = ( W 1 + . . . + W k ) + ( W k + 1 + . . . + W 2 k ) + . . . . + ( W n - k + 1 + . . . + W n ) n
并行计算每组用户的兴趣度的和,合并阶段计算所有用户的兴趣度的期望,同理可得到标准差的分布式计算过程,公式如下:
σ A 2 = ( ( W 1 - μ A ) 2 + . . . + ( W k - μ A ) 2 ) + . . . + ( W n - μ A ) 2 n
并行计算每个用户的兴趣与期望差的平均和,再将结果做合并。采用分布式并行计算兴趣模型能保证高PV网站的用户兴趣模型的更新频率,从而敏锐的感知用户的兴趣变化。
在本发明中,通过并行计算能够解决模型训练和兴趣预测评估的时间瓶颈,提升个性化混合推荐技术的性能;能够通过并行计算训练模型也验证通过贝叶斯平均算法和朴素贝叶斯模型提出的建模方法的商业可行性。
S240:根据单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度,确定推荐列表,并将推荐列表推荐给所述数据库的用户。
具体地,可以通过混合推荐策略组件对单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度进行融合,获得数据库的用户对每个推荐算法的兴趣度,根据每个推荐算法的兴趣度获得每个推荐算法在所有推荐算法中的比例,确定推荐列表,将推荐列表推荐给数据库的用户。
其中,个性化混合推荐策略组件的主要功能是将两种兴趣模型的计算结果进行融合,得到用户对每个推荐算法的兴趣度,并通过下面的公式计算每个推荐算法所占推荐列表比例,其公式如下:
P i = W i Σ j = 1 n W j
其中,Wi为融合贝叶斯平均算法计算结果和朴素贝叶斯模型计算结果后的兴趣度。
需要说明的是,计算Wi的方法有很多,除了简单的线性模型外,也可采用回归模型、RBM等。最终,个性化混合推荐策略组件通过Pi确定推荐列表中推荐结果,展现给最终用户,完成推荐。
另外,需要说明的是,个性化混合推荐策略组件将两种计算结果进行融合,如何进行融合已经有相当成熟的技术,本领域技术人员都能了解,在这里不做详细的介绍。
在本发明中,通过贝叶斯平均算法和朴素贝叶斯模型获得用户的推荐算法兴趣度能够为用户提供个性化的混合推荐策略,增强推荐的个性化程度,提高推荐结果的精确度,并兼顾较好的算法召回率。与此同时,在推荐时,能够捕捉用户兴趣变化,自动的调整推荐策略,而不需要任何人为干预。能够避免因线上A/B测试造成的用户体验下降的情况。相反,随着用户数据的丰富用户算法兴趣模型能越来越懂用户;使推荐结果越来越切合用户的兴趣点,提高推荐的用户满意度。通过此方法,能够非常方便的统计推荐算法的实际效果,从而使推荐系统开发人员及时的修改和优化推荐算法,形成良性循环。
与上述方法相对应,本发明还提供一种混合推荐系统,图3示出了根据本发明实施例的混合推荐系统逻辑结构。
如图3所示,本发明提供的混合推荐系统300包括数据库区分单元310、贝叶斯平均算法计算单元320、朴素贝叶斯模型计算单元330和算法推荐单元340。
其中,数据库区分单元310用于将数据库中的用户数据分为单维度用户特征值和多维度用户特征值。
贝叶斯平均算法计算单元320用于采用贝叶斯平均算法对单维度用户特征值进行计算,获得单维度用户的推荐算法兴趣度。
朴素贝叶斯模型计算单元330用于采用朴素贝叶斯模型对多维度用户特征值进行计算,建立多维度用户兴趣模型,并对多维度用户兴趣模型进行训练,获得多维度用户的推荐算法兴趣度。
算法推荐单元340用于根据单维度用户的推荐算法兴趣度和多维度用户的推荐算法兴趣度,确定推荐列表,并将推荐列表推荐给数据库的用户。
算法推荐单元340进一步包括兴趣度获取单元341和推荐列表确定单元342。
其中,兴趣度获取单元341用于通过混合推荐策略组件对所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度进行融合,获得所述数据库的用户对每个推荐算法的兴趣度。
推荐列表确定单元342用于根据每个推荐算法的兴趣度获得每个推荐算法在所有推荐算法中的比例,确定推荐列表。
其中,贝叶斯平均算法计算单元320在对单维度用户特征值进行计算的过程中,采用并行计算方法计算单维度用户的推荐算法兴趣度;朴素贝叶斯模型计算单元在对多维度用户特征值进行计算的过程中,采用并行计算方法计算多维度用户的推荐算法兴趣度。
其中,贝叶斯平均算法计算单元330在采用贝叶斯平均算法对单维度用户特征值进行计算的过程中,
贝叶斯平均算法公式为:
X ‾ = C × m + Σ i = 1 n x i n + C
其中,C为一个自行设定的常数;
m为数据库中项目的平均值;
n为所述项目的数据数量;
x为每个数据的值;
上述公式中,m为先验概率,每个x的值都是一个调整因子,随着n的增加,所述项目的值
Figure BDA0000447912940000132
将不断趋向其正确的值。
其中,朴素贝叶斯模型计算单元在采用朴素贝叶斯模型对多维度用户特征值进行计算的过程中,
朴素贝叶斯模型公式为:
P ( C | X ) = P ( X | C ) × P ( C ) P ( X )
其中,C为目标事件;X为特征值;
P(C|X)为X条件下C发生的概率;
P(X|C)为C条件下X发生的概率;
P(C)为C的概率;
P(X)为X的概率。
通过上述实施方式可以看出,本发明提供的混合推荐方法及系统,能够计算评估不同用户的推荐算法兴趣度,通过采用贝叶斯平均算法和朴素贝叶斯模型获得用户的推荐算法兴趣度,提高用户的算法兴趣预测精准度;通过并行计算能够缩短训练用户兴趣模型的时间和兴趣预测评估的时间。
如上参照附图以示例的方式描述了根据本发明提出的混合推荐方法及系统。但是,本领域技术人员应当理解,对于上述本发明所提出的混合推荐方法及系统,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (10)

1.一种混合推荐方法,包括:
将数据库中的用户数据分为单维度用户特征值和多维度用户特征值;
采用贝叶斯平均算法对所述单维度用户特征值进行计算,获得所述单维度用户的推荐算法兴趣度;以及,
采用朴素贝叶斯模型对所述多维度用户特征值进行计算,建立多维度用户兴趣模型,并对所述多维度用户兴趣模型进行训练,获得所述多维度用户的推荐算法兴趣度;
根据所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度,确定推荐列表,并将所述推荐列表推荐给所述数据库的用户。
2.如权利要求1所述的混合推荐方法,其中,在根据所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度确定推荐列表的过程中,
通过混合推荐策略组件对所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度进行融合,获得所述数据库的用户对每个推荐算法的兴趣度;
根据所述每个推荐算法的兴趣度获得每个推荐算法在所有推荐算法中的比例,确定推荐列表。
3.如权利要求1所述的混合推荐方法,其中,
在采用贝叶斯平均算法对所述单维度用户特征值进行计算的过程中,采用并行计算方法计算所述单维度用户的推荐算法兴趣度;
在采用朴素贝叶斯模型对所述多维度用户特征值进行计算的过程中,采用并行计算方法计算所述多维度用户的推荐算法兴趣度。
4.如权利要求1所述的混合推荐方法,在采用贝叶斯平均算法对所述单维度用户特征值进行计算的过程中,
所述贝叶斯平均算法公式为:
X ‾ = C × m + Σ i = 1 n x i n + C
其中,C为一个自行设定的常数;
m为数据库中项目的平均值;
n为所述项目的数据数量;
x为每个数据的值;
上述公式中,m为先验概率,每个x的值都是一个调整因子,随着n的增加,所述项目的值
Figure FDA0000447912930000022
将不断趋向其正确的值。
5.如权利要求1所述的混合推荐方法,在采用朴素贝叶斯模型对所述多维度用户特征值进行计算的过程中,
所述朴素贝叶斯模型公式为:
P ( C | X ) = P ( X | C ) × P ( C ) P ( X )
其中,C为目标事件;X为特征值;
P(C|X)为X条件下C发生的概率;
P(X|C)为C条件下X发生的概率;
P(C)为C的概率;
P(X)为X的概率。
6.一种混合推荐系统,包括:
数据库区分单元,用于将数据库中的用户数据分为单维度用户特征值和多维度用户特征值;
贝叶斯平均算法计算单元,用于采用贝叶斯平均算法对所述单维度用户特征值进行计算,获得所述单维度用户的推荐算法兴趣度;
朴素贝叶斯模型计算单元,用于采用朴素贝叶斯模型对所述多维度用户特征值进行计算,建立多维度用户兴趣模型,并对所述多维度用户兴趣模型进行训练,获得所述多维度用户的推荐算法兴趣度;
算法推荐单元,用于根据所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度,确定推荐列表,并将所述推荐列表推荐给所述数据库的用户。
7.如权利要求6所述的混合推荐方系统,其中,所述算法推荐单元进一步包括:
兴趣度获取单元,用于通过混合推荐策略组件对所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度进行融合,获得所述数据库的用户对每个推荐算法的兴趣度;
推荐列表确定单元,用于根据所述每个推荐算法的兴趣度获得每个推荐算法在所有推荐算法中的比例,确定推荐列表。
8.如权利要求6所述的混合推荐方系统,其中,
所述贝叶斯平均算法计算单元在对所述单维度用户特征值进行计算的过程中,采用并行计算方法计算所述单维度用户的推荐算法兴趣度;
所述朴素贝叶斯模型计算单元在对所述多维度用户特征值进行计算的过程中,采用并行计算方法计算所述多维度用户的推荐算法兴趣度。
9.如权利要求6所述的混合推荐系统,
在所述贝叶斯平均算法计算单元采用贝叶斯平均算法对所述单维度用户特征值进行计算的过程中,
所述贝叶斯平均算法公式为:
X ‾ = C × m + Σ i = 1 n x i n + C
其中,C为一个自行设定的常数;
m为数据库中项目的平均值;
n为所述项目的数据数量;
x为每个数据的值;
上述公式中,m为先验概率,每个x的值都是一个调整因子,随着n的增加,所述项目的值
Figure FDA0000447912930000032
将不断趋向其正确的值。
10.如权利要求6所述的混合推荐系统,
所述朴素贝叶斯模型计算单元在采用朴素贝叶斯模型对所述多维度用户特征值进行计算的过程中,
所述朴素贝叶斯模型公式为:
P ( C | X ) = P ( X | C ) × P ( C ) P ( X )
其中,其中,C为目标事件;X为特征值;
P(C|X)为X条件下C发生的概率;
P(X|C)为C条件下X发生的概率;
P(C)为C的概率;
P(X)为X的概率。
CN201310737345.0A 2013-12-27 2013-12-27 混合推荐方法及系统 Active CN103744917B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310737345.0A CN103744917B (zh) 2013-12-27 2013-12-27 混合推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310737345.0A CN103744917B (zh) 2013-12-27 2013-12-27 混合推荐方法及系统

Publications (2)

Publication Number Publication Date
CN103744917A true CN103744917A (zh) 2014-04-23
CN103744917B CN103744917B (zh) 2018-04-06

Family

ID=50501935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310737345.0A Active CN103744917B (zh) 2013-12-27 2013-12-27 混合推荐方法及系统

Country Status (1)

Country Link
CN (1) CN103744917B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104205100A (zh) * 2014-06-05 2014-12-10 深圳市推想大数据信息技术有限公司 一种估算用户的隐性特征分布的方法及装置
CN105913286A (zh) * 2016-05-16 2016-08-31 达而观信息科技(上海)有限公司 一种自动融合多种个性化推荐模型的方法
CN106296242A (zh) * 2015-05-22 2017-01-04 苏宁云商集团股份有限公司 一种用于电子商务中商品推荐列表的生成方法及生成系统
CN106980629A (zh) * 2016-01-19 2017-07-25 华为技术有限公司 一种网络资源推荐方法及计算机设备
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108876537A (zh) * 2018-06-15 2018-11-23 重庆知遨科技有限公司 一种用于网上商场系统的混合推荐方法
CN110070391A (zh) * 2019-04-17 2019-07-30 同盾控股有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN111209486A (zh) * 2019-12-19 2020-05-29 杭州安恒信息技术股份有限公司 一种混合推荐规则的管理平台数据推荐方法
CN111861605A (zh) * 2019-04-28 2020-10-30 阿里巴巴集团控股有限公司 业务对象推荐方法
CN112395552A (zh) * 2019-08-15 2021-02-23 腾讯科技(深圳)有限公司 数据处理方法以及装置
CN109936498B (zh) * 2019-02-26 2021-11-19 企知道网络技术有限公司 即时通讯消息提示的全排序方法
CN114254193A (zh) * 2021-12-20 2022-03-29 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备及存储介质
WO2022213662A1 (zh) * 2021-04-06 2022-10-13 深圳先进技术研究院 应用推荐方法、系统、终端以及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271558A (zh) * 2008-05-16 2008-09-24 华东师范大学 基于上下文信息的多策略商品推荐系统
CN103309866A (zh) * 2012-03-09 2013-09-18 华为技术有限公司 生成推荐结果的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271558A (zh) * 2008-05-16 2008-09-24 华东师范大学 基于上下文信息的多策略商品推荐系统
CN103309866A (zh) * 2012-03-09 2013-09-18 华为技术有限公司 生成推荐结果的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
向志明: "面向海量用户行为数据的并行个性化推荐算法的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
阮一峰: "基于用户投票的排名算法(六):贝叶斯平均", 《SONGSHUHUI.NET/ARCHIVES/67443》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015184619A1 (zh) * 2014-06-05 2015-12-10 深圳市推想大数据信息技术有限公司 一种估算用户的隐性特征分布的方法及装置
CN104205100B (zh) * 2014-06-05 2018-02-02 北京推想科技有限公司 一种估算用户的隐性特征分布的方法及装置
CN104205100A (zh) * 2014-06-05 2014-12-10 深圳市推想大数据信息技术有限公司 一种估算用户的隐性特征分布的方法及装置
CN106296242A (zh) * 2015-05-22 2017-01-04 苏宁云商集团股份有限公司 一种用于电子商务中商品推荐列表的生成方法及生成系统
US10839032B2 (en) 2016-01-19 2020-11-17 Huawei Technologies Co., Ltd. Network resource recommendation method and computer device
CN106980629A (zh) * 2016-01-19 2017-07-25 华为技术有限公司 一种网络资源推荐方法及计算机设备
CN105913286A (zh) * 2016-05-16 2016-08-31 达而观信息科技(上海)有限公司 一种自动融合多种个性化推荐模型的方法
CN105913286B (zh) * 2016-05-16 2020-02-11 达而观信息科技(上海)有限公司 一种自动融合多种个性化推荐模型的方法
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108629608B (zh) * 2017-03-22 2023-02-24 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108876537B (zh) * 2018-06-15 2021-08-17 上海百秋电子商务有限公司 一种用于网上商场系统的混合推荐方法
CN108876537A (zh) * 2018-06-15 2018-11-23 重庆知遨科技有限公司 一种用于网上商场系统的混合推荐方法
CN109936498B (zh) * 2019-02-26 2021-11-19 企知道网络技术有限公司 即时通讯消息提示的全排序方法
CN110070391B (zh) * 2019-04-17 2020-06-19 同盾控股有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN110070391A (zh) * 2019-04-17 2019-07-30 同盾控股有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN111861605A (zh) * 2019-04-28 2020-10-30 阿里巴巴集团控股有限公司 业务对象推荐方法
CN112395552A (zh) * 2019-08-15 2021-02-23 腾讯科技(深圳)有限公司 数据处理方法以及装置
CN112395552B (zh) * 2019-08-15 2024-07-02 腾讯科技(深圳)有限公司 数据处理方法以及装置
CN111209486A (zh) * 2019-12-19 2020-05-29 杭州安恒信息技术股份有限公司 一种混合推荐规则的管理平台数据推荐方法
CN111209486B (zh) * 2019-12-19 2023-04-11 杭州安恒信息技术股份有限公司 一种混合推荐规则的管理平台数据推荐方法
WO2022213662A1 (zh) * 2021-04-06 2022-10-13 深圳先进技术研究院 应用推荐方法、系统、终端以及存储介质
CN114254193A (zh) * 2021-12-20 2022-03-29 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103744917B (zh) 2018-04-06

Similar Documents

Publication Publication Date Title
CN103744917A (zh) 混合推荐方法及系统
US8572011B1 (en) Outcome estimation models trained using regression and ranking techniques
Wang et al. Opportunity model for e-commerce recommendation: right product; right time
US8296253B2 (en) Managing online content based on its predicted popularity
US8744989B1 (en) Ranking and vote scheduling using statistical confidence intervals
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
US20090037410A1 (en) System and method for predicting clickthrough rates and relevance
CN104391849A (zh) 融入时间上下文信息的协同过滤推荐方法
CN105824912A (zh) 基于用户画像的个性化推荐方法和装置
CN109543840B (zh) 一种基于多维分类强化学习的动态推荐系统设计方法
Fu et al. User preference learning with multiple information fusion for restaurant recommendation
CN103377250A (zh) 基于邻域的top-k推荐方法
US9727653B2 (en) System and method for identifying and ranking user preferences
CN109635206B (zh) 融合隐式反馈和用户社会地位的个性化推荐方法及系统
Goodwin et al. The challenges of pre-launch forecasting of adoption time series for new durable products
CN101354714A (zh) 一种基于概率潜在语义分析的问题推荐方法
US7895149B2 (en) System for opinion reconciliation
CN103309894A (zh) 基于用户属性的搜索实现方法及系统
Fung et al. A fuzzy expected value-based goal programing model for product planning using quality function deployment
CN103761266A (zh) 基于多级逻辑回归的点击率预测方法和系统
CN110520886B (zh) 用于消除媒体混合建模中的偏差的系统和方法
Cheng et al. Understanding the impact of individual users’ rating characteristics on the predictive accuracy of recommender systems
Domarchi et al. Electric vehicle forecasts: a review of models and methods including diffusion and substitution effects
CN109636184B (zh) 一种品牌的账号资产的评估方法及系统
Song et al. Evaluation model of click rate of electronic commerce advertising based on fuzzy genetic algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant