CN107357847B - 数据处理方法及其装置 - Google Patents
数据处理方法及其装置 Download PDFInfo
- Publication number
- CN107357847B CN107357847B CN201710498852.1A CN201710498852A CN107357847B CN 107357847 B CN107357847 B CN 107357847B CN 201710498852 A CN201710498852 A CN 201710498852A CN 107357847 B CN107357847 B CN 107357847B
- Authority
- CN
- China
- Prior art keywords
- operation data
- actual operation
- target user
- expected
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种数据处理方法,包括:获取目标用户对指定品类的第一实际操作数据;获取目标用户对指定品类的期望操作数据,其中,期望操作数据用于作为衡量目标用户对指定品类的兴趣偏差的参照数据,且期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,指定品类属于多个品类中的一种;以及根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差。本公开还提供了一种数据处理装置、计算机可读存储介质、数据处理系统。
Description
技术领域
本公开涉及数据处理领域,更具体地,涉及一种数据处理方法及其装置。
背景技术
随着人工智能、自动控制和计算机技术的快速发展,数据处理及分析的能力对电子商务的影响变得越来越重要。例如,在电商领域,面对海量的商品数据和用户数据,数据分析的精准性对于商家营销,客户交易决策有着非常重要的影响。
在实现本发明构思的过程中,发明人发现现有技术中至少存在如下问题:面对海量的商品分类(简称为品类)数据和用户数据,现有技术利用单变量统计来衡量数据的有效性,导致数据分析精准度低。
发明内容
有鉴于此,本公开提供了一种能够提高数据分析精准度的数据处理方法及其装置和系统、以及计算机可读存储介质。
本公开的一个方面提供了一种数据处理方法,包括:获取目标用户对指定品类的第一实际操作数据;获取上述目标用户对上述指定品类的期望操作数据,其中,上述期望操作数据用于作为衡量上述目标用户对上述指定品类的兴趣偏差的参照数据,且上述期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,上述指定品类属于上述多个品类中的一种;以及根据上述第一实际操作数据和上述期望操作数据,确定上述目标用户对上述指定品类的兴趣偏差。
根据本公开的实施例,获取上述目标用户对上述指定品类的期望操作数据包括:确定事件发生的概率,其中,上述事件为上述多个用户对上述指定品类进行操作;获取第二实际操作数据,其中,上述第二实际操作数据为上述目标用户对上述多个品类进行操作时产生的实际操作数据的总和;以及根据上述第二实际操作数据和上述事件发生的概率,确定上述期望操作数据。
根据本公开的实施例,确定事件发生的概率包括:获取第三实际操作数据,其中,上述第三实际操作数据包括上述多个用户对上述多个品类进行操作时产生的实际操作数据的总和;获取第四实际操作数据,其中,上述第四实际操作数据包括上述多个用户对上述指定品类进行操作时产生的实际操作数据的总和;以及确定上述第四实际操作数据占上述第三实际操作数据比值,得到上述事件发生的概率。
根据本公开的实施例,根据上述第一实际操作数据和上述期望操作数据,确定上述目标用户对上述指定品类的兴趣偏差包括:判断上述第一实际操作数据对应的数值是否大于上述期望操作数据对应的数值;以及若是,则确定上述目标用户对上述指定品类感兴趣。
根据本公开的实施例,根据上述第一实际操作数据和上述期望操作数据,确定上述目标用户对上述指定品类的兴趣偏差包括:根据上述第一实际操作数据和上述期望操作数据计算上述目标用户对上述指定品类的兴趣偏差值;以及根据上述兴趣偏差值确定上述目标用户对上述指定品类的兴趣偏差。
根据本公开的实施例,根据上述第一实际操作数据和上述期望操作数据计算上述目标用户对上述指定品类的兴趣偏差值包括:根据上述第一实际操作数据和上述期望操作数据确定调节系数,上述调节系数用于调节上述兴趣偏差值;以及根据上述第一实际操作数据、上述期望操作数据和上述调节系数计算上述目标用户对上述指定品类的兴趣偏差值。
根据本公开的实施例,在根据上述第一实际操作数据和上述期望操作数据,确定上述目标用户对上述指定品类的兴趣偏差之后,上述方法还包括:判断确定出的上述目标用户对上述指定品类的兴趣偏差是否符合预期指标;以及若否,则滤除上述第一实际操作数据。
本公开的另一个方面提供了一种数据处理装置,包括:第一获取模块,用于获取目标用户对指定品类的第一实际操作数据;第二获取模块,用于获取上述目标用户对上述指定品类的期望操作数据,其中,上述期望操作数据用于作为衡量上述目标用户对上述指定品类的兴趣偏差的参照数据,且上述期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,上述指定品类属于上述多个品类中的一种;以及第一确定模块,用于根据上述第一实际操作数据和上述期望操作数据,确定上述目标用户对上述指定品类的兴趣偏差。
根据本公开的实施例,上述第二获取模块包括:第一确定单元,用于确定事件发生的概率,其中,上述事件为上述多个用户对上述指定品类进行操作;获取单元,用于获取第二实际操作数据,其中,上述第二实际操作数据为上述目标用户对上述多个品类进行操作时产生的实际操作数据的总和;以及第二确定单元,用于根据上述第二实际操作数据和上述事件发生的概率,确定上述期望操作数据。
根据本公开的实施例,上述第一确定单元包括:第一获取子单元,用于获取第三实际操作数据,其中,上述第三实际操作数据包括上述多个用户对上述多个品类进行操作时产生的实际操作数据的总和;第二获取子单元,用于获取第四实际操作数据,其中,上述第四实际操作数据包括上述多个用户对上述指定品类进行操作时产生的实际操作数据的总和;以及第一确定子单元,用于确定上述第四实际操作数据占上述第三实际操作数据比值,得到上述事件发生的概率。
根据本公开的实施例,上述第一确定模块包括:判断单元,用于判断上述第一实际操作数据对应的数值是否大于上述期望操作数据对应的数值;以及第二确定单元,用于在上述第一实际操作数据对应的数值大于上述期望操作数据对应的数值的情况下,确定上述目标用户对上述指定品类感兴趣。
根据本公开的实施例,上述第一确定模块包括:计算单元,用于根据上述第一实际操作数据和上述期望操作数据计算上述目标用户对上述指定品类的兴趣偏差值;以及第三确定单元,用于根据上述兴趣偏差值确定上述目标用户对上述指定品类的兴趣偏差。
根据本公开的实施例,上述计算单元包括:第二确定子单元,用于根据上述第一实际操作数据和上述期望操作数据确定调节系数,上述调节系数用于调节上述兴趣偏差值;以及计算子单元,用于根据上述第一实际操作数据、上述期望操作数据和上述调节系数计算上述目标用户对上述指定品类的兴趣偏差值。
根据本公开的实施例,上述装置还包括:判断模块,用于在根据上述第一实际操作数据和上述期望操作数据,确定上述目标用户对上述指定品类的兴趣偏差之后,判断确定出的上述目标用户对上述指定品类的兴趣偏差是否符合预期指标;以及过滤模块,用于在判断出的上述目标用户对上述指定品类的兴趣偏差符合预期指标的情况下,滤除上述第一实际操作数据。
本公开的另一个方面提供了一种计算机可读存储介质,其上存储有可执行指令,上述指令被处理器执行时用于实现上述的数据处理方法。
本公开的另一个方面提供了一种数据处理系统,包括:上述的计算机可读存储介质;以及上述处理器。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,由于将用户对指定品类的实际操作数据与期望操作数据进行比较,其中,该期望操作数据与多个用户对多个品类的操作数据相关,在这种情况下,期望操作数据由于可以随着多个用户对不同品类的操作数据的变化而变化,即期望操作数据是可以动态变化的,因此,可以至少部分地解决现有技术中数据分析精准度低而导致不能准确确定用户是否真正对指定品类感兴趣的问题,进而实现提高数据分析精准度的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了可以应用本公开的数据处理方法及其装置的示例性系统架构;
图2示意性示出了根据本公开实施例的数据处理方法的流程图;
图3A示意性示出了根据本公开另一实施例的数据处理方法的流程图;
图3B示意性示出了根据本公开另一实施例的数据处理方法的流程图;
图4示意性示出了根据本公开实施例的数据处理装置的框图;以及
图5示意性示出了应用本公开实施例的数据处理方法的计算机系统的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
本公开的实施例提供了一种数据处理方法及其装置。其中,该方法包括:数据获取阶段和兴趣偏差确认阶段。在数据获取阶段,需要获取目标用户对指定品类的第一实际操作数据和该目标用户对该指定品类的期望操作数据,其中,期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,用于作为衡量目标用户对指定品类的兴趣偏差的参照数据,且指定品类属于多个品类中的一种。在兴趣偏差确认阶段,需要根据获取的第一实际操作数据和期望操作数据,确定该目标用户对该指定品类的兴趣偏差,即确定该目标用户是否对该指定品类感兴趣。
图1示意性示出了可以应用本公开的数据处理方法及其装置的示例性系统架构。
如图1所示,系统架构100可以包括终端设备101、终端设备102、终端设备103,网络104和服务器105。网络104用以在终端设备101、终端设备102、终端设备103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、终端设备102、终端设备103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、终端设备102、终端设备103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等,在此不再赘述。
终端设备101、终端设备102、终端设备103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、终端设备102、终端设备103所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息等等)反馈给终端设备。
需要说明的是,本公开实施例所提供的数据处理的方法可以由服务器105执行,也可以由不同于服务器105的另外一个服务器或者一个服务器集群执行。相应地,用于数据处理的装置可以设置于服务器105中,也可以设置与服务器105以外的另一个服务器或者一个服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
目前,越来越多的用户会选择在电商平台或者其他交易平台上进行交易,而在交易的过程中,系统会产生海量的交易数据,例如,在购物网站上,用户面对不同分类的商品,会对各商品分类(即品类)执行点击浏览、评论、购买等操作,执行这些操作时,系统会产生海量的操作数据。面对海量的操作数据,对于商家而言,如何处理这些数据显得意义重大。
图2示意性示出了根据本公开实施例的数据处理方法的流程图。
如图2所示,该方法可以包括操作S201~操作S203,其中:
操作S201,获取目标用户对指定品类的第一实际操作数据。
根据本公开的实施例,在对数据进行处理之前,先获取目标用户对指定品类的操作数据,其中,目标用户可以是任意指定的用户,如可以登陆某交易网站的用户。指定品类可以是显示在网页上的品类。例如,用户A在某电商购物网站上购物时,浏览到网页上存在不同的商品分类,如生鲜、服装、鞋以及包等,用户A点击“服装”这一品类后,可以购买或者收藏该“服装”品类下的相关服装,也可以将该“服装”品类下的相关服装对应的信息推送给其他好友等等。
需要说明的是,在本公开实施例中,对商品分类不作限定,它可以包括但不限于不同种类的商品,或者同一种类商品在不同维度上的分类。例如,商品为短袖时,可以分成红色、白色和黑色等不同颜色的分类。另外,商品分类还可以是在交易网站中超市,优惠券等等其他分类。操作数据可以是目标用户对指定品类的点击量,具体地,如表1所示。
表1
用户ID | 品类id | 点击量 |
A | 母婴 | 100 |
B | 图书 | 50 |
... | ... | ... |
N | 品类n | m |
表1中的用户ID用于识别每一个用户,作为用户的唯一标识。品类id可以是各个商品分类的数据标识。点击量是指用户在某一个商品分类下面产生的操作数据量,通常情况下可以通过数据条数据计算,例如,用户A在母婴品类下面的浏览量为100条。表1可以作为用于数据分析的一个数据集合,包括N个用户,n种品类,以及点击量。需要说明的是,作为用于数据分析的数据集合可以包括一个或多个,例如,用户A对图书的点击量,对其他品类的点击量作为用于数据分析的数据集合。此外,操作数据还可以是对品类的评论条数等其他操作数据,在此不再赘述。
操作S202,获取目标用户对指定品类的期望操作数据,其中,期望操作数据用于作为衡量目标用户对指定品类的兴趣偏差的参照数据,且期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,指定品类属于多个品类中的一种。
根据本公开的实施例,期望操作数据用于作为衡量目标用户对某一指定品类的兴趣偏差的参照数据,兴趣偏差是指目标用户对某一类指定品类商品的喜好程度。例如,在交易网站上,具有多个用户对网站上的商品进行了操作,目标用户对某一商品是否感兴趣,可以通过兴趣偏差来衡量。期望操作数据与网站上的多个用户对多个品类操作产生的数据是相关的,也就是说,期望操作数据随着多个用户对多个品类操作产生的数据变化。可见,期望操作数据与多个用户产生的数据有关,是变化的。需要说明的是,目标用户可以是多个用户中的一员,也可以不是多个用户中的一员,多个用户可以是网站上的所有用户,也可以是部分用户。
操作S203,根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差。
根据本公开的实施例,可以根据目标用户对指定品类的第一实际操作数据与和多个用户对多个品类操作产生的数据相关的期望操作数据,确定目标用户对指定品类是否感兴趣。例如,对于新品类或者不长常见品类,用户量可能相对稀疏,这种情况下对用户的兴趣偏差进行衡量时,可能误认为用户对该品类不感兴趣。例如,对于A类不常见的商品而言,一旦有用户关注,即使其仅仅浏览了几次,该用户对该商品也感兴趣。如果依照现有技术提供的方案,将人为设定的预设值与实际操作数据比较,而不是根据实际情况计算得到的如期望值进行比较,因而很可能由于预设值设置不当(如过大)而导致难以发觉该用户的兴趣点。
根据本公开的实施例,由于根据用户对指定品类的实际操作数据与期望操作数据,确定目标用户对指定品类的兴趣偏差,其中,该期望操作数据与多个用户对多个品类的操作数据相关。在这种情况下,期望操作数据是动态变化的,随着多个用户对不同品类的操作数据的变化而变化。并且,对用户兴趣偏好的分析方法不是采用单变量统计某一指定品类的实际操作数据,而是获取用户对指定品类的实际操作数据与期望操作数据。因此,可以至少部分地解决现有技术中数据分析精准度低,导致不能准确确定用户是否对指定品类感兴趣的问题,进而可以实现提高数据分析精准度的技术效果。
下面参考图3A和图3B,结合具体实施例对图2所示的方法做进一步说明。
图3A示意性示出了根据本公开另一实施例的数据处理方法的流程图。如图3A所示,该方法包括操作S301~操作S305,其中:
操作S301,获取目标用户对指定品类的第一实际操作数据。
操作S302,确定事件发生的概率,其中,上述事件为多个用户对指定品类进行操作。
操作S303,获取第二实际操作数据,其中,第二实际操作数据为目标用户对多个品类进行操作时产生的实际操作数据的总和。
操作S304,根据第二实际操作数据和事件发生的概率,确定期望操作数据。
操作S305,根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差。
根据本公开的实施例,其中,确定事件发生的概率是确定用户群中多个用户对指定品类进行操作的概率,也即,多个用户在网站上对指定品类进行操作的可能性通过统计学概率的方式进行衡量。多个用户可以是用户群中部分用户,也可以是用户群中所有的用户。例如,用户群中有用户A、用户B、用户C和用户D,购物网站上有图书和服装两种品类,确定多个用户对指定品类进行操作的概率可以是用户群中的用户A、用户B、用户C对服装进行操作的概率,目标用户可以是用户D,可以是用户A,当然还可以是用户A、用户B、用户C和用户D之外的其他用户。
获取目标用户对多个品类进行操作时产生的实际操作数据的总和,如上所述,例如,目标用户可以是用户D,对图书进行操作的实际操作数据为100次和对服装进行操作的实际操作数据为200次,因此,目标用户D对多个品类进行操作时产生的实际操作数据的总和为300次。根据目标用户D对多个品类进行操作时产生的实际操作数据的总和与用户群中多个用户对指定品类进行操作的概率可以确定期望操作数据。进而,在获取到期望操作数据和目标用户的实际操作数据后,根据目标用户的实际操作数据和期望操作数据,确定目标用户对指定品类是否感兴趣。
根据本公开的实施例,由于现有技术是采用单变量或者单一的统计方法对数据进行分析,在这种情况下,当出现相同数据时难以区分用户是否都对某一分类感兴趣,例如用户A和用户B对同一商品同样都点击2次,在这种情况下,就难以衡量这两用户的真实兴趣偏差。根据本公开的实施例,可以将目标用户对多个分类的操作数据(即第二实际操作数据)与多个用户对指定品类进行操作的概率相乘,得到的期望操作数据。由于同时考虑了目标用户对多个分类的操作数据以及多个用户对指定品类进行操作的概率,将得到的期望操作数据与实际的操作数据相比较,因而可以解决多个用户同样对同一商品点击相同次数时,无法衡量多个用户的真实的兴趣偏差的问题。
根据本公开的实施例,其中,确定事件发生的概率包括:获取第三实际操作数据,其中,第三实际操作数据包括多个用户对多个品类进行操作时产生的实际操作数据的总和;获取第四实际操作数据,其中,第四实际操作数据包括多个用户对指定品类进行操作时产生的实际操作数据的总和;以及确定第四实际操作数据占第三实际操作数据比值,得到事件发生的概率。
根据本公开的实施例,为了确定用户群中多个用户对某一指定品类的进行操作的概率,该概率可以作为用户群中的每一个用户对指定品类进行操作的可能性量化指标,每一个用户可以是多个用户中的一个,也可以多个用户以外的其他用户,当然也可以是目标用户。概率可以是多个用户对指定品类进行操作时产生的实际操作数据的总和占多个用户对上述多个品类进行操作时产生的实际操作数据的总和的比例。例如,用户群中有N个用户,网页上显示有n个品类,N个用户在网页上显示的n个品类进行操作得到的操作数据,可以采用聚合方法求N个用户中的多个或全部用户在网页上显示的n个品类(多个或全部品类)进行操作得到的操作数据总和,即第三实际操作数据。第四实际操作数据可以是采用聚合方法求N个用户中的多个或全部用户在网页上显示的指定品类进行操作得到的操作数据总和。
具体地,例如,计算用户群i中的用户在品类j中进行操作的概率Pij,通过概率可以反映用户对品类j发生操作的可能性。
Pij=Nj/Nall
其中,Nj为用户群中所有用户在品类j上进行操作产生的数据量,从而从量级上反馈品类j的热度;Nall为用户群中所有用户在所有品类上进行操作产生的数据量。通过某一个品类的数据量在所有品类的数据量中的占比,衡量用户在该品类上进行操作的活跃度。
根据本公开的实施例,采用上述方法得到的概率,可以用于计算期望操作数据,具体地,例如,将目标用户对多个品类进行操作时产生的实际操作数据的总和与概率相乘,得到目标用户相对于整体用户群在指定品类下产生的标准期望数据量,即期望操作数据。通过上述方式,期望操作数据和整体所有或部分用户在指定品类下进行操作的概率紧密相关,同时也考虑了目标用户在网站进行操作的实际操作数据。
根据本公开的实施例,其中,根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差包括:判断第一实际操作数据对应的数值是否大于期望操作数据对应的数值;以及若是,则确定目标用户对指定品类感兴趣。
根据本公开的实施例,比较目标用户对指定品类的操作数据与期望操作数据,在目标用户对指定品类的操作数据大于期望操作数据对应的数值的情况下,可以判断目标用户对指定品类感兴趣。在目标用户对指定品类的操作数据小于期望操作数据对应的数值的情况下,可以判断目标用户对指定品类不感兴趣,或者兴趣程度不高。
根据本公开的实施例,其中,根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差包括:根据第一实际操作数据和期望操作数据计算目标用户对指定品类的兴趣偏差值;以及根据兴趣偏差值确定目标用户对指定品类的兴趣偏差。
用户群中的用户对不同的品类进行操作时,对每一个品类的操作次数都增加的情况下,如果仅仅分析用户对指定品类的操作是否大于人为预设的值,显然不能代表该用户是否对指定品类感兴趣,根据本公开实施例,由于是将目标用户数据与期望操作数据进行参考对比,期望操作数据是多个用户群对多个品类的操作数据有关,因此解决了目标用户与群体同时数据增长而导致分析用户对指定品类是否感兴趣的精准低的问题。
根据本公开的实施例,由于用户对指定品类的实际操作数据不仅可以是点击量,也可以是评论数,还可以是用户对指定品类进行评论的内容,相应的期望操作数据也可以是点击量,评论数,还可以是用户对指定品类进行评论的内容。当操作数据为对指定品类进行评论的内容时,可以根据评论的内容之间的语义关系确定用户是否对指定品类是否感兴趣。当操作数据为对指定品类进行操作的点击量等其他量化数据时,可以根据第一实际操作数据和期望操作数据计算目标用户对指定品类的兴趣偏差值,从而量化用户对对指定品类是否感兴趣。
根据本公开的实施例,其中,根据第一实际操作数据和期望操作数据计算目标用户对指定品类的兴趣偏差值包括:根据第一实际操作数据和期望操作数据确定调节系数,调节系数用于调节兴趣偏差值;以及根据第一实际操作数据、期望操作数据和调节系数计算目标用户对指定品类的兴趣偏差值。
根据本公开的实施例,具体地,例如,通过兴趣偏差值εij衡量目标用户i对指定品类j的兴趣偏差,公式如下:
其中K为调节系数,可选地,当第一实际操作数据Nij较大或者期望操作数据Eij较小等情况进行相对的调节数值,通常情况下,调节系数K的经验值可以取0.22。上述公式的核心判断依据为Nij和Eij,当εij>1,且对调节系数K不进行调节的情况下,等同于logNij≥logEij+其中可以用于调整期望操作数据Eij数值太小造成的显著性比较不明显情况,随着Eij的增大,的调整可以忽略。其中,显著性不明显是指用户对商品的感兴趣程度不明显。
例如,通过兴趣偏差值γij作为目标用户i对指定品类j的兴趣分数,公式如下:
兴趣偏差值γij作为目标用户i对指定品类j的兴趣度量,分值越高代表目标用户i对指定品类j的兴趣度越高。可以通过兴趣偏差值γii进行倒序排列对用户群进行筛选。
根据本公开的实施例,由于在大规模的机器学习中,特征数据和算法对模型的识别能力同等重要。用户对某个特定品类的兴趣偏好在算法模型上有较好的分辨能力,可以直接作为特征值传递给算法模型。通过量化用户对指定品类的兴趣偏差,可以作为用户对指定品类的兴趣偏差程度度量,从而为机器学习,线上用户交易时的广告推荐等提供较为准确的特征值。
图3B示意性示出了根据本公开另一实施例的数据处理方法的流程图。如图3B所示,该方法包括操作S401~操作S405,其中:
操作S401,获取目标用户对指定品类的第一实际操作数据。
操作S402,获取目标用户对指定品类的期望操作数据,其中,期望操作数据用于作为衡量目标用户对指定品类的兴趣偏差的参照数据,且期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,指定品类属于多个品类中的一种。
操作S403,根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差。
操作S404,判断确定出的目标用户对指定品类的兴趣偏差是否符合预期指标。
操作S405,在判断确定出的目标用户对指定品类的兴趣偏差不符合预期指标,则滤除第一实际操作数据。
根据本公开的实施例,其中,在根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差之后,方法还包括:判断确定出的目标用户对指定品类的兴趣偏差是否符合预期指标;在判断确定出的目标用户对指定品类的兴趣偏差不符合预期指标,则滤除第一实际操作数据。在判断确定出的目标用户对指定品类的兴趣偏差符合预期指标,则保留第一实际操作数据。由于不符合预期指标的数据很可能会较大程度的影响较优用户的兴趣评判(较优用户为产生符合预期指标的数据的用户)。另外,不符合预期指标的数据也代表了在特定程度上难以客观的评判用户的兴趣程度。通过本公开实施例,可以将不符合预期指标的数据进行滤除,可以达到客观的评判用户的兴趣程度,进而提高数据分析的精准性。
需要说明的是,预期指标可以是量化指标,根据不同的兴趣偏差的确定方法,可以得到不同的预期指标,例如,采用上述兴趣偏差值εij进行衡量用户的感兴趣程度时,将兴趣偏差值εij与1进行比较,该预期指标即为1。预期指标还可以是其他的定性指标,例如,不同用户的兴趣偏差可以是喜欢、一般,不喜欢时,将语义与喜欢相近的词作为预期指标。不符合预期指标的兴趣偏差即为一般,不喜欢。
图4示意性示出了根据本公开的实施例的数据处理装置的框图。
如图4所示,数据处理装置500包括第一获取模块510、第二获取模块520、第一确定模块530。
第一获取模块510用于获取目标用户对指定品类的第一实际操作数据。
第二获取模块520用于获取目标用户对指定品类的期望操作数据,其中,期望操作数据用于作为衡量目标用户对指定品类的兴趣偏差的参照数据,且期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,指定品类属于多个品类中的一种。
第一确定模块530用于根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差。
根据本公开的实施例,由于根据用户对指定品类的实际操作数据与期望操作数据确定用户对指定品类的兴趣偏差,其中,该期望操作数据与多个用户对多个品类的操作数据相关。在这种情况下,期望操作数据由于可以随着多个用户对不同品类的操作数据的变化而变化,即期望操作数据是可以动态变化的。并且,对用户兴趣偏好的分析方法不是采用单变量统计某一指定品类的实际操作数据,而是获取用户对指定品类的实际操作数据与期望操作数据。因此,可以至少部分地解决现有技术中数据分析精准度低而导致不能准确确定用户是否真正对指定品类感兴趣的问题,进而实现提高数据分析精准度的技术效果。
根据本公开的实施例,其中,上述第二获取模块包括:第一确定单元,用于确定事件发生的概率,其中,事件为多个用户对指定品类进行操作;获取单元,用于获取第二实际操作数据,其中,第二实际操作数据为目标用户对多个品类进行操作时产生的实际操作数据的总和;以及第二确定单元,用于根据第二实际操作数据和事件发生的概率,确定期望操作数据。
根据本公开的实施例,其中,上述第一确定单元包括:第一获取子单元,用于获取第三实际操作数据,其中,第三实际操作数据包括多个用户对多个品类进行操作时产生的实际操作数据的总和;第二获取子单元,用于获取第四实际操作数据,其中,第四实际操作数据包括多个用户对指定品类进行操作时产生的实际操作数据的总和;以及第一确定子单元,用于确定第四实际操作数据占第三实际操作数据比值,得到事件发生的概率。
根据本公开的实施例,其中,第一确定模块包括:判断单元,用于判断第一实际操作数据对应的数值是否大于期望操作数据对应的数值;以及第二确定单元,用于在第一实际操作数据对应的数值大于期望操作数据对应的数值的情况下,确定目标用户对指定品类感兴趣。
根据本公开的实施例,其中,上述第一确定模块包括:计算单元,用于根据第一实际操作数据和期望操作数据计算目标用户对指定品类的兴趣偏差值;以及第三确定单元,用于根据兴趣偏差值确定目标用户对指定品类的兴趣偏差。
根据本公开的实施例,其中,上述计算单元包括:第二确定子单元,用于根据第一实际操作数据和期望操作数据确定调节系数,调节系数用于调节兴趣偏差值;以及计算子单元,用于根据第一实际操作数据、期望操作数据和调节系数计算目标用户对指定品类的兴趣偏差值。
根据本公开的实施例,其中,上述装置还包括:判断模块,用于在根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差之后,判断确定出的目标用户对指定品类的兴趣偏差是否符合预期指标;以及过滤模块,用于在判断出的目标用户对指定品类的兴趣偏差符合预期指标的情况下,滤除第一实际操作数据。
需要说明的是,本公开实施例的数据处理装置与数据处理方法是相对应的,对于该数据处理装置的描述可以参考根据本公开实施例的数据处理方法的描述,在此不再赘述。
根据本公开的实施例,提供了一种数据处理系统,包括,计算机可读存储介质;处理器。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
图5示意性示出了应用本公开实施例的数据处理方法的计算机系统的框图。
图5示意性示出了适于用来实现本公开实施例的计算机系统600的结构示意图。
如图5所示,计算机系统600包括中央处理单元(CPU 601),其可以根据存储在只读存储器(ROM 602)中的程序或者从存储部分608加载到随机访问存储器(RAM 603)中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有计算机系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出接口(I/O接口605)也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被CPU 601执行时,执行本公开的系统中限定的上述功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、确定单元和判断单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取目标用户对指定品类的第一实际操作数据的单元”。
作为另一方面,根据本公开的实施例还提供了一种计算机可读介质。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,可以实现根据本公开实施例的数据处理方法,包括:获取目标用户对指定品类的第一实际操作数据;获取目标用户对指定品类的期望操作数据,其中,期望操作数据用于作为衡量目标用户对指定品类的兴趣偏差的参照数据,且期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,指定品类属于多个品类中的一种;以及根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差。
其中,获取目标用户对指定品类的期望操作数据包括:确定事件发生的概率,其中,事件为多个用户对指定品类进行操作;获取第二实际操作数据,其中,第二实际操作数据为目标用户对多个品类进行操作时产生的实际操作数据的总和;以及根据第二实际操作数据和事件发生的概率,确定期望操作数据。确定事件发生的概率包括:获取第三实际操作数据,其中,第三实际操作数据包括多个用户对多个品类进行操作时产生的实际操作数据的总和;获取第四实际操作数据,其中,第四实际操作数据包括多个用户对指定品类进行操作时产生的实际操作数据的总和;以及确定第四实际操作数据占第三实际操作数据比值,得到事件发生的概率。根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差包括:判断第一实际操作数据对应的数值是否大于期望操作数据对应的数值;以及若是,则确定目标用户对指定品类感兴趣。根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差包括:根据第一实际操作数据和期望操作数据计算目标用户对指定品类的兴趣偏差值;以及根据兴趣偏差值确定目标用户对指定品类的兴趣偏差。其中,根据第一实际操作数据和期望操作数据计算目标用户对指定品类的兴趣偏差值包括:根据第一实际操作数据和期望操作数据确定调节系数,调节系数用于调节兴趣偏差值;以及根据第一实际操作数据、期望操作数据和调节系数计算目标用户对指定品类的兴趣偏差值。在根据第一实际操作数据和期望操作数据,确定目标用户对指定品类的兴趣偏差之后,方法还包括:判断确定出的目标用户对指定品类的兴趣偏差是否符合预期指标;以及若否,则滤除第一实际操作数据。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (14)
1.一种数据处理方法,包括:
获取目标用户对指定品类的第一实际操作数据;
获取所述目标用户对所述指定品类的期望操作数据,其中,所述期望操作数据用于作为衡量所述目标用户对所述指定品类的兴趣偏差的参照数据,且所述期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,所述指定品类属于所述多个品类中的一种;
根据所述第一实际操作数据和所述期望操作数据,确定所述目标用户对所述指定品类的兴趣偏差;
其中,获取所述目标用户对所述指定品类的期望操作数据包括:
确定事件发生的概率,其中,所述事件为所述多个用户对所述指定品类进行操作;
获取第二实际操作数据,其中,所述第二实际操作数据为所述目标用户对所述多个品类进行操作时产生的实际操作数据的总和;以及
根据所述第二实际操作数据和所述事件发生的概率,确定所述期望操作数据。
2.根据权利要求1所述的方法,其中,确定事件发生的概率包括:
获取第三实际操作数据,其中,所述第三实际操作数据包括所述多个用户对所述多个品类进行操作时产生的实际操作数据的总和;
获取第四实际操作数据,其中,所述第四实际操作数据包括所述多个用户对所述指定品类进行操作时产生的实际操作数据的总和;以及
确定所述第四实际操作数据占所述第三实际操作数据比值,得到所述事件发生的概率。
3.根据权利要求1所述的方法,其中,根据所述第一实际操作数据和所述期望操作数据,确定所述目标用户对所述指定品类的兴趣偏差包括:
判断所述第一实际操作数据对应的数值是否大于所述期望操作数据对应的数值;以及
若是,则确定所述目标用户对所述指定品类感兴趣。
4.根据权利要求1所述的方法,其中,根据所述第一实际操作数据和所述期望操作数据,确定所述目标用户对所述指定品类的兴趣偏差包括:
根据所述第一实际操作数据和所述期望操作数据计算所述目标用户对所述指定品类的兴趣偏差值;以及
根据所述兴趣偏差值确定所述目标用户对所述指定品类的兴趣偏差。
5.根据权利要求4所述的方法,其中,根据所述第一实际操作数据和所述期望操作数据计算所述目标用户对所述指定品类的兴趣偏差值包括:
根据所述第一实际操作数据和所述期望操作数据确定调节系数,所述调节系数用于调节所述兴趣偏差值;以及
根据所述第一实际操作数据、所述期望操作数据和所述调节系数计算所述目标用户对所述指定品类的兴趣偏差值。
6.根据权利要求1至5中任一项所述的方法,其中,在根据所述第一实际操作数据和所述期望操作数据,确定所述目标用户对所述指定品类的兴趣偏差之后,所述方法还包括:
判断确定出的所述目标用户对所述指定品类的兴趣偏差是否符合预期指标;以及
若否,则滤除所述第一实际操作数据。
7.一种数据处理装置,包括:
第一获取模块,用于获取目标用户对指定品类的第一实际操作数据;
第二获取模块,用于获取所述目标用户对所述指定品类的期望操作数据,其中,所述期望操作数据用于作为衡量所述目标用户对所述指定品类的兴趣偏差的参照数据,且所述期望操作数据与多个用户对多个品类进行操作时产生的实际操作数据相关,所述指定品类属于所述多个品类中的一种;
第一确定模块,用于根据所述第一实际操作数据和所述期望操作数据,确定所述目标用户对所述指定品类的兴趣偏差;
其中,所述第二获取模块包括:
第一确定单元,用于确定事件发生的概率,其中,所述事件为所述多个用户对所述指定品类进行操作;
获取单元,用于获取第二实际操作数据,其中,所述第二实际操作数据为所述目标用户对所述多个品类进行操作时产生的实际操作数据的总和;以及
第二确定单元,用于根据所述第二实际操作数据和所述事件发生的概率,确定所述期望操作数据。
8.根据权利要求7所述的装置,其中,所述第一确定单元包括:
第一获取子单元,用于获取第三实际操作数据,其中,所述第三实际操作数据包括所述多个用户对所述多个品类进行操作时产生的实际操作数据的总和;
第二获取子单元,用于获取第四实际操作数据,其中,所述第四实际操作数据包括所述多个用户对所述指定品类进行操作时产生的实际操作数据的总和;以及
第一确定子单元,用于确定所述第四实际操作数据占所述第三实际操作数据比值,得到所述事件发生的概率。
9.根据权利要求7所述的装置,其中,所述第一确定模块包括:
判断单元,用于判断所述第一实际操作数据对应的数值是否大于所述期望操作数据对应的数值;以及
第二确定单元,用于在所述第一实际操作数据对应的数值大于所述期望操作数据对应的数值的情况下,确定所述目标用户对所述指定品类感兴趣。
10.根据权利要求7所述的装置,其中,所述第一确定模块包括:
计算单元,用于根据所述第一实际操作数据和所述期望操作数据计算所述目标用户对所述指定品类的兴趣偏差值;以及
第三确定单元,用于根据所述兴趣偏差值确定所述目标用户对所述指定品类的兴趣偏差。
11.根据权利要求10所述的装置,其中,所述计算单元包括:
第二确定子单元,用于根据所述第一实际操作数据和所述期望操作数据确定调节系数,所述调节系数用于调节所述兴趣偏差值;以及
计算子单元,用于根据所述第一实际操作数据、所述期望操作数据和所述调节系数计算所述目标用户对所述指定品类的兴趣偏差值。
12.根据权利要求7至11中任一项所述的装置,其中,所述装置还包括:
判断模块,用于在根据所述第一实际操作数据和所述期望操作数据,确定所述目标用户对所述指定品类的兴趣偏差之后,判断确定出的所述目标用户对所述指定品类的兴趣偏差是否符合预期指标;以及
过滤模块,用于在判断出的所述目标用户对所述指定品类的兴趣偏差符合预期指标的情况下,滤除所述第一实际操作数据。
13.一种计算机可读存储介质,其上存储有可执行指令,所述指令被处理器执行时用于实现权利要求1至6中任一项所述的数据处理方法。
14.一种数据处理系统,包括:
权利要求13所述的计算机可读存储介质;以及
权利要求13所述的处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710498852.1A CN107357847B (zh) | 2017-06-26 | 2017-06-26 | 数据处理方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710498852.1A CN107357847B (zh) | 2017-06-26 | 2017-06-26 | 数据处理方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107357847A CN107357847A (zh) | 2017-11-17 |
CN107357847B true CN107357847B (zh) | 2020-07-31 |
Family
ID=60273712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710498852.1A Active CN107357847B (zh) | 2017-06-26 | 2017-06-26 | 数据处理方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107357847B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109992745A (zh) * | 2017-12-29 | 2019-07-09 | 北京京东尚科信息技术有限公司 | 数据处理方法及其系统、计算机系统及计算机可读介质 |
CN109977176B (zh) * | 2019-03-25 | 2022-02-22 | 上海火了信息科技有限公司 | 数据处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012121935A2 (en) * | 2011-03-08 | 2012-09-13 | Alibaba Group Holding Limited | Sending product information based on determined preference values |
CN102929928A (zh) * | 2012-09-21 | 2013-02-13 | 北京格致璞科技有限公司 | 基于多维相似度的个性化新闻推荐方法 |
CN103744956A (zh) * | 2014-01-06 | 2014-04-23 | 同济大学 | 一种关键词的多样化拓展方法 |
CN103870453A (zh) * | 2012-12-07 | 2014-06-18 | 盛乐信息技术(上海)有限公司 | 数据推荐方法及系统 |
CN106503269A (zh) * | 2016-12-08 | 2017-03-15 | 广州优视网络科技有限公司 | 应用推荐的方法、装置及服务器 |
-
2017
- 2017-06-26 CN CN201710498852.1A patent/CN107357847B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012121935A2 (en) * | 2011-03-08 | 2012-09-13 | Alibaba Group Holding Limited | Sending product information based on determined preference values |
CN102929928A (zh) * | 2012-09-21 | 2013-02-13 | 北京格致璞科技有限公司 | 基于多维相似度的个性化新闻推荐方法 |
CN103870453A (zh) * | 2012-12-07 | 2014-06-18 | 盛乐信息技术(上海)有限公司 | 数据推荐方法及系统 |
CN103744956A (zh) * | 2014-01-06 | 2014-04-23 | 同济大学 | 一种关键词的多样化拓展方法 |
CN106503269A (zh) * | 2016-12-08 | 2017-03-15 | 广州优视网络科技有限公司 | 应用推荐的方法、装置及服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN107357847A (zh) | 2017-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145280B (zh) | 信息推送的方法和装置 | |
CN107220852A (zh) | 用于确定目标推荐用户的方法、装置和服务器 | |
CN110766486B (zh) | 确定物品类目的方法和装置 | |
US20190026760A1 (en) | Method for profiling user's intention and apparatus therefor | |
CN107247786A (zh) | 用于确定相似用户的方法、装置和服务器 | |
WO2019072128A1 (zh) | 对象识别方法及其系统 | |
CN106897905B (zh) | 用于推送信息的方法、装置及电子设备 | |
CN107808346B (zh) | 一种潜在目标对象的评估方法及评估装置 | |
CN110929136A (zh) | 一种个性化推荐方法和装置 | |
CN111311294A (zh) | 数据处理方法、装置、介质及电子设备 | |
CN109961299A (zh) | 数据分析的方法和装置 | |
CN110827101B (zh) | 一种店铺推荐的方法和装置 | |
KR20200025431A (ko) | 오픈마켓 통합 관리 시스템 및 방법 | |
CN113450172B (zh) | 一种商品推荐方法和装置 | |
WO2022156589A1 (zh) | 一种直播点击率的确定方法和装置 | |
CN113495991A (zh) | 一种推荐方法和装置 | |
CN107357847B (zh) | 数据处理方法及其装置 | |
CN109978594B (zh) | 订单处理方法、装置及介质 | |
CN109474884B (zh) | 数据处理方法及其系统 | |
CN108959289B (zh) | 网站类别获取方法和装置 | |
CN110599281A (zh) | 一种确定目标店铺的方法和装置 | |
CN113792952A (zh) | 用于生成模型的方法和装置 | |
CN112989276B (zh) | 信息推送系统的评价方法和装置 | |
CN110555747A (zh) | 确定目标用户的方法和装置 | |
CN111833085A (zh) | 一种计算物品价格的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |