Nothing Special   »   [go: up one dir, main page]

CN106846061A - 潜在用户挖掘方法以及装置 - Google Patents

潜在用户挖掘方法以及装置 Download PDF

Info

Publication number
CN106846061A
CN106846061A CN201710056592.2A CN201710056592A CN106846061A CN 106846061 A CN106846061 A CN 106846061A CN 201710056592 A CN201710056592 A CN 201710056592A CN 106846061 A CN106846061 A CN 106846061A
Authority
CN
China
Prior art keywords
user
information
potential
potential user
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710056592.2A
Other languages
English (en)
Inventor
李会鹏
荣岳成
文庆
李静永
齐伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710056592.2A priority Critical patent/CN106846061A/zh
Publication of CN106846061A publication Critical patent/CN106846061A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种潜在用户挖掘方法以及装置。其中方法包括:获取用户的搜索行为信息;提取搜索行为信息中的特征信息;根据预先训练得到的潜在用户挖掘模型对特征信息进行预测,判断用户是否为潜在购买商品房的用户;若是,则根据搜索行为信息确定用户的细化标签;将用户以及用户的细化标签加载至潜在用户库中。该方法可以大大降低潜在用户的挖掘成本,提高了用户的互动性,并提高了潜在用户的获得率以及精准度。

Description

潜在用户挖掘方法以及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种潜在用户挖掘方法以及装置。
背景技术
房地产作为国民经济支柱产业,在国民经济发展中的地位十分重要,其从业人员众多,针对房产销售的营销需求旺盛。如何快速有效的获取大量潜在用户,成为房产从业人员的迫切需求。
相关技术中,房产从业人员需要获取新的买房用户,会进行大量的推广活动和广告投放。现有的广告投放方式主要分为网络广告和传统媒体广告,例如,在各大房产电商网站上购买广告位,或者在各个广告联盟投放广告,或者通过报纸、电视广播等传统媒体进行推广。
但是,上述这些营销方式有一些共同的缺点,就是只能被动的等待用户,等待用户的交互,而不能主动的挖掘出更多的潜在用户,特别是针对某个具体需求的精准潜在用户,并且,上述这些营销方式的开销也比较大,用户的互动性也比较差,且大大降低了潜在用户的获得率。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种潜在用户挖掘方法。该方法可以大大降低潜在用户的挖掘成本,提高了用户的互动性,并提高了潜在用户的获得率以及精准度。
本发明的第二个目的在于提出一种潜在用户挖掘装置。
本发明的第三个目的在于提出一种存储介质。
本发明的第四个目的在于提出一种计算机程序产品。
为达到上述目的,本发明第一方面实施例提出的潜在用户挖掘方法,包括:获取用户的搜索行为信息;提取所述搜索行为信息中的特征信息;根据预先训练得到的潜在用户挖掘模型对所述特征信息进行预测,判断所述用户是否为潜在购买商品房的用户;如果所述用户为潜在购买商品房的用户,则根据所述搜索行为信息确定所述用户的细化标签;将所述用户以及所述用户的细化标签加载至潜在用户库中。
本发明实施例的潜在用户挖掘方法,可先获取用户的搜索行为信息,之后,可提取搜索行为信息中的特征信息,然后,根据预先训练得到的潜在用户挖掘模型对特征信息进行预测,判断用户是否为潜在购买商品房的用户,若是,则根据搜索行为信息确定用户的细化标签,最后,将用户以及用户的细化标签加载至潜在用户库中。即利用用户的搜索行为数据,并通过数据挖掘方法寻找潜在的买房用户,同时进一步挖掘潜在买房用户的精准需求,最终建立起潜在用户库,在整个过程中,大大降低了潜在用户的挖掘成本,提高了用户的互动性,并提高了潜在用户的获得率以及精准度。
为达到上述目的,本发明第二方面实施例提出了一种潜在用户挖掘装置,包括:第一获取模块,用于获取用户的搜索行为信息;提取模块,用于提取所述搜索行为信息中的特征信息;预测模块,用于根据预先训练得到的潜在用户挖掘模型对所述特征信息进行预测,判断所述用户是否为潜在购买商品房的用户;确定模块,用于在所述用户为潜在购买商品房的用户时,根据所述搜索行为信息确定所述用户的细化标签;加载模块,用于将所述用户以及所述用户的细化标签加载至潜在用户库中。
本发明实施例的潜在用户挖掘装置,可通过第一获取模块获取用户的搜索行为信息,提取模块提取搜索行为信息中的特征信息,预测模块根据预先训练得到的潜在用户挖掘模型对特征信息进行预测,判断用户是否为潜在购买商品房的用户,若是,确定模块则根据搜索行为信息确定用户的细化标签,加载模块将用户以及用户的细化标签加载至潜在用户库中。即利用用户的搜索行为数据,并通过数据挖掘方法寻找潜在的买房用户,同时进一步挖掘潜在买房用户的精准需求,最终建立起潜在用户库,在整个过程中,大大降低了潜在用户的挖掘成本,提高了用户的互动性,并提高了潜在用户的获得率以及精准度。
为达到上述目的,本发明第三方面实施例提出的非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器被执行时,使得电子设备能够执行一种潜在用户挖掘方法,所述方法包括:获取用户的搜索行为信息;提取所述搜索行为信息中的特征信息;根据预先训练得到的潜在用户挖掘模型对所述特征信息进行预测,判断所述用户是否为潜在购买商品房的用户;如果所述用户为潜在购买商品房的用户,则根据所述搜索行为信息确定所述用户的细化标签;将所述用户以及所述用户的细化标签加载至潜在用户库中。
为达到上述目的,本发明第四方面实施例提出的计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种潜在用户挖掘方法,所述方法包括:获取用户的搜索行为信息;提取所述搜索行为信息中的特征信息;根据预先训练得到的潜在用户挖掘模型对所述特征信息进行预测,判断所述用户是否为潜在购买商品房的用户;如果所述用户为潜在购买商品房的用户,则根据所述搜索行为信息确定所述用户的细化标签;将所述用户以及所述用户的细化标签加载至潜在用户库中。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的潜在用户挖掘方法的流程图;
图2是根据本发明一个实施例的预先训练潜在用户挖掘模型的流程图;
图3是根据本发明另一个实施例的潜在用户挖掘方法的流程图;
图4是根据本发明一个实施例的潜在用户挖掘装置的结构示意图;
图5是根据本发明一个具体实施例的潜在用户挖掘装置的结构示意图;
图6是根据本发明另一个具体实施例的潜在用户挖掘装置的结构示意图;
图7是根据本发明又一个具体实施例的潜在用户挖掘装置的结构示意图;
图8是根据本发明再一个具体实施例的潜在用户挖掘装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
目前,房产在线广告大多投放于房产电商等房产垂直网站,虽然受众相对精准,但是垂直网站用户量比较小的特性决定了这种方式的覆盖率比较低。除了单纯追求曝光的展示效果广告,其他的很多房产在线广告的目的是为了获取用户的有效信息,例如账号、手机号码、邮箱等。但是,大部分用户并不会进行这些有效互动,所以很大一部分潜在用户就会流失掉。
传统媒体广告虽然能覆盖更多的用户,但是反过来说目标受众分散,效果打折。并且传统媒体的互动性,时效性非常弱,只能进行单向的传播,对于受众的接受程度、反馈无从知晓。所以,传统媒体更多的用来进行品牌宣传,对于房产销售中的一些精准营销需求难以满足。
因此,如何寻找更加先进和有效的用户获取手段,以拓展买房用户来源就成了首要问题。为此,本发明提出了一种能够提高潜在用户的获得率、并降低挖掘成本的潜在用户挖掘方法以及装置。具体地,下面参考附图描述本发明实施例的潜在用户挖掘方法以及装置。
图1是根据本发明一个实施例的潜在用户挖掘方法的流程图。需要说明的是,本发明实施例的潜在用户挖掘方法可应用于本发明实施例的潜在用户挖掘装置,作为一种示例,该潜在用户挖掘装置可被配置于搜索引擎中。
如图1所示,该潜在用户挖掘方法可以包括:
S110,获取用户的搜索行为信息。
需要说明的是,搜索引擎作为互联网的主要流量入口,能够覆盖到大多数的用户,并且会记录这些用户的搜索行为,本发明实施例的潜在用户挖掘方法正是基于该搜索引擎的特性,通过从用户的搜索行为中发现潜在购买商品房用户。
具体地,可先获取用户的基本信息,之后,可根据该基本信息获取该用户的搜索行为信息。作为一种示例,该基本信息可以是用户名或账户名等,其中,该用户名或账户名可以是用户注册时用户根据自己喜好所填写的,也可以是注册系统自动生成的。
需要说明的是,在本发明的一个实施例中,获取用户的搜索行为信息的时机可以是周期性地获取,还可以是实时获取。也就是说,可定期获取用户在这一段时间内的历史搜索行为信息,其中,该定期的周期时长可以是3天、7天、或者一个月等;还可实时获取用户的搜索行为信息,例如,在监控到用户当前正在使用搜索功能,则可获取用户当前的搜索行为信息。
作为一种示例,该搜索行为信息至少包括但不限于搜索关键词、搜索时间、点击URL地址、点击URL地址的主题等。其中,该搜索关键词可理解为用户在进行搜索操作时所输入的内容信息;该搜索时间可理解为用户进行搜索操作时的当前时间;该点击URL地址可理解为用户在搜索结果中页面中点击的搜索结果所对应的URL地址;该点击URL地址的主题可理解为用户在搜索结果中页面中点击的搜索结果所对应的主题。
S120,提取搜索行为信息中的特征信息。
具体地,可对搜索行为信息进行内容分析,以从该搜索行为信息中提取特征信息。其中,在本发明的一个实施例中,该特征信息至少包括但不限于关键词特征、URL特征和URL的主题特征等。
作为一种示例,上述提取搜索行为信息中的特征信息的具体实现过程可如下:可对搜索关键词进行分词处理,统计分词结果相同的搜索关键词,并对分词结果相同的搜索关键词进行行为分析以生成关键词特征,并从点击URL地址中获取与商品房相关的URL地址,并根据网站访问流量和主题相关程度对与商品房相关的URL地址进行分析以生成URL特征,以及对点击URL地址的主题进行分词处理,并对分词处理后的点击URL地址的主题进行关键词提取,以及对提取结果进行行为分析以生成URL的主题特征。
更具体地,对于搜索关键词,可在经过对其进行分词处理之后,对分词结果相同的搜索关键词,统计分析其行为特征以生成关键词特征,其中,该行为特征例如可为:该搜索关键词的检索时间分布、点击的URL分布、点击URL的主题分布等;对于点击URL地址,可综合利用经验、网站访问流量和主题相关程度等方法对与商品房相关的URL地址进行采集和分析,生成URL特征;对于点击URL地址的主题,可同样对该点击URL地址的主题进行分词处理、关键词提取,并在分词处理以及关键词提取之后,统计其行为特征,生成URL地址的主题特征,其中,该行为特征例如可为:点击URL地址的点击时间分布、点击URL分布、点击URL的主题分布等。
S130,根据预先训练得到的潜在用户挖掘模型对特征信息进行预测,判断用户是否为潜在购买商品房的用户。
需要说明的是,上述潜在用户挖掘模型可以是通过对大量的样本用户的样本搜索行为信息进行分析并训练而得到的。作为一种示例,如图2所示,该潜在用户挖掘模型可通过以下步骤预先训练得到的:
S210,获取样本用户的样本搜索行为信息。
S220,按照预设格式对样本搜索行为信息进行预处理。
可以理解,在本发明的实施例中,该预设格式可以是预先定义好的,例如,可预先定义数据类型、数据字符长度等。也就是说,可按照预设格式对获得的样本搜索行为信息进行过滤、变换等处理。作为一种示例,可对样本搜索行为信息进行预处理,并根据预处理后的样本搜索行为信息以创建数据库表,生成用户行为库。其中,该用户行为库可包括样本用户的基本信息、搜索关键词、搜索时间、点击URL地址、点击URL地址的主题等。此外,数据处理环节,可不断将样本用户的新搜索行为合并到已有行为中,以节省存储空间,减少数据冗余,提高数据的关联性。
S230,对预处理后的样本搜索行为信息进行特征提取以得到样本搜索行为信息中的样本特征信息。
作为一种示例,可对预处理后的样本搜索行为信息进行特征提取,得到该样本搜索行为信息中的样本特征信息,并根据该样本特征信息创建数据库表,以生成特征库,以便后续通过该特征库获取特征信息以进行模型训练。
S240,基于机器学习算法,根据样本特征信息进行模型训练以得到潜在用户挖掘模型。
由此,通过上述步骤S210至步骤S240即可训练出该潜在用户挖掘模型,以便在实际应用中,可根据该潜在用户挖掘模型对新用户以及其历史搜索行为进行预测,即可判断该新用户的购房意愿,即判断该新用户是否为潜在购买商品房的用户。
S140,如果用户为潜在购买商品房的用户,则根据搜索行为信息确定用户的细化标签。
可以理解,可预先根据意图信息进一步对用户标签进行细化,以得到细化标签。这样,在实际应用中,在得到潜在购买商品房的用户之后,可进一步根据搜索行为信息确定该用户属于哪种细化标签。
作为一种示例,在判断待挖掘用户为潜在购买商品房的用户时,可先对该用户的搜索行为信息进行分析,以得到与购买商品房相关的搜索行为信息,之后,可根据该与购买商品房相关的搜索行为信息,确定该用户购买商品房的意向信息,其中,该意向信息包括意向区域、意向楼盘和意向楼盘类型等,最后,根据该意向信息对该用户进行标签标记,以得到该用户的细化标签。其中,该意向区域可包括城市、区县、环线位置等;该意向楼盘类型可包括楼盘的类型和属性,例如,住宅、写字楼、商业用房、商住两用、学区房、小户型、刚需、改善、别墅、地铁房、单价范围、总价范围、居室等;该意向楼盘可以精确到用户具体感兴趣的楼盘,其中,该意向楼盘的数量可以为多个。
S150,将用户以及用户的细化标签加载至潜在用户库中。
具体地,在根据搜索行为信息确定用户的细化标签之后,可根据该用户以及该用户的细化标签创建数据库表,生成潜在用户库中,这样,在实际应用中,可不断地根据新用户的搜索行为信息来判断该新用户是否潜在购买商品房的用户,若是,则将该新用户以及该新用户的细化标签加载到该潜在用户库中。
本发明实施例的潜在用户挖掘方法,可先获取用户的搜索行为信息,之后,可提取搜索行为信息中的特征信息,然后,根据预先训练得到的潜在用户挖掘模型对特征信息进行预测,判断用户是否为潜在购买商品房的用户,若是,则根据搜索行为信息确定用户的细化标签,最后,将用户以及用户的细化标签加载至潜在用户库中。即利用用户的搜索行为数据,并通过数据挖掘方法寻找潜在的买房用户,同时进一步挖掘潜在买房用户的精准需求,最终建立起潜在用户库,在整个过程中,大大降低了潜在用户的挖掘成本,提高了用户的互动性,并提高了潜在用户的获得率以及精准度。
为了便于后续使用,进一步地,在本发明的一个实施例中,如图3所示,在如图1所示的基础上,在将用户以及用户的细化标签加载至潜在用户库中(即上述步骤S150)之后,该潜在用户挖掘方法还可包括:从潜在用户的搜索行为信息中,获取潜在用户针对商品房的搜索次数和/或搜索频率(S310);根据搜索次数和/或搜索频率生成潜在用户购买商品房的意愿强度(S320);根据意愿强度对潜在用户进行排序(S330)。
作为一种示例,在根据意愿强度对潜在用户进行排序之后,可根据排序结果更新该潜在用户在该潜在用户库中的存储顺序,例如,可按照意愿强度由大到小的顺序以更新潜在用户的存储顺序,即意愿强度最大的潜在用户,其存储顺序为第一,依次类推。由此,通过对潜在用户库中的潜在用户进行存储顺序排序,可以方便后续数据的使用,例如,在调取该潜在用户库中所有潜在用户中,该调取出的所有潜在用户即已经为排序后的数据。
与上述几种实施例提供的潜在用户挖掘方法相对应,本发明的一种实施例还提供一种潜在用户挖掘装置,由于本发明实施例提供的潜在用户挖掘装置与上述几种实施例提供的潜在用户挖掘方法相对应,因此在前述潜在用户挖掘方法的实施方式也适用于本实施例提供的潜在用户挖掘装置,在本实施例中不再详细描述。图4是根据本发明一个实施例的潜在用户挖掘装置的结构示意图。如图4所示,该潜在用户挖掘装置可以包括:第一获取模块410、提取模块420、预测模块430、确定模块440和加载模块450。
具体地,第一获取模块410可用于获取用户的搜索行为信息。其中,在本发明的一个实施例中,该搜索行为信息至少包括但不限于搜索关键词、搜索时间、点击URL地址、点击URL地址的主题等。
提取模块420可用于提取搜索行为信息中的特征信息。其中,在本发明的一个实施例中,该特征信息至少包括但不限于关键词特征、URL特征和URL的主题特征等。
作为一种示例,如图5所示,该提取模块420可包括:第一生成单元421、第二生成单元422和第三生成单元423。其中,第一生成单元421用于对搜索关键词进行分词处理,统计分词结果相同的搜索关键词,并对分词结果相同的搜索关键词进行行为分析以生成关键词特征。第二生成单元422用于从点击URL地址中获取与商品房相关的URL地址,并根据网站访问流量和主题相关程度对与商品房相关的URL地址进行分析以生成URL特征。第三生成单元423用于对点击URL地址的主题进行分词处理,并对分词处理后的点击URL地址的主题进行关键词提取,以及对提取结果进行行为分析以生成URL的主题特征。
预测模块430可用于根据预先训练得到的潜在用户挖掘模型对特征信息进行预测,判断用户是否为潜在购买商品房的用户。
确定模块440可用于在用户为潜在购买商品房的用户时,根据搜索行为信息确定用户的细化标签。其中,在本发明的一个实施例中,如图6所示,该确定模块440可包括:分析单元441、确定单元442和标记单元443。
其中,分析单元441用于对搜索行为信息进行分析,以得到与商品房相关的搜索行为信息。确定单元442用于根据与商品房相关的搜索行为信息,确定用户购买商品房的意向信息,其中,意向信息包括意向区域、意向楼盘和意向楼盘类型。标记单元443用于根据意向信息对用户进行标签标记,以得到用户的细化标签。
加载模块450可用于将用户以及用户的细化标签加载至潜在用户库中。
作为一种示例,如图7所示,该潜在用户挖掘装置还可包括:预先训练模块460,预先训练模块460可用于预先训练潜在用户挖掘模型。其中,在本发明的实施例中,如图7所示,该预先训练模块460可包括:获取单元461、预处理单元462、提取单元463和模型训练单元464。
其中,获取单元461用于获取样本用户的样本搜索行为信息。预处理单元462用于按照预设格式对样本搜索行为信息进行预处理。提取单元463用于对预处理后的样本搜索行为信息进行特征提取以得到样本搜索行为信息中的样本特征信息。模型训练单元464用于基于机器学习算法,根据样本特征信息进行模型训练以得到潜在用户挖掘模型。
进一步地,在本发明的一个实施例中,如图8所示,该潜在用户挖掘装置还可包括:第二获取模块470、生成模块480和排序模块490。其中,第二获取模块470用于在加载模块450将用户以及用户的细化标签加载至潜在用户库中之后,从潜在用户的搜索行为信息中,获取潜在用户针对商品房的搜索次数和/或搜索频率。生成模块480用于根据搜索次数和/或搜索频率生成潜在用户购买商品房的意愿强度。排序模块490用于根据意愿强度对潜在用户进行排序。
本发明实施例的潜在用户挖掘装置,可通过第一获取模块获取用户的搜索行为信息,提取模块提取搜索行为信息中的特征信息,预测模块根据预先训练得到的潜在用户挖掘模型对特征信息进行预测,判断用户是否为潜在购买商品房的用户,若是,确定模块则根据搜索行为信息确定用户的细化标签,加载模块将用户以及用户的细化标签加载至潜在用户库中。即利用用户的搜索行为数据,并通过数据挖掘方法寻找潜在的买房用户,同时进一步挖掘潜在买房用户的精准需求,最终建立起潜在用户库,在整个过程中,大大降低了潜在用户的挖掘成本,提高了用户的互动性,并提高了潜在用户的获得率以及精准度。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种潜在用户挖掘方法,其特征在于,包括以下步骤:
获取用户的搜索行为信息;
提取所述搜索行为信息中的特征信息;
根据预先训练得到的潜在用户挖掘模型对所述特征信息进行预测,判断所述用户是否为潜在购买商品房的用户;
如果所述用户为潜在购买商品房的用户,则根据所述搜索行为信息确定所述用户的细化标签;
将所述用户以及所述用户的细化标签加载至潜在用户库中。
2.如权利要求1所述的潜在用户挖掘方法,其特征在于,所述搜索行为信息至少包括搜索关键词、搜索时间、点击URL地址、所述点击URL地址的主题;所述特征信息至少包括关键词特征、URL特征和URL的主题特征。
3.如权利要求2所述的潜在用户挖掘方法,其特征在于,所述提取所述搜索行为信息中的特征信息,包括:
对所述搜索关键词进行分词处理,统计分词结果相同的搜索关键词,并对所述分词结果相同的搜索关键词进行行为分析以生成所述关键词特征;
从所述点击URL地址中获取与所述商品房相关的URL地址,并根据网站访问流量和主题相关程度对所述与所述商品房相关的URL地址进行分析以生成所述URL特征;
对所述点击URL地址的主题进行分词处理,并对分词处理后的所述点击URL地址的主题进行关键词提取,以及对提取结果进行行为分析以生成所述URL的主题特征。
4.如权利要求1所述的潜在用户挖掘方法,其特征在于,所述潜在用户挖掘模型通过以下步骤预先训练得到的:
获取样本用户的样本搜索行为信息;
按照预设格式对所述样本搜索行为信息进行预处理;
对预处理后的所述样本搜索行为信息进行特征提取以得到所述样本搜索行为信息中的样本特征信息;
基于机器学习算法,根据所述样本特征信息进行模型训练以得到所述潜在用户挖掘模型。
5.如权利要求1所述的潜在用户挖掘方法,所述根据所述搜索行为信息确定所述用户的细化标签,包括:
对所述搜索行为信息进行分析,以得到与所述商品房相关的搜索行为信息;
根据所述与所述商品房相关的搜索行为信息,确定所述用户购买所述商品房的意向信息,其中,所述意向信息包括意向区域、意向楼盘和意向楼盘类型;
根据所述意向信息对所述用户进行标签标记,以得到所述用户的细化标签。
6.如权利要求1所述的潜在用户挖掘方法,其特征在于,在所述将所述用户以及所述用户的细化标签加载至潜在用户库中之后,所述方法还包括:
从所述潜在用户的搜索行为信息中,获取所述潜在用户针对所述商品房的搜索次数和/或搜索频率;
根据所述搜索次数和/或搜索频率生成所述潜在用户购买所述商品房的意愿强度;
根据所述意愿强度对所述潜在用户进行排序。
7.一种潜在用户挖掘装置,其特征在于,包括:
第一获取模块,用于获取用户的搜索行为信息;
提取模块,用于提取所述搜索行为信息中的特征信息;
预测模块,用于根据预先训练得到的潜在用户挖掘模型对所述特征信息进行预测,判断所述用户是否为潜在购买商品房的用户;
确定模块,用于在所述用户为潜在购买商品房的用户时,根据所述搜索行为信息确定所述用户的细化标签;
加载模块,用于将所述用户以及所述用户的细化标签加载至潜在用户库中。
8.如权利要求7所述的潜在用户挖掘装置,其特征在于,所述搜索行为信息至少包括搜索关键词、搜索时间、点击URL地址、所述点击URL地址的主题;所述特征信息至少包括关键词特征、URL特征和URL的主题特征。
9.如权利要求8所述的潜在用户挖掘装置,其特征在于,所述提取模块包括:
第一生成单元,用于对所述搜索关键词进行分词处理,统计分词结果相同的搜索关键词,并对所述分词结果相同的搜索关键词进行行为分析以生成所述关键词特征;
第二生成单元,用于从所述点击URL地址中获取与所述商品房相关的URL地址,并根据网站访问流量和主题相关程度对所述与所述商品房相关的URL地址进行分析以生成所述URL特征;
第三生成单元,用于对所述点击URL地址的主题进行分词处理,并对分词处理后的所述点击URL地址的主题进行关键词提取,以及对提取结果进行行为分析以生成所述URL的主题特征。
10.如权利要求7所述的潜在用户挖掘装置,其特征在于,还包括:
预先训练模块,用于预先训练所述潜在用户挖掘模型;
其中,所述预先训练模块包括:
获取单元,用于获取样本用户的样本搜索行为信息;
预处理单元,用于按照预设格式对所述样本搜索行为信息进行预处理;
提取单元,用于对预处理后的所述样本搜索行为信息进行特征提取以得到所述样本搜索行为信息中的样本特征信息;
模型训练单元,用于基于机器学习算法,根据所述样本特征信息进行模型训练以得到所述潜在用户挖掘模型。
11.如权利要求7所述的潜在用户挖掘装置,其特征在于,所述确定模块包括:
分析单元,用于对所述搜索行为信息进行分析,以得到与所述商品房相关的搜索行为信息;
确定单元,用于根据所述与所述商品房相关的搜索行为信息,确定所述用户购买所述商品房的意向信息,其中,所述意向信息包括意向区域、意向楼盘和意向楼盘类型;
标记单元,用于根据所述意向信息对所述用户进行标签标记,以得到所述用户的细化标签。
12.如权利要求7所述的潜在用户挖掘装置,其特征在于,还包括:
第二获取模块,用于在所述加载模块将所述用户以及所述用户的细化标签加载至潜在用户库中之后,从所述潜在用户的搜索行为信息中,获取所述潜在用户针对所述商品房的搜索次数和/或搜索频率;
生成模块,用于根据所述搜索次数和/或搜索频率生成所述潜在用户购买所述商品房的意愿强度;
排序模块,用于根据所述意愿强度对所述潜在用户进行排序。
CN201710056592.2A 2017-01-25 2017-01-25 潜在用户挖掘方法以及装置 Pending CN106846061A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710056592.2A CN106846061A (zh) 2017-01-25 2017-01-25 潜在用户挖掘方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710056592.2A CN106846061A (zh) 2017-01-25 2017-01-25 潜在用户挖掘方法以及装置

Publications (1)

Publication Number Publication Date
CN106846061A true CN106846061A (zh) 2017-06-13

Family

ID=59121647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710056592.2A Pending CN106846061A (zh) 2017-01-25 2017-01-25 潜在用户挖掘方法以及装置

Country Status (1)

Country Link
CN (1) CN106846061A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656963A (zh) * 2017-08-11 2018-02-02 百度在线网络技术(北京)有限公司 车主身份识别方法及装置、计算机设备及可读介质
CN107688865A (zh) * 2017-07-31 2018-02-13 上海恺英网络科技有限公司 识别网络游戏中潜在高消费用户的方法及设备
CN107944929A (zh) * 2017-12-14 2018-04-20 互动派科技股份有限公司 一种基于用户行为数据进行建模的用户画像建立方法
CN107993085A (zh) * 2017-10-19 2018-05-04 阿里巴巴集团控股有限公司 模型训练方法、基于模型的用户行为预测方法及装置
CN108334625A (zh) * 2018-02-09 2018-07-27 深圳壹账通智能科技有限公司 用户信息的处理方法、装置、计算机设备和存储介质
CN108416630A (zh) * 2018-03-16 2018-08-17 北京焦点新干线信息技术有限公司 一种目标受众的确定方法及装置
CN110245174A (zh) * 2019-06-13 2019-09-17 浙江华坤道威数据科技有限公司 一种企业定制dmp系统及其使用方法
CN110750714A (zh) * 2019-09-26 2020-02-04 北京瑞卓喜创科技发展有限公司 一种目标用户的推荐方法、装置、存储介质及移动终端
CN111353815A (zh) * 2020-02-24 2020-06-30 苏宁云计算有限公司 一种潜在用户预测方法和系统
CN111695922A (zh) * 2019-03-15 2020-09-22 北京沃东天骏信息技术有限公司 潜在用户确定方法及装置、存储介质和电子设备
CN111782611A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 预测模型建模方法、装置、设备及存储介质
CN112100237A (zh) * 2020-09-04 2020-12-18 北京百度网讯科技有限公司 一种用户数据处理方法、装置、设备以及存储介质
CN112115346A (zh) * 2019-06-21 2020-12-22 百度在线网络技术(北京)有限公司 线索数据处理方法及装置
CN112200566A (zh) * 2020-09-08 2021-01-08 青岛农业大学 基于区块链的艺术品交易方法与系统
CN112632149A (zh) * 2020-12-24 2021-04-09 深圳市高德信通信股份有限公司 一种基于网络数据分析的潜在用户挖掘方法
CN113312552A (zh) * 2021-06-10 2021-08-27 北京百度网讯科技有限公司 数据处理方法、装置、电子设备和介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101331475A (zh) * 2005-12-14 2008-12-24 微软公司 在线商业意图的自动检测
CN106296301A (zh) * 2016-08-17 2017-01-04 北京集奥聚合科技有限公司 一种房产销售线索的挖掘方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101331475A (zh) * 2005-12-14 2008-12-24 微软公司 在线商业意图的自动检测
CN106296301A (zh) * 2016-08-17 2017-01-04 北京集奥聚合科技有限公司 一种房产销售线索的挖掘方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688865A (zh) * 2017-07-31 2018-02-13 上海恺英网络科技有限公司 识别网络游戏中潜在高消费用户的方法及设备
CN107656963A (zh) * 2017-08-11 2018-02-02 百度在线网络技术(北京)有限公司 车主身份识别方法及装置、计算机设备及可读介质
CN107993085A (zh) * 2017-10-19 2018-05-04 阿里巴巴集团控股有限公司 模型训练方法、基于模型的用户行为预测方法及装置
CN113409084A (zh) * 2017-10-19 2021-09-17 创新先进技术有限公司 模型训练方法、基于模型的用户行为预测方法及装置
CN107993085B (zh) * 2017-10-19 2021-05-18 创新先进技术有限公司 模型训练方法、基于模型的用户行为预测方法及装置
CN107944929A (zh) * 2017-12-14 2018-04-20 互动派科技股份有限公司 一种基于用户行为数据进行建模的用户画像建立方法
CN108334625A (zh) * 2018-02-09 2018-07-27 深圳壹账通智能科技有限公司 用户信息的处理方法、装置、计算机设备和存储介质
CN108334625B (zh) * 2018-02-09 2020-05-29 深圳壹账通智能科技有限公司 用户信息的处理方法、装置、计算机设备和存储介质
CN108416630A (zh) * 2018-03-16 2018-08-17 北京焦点新干线信息技术有限公司 一种目标受众的确定方法及装置
CN111695922A (zh) * 2019-03-15 2020-09-22 北京沃东天骏信息技术有限公司 潜在用户确定方法及装置、存储介质和电子设备
CN110245174A (zh) * 2019-06-13 2019-09-17 浙江华坤道威数据科技有限公司 一种企业定制dmp系统及其使用方法
CN112115346A (zh) * 2019-06-21 2020-12-22 百度在线网络技术(北京)有限公司 线索数据处理方法及装置
CN112115346B (zh) * 2019-06-21 2023-08-18 百度在线网络技术(北京)有限公司 线索数据处理方法及装置
CN110750714A (zh) * 2019-09-26 2020-02-04 北京瑞卓喜创科技发展有限公司 一种目标用户的推荐方法、装置、存储介质及移动终端
CN111353815B (zh) * 2020-02-24 2024-03-01 苏宁云计算有限公司 一种潜在用户预测方法和系统
CN111353815A (zh) * 2020-02-24 2020-06-30 苏宁云计算有限公司 一种潜在用户预测方法和系统
CN111782611A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 预测模型建模方法、装置、设备及存储介质
CN111782611B (zh) * 2020-06-30 2024-01-23 北京百度网讯科技有限公司 预测模型建模方法、装置、设备及存储介质
CN112100237B (zh) * 2020-09-04 2023-08-15 北京百度网讯科技有限公司 一种用户数据处理方法、装置、设备以及存储介质
CN112100237A (zh) * 2020-09-04 2020-12-18 北京百度网讯科技有限公司 一种用户数据处理方法、装置、设备以及存储介质
CN112200566A (zh) * 2020-09-08 2021-01-08 青岛农业大学 基于区块链的艺术品交易方法与系统
CN112200566B (zh) * 2020-09-08 2022-08-12 青岛农业大学 基于区块链的艺术品交易方法与系统
CN112632149A (zh) * 2020-12-24 2021-04-09 深圳市高德信通信股份有限公司 一种基于网络数据分析的潜在用户挖掘方法
CN113312552A (zh) * 2021-06-10 2021-08-27 北京百度网讯科技有限公司 数据处理方法、装置、电子设备和介质
CN113312552B (zh) * 2021-06-10 2024-11-08 北京百度网讯科技有限公司 数据处理方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN106846061A (zh) 潜在用户挖掘方法以及装置
Kazienko et al. AdROSA—Adaptive personalization of web advertising
CN104462593B (zh) 一种提供用户个性化资源消息推送的方法和装置
CN103295145B (zh) 一种基于用户消费特征向量的手机广告投放方法
US8533141B2 (en) Systems and methods for rule based inclusion of pixel retargeting in campaign management
CN109978630A (zh) 一种基于大数据建立用户画像的精准营销方法和系统
US8380693B1 (en) System and method for automatically identifying classified websites
CN102360386A (zh) 电子商务网站智能导购系统和方法
US20180285331A1 (en) Method, server, browser, and system for recommending text information
CN104133878A (zh) 用户标签的生成方法和装置
CN108038237A (zh) 一种信息推荐方法与系统
CN104239298A (zh) 文本信息推荐方法、服务器、浏览器及系统
CN101025815A (zh) 利用个人网站的广告系统及其获利方法
US20110029384A1 (en) System and method for dynamic targeting advertisement based on content-in-view
CN109003146B (zh) 业务数据推广方法、装置、终端和计算机可读存储介质
CN104866557A (zh) 一种基于建构学习理论的个性化即时学习支持系统与方法
CN108229994A (zh) 一种信息推送方法及装置
CN104077290A (zh) 一种生成推广账户的方法和装置
CN102811207A (zh) 网络信息推送方法及系统
CN109214418A (zh) 用户意图的挖掘方法及装置、计算机设备及可读介质
CN112839063A (zh) 消息推送方法、消息显示方法、存储介质和计算机设备
CN100555283C (zh) 一种直接针对用户的相关信息的发布方法和系统
CN109102328A (zh) 广告链接排版方法、装置及存储介质
CN110516162A (zh) 一种信息推荐方法、装置、设备及存储介质
KR102238438B1 (ko) 규격화된 광고상품을 이용한 광고상품거래 서비스 제공 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170613