Nothing Special   »   [go: up one dir, main page]

CN114820080A - 基于人群流转的用户分群方法、系统、装置及介质 - Google Patents

基于人群流转的用户分群方法、系统、装置及介质 Download PDF

Info

Publication number
CN114820080A
CN114820080A CN202210569930.3A CN202210569930A CN114820080A CN 114820080 A CN114820080 A CN 114820080A CN 202210569930 A CN202210569930 A CN 202210569930A CN 114820080 A CN114820080 A CN 114820080A
Authority
CN
China
Prior art keywords
user
crowd
data
circulation
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210569930.3A
Other languages
English (en)
Inventor
杨磊
李强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Junzheng Network Technology Co Ltd
Original Assignee
Shanghai Junzheng Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Junzheng Network Technology Co Ltd filed Critical Shanghai Junzheng Network Technology Co Ltd
Priority to CN202210569930.3A priority Critical patent/CN114820080A/zh
Publication of CN114820080A publication Critical patent/CN114820080A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供基于人群流转的用户分群方法、系统、装置及介质,包括:获取用户行为数据并生成业务标签数据;将所述业务标签数据传送至用户画像平台,以基于所述用户画像平台的表结构生成用户画像表;对所述用户画像表进行统计分析后生成对应的业务线统计表,以根据所述业务线统计表构建可视化查询界面;响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,并基于所述人群流转路径图选择非零转化的流转用户生成对应的用户群组,以适用于多种不同场景人群应用。本发明具有开发周期短且方便接入、借助流转路径图更加直观准确、用户分群更加细化及对目标用户的捕捉能力更强等技术效果。

Description

基于人群流转的用户分群方法、系统、装置及介质
技术领域
本发明涉及用户分群技术领域,尤其涉及基于人群流转的用户分群方法、系统、装置及介质。
背景技术
随着互联网步入大数据时代,企业对大数据的研究逐渐深入,企业的关注点日益聚焦在如何利用大数据进行精准化运营和精准营销,用户分群正是企业在运营中对大数据的实际运用,其主要面向运营人员,运营人员可以筛选出所需要的特定用户群体,用于精准投放、精准营销、个性化推送等场景,以满足运营人员在不同业务场景下的相关需求,使企业效益最大化。
现有的用户分群方法,一般是将来自不同业务线的业务数据提供给数据平台的数据开发人员,加工成相对应的标签后,提供给用户画像平台,运营人员通过用户画像平台提供的用户人群系统,选择合适的标签,并设定标签的阈值,建立规则,然后将单个标签规则或者多个标签规则以交并等运算的方式进行组合,生成用户群组。
这种方式对于运营人员而言快速简单,但缺点也很明显:首先,需要将业务数据提供给数据平台,建立对应的标签,再将标签提供给用户画像平台,需要较长的开发周期。其次,标签阈值的设定和标签规则的组合具有主观因素,对于不同的运营人员来说,对于同一业务场景,其设定不一定相同,这也容易导致后续的运营活动效果不显著,容易造成企业的资损。
因此,本领域的技术人员致力于开发一种能够准确服务到目标用户,并帮助企业运营人员准确把握人群特征的技术方案。
发明内容
有鉴于现有技术的上述缺陷,本发明提供基于人群流转的用户分群方法、系统、装置及介质,用于解决的技术问题是现有的用户分群技术开发周期长、主观因素干扰大以及成本高等问题。
为实现上述目的,本发明提供了一种基于人群流转的用户分群方法,包括:获取用户行为数据并生成业务标签数据;将所述业务标签数据传送至用户画像平台,以基于所述用户画像平台的表结构生成用户画像表;对所述用户画像表进行统计分析后生成对应的业务线统计表,以根据所述业务线统计表构建可视化查询界面;响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,并基于所述人群流转路径图选择非零转化的流转用户生成对应的用户群组,以适用于不同场景人群应用。
在本发明的较佳实施方式中,所述获取用户行为数据并生成业务标签数据,包括:收集并存储各条业务线上的用户行为数据,存储方式包括每条业务线上的用户行为数据按照业务场景或用户角色存储至不同的第一数据表中;基于所述第一数据表增加标签类字段以生成第二数据表;所述标签类字段包括业务标签字段、用户生命周期字段及对应的标签值字段。
在本发明的另一较佳实施方式中,所述用户画像平台的表结构中的字段包括:用户唯一标识、业务线标识、业务维度、业务标签、业务标签值及日期分区。
在本发明的另一较佳实施方式中,所述响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,包括:根据用户在所述可视化查询界面中填入的筛选条件确定其映射于所述业务线统计表中的字段数据并生成对应的查询表达式;将所述查询表达式传送至统计分析工具的接口,以通过调用所述统计分析工具进行数据查询后得到对应的人群流转数据,并将所述人群流转数据进行图示化得到所述人群流转路径图。
在本发明的另一较佳实施方式中,所述人群流转路径图设有对应的路径明细数据;所述路径明细数据包括各用户生命周期在不同时间节点下的用户数,以通过比对所述用户生命周期在不同时间节点下的用户数变化情况来计算转化用户数及转化率。
在本发明的另一较佳实施方式中,所述用户生命周期为业务标签,其标签值包括完单新客、次新用户,沉默新客、活跃用户、流失用户、僵尸用户及沉默用户中的一种或多种。
在本发明的另一较佳实施方式中,所述用户群组的生成过程包括:将人群流转路径上在不同时间节点内的各用户生命周期中的用户ID位图输入至统计分析工具中得到转化用户人群ID列表,并与预构建的群组ID建立关联关系;将相关联的转化用户人群ID列表及群组ID所组成的用户群组存储至离线数据库的数据表中;通过调度任务将所述离线数据库的数据表中的用户群组数据同步至实时搜索引擎中以供在实时应用下调用。
为实现上述目的,本发明提供了一种基于人群流转的用户分群系统,包括:业务标签模块,用于获取用户行为数据并生成业务标签数据;用户画像模块,用于将所述业务标签数据传送至用户画像平台,以基于所述用户画像平台的表结构生成用户画像表;可视化模块,用于对所述用户画像表进行统计分析后生成对应的业务线统计表,以根据所述业务线统计表构建可视化查询界面;用户分群模块,用于响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,并基于所述人群流转路径图选择非零转化的流转用户生成对应的用户群组,以适用于不同场景人群应用。
为实现上述目的,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人群流转的用户分群方法。
为实现上述目的,本发明提供了一种用户分群装置,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述装置执行所述基于人群流转的用户分群方法。
本发明提供的基于人群流转的用户分群方法、系统、装置及介质,具有以下技术效果:
(1)开发周期短且方便接入:本发明中基于人群流转的用户分群方式只需由业务线向用户画像平台提供规定的业务数据即可实现,相比于现有的业务线数据开发成标签的方式,开发周期大大缩短且接入方便。
(2)借助流转路径图更加直观准确:本发明通过人群流转路径图的方式创建用户群组,使用人员可以通过人群流转路径图更加直观地观察符合的人群,得到的用户群组也更加准确,且更加符合业务预期。
(3)用户分群更加细化:本发明支持按照业务标签维度(如用户生命周期)进行的用户分群,相比于现有技术根据业务数据打成标签的方式,粒度更细且更加灵活。
(4)目标用户的捕捉能力更强:本发明中的群组应用到实际场景后,可以通过后续人群流转路径图观察群组应用后的效果,针对效果对群组做出有效的调整,以便能够准确的服务到目标用户。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明实施例中的一种基于人群流转的用户分群方法的流程示意图。
图2是本发明实施例中的业务标签数据的生成过程示意图。
图3是本发明实施例中的用户画像平台的表结构示意图。
图4是本发明实施例中的业务线统计表的示意图。
图5是本发明实施例中的可视化查询界面的示意图。
图6是本发明实施例中的两级流转路径的示意图。
图7是本发明实施例中的用户分群界面示意图。
图8是本发明实施例中的基于人群流转的用户分群装置的硬件结构示意图。
图9是本发明实施例中的基于人群流转的用户分群系统的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
鉴于现有的用户分群方法存在开发周期长和运营效果不显著等问题,本发明提出一种基于人群流转的用户分群方式,通过可视化的人群流转路径图创建用户群组,可以更加直观的选择人群,减少主观因素带来的偏差,生成用户群组更加灵活;接入方便,接入周期短,能够迅速支撑不同业务线的需求;群组应用到实际场景后,可以通过人群流转路径图观察群组应用后的效果,基于效果对群组做出有效调整,以便能够准确的服务到目标用户,帮助企业运营人员准确把握人群特征。
在对本发明进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释:
<1>用户画像,是一种勾画目标用户、联系用户诉求与设计方向的有效工具。在大数据背景下,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供具有针对性的服务。
<2>ClickHouse是一种列式存储数据库,其数据在表中按行存储;列式存储数据库的优势在于查询中的选择规则通过列来定义,因此整个数据库是自动索引化的,按列存储每个字段的数据聚集存储,在查询只需要少数几个字段时,能大大减少读取的数据量。
<3>BitMap是通过一个bit数组来存储特定数据的数据结构;由于bit是数据的最小单位,所以这种数据结构非常节省存储空间。
<4>Hive是基于Hadoop的一种数据仓库工具,用于进行数据提取、转化、加载,这是一种可以存储、查询和分析Hadoop中大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张第一数据表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。
本发明实施例提供基于人群流转的用户分群方法、实施用户分群方法的系统、以及存储用于实现用户分群方法的可执行程序的存储介质。就用户分群方法的实施而言,本发明实施例将对用户分群的示例性实施场景进行说明。
如图1所示,展示了本发明实施例中的一种基于人群流转的用户分群方法的流程示意图。
步骤S11:获取用户行为数据并生成业务标签数据。
所述用户行为数据包括用户基础数据和用户业务数据。其中,所述用户基础数据包括但不限于如用户角色、用户性别、用户年龄、用户联系方式等数据;所述用户业务数据是指用户在使用业务相关产品时通过一些操作所产生的数据,举例来说,用户使用哈啰打车软件进行一次打车的过程中,参与了哈啰打车的相关活动,浏览了哈啰打车软件的一些页面等,上述这些操作都会相应产生业务数据。
所述用户基础数据一般在用户进行账号注册时得到,例如:用户在注册某个应用软件时需填写相关内容(如姓名、性别、年龄和联系方式等),这些内容都会上传至服务器并存储到数据库中,并且会对每一个用户生成对应的用户唯一标识(如用户ID);可将用户唯一标识与设备唯一标识对应绑定,因此当用户登录应用软件时既可使用用户唯一标识进行登录,也可通过设备唯一标识登录来识别身份。
进一步地,可根据所述用户基础数据生成对应的用户唯一标识;将所述用户唯一标识与对应设备的设备唯一标识绑定,以供通过所述用户唯一标识或设备唯一标识来识别用户身份。
所述用户业务数据通过设置对应的埋点组件得到。具体而言,可在相应的渠道,例如APP、H5或者小程序等,设置对应的埋点组件,当用户在相应的渠道使用该产品进行一些操作时(例如登录了APP、完成了一单打车、浏览了某个页面等),可以通过埋点组件将用户的业务数据上传到服务器,并存储到相应的数据库中;每一条业务数据都需要与用户唯一标识或者设备唯一标识进行绑定。举例来说,当用户完成一单打车业务,业务数据中包含了打车的起始点信息、打车时间戳信息、打车距离信息、平均车速信息等,这些业务数据与对应的用户唯一标识绑定后存储。
应理解,埋点是用户行为数据的来源,为获取用户行为数据,需要在各个终端上设置埋点,通过各种各样的埋点获取相应的用户行为数据,用于下游的统计分析和业务迭代。
在本实施例中,所述基于用户行为数据生成业务标签数据的实现过程如图2所示,主要由步骤S21和S22组成:
步骤S21:收集并存储各条业务线上的用户行为数据,存储方式包括每条业务线上的用户行为数据按照业务场景或用户角色存储至不同的第一数据表中。
应理解,所述业务线是指针对某一类服务/产品的特定业务,例如出行业务线、购物业务线、社交业务线、游戏业务线、视频业务线、直播业务线、支付业务线、金融理财业务线等,本实施例不做限定。
在本实施例中的存储方式中,每条业务线可以按照不同的业务场景或者用户角色将数据存储到不同的数据表中,数据表设立多个业务字段,例如用户ID、业务维度、用户角色、业务场景、时间及其他相关的业务字段。以打车业务线为例:用户角色有车主和用户两种,因此可以按照车主和用户这两种角色将对应的用户行为数据分别存储到不同的数据表中。
步骤S22:基于所述第一数据表增加标签类字段以生成第二数据表;所述标签类字段包括业务标签字段、用户生命周期字段及对应的标签值字段。
具体而言,在业务线上可以新建一张数据表,表中的字段至少包括用户ID、业务维度、用户角色、业务场景、时间、业务标签、业务标签值、用户生命周期标签、用户生命周期标签值等。仍以打车业务线为例:用户角色有车主和用户两种;业务维度可以是城市;业务标签可以按照用户的某种行为进行打标签,对应的业务标签值可以是专车、拼车、快车、豪车、经济车等;用户生命周期标签是以第一数据表中的埋点数据作为原始数据,按照某一周期内的用户行为设定标签值。以用户在某天或某周内的行为设定用户生命周期标签,对应的标签值可以是完单新客、次新用户、沉默新客、活跃用户、流失用户、僵尸用户、沉默用户等,将处理后的数据按照周或日的更新周期存储到第一数据表和第二数据表中。
步骤S12:将所述业务标签数据传送至用户画像平台,以基于所述用户画像平台的表结构生成用户画像表。
具体而言,可通过调度任务将所述业务标签数据转移至用户画像平台,其中所述用户画像平台的表结构如图3所示,由用户唯一标识、业务线标识、业务维度、业务标签、业务标签值、日期分区等字段组成。应理解,表结构中的第一列为字段标识,其与第三列的字段名称相对应,第二列是字段的数据类型;本实施例仅以图3所列的字段为例,但并不以此为限。
在一些示例中,若所述业务标签数据已经包含了所述用户画像表中的全部字段,则可通过调度任务将业务标签数据直接同步至用户画像表中;若所述业务标签数据未完全覆盖所述用户画像表中的全部字段,则应在调度任务中增加缺失字段后再同步至用户画像中。通过用户画像平台提供的统一接入规则,可以让各条业务线快速接入。
步骤S13:对所述用户画像表进行统计分析后生成对应的业务线统计表,以根据所述业务线统计表构建可视化查询界面。
在一些示例中,可使用ClickHouse等统计处理工具对所述用户画像表进行统计分析,将得到的统计结果存储至业务线统计表中;其中,所述业务线统计表所包含的字段如图4所示,至少包括业务线、业务维度、业务标签、标签值、数据周期、用户ID位图及日期分区等;业务线统计表中的第一列为字段标识,其与第三列的字段名称相对应,第二列是字段的数据类型;本实施例仅以图4所列的字段为例,但并不以此为限。
以打车业务线为例来说明上述各字段的含义:业务维度可以是城市;业务标签可以是用户生命周期,而当业务标签为用户生命周期时对应的标签值可以是完单新客、次新用户,沉默新客、活跃用户、流失用户、僵尸用户、沉默用户等;数据周期可以是业务线的更新周期(例如周或日等);日期分区就是数据更新的日期;用户ID位图也称作用户bitmap,bitmap是由满足该条数据的用户id统计得到。
需说明的是,bitmap是指位图,又称为栅格图或点位图,是使用像素阵列来表示的图像。在设计用户图像时,每个用户都具有各种标签,数量多达成百上千甚至更多,若按照标签来实现多种多样的用户群体统计(如性别或年龄段等),普通的SQL虽然可以实现但效率很低,因此这种情况下可以使用bitmap来实现,适合给大量整形数据去重和查询,每个标签生成一个bitmap,用户ID对应的下标标为1表示该用户具备该标签。
为便于理解所述可视化查询界面,以图5为例进行说明:查询界面中的业务线对应业务线统计表中的业务线,查询界面中的城市对应业务线统计表中的业务维度,查询界面中的参与分析用户对应业务线统计表中的标签值,查询界面中的时间维度对应业务线统计表中的数据周期,查询界面中的起始节点、中间节点及结束节点对应业务线统计表中的日期分区(指定更新时间的范围)。
步骤S14:响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,并基于所述人群流转路径图选择非零转化的流转用户生成对应的用户群组。
在一些示例中,所述响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,包括:根据用户在所述可视化查询界面中填入的筛选条件确定其映射于所述业务线统计表中的字段数据并生成对应的查询表达式;将所述查询表达式传送至统计分析工具的接口,以通过调用所述统计分析工具进行数据查询后得到对应的人群流转数据,并将所述人群流转数据进行图示化得到所述人群流转路径图。
举例来说,当用户在所述查询界面上按照图示填入筛选条件后,服务端根据前端的用户操作确定其映射在业务线统计表中的字段数据,生成对应的sql表达式并传送至ClickHouse的API接口,以通过调用ClickHouse等统计分析工具进行查询得到人群流转数据。根据所述人群流转数据生成对应的人群流转路径图于前端展示;所述人群流转路径图根据所选的时间节点分为两级流转路径图或多级流转路径图。
所述两级流转路径图由两个时间节点组成,例如图6所示:第一个时间阶段是2021-09-20至2021-09-26(记为第一周),第二个时间节点是2021-09-27至2021-10-03(记为第二周),图中的曲线代表的就是用户流转路径。所述三级流转路径图由三个时间节点组成,这些时间节点可以是某一周或某日,本实施例不做限定,且本领域技术人员在图6展示的两级流转路径图的基础上也能够理解三级流转路径图,此处不再赘述。
进一步地,每个流转路径图都设有对应的路径明细数据,主要体现的是每个时间节点下各用户生命周期的用户ID数据,通过比对不同时间节点下的各用户生命周期的用户数变化计算各用户生命周期的转化用户数及转化率。
具体而言,根据所述人群流转路径图及其明细数据,选择其中转化用户数非零的数据,点击保存用户群组。以图7所展示的用户分群界面为例,在界面填写相关信息,包括但不限于群组名称、应用场景、业务线、有效期、是否开启每日更新等,保存成用户群组,这样生成的用户群组可供用于不同场景下的人群应用。
在一些示例中,所述用户群组的生成过程如下:
首先,将人群流转路径上不同时间节点内的各用户生命周期中的用户ID位图输入至ClickHouse工具中进行处理,得到对应的转化用户人群ID列表。
其次,将所述转化用户人群ID列表与对应的群组ID进行关联,存储至离线数据库的数据表中,例如Hive等数据库,Hive数据库最大的特点在于可通过类SQL来分析大数据,而避免了写MapReduce程序来分析数据,这样使得分析数据更容易;Hive能存储很大的数据集,且适用于离线分析。
最后,通过调度任务,将离线数据库表中的数据同步到实时搜索引擎中,以供实时应用下调用用户群组。所述实时搜索引擎包括ES引擎,ES(ElasticSearch)是高度可伸缩的开源全文搜索和分析引擎,可实现快速实时的存储、搜索、分析大数据。
本发明实施例提供的基于人群流转的用户分群方法可以采用终端侧或服务器侧实施,就基于人群流转的用户分群装置的硬件结构而言,请参阅图8,为本发明实施例提供的基于人群流转的用户分群装置800的一个可选的硬件结构示意图,该装置800可以是移动电话、计算机设备、平板设备、个人数字处理设备、工厂后台处理设备等。基于人群流转的用户分群装置800包括:至少一个处理器801、存储器802、至少一个网络接口804和用户接口806。装置中的各个组件通过总线系统805耦合在一起。可以理解的是,总线系统805用于实现这些组件之间的连接通信。总线系统805除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统。
其中,用户接口806可以包括显示器、键盘、鼠标、轨迹球、点击枪、按键、按钮、触感板或者触摸屏等。
可以理解,存储器802可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,StaticRandom Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous StaticRandomAccess Memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类别的存储器。
本发明实施例中的存储器802用于存储各种类别的数据以支持基于人群流转的用户分群装置800的操作。这些数据的示例包括:用于在基于人群流转的用户分群装置800上操作的任何可执行程序,如操作系统8021和应用程序8022;操作系统8021包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序8022可以包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例提供的基于人群流转的用户分群方法可以包含在应用程序8022中。
上述本发明实施例揭示的方法可以应用于处理器801中,或者由处理器801实现。处理器801可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器801中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器801可以是通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器801可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器801可以是微处理器或者任何常规的处理器等。结合本发明实施例所提供的配件优化方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,基于人群流转的用户分群装置800可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex ProgrammableLogicDevice),用于执行前述方法。
如图9所示,展示了本发明实施例中的一种基于人群流转的用户分群系统的结构示意图。所述用户分群系统900包括业务标签模块901、用户画像模块902、可视化模块903及用户分群模块904。
所述业务标签模块901用于获取用户行为数据并生成业务标签数据。
在一些示例中,所述业务标签模块901获取用户行为数据并生成业务标签数据的过程包括:收集并存储各条业务线上的用户行为数据,存储方式包括每条业务线上的用户行为数据按照业务场景或用户角色存储至不同的第一数据表中;基于所述第一数据表增加标签类字段以生成第二数据表;所述标签类字段包括业务标签字段、用户生命周期字段及对应的标签值字段。
所述用户画像模块902用于将所述业务标签数据传送至用户画像平台,以基于所述用户画像平台的表结构生成用户画像表。
在一些示例中,所述用户画像平台的表结构中的字段包括:用户唯一标识、业务线标识、业务维度、业务标签、业务标签值及日期分区。
所述可视化模块903用于对所述用户画像表进行统计分析后生成对应的业务线统计表,以根据所述业务线统计表构建可视化查询界面。
在一些示例中,所述可视化模块903响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,过程包括:根据用户在所述可视化查询界面中填入的筛选条件确定其映射于所述业务线统计表中的字段数据并生成对应的查询表达式;将所述查询表达式传送至统计分析工具的接口,以通过调用所述统计分析工具进行数据查询后得到对应的人群流转数据,并将所述人群流转数据进行图示化得到所述人群流转路径图。
进一步地,所述人群流转路径图设有对应的路径明细数据;所述路径明细数据包括各用户生命周期在不同时间节点下的用户数,以通过比对所述用户生命周期在不同时间节点下的用户数变化情况来计算转化用户数及转化率。所述用户生命周期为业务标签,其标签值包括完单新客、次新用户,沉默新客、活跃用户、流失用户、僵尸用户及沉默用户中的一种或多种。
所述用户分群模块904用于响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,并基于所述人群流转路径图选择非零转化的流转用户生成对应的用户群组,以适用于不同场景人群应用。
在一些示例中,所述所述用户分群模块904生成用户群组的过程包括:将人群流转路径上在不同时间节点内的各用户生命周期中的用户ID位图输入至统计分析工具中,得到转化用户人群ID列表,并与预构建的群组ID建立关联关系;将相关联的转化用户人群ID列表及群组ID所组成的用户群组存储至离线数据库的数据表中;通过调度任务将所述离线数据库的数据表中的用户群组数据同步至实时搜索引擎中以供在实时应用下调用。
需要说明的是:上述实施例提供的用户分群系统在进行用户分群时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将系统的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的图像分类装置与图像分类方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人群流转的用户分群方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
于本发明提供的实施例中,所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外,任何连接都可以适当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或者诸如红外线、无线电和微波之类的无线技术,从网站、服务器或其它远程源发送的,则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而,应当理解的是,计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质,而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中,磁盘通常磁性地复制数据,而光盘则用激光来光学地复制数据。
综上所述,本发明提供基于人群流转的用户分群方法、系统、装置及介质,能够实现如下:开发周期短且方便接入:本发明中基于人群流转的用户分群方式只需由业务线向用户画像平台提供规定的业务数据即可实现,相比于现有的业务线数据开发成标签的方式,开发周期大大缩短且接入方便。借助流转路径图更加直观准确:本发明通过人群流转路径图的方式创建用户群组,使用人员可以通过人群流转路径图更加直观地观察符合的人群,得到的用户群组也更加准确,且更加符合业务预期。用户分群更加细化:本发明支持按照业务标签维度(如用户生命周期)进行的用户分群,相比于现有技术根据业务数据打成标签的方式,粒度更细且更加灵活。目标用户的捕捉能力更强:本发明中的群组应用到实际场景后,可以通过后续人群流转路径图观察群组应用后的效果,针对效果对群组做出有效的调整,以便能够准确的服务到目标用户。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种基于人群流转的用户分群方法,其特征在于,包括:
获取用户行为数据并生成业务标签数据;
将所述业务标签数据传送至用户画像平台,以基于所述用户画像平台的表结构生成用户画像表;
对所述用户画像表进行统计分析后生成对应的业务线统计表,以根据所述业务线统计表构建可视化查询界面;
响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,并基于所述人群流转路径图选择非零转化的流转用户生成对应的用户群组。
2.如权利要求1所述的基于人群流转的用户分群方法,其特征在于,所述获取用户行为数据并生成业务标签数据,包括:
收集并存储各条业务线上的用户行为数据,存储方式包括每条业务线上的用户行为数据按照业务场景或用户角色存储至不同的第一数据表中;
基于所述第一数据表增加标签类字段以生成第二数据表;所述标签类字段包括业务标签字段、用户生命周期字段及对应的标签值字段。
3.如权利要求1所述的基于人群流转的用户分群方法,其特征在于,所述用户画像平台的表结构中的字段包括:用户唯一标识、业务线标识、业务维度、业务标签、业务标签值及日期分区。
4.如权利要求1所述的基于人群流转的用户分群方法,其特征在于,所述响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,包括:
根据用户在所述可视化查询界面中填入的筛选条件确定其映射于所述业务线统计表中的字段数据并生成对应的查询表达式;
将所述查询表达式传送至统计分析工具的接口,以通过调用所述统计分析工具进行数据查询后得到对应的人群流转数据,并将所述人群流转数据进行图示化得到所述人群流转路径图。
5.如权利要求4所述的基于人群流转的用户分群方法,其特征在于,所述人群流转路径图设有对应的路径明细数据;所述路径明细数据包括各用户生命周期在不同时间节点下的用户数,以通过比对所述用户生命周期在不同时间节点下的用户数变化情况来计算转化用户数及转化率。
6.如权利要求5所述的基于人群流转的用户分群方法,其特征在于,所述用户生命周期为业务标签,其标签值包括完单新客、次新用户,沉默新客、活跃用户、流失用户、僵尸用户及沉默用户中的一种或多种。
7.如权利要求1所述的基于人群流转的用户分群方法,其特征在于,所述用户群组的生成过程包括:
将人群流转路径上在不同时间节点内的各用户生命周期中的用户ID位图输入至统计分析工具中,得到转化用户人群ID列表,并与预构建的群组ID建立关联关系;
将相关联的转化用户人群ID列表及群组ID所组成的用户群组存储至离线数据库的数据表中;
通过调度任务将所述离线数据库的数据表中的用户群组数据同步至实时搜索引擎中以供在实时应用下调用。
8.一种基于人群流转的用户分群系统,其特征在于,包括:
业务标签模块,用于获取用户行为数据并生成业务标签数据;
用户画像模块,用于将所述业务标签数据传送至用户画像平台,以基于所述用户画像平台的表结构生成用户画像表;
可视化模块,用于对所述用户画像表进行统计分析后生成对应的业务线统计表,以根据所述业务线统计表构建可视化查询界面;
用户分群模块,用于响应于用户对所述可视化查询界面的操作而生成对应的人群流转路径图,并基于所述人群流转路径图选择非零转化的流转用户生成对应的用户群组。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述基于人群流转的用户分群方法。
10.一种用户分群装置,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述装置执行如权利要求1至7中任一项所述基于人群流转的用户分群方法。
CN202210569930.3A 2022-05-24 2022-05-24 基于人群流转的用户分群方法、系统、装置及介质 Pending CN114820080A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210569930.3A CN114820080A (zh) 2022-05-24 2022-05-24 基于人群流转的用户分群方法、系统、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210569930.3A CN114820080A (zh) 2022-05-24 2022-05-24 基于人群流转的用户分群方法、系统、装置及介质

Publications (1)

Publication Number Publication Date
CN114820080A true CN114820080A (zh) 2022-07-29

Family

ID=82517226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210569930.3A Pending CN114820080A (zh) 2022-05-24 2022-05-24 基于人群流转的用户分群方法、系统、装置及介质

Country Status (1)

Country Link
CN (1) CN114820080A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599976A (zh) * 2022-11-28 2023-01-13 中国外运股份有限公司(Cn) 用户分群方法、装置、电子设备及存储介质
CN115829615A (zh) * 2023-01-05 2023-03-21 瓴创(北京)科技有限公司 一种基于多数据库的用户分群方法、系统和存储介质
CN117273765A (zh) * 2023-11-21 2023-12-22 广州欧派创意家居设计有限公司 基于自动核检的多级经销商流转数据处理方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004157723A (ja) * 2002-11-06 2004-06-03 Canon Inc 位置情報による画像検索方法
CA2528555A1 (en) * 2004-11-30 2006-05-30 Oculus Info Inc. System and method for interactive visual representation of information content and relationships using layout and gestures
CN107766580A (zh) * 2017-11-20 2018-03-06 北京奇虎科技有限公司 消息的推送方法及装置
CN107895026A (zh) * 2017-11-17 2018-04-10 联奕科技有限公司 一种校园用户画像的实现方法
CN108596679A (zh) * 2018-04-27 2018-09-28 中国联合网络通信集团有限公司 用户画像的构建方法、装置、终端及计算机可读存储介质
CN109213771A (zh) * 2018-06-28 2019-01-15 深圳市彬讯科技有限公司 更新画像标签的方法和装置
CN111400599A (zh) * 2020-03-17 2020-07-10 苏宁金融科技(南京)有限公司 一种用户群画像生成方法、装置及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004157723A (ja) * 2002-11-06 2004-06-03 Canon Inc 位置情報による画像検索方法
CA2528555A1 (en) * 2004-11-30 2006-05-30 Oculus Info Inc. System and method for interactive visual representation of information content and relationships using layout and gestures
CN107895026A (zh) * 2017-11-17 2018-04-10 联奕科技有限公司 一种校园用户画像的实现方法
CN107766580A (zh) * 2017-11-20 2018-03-06 北京奇虎科技有限公司 消息的推送方法及装置
CN108596679A (zh) * 2018-04-27 2018-09-28 中国联合网络通信集团有限公司 用户画像的构建方法、装置、终端及计算机可读存储介质
CN109213771A (zh) * 2018-06-28 2019-01-15 深圳市彬讯科技有限公司 更新画像标签的方法和装置
CN111400599A (zh) * 2020-03-17 2020-07-10 苏宁金融科技(南京)有限公司 一种用户群画像生成方法、装置及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599976A (zh) * 2022-11-28 2023-01-13 中国外运股份有限公司(Cn) 用户分群方法、装置、电子设备及存储介质
CN115829615A (zh) * 2023-01-05 2023-03-21 瓴创(北京)科技有限公司 一种基于多数据库的用户分群方法、系统和存储介质
CN117273765A (zh) * 2023-11-21 2023-12-22 广州欧派创意家居设计有限公司 基于自动核检的多级经销商流转数据处理方法及系统
CN117273765B (zh) * 2023-11-21 2024-02-06 广州欧派创意家居设计有限公司 基于自动核检的多级经销商流转数据处理方法及系统

Similar Documents

Publication Publication Date Title
US8874600B2 (en) System and method for building a cloud aware massive data analytics solution background
CN114820080A (zh) 基于人群流转的用户分群方法、系统、装置及介质
US20160034547A1 (en) Systems and methods for an sql-driven distributed operating system
US20160171505A1 (en) Extract, transform, and load (etl) processing
CN110162512B (zh) 一种日志检索方法、装置及存储介质
CN110675194A (zh) 一种漏斗分析方法、装置、设备及可读介质
CN111046237B (zh) 用户行为数据处理方法、装置、电子设备及可读介质
CN105447723A (zh) 推广系统与推广方法
CN108121742A (zh) 用户分类模型的生成方法及装置
CN115033646B (zh) 一种基于Flink&amp;Doris构建实时数仓系统的方法
WO2015074477A1 (zh) 路径分析方法和装置
CN112115113A (zh) 数据存储系统、方法、装置、设备以及存储介质
US10713070B2 (en) Systems and methods for capturing and visualizing user interactions across devices
CN111553749A (zh) 一种活动推送策略配置方法及装置
CN110968579A (zh) 执行计划的生成与执行方法、数据库引擎及存储介质
CN113287100A (zh) 用于生成内存表格模型数据库的系统和方法
CN117009437A (zh) 一种数据同步的方法、装置、设备及介质
CN110502566B (zh) 近实时数据采集方法、装置、电子设备、存储介质
CN104699788A (zh) 数据库查询方法和装置
CN112506887B (zh) 车辆终端can总线数据处理方法及装置
CN109697234B (zh) 实体的多属性信息查询方法、装置、服务器和介质
CN110062112A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN115168361A (zh) 一种标签管理方法和装置
CN113190236A (zh) Hql脚本校验方法及装置
CN117194463A (zh) 一种查询报表数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination