CN113112069A - 一种人口分布预测方法、人口分布预测系统及电子设备 - Google Patents
一种人口分布预测方法、人口分布预测系统及电子设备 Download PDFInfo
- Publication number
- CN113112069A CN113112069A CN202110391483.2A CN202110391483A CN113112069A CN 113112069 A CN113112069 A CN 113112069A CN 202110391483 A CN202110391483 A CN 202110391483A CN 113112069 A CN113112069 A CN 113112069A
- Authority
- CN
- China
- Prior art keywords
- area
- clustering
- positioning information
- sample points
- population
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000009826 distribution Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 238000005259 measurement Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 3
- 230000011664 signaling Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 6
- 238000003860 storage Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人口预测技术领域,具体涉及一种人口分布预测方法、人口分布预测系统及电子设备。人口分布预测方法包括:收集待预测区域内用户的定位信息,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点;结合预设聚类半径阈值及预设样本阈值,对待预测区域内的用户的定位信息进行聚类处理,获得聚类样本点;基于相同类别的聚类样本点确定待预测区域的核心区的边界和范围;计算核心区的定位热度,以估算核心区的人口。其根据定位信息找出用户比较集中的核心区,通过估算出核心区的具体人口数量,实现对潜在客户群体数量的评估,从而能够为市场业务的开展提供参考。人口分布预测系统及电子设备用于进一步实施人口分布预测方法。
Description
【技术领域】
本发明涉及人口预测技术领域,具体而言,涉及一种人口分布预测方法、人口分布预测系统及电子设备。
【背景技术】
目前,传统的人口预测或者统计方法还主要是通过人工来进行,或者是从官方获取相关数据,对于普通的企业来说,特定区域的人口数量直接关系到了其市场规模,因此,对于普通也起而言准确地预估相应区域的实际活跃人口数量来说非常重要,直接决定了其对于市场潜力的把控精确度。但是,现有的人口预测方法并不适合普通企业使用,这也导致普通企业在很多情况下无法快速、准确地获取相应区域的潜在市场规模,在进行市场的布局时,信息比较滞后,不利于及时调整市场规划。
有鉴于此,特提出本申请。
【发明内容】
为克服现有的人口预测方法中存在的通用性差、获取速度慢、信息滞后的技术问题,本发明提供了一种人口分布预测方法、人口分布预测系统及电子设备。
本发明提供一种人口分布预测方法,其包括:提供待预测区域,收集待预测区域内用户的定位信息,定位信息至少包括定位热度,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点;基于聚类方法,结合预设聚类半径阈值及预设样本阈值,对待预测区域内的用户的定位信息进行聚类处理,以获得聚类样本点;基于相同类别的聚类样本点确定待预测区域的至少一个核心区的边界和范围;及计算至少一个核心区的定位热度,以估算至少一个核心区的人口。
优选地,对定位热度大于预设值的定位信息进行拆分时,将定位热度大于预设值的定位信息等额拆分为多个坐标相同的样本点;和/或进行聚类处理时,利用DBSCN聚类方法,结合坐标信息,按预设聚类半径阈值及预设样本阈值,对用户的定位信息的样本点进行聚类处理,以获得聚类样本点。
优选地,将定位热度大于预设值的定位信息等额拆分为多个坐标相同的样本点包括:将待预测区域划分为若干子区域,标记各个子区域的坐标;利用子区域的定位热度占比计算各个子区域的人数,定义临时计量单位n以拆分各个子区域中数量大于临时计量单位n的区域;及标记每个临时计量单位n的坐标,n的坐标与其所在子区域的坐标相同,以临时计量单位n作为聚类处理的临时样本。
优选地,收集待预测区域内用户的定位信息时,定位信息为GPS定位信息、北斗定位信息或手机信令定位信息。
优选地,确定待预测区域的至少一个核心区的规则包括:结合城市的行政区划边界和类别内的聚类样本点,以确定核心区的边界和范围。
优选地,通过聚类处理获得聚类样本点后,对获得的聚类样本点进行噪声点去除。
优选地,人口分布预测方法还包括:确定待预测区域的至少一个核心区后,获取核心区的人流数据,确定目标客户群体的占比。
优选地,获取核心区的人流数据时,人流数据包括路口监控视频,基于筛分条件,通过视频图像识别对路口监控视频进行分析,得出目标客户群体的占比。
为了进一步解决上述技术问题,本发明还提供一种人口分布预测系统,其包括:信息收集模块、聚类处理模块、核心区分析模块和人口计算模块。信息收集模块用于收集待预测区域中用户的定位信息,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点;聚类处理模块用于结合预设聚类半径阈值及预设样本阈值,对用户的定位信息进行聚类处理,以获得聚类样本点;核心区分析模块用于结合聚类样本点,获取待预测区域的核心区的边界和范围;及人口计算模块用于计算核心区的定位热度,以估算核心区的人口。
为了进一步解决上述技术问题,本发明还提供一种电子设备,其包括:存储器和处理器;存储器存储有计算机程序,计算机程序被设置为运行时执行上述的人口分布预测方法;处理器被设置为通过计算机程序执行上述的人口分布预测方法。
与现有技术相比,本发明提供的技术方案的有益效果包括:
1.人口分布预测方法根据用户的定位信息进行聚类处理,从而找出用户比较集中的核心区,通过估算出核心区的具体人口数量,实现对潜在客户群体数量的评估,从而能够为市场业务的开展提供参考。核心区相当于是整个待预测区域中消费能力最为集中的区域,可以用于为商业活动的市场业务工作提供参考。此外,还可以用于评估整个待预测区域中的人口分布情况和人口分布变化趋势,以作为相关政府部门的人口管理工作的参考以及区域发展规划的参考。
2.对定位热度大于预设值的定位信息进行拆分时,将定位热度大于预设值的定位信息等额拆分为多个坐标相同的样本点,大大提高了聚类处理结构的可靠度。
3.利用子区域的定位热度占比计算各个子区域的人数,定义临时计量单位n来表示各个子区域的人数,嫩够利用人数来表征定位热度,从而更直观地反映出人口规模情况,也便于对样本点进行合理拆分,对于提高聚类处理的准确度和可靠度具有积极意义。
4.结合城市的行政区划边界和类别内的聚类样本点来确定核心区的边界和范围,能够使核心区的划分与行政区划的划分相适应,这样更便于对核心区进行统一管理,避免造成管理上的混乱。
5.经聚类处理后,对获得的聚类样本点进行噪声点去除,能够进一步提高确认核心区时的可靠度。
6.采用对核心区中人流数据的分析,可以统计出目标客户群体的占比情况,从而预估出目标客户群体的大致数量,这样就能够大大提高我们在投放共享单车时对投放量的把控精度,避免过度投放,大大提高了对实际的目标客户的把控精确度,避免过高估计市场潜力,降低了市场开发风险。
【附图说明】
为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例1提供的人口分布预测方法的流程示意图;
图2为本发明实施例1提供的人口分布预测方法的步骤S1的流程示意图;
图3为本发明实施例1提供的人口分布预测方法的步骤S5的流程示意图;
图4为本发明实施例2提供的人口分布预测系统的构成示意图;
图5为本发明实施例3提供的电子设备的结构示意图;
图6为用于实现本发明实施例的终端设备/服务器的计算机系统的结构示意图。
附图标记说明:1-人口分布预测系统;11-信息收集模块;12-聚类处理模块;13-核心区分析模块;14-人口计算模块;8-电子设备;81-存储器;82-处理器;800-计算机系统;801-中央处理单元(CPU);802-存储器(ROM);803-RAM;804-总线;805-I/O接口;806-输入部分;807-输出部分;808-存储部分;809-通信部分;810-驱动器;811-可拆卸介质。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
应当理解,本发明使用的“系统”、“装置”、“单元”、“模块”和/或“模组”等是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
实施例1
请参照图1,本实施例提供一种人口分布预测方法,其包括如下步骤:
S1、提供待预测区域,收集待预测区域内用户的定位信息,定位信息至少包括定位热度,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点;
S2、基于聚类方法,结合预设聚类半径阈值及预设样本阈值,对待预测区域内的用户的定位信息进行聚类处理,以获得聚类样本点;
S3、基于相同类别的聚类样本点确定待预测区域的至少一个核心区的边界和范围;及
S4、计算至少一个核心区的定位热度,以估算至少一个核心区的人口。
人口分布预测方法根据用户的定位信息进行聚类处理,从而找出用户比较集中的核心区,通过估算出核心区的具体人口数量,实现对潜在客户群体数量的评估,从而能够为市场业务的开展提供参考。
可以理解,人口分布预测方法可以用于找出核心区,从而显示出待预测区域当中的人口活动较为活跃、人口较为集中的范围,核心区相当于是整个待预测区域中消费能力最为集中的区域,可以用于为商业活动的市场业务工作提供参考。此外,还可以用于评估整个待预测区域中的人口分布情况和人口分布变化趋势,以作为相关政府部门的人口管理工作的参考以及区域发展规划的参考。
在步骤S1中,对定位热度大于预设值的定位信息进行拆分时,待预测区域即为我们需要找出其核心区并进行潜在用户群体估算的区域,一般可以是按照行政区划进行选择,例如:一个县、一个市或者是一个区等,且不仅限于此,还可以结合实际需要,对区域的边界和范围进行人为性的划分,而不按照已有的行政区划进行划分。待预测区域的划分方式可以灵活选择。
用户的定位信息包括但不限于GPS定位信息、北斗定位信息、手机信令定位信息,可选地,在本实施例中,用户的定位信息采用GPS定位信息。而用户的定位信息可以通过共享单车app进行收集,也可以通过其它常用软件进行收集。
为了便于聚类处理,且为了进一步提高聚类处理的准确度,在步骤S1中,将定位热度大于预设值的定位信息等额拆分为多个坐标相同的样本点,利用这些样本点进行聚类处理。例如,在待预测区域中的某个位置,定位热度非常高,那么就代表这个位置的人数非常多,如果将这个位置整体作为一个点进行聚类处理,会使这个点的体量过大,从而使聚类分析的可靠度降低。因此,我们对定位热度大于预设值的定位信息进行拆分。
请参阅图2,为了进一步提高在实际应用中的便利度,以及提高对定位信息拆分的准确度,我们在进行拆分前,先将定位热度换算成对应的人数,以便于更精确把控聚类处理中每个聚类样本的规模。具体的,步骤S1包括如下步骤:
S11、将待预测区域划分为若干子区域,标记各个子区域的坐标;
S12、利用子区域的定位热度占比计算各个子区域的人数,定义临时计量单位n以拆分各个子区域中数量大于临时计量单位n的区域;及
S13、标记每个临时计量单位n的坐标,n的坐标与其所在子区域的坐标相同,以临时计量单位n作为聚类处理的临时样本。
例如,将待预测区域划分为了3000个大小相同的子区域,第一个子区域的定位热度占比为1%,而整个待预测区域中的总人口数量为100w,那么第一个子区域中的人口数量就是100w*15%=1w。如果将1w直接作为一个样本点进行聚类处理,势必会导致这个样本点中的人口数量相较于其他样本点过多而使聚类处理的准确度下降。为了保障聚类处理的效率和准确度,我们可以将定位热度拆分的预设值也换算为人口数量,并设置为100人,这样就可以将第一个子区域中的这1w人拆分为100个样本点,每个样本点中包含100人,同时,为了便于统计,我们可以引入临时计量单位n,每一个临时计量单位n代表100个人,第一个子区域中的总人数也就是100n。每一个临时计量单位n就可以看作是由第一个子区域拆分出来的样本点,由于这100个临时样本点n均是由第一个子区域拆分而来,这100个临时样本点n的坐标均与第一个子区域的坐标相同。在进行聚类处理时,则用这100个临时样本点n代替第一个子区域参与到聚类处理当中。其他子区域均以类似的方式进行拆分。
需要注意的是,在进行上述的拆分操作时,如果某一个子区域当中的人数无法平均拆分为若干个n,例如某一个子区域中的人数为1035人,就只能拆分为10个n后还剩余35人,由于35人并不足以构成一个n,则将这剩余的35人去除,不计入聚类处理的样本点当中。但若某一个子区域中的总人数就不足10人,无法构成一个n,那么这个子区域的人数就都不作为聚类处理的样本点,将该子区域去除,在进行聚类处理时就无需考虑这个子区域了。由于这些样本点人数非常少,本身对于聚类处理的影响就非常小,参考性也不大,如果强行引入反而会对核心区的确认产生干扰,因此将其去除,以提高确定核心区的可靠性。
需要说明的是,定位热度拆分的预设值以及临时计量单位n的具体数值可以根据实际情况进行灵活调整,如果待预测区域中总人数数量较大,那么可以考虑将临时计量单位n的数值调大一些。如果待预测区域中的定位热度分布比较集中,且各个区域的定位热度占比比较均衡,那么就可以考虑将定位热度拆分的预设值调大一些。但不仅限于此。
在步骤S2中,利用DBSCN聚类方法,结合坐标信息,按预设聚类半径阈值及预设样本阈值,对用户的定位信息的样本点进行聚类处理,以获得所述聚类样本点。所获得的聚类样本点包含了人数信息和坐标信息,便于确定待预测区域的核心区。
为了提高确认核心区时的可靠度,在步骤S2中,还包括对获得的聚类样本点进行噪声点去除。
在步骤S3中,根据获得的聚类样本点,将基于相同类别的聚类样本点所对应的子区域划分为同一个核心区,这样就可以获得待预测区域中的各个核心区。
为了进一步提高核心区范围的合理性,获取核心区的规则包括:结合城市的行政区划边界和类别内的聚类样本点,以确定核心区的边界和范围。也就是说,在确定核心区的范围时,还可以结合实际的城市的行政区划边界,来对核心区的边界和范围进行修正和完善,从而更便于对核心区进行管理。例如子区域都是经人为性划分而来,某些子区域就可能位于两个区的交界处从而同时包含了这两个区的部分范围,且刚好这个子区域又是其所在核心区的最外侧,那么在最后确定核心区时,为了使核心区的管理更加方便,可以将该核心区在此处的边界按照原有的行政区划边界进行确定,而对应的子区域的人口全部划入其所在子区域当中。当然,也可以在将待评估区域划分为若干个子区域时,就直接将行政区划的因素考虑进子区域的划分中。
需要注意的是,对于至少一个核心区的边界和范围的确认中,可以结合考虑的因素除了城市的行政区划边界外,还可以是:道路分布、河流分布、障碍物分布、消费区分布(例如:商超、景点、其他娱乐场所等)、办公区分布、住宅区分布、公共交通站点分布、其他基础配套分布(例如:医院、学校、政府部门等)、政府政策、竞争对手布局、其他实地运营条件(例如:手机网络信号、遮挡物分布、实际运营收益等),且不限于此。
在步骤S4中,由于上文中已经将定位热度换算成了人口数量,那么在估算核心区的总人数时,只需将被聚入该核心区的全部样本点的人数相加即可。当然,如果没有将定位热度换算成人口数量,而是利用定位热度的热度值或者定位热度的百分比来进行聚类处理,那么就需要先利用定位热度的热度值或者定位热度的百分比来计算出整个核心区的定位热度占比,再根据待评估区域中的总人数来估算核心区中的人口数量。
请参阅图3,为了进一步提高对客户群体的把控准确度,并实际找出目标客户群体的规模情况,人口分布预测方法还包括步骤S5:确定所述待预测区域的所述至少一个核心区后,获取核心区的人流数据,确定目标客户群体的占比。通过对人流数据进行分析,将核心区中的人口进行分类,从而确定符合要求的实际目标客户的规模。例如:在投放共享单车之前,核心区中的全部人口并非都是我们的目标客户,只有身体健全、年龄适合的人群才会被统计为我们的目标客户群体。采用对核心区中人流数据的分析,可以统计出目标客户群体的占比情况,从而预估出目标客户群体的大致数量,这样就能够大大提高我们在投放共享单车时对投放量的把控精度,避免过度投放。
为了提高对目标客户群体的估算准确度,在步骤S5中,人流数据包括路口监控视频,基于筛分条件,通过视频图像识别对路口监控视频进行分析,得出目标客户群体的占比。通过视频图像识别,我们可以判断出大致年龄范围、肢体健全状况等信息,从而便于我们确定目标客户群体的实际占比。
需要说明的是,人口分布预测方法还可以用于其他领域的市场潜力评估,或者是用于对某一个新的市场的消费群体的规模进行评估,以作为进入市场前的前景分析参考。且不仅限于此。
实施例2
请参照图4,本实施例提供一种人口分布预测系统1,人口分布预测系统1包括:信息收集模块11、聚类处理模块12、核心区分析模块13和人口计算模块14。
信息收集模块11用于收集待预测区域中用户的定位信息,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点。
聚类处理模块12用于结合预设聚类半径阈值及预设样本阈值,对用户的定位信息进行聚类处理,以获得聚类样本点。
核心区分析模块13用于结合聚类样本点,获取待预测区域的核心区的边界和范围。及
人口计算模块14用于计算核心区的定位热度,以估算核心区的人口。
实施例3
请参照图5,本实施例提供一种电子设备8,包括:存储器81和处理器82。存储器81存储有计算机程序,计算机程序被设置为运行时执行实施例1的人口分布预测方法。处理器82被设置为通过计算机程序执行实施例1的人口分布预测方法。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备/服务器的计算机系统800的结构示意图。图6示出的终端设备/服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问记忆体(RAM)803中的程序而执行各种适当的动作和处理。在RAM803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)界面805也连接至总线804。
以下部件连接至I/O界面805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络界面卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O界面805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的方法中限定的上述功能。需要说明的是,本发明所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是—但不限于—电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问记忆体(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置执行如下步骤:S1、提供待预测区域,收集用户的定位信息,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点;S2、基于聚类方法,结合预设聚类半径阈值及预设样本阈值,对用户的定位信息进行聚类处理,以获得聚类样本点;S3、结合聚类样本点,获取待预测区域的核心区的边界和范围;及S4、计算核心区的定位热度,以估算核心区的人口。
本发明的技术方案相比于现有技术的有益效果是:
1.人口分布预测方法根据用户的定位信息进行聚类处理,从而找出用户比较集中的核心区,通过估算出核心区的具体人口数量,实现对潜在客户群体数量的评估,从而能够为市场业务的开展提供参考。核心区相当于是整个待预测区域中消费能力最为集中的区域,可以用于为商业活动的市场业务工作提供参考。此外,还可以用于评估整个待预测区域中的人口分布情况和人口分布变化趋势,以作为相关政府部门的人口管理工作的参考以及区域发展规划的参考。
2.对定位热度大于预设值的定位信息进行拆分时,将定位热度大于预设值的定位信息等额拆分为多个坐标相同的样本点,大大提高了聚类处理结构的可靠度。
3.利用子区域的定位热度占比计算各个子区域的人数,定义临时计量单位n来表示各个子区域的人数,嫩够利用人数来表征定位热度,从而更直观地反映出人口规模情况,也便于对样本点进行合理拆分,对于提高聚类处理的准确度和可靠度具有积极意义。
4.结合城市的行政区划边界和类别内的聚类样本点来确定核心区的边界和范围,能够使核心区的划分与行政区划的划分相适应,这样更便于对核心区进行统一管理,避免造成管理上的混乱。
5.经聚类处理后,对获得的聚类样本点进行噪声点去除,能够进一步提高确认核心区时的可靠度。
6.采用对核心区中人流数据的分析,可以统计出目标客户群体的占比情况,从而预估出目标客户群体的大致数量,这样就能够大大提高我们在投放共享单车时对投放量的把控精度,避免过度投放,大大提高了对实际的目标客户的把控精确度,避免过高估计市场潜力,降低了市场开发风险。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种人口分布预测方法,其特征在于,包括:
提供待预测区域,收集所述待预测区域内用户的定位信息,所述定位信息至少包括定位热度,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点;
基于聚类方法,结合预设聚类半径阈值及预设样本阈值,对所述待预测区域内的用户的定位信息进行聚类处理,以获得聚类样本点;
基于相同类别的所述聚类样本点确定所述待预测区域的至少一个核心区的边界和范围;及
计算所述至少一个核心区的定位热度,以估算所述至少一个核心区的人口。
2.根据权利要求1所述的人口分布预测方法,其特征在于,对定位热度大于预设值的定位信息进行拆分时,将定位热度大于所述预设值的定位信息等额拆分为多个坐标相同的样本点;和/或
进行聚类处理时,利用DBSCN聚类方法,结合坐标信息,按所述预设聚类半径阈值及所述预设样本阈值,对用户的定位信息的样本点进行聚类处理,以获得所述聚类样本点。
3.根据权利要求2所述的人口分布预测方法,其特征在于,所述将定位热度大于所述预设值的定位信息等额拆分为多个坐标相同的样本点包括:
将所述待预测区域划分为若干子区域,标记各个子区域的坐标;
利用子区域的定位热度占比计算各个子区域的人数,定义临时计量单位n以拆分各个子区域中数量大于所述临时计量单位n的区域;及
标记每个临时计量单位n的坐标,n的坐标与其所在子区域的坐标相同,以临时计量单位n作为聚类处理的临时样本。
4.根据权利要求1所述的人口分布预测方法,其特征在于,收集所述待预测区域内用户的定位信息时,所述定位信息为GPS定位信息、北斗定位信息或手机信令定位信息。
5.根据权利要求1所述的人口分布预测方法,其特征在于,确定所述待预测区域的所述至少一个核心区的规则包括:结合城市的行政区划边界和类别内的聚类样本点,以确定所述核心区的边界和范围。
6.根据权利要求1所述的人口分布预测方法,其特征在于,通过聚类处理获得聚类样本点后,对获得的所述聚类样本点进行噪声点去除。
7.根据权利要求1所述的人口分布预测方法,其特征在于,所述人口分布预测方法还包括:确定所述待预测区域的所述至少一个核心区后,获取所述核心区的人流数据,确定目标客户群体的占比。
8.根据权利要求7所述的人口分布预测方法,其特征在于,获取所述核心区的人流数据时,所述人流数据包括路口监控视频,基于筛分条件,通过视频图像识别对所述路口监控视频进行分析,得出所述目标客户群体的占比。
9.一种人口分布预测系统,其特征在于,包括:
信息收集模块,用于收集待预测区域中用户的定位信息,将定位热度大于预设值的定位信息拆分为多个坐标相关联的样本点;
聚类处理模块,用于结合预设聚类半径阈值及预设样本阈值,对用户的定位信息进行聚类处理,以获得聚类样本点;
核心区分析模块,用于结合所述聚类样本点,获取所述待预测区域的核心区的边界和范围;及
人口计算模块,用于计算所述核心区的定位热度,以估算所述核心区的人口。
10.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器存储有计算机程序,所述计算机程序被设置为运行时执行如所述权利要求1-8任一项所述的人口分布预测方法;
所述处理器被设置为通过所述计算机程序执行如权利要求1-8任一项所述的人口分布预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110391483.2A CN113112069B (zh) | 2021-04-13 | 2021-04-13 | 一种人口分布预测方法、人口分布预测系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110391483.2A CN113112069B (zh) | 2021-04-13 | 2021-04-13 | 一种人口分布预测方法、人口分布预测系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113112069A true CN113112069A (zh) | 2021-07-13 |
CN113112069B CN113112069B (zh) | 2022-08-30 |
Family
ID=76715836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110391483.2A Active CN113112069B (zh) | 2021-04-13 | 2021-04-13 | 一种人口分布预测方法、人口分布预测系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113112069B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114239983A (zh) * | 2021-12-22 | 2022-03-25 | 广东电网有限责任公司 | 一种目标区域的人口流量预测方法及相关装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887440A (zh) * | 2009-05-13 | 2010-11-17 | 财团法人资讯工业策进会 | 热点分析系统及方法 |
CN105069521A (zh) * | 2015-07-24 | 2015-11-18 | 许继集团有限公司 | 一种基于加权fcm聚类算法的光伏电站输出功率预测方法 |
CN105682024A (zh) * | 2016-01-05 | 2016-06-15 | 重庆邮电大学 | 一种基于移动信令数据的城市热点识别方法 |
CN107070961A (zh) * | 2016-09-30 | 2017-08-18 | 阿里巴巴集团控股有限公司 | 基于地理位置数据的热点区域确定方法及装置 |
CN107291816A (zh) * | 2017-05-22 | 2017-10-24 | 西安交通大学 | 一种针对时空序列数据的群体热点区域分析方法 |
CN107563400A (zh) * | 2016-06-30 | 2018-01-09 | 中国矿业大学 | 一种基于网格的密度峰值聚类方法及系统 |
CN109982257A (zh) * | 2019-02-27 | 2019-07-05 | 中国联合网络通信集团有限公司 | 确定移动用户归属区域的方法、装置、系统 |
CN110363046A (zh) * | 2018-02-08 | 2019-10-22 | 西南石油大学 | 基于人脸识别的客流分析系统及部署方法 |
CN112241425A (zh) * | 2020-11-03 | 2021-01-19 | 亿景智联(北京)科技有限公司 | 一种基于时空聚类的在线广告投放区域热点挖掘算法 |
-
2021
- 2021-04-13 CN CN202110391483.2A patent/CN113112069B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887440A (zh) * | 2009-05-13 | 2010-11-17 | 财团法人资讯工业策进会 | 热点分析系统及方法 |
CN105069521A (zh) * | 2015-07-24 | 2015-11-18 | 许继集团有限公司 | 一种基于加权fcm聚类算法的光伏电站输出功率预测方法 |
CN105682024A (zh) * | 2016-01-05 | 2016-06-15 | 重庆邮电大学 | 一种基于移动信令数据的城市热点识别方法 |
CN107563400A (zh) * | 2016-06-30 | 2018-01-09 | 中国矿业大学 | 一种基于网格的密度峰值聚类方法及系统 |
CN107070961A (zh) * | 2016-09-30 | 2017-08-18 | 阿里巴巴集团控股有限公司 | 基于地理位置数据的热点区域确定方法及装置 |
CN107291816A (zh) * | 2017-05-22 | 2017-10-24 | 西安交通大学 | 一种针对时空序列数据的群体热点区域分析方法 |
CN110363046A (zh) * | 2018-02-08 | 2019-10-22 | 西南石油大学 | 基于人脸识别的客流分析系统及部署方法 |
CN109982257A (zh) * | 2019-02-27 | 2019-07-05 | 中国联合网络通信集团有限公司 | 确定移动用户归属区域的方法、装置、系统 |
CN112241425A (zh) * | 2020-11-03 | 2021-01-19 | 亿景智联(北京)科技有限公司 | 一种基于时空聚类的在线广告投放区域热点挖掘算法 |
Non-Patent Citations (2)
Title |
---|
娄峰等: "基于国家主体功能区规划的人口空间分布预测和建议", 《中国人口·资源与环境》 * |
陈丽娜等: "基于手机定位数据的城市人口分布近实时预测", 《地球信息科学学报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114239983A (zh) * | 2021-12-22 | 2022-03-25 | 广东电网有限责任公司 | 一种目标区域的人口流量预测方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113112069B (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Human mobility and socioeconomic status: Analysis of Singapore and Boston | |
Nair et al. | A model of deadheading trips and pick-up locations for ride-hailing service vehicles | |
Trasberg et al. | Spatial and social disparities in the decline of activities during the COVID-19 lockdown in Greater London | |
Herszenhut et al. | The impact of transit monetary costs on transport inequality | |
CN101889294A (zh) | 酒店费率分析系统 | |
CN112687401B (zh) | 聚集风险确定方法及装置、计算机可读介质及电子设备 | |
CN111291216B (zh) | 一种基于人脸结构化数据的落脚点分析方法和系统 | |
Guo et al. | A simple but quantifiable approach to dynamic price prediction in ride-on-demand services leveraging multi-source urban data | |
Jiao et al. | Evaluating spatial accessibility to healthcare services from the lens of emergency hospital visits based on floating car data | |
Roberts et al. | Associations between greenspace and mental health prescription rates in urban areas | |
Ma et al. | Public transportation big data mining and analysis | |
CN111339409A (zh) | 地图展示方法与系统 | |
CN106850777B (zh) | 推送信息的方法和装置 | |
CN111242723B (zh) | 用户子女情况判断方法、服务器及计算机可读存储介质 | |
KR20200025975A (ko) | 과밀지수 산출방법 및 이를 이용한 창업 지원 시스템 | |
CN113112069B (zh) | 一种人口分布预测方法、人口分布预测系统及电子设备 | |
CN107730022A (zh) | 一种网点分布评估方法及装置 | |
CN115033766A (zh) | 数据处理方法、生活圈的显示方法及装置、介质、设备 | |
CN110895543B (zh) | 人口迁徙跟踪展示方法、装置及存储介质 | |
Hong et al. | Conserved quantities in human mobility: From locations to trips | |
Mane et al. | Influence of proximal land use and network characteristics on link travel time | |
CN113095209B (zh) | 一种客流的人群识别方法、系统及电子设备 | |
CN114511432A (zh) | 一种基于区块链的数字乡村管理服务系统 | |
CN117933512A (zh) | 下车点推荐方法、装置、计算机设备和存储介质 | |
Pengfei et al. | Towards a smart healthy city: A generalised flow-based 2SFCA method for incorporating actual mobility data in healthcare accessibility evaluation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |