CN107086935B - 基于wifi ap的人流量分布预测方法 - Google Patents
基于wifi ap的人流量分布预测方法 Download PDFInfo
- Publication number
- CN107086935B CN107086935B CN201710457666.3A CN201710457666A CN107086935B CN 107086935 B CN107086935 B CN 107086935B CN 201710457666 A CN201710457666 A CN 201710457666A CN 107086935 B CN107086935 B CN 107086935B
- Authority
- CN
- China
- Prior art keywords
- wifi
- aps
- data
- type
- moment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及基于WIFI AP记录的机场客流分布预测方法,涉及大数据挖掘处理技术领域,从控制中心获取WIFI AP记录进行预处理操作,通过WIFI AP接入设备数量分类WIFI AP,为各类WIFI AP分别构建训练样本集,使用各自的训练样本集分别构建回归模型,根据回归模型获取测试样本集,集合第一类模型和第二类模型的测试样本集获得预测结果,预测机场客流分布。本发明利用相关特性,使用数据挖掘及机器学习的相关方法,对机场的客流分布进行预测,达到有效利用机场资源。
Description
技术领域
本发明涉及计算机信息处理技术领域,具体涉及数据挖掘和机器学习相关领域。
背景技术
以数据为原料的数据挖掘和机器学习技术在生活中发挥着越加重要的作用,通过挖掘数据中的“知识”,达到利用数据的目的。机场时时刻刻生产着数据,在机场候机楼,无线WIFI覆盖了整个区域,而WIFI接入接入点AP(access point)记录着每时刻的乘客连接人数,通过WIFI AP记录,能够大致的估测当前时刻的旅客时空分布。旅客的时空分布与飞机的起降也非常相关,当飞机到达后的一段时间,或者飞机起飞前的一段时间,部分位置旅客密度会有所增多,这也是估计旅客时空分布的关键依据。如何有效利用此类数据,合理应用于预测未来的旅客时空分布,是一个如何提高机场服务效率的关键问题。
同时,本发明不仅仅限于机场对人流量的预测,也可以适用于其他大型购物场所等人流量大的场所,通过WIFI接入AP的数量,对人流量进行预测判断,方便发生紧急情况时进行疏散等。现有技术采用的方法只能观察当前时刻的的客流时空分布,不能实现对未来某段时间客流分布进行预测。
发明内容
本发明针对现有技术中存在的上述技术问题,提供一种基于机场WIFI AP记录及航班排班记录的机场客流分布预测系统,旨在解决机场客流量分布预测问题。可以根据预测的旅客时空分布,进行预先的计划和安排,达到更有效的利用机场资源,更好的机场服务。
本发明解决上述技术问题的技术方案是,提供一种基于WIFI AP(无线设备接入数量)记录的机场客流分布预测方法,包括:从控制中心获取WIFI AP记录进行预处理操作,通过WIFI AP接入设备数量分类WIFI AP,为各类WIFI AP分别构建训练样本集,使用训练样本集构建回归模型;构建测试样本集并预测机场客流分布。
进行预处理操作具体包括,对获取的WIFI AP记录进行缺失值处理,对于某一WIFIAP的缺失数据,使用与缺失数据最近预定天数D内记录对应时刻该WIFI AP的设备连接数量的均值进行填充;使用ARMA模型(自回归滑动平均模型)对经过填充后的数据进行平滑处理,然后进行脏数据处理,对进行脏数据处理后的WIFI AP数据,根据公式:计算该WIFI AP规约后的第i个时间段的设备连接数量,以预定时间段T为单位对WIFI AP连接数以平均值进行规约,其中,xij为该WIFI AP第i个时间段的第j时刻的设备连接数量。
所述分类WIFI AP具体包括,对于各个WIFI AP,计算其设备连接数的方差,并根据其方差由大到小进行排序,然后使用二八法则将WIFI AP划分为两类,方差较小的WIFI AP为第一类WIFI AP,方差较大的WIFI AP为第二类WIFI AP。
对于第一类WIFI AP,取最近预定天数D的数据,建立第一类WIFI AP训练集。
对于第二类WIFI AP,取最近预定天数D的数据,通过标签提取与特征提取构建第二类训练集。标签与特征是组成样本的两个部分,特征是样本各个属性的表现,标签是对样本具有标记行为的属性。通过特征与标签,构成了一个样本。
构建第二类训练集的方法为:取编号为i的WIFI AP在j时刻的设备连接数量y,构成样本x(i,j,F,y),其中,F为该样本的特征,包含3部分子特征:(1)历史特征:对于该WIFIAP的同一时刻,分别计算该WIFI AP在以天为单位的同一时刻的均值、最小值、最大值和方差信息。(2)航班特征:根据航班排班记录的登机口位置信息,统计该登机口位置预定时段内(10分钟、30分钟、60分钟及120分钟内)飞机起飞数量,并与WIFI AP的位置信息关联后进行数据合并。(3)获取位置特征:包含WIFI AP所在的区域、所在楼层、所在组编号和WIFI AP坐标信息。
对于第一类WIFI AP,使用第一类WIFI AP训练集,根据公式计算编号i的WIFI AP在j时刻的预测值yij,构建第一类WIFI AP回归模型其中,xijk为编号i的WIFI AP第k天j时刻的设备连接数量,set1为第一类WIFI AP集合。根据第一类模型Y1进行预测,得出第一类WIFI AP的设备连接数量。
对于第二类WIFI AP,其特点为设备连接数的方差较高。对于这类WIFI AP,根据预测日前最近预定天数D的数据进行标签提取,进行特征提取获取第二类训练样本集,公式yij=h(xij)计算编号i的WIFI AP的j时刻的预测值yij,构建第二类回归模型其中,xij为预测样本,预测样本的获取方法与第二类训练集样本的方法相同,并置该样本的标签为空,set2为第二类WIFI AP集合,h函数为使用第二类训练集所训练的基于最优叶子分裂的GBDT回归模型。使用第二类模型Y2进行预测,得出第二类WIFI AP的设备连接数量。
根据公式Y=Y1∪Y2对第一类模型和第二类模型进行集成。对第一类模型的预测结果和第二类模型的预测结果集成,作为最终预测结果。预测结果为各个WIFI AP在预测时间内的各时刻的设备接入个数,通过各个WIFI AP的设备接入个数,获取各个WIFI AP所在区域的人流数,人流密度等信息。
此方法通过各个WIFI AP的设备连接数量的方差排序后所具有的长尾效应的特点,使用二八原则把WIFI AP点分为两类,并对这两类WIFI AP分别建模,相对于建立在单模型预测的方法上,此方法预测结果更加准确。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本发明提供的一种基于机场WIFI AP记录的机场客流分布预测方法流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,不能据此限定本发明的技术方案,和权利保护范围。本领域普通技术人员在没有经过创造性劳动可能获得的所有其他实施例,都属于本申请保护的范围。
图1为本发明提供的一种基于机场WIFI AP记录及航班排班记录的机场客流分布预测方法的流程图,具体包括:
从控制中心获取WIFI AP记录及航班排班记录,一般WIFI AP记录包含三列,第一列为WIFI AP的标签,排班记录包含四列,分别为:航班号等。选取最近预定天数D(如30天)的记录。其中,WIFI AP记录包含三列,第一列为WIFI AP的标签,包含WIFI AP的固有信息,主要为WIFI AP所在的区域、所在楼层、所在组编号和WIFI AP坐标信息,第二列为WIFI AP的设备连接数量,第三列为时间戳。航班排班记录包含四列,分别为:航班号,预定起降时间,实际起降时间及登机口信息。
对获取的WIFI AP记录及航班排班记录进行缺失值处理。对于某一WIFI AP的缺失数据,使用与缺失数据最近预定天数该WIFI AP记录的对应时刻设备连接数量的均值对应的相关数值进行填充。
对经过缺失值处理后的WIFI AP记录进行脏数据处理。使用ARMA模型对数据进行平滑处理。对于各个WIFI AP,通过输入其连续时间的WIFI AP的设备接入数量,输出经过ARMA模型处理后的连续时间的WIFI AP的设备接入数量,输出数据较输入数据的特点为,各WIFI AP点的设备接入数量随时间的变化更加的平滑。对进过脏数据处理后的WIFI AP数据进行数据规约。以预定时间段T(如10分钟)为单位对WIFI AP连接数以平均值进行规约,即每时间段T生成一条数据。根据公式计算该WIFI AP规约后的第i个预定时间段的设备连接数量ri,其中,xij为某WIFI AP第i个预定时间段的第j分钟的设备连接数量。
对于各个WIFI AP,计算其设备连接数的方差,并根据其方差由大到小进行排序,然后使用二八法则划分WIFI AP为两类。方差较小的WIFI AP为第一类WIFI AP,方差较大的WIFI AP为第二类WIFI AP。方差的计算方法为:取某一WIFI AP在各个时间的设备接入数量所构成的序列,计算该序列的方差,作为该WIFI AP的方差。二八法则划分方法为:取前20%的方差较大的WIFI AP作为第二类WIFI AP,取后80%的方差较小的WIFI AP为第一类WIFIAP。
对于第一类WIFI AP,取最近预定天数D的数据,建立第一类WIFI AP训练集,训练集由若干样本x(i,j,y)构成,其中,i为WIFI AP的编号,j为某一时刻,y为编号i的WIFI AP在j时刻的设备连接数量。
对于第二类WIFI AP,使用预测日前最近预定天数D的数据进行标签提取,标签为某一时刻该WIFI AP的设备连接数,对第二类WIFI AP进行特征提取。根据上述所获取数据进行特征提取,其中获取的数据包含WIFI AP记录和航班记录。
其特征包含3部分:
(1)历史特征:对于该WIFI AP的同一时刻,分别计算该WIFI AP在以天为单位的同一时刻的均值、最小值、最大值和方差信息。
(2)航班特征:航班是影响连接数波动的主要因素之一,根据航班的登机口位置信息,统计该登机口位置在每间隔预定时间段内航班起飞降落数量,并与WIFI AP的位置信息关联后进行数据合并,获得航班特征。
(3)位置特征:包含WIFI AP所在的区域、所在楼层、所在组编号和WIFI AP坐标信息。
对于第一类WIFI AP,根据第一类WIFI AP训练集,根据公式计算编号i的WIFI AP在j时刻的设备连接数yij,构建第一类WIFI AP回归模型其中,xijk为编号i的WIFI AP第k天j时刻的设备连接数量,set1为第一类WIFI AP集合。根据第一类模型Y1进行预测,预测结果为P1。预测结果P1为预测的某WIFI AP在某时刻的设备连接数量。
对于第二类WIFI AP,其特点为设备连接数的方差较高。对于这类WIFI AP,根据公式yij=h(xij)计算编号i的WIFI AP的j时刻的预测值yij,构建第二类回归模型其中,xij为测试样本,set2为第二类WIFI AP集合,h函数为使用第二类训练集所训练的基于最优叶子分裂GBDT回归模型。使用第二类模型Y2进行预测,预测结果为P2。P2是根据第二类WIFI AP训练集所获得的某WIFI AP的设备连接数量。
训练集为第二类训练集,即第二类WIFI AP所构成的训练样本集合,训练方法为输入训练集,经过GBDT算法构建预测模型,后输入预测集,通过已构建的GBDT模型进行预测,一个样本(记录)由特征和标签组成,一组特征对应一个标签,标签为该WIFI AP的设备连接数量。
根据公式Y=Y1∪Y2对第一类模型和第二类模型进行集成。
根据公式P=P1∪P2对第一类模型的预测结果和第二类模型的预测结果集成,作为最终预测结果。预测结果为各个WIFI AP在各个时刻的设备接入个数。
Claims (2)
1.基于WIFI AP记录的人流量分布预测方法,其特征在于:包括步骤:从控制中心获取WIFI AP记录进行预处理操作,对于各个WIFI AP,计算其设备连接数的方差,根据其方差由大到小进行排序,使用二八法则将WIFI AP划分为两类,方差较小的WIFI AP为第一类WIFIAP,方差较大的WIFI AP为第二类WIFI AP,对于第一类WIFI AP,以WIFI AP的设备连接数量作为WIFI AP训练集,根据WIFI AP训练集,根据预测日前最近预定天数D的数据进行标签提取,获取训练样本集,调用公式计算编号i的WIFI AP在j时刻的预测值yij,构建第一类WIFI AP回归模型根据模型Y1预测WIFI AP的设备连接数量P1;对于第二类WIFI AP,根据公式yij=h(xij)计算编号i的WIFI AP在j时刻的预测值yij,构建第二类回归模型根据模型Y2预测WIFI AP的设备连接数量P2,根据公式P=P1∪P2集成预测结果,获得各个WIFI AP在各个时刻的设备接入数,预测机场客流分布,其中,xijk为编号i的WIFI AP第k天j时刻的设备连接数量,set1为第一类WIFI AP集合,xij为测试样本,set2为第二类WIFI AP集合,h函数为使用第二类训练集所训练的基于最优叶子分裂GBDT回归模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710457666.3A CN107086935B (zh) | 2017-06-16 | 2017-06-16 | 基于wifi ap的人流量分布预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710457666.3A CN107086935B (zh) | 2017-06-16 | 2017-06-16 | 基于wifi ap的人流量分布预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107086935A CN107086935A (zh) | 2017-08-22 |
CN107086935B true CN107086935B (zh) | 2020-05-12 |
Family
ID=59606305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710457666.3A Active CN107086935B (zh) | 2017-06-16 | 2017-06-16 | 基于wifi ap的人流量分布预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107086935B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107657335A (zh) * | 2017-09-06 | 2018-02-02 | 武汉科技大学 | 一种机场客流量的时空分布预测方法 |
CN107679647B (zh) * | 2017-09-06 | 2019-12-24 | 武汉科技大学 | 一种机场客流量的时空分布预测装置 |
CN109492788B (zh) * | 2017-09-13 | 2020-12-11 | 中移(杭州)信息技术有限公司 | 预测人流量以及建立人流量预测模型的方法及相关设备 |
CN108038116A (zh) * | 2017-10-24 | 2018-05-15 | 安徽四创电子股份有限公司 | 一种基于gis的人流密度监控方法 |
CN108376292A (zh) * | 2017-12-12 | 2018-08-07 | 广州汇智通信技术有限公司 | 一种人群流量预测方法、系统及设备 |
CN108306962B (zh) * | 2018-01-30 | 2021-09-28 | 河海大学常州校区 | 一种商业大数据分析系统 |
CN108260087A (zh) * | 2018-01-31 | 2018-07-06 | 福州大学 | 一种基于wiifi长短时记忆的室内人流分布预测方法 |
CN109120463B (zh) * | 2018-10-15 | 2022-01-07 | 新华三大数据技术有限公司 | 流量预测方法及装置 |
CN109214612A (zh) * | 2018-11-20 | 2019-01-15 | 广东机场白云信息科技有限公司 | 一种基于xgboost机场客流量时空分布预测方法 |
CN111209180B (zh) * | 2018-11-21 | 2023-04-25 | 中国移动通信集团浙江有限公司 | 一种基于模糊匹配的回归测试方法和装置 |
CN109362034B (zh) * | 2018-11-22 | 2020-12-04 | 南京茶非氪信息科技有限公司 | 一种宏观区域连通道热度预测方法 |
CN109657700B (zh) * | 2018-11-22 | 2022-11-11 | 南京茶非氪信息科技有限公司 | 一种宏观区域连通道热度检测方法 |
CN110060102B (zh) * | 2019-04-18 | 2022-05-03 | 重庆邮电大学 | 基于偏标记学习的用户所在商铺定位大数据预测方法 |
CN110166945B (zh) * | 2019-06-04 | 2020-11-24 | 中国民用航空总局第二研究所 | 航站楼旅客流量动态预测方法、装置、介质及设备 |
TWI716061B (zh) * | 2019-08-02 | 2021-01-11 | 中華電信股份有限公司 | 適用於基地台的障礙預測裝置和障礙預測方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8532069B2 (en) * | 2005-09-23 | 2013-09-10 | Ramesh Balwani | Local area wireless airspace management |
CN104573859A (zh) * | 2014-12-31 | 2015-04-29 | 合肥城市云数据中心有限公司 | 一种基于Wifi定位和云数据处理技术的人流量预测方法 |
CN205283824U (zh) * | 2015-11-24 | 2016-06-01 | 如东信息技术服务(上海)有限公司 | 一种基于wifi的机场人流预警系统 |
CN106407706A (zh) * | 2016-09-29 | 2017-02-15 | 北京理工大学 | 基于boruta算法的多层次老年人体能状态量化等级计算方法 |
-
2017
- 2017-06-16 CN CN201710457666.3A patent/CN107086935B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8532069B2 (en) * | 2005-09-23 | 2013-09-10 | Ramesh Balwani | Local area wireless airspace management |
CN104573859A (zh) * | 2014-12-31 | 2015-04-29 | 合肥城市云数据中心有限公司 | 一种基于Wifi定位和云数据处理技术的人流量预测方法 |
CN205283824U (zh) * | 2015-11-24 | 2016-06-01 | 如东信息技术服务(上海)有限公司 | 一种基于wifi的机场人流预警系统 |
CN106407706A (zh) * | 2016-09-29 | 2017-02-15 | 北京理工大学 | 基于boruta算法的多层次老年人体能状态量化等级计算方法 |
Non-Patent Citations (3)
Title |
---|
数据竞赛思路分享:机场客流量的时空分布预测;https://blog.csdn.net/u014135091/article/details/53396336;《CSDN博客》;20161129;正文第1-9页 * |
机器学习小组知识点24:数据预处理之数据清理(Data-Cleaning);https://blog.csdn.net/Eric2016_Lv/article/details/53483716;《CSDN博客》;20161206;正文第1-2页 * |
机器学习小组知识点26:数据预处理之数据规约(Data Reduction);https://blog.csdn.net/Eric2016_Lv/article/details/53487700;《CSDN博客》;20161206;正文第1-3页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107086935A (zh) | 2017-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107086935B (zh) | 基于wifi ap的人流量分布预测方法 | |
CN104751681B (zh) | 一种基于统计学习模型的停机位分配方法 | |
CN101527086B (zh) | 航班时隙分配的实现方法 | |
Notomista et al. | A fast airplane boarding strategy using online seat assignment based on passenger classification | |
CN111401601B (zh) | 一种面向延误传播的航班起降时间预测方法 | |
CN104156594B (zh) | 一种基于贝叶斯网的航班过站时间动态估计方法 | |
CN104182805B (zh) | 基于服刑人员行为特征集成学习模型的危险倾向预测方法 | |
Wang et al. | Frequency and aircraft size dynamics in a concentrated growth market: The case of the Chinese domestic market | |
CN110334959A (zh) | 一种航班舱位资源分配方法及装置 | |
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
CN113673740A (zh) | 机场容量预测系统 | |
Wei et al. | Modeling crew itineraries and delays in the national air transportation system | |
CN110852497A (zh) | 基于大数据深度学习的场面可变滑出时间预测系统 | |
CN111598333B (zh) | 客流数据的预测方法及装置 | |
CN111985685B (zh) | 基于大数据分析的航班计划优化方法、装置及电子设备 | |
CN106846082A (zh) | 基于硬件信息的旅游冷启动用户产品推荐系统及方法 | |
CN110751340A (zh) | 一种机场安检区域人流预测分析方法及系统 | |
CN112651671A (zh) | 一种航班舱位调整方法及相关设备 | |
CN113362604A (zh) | 一种基于扇区动态交通特征的管制员工作负荷评估方法 | |
DE102017128688A1 (de) | Systeme und Verfahren zur Neueinteilung von Flugreisenden | |
CN109934482B (zh) | 一种基于大数据的航站楼精细化运行评估系统和方法 | |
CN106779214A (zh) | 一种基于主题模型的多因素融合民航旅客出行预测方法 | |
CN108510106A (zh) | 一种基于排队论和广义随机petri网的机场安检流程优化方法 | |
CN107679647B (zh) | 一种机场客流量的时空分布预测装置 | |
CN111507502B (zh) | 一种虚占航班班次的优化方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |