CN111931998B - 一种基于移动定位数据的个体出行模式预测方法及系统 - Google Patents
一种基于移动定位数据的个体出行模式预测方法及系统 Download PDFInfo
- Publication number
- CN111931998B CN111931998B CN202010733720.4A CN202010733720A CN111931998B CN 111931998 B CN111931998 B CN 111931998B CN 202010733720 A CN202010733720 A CN 202010733720A CN 111931998 B CN111931998 B CN 111931998B
- Authority
- CN
- China
- Prior art keywords
- travel
- data
- traffic
- points
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000008569 process Effects 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 55
- 239000011159 matrix material Substances 0.000 claims description 51
- 230000006870 function Effects 0.000 claims description 25
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004148 unit process Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 abstract description 11
- 210000004027 cell Anatomy 0.000 description 43
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Traffic Control Systems (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种基于移动定位数据的个体出行模式预测方法及系统,该方法包括获取出行数据、交通小区向量化以及预测出行模式共三个大步骤。该方法综合了居民出行行为的特征和地点兴趣点的特征,能够较为全面的得到个体出行模式的特点,且该方法对数据的来源限制较少,不同来源的移动定位数据或不同来源的兴趣点数据均可以进行处理运算,能够适用于不同时间、空间环境下的个体出行模式预测,因此,该方法对个体出行模式预测过程更加高效、可靠,更适合推广应用。
Description
技术领域
本发明涉及公共交通信息处理技术领域,更具体的说是涉及一种基于移动定位数据的个体出行模式预测方法及系统。
背景技术
目前,随着经济的不断发展以及城镇化的不断推进,城市内的汽车保有量进一步提升,使得原有城市道路上的车流量超出了预先设计的道路交通量,从而导致交通拥堵现象越来越严重,使得城市内部的交通运输效率下降,服务水平下降,要避免城镇人口增加及汽车保有量上升带来的城市交通拥堵问题,城市合理布局、道路规划与建设、交通政策的制订与实施是解决交通拥堵问题的主要手段。而交通需求与城镇居民出行行为、出行模式密不可分,会对交通系统状态产生重要影响。所以,研究个体的出行模式能够得到背后隐含的居民出行需求,出行需求能够为提高运输效率和服务水平提供理论支持,不论在城市合理布局、道路规划与建设、交通政策的制订与实施中,个体的出行模式的预测都是不可或缺的一个关键环节。
然而,现有的居民出行模式预测方法,数据来源主要基于人工的交通调查。对于人工交通调查这一方法,存在着调查成本较高、效率较低、数据量较小以及部分数据主观性较强、可靠性不足的缺陷,使得最终得到的个体出行模式预测结果可参考价值不高。
因此,如何提供一种高效可靠的个体出行模式预测方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于移动定位数据和兴趣点数据的个体出行模式预测方法,该方法通过对移动定位数据进行处理,获得居民的出行行为数据,分别基于出行行为数据和兴趣点数据将交通小区进行向量化,并利用矩阵分解综合,最终通过计算向量距离实现居民出行行为的预测,解决了现有的出行模式预测方法成本高、效率低、数据量较小以及部分数据主观性较强、可靠性不足的问题。
为了实现上述目的,本发明采用如下技术方案:
一方面,本发明提供了一种基于移动定位数据的个体出行模式预测方法,该方法包括:
获取出行数据:获取出行个体的移动定位原始数据,并对所述移动定位原始数据进行处理,得到出行个体的出行起讫点数据;
交通小区向量化:根据所述出行起讫点数据和预先获得的城市兴趣点数据,将交通小区向量化,得到交通小区向量;
预测出行模式:求解所述交通小区向量之间的距离,并对得到的交通小区向量之间的距离进行排序,实现出行模式的预测。
进一步地,所述获取出行数据的步骤中,对所述移动定位原始数据进行处理的过程,具体包括:
步骤1:将所述移动定位原始数据按照用户和时间进行聚类,并去除聚类后数据中的异常点;
该步骤实质上是对移动定位原始数据进行预处理和清洗的过程,主要分为以下两个部分:(1)将数据按照用户和时间进行聚类。(2)去除数据之中的异常点,第一部分主要目的是将原先过于庞大的整体数据拆分为按照时间和用户聚类的子数据。第二部分所提到的异常点主要包括了重复点、漂移点和超出研究范围的点等。
步骤2:预先设定时间阈值和空间阈值,将聚类后数据中的轨迹点划分为出行和停留两个属性,得到出行点和停留点,将出行点两侧的停留点作为一次出行的起讫点,得到起讫点数据;
该步骤通过设定时间和空间阈值的方法,将起讫点提取转化为将轨迹点划分为出行和停留两个属性的这一等价问题,将轨迹点划分为出行和停留后,停留点之间的出行点即为出行对应的轨迹,出行点两侧的停留点便是这次出行的起讫点。
步骤3:将得到的起讫点数据与预先划分的交通小区关联。
进一步地,所述交通小区向量化步骤,具体包括:
步骤1:基于所述出行起讫点数据,通过居民出行数据的特点,借鉴自然语言处理的方法,构建交通小区的特征向量,该步骤通过构建最大目标函数,使目标函数值最大,找到对应的词汇向量求解最大目标函数,得到基于出行轨迹链的地点矩阵;
所述最大目标函数为:
其中:
式中,集合V={v1,v2,...,vn}表示所有的词汇,集合W={w1,w2,...,wT}为训练集,c表示词汇窗口的大小,即中心词汇的前/后c个词汇被认为是相关联的上下文,T=|W|表示训练集中所有的词汇的数目,分别表示上下文词汇和中心词汇的向量m表示累加中的变量,m在累加过程中,在这个范围内变化。例如c=2m=-2,-1,1,2。wn+m是中心wn大小为2的词汇窗。
步骤2:预先获取城市兴趣点(Point of Interest,POI)数据,根据地点的兴趣点特征,使用层次聚类算法划分交通小区特点,得到基于城市兴趣点信息的地点矩阵;
步骤3:对所述基于出行轨迹链的地点矩阵和基于城市兴趣点信息的地点矩阵进行处理,构建并求解最小目标函数,得到交通小区的地点本质特征矩阵。
所述最小目标函数为:
其中,
进一步地,所述交通小区向量(即交通小区的地点本质特征矩阵)之间的距离计算公式为:
DC(A,B)=1-SC(A,B)
其中,
式中,DC(A,B)表示交通小区向量A,B之间的距离,SC(A,B)表示交通小区向量A,B之间的相似度,Ai、Bi分别表示向量A,B的各分量,n表示向量A,B的维数。
另一方面,本发明还提供了一种基于移动定位数据的个体出行模式预测系统,该系统使用上述的个体出行模式预测方法,具体包括以下几部分:
出行数据获取模块,用于获取出行个体的移动定位原始数据,并对所述移动定位原始数据进行处理,得到出行个体的出行起讫点数据;
交通小区向量化模块,用于根据所述出行起讫点数据和预先获得的城市兴趣点数据,将交通小区向量化,得到交通小区向量;以及
出行模式预测模块,用于求解所述交通小区向量之间的距离,并对得到的交通小区向量之间的距离进行排序,完成出行模式的预测。
进一步地,所述出行数据获取模块具体包括:
获取单元,用于获取出行个体的移动定位原始数据;
预处理单元,用于将所述移动定位原始数据按照用户和时间进行聚类,并去除聚类后数据中的异常点;
起讫点提取单元,用于预先设定时间阈值和空间阈值,将聚类后数据中的轨迹点划分为出行和停留两个属性,得到出行点和停留点,将出行点两侧的停留点作为一次出行的起讫点,得到起讫点数据;以及
关联单元,用于将得到的起讫点数据与预先划分的交通小区关联。
进一步地,所述交通小区向量化模块具体包括:
轨迹确定单元,基于所述出行起讫点数据,通过自然语言处理方法构建交通小区的最大目标函数,求解最大目标函数,得到基于出行轨迹链的地点矩阵;
兴趣点确定单元,预先获取城市兴趣点数据,根据地点的兴趣点特征划分交通小区特点,得到基于城市兴趣点信息的地点矩阵;以及
分解单元,对所述基于出行轨迹链的地点矩阵和基于城市兴趣点信息的地点矩阵进行处理,构建并求解最小目标函数,得到交通小区的地点本质特征矩阵。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于移动定位数据的个体出行模式预测方法及系统,该方法综合了居民出行行为的特征和地点兴趣点的特征,能够较为全面的得到个体出行模式的特点,且该方法对数据的来源限制较少,不同来源的移动定位数据或不同来源的兴趣点数据均可以进行处理运算,能够适用于不同时间、空间环境下的个体出行模式预测,因此,该方法对个体出行模式预测过程更加高效、可靠,更适合推广应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的一种基于移动定位数据的个体出行模式预测方法的流程示意图;
图2为本发明实施例中基于移动定位数据的个体出行模式预测方法具体实现流程示意图;
图3为本发明实施例中基于移动定位数据的个体出行模式预测方法中起讫点提取步骤的原理示意图;
图4为本发明实施例中基于移动定位数据的个体出行模式预测方法中预测结果展示状态示意图;
图5为本发明提供的一种基于移动定位数据的个体出行模式预测系统的结构架构示意图;
图6为本发明实施例中出行数据获取模块的结构架构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一方面,参见附图1,本发明实施例公开了一种基于移动定位数据的个体出行模式预测方法,该方法包括:
S1:获取出行数据:获取出行个体的移动定位原始数据,并对移动定位原始数据进行处理,得到出行个体的出行起讫点数据;
S2:交通小区向量化:根据出行起讫点数据和预先获得的城市兴趣点数据,将交通小区向量化,得到交通小区向量;
S3:预测出行模式:求解交通小区向量之间的距离,并对得到的交通小区向量之间的距离进行排序,实现出行模式的预测。
下面以北京市做为预测范围,通过具体的实例并结合附图2,对上述方法进行具体说明。
本实施例提取2018年9月3日,北京市约300万匿名用户的移动定位数据作为范例,兴趣点数据由某开源数据网站提供。
移动定位数据起讫点提取主要包括以下几步:
1、数据预处理
数据预处理主要分为以下两个部分:(1)将数据按照用户和时间进行聚类。(2)去除数据之中的异常点。第一部分主要目的是将原先过于庞大的整体数据拆分为按照时间和用户聚类的子数据。遍历整个数据集,将用户ID列和时间列中内容都相同的行写入路径为“.\时间\用户名”的文件当中。第二部分数据清洗主要目的为移除以下三种异常数据:
①重复点:由于客观上一个用户在一个时刻只能出现在一个位置,因此,每个时刻只应该对应一个经纬度数据。对于某一用户在同一时刻的多条数据,本实施例选择出现次数最多的经纬度作为该时刻真正的经纬度,并将其他数据丢弃,若多个经纬度出现次数一样,则取数据中行数靠前的经纬度作为该时刻的经纬度;
②漂移点:由于时间或空间上定位数据产生的异常使得定位点大幅偏离应有位置或时刻的点称为漂移点。判断漂移点的简单方法为计算轨迹点的瞬时速度,即相邻轨迹点的位移和相邻轨迹点时间差的商。本实施例中假设任何城市内交通的瞬时速度都应该在50m/s以内(这里主要考虑的出行方式是步行、非机动车、机动车和地铁,高速铁路和飞机不在城市内交通的研究范围之内),因此对于瞬时速度超过这一值的前后两个轨迹点丢弃。
③超出研究范围的点:本实施例的研究范围为北京市内居民的出行模式,因此,对于纬度不在北纬39°26′至41°03′之间,经度不在东经115°25′至117°30′之间的点丢弃,不再研究。
2.起讫点提取
本实施例中时间阈值设置为30分钟,空间阈值设置为300米。如图3所示,P1、P2、P3……P12抽象代表了APP数据中的轨迹点,箭头代表了它们按照时间产生的顺序。首先进行第一次时空间层面聚类,即指按照给定的时间阈值与空间阈值,将空间上足够靠近,同时时间上停留足够长的轨迹点聚类为一个起点(或终点),并将其余起讫点之间的轨迹点作为移动轨迹点。例如P3~P6;P8、P9;P10~P12,在时间和空间上都足够靠近,被提取划分为停留点,而其余的点则不满足条件,被划分为两个停留点之间的出行行为轨迹点。之后进行空间层面的聚类,将空间上足够靠近、满足阈值的点聚类为地点,提取出由A到B再回到A的出行轨迹。在本实施例中对于地点A内的轨迹点{p1,p2,p3,...,pn}={(x1,y1),(x2,y2),(x3,y3),...,(xn,yn)}∈A,计算轨迹点的平均经纬度作为地点A的位置点。这样做的目的是将A从一个范围转换为一个点,便于后续操作。
3.交通小区匹配
本范例使用PostgreSQL系统结合其中的PostGIS插件,利用其内置功能实现了轨迹数据与交通小区的高效便捷的匹配与输出
交通小区向量化主要分为以下步骤:
(1)基于居民出行数据
本实施例采用神经网络的方法求解该步骤的目标函数,神经网络构造如表1所示:
表1神经网络结构
层 | 输出维度 | 参数数目 |
全连接层1 | (无,300) | 516300 |
激活函数1 | (无,300) | 0 |
丢弃层1 | (无,300) | 0 |
全连接层2 | (无,1720) | 517720 |
激活函数2 | (无,1720) | 0 |
其中,总参数数目:1,034,020
可训练参数数目:1,034,020
不可训练参数数目:0
训练后全连接层1的参数矩阵即为对应的交通小区向量矩阵。
(2)基于兴趣点数据
对于交通小区k∈K{1,2,3...},使用pkj代表该小区的j∈J{1,2,3...}类POI的数目。使用rkj代表pkj在类j当中的百分比排名。则rkj越大,该交通小区的j特征在城市中越显著。对于每个交通小区k,可得到对应向量rk=(rk1,rk2,…,rkJ)。
同时,为了减少POI信息均值和方差的影响,即要保证各类POI指标的作用影响是相同的,应对rk进行标准化处理,如下式所示:
经过上述处理,每个交通小区都得到了基于POI的位置特征向量。之后进行层次聚类,本实施例中基于邓恩指数(DVI)选择7作为聚类簇数,将结果与地图地理信息进行匹配,对各类别进行解释,每种交通小区对应的含义总结可表示为:
1.商圈或高人流密度景点
2.公园景点
3.政府机关、汽车站、火车站等局部枢纽
4.郊区、低人流密度区域
5.工业园区
6.多功能混合区
7.住宅区
(3)矩阵分解
本实施例基于矩阵分解模型,分别分解地点本质特征矩阵L、基于POI信息的地点矩阵R、基于出行轨迹链提取的地点矩阵M,并保证其所分解的隐向量都是一致的。将最小目标函数在CPLEX软件中求解得到地点本质特征矩阵。
上述的矩阵分解模型(即最小目标函数)为:
其中,
在本实施例中,矩阵R为1911×27的矩阵,其中1911来自于交通小区数目,27来自于POI数据类别j∈J{1,2,3...27};矩阵M为1911×300的矩阵,其中1911来自于交通小区数目,300为全连接层1中神经元总数,该值为人工设定,设定的依据为多次实验所得;矩阵L为求解所得到的结果,为1911×300的矩阵,该矩阵的大小为人工设定,1911设定的依据是保持交通小区数目不变性,300设定的依据为实验和减少结果矩阵形状的差异。
出行模式预测步骤具体如下:
本实施例中使用常用的余弦距离Dc作为向量距离,如下式所示:
DC(A,B)=1-SC(A,B)
其中,
式中,DC(A,B)表示交通小区向量A,B之间的距离,SC(A,B)表示交通小区向量A,B之间的相似度,Ai、Bi分别表示向量A,B的各分量,n表示交通小区向量A,B的维数。本实施例中提到的交通小区向量实质上就是上述步骤中求出的地点本质特征矩阵。
对于给定交通小区km,分别计算交通小区km与交通小区k∈K{1,2,3...}\km中各元素的距离Dc,对计算结果进行由小到大的排序,取前q个值,其对应的交通小区的编号即该小区最有可能来自或前往的前q个交通小区。
以交通小区编号为666号的交通小区为例,分别计算666号交通小区对应向量与1,2,…665,667,…,1910,1911号交通小区对应向量的余弦距离,将结果从小到大排列,如图4所示,得到666交通小区最为关联的前九个交通小区编号依次为:491,493,667,665,398,662,494,68,510。那么对于处于666号交通小区的个体,可根据该结果预测其下一步出行目的地。之后再一次在下一目的地以同样方法进行预测,最终得到该个体出行模式的预测结果。
综上所述,本发明实施例公开的上述基于移动定位数据和兴趣点数据的个体出行模式预测方法及系统中,方法功能核心是实现交通小区的向量化。对此首先要实现移动定位数据中居民出行起讫点的提取,本实施例通过从轨迹数据之中提取其运动(出行)和停止(活动)的行为,划分出居民的出行起讫点数据。根据出行起讫点分布频率和自然语言词汇分布频率的特点,结合自然语言处理的上下文预测分析方法,实现了基于出行行为的地点向量化。通过兴趣点数据,基于层次聚类将各交通小区归类到若干个类别当中,并实现了交通小区的向量化。假设获得方式不同的地点向量背后存在统一的地点综合特征向量,给出了矩阵分解方法,将基于出行和基于兴趣点的向量结果统一。最终根据向量距离得到个体出行模式预测结果。
另一方面,参见附图5,本发明实施例还公开了一种基于移动定位数据的个体出行模式预测系统,该系统使用上述的个体出行模式预测方法,具体包括以下几部分:
出行数据获取模块1,用于获取出行个体的移动定位原始数据,并对移动定位原始数据进行处理,得到出行个体的出行起讫点数据;
交通小区向量化模块2,用于根据出行起讫点数据和预先获得的城市兴趣点数据,将交通小区向量化,得到交通小区向量;以及
出行模式预测模块3,用于求解交通小区向量之间的距离,并对得到的交通小区向量之间的距离进行排序,完成出行模式的预测。
参见附图6,上述的出行数据获取模块1具体包括:
获取单元11,用于获取出行个体的移动定位原始数据;
预处理单元12,用于将移动定位原始数据按照用户和时间进行聚类,并去除聚类后数据中的异常点;
起讫点提取单元13,用于预先设定时间阈值和空间阈值,将聚类后数据中的轨迹点划分为出行和停留两个属性,得到出行点和停留点,将出行点两侧的停留点作为一次出行的起讫点,得到起讫点数据;以及
关联单元14,用于将得到的起讫点数据与预先划分的交通小区关联。
参见附图5,上述实施例中提到的交通小区向量化模块2具体包括:
轨迹确定单元21,基于出行起讫点数据,通过自然语言处理方法构建交通小区的最大目标函数,求解最大目标函数,得到基于出行轨迹链的地点矩阵;
兴趣点确定单元22,预先获取城市兴趣点数据,根据地点的兴趣点特征划分交通小区特点,得到基于城市兴趣点信息的地点矩阵;以及
分解单元23,对基于出行轨迹链的地点矩阵和基于城市兴趣点信息的地点矩阵进行处理,构建并求解最小目标函数,得到交通小区的地点本质特征矩阵。
在本实施例中,移动定位包括两个部分,第一部分为获取位置信息,包括了智能手机、用户终端等;第二部分为结果可视化,基于第一部分获得的位置信息在电子地图上标示出对应的位置。由移动定位数据的特点所决定,移动定位数据具有规模大、成本低、可信度高的优势,为居民出行模式研究打开了新思路。本实施例基于目前在城市内已经高度普及的智能手机,利用智能手机产生的移动定位数据作为基础,设计和提出了居民轨迹结点属性判断方法及居民出行轨迹的划分和提取方法,以及基于居民出行行为的个体出行模式预测方法,为居民出行模式的研究提供了重要参考。
不难发现,本发明实施例提供的基于移动定位数据和兴趣点数据的个体出行模式预测方法及系统,与现有技术相比,具有如下的优点:
1、该方法综合了居民出行行为的特征和地点兴趣点的特征,能够较为全面的得到个体出行模式的特点;
2、该方法对数据的来源限制较少,不同来源的移动定位数据或不同来源的兴趣点数据均可以进行处理运算,且根据不同的使用场景可以设定具体的参数以及对输入数据进行切片筛选以满足具体需要,该方法能够适用于不同时间空间环境下的个体出行模式预测,具有可推广性。
3、该方法实现的交通小区的向量化,可与其他出行模式或城市交通规划研究(城市交通小区间OD矩阵推算、交通小区类别划分、个体出行目的地预测等)相结合,具有可拓展性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (3)
1.一种基于移动定位数据的个体出行模式预测方法,其特征在于,包括:
获取出行数据:获取出行个体的移动定位原始数据,并对所述移动定位原始数据进行处理,得到出行个体的出行起讫点数据;
交通小区向量化:根据所述出行起讫点数据和预先获得的城市兴趣点数据,将交通小区向量化,得到交通小区向量;
预测出行模式:对所述交通小区进行编号,选择目标交通小区,求解所述目标交通小区与其他交通小区对应向量之间的距离,并对得到的交通小区向量之间的距离进行由小到大排序,取前q个值,其对应的交通小区的编号即所述目标交通小区最有可能来自或前往的q个交通小区,实现出行模式的预测;
所述获取出行数据的步骤中,对所述移动定位原始数据进行处理的过程,具体包括:
将所述移动定位原始数据按照用户和时间进行聚类,并去除聚类后数据中的异常点;
预先设定时间阈值和空间阈值,将聚类后数据中的轨迹点划分为出行和停留两个属性,得到出行点和停留点,将出行点两侧的停留点作为一次出行的起讫点,得到起讫点数据;
将得到的起讫点数据与预先划分的交通小区关联;
所述交通小区向量化步骤,具体包括:
基于所述出行起讫点数据,构建交通小区的最大目标函数,求解最大目标函数,得到基于出行轨迹链的地点矩阵;
预先获取城市兴趣点数据,根据地点的兴趣点特征划分交通小区特点,得到基于城市兴趣点信息的地点矩阵;
对所述基于出行轨迹链的地点矩阵和基于城市兴趣点信息的地点矩阵进行处理,构建并求解最小目标函数,得到交通小区的地点本质特征矩阵,即得到交通小区向量;
所述交通小区向量之间的距离计算公式为:
Dc(A,B)=1-Sc(A,B)
其中,
式中,DC(A,B)表示交通小区向量A,B之间的距离,SC(A,B)表示交通小区向量A,B之间的相似度,Ai、Bi分别表示向量A,B的各分量,e表示交通小区向量A,B的维数。
2.根据权利要求1所述的一种基于移动定位数据的个体出行模式预测方法,其特征在于,所述异常点包括重复点、漂移点和超出预测范围的点。
3.一种基于移动定位数据的个体出行模式预测系统,其特征在于,使用权利要求1-2任一项所述的一种基于移动定位数据的个体出行模式预测方法,实施个体出行模式预测,该系统包括:
出行数据获取模块,用于获取出行个体的移动定位原始数据,并对所述移动定位原始数据进行处理,得到出行个体的出行起讫点数据;
交通小区向量化模块,用于根据所述出行起讫点数据和预先获得的城市兴趣点数据,将交通小区向量化,得到交通小区向量;以及
出行模式预测模块,用于对所述交通小区进行编号,选择目标交通小区,求解所述目标交通小区与其他交通小区对应向量之间的距离,并对得到的交通小区向量之间的距离进行由小到大排序,取前q个值,其对应的交通小区的编号即所述目标交通小区最有可能来自或前往的q个交通小区,实现出行模式的预测;
所述出行数据获取模块具体包括:
获取单元,用于获取出行个体的移动定位原始数据;
预处理单元,用于将所述移动定位原始数据按照用户和时间进行聚类,并去除聚类后数据中的异常点;
起讫点提取单元,用于预先设定时间阈值和空间阈值,将聚类后数据中的轨迹点划分为出行和停留两个属性,得到出行点和停留点,将出行点两侧的停留点作为一次出行的起讫点,得到起讫点数据;以及关联单元,用于将得到的起讫点数据与预先划分的交通小区关联;
所述交通小区向量化模块具体包括:
轨迹确定单元,基于所述出行起讫点数据,通过自然语言处理方法构建交通小区的最大目标函数,求解最大目标函数,得到基于出行轨迹链的地点矩阵;
兴趣点确定单元,预先获取城市兴趣点数据,根据地点的兴趣点特征划分交通小区特点,得到基于城市兴趣点信息的地点矩阵;以及
分解单元,对所述基于出行轨迹链的地点矩阵和基于城市兴趣点信息的地点矩阵进行处理,构建并求解最小目标函数,得到交通小区的地点本质特征矩阵,即得到交通小区向量;
所述交通小区向量之间的距离计算公式为:
Dc(A,B)=1-Sc(A,B)
其中,
式中,DC(A,B)表示交通小区向量A,B之间的距离,SC(A,B)表示交通小区向量A,B之间的相似度,Ai、Bi分别表示向量A,B的各分量,e表示交通小区向量A,B的维数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010733720.4A CN111931998B (zh) | 2020-07-27 | 2020-07-27 | 一种基于移动定位数据的个体出行模式预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010733720.4A CN111931998B (zh) | 2020-07-27 | 2020-07-27 | 一种基于移动定位数据的个体出行模式预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931998A CN111931998A (zh) | 2020-11-13 |
CN111931998B true CN111931998B (zh) | 2023-05-02 |
Family
ID=73314230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010733720.4A Expired - Fee Related CN111931998B (zh) | 2020-07-27 | 2020-07-27 | 一种基于移动定位数据的个体出行模式预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931998B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112288048B (zh) * | 2020-12-28 | 2021-03-26 | 湖南师范大学 | 一种基于多源数据驱动的城市人群出行识别方法 |
CN112784901B (zh) * | 2021-01-22 | 2023-04-07 | 北京航空航天大学 | 一种基于位置数据的行人出行分类检测方法和系统 |
CN112883133B (zh) * | 2021-02-01 | 2024-05-24 | 南京航空航天大学 | 基于时序数据和功能演变数据的流量预测方法 |
CN113192321A (zh) * | 2021-03-17 | 2021-07-30 | 东南大学 | 一种面向综合土地利用的交通需求分布提取方法 |
CN113011512B (zh) * | 2021-03-29 | 2024-12-03 | 长沙理工大学 | 基于rbf神经网络模型的交通生成预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600960A (zh) * | 2016-12-22 | 2017-04-26 | 西南交通大学 | 基于时空聚类分析算法的交通出行起讫点识别方法 |
CN107977734A (zh) * | 2017-11-10 | 2018-05-01 | 河南城建学院 | 一种时空大数据下基于移动马尔可夫模型的预测方法 |
WO2018120424A1 (zh) * | 2016-12-29 | 2018-07-05 | 平安科技(深圳)有限公司 | 基于位置服务的人群分类方法、装置、设备和存储介质 |
CN108256914A (zh) * | 2018-01-17 | 2018-07-06 | 华东师范大学 | 一种基于张量分解模型的兴趣点种类预测方法 |
CN109583640A (zh) * | 2018-11-23 | 2019-04-05 | 东南大学 | 一种基于多源定位数据的城市出行客流属性识别方法 |
-
2020
- 2020-07-27 CN CN202010733720.4A patent/CN111931998B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600960A (zh) * | 2016-12-22 | 2017-04-26 | 西南交通大学 | 基于时空聚类分析算法的交通出行起讫点识别方法 |
WO2018120424A1 (zh) * | 2016-12-29 | 2018-07-05 | 平安科技(深圳)有限公司 | 基于位置服务的人群分类方法、装置、设备和存储介质 |
CN107977734A (zh) * | 2017-11-10 | 2018-05-01 | 河南城建学院 | 一种时空大数据下基于移动马尔可夫模型的预测方法 |
CN108256914A (zh) * | 2018-01-17 | 2018-07-06 | 华东师范大学 | 一种基于张量分解模型的兴趣点种类预测方法 |
CN109583640A (zh) * | 2018-11-23 | 2019-04-05 | 东南大学 | 一种基于多源定位数据的城市出行客流属性识别方法 |
Non-Patent Citations (2)
Title |
---|
《impacts of free-floating bikesharing system on public transit ridership》;Xiaolei Ma 等;《Transportation Research Part D Transport and Environment 》;20191130;全文 * |
基于手机信令大数据的城市居民出行OD预测;孙卓等;《数学的实践与认识》;20190608(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111931998A (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931998B (zh) | 一种基于移动定位数据的个体出行模式预测方法及系统 | |
Liu et al. | Multi-scale urban passenger transportation CO2 emission calculation platform for smart mobility management | |
CN112133090A (zh) | 一种基于手机信令数据的多方式交通分布模型构建方法 | |
CN104318324B (zh) | 基于出租车gps记录的机场巴士站点及路线规划方法 | |
CN111612670B (zh) | 一种构建机动车排放清单的方法、装置和计算机设备 | |
CN112749825B (zh) | 预测车辆的目的地的方法和装置 | |
CN110298500A (zh) | 一种基于出租车数据和城市路网的城市交通轨迹数据集生成方法 | |
CN110836675B (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
Jiang et al. | The impact of the transportation network companies on the taxi industry: Evidence from Beijing’s GPS taxi trajectory data | |
CN108062857B (zh) | 用于出租车乘客出行目的的预测方法 | |
CN105117595B (zh) | 一种基于浮动车数据的私家车出行数据集成方法 | |
CN115062873B (zh) | 交通出行方式预测方法和装置、存储介质及电子设备 | |
CN110807552B (zh) | 一种基于改进K-means的城市电动客车行驶工况构建方法 | |
Zhang et al. | How road network transformation may be associated with reduced carbon emissions: An exploratory analysis of 19 major Chinese cities | |
CN108694463A (zh) | 一种城市轨道交通站点进出站客流预测方法 | |
CN113096389B (zh) | 一种基于多源数据的全国高速公路网络拓扑构建方法 | |
Zhao et al. | Understanding the spatio-temporally heterogeneous effects of built environment on urban travel emissions | |
Bao et al. | Spatiotemporal clustering analysis of shared electric vehicles based on trajectory data for sustainable urban governance | |
CN114896523B (zh) | 一种基于乡村旅游线路的道路规划方法及装置 | |
CN114723596A (zh) | 一种基于多源交通出行数据和主题模型的城市功能区识别方法 | |
CN110942622A (zh) | 一种基于停车场实时运营大数据的停车场规划方法 | |
Cao et al. | Investigating the nonlinear relationship between car dependency and the built environment | |
CN117763241A (zh) | 一种融合多源数据的城市功能区精细化识别方法和系统 | |
CN114862001B (zh) | 一种基于区域功能增强特征的城市人群流量预测方法及系统 | |
CN111931968B (zh) | 一种应用手机gps数据来优化公共自行车站点布局的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20230502 |