Nothing Special   »   [go: up one dir, main page]

CN114882069A - 基于lstm网络和注意力机制的出租车轨迹异常检测方法 - Google Patents

基于lstm网络和注意力机制的出租车轨迹异常检测方法 Download PDF

Info

Publication number
CN114882069A
CN114882069A CN202210213647.7A CN202210213647A CN114882069A CN 114882069 A CN114882069 A CN 114882069A CN 202210213647 A CN202210213647 A CN 202210213647A CN 114882069 A CN114882069 A CN 114882069A
Authority
CN
China
Prior art keywords
track
layer
speed
sequence
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210213647.7A
Other languages
English (en)
Inventor
段守坚
徐建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202210213647.7A priority Critical patent/CN114882069A/zh
Publication of CN114882069A publication Critical patent/CN114882069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30241Trajectory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法,包括如下步骤:步骤1:车辆轨迹数据预处理;步骤2:特征提取;步骤3:模型构建与训练;步骤4:输入数据经过嵌入层,LSTM层,注意力层,输出层之后得到期望的输出,若该输出与轨迹的实际类别不同;则反向传播算法则会将误差反向传播至输出层,每层的神经元会根据该误差对网络结构中的参数进行更新,并可视化异常检测结果。本方法所检测出来的异常轨迹更加接近真实情况,而且准确率也更高,有利于对出租车异常轨迹成因的分析操作。

Description

基于LSTM网络和注意力机制的出租车轨迹异常检测方法
技术领域
本发明涉及出租车轨迹异常检测方法技术领域,更具体地说,本发明涉及一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法。
背景技术
随着出租车行业规模的迅速扩大,大量的出租车轨迹数据被生成和采集。对于这些轨迹数据的分析可以帮助研究者获得许多有价值的信息。如位置预测,兴趣模式等相关的隐含事实。其中轨迹异常检测是最热门的的研究课题之一。轨迹异常值指的是在轨迹数据集中与其他数据模式或路线有着显著不同的轨迹。
传统的出租车轨迹异常检测算法包括四类,基于分类的检测技术、基于历史相似性的检测技术、基于距离的检测技术以及基于网格划分的检测技术。基于分类的检测技术在训练阶段,通过手动选择的特征数据集学习构建分类器,在测试阶段,根据分类器将轨迹划分为正常异常两类。通过历史相似性的检测技术根据历史收集到的大量轨迹数据挖掘出所有频繁模式建立特征模型,异于特征模式的数据识别为异常轨迹。基于距离的检测技术将于大多数轨迹有较远距离的轨迹视为异常。基于网格划分的检测技术则是从划分成等大小网格的单元中识别异常的网格单元序列。
现有方法有如下方面的不足:
1.仅仅考虑了出租车轨迹的位置信息,没有挖掘出租车轨迹蕴含的时间和速度信息。特征提取不充分,会降低异常检测的准确度。
2.基于距离的匹配方法非常耗时,LCSS,EDR等方法时间复杂度到达o(m*n),而欧式距离度量则要求轨迹点相同,很难应用到真实场景中。
3.预处理过程比较简单,出租车原始轨迹数据集中包括大量的冗余点,噪音点进行异常检测之前必须剔除。
LSTM是递归神经网络(RNN)在深度学习中的一种变体,可以通过门控网络来增加或删除信息。由于其特殊网络结构特征,它在序列数据中表现出优异的学习能力,许多研究表明,通过LSTM网络捕获轨迹之间的关联特征是探索和解决轨迹异常检测问题的一个很好的选择。
注意力机制借鉴了人类的视觉注意力,人类在观察外部事物时是有一种选择性的,即重点关注感兴趣的那部分区域,忽略其他无关细节,也就是常说的注意力焦点。在出租车轨迹数据训练过程中,轨迹的拐点,特征信息对于模型的训练应当有着更高的权重。将注意力机制运用到LSTM网络中,能捕捉特征中的长范围依赖,可以提高关键轨迹点在训练过程中的权重。
发明内容
为了克服现有技术的上述缺陷,本发明提供了一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法,本发明所要解决的技术问题是:现有技术中轨迹异常检测方法特征提取不充分,耗时较高,轨迹预处理方法较为简单的技术问题。
为实现上述目的,本发明提供如下技术方案:
一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法,包括如下步骤:
步骤1:车辆轨迹数据预处理:收集出租车轨迹数据,轨迹数据是包括由经度、纬度、时间戳三元组p所组成的轨迹序列Tr:p1→p2→…pn,剔除掉原始数据集中的冗余点,噪音点,并将所在地图化身成100*100m的网格,将轨迹转换成网格序列,通过skip-gram将网格序列转换成向量表示,并计算轨迹点的速度转换成对应的道路等级表示;根据城市数据采集当天的实际情况计算提取城市特征点,并将轨迹数据集划分训练集,验证集,测试集;
步骤2:特征提取:将轨迹数据离散化,将轨迹的网格单元ID序列提取位置特征,将连续的时间戳以平均时间间隔离散化提取时间特征,利用滑动窗口算法得到速度特征,将特征速度与位置特征、时间特征相拼接经过word2vec转化成词向量序列构造embedding层;
步骤3:模型构建与训练,构造LSTM-attention模型,将从步骤2中提取的特征作为输入加载到LSTM-attention模型中训练,通过LSTM层提取特征,注意力层区分拐点和非拐点的权重,训练完成后,将作为测试数据集的特征输入到 LSTM-attention模型,对模型分类准确性进行验证;
步骤4:输入数据经过嵌入层,LSTM层,注意力层,输出层之后得到期望的输出,若该输出与轨迹的实际类别不同;则反向传播算法则会将误差反向传播至输出层,每层的神经元会根据该误差对网络结构中的参数进行更新,并可视化异常检测结果。
进一步的,所述车辆轨迹数据预处理包括如下步骤:
步骤1.1:通过车联网数据采集出租车轨迹数据,利用Douglas-Peucker算法过滤掉数据集中冗余采样点数据记录;具体步骤为:将一段轨迹的首末点连接成一条直线,求这段轨迹所有点与这条直线的垂直距离,并找出最大距离值dmax, 用dmax与预定义的阈值D相比:若dmax<D,这条曲线上的中间点全部舍去;若dmax≥D,保留dmax对应的坐标点,并以该点为界,把轨迹分为两部分,对这两部分重复上述步骤,直至过滤所有冗余采样点数据;
步骤1.2:判断并去除噪音点,假设Pi-1,Pi,Pi+1为按照采样时间顺序排列的三个点,若Pi为可能的异常点,那么在Pi-1到Pi与Pi到Pi+1的平均速度差别较大。根据速度和时间得到距离,若在ti-1到ti的路径长度小于该时间段内最大可达位移r1,且在时刻ti到ti+1的路径长度小于该时间段内最大可达位移r2,则可以根据出租车最大行驶速度v,r1,r2投影出Pi可能出现的区域,若Pi出现区域之内,则Pi设为正常点,否则为噪音点,需要去除;
步骤1.3:将原始轨迹转换成离散序列,将整个地图划分为100*100m的等大小网格单元,每个网格单元用单独ID进行标记,每个GPS点被转换成其所在网格单元的ID,将轨迹序列转换成网格单元ID序列;
步骤1.4:利用skip-gram模型学习网格的表示,使得相邻的网格在向量空间中有着相似的表示,将轨迹成网格单元ID序列转换成向量;
步骤1.5:计算出轨迹点的速度并利用图将轨迹点的速度转换成对应的道路等级,将轨迹由网格单元ID表示转换成轨迹点速度序列;并根据城市数据采集当天的实际情况计算提取城市特征点。
进一步的,所述步骤2包括如下步骤:
步骤2.1:滑动窗口特征提取,假如偏移值最大为w,最小为1;每个窗口的移动速度特征有3个维度平均速度,最大速度,最小速度{mean,max,min},统计数据|max-min|表示窗口速度的变化,如果统计数据|max-min|不为0则更新偏移为先前值一半,直至偏移为1;如果统计数据|max-min|为0,则更新偏移为之前的2倍,直至偏移到达最大值;
步骤2.2:位置信息挖掘,向量表示的网格序列包括轨迹的位置信息;
步骤2.3:时间信息挖掘,将连续的时间戳以平均时间间隔离散化,利用 skip-gram模型得到轨迹点对应时间戳的向量表示序列TPi
步骤2.4:速度信息挖掘,利用步骤2.1得到的轨迹点速度序列以skip-gram 模型得到轨迹的点速度序列表示SPi
进一步的,所述步骤3包括如下步骤:
步骤3.1:构建嵌入层:将城市特征点和速度序列特征表示连接起来,预训练向量初始化权重,借助传统的词嵌入方法将序列映射到统一的低维向量中;
步骤3.2:构建LSTM层:将嵌入层的输出特征矩阵作为时间序列,在t时刻将特征向量传入输入层,经过激活函数σ输出结果;将输出结果,t-1时刻的隐藏层输出和t-1时刻细胞单元存储的信息输入到LSTM节点中;通过输入门,输出门,遗忘门和cell单元的梳理,输出数据到注意力层中;LSTM的计算公式为:
ft=σg(Wfxt+Ufct-1+bf)
it=σg(Wixt+Uict-1+bfi)
ot=σg(Woxt+Uoct-1+bo)
ct=ft*ct-1+itc(Wcxt+bc)
ht=oth(ct)
其中xt为上一单元的状态,ft为遗忘门,范围为[0,1];it为输入门,范围为[0,1]。
步骤3.3:构建注意力层,将从步骤3.2中得到的隐藏层状态序列输入到注意力层中,利用Softmax函数对注意力得分进行归一化从而得到权重分布,其计算过程公式可表示为:
atj=vTtan(h(Wsst-1)+Whht)
Figure BDA0003529980560000041
其中T为轨迹点的数量,tanh为双曲正切函数,v,Ws,Wh为学习的参数。
步骤3.4:构建输出层:输出层由全连接层,Dropout层,Softmax层组成,经过步骤3.3输出的向量输入到全连接层,Dropout层、Softmax层转为概率;通过argmax函数输出标签纸,即轨迹所属类别y,其当参数矩阵为W,b为偏置时,其计算公式如下:
y=softmax(W·hi+b)。
进一步的,所述步骤4包括如下步骤:
步骤4.1:将得到的分类结果yi和当前正确的标签值y'i分别作为交叉熵损失函数的两个输入,计算损失值;将误差信号传递到每一层的输出,再通过每一层的函数对参数的导数,可求得参数的梯度;再通过随机梯度下降(SGD)优化器更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化损失函数,得到最优模型之后输入验证集检测异常轨迹并可视化。
本发明的有益效果是,本发明的基于LSTM网络和注意力机制的出租车轨迹异常检测方法,去除了原始轨迹中的噪音点,冗余点,提高了数据的质量。挖掘出了轨迹中蕴含的位置,时间和速度特征。并将序列映射到了同意的低维向量中。提出了注意力机制模块,使得不同点(拐点和非拐点),不同特征(不同速度等) 对于模型训练的影响不同。起到更好的训练效果。该检测方法所检测出来的异常轨迹更加接近真实情况,而且准确率也更高,有利于对出租车异常轨迹成因的分析操作,在出租车欺诈行为检测等领域具有重大意义。
附图说明
图1是本发明的整体流程图;
图2是本发明步骤2中滑动窗口模块的详细处理过程;
图3是本发明步骤3中所述的LSTM网络结构图;
图4是本发明步骤3中所述的整体网络结构图。
具体实施方式
下面结合附图对本发明作进一步说明。
如图1所示,本发明的基于LSTM网络和注意力机制的出租车轨迹异常检测方法,包括如下步骤:
步骤1:车辆轨迹数据预处理:收集出租车轨迹数据,轨迹数据是包括由(经度、纬度、时间戳)三元组p所组成的轨迹序列Tr:p1→p2→…pn,剔除掉原始数据集中的冗余点,噪音点。并将所在地图化身成100*100m的网格,将轨迹转换成网格序列,通过skip-gram将网格序列转换成向量表示,并计算轨迹点的速度转换成对应的道路等级表示。根据城市数据采集当天的实际情况计算提取城市特征点,并将轨迹数据集划分训练集,验证集,测试集。
具体的,步骤1中,所述车辆轨迹数据预处理包括如下步骤:
步骤1.1:通过车联网数据采集出租车轨迹数据,为了解决道路拥挤,事故,设备故障等原因造成的数据冗余问题,利用Douglas-Peucker算法过滤掉数据集中冗余采样点数据记录。具体步骤为:将一段轨迹的首末点连接成一条直线,求这段轨迹所有点与这条直线的垂直距离,并找出最大距离值dmax,用dmax与预定义的阈值D相比:若dmax<D,这条曲线上的中间点全部舍去;若dmax≥D,保留dmax对应的坐标点,并以该点为界,把轨迹分为两部分,对这两部分重复使用该方法,直至过滤所有冗余采样点数据。
步骤1.2:判断并去除噪音点。假设Pi-1,Pi,Pi+1为按照采样时间顺序排列的三个点,若Pi为可能的异常点,那么在Pi-1到Pi与Pi到Pi+1的平均速度差别较大。根据速度和时间得到距离,若在ti-1到ti的路径长度小于该时间段内最大可达位移r1,且在时刻ti到ti+1的路径长度小于该时间段内最大可达位移r2,则可以根据出租车最大行驶速度v,r1,r2投影出Pi可能出现的区域,若Pi出现区域之内,则Pi设为正常点,否则为噪音点,需要去除。
步骤1.3:将原始轨迹转换成离散序列,将整个地图划分为100*100m的等大小网格单元,每个网格单元用单独ID进行标记,每个GPS点被转换成其所在网格单元的ID,将轨迹序列转换成网格单元ID序列。
步骤1.4:利用skip-gram模型学习网格的表示,使得相邻的网格在向量空间中有着相似的表示,将轨迹成网格单元ID序列转换成向量。
步骤1.5:计算出轨迹点的速度并利用图将轨迹点的速度转换成对应的道路等级,将轨迹由网格单元ID表示转换成轨迹点速度序列。并根据城市数据采集当天的实际情况计算提取城市特征点
步骤2:特征提取:将轨迹数据离散化,将轨迹的网格单元ID序列提取位置特征,将连续的时间戳以平均时间间隔离散化提取时间特征,利用滑动窗口算法得到速度特征,将城市特征速度与特征位置特征、时间特征相拼接经过 word2vec转化成词向量序列构造embedding层。
在步骤2中,所述轨迹特征嵌入过程包括如下步骤:
步骤2.1:滑动窗口特征提取,假如偏移值最大为w,最小为1。每个窗口的移动速度特征有3个维度平均速度,最大速度,最小速度{mean,max,min},统计数据|max-min|表示窗口速度的变化,如果统计数据|max-min|不为0则更新偏移为先前值一半,直至偏移为1。如果统计数据|max-min|为0,则更新偏移为之前的2倍,直至偏移到达最大值。
如图2所示,数值1,2和3为轨迹点速度序列转换成对应道路等级(1为高速路,2为主干道,3为次干道)。每个圈代表当前的窗口大小。假设W和offset 分别记录滑动窗口的宽度和偏移。使得offset最大为W最小为1。offset偏移的值根据滑动窗口中速度间隔的变化进行调整。通过这种方式,捕捉大多数的速度变化。
步骤2.2:位置信息挖掘,从步骤1中得到的轨迹网格单元序列向量LCi包括了轨迹的位置信息。
步骤2.3:时间信息挖掘,将连续的时间戳以平均时间间隔离散化,利用 skip-gram模型得到轨迹点对应时间戳的向量表示序列TPi
步骤2.4:速度信息挖掘,利用步骤2.1得到的轨迹点速度序列以skip-gram 模型得到轨迹的点速度序列表示SPi
步骤3:模型构建与训练,构造LSTM-attention模型,将从步骤2中提取的特征作为输入加载到LSTM-attention模型中训练,通过LSTM层提取特征,注意力层区分拐点和非拐点的权重,其中拐点对异常轨迹有着更高权重。注意力层区分特征权重,速度特征对异常轨迹分类有有着更高权重。训练完成后,将作为测试数据集的特征输入到LSTM-attention模型,对模型分类准确性进行验证。
在步骤3中,所述过程包括如下步骤:
步骤3.1:构建嵌入层:将从步骤1.5中获取的城市特征和将从步骤2.1中出得到的出租车时空,速度序列特征表示连接起来,预训练向量初始化权重,借助传统的词嵌入方法将序列映射到统一的低维向量中。
步骤3.2:构建LSTM层:如图3所示,ot为输出门,σ为sigmoid函数。其中ht-1为上一次的隐藏层状态,ft为遗忘门,it为输出门,ot为输出门,
Figure BDA0003529980560000071
为经过tanh函数激活后的细胞状态。qt为经过遗忘后更新的细胞状态。长短期记忆神经网络即有捕捉长距离依赖信息的能力。将嵌入层的输出特征矩阵作为一个时间序列,在t时刻将特征向量传入输入层,经过激活函数σ输出结果。将输出结果,t-1时刻的隐藏层输出和t-1时刻细胞单元存储的信息输入到LSTM节点中。通过输入门,输出门,遗忘门和cell单元的梳理,输出数据到注意力层中。LSTM 的计算公式为:
ft=σg(Wfxt+Ufct-1+bf)
it=σg(Wixt+Uict-1+bfi)
ot=σg(Woxt+Uoct-1+bo)
ct=ft*ct-1+itc(Wcxt+bc)
ht=oth(ct)
其中xt为上一单元的状态,ft为遗忘门,决定从cell状态中丢弃什么信息,范围为[0,1]。it为输入门,决定从当前状态中选择多少信息进入当前的ct,范围为[0,1]。
步骤3.3:构建注意力层,将从步骤3.2中得到的隐藏层状态序列输入到注意力层中,在注意力层中,拐点和非拐点,速度特征的影响被区分开来。为更重要的点和更重要的特征分配权重,利用Softmax函数对注意力得分进行归一化从而得到权重分布,其计算过程公式可表示为:
atj=vTtan(h(Wsst-1)+Whht)
Figure BDA0003529980560000081
其中T为轨迹点的数量,tanh为双曲正切函数,v,Ws,Wh为学习的参数。
步骤3.4:构建输出层:输出层由全连接层,Dropout层,Softmax层组成,其中Dropout层用于避免过拟合,Softmax生成概率进行轨迹异常分类。经过步骤3.3输出的向量输入到全连接层,Dropout层、Softmax层转为概率。通过 argmax函数输出标签纸,即轨迹所属类别y,其当参数矩阵为W,b为偏置时,其计算公式如下:
y=softmax(W·hi+b)。
如图4所示,最后得到的模型网络结果,其中输入为经过特征提取后的出租车轨迹向量表示,经过LSTM层,注意力层。到注意层的输出如隐藏状态Fn所示。到输出层,其中输出层由全连接层,Dropout层,Softmax层组成,隐藏状态Fn经过全连接层变成系列Mn。Dropout层用于避免过拟合,Softmax生成概率进行轨迹异常分类。模型的输出为该轨迹为异常轨迹的概率。
步骤4:输入数据经过嵌入层,LSTM层,注意力层,输出层之后会得到期望的输出,如果这个输出与轨迹的实际类别不同。则反向传播算法则会将误差反向传播至输出层,每层的神经元会根据该误差对网络结构中的参数进行更新,并可视化异常检测结果。
在步骤4中,所述过程包括如下步骤:
步骤4.1:将得到的分类结果yi和当前正确的标签值y'i分别作为交叉熵损失函数的两个输入,计算损失值;将误差信号传递到每一层的输出,再通过每一层的函数对参数的导数,可求得参数的梯度;再通过随机梯度下降(SGD)优化器更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化损失函数,得到最优模型之后输入验证集检测异常轨迹并可视化;
所述城市特征数据包括:出行频率特征,路段特征,居民状态转移特征以及居民区域转移特征,所述路段特征表示给定时段情况下,该路段的速度特征,由参数平均速度和方差表征,以RS表示路段,TS表示时段,路段特征被描述成高斯概率分布X-N(μ,σ2),其中X=(RS,TS),μ,σ2表示从数据层中统计计算得出的平均速度和方差。
所述出行频率特征表示给定区域和时段的情况下,从该区域出发的车辆轨迹量,出行频率特征使用泊松分布表示X-π(λ),其中X=(RE,TS),λ表示从数据层中统计计算得出的平均车辆轨迹量,居民状态转移特征表示居民在各种状态间的转移关系,所述状态指POI点的类别,以OS,DS分别表示起始状态和终止状态,所述居民状态转移特征以概率矩阵表示,所述矩阵中的每一项为P(OS =os,DS=ds)的值,所述居民区域转移特征表示居民在各区域间的转移关系,以 OR,DR分别表示起始区域和终止区域。所述POI数据为在地图上任何非地理意义的有意义的点,包括但不限于商店、酒吧、加油站、医院和车站。

Claims (5)

1.一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法,包括如下步骤:
步骤1:车辆轨迹数据预处理:收集出租车轨迹数据,轨迹数据是包括由经度、纬度、时间戳三元组p所组成的轨迹序列Tr:p1→p2→…pn,剔除掉原始数据集中的冗余点,噪音点,并将所在地图化身成100*100m的网格,将轨迹转换成网格序列,通过skip-gram将网格序列转换成向量表示,并计算轨迹点的速度转换成对应的道路等级表示;根据城市数据采集当天的实际情况计算提取城市特征点,并将轨迹数据集划分训练集,验证集,测试集;
步骤2:特征提取:将轨迹数据离散化,将轨迹的网格单元ID序列提取位置特征,将连续的时间戳以平均时间间隔离散化提取时间特征,利用滑动窗口算法得到速度特征,将特征速度与位置特征、时间特征相拼接经过word2vec转化成词向量序列构造embedding层;
步骤3:模型构建与训练,构造LSTM-attention模型,将从步骤2中提取的特征作为输入加载到LSTM-attention模型中训练,通过LSTM层提取特征,注意力层区分拐点和非拐点的权重,训练完成后,将作为测试数据集的特征输入到LSTM-attention模型,对模型分类准确性进行验证;
步骤4:输入数据经过嵌入层,LSTM层,注意力层,输出层之后得到期望的输出,若该输出与轨迹的实际类别不同;则反向传播算法则会将误差反向传播至输出层,每层的神经元会根据该误差对网络结构中的参数进行更新,并可视化异常检测结果。
2.如权利要求1所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法,其特征在于:所述车辆轨迹数据预处理包括如下步骤:
步骤1.1:通过车联网数据采集出租车轨迹数据,利用Douglas-Peucker算法过滤掉数据集中冗余采样点数据记录;具体步骤为:将一段轨迹的首末点连接成一条直线,求这段轨迹所有点与这条直线的垂直距离,并找出最大距离值dmax,用dmax与预定义的阈值D相比:若dmax<D,这条曲线上的中间点全部舍去;若dmax≥D,保留dmax对应的坐标点,并以该点为界,把轨迹分为两部分,对这两部分重复上述步骤,直至过滤所有冗余采样点数据;
步骤1.2:判断并去除噪音点,假设Pi-1,Pi,Pi+1为按照采样时间顺序排列的三个点,若Pi为可能的异常点,那么在Pi-1到Pi与Pi到Pi+1的平均速度差别较大;根据速度和时间得到距离,若在ti-1到ti的路径长度小于该时间段内最大可达位移r1,且在时刻ti到ti+1的路径长度小于该时间段内最大可达位移r2,则可以根据出租车最大行驶速度v,r1,r2投影出Pi可能出现的区域,若Pi出现区域之内,则Pi设为正常点,否则为噪音点,需要去除;
步骤1.3:将原始轨迹转换成离散序列,将整个地图划分为100*100m的等大小网格单元,每个网格单元用单独ID进行标记,每个GPS点被转换成其所在网格单元的ID,将轨迹序列转换成网格单元ID序列;
步骤1.4:利用skip-gram模型学习网格的表示,使得相邻的网格在向量空间中有着相似的表示,将轨迹成网格单元ID序列转换成向量;
步骤1.5:计算出轨迹点的速度并利用图将轨迹点的速度转换成对应的道路等级,将轨迹由网格单元ID表示转换成轨迹点速度序列;并根据城市数据采集当天的实际情况计算提取城市特征点。
3.如权利要求2所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法,其特征在于:所述步骤2包括如下步骤:
步骤2.1:滑动窗口特征提取,假如偏移值最大为w,最小为1;每个窗口的移动速度特征有3个维度平均速度,最大速度,最小速度{mean,max,min},统计数据|max-min|表示窗口速度的变化,如果统计数据|max-min|不为0则更新偏移为先前值一半,直至偏移为1;如果统计数据|max-min|为0,则更新偏移为之前的2倍,直至偏移到达最大值;
步骤2.2:位置信息挖掘,向量表示的网格序列包括轨迹的位置信息;
步骤2.3:时间信息挖掘,将连续的时间戳以平均时间间隔离散化,利用skip-gram模型得到轨迹点对应时间戳的向量表示序列TPi
步骤2.4:速度信息挖掘,利用步骤2.1得到的轨迹点速度序列以skip-gram模型得到轨迹的点速度序列表示SPi
4.如权利要求3所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法,其特征在于:所述步骤3包括如下步骤:
步骤3.1:构建嵌入层:将城市特征点和速度序列特征表示连接起来,预训练向量初始化权重,借助传统的词嵌入方法将序列映射到统一的低维向量中;
步骤3.2:构建LSTM层:将嵌入层的输出特征矩阵作为时间序列,在t时刻将特征向量传入输入层,经过激活函数σ输出结果;将输出结果,t-1时刻的隐藏层输出和t-1时刻细胞单元存储的信息输入到LSTM节点中;通过输入门,输出门,遗忘门和cell单元的梳理,输出数据到注意力层中;LSTM的计算公式为:
ft=σg(Wfxt+Ufct-1+bf)
it=σg(Wixt+Uict-1+bfi)
ot=σg(Woxt+Uoct-1+bo)
ct=ft*ct-1+itc(Wcxt+bc)
ht=oth(ct)
其中xt为上一单元的状态,ft为遗忘门,范围为[0,1];it为输入门,范围为[0,1];
步骤3.3:构建注意力层,将从步骤3.2中得到的隐藏层状态序列输入到注意力层中,利用Softmax函数对注意力得分进行归一化从而得到权重分布,其计算过程公式可表示为:
atj=vTtan(h(Wsst-1)+Whht)
Figure FDA0003529980550000031
其中T为轨迹点的数量,tanh为双曲正切函数,v,Ws,Wh为学习的参数;
步骤3.4:构建输出层:输出层由全连接层,Dropout层,Softmax层组成,经过步骤3.3输出的向量输入到全连接层,Dropout层、Softmax层转为概率;通过argmax函数输出标签纸,即轨迹所属类别y,其当参数矩阵为W,b为偏置时,其计算公式如下:
y=softmax(W·hi+b)。
5.如权利要求4所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法,其特征在于:所述步骤4包括如下步骤:
步骤4.1:将得到的分类结果yi和当前正确的标签值y'i分别作为交叉熵损失函数的两个输入,计算损失值;将误差信号传递到每一层的输出,再通过每一层的函数对参数的导数,可求得参数的梯度;再通过随机梯度下降(SGD)优化器更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化损失函数,得到最优模型之后输入验证集检测异常轨迹并可视化。
CN202210213647.7A 2022-03-03 2022-03-03 基于lstm网络和注意力机制的出租车轨迹异常检测方法 Pending CN114882069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210213647.7A CN114882069A (zh) 2022-03-03 2022-03-03 基于lstm网络和注意力机制的出租车轨迹异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210213647.7A CN114882069A (zh) 2022-03-03 2022-03-03 基于lstm网络和注意力机制的出租车轨迹异常检测方法

Publications (1)

Publication Number Publication Date
CN114882069A true CN114882069A (zh) 2022-08-09

Family

ID=82668178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210213647.7A Pending CN114882069A (zh) 2022-03-03 2022-03-03 基于lstm网络和注意力机制的出租车轨迹异常检测方法

Country Status (1)

Country Link
CN (1) CN114882069A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116029736A (zh) * 2023-01-05 2023-04-28 浙江警察学院 一种网约车异常轨迹实时检测和安全预警方法、系统
CN116524723A (zh) * 2023-06-27 2023-08-01 天津大学 一种货车轨迹异常识别方法及系统
CN116866211A (zh) * 2023-06-26 2023-10-10 中国信息通信研究院 一种改进的深度合成检测方法和系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116029736A (zh) * 2023-01-05 2023-04-28 浙江警察学院 一种网约车异常轨迹实时检测和安全预警方法、系统
CN116029736B (zh) * 2023-01-05 2023-09-29 浙江警察学院 一种网约车异常轨迹实时检测和安全预警方法、系统
CN116866211A (zh) * 2023-06-26 2023-10-10 中国信息通信研究院 一种改进的深度合成检测方法和系统
CN116866211B (zh) * 2023-06-26 2024-02-23 中国信息通信研究院 一种改进的深度合成检测方法和系统
CN116524723A (zh) * 2023-06-27 2023-08-01 天津大学 一种货车轨迹异常识别方法及系统
CN116524723B (zh) * 2023-06-27 2023-09-12 天津大学 一种货车轨迹异常识别方法及系统

Similar Documents

Publication Publication Date Title
CN108629978B (zh) 一种基于高维路网和循环神经网络的交通轨迹预测方法
CN111832225B (zh) 一种构建汽车行驶工况的方法
CN103605362B (zh) 基于车辆轨迹多特征的运动模式学习及异常检测方法
CN109871876B (zh) 一种基于浮动车数据的高速公路路况识别与预测方法
CN114882069A (zh) 基于lstm网络和注意力机制的出租车轨迹异常检测方法
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN114049765B (zh) 基于自动车辆号牌识别数据的城市路网车流od估计方法
CN110120218A (zh) 基于gmm-hmm的高速公路大型车辆识别方法
CN112613225B (zh) 一种基于神经网络元胞传输模型的交叉口交通状态预测方法
WO2021013190A1 (zh) 基于气象参数的高速列车导航盲区定位方法及系统
CN116631186B (zh) 基于危险驾驶事件数据的高速公路交通事故风险评估方法、系统
Son et al. Deep learning-based anomaly detection to classify inaccurate data and damaged condition of a cable-stayed bridge
CN112884014A (zh) 一种基于路段拓扑结构分类的交通速度短时预测方法
CN111949896A (zh) 基于轨迹大数据的轨迹异常检测方法
CN113570862B (zh) 一种基于XGboost算法的大型交通拥堵预警方法
CN117238126A (zh) 一种连续流道路场景下的交通事故风险评估方法
Moosavi et al. Driving style representation in convolutional recurrent neural network model of driver identification
CN114021627A (zh) 一种融合lstm与场景规则知识的异常轨迹检测方法及装置
Gkountouna et al. Traffic flow estimation using probe vehicle data
Liu et al. Highway traffic congestion detection and evaluation based on deep learning techniques
CN115565376A (zh) 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统
CN114091581A (zh) 一种基于稀疏轨迹的车辆运营行为类型识别方法
CN114021629B (zh) 一种基于均值动态时间规整的车辆轨迹运动模式提取方法
CN116386020A (zh) 多源数据融合的高速公路收费站出口流量预测方法及系统
Xia et al. An ASM-CF model for anomalous trajectory detection with mobile trajectory big data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination