CN114882069A

CN114882069A - 基于lstm网络和注意力机制的出租车轨迹异常检测方法

Info

Publication number: CN114882069A
Application number: CN202210213647.7A
Authority: CN
Inventors: 段守坚; 徐建
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2022-03-03
Filing date: 2022-03-03
Publication date: 2022-08-09

Abstract

本发明公开了一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法，包括如下步骤：步骤1：车辆轨迹数据预处理；步骤2：特征提取；步骤3：模型构建与训练；步骤4：输入数据经过嵌入层，LSTM层，注意力层，输出层之后得到期望的输出，若该输出与轨迹的实际类别不同；则反向传播算法则会将误差反向传播至输出层，每层的神经元会根据该误差对网络结构中的参数进行更新，并可视化异常检测结果。本方法所检测出来的异常轨迹更加接近真实情况，而且准确率也更高，有利于对出租车异常轨迹成因的分析操作。

Description

基于LSTM网络和注意力机制的出租车轨迹异常检测方法

技术领域

本发明涉及出租车轨迹异常检测方法技术领域，更具体地说，本发明涉及一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法。

背景技术

随着出租车行业规模的迅速扩大，大量的出租车轨迹数据被生成和采集。对于这些轨迹数据的分析可以帮助研究者获得许多有价值的信息。如位置预测，兴趣模式等相关的隐含事实。其中轨迹异常检测是最热门的的研究课题之一。轨迹异常值指的是在轨迹数据集中与其他数据模式或路线有着显著不同的轨迹。

传统的出租车轨迹异常检测算法包括四类，基于分类的检测技术、基于历史相似性的检测技术、基于距离的检测技术以及基于网格划分的检测技术。基于分类的检测技术在训练阶段，通过手动选择的特征数据集学习构建分类器，在测试阶段，根据分类器将轨迹划分为正常异常两类。通过历史相似性的检测技术根据历史收集到的大量轨迹数据挖掘出所有频繁模式建立特征模型，异于特征模式的数据识别为异常轨迹。基于距离的检测技术将于大多数轨迹有较远距离的轨迹视为异常。基于网格划分的检测技术则是从划分成等大小网格的单元中识别异常的网格单元序列。

现有方法有如下方面的不足：

1.仅仅考虑了出租车轨迹的位置信息，没有挖掘出租车轨迹蕴含的时间和速度信息。特征提取不充分，会降低异常检测的准确度。

2.基于距离的匹配方法非常耗时，LCSS，EDR等方法时间复杂度到达o(m*n)，而欧式距离度量则要求轨迹点相同，很难应用到真实场景中。

3.预处理过程比较简单，出租车原始轨迹数据集中包括大量的冗余点，噪音点进行异常检测之前必须剔除。

LSTM是递归神经网络(RNN)在深度学习中的一种变体，可以通过门控网络来增加或删除信息。由于其特殊网络结构特征，它在序列数据中表现出优异的学习能力，许多研究表明，通过LSTM网络捕获轨迹之间的关联特征是探索和解决轨迹异常检测问题的一个很好的选择。

注意力机制借鉴了人类的视觉注意力，人类在观察外部事物时是有一种选择性的，即重点关注感兴趣的那部分区域，忽略其他无关细节，也就是常说的注意力焦点。在出租车轨迹数据训练过程中，轨迹的拐点，特征信息对于模型的训练应当有着更高的权重。将注意力机制运用到LSTM网络中，能捕捉特征中的长范围依赖，可以提高关键轨迹点在训练过程中的权重。

发明内容

为了克服现有技术的上述缺陷，本发明提供了一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法，本发明所要解决的技术问题是：现有技术中轨迹异常检测方法特征提取不充分，耗时较高，轨迹预处理方法较为简单的技术问题。

为实现上述目的，本发明提供如下技术方案：

一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法，包括如下步骤：

步骤1：车辆轨迹数据预处理：收集出租车轨迹数据，轨迹数据是包括由经度、纬度、时间戳三元组p所组成的轨迹序列T_r：p₁→p₂→…p_n，剔除掉原始数据集中的冗余点，噪音点，并将所在地图化身成100*100m的网格，将轨迹转换成网格序列，通过skip-gram将网格序列转换成向量表示，并计算轨迹点的速度转换成对应的道路等级表示；根据城市数据采集当天的实际情况计算提取城市特征点，并将轨迹数据集划分训练集，验证集，测试集；

步骤2：特征提取：将轨迹数据离散化，将轨迹的网格单元ID序列提取位置特征，将连续的时间戳以平均时间间隔离散化提取时间特征，利用滑动窗口算法得到速度特征，将特征速度与位置特征、时间特征相拼接经过word2vec转化成词向量序列构造embedding层；

步骤3：模型构建与训练，构造LSTM-attention模型，将从步骤2中提取的特征作为输入加载到LSTM-attention模型中训练，通过LSTM层提取特征，注意力层区分拐点和非拐点的权重，训练完成后，将作为测试数据集的特征输入到 LSTM-attention模型，对模型分类准确性进行验证；

步骤4：输入数据经过嵌入层，LSTM层，注意力层，输出层之后得到期望的输出，若该输出与轨迹的实际类别不同；则反向传播算法则会将误差反向传播至输出层，每层的神经元会根据该误差对网络结构中的参数进行更新，并可视化异常检测结果。

进一步的，所述车辆轨迹数据预处理包括如下步骤：

步骤1.1：通过车联网数据采集出租车轨迹数据，利用Douglas-Peucker算法过滤掉数据集中冗余采样点数据记录；具体步骤为：将一段轨迹的首末点连接成一条直线,求这段轨迹所有点与这条直线的垂直距离,并找出最大距离值d_max, 用d_max与预定义的阈值D相比：若d_max<D,这条曲线上的中间点全部舍去；若d_max≥D，保留d_max对应的坐标点,并以该点为界,把轨迹分为两部分,对这两部分重复上述步骤，直至过滤所有冗余采样点数据；

步骤1.2：判断并去除噪音点，假设P_i-1,P_i,P_i+1为按照采样时间顺序排列的三个点，若P_i为可能的异常点，那么在P_i-1到P_i与P_i到P_i+1的平均速度差别较大。根据速度和时间得到距离，若在t_i-1到t_i的路径长度小于该时间段内最大可达位移r₁，且在时刻t_i到t_i+1的路径长度小于该时间段内最大可达位移r₂，则可以根据出租车最大行驶速度v,r₁,r₂投影出P_i可能出现的区域，若Pi出现区域之内，则Pi设为正常点，否则为噪音点，需要去除；

步骤1.3：将原始轨迹转换成离散序列，将整个地图划分为100*100m的等大小网格单元，每个网格单元用单独ID进行标记，每个GPS点被转换成其所在网格单元的ID，将轨迹序列转换成网格单元ID序列；

步骤1.4：利用skip-gram模型学习网格的表示，使得相邻的网格在向量空间中有着相似的表示，将轨迹成网格单元ID序列转换成向量；

步骤1.5：计算出轨迹点的速度并利用图将轨迹点的速度转换成对应的道路等级，将轨迹由网格单元ID表示转换成轨迹点速度序列；并根据城市数据采集当天的实际情况计算提取城市特征点。

进一步的，所述步骤2包括如下步骤：

步骤2.1：滑动窗口特征提取，假如偏移值最大为w，最小为1；每个窗口的移动速度特征有3个维度平均速度，最大速度，最小速度{mean，max，min}，统计数据|max-min|表示窗口速度的变化，如果统计数据|max-min|不为0则更新偏移为先前值一半，直至偏移为1；如果统计数据|max-min|为0，则更新偏移为之前的2倍，直至偏移到达最大值；

步骤2.2：位置信息挖掘，向量表示的网格序列包括轨迹的位置信息；

步骤2.3：时间信息挖掘，将连续的时间戳以平均时间间隔离散化，利用 skip-gram模型得到轨迹点对应时间戳的向量表示序列TP_i；

步骤2.4：速度信息挖掘，利用步骤2.1得到的轨迹点速度序列以skip-gram 模型得到轨迹的点速度序列表示SP_i。

进一步的，所述步骤3包括如下步骤：

步骤3.1：构建嵌入层：将城市特征点和速度序列特征表示连接起来，预训练向量初始化权重，借助传统的词嵌入方法将序列映射到统一的低维向量中；

步骤3.2：构建LSTM层：将嵌入层的输出特征矩阵作为时间序列，在t时刻将特征向量传入输入层，经过激活函数σ输出结果；将输出结果，t-1时刻的隐藏层输出和t-1时刻细胞单元存储的信息输入到LSTM节点中；通过输入门，输出门，遗忘门和cell单元的梳理，输出数据到注意力层中；LSTM的计算公式为：

f_t＝σ_g(W_fx_t+U_fc_t-1+b_f)

i_t＝σ_g(W_ix_t+U_ic_t-1+b_fi)

o_t＝σ_g(W_ox_t+U_oc_t-1+b_o)

c_t＝f_t*c_t-1+i_t*σ_c(W_cx_t+b_c)

h_t＝o_t*σ_h(c_t)

其中x_t为上一单元的状态，f_t为遗忘门，范围为[0,1]；i_t为输入门，范围为[0,1]。

步骤3.3：构建注意力层，将从步骤3.2中得到的隐藏层状态序列输入到注意力层中，利用Softmax函数对注意力得分进行归一化从而得到权重分布，其计算过程公式可表示为：

a_tj＝v^Ttan(h(W_ss_t-1)+W_hh_t)

其中T为轨迹点的数量，tanh为双曲正切函数，v，W_s，W_h为学习的参数。

步骤3.4：构建输出层：输出层由全连接层，Dropout层，Softmax层组成，经过步骤3.3输出的向量输入到全连接层，Dropout层、Softmax层转为概率；通过argmax函数输出标签纸，即轨迹所属类别y，其当参数矩阵为W，b为偏置时，其计算公式如下：

y＝softmax(W·h_i+b)。

进一步的，所述步骤4包括如下步骤：

步骤4.1：将得到的分类结果y_i和当前正确的标签值y'_i分别作为交叉熵损失函数的两个输入，计算损失值；将误差信号传递到每一层的输出，再通过每一层的函数对参数的导数，可求得参数的梯度；再通过随机梯度下降(SGD)优化器更新和计算影响模型训练和模型输出的网络参数，使其逼近或达到最优值，从而最小化损失函数，得到最优模型之后输入验证集检测异常轨迹并可视化。

本发明的有益效果是，本发明的基于LSTM网络和注意力机制的出租车轨迹异常检测方法，去除了原始轨迹中的噪音点，冗余点，提高了数据的质量。挖掘出了轨迹中蕴含的位置，时间和速度特征。并将序列映射到了同意的低维向量中。提出了注意力机制模块，使得不同点(拐点和非拐点)，不同特征(不同速度等) 对于模型训练的影响不同。起到更好的训练效果。该检测方法所检测出来的异常轨迹更加接近真实情况，而且准确率也更高，有利于对出租车异常轨迹成因的分析操作，在出租车欺诈行为检测等领域具有重大意义。

附图说明

图1是本发明的整体流程图；

图2是本发明步骤2中滑动窗口模块的详细处理过程；

图3是本发明步骤3中所述的LSTM网络结构图；

图4是本发明步骤3中所述的整体网络结构图。

具体实施方式

下面结合附图对本发明作进一步说明。

如图1所示，本发明的基于LSTM网络和注意力机制的出租车轨迹异常检测方法，包括如下步骤：

步骤1：车辆轨迹数据预处理：收集出租车轨迹数据，轨迹数据是包括由(经度、纬度、时间戳)三元组p所组成的轨迹序列T_r：p₁→p₂→…p_n，剔除掉原始数据集中的冗余点，噪音点。并将所在地图化身成100*100m的网格，将轨迹转换成网格序列，通过skip-gram将网格序列转换成向量表示，并计算轨迹点的速度转换成对应的道路等级表示。根据城市数据采集当天的实际情况计算提取城市特征点，并将轨迹数据集划分训练集，验证集，测试集。

具体的，步骤1中，所述车辆轨迹数据预处理包括如下步骤：

步骤1.1：通过车联网数据采集出租车轨迹数据，为了解决道路拥挤，事故，设备故障等原因造成的数据冗余问题，利用Douglas-Peucker算法过滤掉数据集中冗余采样点数据记录。具体步骤为：将一段轨迹的首末点连接成一条直线,求这段轨迹所有点与这条直线的垂直距离,并找出最大距离值d_max,用d_max与预定义的阈值D相比:若d_max<D,这条曲线上的中间点全部舍去；若d_max≥D,保留d_max对应的坐标点,并以该点为界,把轨迹分为两部分,对这两部分重复使用该方法，直至过滤所有冗余采样点数据。

步骤1.2：判断并去除噪音点。假设P_i-1,P_i,P_i+1为按照采样时间顺序排列的三个点，若P_i为可能的异常点，那么在P_i-1到P_i与P_i到P_i+1的平均速度差别较大。根据速度和时间得到距离，若在t_i-1到t_i的路径长度小于该时间段内最大可达位移r₁，且在时刻t_i到t_i+1的路径长度小于该时间段内最大可达位移r₂，则可以根据出租车最大行驶速度v,r₁,r₂投影出P_i可能出现的区域，若Pi出现区域之内，则Pi设为正常点，否则为噪音点，需要去除。

步骤1.3：将原始轨迹转换成离散序列，将整个地图划分为100*100m的等大小网格单元，每个网格单元用单独ID进行标记，每个GPS点被转换成其所在网格单元的ID，将轨迹序列转换成网格单元ID序列。

步骤1.4：利用skip-gram模型学习网格的表示，使得相邻的网格在向量空间中有着相似的表示，将轨迹成网格单元ID序列转换成向量。

步骤1.5：计算出轨迹点的速度并利用图将轨迹点的速度转换成对应的道路等级，将轨迹由网格单元ID表示转换成轨迹点速度序列。并根据城市数据采集当天的实际情况计算提取城市特征点

步骤2：特征提取：将轨迹数据离散化，将轨迹的网格单元ID序列提取位置特征，将连续的时间戳以平均时间间隔离散化提取时间特征，利用滑动窗口算法得到速度特征，将城市特征速度与特征位置特征、时间特征相拼接经过 word2vec转化成词向量序列构造embedding层。

在步骤2中，所述轨迹特征嵌入过程包括如下步骤：

步骤2.1：滑动窗口特征提取，假如偏移值最大为w，最小为1。每个窗口的移动速度特征有3个维度平均速度，最大速度，最小速度{mean，max，min}，统计数据|max-min|表示窗口速度的变化，如果统计数据|max-min|不为0则更新偏移为先前值一半，直至偏移为1。如果统计数据|max-min|为0，则更新偏移为之前的2倍，直至偏移到达最大值。

如图2所示，数值1,2和3为轨迹点速度序列转换成对应道路等级(1为高速路，2为主干道，3为次干道)。每个圈代表当前的窗口大小。假设W和offset 分别记录滑动窗口的宽度和偏移。使得offset最大为W最小为1。offset偏移的值根据滑动窗口中速度间隔的变化进行调整。通过这种方式，捕捉大多数的速度变化。

步骤2.2：位置信息挖掘,从步骤1中得到的轨迹网格单元序列向量LC_i包括了轨迹的位置信息。

步骤2.3：时间信息挖掘,将连续的时间戳以平均时间间隔离散化，利用 skip-gram模型得到轨迹点对应时间戳的向量表示序列TP_i。

步骤3：模型构建与训练，构造LSTM-attention模型，将从步骤2中提取的特征作为输入加载到LSTM-attention模型中训练，通过LSTM层提取特征，注意力层区分拐点和非拐点的权重，其中拐点对异常轨迹有着更高权重。注意力层区分特征权重，速度特征对异常轨迹分类有有着更高权重。训练完成后，将作为测试数据集的特征输入到LSTM-attention模型，对模型分类准确性进行验证。

在步骤3中，所述过程包括如下步骤：

步骤3.1：构建嵌入层：将从步骤1.5中获取的城市特征和将从步骤2.1中出得到的出租车时空，速度序列特征表示连接起来，预训练向量初始化权重，借助传统的词嵌入方法将序列映射到统一的低维向量中。

步骤3.2：构建LSTM层：如图3所示，o_t为输出门，σ为sigmoid函数。其中h_t-1为上一次的隐藏层状态，f_t为遗忘门，i_t为输出门，o_t为输出门，

为经过tanh函数激活后的细胞状态。q_t为经过遗忘后更新的细胞状态。长短期记忆神经网络即有捕捉长距离依赖信息的能力。将嵌入层的输出特征矩阵作为一个时间序列，在t时刻将特征向量传入输入层，经过激活函数σ输出结果。将输出结果，t-1时刻的隐藏层输出和t-1时刻细胞单元存储的信息输入到LSTM节点中。通过输入门，输出门，遗忘门和cell单元的梳理，输出数据到注意力层中。LSTM 的计算公式为：

f_t＝σ_g(W_fx_t+U_fc_t-1+b_f)

i_t＝σ_g(W_ix_t+U_ic_t-1+b_fi)

o_t＝σ_g(W_ox_t+U_oc_t-1+b_o)

c_t＝f_t*c_t-1+i_t*σ_c(W_cx_t+b_c)

h_t＝o_t*σ_h(c_t)

其中x_t为上一单元的状态，f_t为遗忘门，决定从cell状态中丢弃什么信息，范围为[0,1]。i_t为输入门，决定从当前状态中选择多少信息进入当前的c_t，范围为[0,1]。

步骤3.3：构建注意力层，将从步骤3.2中得到的隐藏层状态序列输入到注意力层中，在注意力层中，拐点和非拐点，速度特征的影响被区分开来。为更重要的点和更重要的特征分配权重，利用Softmax函数对注意力得分进行归一化从而得到权重分布，其计算过程公式可表示为：

a_tj＝v^Ttan(h(W_ss_t-1)+W_hh_t)

步骤3.4：构建输出层：输出层由全连接层，Dropout层，Softmax层组成，其中Dropout层用于避免过拟合，Softmax生成概率进行轨迹异常分类。经过步骤3.3输出的向量输入到全连接层，Dropout层、Softmax层转为概率。通过 argmax函数输出标签纸，即轨迹所属类别y，其当参数矩阵为W，b为偏置时，其计算公式如下：

y＝softmax(W·h_i+b)。

如图4所示，最后得到的模型网络结果，其中输入为经过特征提取后的出租车轨迹向量表示，经过LSTM层，注意力层。到注意层的输出如隐藏状态F_n所示。到输出层，其中输出层由全连接层，Dropout层，Softmax层组成，隐藏状态F_n经过全连接层变成系列M_n。Dropout层用于避免过拟合，Softmax生成概率进行轨迹异常分类。模型的输出为该轨迹为异常轨迹的概率。

步骤4：输入数据经过嵌入层，LSTM层，注意力层，输出层之后会得到期望的输出，如果这个输出与轨迹的实际类别不同。则反向传播算法则会将误差反向传播至输出层，每层的神经元会根据该误差对网络结构中的参数进行更新，并可视化异常检测结果。

在步骤4中，所述过程包括如下步骤：

步骤4.1：将得到的分类结果y_i和当前正确的标签值y'_i分别作为交叉熵损失函数的两个输入，计算损失值；将误差信号传递到每一层的输出，再通过每一层的函数对参数的导数，可求得参数的梯度；再通过随机梯度下降(SGD)优化器更新和计算影响模型训练和模型输出的网络参数，使其逼近或达到最优值，从而最小化损失函数，得到最优模型之后输入验证集检测异常轨迹并可视化；

所述城市特征数据包括：出行频率特征，路段特征，居民状态转移特征以及居民区域转移特征，所述路段特征表示给定时段情况下，该路段的速度特征，由参数平均速度和方差表征，以RS表示路段，TS表示时段，路段特征被描述成高斯概率分布X-N(μ,σ²)，其中X＝(RS,TS)，μ,σ²表示从数据层中统计计算得出的平均速度和方差。

所述出行频率特征表示给定区域和时段的情况下，从该区域出发的车辆轨迹量，出行频率特征使用泊松分布表示X-π(λ)，其中X＝(RE,TS)，λ表示从数据层中统计计算得出的平均车辆轨迹量，居民状态转移特征表示居民在各种状态间的转移关系，所述状态指POI点的类别，以OS，DS分别表示起始状态和终止状态，所述居民状态转移特征以概率矩阵表示，所述矩阵中的每一项为P(OS ＝os,DS＝ds)的值，所述居民区域转移特征表示居民在各区域间的转移关系，以 OR，DR分别表示起始区域和终止区域。所述POI数据为在地图上任何非地理意义的有意义的点，包括但不限于商店、酒吧、加油站、医院和车站。

Claims

1.一种基于LSTM网络和注意力机制的出租车轨迹异常检测方法，包括如下步骤：

步骤3：模型构建与训练，构造LSTM-attention模型，将从步骤2中提取的特征作为输入加载到LSTM-attention模型中训练，通过LSTM层提取特征，注意力层区分拐点和非拐点的权重，训练完成后，将作为测试数据集的特征输入到LSTM-attention模型，对模型分类准确性进行验证；

2.如权利要求1所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法，其特征在于：所述车辆轨迹数据预处理包括如下步骤：

步骤1.1：通过车联网数据采集出租车轨迹数据，利用Douglas-Peucker算法过滤掉数据集中冗余采样点数据记录；具体步骤为：将一段轨迹的首末点连接成一条直线,求这段轨迹所有点与这条直线的垂直距离,并找出最大距离值d_max,用d_max与预定义的阈值D相比：若d_max<D,这条曲线上的中间点全部舍去；若d_max≥D，保留d_max对应的坐标点,并以该点为界,把轨迹分为两部分,对这两部分重复上述步骤，直至过滤所有冗余采样点数据；

步骤1.2：判断并去除噪音点，假设P_i-1,P_i,P_i+1为按照采样时间顺序排列的三个点，若P_i为可能的异常点，那么在P_i-1到P_i与P_i到P_i+1的平均速度差别较大；根据速度和时间得到距离，若在t_i-1到t_i的路径长度小于该时间段内最大可达位移r₁，且在时刻t_i到t_i+1的路径长度小于该时间段内最大可达位移r₂，则可以根据出租车最大行驶速度v,r₁,r₂投影出P_i可能出现的区域，若Pi出现区域之内，则Pi设为正常点，否则为噪音点，需要去除；

3.如权利要求2所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法，其特征在于：所述步骤2包括如下步骤：

步骤2.3：时间信息挖掘,将连续的时间戳以平均时间间隔离散化，利用skip-gram模型得到轨迹点对应时间戳的向量表示序列TP_i；

步骤2.4：速度信息挖掘，利用步骤2.1得到的轨迹点速度序列以skip-gram模型得到轨迹的点速度序列表示SP_i。

4.如权利要求3所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法，其特征在于：所述步骤3包括如下步骤：

f_t＝σ_g(W_fx_t+U_fc_t-1+b_f)

i_t＝σ_g(W_ix_t+U_ic_t-1+b_fi)

o_t＝σ_g(W_ox_t+U_oc_t-1+b_o)

c_t＝f_t*c_t-1+i_t*σ_c(W_cx_t+b_c)

h_t＝o_t*σ_h(c_t)

其中x_t为上一单元的状态，f_t为遗忘门，范围为[0,1]；i_t为输入门，范围为[0,1]；

a_tj＝v^Ttan(h(W_ss_t-1)+W_hh_t)

其中T为轨迹点的数量，tanh为双曲正切函数，v，W_s，W_h为学习的参数；

y＝softmax(W·h_i+b)。

5.如权利要求4所述的基于LSTM网络和注意力机制的出租车轨迹异常检测方法，其特征在于：所述步骤4包括如下步骤：