本文全面综述了轨迹数据分类的发展。鉴于轨迹数据分类在现代智能监控安全、异常行为检测、人群行为分析、交通控制等方面的重要作用,轨迹数据分类越来越受到人们的关注。根据对分类性能至关重要的人工标注的可用性,将分类方法分为无监督、半监督和监督三类。此外,根据提取的特征将分类方法划分为若干子类。本文对三种弹道数据分类方法进行了全面的了解和深入的研究,并提出了一些有前途的发展方向。

关键字:轨迹分类,物体运动,分类算法,评论

1简介

随着跟踪和监视设备的发展,大量的目标轨迹数据被收集,这使得提取有用的信息变得迫切而富有挑战性。轨迹分类是分析轨迹数据的有效方法,在模式识别、数据分析、机器学习等领域有着广泛的应用。此外,轨迹分类用于获取轨迹数据中的时空信息,因此在一些应用领域中非常普遍,如目标运动预测[26]、交通监控[7,50,75]、活动等轨迹数据根据设备类型、物体运动甚至用途以不同的格式记录。例如,全球定位系统(GPS)跟踪设备通过跟踪物体的运动来生成轨迹,即轨迹=(。,),这是地理空间中连续的点序列,Tri表示坐标和时间戳的组合,如Tri=(,,),如图1所示。在某些特定的情况下,会添加与物体运动相关的其他属性,例如速度、方向、加速度或地理信息[149,150]。
半监督和监督轨迹分类的目的是从一组预先定义的标记数据集中为测试数据指定一个标签,因此算法是通过标签轨迹数据训练的。随着设备的发展,涉及分类的语义信息可以减少训练数据的总量,提高训练性能。然而,训练数据仍然应该事先由人类专家标记。在某些情况下,标记数据是不可能的,例如人群中的行人轨迹分组和监视中的动作识别,这些都需要识别人群场景中的物体。因此,需要对轨迹数据进行无标记的分类,本文将这些无监督的轨迹分类方法称为轨迹聚类方法。
最近,已经发表了一些论文来回顾轨迹分类的主题[66,84,88,153]。文献[66]对弹道数据及其在现实中的应用作了简要评述,包括轨迹的应用、轨迹的服务和轨迹的挑战。主要讨论弹道数据的生成和使用。参考文献[84]侧重于基于不同应用领域的轨迹数据挖掘技术。本文对轨迹数据挖掘进行了较深入的研究,但仅作了简要的介绍。此外,缺乏技术分析和不同方法之间的比较。文献[88]综述了基于视觉的轨迹数据分类方法。列举了各种方法的优缺点,并考虑了不同的应用场景。参考文献[88]按照聚类过程对论文进行了讨论,包括数据预处理、聚类和路径建模,用于进一步推断。然而,只有有限的模型进行了审查,它主要讨论了弹道数据产生的监视。文献[153]从轨迹测量计算、轨迹分类、聚类验证和应用场景四个方面综述了相应领域。它主要集中在根据时空信息对轨迹进行分类的论文上。然而,单凭时空信息不能达到令人满意的鲁棒性、有效性和准确性。因此,本文将回顾使用不同特性和数据格式的方法。
本文讨论了所有被评论文的应用问题,列出了每一篇论文的编写方法和技术细节。此外,在每个部分末尾的下表中对性能和差异进行了比较,它们揭示了所审查模型的弱点/优点。最后,在介绍实验数据集和论文的基础上,列出了最新的模型。本文将轨迹分类方法分为无监督、有监督、半监督三类。在每一部分中,根据不同的特征使用方法将这些方法进一步分为不同的子部分。无监督模型的目标是在没有人工专家监督或训练数据的情况下对数据进行聚类。通过分析未标记的数据集[37,39,139,143]得出了一个推理函数。在轨迹分类之前学习监督模型。通常,标签数据用于学习将数据映射到其标签或组的函数。未标记数据的分类由该函数预测[27,45,141,154]。标注数据需要大量的人工操作。对于大数据集,这是不可行的。半监督方法是前两类模型的折衷。他们被部分标记数据训练。

2、数据集

由于不同的轨迹数据集是从不同的场景中采集的,或者包含不同类型的数据,因此本节简要介绍了目前流行的轨迹数据集或生成轨迹数据的相关方法。此外,轨迹分类还存在着不同的应用问题,包括动作识别、社会事件发现、热点路径发现、目标检测与识别等。因此,有很多数据集可用于测试轨迹分类模型,下面将对一些流行的数据集进行综述。在回顾了数据集之后,应该更清楚地找出最先进的轨迹分类模型。
(1) Hollywood2数据集:它包含了分布在3669个视频片段中的12类人类行为,这些视频片段是从69部电影中采集的,因此它主要用于测试动作识别中的轨迹分类[42,92,104,133,148]。然而,该数据集还有其他应用领域,如视频分类[59,142]。
(2) HMDB:它主要是从电影中收集的,而一小部分数据来自于像YouTube这样的公共数据集。HMDB包含51个人类动作,分布在6849个视频片段中,每个动作有101个片段。此外,不仅包括身体运动,还记录了一般面部动作和与物体的面部动作。因此,它主要应用于动作识别[25,42,92,133]。
(3) 奥林匹克体育:它包含运动员参加16个不同项目的体育视频,所有视频都是从YouTube上收集的。与前两个数据集相比,OlympicSports的场景更简单,并且使用了有限的对象。因此,它主要用于动作识别[42,92,133]。
(4) UCF:UCF数据集被分成10多个数据集,这些数据集按组数、应用目的和记录设备进行分类。UCF50和UCF Sport是涉及轨迹分类的主要数据集[25,33,51,103,104,109,121,133]。UCF50包含了50类人类行为,由于变化很大,这些类具有挑战性。此外,50个班级被分为25个小组,代表25个不同的人、背景和观点。UCF体育收集了与体育活动有关的人类行为。
(5) TRECVID:包含详细的地面真实数据的视频,数据集中需要30多个语义特征。因此,动作识别[51]不仅是本数据集所关注的主要应用问题,而且还涉及其他应用,例如社会事件的发现[44]。
还有其他的论文自己生成轨迹数据。例如,参考文献[57]通过安装的GPS设备从车辆和动物获取轨迹数据。参考文献[6]应用文献[5]对监控视频中的行人进行跟踪并生成轨迹数据;参考文献[41]也使用参考文献[119]生成轨迹数据。此外,一些论文将视频作为数据集,如UCSD,参考文献[56]和[139]。

3 无监督轨迹分类算法

近年来,越来越多的算法需要在不需要任何先验知识的情况下对弹道数据进行实时分析。因此,不涉及监督,本文称之为聚类方法。例如,在一个大型购物中心,需要对异常行为进行实时识别,但在监控中很少记录到先前的异常轨迹。因此,无监督算法被发明来实现轨迹聚类。无监督算法推断一个函数来描述未标记数据之间的内部关系。聚类是绘制这种隐藏结构的方法,本文综述了一些与轨迹聚类相关的模型,如密集聚类模型、层次聚类模型和谱聚类模型。

3.1密集聚类模型

密集聚类模型度量给定质心后点的密集程度。受此启发,参考文献[37]提出了基于密度的带噪声应用空间聚类(DBSCAN),已广泛应用于轨迹聚类,如图6所示。在DBCSAN中,如图5所示,选择p点作为核心点,并预先给出距离阈值ϵ。圆内半径为ϵ,圆心为p的点称为p的直接可达点。如果存在Tri可直接到达p且每个Tri可直接到达Tri的路径,则,}对p是可到达的[57133]。其他点是离群值。因此,距离度量和核心部件的选择非常重要。为了解决DBSCAN不能对密度差异较大的轨迹进行聚类的问题[62,72,73],首先对所有的轨迹进行划分并用子轨迹代替,然后对子轨迹进行聚类,最后对所有的聚类进行分组。然而,与文献[73]中用欧几里德距离测量距离不同的是,在文献[62]、[72]中,该距离是用等权角距离、中心距离、平行距离的组合来测量的。在文献[31]、[72]、[162]、[163]中,核心轨迹是从这些簇中计算出来的,并用于对新来的轨迹进行分类,例如,属于同一簇的所有轨迹点在每一时刻被平均为一个新的点,并且所有平均的点形成簇的表示[72]。一个类似的模型[118]提出通过计算密度可达性和人与商业场所之间的密度联系来寻找旅行伙伴,这类似于DBSCAN中的直接可达性和可达性定义。在一种基于自适应多核的方法中,收缩聚类通过考虑位置、速度和点等属性来表示所有组,这些属性在参考文献[144]中保留了更多的区别性信息。
除了DBSCAN,还有其他属于密集聚类模型的模型对轨迹数据进行聚类。K-means通过反复搜索簇的质心来表示簇的轨迹[39,43,55,85,89,116]。然而,K-means对噪声数据非常敏感,因为少量的异常轨迹数据会显著影响聚类的表示。由于这个原因以及诸如数据不精确和大型数据集的复杂性等问题,一条轨迹可能属于多个集群。因此,为了提高K-means的性能,期望最大化(EM)算法被实现来迭代地求解优化问题[64,166],因为EM为每个分配分配一个新轨迹的概率。
该算法使用参数来衡量每个轨迹的聚类模糊度,称为模糊度。该算法在每次迭代中搜索正确的方向,寻找簇轨迹[96,97,111]。此外,该算法为轨迹的每个元素分配一个聚类中心,减少簇内方差,提高轨迹聚类性能。FCM类似于K-均值,它们都是迭代最小化优化函数,得到的最小值就是局部最小值。然而,与K-means不同,FCM为轨迹的每个元素分配一个隶属度值。在其他论文中,他们提出寻找轨迹的群模式[48],即在一个时间间隔和半径为flock的群体内的轨迹段[47]。文献[125]提出在基于网格的索引中寻找任意时刻tp的群聚圆盘p。此外,应该有足够多的不同轨迹的点被分配到同一个磁盘上。文献[127]旨在通过挖掘动物的空间信息来跟踪动物的运动趋势。与群体模式类似,文献[9]提出利用空间信息将不同时间记录的轨迹聚类在一起。具体地说,如果trajectoryi和trajectoryj包含足够近的子轨迹和,则它们是匹配的。表2显示了密集聚类模型的应用领域和相应的方法。

3.2层次聚类模型

层次聚类模型有助于通过多个特征来理解轨迹,因此这种树型结构非常适合实现。层次聚类模型一般分为凝聚型和分裂型两种聚类类型。如图7所示,两种层次结构类型也称为“自底向上”和“自顶向下”方法。
在凝聚框架中,通过搜索轨迹的共同性质对轨迹进行分组,并对相似的簇进行合并。通过重复表示计算和聚类合并得到最优分类,直到满足要求为止。受此启发,文献[164]探讨了聚集聚类模型,以挖掘用户感兴趣的位置,提出了超文本诱导主题搜索(HITS)模型,并将用户的运动轨迹记录为轨迹。迭代得到前n个有趣的轨迹簇,生成最热门的位置。
与聚集式框架不同,分割式框架将轨迹数据聚类成组,并递归地将其分割以满足需求。例如,在初始聚类阶段,轨迹数据以方向特征为特征,并通过嵌入Bhattacharyya距离的优势集进行聚类[76]。此外,轨迹被进一步分割,除了那些在每个簇中具有相似位置的轨迹。由于迭代模型的良好性能,提出了测试与划分(TAD)模型[161]。它是一个分裂框架,首先检测所有的封闭轨迹,然后递归地分割它们。[139]中考虑了更多的轨迹点属性来提高性能

3.3光谱聚类模型

轨迹数据可以表示为一个称为亲和矩阵的矩阵,它们之间的关系被提取为矩阵的元素。可以很容易地将143个特征向量分成不同的组,这些特征向量可以在它们之间形成不同的间隔。此外,亲和矩阵刻画了视频的特征[121],并表示了它们之间的关系。文献[23]、[52]和[158]探讨了利用谱聚类模型对高维轨迹数据进行聚类的几种新方法。例如,一个新的相似性度量捕获了参考文献[52]中的时间序列之间的因果关系,并且一个亲和子空间的混合应用于参考文献[23]中的近似轨迹。在文献[36]中,轨迹数据通过考虑轨迹的协方差特征来表示,避免了考虑不同长度的轨迹数据。在文献[148]中,谱聚类结合多实例学习框架来实现人类行为识别。
谱聚类模型来源于图论,其中无向图表示关系,并构造表示关系的对称邻接矩阵[15]。通过构造一个图,可以挖掘轨迹数据中的显式和隐式意图[25]。图被分割成子图来分类轨迹,每个子图代表它自己的簇[78155]。分层通过将轨迹点作为图节点来搜索每个簇中的子簇,这个过程称为分层图划分[49]。为了考虑更多的变量,文献[80]提出了一种新的由图上随机游动的熵率组成的测度函数。从无向图可以表示为相邻矩阵的思想出发,有向图也可以涉及[75]。在文献[95]中,轨迹二叉树(BPT)通过将轨迹表示为节点来表示视频,因此边缘表示一对轨迹之间的关系,图切割方法将轨迹数据分组。由于复合特征描述子具有较强的鲁棒性,文献[78]采用了加速鲁棒特征(SURF)和最大稳定极值区域(MSER)两类描述子。如果一个物体的不同部分被跟踪,那么这个物体就会产生多条轨迹,因此人们发明了一个模型,用特征块来描述轨迹[81]。根据几何距离和外观距离计算边缘。文献[60]利用Hausdorff距离来度量相似度,并将其设为边的权重。由于PageRank的出色性能,它也被用来对边缘进行评分[28]。表4显示了谱聚类模型的轨迹数据应用和相应的工作。


4.轨迹分类的监督算法

有监督算法的目标是在分析带标签的训练数据后,学习确定测试数据标签的函数。因此,监督算法的性能优于其他算法,并且在分类部分可以节省更多的计算资源。在一些有监督的算法中,轨迹数据通过无监督算法和表示法进行分类。轨迹分类的k-NN方法。查询轨迹为绿色,标注的数据为红色和蓝色,表示两组。
对新的查询轨迹进行分类。例如,在密集聚类模型中,可以根据分组的训练轨迹数据计算表示,并在参考文献[10]和[96]中对新的未来轨迹进行快速分类。在文献[50]和[98]中,通过搜索树对轨迹数据进行分类和组织。

4.1最近邻算法

最近邻算法(k-Nearest-neighbor algorithm,k-NN)就是寻找一个投票系统来确定一个新实体的类别,并且所有的数据都保存在同一个特征空间中。在轨迹分类中,计算查询轨迹到所有标注的训练轨迹数据的距离,并由k个最近邻对查询轨迹的标注进行投票。例如,如图8所示,当k=1时,查询轨迹被指定为蓝色轨迹;如果k=3,则分配为红色轨迹。
在实现过程中,根据场景、遮挡、轨迹数据格式和特征类型选择合适的距离度量是非常重要的。因此,在文献[45]中,轨迹数据用MBR表示,用k-NN分类。它避免了遮挡,增加了对象间的可分性。一些论文采用树结构来帮助搜索,并将训练数据集作为组的表示来提高k-NN的搜索速度。将轨迹数据的时空信息用黎曼流形表示并与形状空间相匹配,然后用训练集{训练函数F。训练集通过计算训练集与测试集之间的最大余弦相似度作为k-NN,uˆu Tr的度量来识别动作· . 此外,为了更快地访问k-NN,快速最近邻(fastNN)算法将轨迹数据组织在八叉树中以改进搜索[102]。随着查询轨迹的增加,要求轨迹数据在一个固定周期内的趋势而不是一般的表示,因此参考文献[41]考虑了在固定周期内动态搜索最近邻或属于某一特定类型的近邻的情况。训练支持向量机(SVM)以获得最优参数和超体积,如果查询轨迹超出超体积,则将其确定为异常值[100]。对于更复杂的场景,例如在人群中检测社会群体,参考文献[114]探讨了结构支持向量机(Structural Support Vector Machine,Structural SVM)。添加时间因果关系来衡量行人对其他运动路径的相互影响,这意味着计算两个对象之间的影响并将其作为特征添加,即社会身份之一[114]。空间信息也被用来测量物理距离、形状相似性和群体活动。在文献[113]中,以轨迹数据点为节点,训练支持向量机对轨迹进行分类。

4.2统计模型

统计模型利用一组概率分布来表示数据生成过程,如高斯混合模型(GMM)和贝叶斯推理。GMM通常与EM算法相结合来训练各个部件,贝叶斯推理得到一组概率函数来确定查询轨迹数据的类别。Bayes定理是贝叶斯推理的关键定理,其形式为P(|)=|,其中A和B表示事件空间中的两个事件。AB(B第A(B)第)(A)
GMM旨在描述{。,}在GMM组件中作为十1十2xn公司
K
P(许继) =π英寸(许继;μi, Σ我),(21)
我=1
其中N(;μi,∑)是属于平均μi和方差∑分量的第i个分量的概率密度。πi是约束为1的权重,可以根据事件频率计算。通常,EM算法迭代优化GMM的参数,但在训练阶段有标记轨迹数据时,用极大似然算法代替EM。例如,在文献[154]中,视频事件被视为一组事件模式的线性组合,并且提出了两个概率项来表征视频事件。此外,通过总结相应视频的轨迹数据概率,对异常模式进行评分。GMM对环境因素引起的变化进行建模,并嵌入DTW中进行手势识别[12]。许继我K公司=1πi
贝叶斯推理对新来的数据进行分类,分类后的数据更新贝叶斯推理的概率函数。对于样品{。,},对应标签y1:n的概率为p(|)。从马尔可夫链蒙特卡罗(MCMC)算法出发,变量的分布可以用一个联合分布来近似,因此使用Gibbs抽样来迭代地对p(|-)进行抽样。根据Bayes定理,p(|-)表示为p(|-,)∞(|-)(|-),其中p(|)是似然,p(|-)是边际分布。在贝叶斯推理框架之一的Dirichlet过程(DP)模型中,p(|-)表示为p(|-)∞()+∈-(-),其中α是尺度参数,G0是采样空间中的基测度。聚类可以被参数化以分类新的查询数据,例如Dirichlet过程混合模型(DPMM)用参数化索引{。,Θ}在[54]中。最后,通过训练的DPMM将新的查询轨迹分类为p(Θ|)∞(|)(Θ),其中p(|Θ)是似然,p(Θ)是先验概率。为了学习时空耦合模式,文[132]采用了分层Dirichlet过程(HDP)算法。贝叶斯模型通过对运动轨迹进行分类来分割物体,从而也可以检测到人体的运动[32]。表6按统计模型显示了弹道数据的应用和相应的工作。十1十2xn公司是的1: n十1: n是的1: 不十1: 不彝语是的我十1: n彝语是的我十1: n彝语是的我十1: 不p席彝语p彝语是的我席彝语彝语是的我彝语是的我彝语是的我αG彝语jiδ彝语yj公司12米k公司右p右k公司第k公司右k公司k公司

4.3神经网络

神经网络是模拟动物大脑中生物神经网络的人工系统。该网络由多个相互连接的神经元构成,每个神经元用实数表示。神经网络可以像深层生成模型一样表示数据。如果轨迹数据被生成为一个向量,它被训练来表示多元时间序列[152],并且它用卷积代替因子分析器的内积运算,因此模型中包含了时间相关性,如等式(22)所示。在此基础上,提出了一种生成模型,可以独立地、重复地从潜在变量中生成原始数据。
Tr=A*x+b+,(22)ϵ
其中A,b是需要优化的参数,x是潜在变量。一个具有权值衰减和稀疏约束的深度全连接神经网络从不同的ϵ紧凑表示中固定视点的视点[103]。将同一人从不同角度所作的同一动作记录为一系列轨迹数据,共108个视角。利用深度全连通网络对模型进行训练,称为鲁棒非线性知识转移模型(R-NKTM)。
在大多数情况下,神经网络被用来分类数据。它可以看作是一个数学函数f:X→,其中X是观测值,Y表示相应的标签。例如,卷积神经网络(CNN或ConvNet)由卷积层、池层和完全连接层组成。这种布局可以容忍输入数据的变化,避免过拟合问题,并且可以像多层感知器(MLP)一样区分数据。CNN在计算机视觉分类问题中已被证明是有效的。如图9所示,CNN由输入层、隐藏层和输出层组成。文献[27]和[141]中采用CNN进行轨迹分类。在文献[141]中,分别提取了基于帧、基于对象和基于场景的特征,并将它们融合在一起完成视频分类。此外,还可以发现视频与对象/场景之间的语义关系。在融合阶段,分别计算三个特征序列的平均表示,并将其输入融合网络的第一层。视频的得分属于显性标签,是网络的输出。CNN还通过对密集的物体轨迹进行分类来对分割进行排序[40]。利用运动目标检测器,提取出前景和背景中的目标。然后,对时空管中物体的运动轨迹进行分类,将物体分为0或1,即前景或背景。该方法解决了目标运动变化引起的分割模糊问题。参考文献[138]将两个任意帧之间的坐标不相似性视为骨架轨迹,并将轨迹投影到三个正交平面上。这种投影方法称为关节轨迹图(JTM)。对空间信息的保存有明显的效果,并对运动差异和方向、速度等时间演化进行了编码。除了CNN,递归神经网络(RNN)是另一种可以访问网络内存的人工神经网络。它适用于处理时间动态行为。然而,由于RNN的反向传播过程中会忽略梯度,因此提出了长短时记忆(LSTM)来解决这一问题。文献[34]中涉及到更复杂的网络,它将CNN作为一种深层次的特征抽取器。它有助于捕捉复杂的轨迹。在LSTM中,轨迹被转换成句子映射,从而对大规模图像进行降维和表示。为了进一步应用,参考文献[63]是采用多层LSTM模型对车辆进行分类和预测运动的方法。文献[2]没有融合基于不同预测的RNN得分,而是提出了一个“社会统筹”层,通过融合邻居LSTM的隐藏状态来表示状态,该框架考虑了人与人之间的影响,并引入了一个二元高斯分布来描述未来的位置。利用训练数据,最小化基于隐状态的损失函数,训练二元高斯分布的参数。因此,文献[2]考虑了邻居的影响,并给出了一个适当的函数来模拟这种情况,即对某个数据集的最新模型。

5 轨迹分类的半监督算法

半监督算法介于无监督算法和有监督算法之间。算法利用少量的标记数据和连续查询数据完成任务。首先对模型进行标记数据训练,然后不断地将查询数据发送给训练后的模型,以保证在训练数据量太小时,模型能够得到更新,使之优于以前的模型。半监督程序只需要很少的成本考虑到人类分类的努力。该方法不仅避免了过拟合问题,而且比无监督方法更精确。
因此,一些半监督算法是在无监督或有监督算法的基础上发展起来的。例如,首先对轨迹数据进行分类,然后对新的查询数据进行聚类以自动更新分类器[50,71,135,154]。在文献[50]中,用时空信息和对象ID来描述轨迹数据,并将对象ID、道路ID、目标运动方向和时间间隔等信息作为匿名数据。因此,将同一时间间隔内的轨迹分组为子数据集。在每个子数据集中,对轨迹进行分类并计算其表示形式,从而在新目标出现新轨迹时给出推荐路径。文献[71]提出了一种参数光模型来解决多个参数难以优化以获得良好性能的问题。不符合度量(NCM)度量新的查询轨迹与每个训练轨迹之间的差异。根据应用,可以包括其他信息来实现目标,包括对象的速度、方向、第三空间位置或时间信息。文献[135]的目的是将轨迹表示为矩阵,blob跟踪器从视频片段中获取目标的轨迹,轨迹的每个元素由当前帧上blob区域的四个角点组成。因此,轨迹被表示为N×8矩阵,其中N是轨迹的长度。在给定运动矩阵后,其低阶近似矩阵可由M∮=,其中M为运动矩阵,C为代表运动子空间中的矩阵。U是通过最小化|−| |来计算的,并且R=。为了计算近似值,计算误差,SSE=| |−| | |。在子空间下,根据SSE值将轨迹分配为异常或正常。视频的轨迹数据被建模为正常模式和异常模式的组合,参考文献[154]中的概率项描述了这些模式。从这个模型中,可以通过检测到的查询轨迹来更新术语。
由此可见,半监督算法几乎是由监督算法衍生而来的。在分层框架[50,99]中,由于对每个新的查询数据进行分类并在迭代步骤中找到合适的类别,因此当涉及大量数据时,它们会花费大量的资源。统计模型[54,67,74,154]需要大量的训练数据,而且采样过程比层次模型快,因为在统计模型中整个轨迹涉及推断处理,而不是在分层模型中计算轨迹的每个点的距离。文献[54]对交通数据的准确率达到85%,对手标志数据集的准确率达到74%,这使得新的轨道分类更加方便和快捷,因为之前的分类只需要更新两个参数。此外,他们使标签工作更便宜。然而,为了达到获取精度,需要多次迭代,这意味着需要同时推荐验证步骤和校正步骤,并且轨迹独立性假设会影响算法的性能。作为一种神经网络模型,文献[51]对KTH数据集和UCF50数据集的精度分别达到98%和53.8%。它优于一些模型,包括卷积神经网络(CNN)。当一个更紧凑、更强大的轨迹表示法被学习到时,就可以获得更好的性能,并且需要一些标记的训练数据。在大多数特定的情况下,得到的标记数据很少,半监督算法是合适的。

六、未来发展方向和任务

在轨迹分类中,我们看到了测量不同长度轨迹的重要性。因此,一种表示方法或特征描述子对于轨迹分类至关重要。在近年来,将弹道数据转换到其它空间的方法越来越受到重视,如DFT,它可以保留数据信息,统一轨迹数据的长度[54]。对于其他准备工作,重采样对于稀疏场景是有效的[134],但它限制了模型的鲁棒性。曲线近似适合轨迹的运动[110155]。因此,弹道数据准备可能是一个有前途和有益的方向。
近年来,密集聚类模型在轨迹聚类方面取得了很大的进展。特别地,根据不同的特性,提出了一种新的距离度量方法来测量弹道数据。此外,对于密度差异较大的轨迹数据,采用网格结构来提高性能[124]。除了基于网格的DBCSAN外,参考文献[62]、[72]和[73]中的轨迹用子轨迹代替。
谱聚类模型和图方法虽然有着相似的思想,但它们本质上是不同的。谱聚类模型易于实现,不受数据维数的限制,但模型需要非负亲和力,这一限制限制了其性能和应用。因此,需要一种合适的亲和矩阵构造方法。此外,在计算亲和力矩阵时确定尺度值是非常重要的,因为它决定了聚类结果的有效与否。因此,谱聚类模型需要处理亲和力矩阵的构造问题。
在监督算法中,需要大量的训练数据才能得到有效的模型。然而,例如在神经网络中,可能存在过度拟合的问题,并且需要一些特殊的步骤,例如在CNN中合并层。此外,需要注意的是,有意义的距离度量对于最近邻算法是必不可少的。
本文对弹道分类方法进行了综述。根据轨迹数据具有多种特征和数据形式,引入训练数据或记录速度值等运动信息。然后,需要不同的算法来实现这一目标,因此将其分为三类:无监督算法、有监督算法和半监督算法。无监督算法被称为聚类方法,它可以分为三个子类:密集聚类模型、层次聚类模型和谱聚类模型,其中谱算法在这一类中表现得更好。通过综合分析,我们发现无监督算法虽然没有训练数据的要求,也没有人工专家的监督,但存在计算量大、存储量大的缺点。监督算法分为最近邻算法、统计模型和神经网络。此外,神经网络被应用于解决许多问题,包括轨迹分类。训练神经网络虽然需要大量的训练数据和大量的时间来理解弹道数据的结构,但它对新来的轨迹分类速度快,在实时应用中显示出鲁棒性和准确性。半监督算法结合了前两种算法的优点,但验证和校正步骤需要多次迭代。因此,它减少了计算时间,适用于涉及少量标记数据的情况。最后,我们提出了一些有前途的方向和任务,本文可以帮助读者对轨迹分类有一个透彻的了解。