T-ITS(IEEE Transaction on Intelligent Transportation Systems)是智能交通系统领域的顶级期刊,中科院大类分区一区,CCF B类期刊。该期刊定位于智能交通领域的学术研究和科技发展,旨在推广智能交通系统技术与应用的研究。
交通数据是典型的时空数据。一般情形下,交通数据存在时空不完整性问题。在时间维度,无法保证在所有时刻都能够采集到完整的交通数据;同样地,在空间维度,无法保证在所有位置上都能够采集到完整的交通数据。对于时空不完整的交通数据,如何进行高性能的预测是交通预测中需要解决的关键问题之一。本期将分享一篇该期刊上解决此类问题的创新性文章,论文推荐和分享者为朱旺。
本次分享的文章的题目为《Traffic Prediction With Missing Data: A Multi-Task Learning Approach》,论文主要呈现了针对缺失数据情况下的交通预测多任务学习方法,论文的第一作者是Wang Ao。交通速度预测是智能交通系统的重要组成部分,现有的交通速度预测模型大多是基于交通数据完整或缺失值较少的假设,然而由于人为和自然因素,现实场景中交通数据往往是不完整的。此外,以往通过插值方法估计缺失值再进行预测的方法会破坏数据关键的潜在特征,进而导致误差积累。基于以上问题,本文提出了一种基于图的时空自编码器(GSTAE)。试验结果表明,该模型优于当前主流的基于缺失值的交通预测方法。
1. 研究背景与解决的关键问题
交通速度预测是智能交通系统的重要组成部分,在实际采集的交通数据中,由于各种因素的影响,数据缺失是一个现实而常见的问题。基于缺失值的交通速度预测不仅有助于解决实际应用中常见的数据缺失问题,还有助于提高交通系统的运行效率、决策制定的科学性以及用户体验的质量。在有大量数据缺失情况下的交通速度预测更难捕获其动态的时间相关性和复杂的空间依赖性,因此,论文针对以下挑战进行合理建模:
(1) 数据缺失问题
现实场景中交通数据往往是不完整的,这也是交通速度预测最关键的挑战之一。本文设计了一个采用自编码器结构的多任务模型,在编码模块从缺失值的交通数据中提取广义表示,进而捕获缺失数据的动态特性。
(2) 误差积累问题
以往研究中常用的线性插值法估算缺失值会导致数据过于平滑,从而失去其动态特征,进一步对下游任务(交通预测)造成不利的误差积累。因此本文将估算和预测作为两个并行任务处理,以消除估算对预测任务的影响。
(3) 模型训练速度和性能问题:
基于含有缺失值的交通速度预测任务量大、训练复杂的问题。本文设计了一个两阶段训练范式,通过多任务并行训练,提高估算和预测任务的性能。
2. 方法
针对于具有缺失值的交通预测,本文设计了一个多任务学习方法:图时空自编码器(GSTAE),其整体结构如图1所示。考虑到插值估算往往会忽略数据的动态特性,本文采用编码器-解码器结构设计模型。编码器模块从具有缺失值的历史交通数据中提取复杂的时空依赖关系,并将其表示为适合下游任务的广义密集表示。解码器使用编码模块的广义表示,耦合到执行特定的下游任务(估算和预测)。由于交通数据包含复杂的空时空依赖关系,在编码器模块中,本文采用双向递归时空块进行特征捕获。在解码器模块中,使用前向循环时空块自回归生成预测输出。每个时空块都由GCN和GRU组成,联合捕获时空特征。此外,本文在邻接矩阵的基础上还添加了一个自适应矩阵,从而学习更深层的空间特征。考虑到输入和预测任务的复杂性不同,以及为了提升模型的训练效率和预测性能。本文设计了一个两阶段的训练范式,将预测任务作为主要任务,估算任务作为辅助任务。具体来说,首先用估算任务训练提出的GSTAE模型,从原始数据中提取缺失值的表示,然后再进行预测任务。估算和预测任务是顺序训练的,编码器通过估算任务可以从数据中提特征表示,进行模型参数更新,进而加快后续预测任务的训练过程。
图1 T-ST-SSL模型整体框架
3. 实验结果
本文研究了随机缺失和非随机缺失两种缺失模式,数值缺失率范围从20%到80%,以20%为区间,在PeMSD7和METR-LA这两个公开数据集上进行实验。使用RMSE、MAE和MAPE评估并进行对比实验,结果表明本文提出的模型拥有最优性能。接着,对各个模块进行了消融实验,结果表明,模型的各个模块都对模型性能有积极影响。此外,本文还通过对时空块的特征维数、堆叠个数和全连接层的隐藏维数进行超参数测试,并确定了最优参数。
4. 结论
本文提出了一种新的多任务学习深度神经网络模型:GSTAE,该模型采用编码器-解码器结构来处理具有缺失值的交通速度预测任务,并消除了输入和预测过程中的误差积累问题。通过两阶段训练范式,所提出的多任务学习深度神经网络模型GSTAE在交通数据输入和缺失值交通预测两个子任务上都取得了优势和稳定的性能。然而,由于GRU模块迭代处理数据,不能并行化,因此在大规模数据集上采用该模型并预测长期交通速度需要大量的计算量。在未来,作者将通过使用CNN和TCN等模块改进模型结构来加速训练过程。此外,带缺失值的长期交通预测也是一个值得研究的方向。
您可以通过阅读全文了解该论文的详细内容,论文的下载地址为:https://ieeexplore.ieee.org/document/10012030。