城市轨道交通车辆以太网流量的预测方法

马乐庭 伍红波

(1.中车长春轨道客车股份有限公司, 130062, 长春;

2.北京交通大学电子信息工程学院, 100044, 北京∥第一作者, 高级工程师)

列车控制系统中的信息传输及城市轨道交通运营商对控制通信的要求不断上升,使得传统列车总线技术已不能满足列车通信控制网络日益增长的带宽需求。采用ETB(以太网列车骨干网)和ECN(以太网编组网)等列车以太网技术来提升列车通信带宽是急迫且可行的[1]。

网络流量预测技术是网络监控技术的重要组成部分之一[2]。高效、高精度的网络流量预测技术可协助监控系统进行实时、高质量的网络通信流量预警和控制,并为网络安全和异常监测提供技术支撑。针对车辆以太网的网络流量预测技术,尚未有一种普适性方法可适用于所有网络环境,需针对具体应用场景和网络流量特性进行选择。利用主流的智能预测方法进行以太网流量预测,通常需进行3方面的研究和分析:

1)网络流量历史数据的特性分析:是否可用确定的统计学模型描述,或是否具备智能预测方法所需的统计学规律特性,尤其是平稳性。

2)模型方法的选择和训练:根据流量场景和样本量选择适当的智能预测模型,划分训练集和测试集进行训练和测试。

3)模型方法的分析和评价:基于模型训练和测试结果,对预测方法进行性能分析和评价。

网络流量预测属于典型的时间序列预测问题,诸多模型方法如GARMA(广义自回归移动平均)、RBF(径向基函数)神经网络、小波变换及SVM(支持向量机)等均有相关研究[3-5]。但大多智能预测方法对数据集的敏感性较高,若数据量不足或缺乏多样性甚至存在过多离群点,则预测精度会明显受到影响[6]。虽通过融合或改进智能算法能提升网络流量预测精度,但其算法复杂度的增加会影响预测的实时性[7]。因此,如何权衡速度与精度,并针对车辆以太网应用场景进行主流方法的仿真对比试验,具有积极的意义。

本文基于以太网公开数据集结合自建的车辆以太网试验系统,对典型的3种智能预测方法,即RBF神经网络模型、LSTM(长短期记忆)神经网络模型和LS-SVM(最小二乘支持向量机)模型的网络流量预测性能进行研究。首先,对拟用于试验的数据特性进行分析,讨论其使用智能预测方法进行训练和回归的可行性,并描述了网络流量预测的总体方案框架;
进而,简述了3种典型智能方法的预测原理和步骤;
最后,对3种方法的仿真试验结果进行了对比分析,为车辆以太网流量预测方法的选择提供一定技术参考。

本文的以太网试验数据来源于Bellcore Morristown研究工程中心的高分辨率网络流量数据采样[8]。对预测的数据,通常要求其是平稳时间序列的[9]。上述公开数据集经多场景分析,表明其具有时间序列的规律统计特性:周期平稳性和自相似特性[10-11],且本文后续仿真曲线也展现出数据的周期平稳特性。故基于该数据集搭建试验系统如图1所示,总体网络流量预测方案如图2所示。

图1 基于Duagon板卡的试验系统Fig.1 Experiment system based on Duagon cards

图2 总体网络流量预测方案Fig.2 Overall internet flow data prediction scheme

由图1可见,基于杜根(Duagon)设备的试验系统由电脑主机担任输入数据包的发送端和输出数据的接收端;
杜根设备核心板卡型号为I303,即车辆以太网通信板卡;
交换机、Wireshark软件和网络调试软件协助进行通信监控。由图2可见,将Bellcore数据集输入以太网试验系统,然后输出以太网数据包送往RBF神经网络、LSTM神经网络和LS-SVM等3种智能预测方法进行训练和预测,最后进行网络流量预测性能的对比分析。

2.1 基于RBF神经网络模型的网络流量预测方法

RBF神经网络对非线性连续函数具有一致逼近性能,常用于不确定因素的建模和估计[12]。

基于RBF神经网络模型进行车辆以太网网络流量预测,需要在模型训练中解决2个问题:其一,确定神经网络结构,主要包括隐藏层的数目以及RBF神经网络的聚类中心;
其二,校正相应的权值,即将权值矩阵W从隐层空间映射到输出空间。其中,输入层到隐藏层之间为低维空间到高维空间的非线性映射,故隐藏层采用非线性的调整办法。隐藏层到输出层是线性加权的过程,故输出层采用线性调整办法。从而整个网络学习可分为聚类中心的确定以及权值矩阵的调整,两者的同步执行程度取决于数据复杂度。

本文采用3 000个车辆以太网流量数据采样点进行试验,其中前2 500个数据作为训练数据,后500个数据作为测试数据。建立RBF神经网络预测模型,取隐藏神经元数20个,迭代次数为10次,经数据预处理、模型训练和预测,得到500个以太网流量预测数值分布如图3所示。

图3 基于RBF的网络流量预测值与实际值对比Fig.3 Comparison between the prediction value and real value of network flow based on RBF

由图3可见,RBF神经网络模型总体上实现了流量的预测趋势跟踪,在流量上升和下降的走势中基本能保证较准确预测;
但在峰谷拐点时刻出现较明显的延迟及波动,最大误差点的幅值近30%,这说明流量值波动较频繁,难以满足高精度预测的需求。

2.2 基于LSTM神经网络模型的网络流量预测方法

LSTM神经网络源于RNN(循环神经网络)。LSTM神经网络模型在RNN的基础上将记忆单元置于隐藏层中的各神经单元内。该记忆单元可对历史数据信息和状态值进行长期的存储,同时传输存储的历史信息,加深时间序列的联系性[13]。该特性使其适于进行长时间序列的预测。

本文基于LSTM神经网络模型对车辆以太网流量预测模型的训练主要采用时间反向传播算法,即通过梯度下降法迭代更新参数,计算所有参数基于损失函数的偏导数。模型对权值的更新以迭代次数为一周期,当满足迭代次数达到最大值,或模型预测的车辆以太网流量和实际流量间的误差达到预定最小阈值,则停止对权重值的更新。本文LSTM神经网络选择Adam函数作为优化函数以及Sigmoid函数作为激励函数,网络流量预测步骤如下:

1)对车辆以太网的网络流量数据进行预处理。

2)设定LSTM神经网络模型结构,包括2个隐藏层、1个输入层和1个输出层;
设置隐藏神经元数目为100、迭代次数为140、初始学习率为0.005、梯度阈值为1。

3)将训练数据输入LSTM神经网络模型进行训练,并利用测试数据进行预测测试。

4)比较预测值与实际值,计算预测误差。

5)根据误差的大小,进行模型的反向传播运算,从而得到反馈的参数更新权值,以判断是否重复新的循环;
为防止收敛度过低,在60轮训练之后,通过乘以因子0.2来降低学习率。

基于LSTM的网络流量预测结果如图4所示。总体上,在数据的前段部分,模型的预测性能较好;
在数据的中间部分预测误差较大;
在数据的中后段部分预测趋势延迟明显,这也是LSTM神经网络模型在小样本时间序列预测中的缺陷。

图4 基于LSTM的网络流量预测值与实际值对比Fig.4 Comparison between the prediction value and real value of network flow based on LSTM

2.3 基于LS-SVM模型的网络流量预测方法

LS-SVM模型的主要机理是寻求结构化风险最小,从而提高学习机的泛化能力,同时实现经验风险和置信范围最小化。其优势主要表现在小样本数据条件下,仍然保证较好的回归预测精度[14],其应用于本文网络流量预测结果如图5所示。

如图5可见,基于LS-SVM模型的预测在整个数据段均实现了高精度的预测,尤其在峰谷及数据趋势发生变化的拐点处,预测跟踪效果突出。

图5 基于LS-SVM模型的网络流量预测值与实际值对比Fig.5 Comparison between the prediction value and real value of network flow based on LS-SVM

作为示例,本文取1~25个数据点(数值保留至小数点后2位,四舍五入),其实际流量、预测流量及误差值如表1所示。

表1 LS-SVM模型的车辆网络流量预测值与实际值对比Tab.1 Comparison between the prediction value and real value of vehicle network flow based on LS-SVM

2.4 3种预测方法对比及分析

上述3种智能预测方法的预测结果对比曲线如图6所示。

图6 3种智能网络流量预测方法对比Fig.6 Comparison of the three intelligent network flow prediction methods

采用均方根误差eRMSE和平均绝对百分比误差eMAPE对模型预测性能进行评价,其计算式如下:

(1)

(2)

式中:

n——时间序列的元素个数;

Yi——各元素实际值;

i——采样点序号;

n——采样总量。

式(1)—(2)中,n=25。

计算得到3种预测模型的指标结果如表2所示。

表2 3种模型预测指标对比Tab.2 Prediction index comparison of the three models

由表2可见:LS-SVM模型在车辆以太网的网络流量预测中相比RBF神经网络、LSTM神经网络模型更有优势。此外,在MATLAB 2019版本的软件运算上述3个模型时,RBF神经网络模型与LSTM神经网络运算的时间较长,而LS-SVM模型训练速度较快,保证了收敛的快速性和准确性,这反映出LS-SVM在工程应用领域的潜在价值。在本文测试场景中,具有长时记忆、强非线性适应性的LSTM神经网络在本场景预测中的性能并不如LS-SVM优越,这在一定程度上是由于本次测试样本量对LSTM神经网络而言不具有优势,而大幅度增大样本量和训练场景多样性将会有效提升LSTM神经网络性能。限于实际硬件平台试验资源所限,不再进行全面的对比。

智能算法的训练受到训练数据、模型参数、测试数据、噪声干扰和场景转换等多个因素的影响。在不同的测试场景和测试数据下,智能预测模型方法的性能可能会发生明显波动。因此,需要针对具体应用需求进行选择和人工调整参数。

本文面向城市轨道交通车辆以太网网络流量特性,采用3种智能网络方法设计网络流量预测方法,并给出了分析和计算。结果表明,对于模型的选用,样本量较小时宜选用LS-SVM,样本量较大且对实时性要求较高时宜选用RBF神经网络,样本量充足且对精度要求高时可选用LSTM神经网络。本文测试中,相对RBF和LSTM神经网络,LS-SVM在小样本(3000数据量)条件下体现出快速性和准确性的优势,具有在未来轨道车辆网络流量预测中的工程应用潜力。

综上,本文研究的算法对于一定应用场景下车辆以太网的网络流量预测具有较好的可行性,但对于实际多样化场景应用,应综合考虑数据样本量以及时效性要求,选择合适的智能算法并进行必要的数据预处理和网络参数整定。

猜你喜欢 网络流量以太网神经网络 基于神经网络的船舶电力系统故障诊断方法舰船科学技术(2022年11期)2022-07-15大数据驱动和分析的舰船通信网络流量智能估计舰船科学技术(2022年10期)2022-06-17MIV-PSO-BP神经网络用户热负荷预测煤气与热力(2022年2期)2022-03-09基于双向长短期记忆循环神经网络的网络流量预测计算机应用与软件(2022年2期)2022-02-19基于改进Hopfield神经网络的对地攻击型无人机自主能力评价北京航空航天大学学报(2021年4期)2021-11-24Microchip推出首款车载以太网音视频桥接(AVB)全集成解决方案汽车零部件(2021年4期)2021-04-29三次样条和二次删除相辅助的WASD神经网络与日本人口预测软件(2017年6期)2017-09-23三大因素驱动创新提速以太网快步迈入“灵活”时代通信产业报(2017年6期)2017-03-27三大因素驱动创新提速 以太网快步迈入“灵活”时代通信产业报(2017年3期)2017-03-24一种用于敏感图像快速加密的图像注入技术仿真现代电子技术(2016年24期)2017-01-19

推荐访问:以太网 流量 车辆