文章快速检索  
  高级检索
基于BiGRU-SVDD的ADS-B异常数据检测模型
罗鹏, 王布宏, 李腾耀     
空军工程大学 信息与导航学院, 西安 710077
摘要: 广播式自动相关监视(ADS-B)作为新一代空管监视技术,由于采用明文方式广播发送数据,因而存在易遭受网络攻击的安全问题。为了准确检测ADS-B数据攻击行为,在充分考虑时间相关性的基础上,提出了针对ADS-B数据的异常数据检测模型。首先利用双向门控循环单元(BiGRU)神经网络预测ADS-B数据,得到了ADS-B数据预测值。再将预测值和实际值作差,将差值放入支持向量数据描述(SVDD)训练,得到了能检测ADS-B异常数据的超球体分类器。并且,选择了合适的滑动窗口,在保证异常检测准确率的同时,缩短BiGRU神经网络的训练时长。实验结果表明,BiGRU-SVDD模型能检测出随机位置偏移攻击、高度偏差攻击、重放攻击、拒绝服务(DOS)等攻击下的ADS-B异常数据。并且,与其他机器学习和深度学习方法相比,BiGRU-SVDD异常检测模型的准确率更佳,适应性更优。
关键词: 广播式自动相关监视(ADS-B)    异常检测    神经网络    双向门控循环单元(BiGRU)    支持向量数据描述(SVDD)    
ADS-B anomaly data detection model based on BiGRU-SVDD
LUO Peng, WANG Buhong, LI Tengyao     
School of Information and Navigation, Air Force Engineering University, Xi'an 710077, China
Abstract: As a new generation ATM monitoring technology, ADS-B is vulnerable to cyber attack because it broadcasts data in a plaintext format. To solve the security issues of ADS-B, this paper considers the time correlation of ADS-B data. Firstly, the BiGRU (Bidirectional Gated Recurrent Unit) is used to predict the ADS-B data, obtaining the predicted value. Then, the difference of the predicted and the actual values is put into SVDD (Support Vector Data Description) and a hypersphere classifier which can be trained to detect the ADS-B anomalous data. In addition, a suitable sliding window is selected to ensure the accuracy of anomaly detection and reduce the training time of the BiGRU neural network. The experimental results show that the BiGRU-SVDD can detect the ADS-B anomalous data from random position deviation attack, height deviation attack, DOS attack, replay attack, and data deletion attack. Moreover, compared with other machine learning and deep learning methods, the BiGRU-SVDD anomaly detection model has better accuracy and adaptability.
Keywords: ADS-B    anomaly detection    neural networks    BiGRU    Support Vector Data Description (SVDD)    

空中交通管理(ATM)是管理空域、飞行器和航线的重要系统。它利用通信、导航、监视等技术, 保障和维护空中交通安全、秩序和畅通[1]。目前,空管监视技术主要包含一次雷达(PSR)、二次雷达(SSR)、广域多点定位(Wide Area Multilateration,WAM)、广播式自动相关监视(ADS-B)等监视技术[2]。PSR通过对雷达发射信号和反射信号的分析计算,可获得探测目标的位置和速度等状态信息,但是PSR获取的状态信息误差较大。SSR通过询问、应答机制获取目标的状态信息,但在缺乏雷达保障的区域很难获取飞行器的状态信息,且SSR的监视精度不高。WAM通过到达时间差(TDOA)对目标飞行器的位置和速度完成测算,但是WAM需要部署多个地面接收站,且对地面接收站的部署位置有一定要求。ADS-B作为新一代空管监视技术,比雷达监视技术监视精度高、监视范围广;且相较于WAM,虽然ADS-B的定位精度略低,但由于ADS-B采用了广播机制,使得监视信息易在邻近飞行器和地面站之间完成信息共享,因而全球大部分商用飞机都安装了ADS-B设备[3-4]。ADS-B通过卫星导航系统(GNSS)和其他机载设备获取位置、速度和航向等信息,然后由ADS-B发射器广播这些信息,其他装配有ADS-B接收设备的飞行器和地面基站可以实时接收这些信息。但是,ADS-B以明文格式广播发送数据,协议缺少消息认证和加密机制,因而其安全性易受挑战。

文献[5-7]讨论了ADS-B易遭受的窃听、干扰、消息篡改、消息删除和消息注入等攻击,并对攻击的网络分层、难易等级和影响程度进行了分析。针对ADS-B的安全漏洞,目前已经提出了多种解决方法。第1类方案将加密技术用于ADS-B[8-10],但是此类方案不易实施,原因是与标准化的ADS-B协议不兼容。第2类方案将位置验证用于ADS-B数据的合法性判定[11-13]。文献[14]运用到达时间差(TDOA)和到达时间和(TSOA)2个量测定位飞行器位置,和ADS-B解析后的位置数据进行比较,实现ADS-B合法性判定,但是这需要多个基站协同工作;并且当多个基站接收ADS-B数据时间不同步时,会影响到ADS-B数据合法性的判定。第3类方案将机器学习和深度学习的方案用于ADS-B数据的异常检测,异常检测是ADS-B研究的一个关键问题。文献[15-16]使用深度学习的seq2seq模型重构ADS-B数据,对ADS-B数据中存在的位置和速度等异常,利用重构误差进行检测,但这种方法没有考虑飞行器机动状态改变所带来的ADS-B数据变化,因而这种方案的适应性不高。文献[17]将机器学习的支持向量数据描述(SVDD)用于ADS-B数据的异常检测,但是此方法需要同步的SSR数据和ADS-B数据做差,数据的时间同步问题不易解决,因而难以真正化。

本文针对ADS-B易遭受的随机位置偏移攻击、高度偏差攻击、重放攻击和拒绝服务(DOS)等攻击,构建了BiGRU-SVDD异常检测模型。利用BiGRU神经网络对ADS-B数据进行预测,得到ADS-B数据预测值;为了解决ADS-B数据攻击检测阈值自适应问题,将ADS-B预测值和实际值作差,把差值输入SVDD超球体二次训练,得到的攻击检测阈值具有良好的自适应性,提升了ADS-B异常数据的检测性能。并且,选取了合适的滑动窗口长度,降低了BiGRU神经网络的训练时长。

1 准备知识 1.1 双向门控循环单元(BiGRU)

RNN(Recurrent Neural Network)是深度学习中用于处理序列数据的神经网络,目前已经在故障预测和机器翻译等领域有所运用[18-19]。但是,RNN在参数训练时,存在梯度消失现象,因而RNN不适合处理长序列问题。GRU(Gated Recurrent Unit)是RNN的一种优化类型,它通过门控机制缓解了RNN的梯度消失问题, 因而具有学习长序列中存在的长期依赖关系的能力[20]。但单向GRU只是从前往后学习序列信息,然而在有些问题中,当前时刻的输出不仅和上文序列信息相关,还和下文序列信息也有关[21]。例如,在预测一句话中缺失的单词时,就需要同时结合上文和下文内容进行预测。BiGRU就是一种能处理这类问题的神经网络。BiGRU由2个信息传递方向相反的GRU循环层构成,其中第1层按时间顺序传递信息(顺时间循环层),第2层按时间逆序传递信息(逆时间循环层)。BiGRU的基本思想是:通过顺时间循环层得到正向隐藏状态,通过逆时间循环层得到反向隐藏状态,再将正向隐藏状态和反向隐藏状态拼接,得到BiGRU最终输出的隐藏状态。

1.2 支持向量数据描述(SVDD)

SVDD是文献[22]提出的一种基于边界数据的单分类机器学习方法。SVDD的主要思想是:通过训练目标样本,SVDD能创建一个超球体分类器,此超球体分类器几乎包含全部训练样本,并且它的体积越小越好。分类器可以表示为

$ F\left( R, a \right)={{R}^{2}}+C\sum\limits_{i=1}^{n}{{{\xi }_{i}}} $ (1)
 

式中:R为半径;a为球心;ξi为松弛因子,ξi≥0;C为惩罚系数,0 < C < 1。

图 1为SVDD超球体分类器示意图。如果测试样本离球心a的距离小于R,则测试样本是正常样本;若测试样本离球心a的距离等于R,则测试样本是支持向量;若测试样本离球心a的距离大于R,则测试样本是异常样本。

图 1 SVDD分类器 Fig. 1 SVDD classifier
2 异常检测模型构建 2.1 异常检测门限

用时间序列X={X1, X2, …, XM}表示模型接收到的原始ADS-B数据,M为序列的长度。Xk的表达式为

$ {{\boldsymbol{X}}_{k}}={{\left[ {{x}_{1}}, {{x}_{2}}, \ldots , {{x}_{d}} \right]}^{\text{T}}}\text{ }1\le k\le M $ (2)
 

Xk为一个d维列向量,每个维度表示ADS-B数据的一个特征,数据特征包括纬度、经度、高度、识别号、航向等信息。本文要解决的问题是如何检测出ADS-B时间序列数据中的异常数据。为了解决此问题,需要建立ADS-B异常数据的检测门限。图 2为异常检测门限建立的流程图。

图 2 异常数据检测门限 Fig. 2 Detection threshold of anomaly data

在训练阶段,首先对原始ADS-B时间序列X={X1, X2, …, XM}进行特征数据提取以及数据归一化处理,得到归一化后的序列数据Y={Y1, Y2, …, YM};接着,利用BiGRU神经网络对Y进行预测,可以预测下一时刻且在正常范围内的ADS-B预测序列P={P1, P2, …, PM};然后,将预测序列和实际序列做差

$ {{\boldsymbol{D}}_{k}}={{\boldsymbol{P}}_{k}}-{{\boldsymbol{Y}}_{k}}~\ \ \ \ 1\le k\le M $ (3)
 

将差值序列D={D1, D2, …,DM}放入SVDD训练,可以求出SVDD超球体的球心a和半径R,此半径R就是异常检测的阈值。

在测试阶段,输入测试数据Xk,经过求解后,如果其差值Dk距球心a的距离小于或等于阈值R,则Xk是正常数据;如果其差值Dk距球心a的距离大于阈值R,则Xk是异常数据。

2.2 数据预处理和特征提取

由于接收的ADS-B数据存在一定丢包率,故丢包特别多的ADS-B航班数据不能选取为训练样本,否则会降低BiGRU神经网络预测的准确性,进而降低模型的检测率。对一架次航班缺失的少量ADS-B数据,本文采用插值法进行补齐,插值法具体为:首先计算缺失值前后数据的斜率,再根据斜率补齐缺失的ADS-B数据。

ADS-B原始数据中包含了纬度、经度、高度、速度和航向等信息,也包含了24位的循环冗余校验码(CRC),但是CRC主要是校验ADS-B通信链路上数字传输过程中出现的错误,不能检测攻击者精心构造的ADS-B异常数据。

为了检测ADS-B异常数据,本文选取纬度、经度、高度、速度和航向为特征数据。用时间序列H={H1, H2, …, Hk, …, HM}表示提取的特征数据,序列H中每个元素均是一个五维列向量,5个维度表示的属性分别为纬度、经度、高度、速度和航向。为了消除奇异样本数据导致的不良影响,同时为了减短模型的训练时长、使训练过程尽快收敛,本文对ADS-B数据进行归一化处理,归一化的公式为

$ \boldsymbol{Y}_{k}^{i}=\frac{\boldsymbol{H}_{k}^{i}-\text{min}\left( {{\boldsymbol{H}}^{i}} \right)}{\text{max}\left( {{\boldsymbol{H}}^{i}} \right)-\text{min}\left( {{\boldsymbol{H}}^{i}} \right)} $ (4)
 

式中:HkH的第k个元素;Hk为五维列向量;上标i表示第i个维度;min(Hi)为Hi的最小值;max(Hi)为Hi的最大值。

2.3 基于BiGRU神经网络的预测模型

ADS-B数据具有前后时间相关性,是基于时间的一系列数据,它任一时刻的纬度、经度、高度、速度和航向等信息是与历史时刻和未来时刻的ADS-B数据相关的。为了实现对ADS-B时序数据的预测,本文设计了一种基于BiGRU神经网络的预测结构,如图 3所示。

图 3 BiGRU预测结构 Fig. 3 Prediction structure of BiGRU

输入层  本层用滑动窗口机制输入时间序列数据。序列{Xk-L+1, Xk-L+2, …, Xk-1, Xk}为[k-L+1, k]时间上的时序数据,滑动窗口的长度为L;并且每个时间步的滑动步长为1。例如,如果L=5,k=10,则表示{X6, X7, X8, X9, X10}为[6, 10]时间上的时序数据,预测结果是对X11的预测X11;则下一时间步{X7, X8, X9, X10, X11}为区间[7, 11]时间上的时序数据,预测结果是对X12的预测X12。同时设置BiGRU神经网络训练次数epochs、设置训练批尺度batch_size。

两层BiGRU   本层采用2层的BiGRU网络结构。利用BiGRU能捕获ADS-B数据的时间相关性,并且能解决梯度消失问题。第1层BiGRU1的神经元个数为60;第2层BiGRU2的神经元个数为40。2层BiGRU之间设置Dropout层,Dropout层是为了避免训练的过拟合,提高预测模型的泛化能力。

全连接层   全连接层能通过权重矩阵提取以前全部的局部特征,能够将网络的输出值映射成目标输出值。本文采用了3层的全连接层结构,第1层全连接层的神经元个数为20,第2层全连接层的神经元个数为10,第3层全连接层的神经元个数为5。

输出层  输出层通过线性激活函数输出xk+1预测结果。

2.4 利用SVDD算法求解

为了解决ADS-B数据攻击检测阈值的自适应问题,本文将ADS-B预测序列和实际序列做差,得到差值序列为Dk=Pk-Yk;将差值序列D输入SVDD程序求解,可以求得SVDD超球体的半径R和球心a。其中,半径R就是异常检测的阈值。为了使样本在特征空间中线性可分,需要利用核函数将样本从原始空间映射到一个更高维的特征空间[23-24]。本文采用高斯核函数,将样本从原始空间映射到一个合适的特征空间,高斯核函数的表达式为

$ {{K}_{\text{Gauss}}}\left( {{\boldsymbol{D}}_{i}}, {{\boldsymbol{D}}_{j}} \right)=\text{exp}\left( -{{\left\| {{\boldsymbol{D}}_{i}}-{{\boldsymbol{D}}_{j}} \right\|}^{2}}/{{s}^{2}} \right) $ (5)
 

式中:DiDj为输入SVDD的任意2个样本;s为高斯核参数。

2.5 模型评价指标

表 1描述了样本分类结果。TP指实际正常样本被正确判定为正常样本的数量,FN指实际正常样本被错误判定为异常样本的数量,FP指实际异常样本被错误判定为正常样本的数量,TN指实际异常样本被正确判定为异常样本的数量。本文采用检测率(De)、召回率(Rc)和准确率(Acc)作为评价指标。检测率De是指被模型正确判定为异常样本的数量占真实异常样本数的比例,召回率Rc是指被正确判定为正常样本的数量占真实正常样本数的比例,准确率Acc是指被正确判定的样本占总样本的比例。

表 1 样本分类结果 Table 1 Classification result of samples
真实情况 判定结果
判定为正常样本 判定为异常样本
实际为正常样本 TP FN
实际为异常样本 FP TN

则模型评价指标公式为

$ \text{De=}\frac{\text{TN}}{\text{FP+TN}} $ (6)
 
$ \text{Rc=}\frac{\text{TP}}{\text{TP+FN}} $ (7)
 
$ \text{Acc=}\frac{\text{TN+TP}}{\text{TP+FN+FP+TN}} $ (8)
 
3 实验与分析 3.1 数据获取

实验从OPENSKY中总计获取200架次航班数据用作训练样本[25],选取40架次航班作为测试样本。每架次航班的ADS-B数据在200~3000之间,选取的ADS-B数据包含了飞机的起飞、爬升、巡航和下降等阶段。

选取一架次包含300条ADS-B数据的示例航班,飞机处于巡航和爬升的机动状态,攻击的报文数据由模拟生成,生成方法如下:

随机位置偏移  如图 4所示,选取的ADS-B航班数据共300条。其中,前100条和后100条ADS-B数据不做任何篡改;中间100条数据,经度和纬度上加入均值为0、方差为0.1的高斯噪声。攻击者通过随机位置偏移攻击,使攻击航迹在实际航迹左右随机波动。

图 4 随机位置偏移 Fig. 4 Random position offset

高度偏差   如图 5所示,前100条、后100条航迹不做任何篡改;中间100条航迹数据,以50 m为倍数,逐渐改变ADS-B数据中包含的高度信息。具体来说,第101条航迹的高度增加50 m,第102条航迹高度增加100 m,往后类推。

图 5 高度偏差攻击 Fig. 5 Height deviation attack

DOS攻击   如图 6所示,前100条、后100条航迹不做任何篡改;中间100条航迹,攻击者发起DOS攻击,接收端不能监视到报文信息。

图 6 DOS攻击 Fig. 6 DOS attack

重放攻击   如图 7所示,前100条、后100条航迹不做任何篡改;中间100条航迹数据,攻击者发起重发攻击,将第91~第100条ADS-B航迹数据连续发送了10次,接收端接收到的是延迟发送了10次的第91~第100条航迹。

图 7 重放攻击 Fig. 7 Replay attack

航路替换   如图 8所示,前100条、后100条航迹不做任何篡改;对于中间的100条ADS-B报文:假设攻击者掌握了飞机正处于爬升到巡航的机动状态信息,则攻击者注入另一段同样正在爬升且含有高斯白噪声的ADS-B报文。

图 8 航路替换 Fig. 8 Replacement of track

速度偏差   前100条、后100条ADS-B数据不做篡改;中间100条数据,以5 m/s为倍数,逐渐改变ADS-B数据中包含的速度信息。具体来说,第101条数据的速度增加了5 m/s,第102条数据的速度增加了10 m/s,往后类推。

3.2 滑动窗口长度

在BiGRU神经网络训练次数epochs=50、设置训练批尺度batch_size=100、Dropout比率为0.2的条件下,BiGRU神经网络的预测效果较好。为了充分利用ADS-B数据的时间相关性,需要选择一个合适长度的滑动窗口。如果滑动窗口长度太短,则BiGRU神经网络会失去大量的时间关联的有效信息,降低异常检测的检测效果。如果滑动窗口长度太长,则会导致BiGRU神经网络训练时间过长。为了获得合适的滑动窗口长度,本文比较了不同滑动窗口长度对异常检测准确率和训练时长的影响。如图 9所示可以看出,当滑动窗口长度大于8后,其准确率变化不大,保持在0.95左右;但是其训练时间仍然快速增加,因而本文选择滑动窗口长度为8,能保证ADS-B异常检测的准确率和训练时间达到相对最优。

图 9 滑动窗口长度选择 Fig. 9 Length selection of sliding window
3.3 异常检测实验结果

以BiGRU-SVDD异常检测的准确率为适应度函数,经粒子群优化算法[26]求得惩罚系数C=0.25,高斯核参数s=9。图 10~图 15为针对以上6种攻击的异常检测实验结果。其中,图 10为随机位置偏移的异常检测结果图;样本经过训练后,得到SVDD超球体半径R为0.232,R即为异常检测的阈值。第101~200个异常测试样本中,共有94个测试样本的到超球体球心的距离大于阈值R,因而随机位置偏移的检测率为94%;第1~100个和第201~300个正常测试样本中,共有195个测试样本到超球体球心的距离小于阈值R,因而随机位置偏移的召回率为97.5%;300个测试样本中共有289个样本被正确检测出了是否存在异常,因而随机位置偏移异常检测的准确率为96.33%。

图 10 随机偏移检测 Fig. 10 Detection of random offset
图 11 高度偏差检测 Fig. 11 Detection of height deviation
图 12 DOS攻击检测 Fig. 12 Detection of DOS attack
图 13 重放攻击检测 Fig. 13 Detection of replay attack
图 14 航路替换检测 Fig. 14 Detection of track replacement
图 15 速度偏差检测 Fig. 15 Detection of speed deviation

同理,如图 11~图 15所示,高度偏差的检测率为98%,召回率为96.5%,准确率为97%;DOS攻击的检测率为100%,召回率为96%,准确率为97.33%;重放攻击检测率为95%,召回率为95.5%,准确率为95.33%;航路替换的检测率为88%,召回率为97.5%,准确率为94.33%;速度偏差检测率为98%,召回率为97.5%,准确率为97.67%。

为了验证飞机处于爬升、转向、下降等机动状态下,BiGRU-SVDD模型也具有良好的异常检测性能,实验还选取了一架次含有600条ADS-B数据的示例航班,包含了飞机的爬升、转向、巡航和下降等阶段。如图 16所示,前50条和后50条ADS-B数据不做任何篡改;在中间500条数据注入随机位置偏移攻击,注入的攻击和图 4的方法保持一致:在经度和纬度上加入均值为0、方差为0.1的高斯白噪声。

图 16 随机位置偏移攻击(600条数据) Fig. 16 Random position offset (600 data)

图 17为随机位置偏移(600条数据)的攻击检测图,检测率为94.4%,召回率为95%,准确率为94.5%。600条ADS-B航迹数据包含了飞机的爬升、转向和下降等阶段,说明即使飞机处于机动状态下,BiGRU-SVDD模型异常检测的检测性能也较好。

图 17 随机位置偏移检测(600条数据) Fig. 17 Detection of random offset (600 data)

实验总计对40架次测试航班采用BiGRU-SVDD模型做了异常检测实验,取40次实验的检测率、召回率、准确率的均值作为异常检测的结果。表 2列出了BiGRU-SVDD异常检测的结果。从表 2可以看出,BiGRU-SVDD模型对航路替换的检测率为88.72%,相对较低,其他形式的攻击检测率均在93.5%以上;BiGRU-SVDD模型召回率均在95%以上,准确率均在92%以上;且BiGRU-SVDD用于DOS攻击的异常检测性能相对最优,DOS攻击检测率达到了99.08%,这是因为DOS攻击导致航迹出现了消失,客观上来说,DOS攻击也最容易被检测。高度偏差攻击的检测率为93.56%,相对较低,这是因为起始注入的高度偏差导致的高度变化还不够明显,故客观上起始注入的一小段高度偏差攻击确实难以检测。通过计算得到,针对6种形式的攻击,BiGRU-SVDD模型的平均检测率为95.26%,平均召回率为96.22%,平均准确率为95.57%。

表 2 BiGRU-SVDD异常检测 Table 2 Anomaly detection of BiGRU-SVDD
评价指标 随机位置偏移 高度偏差 DOS攻击 重放攻击 航路替换 速度偏差
检测率/% 94.59 93.56 99.08 97.75 88.72 97.91
召回率/% 96.47 95.74 96.57 95.02 96.54 97.02
准确率/% 95.85 95.02 97.70 95.90 92.26 97.43
3.4 对比实验和分析

另外,本文选取了其他机器学习和深度学习的方法,同样用于检测以上6种类型的ADS-B数据攻击(攻击数据的构造方法和3.1节保持一致)。这些方法包括一类支持向量机(OCSVM)、孤立森林(IForest)、长短期记忆神经网络(LSTM)、门控循环单元神经网络(GRU)、双向门控循环单元神经网络(BiGRU)和seq2seq模型[16]。其中,OCSVM采用的核函数为径向基核函数,核参数Gamma取值为0.2。IForest中,树的棵数取值为默认的100,每棵树的采样大小取值为256。LSTM、GRU和BiGRU都采用和图 3相似的网络结构,用余弦相似度衡量预测值和实际值的误差大小(阈值的确定方法为:将余弦相似度按照从小到大排序,将第3%小的余弦相似度选取为阈值)。seq2seq模型采用的网络结构和文献[16]保持一致,即编码器和解码器的隐藏层都采用LSTM神经网络,LSTM的单元数为128。表 3给出了6种形式攻击下,各种异常检测方法的检测率、召回率和准确率的均值实验结果。可以看出:

表 3 异常检测均值 Table 3 Mean value of anomaly detection
评价指标 OCSVM IForest LSTM GRU BiGRU seq2seq BiGRU-SVDD
检测率/% 59.08 54.68 90.81 90.55 91.80 93.81 95.26
召回率/% 69.65 65.80 92.41 92.19 93.08 93.91 96.22
准确率/% 62.60 58.38 91.33 91.09 92.22 93.84 95.57

1) OCSVM和IForest的检测率、召回率、准确率性能都较差。这是因为ADS-B数据中的纬度、经度、高度、速度和航向等信息的数值大小是随时间的变化而变化的,然而OCSVM和IForest仅考虑了当前时刻ADS-B数据的特征信息,没有考虑到ADS-B数据的时间相关性,因而这两种方法的异常检测性能较差。

2) 考虑到ADS-B数据的前后时间相关性,将单向GRU和BiGRU的检测性能作比较。实验结果表明,相比于单向GRU,BiGRU的检测率、召回率和准确率均更高,说明BiGRU的预测效果更好,异常检测性能更佳。

3) 为了解决ADS-B数据攻击检测阈值自适应问题,本文在BiGRU预测结果后加入SVDD进行二次训练。结果表明,相较于BiGRU,BiGRU-SVDD的检测率、召回率和准确率均要更高,达到95%以上。说明BiGRU-SVDD能解决ADS-B数据攻击检测阈值的自适应问题,异常检测适应性更好,效果更优。

4) 相较于seq2seq模型,本文的BiGRU-SVDD模型异常检测性能更好。这是因为,BiGRU-SVDD考虑了飞机的机动状态,seq2seq模型没有考虑飞机的机动状态;并且BiGRU-SVDD利用SVDD对样本进行了二次训练,解决了ADS-B数据攻击检测阈值的自适应问题。因而,相比于seq2seq模型,本文的BiGRU-SVDD模型异常检测性能更优。

由于BiGRU-SVDD模型在使用BiGRU对ADS-B数据进行预测的基础上,又使用了SVDD对差值样本进行了二次训练,因而需要比较BiGRU-SVDD模型和其他检测方法的复杂性。本文记录了各种异常检测方法的训练时长和检测时长。表 4给出了训练一架次ADS-B航班数据的平均时长,以及检测一架次ADS-B航班数据的平均时长(平均每架次航班包含的ADS-B数据约500条)。可以看出:

表 4 训练与检测时长对比 Table 4 Comparison of training time and testing time
评价指标 OCSVM IForset LSTM GRU BiGRU seq2seq BiGRU-SVDD
平均训练时长/s 0.62 0.24 8.64 8.62 14.13 23.62 14.80
平均检测时长/s 0.06 0.06 0.07 0.07 0.08 0.21 0.085

1) OCSVM和IForest作为传统的机器学习方法,训练时长较短。但是结合表 3可知,OCSVM和IForest的检测率、召回率、准确率性能较差。

2) BiGRU比单向GRU的训练时长多了5.51 s,BiGRU-SVDD比BiGRU的训练时长仅仅多了0.67 s,这说明BiGRU-SVDD的复杂性主要来自双向机制。

3) BiGRU-SVDD模型检测一架次ADS-B航班数据(约500条)共用了0.085 s,仅比BiGRU多了0.005 s, 比LSTM和GRU多了0.015 s。

4) BiGRU-SVDD模型比seq2seq的训练时长和检测时长都要短。这主要是因为文献[16]ses2seq模型的编码器和解码器的LSTM单元数为128,本文的BiGRU-SVDD模型的2层BiGRU的单元数分别是60和40。

4 结论

1) 本文考虑了ADS-B数据的时间相关性,利用BiGRU神经网络对ADS-B数据进行预测,得到了ADS-B预测数据;再将预测值和实际值作差,将差值放入支持向量数据描述(SVDD)训练,可以得到能检测ADS-B异常数据的超球体分类器。并且,选择了合适的滑动窗口,在保证异常检测准确率的同时,缩短了BiGRU神经网络的训练时长。实验结果表明,BiGUR-SVDD模型可用于ADS-B异常数据的检测。

2) 在OCSVM、IForest、LSTM、GRU、BiGRU、seq2seq和BiGRU-SVDD中,本文BiGRU-SVDD模型异常检测性能均更具优势。

参考文献
[1] 万健, 李楠, 李琦. 空中交通管理系统安全评价研究[J]. 北京航空航天大学学报, 2009, 24(1): 89-92.
WAN J, LI N, LI Q. Research on safety evaluation of ATM system[J]. Journal of Beijing University of Aeronautics and Astronautics, 2009, 24(1): 89-92. (in Chinese)
Cited By in Cnki (24) | Click to display the text
[2] MCCALLIE D, BUTTS J, MILLS R. Security analysis of the ADS-B implementation in the next generation air transportation system[J]. International Journal of Critical Infrastructure Protection, 2011, 4(2): 78-87.
Click to display the text
[3] ZHANG J, LIU W, ZHU Y B. Study of ADS-B data evaluation[J]. Chinese Journal of Aeronautics, 2011, 24(4): 461-466.
Click to display the text
[4] STROHMEIER M. Large-scale analysis of aircraft transponder data[J]. IEEE Aerospace & Electronic Systems Magazine, 2017, 32(1): 42-44.
Click to display the text
[5] STROHMEIER M, LENDERS V, MARTINOVIC I. On the security of the automatic dependent surveillance-broadcast protocol[J]. IEEE Communications Surveys & Tutorials, 2015, 17(2): 1066-1087.
Click to display the text
[6] MATTHIAS S, LENDERS V, MARTINOVIC I. Experimental analysis of attacks on next generation air traffic communication[C]//International Conference on Applied Cryptography and Network Security, 2013: 253-271.
[7] STROHMEIER M, SCHAFER M, LENDERS V, et al. Realities and challenges of nextgen air traffic management:The case of ADS-B[J]. IEEE Communications Magazine, 2014, 52(5): 111-118.
Click to display the text
[8] PINKE C, BUTTS J, MILIS R, et al. Enhancing the security of aircraft surveillance in the next generation air traffic control system[J]. International Journal of Critical Infrastructure Protection, 2013, 6(1): 3-11.
Click to display the text
[9] BAKE J, BYON J, HABLEELE E, et al. Making air traffic surveillance more reliable:A new authentification framework for automatic dependent surveillance-broadcast (ADS-B) based on online/offline identity-based signature[J]. Security and Communication Networks, 2015, 8(5): 740-750.
Click to display the text
[10] PAN W J, FENG Z L, WANG Y. ADS-B data authentication based on ECC, and X.509 certificate[J]. Journal of Electronic Science and Technology, 2012, 10(1): 51-55.
Click to display the text
[11] MÁRCIO M. Detecting malicious ADS-B broadcasts using wide area multilateration[C]//The IEEE/AIAA 34th Digital Avionics Systems Conference. Piscataway: IEEE Press, 2015.
[12] KOVELL B, MELLISH B, NEWMAN T, et al. Comparative analysis of ADS-B verfication techniques[D].Boulder: The University of Colorado, 2012.
[13] NIJSURE Y, KADDOUM G, GAGNON G, et al. Adaptive air-to-ground secure communication system based on ADS-B and wide-area multilateration[J]. IEEE Transactions on Vehicular Technology, 2016, 65(5): 3150-3165.
Click to display the text
[14] 颜可壹, 吕泽均, 时宏伟, 等. 基于TDOA/TSOA的ADS-B系统防欺骗技术[J]. 计算机应用研究, 2015, 32(8): 2272-2275.
YAN K Y, LV Z J, SHI H W, et al. ADS-B system anti cheat technology based on TDOA/TSOA[J]. Application Research of Computers, 2015, 32(8): 2272-2275. (in Chinese)
Cited By in Cnki (4) | Click to display the text
[15] HABLER E, SHABTAI A. Using LSTM encoder-decoder algorithm for detecting anomalous ADS-B Messages[J]. Computers & Security, 2018, 78: 155-173.
Click to display the text
[16] 丁建立, 邹云开, 王静, 等. 基于深度学习的ADS-B异常数据检测模型[J]. 航空学报, 2019, 40(11): 323220.
DING J L, ZOU Y K, WANG J, et al. ADS-B anomaly data detection model based on deep learning[J]. Acta Aeronautica et Astronautica Sinica, 2019, 40(11): 323220. (in Chinese)
Cited By in Cnki (5) | Click to display the text
[17] 王振昊, 王布宏. 基于SVDD的ADS-B异常数据检测[J]. 河北大学学报, 2019, 39(3): 323-329.
WANG Z H, WANG B H. ADS-B abnormal data detection based on SVDD[J]. Journal of HeBei University, 2019, 39(3): 323-329. (in Chinese)
Cited By in Cnki (2) | Click to display the text
[18] HORI T, CHEN Z, ERDGAN, et al. Multi-microphone speech recognition integrating beamforming, robust feature extraction, and advanced DNN/RNN backend[J]. Computer Speech & Language, 2017, 46: 401-418.
Click to display the text
[19] MANSOUR S, ZAHRA J, ALI F. Intrusion detection using reduced-size RNN based on feature grouping[J]. Neural Computing & Applications, 2012, 21(6): 1185-1190.
Click to display the text
[20] 桑海峰, 陈紫珍. 基于双向门控循环单元的3D人体运动预测[J]. 电子与信息学报, 2019, 41(9): 2256-2263.
SANG H F, CHEN Z Z. 3D human motion prediction based on two-way gated circulation unit[J]. Journal of Electronics and Information Technology, 2019, 41(9): 2256-2263. (in Chinese)
Cited By in Cnki (2) | Click to display the text
[21] 王伟, 孙玉霞, 齐庆杰, 等. 基于BiGRU-Attention神经网络的文本情感分类模型[J]. 计算机应用研究, 2019, 36(12): 3558-3564.
WAND W, SUN Y X, QI Q J, et al. A text emotion classification model based on BiGRU-Attention neural network[J]. Application Research of Computers, 2019, 36(12): 3558-3564. (in Chinese)
Cited By in Cnki (20) | Click to display the text
[22] TAX D M J, DUIN R P W. Support vector data description[J]. Kluwer Academic Publishers, 2004, 54(1): 45-66.
Click to display the text
[23] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016: 121-123.
ZHOU Z H. Machine learning[M]. Beijing: Tsinghua University Press, 2016: 121-123. (in Chinese)
[24] FUREY T S, CRISTIANINI N, DUFFY N, et al. Support vector machine classification and validation of cancer tissue samples using microarray expression data[J]. Bioinformatics, 2000, 16(10): 906-914.
Click to display the text
[25] OpenSky. The OpenSky network[DB/OL].(2020-07-13)[2020-02-17].https//opensky-network.org
[26] ROBINSON J, RAHMAT Y. Particle swarm optimization in electromagnetics[J]. IEEE Transactions on Antennas Propagation, 2004, 52(2): 397-407.
Click to display the text
http://dx.doi.org/10.7527/S1000-6893.2020.23878
中国航空学会和北京航空航天大学主办。
0

文章信息

罗鹏, 王布宏, 李腾耀
LUO Peng, WANG Buhong, LI Tengyao
基于BiGRU-SVDD的ADS-B异常数据检测模型
ADS-B anomaly data detection model based on BiGRU-SVDD
航空学报, 2020, 41(10): 323878.
Acta Aeronautica et Astronautica Sinica, 2020, 41(10): 323878.
http://dx.doi.org/10.7527/S1000-6893.2020.23878

文章历史

收稿日期: 2020-02-17
退修日期: 2020-03-18
录用日期: 2020-07-02
网络出版时间: 2020-07-07 10:18

相关文章

工作空间