当前位置:首页 > 技术与方案 > 监控安防相关

高速公路事件自动检测算法研究(中)

(2012-09-01 16:28:09)

三、 AID算法分类
目前存在的AID算法可分为以下几类:模式识别、统计、突变理论以及高级事件检测技术。下面我们将对各种算法的基本原理进行讨论,并进行性能分析。
3.1 模式识别法
常见的模式识别算法包括加州算法、多目标事件检测算法(APID)、模式识别算法(PATREG)等,以下分别做一简单介绍。
加利福尼亚算法:加州算法开发于1965-1970年之间[7],该算法比较相邻检测站之间的交通流的相关参数,主要是比较环型线圈检测器获得的占有率数据。随后加州算法被改进并且扩展为相应的各种交通参数,并且提高区分事件和非事件状况的能力(Payne et al., 1976)。步骤如下:1计算上下游检测器之间占有率的绝对差,和阈值T1比较,如果超过T1继续第二步。2计算上下游之间占有率量测之差与上游占有率之比,和阈值T2比较,如果超过T2继续第三步。3计算上下游之间占有率量测之差与下游占有率之比,和阈值T3进行比较,如果超过T3就预示着可能有事件发生,并重复第二步。如果再一次超过阈值,就表明有事件发生。
加州#7:经过深入的研究,Payne and Tignor (1978)公布了10种基于最初的加州算法的改进新方法,其中性能最好的是加州#7和加州#8。在加州#7中第三个参数(见上)被当前的下游占有率测量所取代,因此在大交通量中很常见的压缩波,不会发生误报警。并且发现当下游占有率的数据低于某个阈值,通常是20%,就预示着很可能有事件发生。
加州#8:这是改进的加州算法中最复杂的一个,同时也是性能最好的一个(Cohen and Ketselidou 1993)。这种算法提供了一个对压缩波反复的检测。这些波导致了上游交通移动的减速,并且可能在大交通量下产生交通瞬间的中断。通过分析数据,压缩波可以被检测到并且在上游推迟5分钟报警。这种算法把交通数据分成9种不同的状态,并且需要五种不同的阈值来进行校准[3]。
California算法系统中的3个主要缺陷是:①对于每个地点的阈值标定很困难。特别在大的网络中,每个独立的阈值必须根据道路几何条件(如匝道、交织区、山地等)的不同而分别标定。②3个预定的事件判断步骤(见上)确实不能有效地捕捉到所有可能的交通模式。③3个步骤需要标定的阈值T1、T2、T3尤其依赖于地点及历史数据的质量,在入口匝道、交织段及上坡等路段算法无法表征其特定的交通模式,导致误警率上升,而在各地点取常数同样也增大了误警率[8]。
多目标事件检测算法(APID):多目标事件检测算法(APID)是由Philip H. Masters开发用来在多伦多ATMS中使用的COMPASS软件的一部分(Chang and Lin 1993)。APID算法是各种加州算法的一个组合,并且有压缩波检验程序和持续检验程序。与加州算法不同,它使用平滑的占有率作为检测变量来减少误警率。该算法在大交通量条件下性能优越,但是在小交通量条件下性能较差(Masters, Lam, and Wong 1991)。文献[3]通过对算法的离线评估显示,在86%的事件检测率下,平均检测时间为2.55分钟,误警率为0.05%,该算法表现出了良好的性能。但有些人认为APID算法尽管避免了California算法中某些理论上的不足,但它对各种交通条件的反应过于敏感[8]。
模式识别算法(PATREG):该方法由交通道路研究实验室(TRRL)在1979年开发,模式识别算法(PATREG)被设计用来和高占有率(HIOCC)算法(Collins, Hopkins, and Martin 1979)联合检测事件。该算法通过跟踪和量测相邻检测器之间的特殊模式交通的旅行时间来估计车辆速度,并和预设阈值比较,当低于阈值时,触发事件报警系统。旅行时间由综合的相关技术决定,使上游与下游的交通流相协调。该算法在稍低于中等交通量(1500vph)时性能最好。这是因为在大交通量时,交通状况变得不稳定。算法要求检测器之间的距离最小为1/3英里。但这种算法现在已经不是很常用,并且自从20世纪80年代以来没有新的突破[3]。
PATREG算法引入速度模式判断事故是否发生,因而该算法在理论上有缺陷。另外,用速度作为事故检测变量可能会在入口匝道和交织段之间的交通流相互干扰严重的区域产生高的误警率。
3.2 统计算法
是运用统计技术和线圈数据来检测交通事件的一类算法,统计算法基本上不考虑依靠什么理论,而仅仅采用某种方法进行模式或异常数据的识别。
标准差(SND)算法:由德克萨斯州交通协会(TTI)早在1970-1975年期间开发的,用于休斯顿海湾公路(I-45) (Dudek, Messer, and Nuckles 1974)的交通监视和控制中心。Dudek等人认为在对交通事件进行检测时,不论交通参数是否超过指定的阈值,只要考察交通参数的变化率就会取得更好的效果。因此,与其确定交通参数(如占有率)本身的阈值,不如判断交通参数的变化率是否大于指定的阈值。标准偏差值SND是通过一个简单的统计分析得到的,即用当前交通参数值减去平均值,然后除以标准偏差得到的。SND的值反映了当前交通流状态相对于前几个周期检测到的平均趋势的改变程度,较大的SND值反映了交通流的改变较大,通常连续两个检测周期的SND值大于阈值,则认为发生交通事件[9]。
对其进行的一个离线性能评估表明:这种算法在92%的事件检测率下有1.1分钟的平均检测时间和1.3%的误警率。但是这种算法的阈值是很难判定的,具体的判定方法还没有很好的定义。由于算法依赖于经过检测器的冲击波,所以检测器的空间布置距离也是个问题[3]。
指数平滑算法:是指通过对交通参数进行指数平滑来检测交通事件的算法,对交通参数进行预测并与实际值进行比较,观察二者的差异。一般采用双指数平滑的方法对交通参数进行预测,以减小随机干扰的影响。双指数平滑(DES)算法在1974年由Cook(1974)开发,统计方法和标准差算法类似,但是预测方法更为复杂。用这种方法,天气和流量的变化不会产生很大的误警率。平滑出的数据用来构造跟踪信号,可以通过跟踪信号,即所有以前预测值和观测值之差的总和来识别事件发生。在无事件发生条件下,跟踪信号值稳定在0附近;在事件发生时,预测参数值和实际参数值显著不同,跟踪信号显著的偏离零值。
Cook在1974年使用13种不同的变量对这个算法进行了测试,流量和占有率变量都产生了比较好的结果。Busch和Fellendorf(1990)发现速度的不连续指数也可以产生一个很好的结果。这种方法的优点是比较简单并且不需要校准,而且有比较好的性能。缺点是检测时间太长,且仅在交通流较平滑时表现尚佳,在事故或交通流变化起伏很大时,需选择合理的数据采集周期及评价标准才能保证系统的性能稳定[3]。
贝叶斯(Bayesian)算法: 该算法与加州算法相似,也使用两个检测器之间占有率的差值,但是不同之处在于它是计算由事件或常发性拥挤引起的相对占有率之差的条件概率(Levin and Krause 1979)。完成该算法需要三个历史数据库,即事件发生条件下的流量和占有率,无事件发生条件下的流量、占有率及发生事件的类型、位置和影响。分析所有的历史数据,然后建立判定所给的占有率差值是事件还是非事件的统计范围。此算法检测发生事件的概率阈值,当超过这个阈值时,触发报警。离线结果表明,该算法对于检测率和误警率检测效果较好,但是平均检测时间太长。从J.
F.Kennedy Expressway的离线报告中表明,检测率为100%,误警率为0,但平均检测时间为4 分钟[3]。
Levin 和Krause(1978,1979a,1979b)评价了贝叶斯算法,认为贝叶斯判别原则对于阈值的标定是非常重要的。但是困难的是它需要建立给定交通流参数值的情况下,交通流处于异常状态和正常状态的条件概率的数学描述。这在实际应用中往往难以达到,所以需要探索新的方法[9]。
时间序列ARIMA算法:Ahmed和Cook运用Box-Jenkins时间序列分析技术中的自回归移动平均方法ARIMA(auto regressive integrated moving average)开发了一种交通事件检测算法,以单个检测器提供的占有率为输入参数,建立了一个三阶的ARIMA(0,1,3)模型对占有率及其置信水平进行短期预测。该模型能够通过平均前三个时间段的观测值和预测值之间的误差,来预测当前时间段(t)和前一时间段(t-1)交通变量的差值。该模型通常用作短期交通预测和置信区间预测,预测数据与观测数据存在大的偏差时,启动事件报警系统。这种算法的本质也与前述的指数平滑算法相似。
在一个离线的试验中,该算法的性能如下(JHK and Associates 1993):DR为100%,FAR为2.6%,MTTD为0.58分钟。在另一个试验中,该算法与DES和加州算法进行了比较(JHK and Associates 1993)。当误警率都降到1%时,ARIMA算法的检测率和检测时间都超过它们。这个算法在大交通量和中等交通量时性能较好,在小交通量下的性能不是很好。它的模型也很简单,所以不需要很多复杂的交通行为。
但文献[8]认为时间序列法存在以下缺陷:①该方法假定交通模式服从历史的趋势,因而除非日复一日的交通状态很稳定,否则就不能有效地捕捉到交通的动力学的演化过程;②利用现有的控制标准的选择是统计假设检验中Ⅰ类和Ⅱ类误差之间取舍的典型例子,恰当控制阈值的选择不仅影响算法的性能,而且还影响检测时间。
低通滤波算法(LPF):LPF产生平滑的移动平均值,去除噪声和高频数据成份,允许低频数据通过。LPF算法处理邻近检测器的占有率时使用了两个平均值:第一是三分钟移动平均值(或者中值),用来详细区分瓶颈拥堵和事件发生;第二是在第一个三分钟前的相邻占有率差的五分钟平均值(或者中值),直接比较连续时间段的占有率差值可以区别常发性拥堵和交通事件[2]。
国内学者张云伟、刘跃明(1998)[10]也提出了交通事件检测的一种滤波算法,利用维纳(Wiener)数字滤波原理,在此基础上判断是否拥挤,以及是否属于事件所引起的拥挤。
3.3 突变理论算法
McMaster算法:加拿大McMaster大学的研究人员根据突变理论,即“函数中的一个变量产生非连续特性而其他变量只显示连续性变化”(Thom,1975),开发了McMaster算法。这种算法建立在这样的前提下,即当交通从拥挤状态向非拥挤状态变化时,流量和占有率变化平稳,而速度表现为突然的变化。使用从拥挤向非拥挤状态变化的流量-占有率关系的历史资料,开发一个流量-占有率模板,该模板在坐标轴上由四个区域组成,每个区域代表一个特别的交通状态。该算法的原理是在模板和观测数据之间作两次比较检查,第一次比较确定检测器附近是否拥挤,如果拥挤,通过检查下游检测器的交通状态确定拥挤的来源[2]。
与加州#8算法相比,McMaster算法有很多明显的优点:在这个算法中,下游检测器的故障不会影响事件检测,这与加州#8算法不同;在验证可能的事件时,它使用流量作为输入,而加州#8使用占有率作为输入;平均检测时间为30s,比加州#8要快;由于McMaster算法在验证事件时,考虑了偶发性拥挤,所以可以降低误警率[11]。
McMaster算法主要的缺点是:该算法在定义阻塞与非阻塞边界时考虑了交通流及道路几何线形的变化,因而该算法需要对不同的地点和不同的数据集重新定义。这导致其可移植性较差,而且该算法预定的阻塞与非阻塞边界不能在实时运行过程中随时间变化[12]。
3.4 高级事件检测技术
神经网络算法:是用来模拟人脑的思维过程,进行并行处理获得最终结果。一个神经元网络由许多简单的并行连接的处理单元(PE)构成。单个PE可以接受来自许多其它PE输出的有相关连接决定权值的输入,并快速把处理结果输出给其它PE。人工神经网络(ANN)在高速公路事件检测中的应用首先在(Cheu et al., 1991)中发现。在已经测试的ANN中,多层前馈网络(MLF)由于较高的DR和较低的FAR而表现出良好的性能(Chew and Ritchie, 1995)。该神经网络由输入层、中间层和输出层三层组成,输入层由上游检测站5个连续时间间隔内的30s占有率和流量组成,以及下游3个连续时间间隔的数据,中间层处理数据,输出层产生事件和非事件信号。首先要对网络进行训练,通过反复试验,网络学习应用于输入层和输出层的适当的权值。
Abdulhai(1996)用概率神经元网络(PNN)来进行事件检测,该神经网络开发用来检测模拟数据和实际数据。结果表明PNN比在(Cheu, 1994)使用的算法有较高的DR和FAR,并且有相对较高的可移植性。PNN最大的局限性是由于大规模的模式层,需要大量的记忆和计算时间[11]。
国内学者姜紫峰、刘小坤(2000)[13]采用了一个4层的BP 神经网络(Back Propagation NN)算法对实测数据进行了检测,结果表明,该算法DR可以达到91%,FAR为5.41%,MTTD为0.84分钟,相比之下优于其他算法。
神经网络算法有如下缺陷:①训练数据对真实的历史数据依赖性强,如果训练数据覆盖了所有的事件及非事件交通状态,则算法的有效性将会很高;②算法的可移植性较差。当新地点的数据与训练数据存在较大的差异及离线标定网络所用的历史数据不足时,其移植性将会受到限制;③神经网络模型的推广有限。即已训练好的神经网络的结构对不同的地点可能不实用。但是,根据RL Chen等人(1993)使用从微观仿真程序(IN IRS)产生的数据进行仿真验证表明:该算法其检测率,误警率及平均检测时间均优于California算法9。如果能解决上述3个缺陷,我们相信,神经网络法的潜力将很大[8]。
此外,此类算法中还有模糊集合算法、基于logit的算法以及图象处理法等,在此不再详细叙述。
更多
关闭窗口 打印 
网站首页    -    联系我们    -   收藏本站    -    网站地图                                                               客户服务热线:0571-85023000
本网站所有网页信息已申请知识产权和著作权保护,版权归四海光纤公司所有,未经授权禁止任何人复制或镜像,违者必究。
公司主营:杭州光纤光缆视频会议系统,是专业的通信网络工程、视频会议系统建设专家

中华人民共和国备案号:浙ICP备10018243号