基于累积和控制图的分布式传感网络故障诊断

龙源期刊网 http://www.qikan.com.cn

基于累积和控制图的分布式传感网络故障诊断

作者:刘秋玥 程勇 王军 钟水明 徐利亚 来源:《计算机应用》2016年第11期

摘 要:由于无线气象传感网具有资源受限及分布式等特点,传感器节点的故障诊断面临着很大挑战。针对现有诊断方法误报率高、计算冗余量大的问题,提出了一种基于累积和控制图(CUSUM)与邻居协作融合的故障诊断方法。首先,通过累积和控制图分析传感器节点上的历史数据,提高对节点故障判断的灵敏度并且定位出异常时间点;然后,结合网络内邻居节点间的数据交换,通过判断节点的状态诊断出故障节点。实验结果表明,即使在整个网络中在节点故障率高达35%时,算法检测精度仍然高于97.7%,而误报率不超过2%。由此可见,在节点故障概率很高的情况下,此所提法也能得到很高的检测精度和较低的误报率,受节点故障率的影响明显减小。

关键词:无线传感器网络;故障诊断;分布式;累积和控制图;中值绝对偏差 中图分类号:TP393 文献标志码:A

文章编号:1001-9081(2016)11-3016-05 0 引言

无线传感网络(Wireless Sensor Network,WSN)是由无数成本低廉、体积微小的传感器节点组成,通常被随机放置在监测区域中,节点之间以多跳的形式对采集数据进行传输,最后将这些数据以无线通信的方式传送给观测者[1]。如今,无线传感器网络已经广泛应用于许多领域,如交通监控、工业控制、气象观测[2-4]。由于无线气象传感网的节点计算能力和能量有限,气象信息具有复杂性、数据突发性等特点,自节点部署开始,经过较长时间运行后可能会发生故障,但是由于气象传感网处在无人监控和检查的位置,节点本身运行的状态无从得知,为了更好地了解节点状态,就需要对节点进行故障检测。

现阶段,无线传感器网络的故障检测根据任务执行主体可分为集中式检测和分布式检测[5]。集中式检测算法中,文献[6]首先将感知数据变换为故障特征空间中的向量,然后依据已知故障数据库向用户指示需要采取的相关措施(如校准、验证读数等),最后用户根据传感器的实际情况对故障数据库进行更新,从而改进与优化故障检测系统。对于大规模无线传感网络来说,目前基于汇聚节点的诊断方法存在许多缺点。首先,主动信息收集会导致通信方面的巨大开销,大幅缩短了网络系统的寿命;其次,由于网络规模不断扩大和不可靠的无线通信,后

龙源期刊网 http://www.qikan.com.cn

端上的故障推理机常常获得不完整和不确定的信息,明显降低了检测精度; 最后,在汇聚节点上故障诊断方法的诊断延迟非常高[7]。

文献[8]提出了一种分布式无线传感器网络节点故障诊断(Distributed Fault Detection,DFD)算法,事先设定固定阈值,将节点自身的传感器测量值与邻居节点相比较来判断节点自身是否发生故障。但是该算法在节点的邻居数较少或者整个网络中节点发生故障概率较大时,故障诊断精度会大幅下降。文献[9]通过融合邻居节点的测量数据并对邻居节点测量数据进行加权,衡量测量节点与节点的数据之间差异的方法最终判断节点故障状态。针对WSN中节点故障原因复杂,文献[10]提出了一个WSN节点故障诊断方法,可以实现对具体故障进行诊断和判定,但是算法复杂性比较大,不适合节点数量较大的网络。文献[11]提出一种通过观察节点采样值数据变化率与时间特性相似度,判断是事件发生还是节点故障的事件检测方法。由于引入了节点可信度自适应调整机制,通过不断排除故障节点,该方法能够获得较高的故障识别率。

现有的分布式故障诊断算法没有充分利用传感器节点采集数据的特点,使得算法的复杂度较高;仅仅利用传感器网络具有空间相关性的特点来实现故障检测,消耗大量的能量,尤其是对于大规模无线传感网络而言。基于上述分析,本文采用分布式节点故障诊断算法,通过无线气象传感网内节点上搭载的气象传感器,对气象要素进行采集,利用节点之间的气象要素值存在时空相关性的特点,改进分布式节点故障诊断方法。通过节点自身历史数据和邻居协作方法融合进而提高无线气象传感器网络的故障诊断精度,同时降低故障诊断的误报率,节省节点间频繁交互产生的开销,使算法更加适用于节点资源有限的大规模无线气象传感网络。 为了检测错误的测量值,每个节点发生故障的概率相互独立。无线传感器网络的节点故障分为两类:硬故障和软故障。当传感器节点的某一模块发生损坏而造成无法通信,称之为硬故障;当传感器节点虽然发生故障,但是仍然具有接收、发送、采集及处理数据的能力,只是节点采集的数据是错误的,称之为软故障。图1中为节点s6发生软故障的节点。在分布式传感器网络故障诊断算法里,针对的主要是节点软故障的检测;若周围的邻居节点都检测不到某个节点,则可以判定该节点发生硬故障。 2 故障诊断算法 2.1 符号说明

相关符号说明如表1所示。 2.2 异常时间点的定位

由于传感器节点有限的计算和存储资源,使用一个轻量级的方法,将累积和控制图和引导相结合来检测观测节点在滑动窗口下历史数据的变化。本文采用累积和控制图(Cumulative Sum Control Chart, CUSUM)结合引导方案来确定参数值是否发生了显著变化[12]。

龙源期刊网 http://www.qikan.com.cn

2.2.1 累积和控制图的计算

累积和控制图(CUSUM)主要依据序贯分析原理,对历史采样数据的偏差进行持续累积,更加灵敏地判断出节点的失控或者受控状态,有效地提高了发现节点异常的灵敏度。CUSUM是基于原始的时间序列构成。本文使用基于滑动窗口的策略来缓存最新的参数测量值。如图2(a)所示,假设时间窗口的大小w为30,某个传感器节点储存最新的30个感知数据。

首先计算这组数据序列的累积和控制图。设节点采样时间间隔为T,T的选择和系统响应时间相关,T应足够大,以保证节点可以在采样间隔时间内完成数据处理和发送[13]。设在t时刻节点si采集的数据Xti。对于数据{Xj*Ti}(1≤j≤w)表示为该数据序列上的数据点集合。累积和用{Cj}表示。这里定义C0=0,其他的累积和通过当前测量值与所有累积和的均值加上前一个累积和得出。具体计算公式如下:

累积和控制图如图2(b)所示。在累积和控制图里,直线表明原始的值是相对稳定,波动的线是由原始测量值的变化量引起。累积和趋势在图中向上倾斜表明,这一时期的值高于总体的平均值;反之则低于总体的平均值。并且测定结果和预期值之间的差异愈大,累积和图的倾斜愈陡。CUSUM算法优势在于将整个过程小偏移累加起来,起到放大作用,提高小偏移的灵敏度。并且,通过观察倾斜程度的变化,可找到过程出现变化的点。在每个时间窗口结束时,算法计算数据是否有任何突变:如果有,作为一个传感器的异常时间点被标记。 图2(b)中CUSUM曲线在C13变化,可以推断这里是一个突变。由于无线气象传感网络是一个以数据为中心的网络,气息要素具有实时更新和数据量大等特点,这里我们使用引导分析方案来对决策设置一个置信度来进一步提高检测的精度和效率。如果没有异常时间点,那么随机重新排序的数据序列会模仿原始的累积和控制图。 3 实验与分析

本文使用Matlab软件进行了一些实验来评估所提算法的性能。所模拟的WSN监测区域为一个32×32单元的区域。假定1024个节点随机部署且不可移动,不失一般性,我们假设每个节点的位置可以通过GPS或者其他定位技术得到,并且具有相同的通信半径。实验中节点上的感知数据服从正态分布,并且设θ1=90%,θ2=3。实验分别从故障检测精度和误报率两个方面对分布式故障检测(Distributed Fault Detection,DFD)[8]与本文算法(Self-Distributed Fault Detection,SDFD)方法进行仿真与比较。为了使实验结果更为客观并消除随机性因素,本文将每项实验进行100次后计算平均值从而得出最终的实验结果。 3.1 检测精度

所谓检测精度(Detection Accuracy,DA)指检测出的故障数与所有故障数量的比值即: DA=(|F∩Q|)/|Q|(15)

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4