摘要: 无线监控网络是一种WSN,其中所有网络节点定期生成数据,并通过在称为管理器的单个节点上的多跳传输收集数据。
高端到端可靠性是具有关键监控和驱动要求的质量要求。迄今为止,无线传感器网络(WSN)用户通常认为次优可靠性是无线技术固有的。我们描述了一个集中监控TDMA网络,其选择的策略是在保持低功耗特性的同时最大化接收数据包的数量。提出了检测和诊断丢包的方法,并给出了丢包相对影响的期望值。这种诊断允许对所有已知的损失机制进行分类,并对以99.99%的稳态端到端可靠性运行的50个节点网络中的损失进行分析。
C.3 [特殊用途和基于应用程序的系统实时和嵌入式系统,微处理器/微型计算机应用,信号处理系统。
算法,性能,设计,可靠性。
无线网状网络,性能分析,实验评估,案例研究。
无线监控网络是一种WSN,其中所有网络节点定期生成数据,并通过在称为管理器的单个节点上的多跳传输收集数据。知道了节点的数量和生成速率,就可以计算出期望的数据包数量:让可靠性为描述在管理器处接收到的唯一数据包的数量除以应该接收到的唯一数据包的数量的无单位数量。无线传感器网络的学术研究旨在提供最佳解决方案:最低的能源成本,最低的延迟,或最高的带宽。虽然这些元素对工业和商业WSN用户很重要,但他们主要关心的问题通常是网络中生成的数据包应该在集中的数据存储库中可靠地接收,并可用于分析。网络上的实际压力通常不是那么高:例如,一个50个节点的网络,每个节点每分钟生成10字节的数据有效负载,收发器的速度为76.8 kbps。该网络使用的原始可用带宽不到管理器可用带宽的0.1%。许多研究人员回避研究这些琐碎的需求并不奇怪。然而,即使在大量配置的场景中,也很难满足严格的可靠性要求。提出的时间同步协议提供了一个高可靠性的无线网络解决方案,还实现了低功耗路由和高可用带宽。激励目标不一定是获得完美的可靠性,而是要了解每个丢失包的原因,并能够绑定每种丢失机制。
在传统的有线领域安装WSN(5),低可靠性是采用该技术的主要风险之一。可靠性度量在处理WSN部署的系统论文中经常被讨论,但很少成为主要焦点。exscale(2)等项目正在不断扩展WSN大小和整体性能的极限。这项特别的工作引用了86%的端到端可靠性,并暗示缺乏关于故障和可变性的公开数据,这些数据困扰着可靠的运行。另一个自称“工业传感器网络”的项目(7)评论了可靠性的重要性,但指出实验中的大多数节点报告了80%以上的数据,这表明总体可靠性远未达到100%的范围。很明显,这些作者认识到可靠性在商业应用中的重要性,但同样清楚的是,单个数据包的丢失并不是最重要的问题。(3)中的一个揭示性的图显示了节点数/生命周期空间中发布的网络的跨度,但没有直接评论这些网络的可靠性。到目前为止,网络在给定的时间范围内保持运行就足够了,而不是网络必须能够在这段时间内可靠地传输数据包。(4)中的工作试图使用网络来检测“罕见的、随机的和短暂的事件”,其含义是网络必须准备好感知消失的小时间和空间区域。这一原则的延续表明,由于这样一个短暂但重要的事件而产生的单个数据包应该保持同样的高标准。
最近的新平台和系统(6)、(8)专注于从基本原理重新设计wsn,但没有明确的目标来提供近乎完美的可靠性。对更广泛的无线网状网络领域的调查(1)一般只简要地提到了可靠性的主题,这表明即使在传感器网络领域之外,无线多跳也没有关注这一目标。
众所周知,无线频道会随着时间和空间的变化而变化。为了克服这一挑战,我们使用了几种技术和策略来最大限度地提高可靠性:
TDMA调度,以确保足够的带宽
网状拓扑结构提供冗余路由
在删除消息之前需要ACK
跳频以避免信道阻塞
拓扑优化,选择更好的路由
大功率模式恢复断开连接的节点
一致使用可靠性诊断
该网络由无线节点和所选节点对之间的重复定向TDMA通信槽组成。每个这样的节点对定义一条路径,并且可以由一个TDMA超帧中的一个或多个槽组成。每次传输和接收都是预定的,因此网络流量不会发生冲突。这种选择是在考虑低功耗的情况下做出的,但它也允许在拥塞中比基于争用的协议具有更好的可靠性。在TDMA调度中为每个节点分配足够数量的插槽,以满足其自身和后代预期的最大带宽需求。这里需要“监控网络”的假设:很难充分提供具有未知流量需求的网络。TDMA网络需要严格的时间同步,这就提出了它自己的一系列挑战。
通过构建网络,使管理器没有父节点,并且在路径集合生成的有向图中不允许有环路,流量向上流向管理器。由于每个节点都在寻找两个父节点,由此产生的网格结构可以最大限度地减少由于单路径失败而导致的数据包丢失。管理节点控制通信是通过沿相反方向的相同路径的广播泛洪完成的。TDMA协议的细节对本讨论并不重要;重要的是要安排足够的带宽,以尽量减少意外拥塞或来自外部源的干扰的影响。就带宽而言,高可靠性网络是过度供应的,唯一的代价是额外的空闲侦听槽。这允许队列在大多数网络操作中保持空。在发送端,只有当有数据包等待发送时,r o才会被激活,因此没有空闲插槽的能量开销。然而,在传输的情况下,接收器必须总是在一个时隙的开始收听一小段时间,因此分配的带宽越多,消耗的能量就越多。由于一些流量沿着次优路径传输到管理器,Mesh网络可能会预先支付延迟和能量损失,但这些成本确保了由于不可避免的路径稳定性变化而导致的连接损失很少。
我们的网络标准是,一旦生成了一个数据包,它就不应该被丢弃,而只是在拓扑结构上挨个节点地传递给更接近管理器的数据包。管理器是一个中央数据存储库,所有数据包都路由到该存储库,并且通常连接到用户可访问的数据库。多跳传播是通过一系列握手完成的:直到收到父节点的ACK,才会从子节点删除数据包。这要求每个节点上都有一个合理大小的数据包队列。当队列填满时,节点不能再存储新生成的本地数据,并开始丢失这些数据包。在这种情况下,满队列不会导致外部数据包丢失,因为节点会接收其子节点的消息。
为了克服可能对可靠性产生不利影响的本地窄带干扰,我们的网络在空间和时间上通过多个信道传播通信。传输在900MHz频带中跨越50个频道,在2.4GHz频带中跨越16个频道。如果在一个或几个信道上有干扰,在另一个信道上的后续尝试仍然可以成功传输。同样,带宽的过度配置使网络即使在通道阻塞的情况下也能保持高可靠性。跳频导致连接时间变长,因为新节点必须扫描多个信道才能定位它们的对等节点,但动态r / o环境中的长期可靠性更倾向于多信道策略。
这种网络架构有利于网络形成和运行过程中的路径优化。管理者不断地寻找重定向网络图的方法,以确保可靠性最大化。优化的评分基于路径质量(经验测量或RSSI)、到管理器的跳数和父节点的生命周期。这使我们能够持续地确保网络正在使用最佳可用路由传输数据。
该网络可以在低功耗和高功耗模式下运行。在网络形成过程中以及网络失去连通性后,网络会自动切换到大功率模式,以方便和加快节点的加入。网络外节点花费的时间是数据包丢失的时间;为了尽量减少丢失的数据包,需要花费更多的精力来尽可能快地恢复丢失的节点。
最后,正如将在下一节中详细描述的那样,我们始终采用几种独立的诊断方法来跟踪丢失的数据包。随着可靠性水平的提高,丢失的数据包变得更加难以跟踪,特别是在短期实验中无法跟踪罕见的事件。因此,在所有操作网络上使用诊断工具可以提供最大的机会来发现所有损失机制。
在我们的网络中,通过比较两个独立的数据包计数来识别丢失的数据包:来自每个节点的定期诊断数据包和管理器收到的唯一数据包列表。诊断包通知管理器在最近的收集间隔期间从节点发出的数据包的数量,以及由于消息缓冲区满而丢弃的本地生成的数据包的数量。目标是能够一致地跟踪丢失的数据包数量和每个丢失的原因。除了这些方法外,我们还使用直接有线和无线节点查询、网络模拟和节点模拟来确定数据包丢失的来源。根据标准网络运行时的可用数据,我们可以将丢失的数据包分为以下几类:
交通拥堵
设备重置
设备故障
会计差错
未知的
拥塞损失由诊断包中的节点直接报告,因此最容易跟踪。然而,持续的拥塞导致诊断数据包被中止,以阻止进一步的损失,因此在节点n的诊断数据包没有到达的一段时间内,管理器报告节点n丢失的数据包被认为是拥塞损失。由于拥塞,节点n只能丢失自己的消息;当节点的消息缓冲区已满时,节点会重新设置子节点。这并没有改变每个进入网络的数据包都是安全的这一概念,而是显示了一些预期的数据包是如何被阻止进入网络的。
图1所示 显示测试部署中父子关系的网络图。
当节点失去与所有父节点的连接时,会重置其软件。这将导致节点丢失其队列中的所有数据包,其中可能包括来自其他节点的数据包。管理器通过节点的父节点和子节点产生的告警报文以及节点重新加入网络的请求来检测重置事件。当一个节点已经离开网络时,在间隔期间丢失的数据包被认为是由于这个重置节点造成的,而不管它们的初始来源如何。类似地,需要维护的设备故障(如更换电池)最初可能会导致来自多个来源的数据包丢失,但随着时间的推移,只有来自故障节点的数据包丢失。
一个16位的CRC被附加到所有的消息,以确保链路级的完整性。然而,对于较长的数据包,这个CRC不是唯一的,某些错误组合可能导致有错误的数据包与没有错误的数据包具有相同的CRC。但是,使用另一个端到端加密MIC,因此在解密时在管理器上检测到错误(但无法纠正)。
已经发现并修复了几次会计漏洞,但不能保证不会继续存在。我们假设一个包在被管理器报告之前是丢失的,所以所有的错误都是误报的损失。尽管如此,还是不可能将会计错误与数据包丢失区分开来,因此必须始终假设最坏的情况。最大的麻烦来自大量无序的数据包序列,并且跨越不同的15分钟间隔。对于本研究,保留了所有传入消息的独立跟踪,以确定自动分析中是否存在任何会计错误。
一年前,这一系列损失机制与现在大不相同。有的问题解决了,有的问题又被发现了。随着可靠性、网络规模和流量水平的不断提高,将会出现更多不为人知和隐秘的损失。当10-3级损失普遍存在时,10-6级的因素就不可见了。这再次强调了能够解释每一个已知丢失类型的丢失包的必要性。在下一节中我们将看到,目前测试网络中主要的丢包形式是通过未知的机制造成的。我们推测,这是由于逻辑干扰与其他不同步的网络在同一r / o空间。
图2 网络生命周期内的日常可靠性。
作为可实现的可靠性级别的一个示例,在我们的办公楼内部和周围部署了一个50个节点的监控网络。节点被放置在工作空间和屋顶的两个垂直层上。该网络被设计为在具有低节点到节点通道稳定性的情况下以非常高的可靠性运行;为每个节点选择1分钟的报告速率,以尽量减少因拥塞而丢失数据包的机会。该网络每天产生72,000个数据包,每个数据包平均通过2.0跳进行无线传输。离管理器最远的节点平均每个数据包跳3.6次。
该网络运行199个槽(6.2秒)的TDMA超帧。网络有向图如图1所示。在第一天的运行可靠性为99.86%,但整个星期的可靠性至少为99.99%。17天无人为干预的可靠性数据如图2所示。
节点在不同的垂直平面上,平均路径稳定性是相当低的60%,这意味着十分之四的传输尝试失败,并重新尝试。选择低路径稳定性是为了鼓励所有可能的错误类别在网络中显示自己。所有节点都是相同的——没有一个被区分为“路由器”节点——并且都使用相同的AA电池。一对AA电池的最短节点寿命为13个月。在整个网络生命周期中,平均数据包延迟为3.9秒。该网络在下雨期间运行,屋顶节点测量的地表温度超过70摄氏度。
表1总结了截至撰写本文时所有丢失包的性质。总丢包数为3.67个,收到的唯一报文为120万个。
损失机制 | 报文数 | 损失率 |
节点重置 | 265 | 2 x10-4 |
未知的 | 71 | 6 x10-5 |
交通拥堵 | 26 | 2 x10-5 |
CRC失败 | 5 | 4 x10-6 |
故障设备 | 0 | 0 |
会计 | 0 | 0 |
图3 在网络的生命周期中每日丢包的机制。
进一步的基于日的损失机制分析如图3所示。在最近一周的运行中,没有数据包因节点复位或拥塞而丢失。这是由于在网络中运行的优化例程——通过确保所使用的所有路径具有足够高的稳定性来确保可靠的操作,拓扑已经优化到几乎消除了这些数据包丢失的组件。在所有这些过程中,单独的路径被创建和失败,但由于网格体系结构,这并不一定会导致数据包丢失。
节点复位事件多发生在网络形成和优化过程中;期望在稳态运行期间,这些损失会少得多。未知和CRC故障的数量应该继续以目前的速度增长,我们预计网络将继续以99.99%的可靠性报告数据,从现在到未来至少13个月。
提出的基于tdma的WSN策略允许低功耗50节点网络在没有人为干预的情况下以99.99%的稳定可靠性运行。这种级别的可靠性是通过围绕将每个数据包传递到集中式管理器的目标对整个系统进行精心设计而实现的。通过在重置期间保留队列内容和增加队列长度以消除拥塞损失,协议的更改可能导致网络丢失低于10-4的数据包(包括加入期)。
展望未来,目标是确定来源并减少未知损失的数量。这些误差的幅度足够大,因此crc类型的误差相对来说不太值得关注。进一步的发现将通过更广泛地使用有线连接来直接监测单个节点对。该网络没有出现任何节点故障,但这种级别的可靠性要求故障要么是可预测的(例如通过电池监测),要么是极其罕见的。在99.9%的可靠性水平下,我们可以承受1/10000量级的故障停机时间。如果每次更换故障需要一天的时间,我们需要将设备故障发生的频率降低到每27年一次以下。
虽然测试网络仅由50个节点组成,但该协议可扩展到更大的网络,并且具有相似的每个节点可靠性。对于监控网络,必须相应地调整报告率,以确保拥塞水平不会增加,但对协议没有根本的更改。在几个错误修复之前,我们已经运行了250个节点的网络,时间超过一个月,可靠性为99%。假设节点可以在同一级别保持连接,则操作的其余部分是相同的,并且应该产生相同的损失分数。
(1)王晓明,王晓明,王晓明。无线网状网络的研究进展。IEEE通讯杂志,第43卷,第43期。2005年9月9日。
(2)张建军,张建军,张建军。基于无线传感器网络的无线传感器网络实验研究。ICNP 05, 2005年11月。
(3) Dutta, P., Grimmer, M., Arora, A., Bibyk, S.和Culler, D.一种用于检测稀有、随机和短暂事件的无线传感器网络平台的设计。IPSN 05, 2005年4月
(4) Dutta, P., Hui, J., Jeong, J., Kim, S., Sharp, C., Taneja, J., Tolle, G., Whitehouse, K.和Culler, D. Trio:实现可持续和可扩展的户外无线传感器网络部署。2006年4月6日。
(5) Healy, W. M.无线监测的经验教训。ASHRAE杂志,Vol. 47 No. 10, 2005年10月,pp. 54-60。
(6) Kling, R., Adler, R., Huang, J., Hummel, V., Nachman, L. Intel Mote:工业应用中的传感器网络技术,IPSN 05 demo, 2005年4月。
(7) Krishnamurthy, L., Adler, R., Buonadonna, P., Chhabra, J., Flanigan, M., Kushalnagar, N., Nachman, L., Yavis, M.工业传感器网络的设计和部署:来自半导体工厂和北海的经验。ACM SenSys 05。
(8)刘建军,刘建军,刘建军,吴伟,吴伟杰,吴伟杰。一种基于嵌入式网络传感器的低功耗能量感知处理系统。2006年4月6日。
社群二维码
关注“华强商城“微信公众号
Copyright 2010-2023 hqbuy.com,Inc.All right reserved. 服务热线:400-830-6691 粤ICP备05106676号 经营许可证:粤B2-20210308