物联网指南:如何构建一套实时设备管理系统

  家庭环境内接入互联网的设备数量正在急剧增加,而其它物联网装置在数量与类别方面亦将呈现爆炸式扩展。面对如此规模的发展节奏,高效监控与自动化管理无疑是保障物联网成功的核心所在。

  幸运的是,poadband Forum已经在链接层面为远程监控与设备管理提供了坚实基础,即TR-069标准。现在,我们最大的障碍在于存在多年的网络IP驱动型设备通信协议,SNMP。不过随着TR-069的普及,目前我们已经能够在路由器、网关、机顶盒、VOIP电话等多种设备上见到它的身影。

  在今天的文章中,我们将共同探讨如何将设备管理系统由被动与补救性方案,转化为主动实时型工具。

  设备管理的挑战与架构

  设备管理的最大挑战在于,我们需要面对来自不同制造商的数量极为庞大的各类设备,且管理服务的实现成本不能太高。很明显,成本过高或者要求最终用户不断重启设备的方案不能算是理想的解决办法。

  TR-069允许各自动配置服务器(简称ACS)了解设备类型、制造商、序列号并上传设备日志。TR-069可帮助用户通过“心跳”了解设备的在线状态、最后一次配置变更与重启情况。另外,ACS还能够请求设备下载更新配置或者新型固件。TR-069甚至能够在设备发生故障时对其进行恢复性操作。

  遗憾的是,客户自有设备拥有极为广泛的用途与配置,这意味着其发生故障的机率极高。以路由器与住宅网关为例,其可能支持局域网WEP或WPA2加密、DHCP或静态IP分配、提供可变DHCP租约条款、IPv4与IPv6,且包含多种路由协议及桥接方式。另外,供电质量、射频干扰、温度以及下载软件等客观因素也会给其运行带来巨大影响。

  面对路由器故障,用户往往会频繁将其重启。这种状况在智能家居及物联网领域将更为普遍,而设备管理在这类场景中亦变得非常关键。

  利用场景与操作强化ACS服务

  简单来讲,TR-069是一种面向反馈的设计方案,其会等待设备发生脱机问题,而后采取行动。这种方法无法预先消除故障,且实施成本更高,因此我们需要主动模式以识别并操作,从而抢先一步解决潜在故障并尽可能提升正常运行时间。

  导致设备脱机的原因多种多样,包括软件质量、设备配置、设备加载、供电质量、设备过热等等。

  事实上,过去十年中已经出现了多种前瞻性事件管理模型,其目前被广泛应用于银行欺诈检测、零售商实时管理以及运营商无线服务管理等领域。其中一项最新设计方案能够仅利用一台8核心Linux主机配合64 GB内存管理无线网络上的300万台终端客户设备。

  在此设计中,其定义了一套场景,即识别设备在发生故障之前的事件顺序或模式。该系统能够将各事件中的共性结合起来,并在满足这些条件后提前采取行动。例如设备可能需要配合特定配置。当配置日志表明客户启用了不支持的功能时,服务供应商即可通过邮件提醒客户调整这一不当配置。

  在如下图所示的这套系统中,ACS服务器与实时事件引擎(这里将其命名为EVAM)之间能够实现实时事件协作。在第一步中,事件引擎会实时收集并识别事件。当满足某一场景时,则结果操作会直接跳转至ACS服务器(第二步)——例如要求设备下载新的配置文件,或者第三步——通过邮件、电话乃至其它沟通方式与客户取得联系。

  

  这套系统架构的关键在于准确识别可能引导故障的模式,并在发现这种模式后立即实施操作。

  总结

  可以看到,如此一来我们即可轻松在智能家居设备管理系统中实现主动事件检测与设备管理功能。本文中提到的这套方案已经得到众多企业的验证,实现成本低廉且能够顺利将原本的纯被动管理模式转换为主动/被动各占一半的混合形式。