随着网络系统越来越复杂,整个系统的可靠性和可管理性变得越来越重要。
网络的高可用性包括软硬件故障的监测和故障恢复,当软硬件出现异常时通过冗余和状态同步等方式实现无缝恢复,保证系统业务不间断。同时还要承担分布式系统的通讯,调试以及软件的升级管理。
可管理性主要是针对复杂网络节点环境(包括基于云端或者NVF的虚拟节点)如何实现北向接口和南向接口的自动通讯,包括配置数据和状态数据的异步更新和通知机制来实现对整个系统的管理和维护。
高可用性(HA)和嵌入式管理中间件
Enea Element主要实现了HA要求的分布式管理、高可用性管理、CheckPoint、In Service软件升级、嵌入式设备管理、机架管理、LOG管理等多种功能。基于Element可以极大地减少用户部署HA应用的开发维护工作量。
嵌入式管理是针对嵌入式设备而设计的标准的、模块化的管理系统中间件。对外提供北向接口(Northbound API)和南向接口(Southbound API)分别和运营管理系统、应用程序集成。通过YANG语言进行建模,实现对嵌入式设备的配置数据,运行状态数据进行实时管理。
Element具有10+年的现场应用成功案例,如成功部署到电信设备、卫星控制和国防军工等关键领域。
Element系统架构
Core Services (核心服务)
基于LINX的消息机制:提供一个可靠、高速的进程间通讯机制,和消息发布/订阅、流控、命名服务的透明传输机制。
调试框架:提供系统及调试工具。调试工具可以提供可定制命令服务,消息trace跟踪服务。
提供基于网页和CLI的命令人机接口,可以方便的对整个系统进行配置和监测。
系统LOG服务;通用工具:提供通用API框架和数据类型转换功能。
High Availability (高可用性)
出错管理:提供系统运行监控、状态检测、事件驱动策略和故障主动通知功能,AMF框架完全符合SAF B.02.01标准。
支持AMF要求的2N,N+M,N-Way,N-Way Active和No Redundancy多种冗余模型组合。
Checkpoint服务:Element提供一个轻量级的实时数据库来动态保护系统状态信息。
异常状态历史记录:可以动态记录系统中各个组件的异常状况,并以后续分析和跟踪。
Chassis Management (机架管理)
提供符合标准HPI的软硬件接口,无缝适配业界主流ATCA硬件,并可以支持硬件热插拔功能。
节点管理:提供发现,状态监控和HPI管理功能。
告警服务:提供硬件异常告警功能。
ISU (软件热升级功能)
提供完整的在线升级功能,在升级过程中避免中断现有进行中的业务。
对Element本身和用户程序提供无缝的在线升级功能。
Enea 嵌入式管理 (Embedded Management)
Embedded Management针对嵌入式设备而设计的标准的、模块化的管理系统中间件。对外提供北向接口(Northbound API)和南向接口(Southbound API)分别和运营管理系统、应用程序集成。通过YANG语言进行建模,实现对嵌入式设备的配置数据,运行状态数据进行实时管理。
北向接口
CLI:类似于Juniper命令行接口
XML-RPC:基于http-based XML-RPC
YANG模型
基于YANG模型来组织系统配置和数据
支持RPC directive
支持完备的数据类型
支持Session和AAA认证机制
提供mediation layer,支持Session机制
集成了AAA验证机制,提供访问权限控制
提供账户审计信息记录
ACID Transaction Support
支持Transaction回滚Rollback操作
配置数据冗余存储,保证配置可靠
配置数据管理
配置数据能导出,导入和永久保存
支持running和startup两种配置存储
南向接口API
配置数据,基于配置对象级别的配置更新
状态数据,基于状态对象级别的配置更新
配置数据改变后,通过异步API接口通知应用
Element案例 – uTCA / ATCA / 服务器数据通讯应用
Element for uTCA / ATCA 平台提供:
Cluster内部有2块控制板和4块高速数据板卡构成6个Node(节点)
Node间通过高速以太网卡和光纤互联,软件通过Enea LINX互联
Element对整个系统内组件进行高可用性管理,并通过Checkpoint实现运行状态备份和恢复
系统运行Polyhedra内存数据库,用于海量数据管理
Node采用电信级Enea Linux为整个Cluster提供操作系统平台
用户后台可以通过CLI或者Web方式对系统进行配置、管理和状态查询
Element案例 – Cloud 应用
Element Cloud 平台提供:
配置数据和操作状态数据配置管理
标准SAF高可用冗余方案
基于状态备份的HA功能
系统的监控
软件升级管理
软件发布更新
基于ACL访问控制配置操作
基于Cloud的分布式通讯采用LINX over TCP/IP 架构,并实现对OpenStack的集成。