提升SDN网络可靠性可用性的策略探讨

中国新通信 / 2018年10月16日 10:02

互联网+

系统可靠性与可用性分析方法片

袁文亮

【摘要】 当今,互联 网业务的发展日新月异,传统分布式IP网络已经成为业务发展的瓶颈。为破解业务开展过程中的诸多问题,SDN网络架构应运而生。本文对传统分布式IP网络和SDN网络架构进行分析,重点对提升SDN网络可靠性可用性的策略进行探讨,并应用到实际SDN网络部署中。

【关键词】 SDN 网络架构 可靠性 可用性 策略

一、背景

随着互联网和移动互联网的高速发展,网络的灵活性和敏捷性要求更高,现有的传统分布式IP网络的局限性日益突显,主要表现为:

1.网络刚性。网络设备大量由单一功能的专用设备构成,造成网络复杂、无法协同、缺乏灵活性等弊端。

2.网元封闭。硬件和软件一体化的封闭结构,导致设备扩展性差、价格昂贵、不同厂家的网元互通困难。

3.业务僵硬。不同厂家的网元设备功能单一封闭,新业务开发周期长、成本高,难以满足快速灵活提供业务的要求。

4.运营复杂。大量厂家的各类专用设备以及相关的协议众多,网络规划复杂,整合难度高,运营复杂,造成运营成本居高不下。

多年来积累的问题已经使得今天的IP网络患有“动脉硬化症”,网络架构重构迫在眉睫。2006年,SDN概念于是应运而生。

SDN(Software Defined Network)即软件定义网络,是一种开放灵活和可持续演进的新型网络架构,采用软件化、虚拟化的“分离”方法,将现有传统的分布式网络架构进行重构,让网络中的控制面和数据转发面进行分离,由传统分布控制向集中控制的网络转变。

关于SDN网络架构,不同的组织有不同的定义,当前较为主流的是开放网络基金会ONF(Open Networking Foundation)对SDN分层架构的定义,如图1所示。

该分层架构模型得到了产业界的广泛认可和推广使用。

SDN的核心是“S”即软件,也就是网络不再是“硬”的,固化封闭的,难以扩展的,而是可以通过软件程序实现灵活的新業务开发和部署,网络资源可以灵活调度,使得网络作为一个管道变得更加智能和弹性可用,较好地解决运营商现有网络运营的痛点,因此,SDN概念一经提出,就受到了运营商的青睐和积极响应。2014年以来,随着SDN技术的逐步成熟,国内运营商开始进行局部试点商用。

二、传统分布式IP网络和SDN网络架构分析

SDN是对运营商现有网络架构进行重构,重构后的网络是否能够稳定运行,是否出了故障能及时恢复,是否能达到或接近传统分布式IP网络的可靠性可用性要求,是运营商关注的重点之一。

2.1可靠性、可用性

网络的可靠性使用网络运行阶段平均业务失效故障间隔时间来描述,用无故障运行时间来衡量。网络的可用性使用网络稳定不出现故障的时间与总的时间的百分比来表示。

从通俗的角度来理解,可靠性高是指网络持续一段较长时间(如一年或两年)运行稳定,不出现业务失效的故障;可用性高是指网络稳定运行不易出现故障,并且一旦出现故障能够快速恢复。

要提升网络的可靠性和可用性,通常采用冗错技术来实现,也就是在网络设计中增加冗余资源,避免单点故障造成业务失效。

2.2传统分布式IP网络基本架构分析

传统分布式IP网络的基本架构如图2所示,分为管理平面、控制平面和数据平面。管理平面为网管系统,负责网络监控和业务配置,当业务配置下发后即使脱网也不影响网络的正常运转。控制平面和数据平面由路由器等设备组成,路由器负责按路由表转发数据包,采用IGP和BGP两种核心分布式动态路由协议,当网管把业务配置上传到路由器后,如果网络状态发生变化,控制平面即路由器会在网络中自动扩散这些变化,各自根据新的状态自动重新计算路由,全网采用冗余路由技术和路由快速收敛技术,当故障发生时能够在秒级时间内使受到影响的业务得以恢复,网络具有故障快速自愈能力。

2.3 SDN网络基本架构分析

SDN网络的基本架构如下图3所示,分为应用层、控制层、基础设施层。应用层由各类商业应用软件程序组成,通过北向接口向控制器提交各种网络应用;控制层由SDN控制器组成,它是整个网络的控制中心和指挥中心,是整个网络的“大脑”,拥有全局网络视图,负责实时采集全网设备状态、网络拓扑和各链路流量,生成流表并通过南向接口下发给网络设备,同时根据网络状态变化或应用层提交的功能更改重新生成流表并下发;基础设施层由网络设备和线路组成,一方面负责接收控制器下发的流表并按之进行数据包转发,另一方面负责将网络资源信息和状态上报给SDN控制器,是执行单元,本身不做决策。

从SDN网络的架构来看,SDN控制器作为网络的“大脑”是关键部位,成为单点故障引发全网故障的风险点。

2.4两种架构的可靠性可用性比较

从传统分布式IP网络和SDN网络的基本架构来看,传统分布式IP网络的控制功能是分布式的,任何一个单点故障发生时网络具有快速自愈能力,而SDN网络的控制功能全部集中在SDN控制器,有单点故障引发所有业务失效风险,因此,传统分布式IP网络的可靠性和可用性较高,但是,SDN具有简化网络、快速业务开发和部署、低成本等核心价值,值得研究对策,让SDN网络可用。

三、提升SDN网络可靠性可用性的策略

可靠性和可用性是基于网络故障来考虑的,如果能够识别出各层可能发生的故障及对网络的影响程度,拿出应对策略,避免网络因单点故障而瘫痪。

从SDN网络架构来看,各层可能出现的故障如下:

应用层

设备方面:服务器故障、应用程序故障、服务器所在机房出现断电等故障。

链路方面:服务器与SDN控制器的通信链路故障。

安全方面:非法侵入等。

控制层

设备方面:服务器故障、SDN控制器软件故障、服务器所在机楼出现坍塌等故障。

链路方面:SDN控制器和网络设备之间的链路故障。

安全方面:非法接入或受DDOS攻击等。

基础设施层

设备方面:网络设备故障。

链路方面:网络设备之间的链路故障。

安全方面:非法侵入等。

针对以上各层可能出现的故障,以及各层在网络中的重要程度,权衡成本投入以及可接受的可靠性、可用性等因素采取以下的应对策略:

3.1应用层的应对策略

应用层的设备方面故障对网络的运行影响并不大,当应用需求通过北向接口提交给控制器,由控制器生成相关的业务逻辑变成相关流表下发给网络设备执行,此后,应用程序的服务器即使出现脱网等故障也暂时不会影响网络的运行。因此,應用层的服务器、应用程序采用冷备份冗余设计,考虑到机房安全问题,在异地机楼部署冷备份系统。当主用系统出现异常时切换到冷备份系统上运行。

防范链路方面的故障,可采用一条主链路和一条备用链路。由于与应用程序通信的外部设备是可知的,因此,防范安全方面造成的故障,采取对连接的设备进行白名单设置并进行严格的身份认证。

3.2控制层的应对策略

SDN控制器是网络的控制中心和指挥中心,一旦SDN控制器无法提供服务,假设基础设施层的网络没有发生变化,网络设备仍按原有的流表进行转发,不影响网络运行,但是此时基础设施层的网络拓扑如果发生变化,没有SDN控制器重新计算路由生成新的转发流表,对网络的运行就会造成重大影响。因此,控制层健壮性设计非常关键。

防范设备方面的故障,采取SDN控制器异地机楼的热备份设计显得尤为重要,承载SDN控制器软件的服务器采用云化虚拟机集群,这些虚拟机独占物理设备不与其他用户分享,软件采用分布式部署,主用控制器和备份控制器同时运行,都在处理业务,是负载均担关系,因此具有超强的自愈能力来应对单台或多台服务器故障,冗余保护措施在故障情况下自动生效,对外服务不中断,故障服务器修复后重新上线,系统自动平衡工作负载。

控制器和网络设备之间的通信链路如果中断导致控制器无法控制网络,会造成重大影响,为了防范链路故障的影响,应采用控制器通过多条链路连接到网络设备,采取带外专门的链路通道,辅以带内控制通道作为冗余链路,使得任何一条链路故障,都不影响控制器与网络设备的通信。

为防范非法接入或受DDOS攻击,应采取在SDN控制器和网络边界处部署防火墙、入侵检测设备以及流量清洗系统。通过防火墙和入侵检测设备进行访问控制、病毒木马防治、非法入侵检测、安全漏洞扫描等,采取只对特定的IP地址提供服务并按需开放端口原则,阻断非法IP接入或攻击;通过清洗系统对进出控制器的流量进行分析,一旦发现非法攻击流量,立即引导非法流量到清洗部件。

3.3基础设施层的应对策略

基础设施层的网络设备或链路故障,会造成部分业务中断,故障发生后,SDN控制器会根据网络变化情况,重新进行路由计算并生成新的流表下发给在线运行的网络设备,实现网络收敛。在设计网络节点时采用传统的设备冗余、链路冗余技术,部署IP FRR快速重路由,一旦节点故障发生,网络设备在没有控制器控制下也能自动完成路径切换。适当加大资源冗余度,以轻载为主,链路带宽利用率控制在50%以下。防范非法侵入网络设备产生的故障,采取管理控制网络与公网隔离,对远程登录进行严格设置和身份认证。

四、SDN可靠性可用性策略在实际网络部署中的应用

中国电信广西公司从2014年以来,积极推进SDN网络的试点工作,在实际SDN试点网络部署中综合考虑以上可靠性可用性策略,采用如图4的方式部署:

应用层和控制层的软件使用云资源池分配的虚拟机来承载,同时在异地机楼云资源池上部署备用系统。应用层和控制层的虚拟机各自独占一个VLAN与云资源池中的其它网络进行隔离。这些虚拟机独占物理设备不与其他用户分享。SDN控制器采用热备份部署。

SDN控制器与网络设备的通信链路,采用带外管理控制网络和带内控制通道相结合的方式。

基础设施层采用设备、链路冗余配置。

在控制层部署防火墙、入侵检测设备和流量清洗系统,保障SDN控制器的安全。

通过在SDN试点网络进行了专线业务开通、业务流量优化、新业务开发和部署、模拟攻击、设备主备倒换等一系列实验,各项业务功能达到了预期效果,网络可靠性可用性也达到商用的要求。

五、结束语

SDN网络架构具有传统网络无可比拟的优势,虽然SDN网络的可靠性可用性相对于传统分布式IP网络而言,还有一些差距,但是可以通过以上的策略来提升SDN网络的可靠性可用性,从而使SDN网络达到可商用的目的。

参 考 文 献

[1]闫长江,吴东君,熊怡 .SDN原理解析—转控分离的SDN架构[M].北京:人民邮电出版社,2016

[2]刘文懋,裘晓峰,王翔 .软件定义安全:SDN/NFV新型网络的安全揭秘[M].北京:机械工业出版社,2016

[3]中兴通讯学院编著 .信息通信技术百科全书[M]. 北京:人民邮电出版社,2015

[4]邵广禄 .SDN/NFV重构未来网络 电信运营商愿景与实践[M]. 北京:人民邮电出版社,2016

1.环球科技网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.环球科技网的原创文章,请转载时务必注明文章作者和"来源:环球科技网",不尊重原创的行为环球科技网或将追究责任;3.作者投稿可能会经环球科技网编辑修改或补充。