首先,路由器集群的平滑演进更加困难。在路由器集群传统架构中,为了实现系统交换能力的提升,需要更换容量更大的交换网板,这必然导致业务中断,系统无法平滑升级,同时增加运营商额外投资。
其次,实现控制平面的快速切换,以保证系统的高可靠性更加复杂。这是因为路由器集群包括更多的主控板,选举主用和备用主控板,以及当主用主控板发生故障或者主用链路时,实现控制平面快速切换,变得愈加复杂而重要。
最后,Full-Mesh带来的N2问题大大增加运维成本。对于路由器集群系统,目前业界最通用的技术是将中央交换框主控板和线卡框主控板全连接(Full-Mesh)。Full-Mesh技术实现简单,维护方便,可以满足特定阶段的客户需求。但是后期随着网络带宽增大,路由器集群需要持续升级,Full-Mesh连接会带来N2问题,导致运营维护困难,从而大幅增加运营商运维成本。
针对路由器集群扩容面临的问题,华为通过领先的硬件和软件设计能力,整合自身产品优势,创新提出了ISHE解决方案。ISHE方案可保证集群无缝扩容,系统硬件充分利旧,从而最大程度保护运营商投资,大幅降低运营商运营成本。
ISHE核心思想主要分为硬件平台和软件平台两个层面:
弹性的硬件架构设计 硬件不更换保护投资
华为路由器集群系统的中央交换框采用中置背板模式,电交叉板和交换网板采用垂直交叉连接,形成正交矩阵,如图1所示:

正交矩阵保证数据平面和交换平面的全连接,通过接口散列方式,将每根高速光纤带的数据流散列到所有交换网板的所有交换平面,保证高速光纤传到交换框的流量可以均衡分担到任意交换平面。

图2给出了数据流量在中央框进行交换的实例图。拿光子卡1举例:光子卡1接收到光信号后,在电交叉板完成光、电信号转换,然后通过背板,将电信号负载分担给所有交换网板的所有交换平面,这样,每一个交换平面仅仅处理1/N光子卡1接收的流量。随着流量的增大,运营商仅仅需要增加光子卡及电交叉板个数。实现交换能力的最大提升。
同时,华为创新硬件架构完美支持智能感知集群规模、交换模式及交叉粒度动态可调、光子卡按需配置等功能。创新硬件架构采用灵活的弹性矩阵保证集群升级扩容过程中硬件充分利旧,最大程度保护客户投资。
智能的软件平台设计 灵活切换保证高可靠
针对集群不同的场景需求,华为创新的软件平台设计能够提供最优的解决方案。
在小容量集群系统(1+N/2+N)场景中,线卡框和中央交换框数量很少,因此采用“双星型”连接方式实现中央交换框控制平面和线卡框控制平面的Full-Mesh连接。这种方式拓扑简单、运维方便,能体现更高的性价比优势。
在大容量多框集群系统(4+N/8+N等)场景中,线卡框和中央交换框数量很多,“双星型”连接方式会使网络拓扑复杂化,降低可靠性,大幅增加运维成本。华为凭借深厚的技术优势,创新地提出CP-POOL(Control Plane POOL)解决方案。其基本原理是通过10G光纤将多套小容量路由器集群系统的所有中央交换框的主控板互联,形成RRPP(华为专利技术)环。如图3所示:

1、可靠管理控制平面:通过RRPP专利技术,集群扩容时仅需将新增的中央交换框控制平面接入RRPP环(内外两个环路)即可。当集群某一链路出现故障后,系统自动感知,控制信令实现50ms快速切换到反向链路,保证控制平面高可靠运行。
2、智能选举集群大脑:CP-POOL解决方案引入了资源池的概念。CP-POOL方案通过整合集群系统中央交换框的所有主控板,并且将其归属到一个资源池内,资源池中任意主控板都可以参与竞选,竞选获胜者自动升级为集群系统主控板。主用主控板和备用主控板实时信息同步,当主用主控板出现故障,备用主控板自动升级为主用主控板,同时系统会从资源池中重新选取一个备用主控板。