创新技术
企业自动驾驶网络架构解析
在国家“十四五”规划的宏观背景下,加快数字化发展、建设数字中国已经成为企业的普遍共识。网络作为IT基础设施最关键最复杂的一部分,企业网络自动驾驶是使能企业的数字化转型的关键。

文/华为NCE数通首席架构师 赵永鹏
根据《2021年IDC企业自动驾驶网络调研,N=203 》调研结果,超过一半的企业表示其网络架构难以完美满足其数字化转型的需求。其中,网络架构不够敏捷,网络规划、部署、下发、调参等不够自动化和智能化,网络故障定位难是提及最多的挑战。

以银行数字化转型为例,传统银行的数字化举措包括:开放银行、数据驱动、双速IT模式等。银行还在从“产品驱动”转向“客户驱动”:以“场景化创新”“快速上线”“小步迭代”等方式,缩短产品创意到上线的周期,通过短平快的产品开发模式,从客户需求角度出发,快速上线产品原型,并基于客户反馈持续优化迭代,持续推动敏捷、快速、端到端的数字化流程再造。
但是,银行内部的网络架构不能满足转型需求,当下主要存在四大类问题:
- 网络变更自动化效率低:以某银行数据中心为例,有自动化能力的网络运维场景占比20%左右;单场景自动化程度不到30%;人为失误率5/1k,无有效的事前变更验证手段;
- 业务连续性无法满足SLA:故障处置效率低;用户、终端、应用状态网络无感知,无法快速还原网络路径,难以有效定界故障点;被动救火式运维,无主动运维能力,隐患无法提前识别;
- 管控手段整体方案割裂:企业客户当前网络运维系统或工具数普遍在5个以上,如ITSM、cmdb、IPAM、资源监控、流量监控、性能监控、告警平台、拨测、自动化工具、巡检工具等等。缺乏统一的数字化模型,导致数据孤岛,流程不连续,需要大量人工干预;
- 网络运营成本居高不下:专线费用居高不下,成本高昂,网络调度不均,不能感知业务;线路带宽利用率偏低,资源浪费严重。
企业自动驾驶网络的出现,解决了类似银行这样的内部网络架构与转型需求之间的矛盾。
自动驾驶网络是类比于自动驾驶汽车的一种新的网络架构设计理念,它改变了传统面向硬件设备的网络架构设计,重构为面向业务和应用的网络理念,基于整网来进行网络各个环节和流程的实施,而非单点或单台设备,主要目的是通过打造全智能、自治的网络来支撑企业数字化转型。
自动驾驶网络主要借助自动化和智能化,逐步减少网络人为干预,预测并适应环境的变化,自主做出判断并执行,最终实现无人化网络。它能够自行配置、监控、管理、纠正、保护和分析网络流量,随着时间的推移变得更加智能,完成无需人工干预的自动网络故障检测、排障和优化。同时,自动驾驶网络解放了很多员工,使他们将更多时间和精力聚焦到业务上来。自动驾驶网络还可以有效降低运营成本,提升基础设施利用率,更好地支撑业务创新。
一、 企业自动驾驶网络整体架构
面向未来使能企业数字化而提出的网络数字化、服务化、智能化的演进趋势,华为提出了自动驾驶网络方案(图1)。
华为iMaster NCE产品解决方案整体架构包括五大引擎,分别聚焦不同的能力,共同完成网络生命周期中规划、建设、维护、网优、运营不同阶段不同场景的全流程闭环自动化。智能分析引擎、数字孪生引擎和自动化引擎是网络自动驾驶架构的关键核心组件,其能力的高低决定了自动化和智能的等级。

图1 自动驾驶网络整体架构
二、5+1:五大引擎+一个AI网元
1. 感知引擎——全栈数据实时采集
感知引擎提供一整套完整的监控手段,能够有效支持白盒监控和黑盒监控。白盒监控能够了解系统内部的实际运行状态,通过对系统指标的实时秒级监控能够预判可能出现的问题,从而对潜在的不确定因素进行优化。而黑盒监控,如常见的拨测和基于意图的随流检测,可以在系统或者服务在发生故障时快速自动进行处理。通过白+黑的完善监控体系,可以实现:
- 持续收集和统计监控样本数据,分析监控指标的长期趋势;
- 对系统变更前后的资源使用情况进行跟踪和比较;
- 出现问题后的故障分析与定位。
2. 意图引擎——可理解易使用的意图定义及意图转换
意图是指用户对网络状态的一种期望,意图引擎的作用就是让网络根据用户的意图运行。意图是自动驾驶网络抽象层面的直观体现,而意图引擎能将过去客户繁琐的网络语言抽象为便于客户直观理解、可度量的业务应用语言,作为系统的输入,然后由系统去达成客户意愿。iMaster NCE的意图引擎支持将简单的用户语言转化为复杂的网络模型,自动生成对各个领域服务的调用任务,完成复杂业务场景的部署分解。意图引擎也能从存量网络的特征中学习用户规则和习惯,形成输入意图转换成内置模型,并通过可靠的形式化验证手段进行验证,同时借助感知引擎的持续监控能力,保障意图的达成。
3. 自动化引擎——开放底码化的全流程闭环框架
自动化引擎负责整体网络规划和业务发放。其中,网络规划是通过可拖拽式编排实现网络模型的定义,并以低码化方式实现网络模型到物理配置的映射,通过南向适配和北向开放自定义来降低网络规划的复杂性。业务发放是指基于网络模型,完成业务逻辑网络向网络配置的转换,并采用仿真技术进行执行前的意图校验,以验证意图是否可以正常执行及其负面影响。自动化引擎支持业务高效调度和高并发,满足网络业务极速发放的要求,同时提供业务、租户和全网的多级回滚及对账能力。
4. 智能分析引擎——AI加持的可预测用户体验保障

智能分析引擎在感知引擎的基础上,通过引入一种基于知识图谱的智能分析技术,进一步提升了用户的体验。首先,智能分析引擎对网络进行抽象建模,把网络的抽象概念具体为一个个对象模型实例。然后通过Telemetry技术采集网络中的KPI数据、业务流数据、配置数据、异常日志等,结合机器学习算法,快速发现网络中的异常特征,并将异常特征关联到具体的对象模型上。最后,借助故障演练的虚拟网络环境,持续构造实际业务中常出现的各种问题,并结合网络部署积累的专家经验,不断迭代发现故障模式,形成一个个知识,通过知识推理引擎,实现网络中的故障快速定位。智能分析引擎建立了一整套故障发现、故障根因分析、故障影响推理、故障处理维护的统一框架。通过大数据技术构建海量设备数据的采集与分析能力,实时感知设备KPI、状态以及表项变化。
5. 数字孪生引擎——实时可验证的多模型孪生体
为解决网络运维难题,需要数字孪生引擎提供数据基础设施。通过网络数据的高效接入、存储、加工处理、分析决策、访问和治理能力,打造360°的网络孪生空间,支撑网络数据的多维可视。数字孪生引擎的关键能力包括:
- 内置的网络模型及知识库能够覆盖4万+设备,跨多厂商且双向映射准确率达100%;
- 内置隐患特征数十种,如IP冲突、RouterID、ACL等,基于海量的模型及隐患可达到秒级全网校验能力;
- 基于知识图谱的网络建模、GNN+概率模型以及多模态的资源还原,实现网络数字孪生体的高效完整覆盖;
- 基于图神经网络的性能评估与预测,为流控提供准确的网络级性能评估(流量、丢包、时延、抖动)。
网络数字地图是数字孪生引擎的直观对外呈现。它能基于网图的多维可视,包括3D、动态缩放、图层叠加等技术,在不同用户场景下呈现不同的拓扑,达到良好的交互体验。网络数字地图能对后台数据统一存储与管理,构建网元和网络数据模型,实现数据驱动的实时、动态数字图谱,覆盖DCN/LAN/ WAN/城域/骨干的应用SLA可视。同时,它还能借助网络数据还原技术,在LLDP/CDP发现协议的基础上,优化MAC/ARP数据还原拓扑,并使用AI结合流量分析、拓扑推测等技术,突破拓扑还原,解决MAC老化、单个设备漏采等关键难题。
6. AI网元——功能机到智能机的华丽转身
通过AI技术重构网元,打造自感知、自决策、自学习的绿色智能IPv6+网络,在全生命周期内提供体验佳、性能高、TCO低、安全可信的个性化IP连接服务。这种以模型为中心,数据驱动的智能网元可以实现以下目标:
- 网元自动上线、角色自动识别、配置自动生成、业务自动验收;
- 故障自发现、根因自诊断、业务自恢复、故障自愈合;网络服务可度量、可优化、可闭环;智能知识面:极速采集,自主决策,实时感知,动态压缩;设备智能分析;智能联接:智能无损(0丢包)到确定性抖动,流量识别+智能拥塞控制,实现低时延/抖动,提升应用性能;智能超宽:AI辅助数据面优化,硬件性能提升,AI查表优化,节省现有芯片面积30%。