创新技术
星河 AI 网络,共赢行业智能化
千行万业智能化转型加速,驱动网络向 Net5.5G 新代际演进。华为星河AI 网络引入智能化技术,为客户构筑智能时代的新一代网络底座。
文/华为数据通信产品线总裁 王雷
人工智能技术正以前所未有的速度和力量重塑着各行各业。在金融领域,中国工商银行将行业通用模型应用于风险防控,实现了对工业工程融资项目建设的进度监测,监测精准度提升约10%;在医疗领域,基于AI大模型的“良医小慧”,能够解释超过4500个检验项目和2800种疾病,有效提高医院的诊疗效率;在制造领域,上海宝武钢铁通过AI技术赋能热轧生产,精轧宽展预测精度提升5%以上,预计每年可以多产钢板2万余吨,增收9000余万元。根据华为的市场洞察预测,到2026年,AI在行业核心业务场景的渗透率将达到30%。
面向Net5.5G时代,华为星河AI网络全面升级
行业智能化的深入发展对网络的应用场景、系统架构和关键技术等也提出了更高的要求,驱动着数据通信网络迈向Net5.5G时代。围绕Net5.5G网络的演进方向,华为星河AI网络通过引入智能化技术,在园区网络、广域网络、数据中心网络以及网络安全等四大领域全面增强网络能力,旨在精准契合智能时代各行各业对网络的多样化需求,帮助客户抓住智能化发展机遇。
图:华为星河AI网络解决方案
星河AI园区网络:AI 使能体验建网,跃升企业数智生产力
随着企业数智化转型不断深入,园区网络的联接范围不断扩大,联接对象不断增加,园区网络面临全新挑战。具体而言,两大难题尤为凸显。首先,据Gartner预测,未来两年超过80%的企业将融入生成式AI办公,每人将配备3至5个AI助手,这将导致园区终端联接数激增5倍,带宽需求增长10倍,流量会话数更是攀升至原来的10倍甚至100倍以上。如何在高并发环境下确保用户的体验,是园区网络亟需解决的首要难题;其次,音视频流量正以每年30%的速度迅速增长,视频会议已经成为企业办公的核心应用,尤其是高层会议的质量对企业的运营效率有很大影响。如何优先保障关键业务及用户的网络体验,是园区网络面临的另一大挑战。
华为星河AI园区网络通过无线、应用、运维三大体验升级,引领园区网络从联接建网时代向体验建网时代跨越。
第一,无线体验升级。华为全球有20万员工,60万终端。过去,由于AP干扰等问题,多用户接入会导致网络性能雪崩,园区无线网络不得不采取限速措施,每终端的带宽上限只有20M,这就导致下载GB级软件镜像需耗时数小时,严重影响开发效率。现在,华为创新地引入X-Wireless智能无线调优算法,实现单AP、AP组、整网三级参数全局最优,打造了带宽不限速、覆盖无死角、无缝漫游的高品质无线园区,下载GB级文件只要几分钟。
第二,应用体验升级。华为每天召开8万余场次视频会议,以前IT报障最多的就是视频会议质量欠佳。这是因为视频会议等应用云化后,其IP地址和端口号不断变化,传统的静态QoS方案已经不再适用,网络需要基于流量特征智能识别出关键应用。为此,华为独家开发了智能调度引擎,通过把轻量化的业务感知模型嵌入交换机和Wi-Fi设备,实现智能、动态地识别应用,并对全业务流关键帧实时检测和调度,从而打造0卡顿的视频体验。针对VIP用户,华为基于独家超帧抢占技术,为VIP提供独享的“专车道”网络资源。即便在网络拥塞的情况下,也能保证VIP用户的时延不超过50毫秒,体验0受损。
第三,运维体验升级。通过业界首个园区数字地图构建用户/终端,应用和网络三层立体可视,体验精准度量,实现一人轻松管理万人园区;网络数字地图结合NetMaster,可实现自然语言交互,脑图联动定位,80%无线故障自闭环,分钟级故障定位。
星河AI广域网络:AI使能新一代自感知自优化智能广域网
企业业务上云入算成为主流,生产网走向IP化,驱动着广域网络革新换代。
首先,以近期热门游戏 “黑神话悟空”为例,很多用户因本地电脑无法满足该游戏对显卡的高要求,购买云电脑服务以获得流畅体验,这就对广域网络提出了新的要求。相较于传统云游戏的网络时延约40ms左右的标准,“黑神话悟空”为保障体验要求时延低于5ms。除了云游戏,广域网络还需满足各行业多样化业务的网络时延等差异化需求。比如,电力行业继电保护要求时延小于5ms,铁路行业FRMCS系统则要求时延小于10ms。这就需要网络能够从海量数据中精准识别特定应用,并实时规划低时延路径。此外,面对云游戏等200万用户同时在线的场景,网络还必须具备百万级低时延路径规划能力。
其次,由于这些都是高价值业务,一旦出现长时间网络故障,影响非常大,所以提升网络的可靠性至关重要。
华为引入AI技术全面升级广域网,实现应用体验“自优化”,网络问题“自维护”。
一方面,升级智能网元,保障关键应用体验。基于应用特征持续进行AI训练,精准识别新应用,准确率达98%,实现从传统链路级到应用级的体验保障;同时,SRv6智能云图算法自动优化路径,可以实现百万路径分钟级调整。
另一方面,升级智能大脑,提升网络可靠性。华为基于历史运维经验库,训练了运维智能体,可以主动分析预测网络隐患,实现90%故障分钟级自闭环。
星河AI数据中心网络:高吞吐、高可靠,使能AI算力高效释放
AI大模型迅猛发展,带动算力需求爆发式增长。预计到2030年,全球人工智能算力需求将增长500倍,相比之下,单卡算力仅提升15倍,两者存在巨大的供需剪刀差。通过算力集群优势突破单点算力性能极限,成为满足日益增长的海量算力需求的重要途径。然而,简单地扩大集群规模并不能直接带来集群有效算力的线性增长。因为集群的有效算力除了受限单卡算力和集群规模外,还受到“算力效率”和“算力可用率”这两大核心因素的制约。其中,“算力效率”主要依赖于网络吞吐率,而“算力可用率”则取决于网络的可靠性。因此,提升网络吞吐率和可靠性,是实现算力充分释放的关键。
但在实际AI计算场景中,流量特征表现为流数较少、每条流的数据量较大。使用传统静态Hash算法时,网络节点仅基于本地视角选择流量路径,容易导致链路负载不均衡,整网吞吐率往往仅达50%,从而严重影响大模型训练的效率。
此外,大模型训练周期长,且对故障容忍度较低。网络作为业务流量的交换中枢,其可靠性直接关乎整个集群系统的稳定性。但在大规模集群训练任务中,数以百万计的元器件在高负荷下运转,固有的硬件失效率与庞大的器件数量导致硬件故障频发。以光模块为例,由于常年运行在65℃左右高温,年失效率高达6.3‰,平均每3天便因光模块故障而引发一次训练中断。因此,提升网络的可靠性和故障恢复速度,是当前亟须解决的问题。
星河AI数据中心网络,通过升级算力效率和算力可用率两大关键能力,使能AI算力的高效释放。
一是算力效率升级。NSLB网络级负载均衡算法持续增强,从支持单任务演进到复杂的多任务场景,并实现三层组网超大规模集群下整网吞吐率提升到95%以上,让模型训练效率再提升10%。
二是算力可用率升级。全新推出的星联系列光模块结合独家光模块通道抗损技术,将光模块故障率从千分之6.3降低到万分之4,整网可靠性提升10倍以上。同时,创新闪启技术可保障设备单点故障集合通信不断链,AI训练月级不中断。
星河AI网络安全:AI赋能安全检测,守护智能化基础设施安全
科技如同一把双刃剑,AI技术亦是如此。攻击者利用AI技术快速识别系统漏洞、高效开发攻击代码,相较于传统病毒简单的复制和变异传播方式,AI时代的病毒呈现出高变种、高逃逸以及自动化生成的新特性。据国际知名反病毒测试机构AV-Test的统计数据显示,当前每日新增的病毒数量高达33万,年增量更是数以亿计。这意味着,传统基于特征签名检测的安全防护手段已经失效,企业抵御网络安全风险的难度及成本显著增加。将AI技术融入网络防御体系,实现“以AI对抗AI”,成为当前网络安全防御领域内最迫切的诉求。
华为星河AI网络安全,通过跟踪现网全量流行病毒家族,推理出未知病毒检测、加密流量检测、恶意域名检测、恶意URL检测等18个AI安全小模型,实现未知威胁检测率领先业界14%。同时在设备侧,依托华为独有的AI core和自研操作系统能力,将AI模型下沉到防火墙等设备,实现微秒级AI推理,安全与体验双保障。
在海外某互联网服务商的POC测试中,基于瑞士权威非盈利安全组织Abuse.ch公开病毒库,华为以未知病毒检测率91%脱颖而出,赢得客户信任。
全面智能化的时代已然来临,构建一张领先的数据通信网络已经成为提升企业竞争力的关键一环。华为愿与行业客户和产业伙伴一起,深入行业场景,共同探索新架构、联创新技术、把握新机遇,共赢智能未来。