本站点使用cookies,继续浏览表示您同意我们使用cookies。Cookies和隐私政策

敢为人先,中国银行探索新一代存储网络

业界首个新一代智能无损存储网络,为中行的联机交易等生产系统带来了三大升级。

文/转载金融电子化
《华为技术》第89期

目前,金融行业的变化已经深入影响到每个人的日常生活,从大家习以为常的移动支付,到正在进化中的数字货币、无实体银行等,人们的金融消费习惯正在被数字技术所改变。金融科技作为商业银行高质量发展及数字化转型的重要驱动力,深刻改变了银行业的经营模式,云计算、人工智能、大数据、5G和区块链等新技术的出现,将为银行的未来发展提供更多可能。

早在2018年,中国银行(简称中行)就发布了《科技引领数字化发展战略》,将科技引领数字化发展置于新一期战略规划之首,以加快打造用户体验极致、场景生态丰富、线上线下协同、产品创新灵活、运营管理高效、风险控制智能的数字化银行。

这一时期,金融科技背后IT基础设施的重要性日益凸显,前端需要提供的数字化、个性化服务越多,对后端的计算能力、稳定性与灵活性要求就越高。基于此,通过全面云化和分布式架构,实现主机下移等金融IT基础设施的重构,就成为中行实现未来发展的必由之路。

深化科技改革,坚定开启生产系统新一代存储网络建设

随着金融业务的不断深化,金融科技在经历了电子化、网络化之后,逐步迈入数字化、智能化发展的新阶段。在金融全面数字化、智能化的新时代,金融IT基础设施的科技改革,不仅聚焦于金融云、大数据、AI等热点技术的投入,也对核心账务联机交易业务等传统生产系统的基础设施,提出了自我建设与求新求变的新需求。

高速稳定的业务数据存储及同城数据实时容灾备份一直是金融IT生产系统中高可用的关键场景,中行在通盘梳理了IT基础设施架构后,敏锐识别出金融生产系统中基于FC(Fibre Channel光纤通道协议)封闭技术的传统数据存储已进入变革的窗口期,因此,在银行业内率先开启了新一代存储网络的创新建设。

新一代存储网络的创新研究主要受益于以下三方面的变革驱动:

首先,业务增长驱动了存储网络的变革。2020年前9个月,中行在保持对公客户数量持续稳步增长的同时,普惠型小微企业贷款及个人金融等业务均取得了可观的增长,业务覆盖全球62个国家和地区,手机银行等线上交易业务快速发展。这主要得益于中行深化了科技与业务的融合,强化了科技对业务发展的赋能作用,也显示出中行经营模式的变化。

业务变化的背后是计算及存储服务器指数级的增长和各类交易系统数据TB级网络流量的增长。数据显示,中行业务系统同城数据的日均备份量已由2018年的500TB提高到2020年的PB级,连续三年年均增长超30%。中行基于分布式架构的“多地多中心”数据中心布局及海量数据在中心内、中心间的高速交互,均使当前以FC-SAN 8/16G为主流速率的存储网络面临巨大挑战。

其次,技术发展驱动了存储网络的变革。技术发展包含存储介质及存储协议两个方面。

目前,存储介质已从机械硬盘(HDD)发展到固态存储(SSD),全方位提升了网络的存储性能:包括IOPS每秒读写能力提升了100倍,时延从2ms到0.2ms降低了10倍,年失效率降低5倍,能耗降低了87%等等。

存储介质性能的百倍提升,驱动了存储协议从传统串行SCSI协议发展到高速并行的NVMe协议。为了保证全闪存NVMe协议高吞吐、低时延的特性,在远程直接存储读取(RDMA)场景下,新一代存储网络需满足零丢包、低时延及高吞吐的要求。

最后,简化管理驱动了存储网络的变革。金融IT基础设施全面云化的发展趋势已势不可挡,目前,互联网金融、移动金融、大数据分析等业务均已实现了云化,而联机交易等核心业务因FC-SAN存储网络的系统及协议较为独立,因此在业务灵活上云及大规模自动化部署、管理方面,不仅实现复杂,难度大,且运维成本也较高。同时,由于同城跨DC数百条8G/16G FC链路占用了昂贵的波分传输通道,也进一步提升了成本。

此外,FC-SAN技术较封闭,全球仅有两家美国公司可以提供相关产品,不仅采购来源单一,建设维护成本较高,更难以保障关键生产系统自主可控的要求。

业界首个新一代智能无损存储网络,为生产系统带来三大升级

中行“RoCE-SAN”是业界首个基于标准以太IP网及开放的RoCE(以太网远程内存访问)协议打造的新一代智能无损存储网络。

如图1所示,新一代智能无损存储网络“RoCE-SAN”采用华为CloudEngine数据中心交换机和OceanStore Dorado全闪存架构,结合中行具体的应用场景,实现了智能缓存管理、逐流精准控速、故障高可用秒级切换的技术创新突破,满足了金融企业对高可用存储网络的需求。

中国银行,存储网络

图1 新一代智能无损存储网络整体架构

2020年11月20日,基于“RoCE-SAN”架构的应用项目管理平台及应急运维管理平台的成功投产上线,标志着中行自主可控的新一代无损存储网络正式投入生产运行。

新一代智能无损存储网络为中行的联机交易等生产系统带来了三大升级:

第一, 高性能、高可靠。

首先,新一代智能无损存储网络实现了25GE接入、100GE上行,同时具备100GE接入、400GE上行的平滑演进能力。网络容量大、带宽足,可充分发挥全闪存百万级IOPS的优势,以满足未来存储数据容量PB级发展的需求。同时,新一代存储网络突破了以太网超长距传输反馈慢的缺陷,不仅可实现跨数据中心间(>50KM)的长距无损传输,且通过智能算法提升了数据中心间专线带宽的利用率,降低了使用成本。在相同场景下,对比FC-SAN,新存储系统的整体吞吐性能最大可实现85%的提升(见图2)。

中国银行,存储网络

图2 RoCE与FC的效能对比

其次,新一代智能无损存储网络可充分发挥网络的流量智能识别、主动差异化控制等价值,在拥塞场景下拥有更大的带宽利用率及更低的平均时延,与FC-SAN相比,其最高可将流量突发导致的拥塞时延降低50%(见图3)。 

中国银行,存储网络

图3 256KB数据块时延变化

最后,在网络故障的场景下,交换机可快速感知主机、存储及网络的状态变化,并通报主机进行多路径切换,使端到端的切换时间小于1秒,确保了系统的高可靠。

第二, 自主可控,开放生态。

新一代智能无损存储网络采用通用以太网交换机构建,基于IP和RoCE通用存储网络协议运行,不仅有效提升了核心生产系统存储网络的标准化及开放性,更进一步提升了核心生产业务自主可控的能力。

此外,新一代智能无损存储网络能够与业界主流的OS进行协同对接,可基于标准开放的API与更多第三方伙伴共建场景化服务,共同打造生态圈。

第三,灵活上云。

新一代智能无损存储网络可实现数据中心内SAN网络与普通业务场景LAN网络的无缝对接及混流运行,在将存储服务器云化的同时,降低了管理的复杂度和运维成本,提升了整个IT基础设施的自动化水平和业务敏捷性。

同时,新一代智能无损存储网络可提供100G接入/400G转发的高性能组网,以有效满足分布式架构云平台下数万台存储服务器的大规模部署。

未来,中行将按照“稳定可靠、智能高效”的原则持续推进新一代智能无损存储网络的能力建设,通过异地长距传输、数据在线压缩等能力的构建,支撑中行“多地多中心”打造完整的数据容灾系统。

运用新科技,打造新时代全球一流银行

在众多业内人士看来,目前,我们正在步入“洞见力时代”,如同柏拉图《理想国》 中的洞穴隐喻所昭示的那样,只有坚持走出原有舒适区,才能发现崭新天地。

中行以数字化银行为主轴、以金融科技为抓手,打造的新一代“RoCE-SAN”智能无损存储网络目前已初现成效,鉴于新一代智能无损存储网络属于全新的技术领域,因此,虽然中行已跨出了艰难的一步,但后面的路还很长,还需要不断探索总结,一步一个脚印地持续建设和完善。

新一代智能无损存储网络是中国银行敢为天下先,面向未来发展取得的一项重大突破,也是对金融行业存储网络建设的又一次创新和探索,该系统的成功搭建,为整个金融业、银行业的IT架构发展演变提供了准确、详实的路径参考。

中行将在此基础上夯实金融业务系统的数据底座,在支撑智能化、数字化的建设和转型的同时,持续建设新时代的全球一流银行!