本站点使用cookies,继续浏览表示您同意我们使用cookies。Cookies和隐私政策

中国石化石油物探技术研究院,携手华为,开启能源勘探新时代

中国石化石油物探技术研究院携手华为,建立了更高效、更经济的数据分析处理平台。

文/中国石化石油物探技术研究院高性能计算高级专家 王永波
2021年05月

随着全球石油资源消耗的逐年攀升,石油和天然气行业已经成为HPC(高性能计算)最大的应用和创新行业之一。如何使用HPC找到更多的油层,提供更精准的井位建议,成为引领物探技术研究的创新方向。

Winwin 38

中国石化石油物探技术研究院(以下简称“物探院”)携手华为,基于OceanStor海量存储打造的高性能计算平台,开启了数据找油新时代。

Winwin 38

油气勘探的基本流程

油气勘探包括野外地震资料采集、地震资料处理及地震资料解释3个环节。

在野外资料采集环节,主要采用人工地震的方法——人工放炮或使用震源车产生人工地震,通过收集从地下返回的地震波,形成野外观察数据。

在地震资料的处理环节,需要通过HPC对观测数据进行信号处理,形成能够反映地下地质特征的数据体。

在地震资料解释环节,通过技术人员对数据体进行分析研究,寻找油气聚集区,并提供井位建议。地震资料解释完后,地质专家可以根据生成的地质构造图来确定哪个地方有油、储量多少、是否值得开采、开采打井位置等信息。

Winwin 38

油气勘探的瓶颈所在

油气勘探就好比给地球做CT,采集的数据越多、处理得越精细,对地下地质结构的了解就越准确,找到油的可能性就越大。通过不断优化HPC技术,在海量数据中更高效地发现油藏信息,是物探院及整个行业孜孜以求的目标。

油藏勘探的数据有如下特点:

首先,地震资料采集的数据量非常大,单体原始数据一般为几十TB,最大可达PB级。而且处理过程的中间步骤繁多,在数据处理过程中会产生大量的临时文件和中间结果数据,因此需要为一个作业分配超过原始数据10倍的存储空间。

其次,地震资料处理的流程多、I/O频繁。地震资料处理的一个流程有几十步,其中可能还有反复的迭代,涉及多达400个软件模块。作业在运行过程中,这些模块需要频繁地交换数据,给内置磁盘和外部存储带来了巨大的读写压力。

第三,地震资料处理的计算量大且周期长。不仅涉及串行的作业,也涉及大量计算量大的并行作业,且一次计算任务需要数周不中断地计算,对可靠性有极高的要求。

近年来,随着采集精度的逐年提升,传统数据处理系统的问题开始凸显:首先,分散的建设模式形成了多个数据烟囱,数据需要在不同的计算集群间重复拷贝,影响了整体数据的处理效率;其次,资源的隔离导致数据无法充分共享,资源利用率低;此外,I/O处理能力逐渐成为瓶颈,导致CPU等待时长持续攀高,无法充分发挥算力的优势。

Winwin 38

基于全分布式架构的数据处理解决方案

为了解决当前地震资料数据处理过程中存在的问题,物探院选择了携手华为,基于OceanStor海量存储建设了融合共享的地震资料资源池,以打造出更高效、更经济的数据分析处理平台。

存储层对于地震资料处理非常关键,计算的速度远远高于磁盘的读写速率。对于物探院来说,整个地震资料处理过程中有35%以上的时间是在做数据的迁移和转换,因此大带宽、低时延的存储层成为提升勘探效率的关键。而通过OceanStor海量存储的大带宽、低时延存储能力,大幅降低了I/O等待时间,提高了计算集群CPU的并行处理效率,使CPU的利用率稳定在60%以上,最终缩短了数据分析时间16%以上。

采用基于去中心化架构的OceanStor海量存储,实现了存储资源的整合与共享,不仅将机柜数降低了40%,整体TCO节省30%,并且可以匹配未来5~10年的数据扩展需求。

此外,OceanStor海量存储采用的N+M弹性EC数据保护模式,允许M台存储节点同时故障,且可以自动缩列,极大地增强了数据的可靠性,为地震的长周期处理提供了持续性保障。

目前,石油行业正面临数字化浪潮带来的大变革,油气勘探领域是新兴科技的试验场与磨刀石。油气地震勘探数据具有明显的大数据特征,既有流式处理,也有非流式处理;既有结构化数据,也有半结构化和非结构化数据,非常适合作为石油行业与新技术融合的先行者。未来,大数据和AI技术将广泛应用到能源勘探领域,进一步提升勘探的效率,通过数据的碰撞和算法的训练,来提升对于油层、井位、储量的预测,将油气勘探带入一个新时代。