大数据时代的“找油利器”

能源行业迈入大数据时代

随着数据总量的持续增长和急速膨胀,大数据时代已经来临,石油、电力等能源细分行业纷纷拉开了大数据开发应用的序幕。如何从海量数据中高效获取信息,有效地深加工并最终得到有用数据是能源企业涉足大数据的目的。

对石油行业来说,众多企业正在把更多的新技术应用于战略决策、科技研发、生产经营和安全环保等各个领域,目的是为了从大数据资源中挖掘更多的财富和价值。大数据应用是石油行业信息化深入、IT与业务深度融合的必然趋势,在我国石油石化行业应用的前景将越来越广阔。随着石油储备的逐步减少,石油石化行业产业链中的勘探、开发难度日益增大, 信息化的成熟度已经成为影响行业增长幅度的首要因素。精准、快速的地质勘测成为世界能源巨头们倚重的核心竞争力之一,其中高性能计算技术和大数据技术的应用是关键因素。

油气勘探海量数据处理需要高性能计算   

目前在石油勘探中最常用的是地球物理方法。地球物理方法是使用现代物理方法进行地质勘探的方法,包括电法、磁法、重力法、放射性法、地震波法等,其中以地震波法最为重要。为了了解和模拟出地下数千米的地质构造,通过地震波反射方式来收集海量数据,一般二维数据可达1~2TB,三维数据可高达几百TB甚至PB级, 然后进行大量的密集计算和模拟,计算结果出来后还要转换成直观的可视画面,方便专家对数据进行解释,为油气钻井定位提供参考。因此,这些海量数据的处理只有借助高性能计算才能实现最佳的勘探效益,这也是在石油勘探领域高性能计算需求的主因。

由于石油勘探行业的特殊性和复杂性,石油勘探对高性能计算提出了非常苛刻的要求。过去十年中,石油勘探计算处理多采用大型机或高性能计算机,但目前高性能计算机系统在计算性能、系统建设与运行成本等方面已经面临着许多问题。让石油勘探企业感到颇为头痛的问题主要集中在三大困境:一是计算能力需求和CPU处理器性能落差越来越大,目前通过不断提高CPU处理器的工作频率来提高计算性能的技术路线已经逐步走向其极限;二是石油勘探高速增长的数据和存储扩容越来越不匹配;三是能耗制约越来越严重,高性能计算机的体积大、耗电多等弱点以及对庞大的计算机房空间需求、空调需求和用电量等已经成为石油勘探数据处理的一大挑战。

地震资料数据的大数据特征

BGP(中国石油集团东方地球物理公司)是中国石油天然气集团公司独资的地球物理专业化技术服务公司,主要从事陆地、浅海地震勘探采集、处理、解释及物探装备和软件研发,业务分布在全球34个国家,陆上地震勘探市场份额居全球第一位。现拥有2.6万员工,3000多IT人员和300多软件开发人员,在全球有23个处理中心,约9万CPU核和80万GPU核,运算能力约2PFlops,存储容量超过25PB。

中国石油集团东方地球物理公司研究院的总工程师赖能和先生曾在华为云计算大会2013上做了《大数据技术在石油勘探领域的应用》的主题演讲,对地震海量数据的采集与处理过程做了详细阐释。

石油勘探过程产生的大数据有自己独特的“4V”特征:

1、     数据海量:以BGP为例,每天会产生大于7TB的生产数据,在地震资料处理过程中还会产生大量的中间过程数据。

2、     数据来源单一:地震资料数据是由人工模拟地震波激发,由定点采集仪器接收和采集到的,数据来源和数据格式都比较单一。

3、     计算量大:以BGP为例,54TB的原始数据通过4000个CPU 的计算集群处理,需要50多天时间。

4、     处理流程复杂:地震资料处理过程涉及到频繁的IO和数据库,操作复杂。

地震数据的快速增长对于存储提出了巨大需求,也对传统的HPC软硬件架构提出了新的挑战。

华为石油勘探HPC解决方案实现高计算、大存储能力

针对石油行业的特点和需求,华为提出了石油勘探HPC解决方案,包含以下几个部分:

1、计算集群系统

计算节点和胖节点采用华为刀片服务器,提供强大的计算能力,特别是浮点计算能力,以完成地震资料处理中巨大的计算任务。

2、存储系统

存储部分采用华为OceanStor 9000大数据存储系统(简称OceanStor 9000)。

与传统的NFS和lustre方案不同,OceanStor 9000采用全对称分布式架构,每个节点都可以提供IO和存储单元,提供业务访问、数据处理和存储的能力,因此可以轻松完成节点扩容,实现系统性能和容量的线性扩展。

其全对称Scale-out架构,通过集群模式、自动负载均衡、全局缓存等技术来整合和管理系统资源,有效提升存储系统性能,缩短地震资料处理的作业周期。OceanStor 9000还具备高可靠性和硬件容错能力,保障作业正常运行。它还能提供灵活的组网方式,前后端网络均支持Infiniband或者10GE以太网高速互联,能有效满足石油勘探HPC场景的高带宽、低时延需求

3、网络互联

采用计算网络、存储网络和管理网络分离的方式。计算网络采用万兆以太网,承担并行计算时的数据通讯。管理网络采用千兆以太网,用于HPC集群系统的管理和监控。存储网络采用10GE以太网或40GE的Infiniband网络,为主机访问数据文件提供高速的网络互联。

原文发布时间为:2014年04月15日

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-08-01 12:52:32

大数据时代的“找油利器”的相关文章

大数据时代 谁充当“出卖者”的角色?

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   大数据正在成为一个被广泛传播的话题,它对我们的生活,以及与世界的交流的方式都提出了挑战.约翰•奈斯比(John Naisbitt)在他的成名作<大趋势> (Megatrends)中曾提到:"人类正被信息淹没,却饥渴于知识". 如今"数据"已几近占据了我们的所有.一路走来,人类从原始时代,农业时代,工业时代到信息

科研人员变身数据科学家 大数据成天津大港油田“找油利器”

ZDNet至顶网软件频道消息:在一般人的印象中,油田与科研之间似乎划不上等号,再把油田与1000名科研人员联系在一起,很多人会问:这些科研人员在油田中的作用是什么?作为一名对油田不太了解的IT记者,我也有这样的疑问.为此,ZDNet记者近日专门采访了天津大港油田信息中心数据管理部主任范德军. 1000这个数字,是天津大港油田科研人员的规模.在范德军看来,与公司3.4万名职工数相比,科研人员比例并不高,但是他们的作用却非常大.大港油田信息中心负责整个油田信息化建设,而为科研生产提供好的信息化支持,

院士演讲:大数据时代的位置服务

 摘要: 中国工程院院士李德毅院士为大家带来<大数据时代的位置服务>的主题演讲,李德毅院士同时指出:大数据引发新理念,实践中的研究也许胜过研究中的实践,较多的数据也许胜过较好的算法  以"智慧城市与移动信息化"为主题的"第七届中国电子政务高峰论坛"于2013年6月23日在北京大学英杰交流中心阳光大厅隆重举办.本次论坛由工业和信息化部信息化推进司指导,北京大学信息化与信息管理研究中心主办,中央机构编制委员会办公室电子政务中心.北大CIO班教务办公室协办,C

如果相关不意味着因果,那么意味着什么? ——大数据时代的“因果关系”思辨

[导语]:相关性和因果性之间的联系,从统计学教材到大数据著作,都有着广泛的探讨,甚至争议不断.迈尔舍恩伯格在<大数据时代>里说,"要相关,不要因果",在大数据时代,有相关,就够了.而周涛则在<为数据而生>一书中说,放弃对因果关系的追寻,就是人类的自我堕落,相关性分析是寻找因果关系的利器.想不想听听第三方的观点?下面文字为BuzzFeed首席数据科学家Adam Kelleher观点的部分编译,感兴趣的读者,请阅读原文. 我们知道,相关关系和因果关系,在人们的工作和

巅峰对话:畅想大数据时代的车联网与智能汽车

ZD至顶网CIO与应用频道 01月20日 北京消息:2016年1月20日,数据猿作为独家全程直播与专访媒体,受邀参加"全球大数据峰会 Global Big Data Conference 简称为 GBDC"本届大会由世界O2O组织.全球大数据联盟GBDC.全球移动游戏联盟GMGC.光合资本主办,中国互联网协会O2O工作组.中国汽车流通协会支持. GBDC全球大数据峰会在北京国家会议中心举办,本届大会规模逾3000人.大会从大数据改变政务管理方式.引领全球企业营销.智能交通综合服务.互联

大数据时代传统报业如何占位?

数据再"大"无用武之地等于零,要搜集"慢数据" "活数据" 互联网上每时每刻都在产生数据,人们生活中无所不在的各种设备,比如电脑.手机.智能电器.感应器等等,都能时刻留下人的行为痕迹,实时产生数据,这些呈几何级增加的数据沉淀在网上,成为大数据.这些大数 数据再"大"无用武之地等于零,要搜集"慢数据" "活数据" 互联网上每时每刻都在产生数据,人们生活中无所不在的各种设备,比如电脑.手机.

大数据时代的“最强大脑”

是否想过这样的情景:某一天,当你打开电视看天气预报,发现它能精确地预报明天早上8时你家门口的天气情况. 或者某天你要买房,你再也不用饱受奔波看房之苦,足不出户,只要打开电脑,在一个数字地图上敲入几个关键词,就可以看到房子周边的景色.房子的内在结构.甚至能够体验自己置身阳台所能观看到的景色. 甚至当你走进电影院,看到好莱坞科幻大片<盗梦空间>,你也想像电影里那样,在梦境里轻易模拟出一个现实空间,其逼真程度可以蒙骗那些被"拐"到梦境里来的人,让他们误以为身处现实-- 也许你会说

大数据时代来临

前言:最近读了很多大数据分析的文章,感觉大数据时代来临.哈佛商业评论也开了一个新的栏目叫做"大数据".整理了一下所有收藏并准备记录的大数据分析文章,本文是最适合做第一篇分享的.文章以案例为支持,讲述了大数据分析的4个基本点.文章记录完后,yoyo也根据与英雄联盟数据分析组负责人的聊天,记录一些对大数据分析的思考. http://blogs.hbr.org/cs/2012/10/getting_started_on_a_big_data.html Inspiration: Big dat

中国离大数据时代还有不小距离

摘要: 为了迎接即将到来的大数据时代,各大互联网公司都在争分夺秒.阿里巴巴在公布大数据分享平台之后的半年中,也全面启动了攻势.但即使是这个行业的先行者,离大数据时代也还有 "为了迎接即将到来的大数据时代,各大互联网公司都在争分夺秒.阿里巴巴在公布大数据分享平台之后的半年中,也全面启动了攻势.但即使是这个行业的先行者,离大数据时代也还有不小的距离." 刚刚过去的2012年,秦予有个很大的遗憾,就是没能招聘到自己想要的数据科学家,浪费了公司给的招人名额.他是支付宝用户价值创新中心的负责人.