科研人员变身数据科学家 大数据成天津大港油田“找油利器”

ZDNet至顶网软件频道消息:在一般人的印象中,油田与科研之间似乎划不上等号,再把油田与1000名科研人员联系在一起,很多人会问:这些科研人员在油田中的作用是什么?作为一名对油田不太了解的IT记者,我也有这样的疑问。为此,ZDNet记者近日专门采访了天津大港油田信息中心数据管理部主任范德军。

1000这个数字,是天津大港油田科研人员的规模。在范德军看来,与公司3、4万名职工数相比,科研人员比例并不高,但是他们的作用却非常大。大港油田信息中心负责整个油田信息化建设,而为科研生产提供好的信息化支持,是超脱管理之上的重要业务职能,因为勘探开发永远是油田的核心任务。在当今大数据、云计算时代,这些新技术同样可以变为油田科研人员手中的“找油利器”,让他们成为出色的数据科学家。因为数据对于油田的重要性之高,超乎我们的想象;而数据科学家能够给油田勘探、生产带来的价值,可能会在很短时间内呈现几何级数增长。为了让这一切成为现实,天津大港油田采用IBM Platform Computing,为石油行业走出一条构建在云管理平台之上的大数据应用之路进行探索。

天津大港油田信息中心数据管理部主任范德军

传统石油勘探数据的获取耗时耗力
对于石油行业来说,石油勘探开发中的科研工作是一项多学科协作的智慧集结。石油勘探开发流程包含很多步骤:第一步是地震处理,也就是收集地震波信息;第二步是地震解释,用于了解地层底部结构;第三步是测井评价和地质建模,也就是根据地震波了解到的地层情况构建模型;第四步是制定数据模拟开发方案。在石油勘探开发整个过程中,有了采集到的数据,只有通过石油行业专业软件,再综合人的经验和对地层的认识,才能最终找到原油并决定在哪里打井。

天津大港油田信息中心有两个主要机房,第一机房服务于勘探科研生产,第二机房部署管理类系统。机房位于这个大楼中。

在这一整套流程中,数据的采集、获取、建模的最终目的,是让科研人员正确找到井位,并且还能估计出井的产能。但是范德军告诉记者,有时候一个油藏描述项目却要用三到四个月的时间来准备数据。“以我港东油田某区块为例,我们初步计划先打五口井,相应就需要研究这个油田是否满足打井条件。这时候收集地震处理、地震检测、测井数据以及井名、井深和井坐标就得花费三到四个月的时间;而如果再要把这些数据整理并录入到软件里,还需要一个科室人员的投入,而单单整理数据就占用了科研生产三分之一左右的时间。”

传统的数据收集整理方法不仅仅耗时耗力,而且石油行业软件都是大型专业软件,架构庞大、技术复杂,一般部署在Unix或者Linux操作系统上,底层采用Oracle数据库。对于科研人员来说,学会使用这些软件难度就非常大,日常维护管理更是难于上青天,毕竟他们不是IT人员,更不懂IT技术,而且单机运行会出现数据无法共享和数据丢失现象,迫切需要考虑一套行之有效的方法。

IBM Platform Computing提高30%科研生产效率
为此,天津大港油田从两年前开始尝试采用IBM Platform Computing搭建一个支撑油田勘探开发科研工作的云管理平台。这个平台是一个面向科研人员的平台,也就是真正把这些科研人员变成数据科学家,让他们通过这个平台寻找和定位井位。

Platform一如它的名字——平台,核心任务是负责对资源进行整合、调度,确保上层应用能够访问底层资源。作为一个平台,Platform Computing实际上跨越了好几个环节,包括数据的整理、数据的存储以及在这之上的大数据运算。在这之中,Platform Computing要充当管理职能,为这些系统提供快速响应以及合理、高效的应用。

就Platform Computing在天津大港油田的运用来看,据范德军介绍,今年天津大港油田计划通过Platform Computing收集、分析数据,从而支持开采100口井,从而支持油田每年500万吨油气当量的产能。为了支持庞大的数据管理、存储和分析,其实Platform Computing构建了一个云管理平台,云的特点包括灵活、可扩展和高效,这些特点被Platform Computing发挥到最大。

信息中心拥有既懂信息技术又懂专业技术的专门人才,依托Platform Computing的云管理平台,把石油勘探开发的研究人员从计算、硬件、存储、软件等繁琐并且不擅长的IT问题中解放出来,专攻科技。科研人员只要明确提出需要在哪个区块进行研究工作,信息中心就可以马上为该科研人员提供工具,做到协同研究环境中的统一管理。这样一组数据可能更有说服力,据范德军介绍, Platform Computing投入生产运行之后,科研生产效率提高30%左右;鉴于油田勘探开发生产涉及的专业特别多,实际上个别专业科研生产效率提升了10倍。

而具体到数据分析业务,哈里伯顿(Halliburton Company)、斯伦贝谢(Schlumberger)等行业软件基本上占领了石油行业软件市场,这些软件虽然本身带有数据分析功能,但是应用复杂并且信息无法共享,而Platform Computing提供了一个硬件资源、软件资源和数据资源集结的高性能计算平台,也让石油行业的数据分析业务取得质的飞跃。

成石油行业第一个协同研究云“尝鲜者”
天津大港油田信息中心目前拥有500人,具体从事信息化工作的人员数量在220人左右。信息中心有两个主要机房,第一机房服务于勘探科研生产,第二机房部署管理类系统。服务器节点达到近500台,总存储空间3个PB,机房面积在2000平米左右。单从人员数量和机房规模来看,天津大港油田信息中心并没有“豪华”配置,但是在石油行业,它却是第一家将协同研究云用于勘探科研生产的单位。

天津大港油田信息中心机房服务器节点达到近500台,总存储空间3个PB,机房面积在2000平米左右。

从2008年开始,天津大港油田着手从虚拟化开始建立云平台,目前搭载了三个云:一个是以虚拟化为基础的基础设施云,目前可以提供200多套业务应用系统;第二个是桌面云,应用于机关部门人事、财务和党群员工的电脑桌面;第三个云,称为协同研究云,其重点在于支撑勘探科研生产工作。

协同研究云的最主要目的就是勘探科研生产工作,通过云管理平台的搭建,更好地把硬件资源集中起来。而勘探开发研究的专业软件调用的数据量特别大,建立模型非常复杂,运行速度会比较慢。云管理平台的工作原理在于,对硬件资源进行集中管理,根据不同业务需要来高效合理地分配资源,整个后台是一个统一集群,其上的硬件资源是浮动的,通过灵活的资源调度来支持扩展的应用。

提及对Platform Computing的选择,在范德军的介绍中记者得知,也经历了一个考验期。天津大港油田对开源产品一直报以非常开明的态度,在高性能计算方面,先后对Cluster Resources的Moab、Sun Grid进行了详细测试,而最终决定采用Platform Computing 的原因,还是基于Platform Computing作为成熟商业产品的优势:开源系统二次开放成本会比较高,而且需要一个持续较长时间的开发周期,而天津大港油田偏向于选择能够即刻投入到实际工作中去的产品,而且不需要投入精力进行漫长的开发。

在IBM收购Platform之后,其实已经改变了Platform Computing单纯作为一个软件产品的产业形态,IBM把Platform Computing并入硬件部门,这也就意味着Platform Computing在软硬件优化方面有着极大的优势,也被赋予重大的责任。Platform Computing并不是一个单一软件,称其为家族产品可能更合适,共包括上中下三层,三层实现协同。下层是基础设施层,由云管理平台来统一管理物理机和虚拟机共存的云环境,这是Platform的优势;中间层是应用调用层,IBM在这里做中间件的管理,负责整个作业的派发、调度、资源管理;再上一层就是最上层的应用层,各式各样的应用软件与中间层形成一个集成,使用底层由云平台提供的计算资源。

在记者看来,Platform Computing有三大优势:首先,完整性,整个大数据平台从设计开始是一套完整的系统,是集成化的;其次,性能。IBM的大数据平台在实时响应、快速处理等方面有严苛的要求;最后,是容易被大家所忽略的,那就是整个系统的开放性和兼容性。Platform Computing的设计理念就是一个跨平台的、面向不同应用的产品,众多应用场景、分析软件都跑在Platform Computing平台上,系统的开放性、兼容性非常好。

结束语
其实在很多时候,IT厂商所提供的产品或者解决方案必须要兼顾客户的成长,一成不变也就意味着保守和缺乏创新。在采访最后范德军表示,虽然选择Platform Computing的原因在于其比开源产品更加成熟以及稳定,但是这并不意味着开源就不好。天津大港油田IT专业人员的技术水平越来越高,而石油行业需要的支撑本行业的专业软件也非常多。Platform Computing在开放接口方面能否更加open甚至做到开源,给予石油行业用户更多基于Platform Computing进行二次开发的机会?这或许是成长中的客户,给予Platform Computing在未来的挑战。

原文发布时间为:2014年09月24日

本文作者:张晓楠

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2025-01-25 02:45:08

科研人员变身数据科学家 大数据成天津大港油田“找油利器”的相关文章

数据科学家大调查:职业受挫数据多样性,吐槽Hadoop

经过无数权威媒体的反复轰炸,我们大致已经相信,数据科学家是21世纪最神秘最性感最多金的职业,他们是大数据时代数据炸弹的拆弹专家,企业数字化经营的发动机,他们的身价堪比NFL四分卫,而且,他们比昆仑山上的雪豹数量还少. 显然,数据科学家个个都是十八般数据分析武艺样样精通的绝世高手,但他们近来也有烦心事.不久前,开源数据库SciDB开发商Paradigm4进行的一项针对111名北美数据科学家的调查显示,71%的数据科学家认为数据来源的多样性(IT经理网记者此前曾与百度创始七剑客之一,酷我音乐CEO雷

数据科学家大减价:一小时只收30美元

你有没有想过雇佣一个数据科学家为你工作,也许你还认为雇佣数据科学家的成本会让你难以承受,事实上,数据科学家已经逐渐转变为经济适用型人才了. 数据科学家大减价:一小时只收30美元 Vincent Granville是一个数据科学家,一次偶然的机会,他发现一些专业数据分析人士在自由职业者网站Elance上寻求一份30美元一小时的工作,近期他在数据科学中心网站上发布的一篇博客详细描述了这一事件. 这个求职者叫Andrew Collier,他在Elance简历上称自己是数据科学家,期望自己的工资最低为2

品《阿里巴巴大数据实践-大数据之路》一书(下)

今天继续谈阿里的这本书,包括数据服务平台.数据挖掘平台.数据建模.数据管理及数据应用,希望于你有启示. 1.数据服务平台 数据服务平台可以叫数据开放平台,数据部门产出海量数据,如何能方便高效地开放出去,是我们一直要解决的难题,在没有数据服务的年代,阿里的数据开放的方式简单.粗暴,一般是直接将数据导出给对方,我想,现在大多公司的开放应该也是如此吧,虽然PaaS喊了这么多年,但真正成就的又有几个? 即使如阿里,在数据开放这个方向上的探索和实践,至今也有7个年头了,任何关于数据开放毕其功于一役的做法都

大小数据 | 辨析大数据价值与小数据洞察

大数据技术的出现带给人们的思维方式.行为方式.媒体传播方式及社会治理方式等都诸多方面带来了革命性的变革.<大数据时代>一书的核心观点是说:"在大数据时代,我们正经历着一场生活.工作与思维的大变革. 我们没必要非得知道现象背后的原因,而是要让数据自己发声."在大数据时代,相关关系能够帮助我们更好地了解这个世界,建立在相关关系分析法上面的预测是大数据的核心,通过找到"关联物"并监控它,我们就能够预测未来. 作者还提出了"大数据三原则":要

小数据:解决大数据难题的“良药”

当前,随着大数据日渐炙手可热,大数据的应用也在逐渐深入,然而,围绕大数据的争论却从未停止过,依然非常激烈.其中一个原因就是,尽管前景美好.潜力巨大,但在"大体量"数据利用及实现商业价值的过程中往往充满挑战.非常棘手. 如首先,需要强大的机器和经验丰富的数据科学家将原始信息及庞大数据转化为洞察力.在这个过程中,如何去分配正确资源,并跨部门和学科去释义这些信息都非常困难.而当我们从数据中抽离出洞察见解之后,下一步该如何去利用这些洞察也一样充满困惑. 那么,在目前阶段,该怎么办呢?笔者认为解

大数据时代的“找油利器”

能源行业迈入大数据时代 随着数据总量的持续增长和急速膨胀,大数据时代已经来临,石油.电力等能源细分行业纷纷拉开了大数据开发应用的序幕.如何从海量数据中高效获取信息,有效地深加工并最终得到有用数据是能源企业涉足大数据的目的. 对石油行业来说,众多企业正在把更多的新技术应用于战略决策.科技研发.生产经营和安全环保等各个领域,目的是为了从大数据资源中挖掘更多的财富和价值.大数据应用是石油行业信息化深入.IT与业务深度融合的必然趋势,在我国石油石化行业应用的前景将越来越广阔.随着石油储备的逐步减少,石油

数据说 | 大数据企业的汇总信息

名称 涉及领域 核心业务 投资机构 投资机构 投资机构 投资机构 金额(人民币) 轮次 美林数据 算法/分析/模型/可视化 数据分析,数据集成与管控,数据应用开发 未披露       新三板   惠辰资讯 算法/分析/模型/可视化 数据洞察,大数据技术,数字化时代的市场决策支持 未披露       新三板   有米 数据获取/存储/云处理等 产品推广和品牌营销 未披露       新三板 上市 寻英网 其他应用 大数据招聘平台,实现人才与企业职位的精准匹配 未披露       未披露   大贤科

中国科学院院士怀进鹏:大数据及大数据的科学与技术问题

第五届中国云计算大会于2013年6月5-7日在北京国家会议中心拉开帷幕.本次大会以国际视野,洞悉全球云计算发展趋势,并从应用出发,探讨云计算与大数据.云计算与移动互联网.云安全及云计算行业应用等焦点话题.大会还特别设立了云计算服务展示区域,交流国际云计算最新研究成果,展示国内云计算试点城市发展成就,分享云计算发展经验,促进全球云计算创新合作. 中国电子学会云计算专家委员会候任主任委员.中国科学院院士 怀进鹏 在第五届云计算大会第二天的演讲上,中国电子学会云计算专家委员会候任主任委员.中国科学院院

“厚数据”,大数据的下一站

作者:王圣捷(PL Data公司创始人,她是名全球科技人类学家,也曾是 IDEO 上海的一名驻地专家) 当前,全世界各种规模的公司都在被告知需要大数据 -- 大数据是驱动下一轮创新的源动力.风投公司专门确立针对大数据的投资组合,初创公司对外宣称自己是 "大数据" 公司,成熟的巨头企业会成立专门做大数据项目的数字创新团队.面对先进的计算数据收集和分析能力,许多初创公司和大型企业不惜以牺牲人的洞察为代价,过度地专注于收集定量数据.这种把定量数字凌驾于定性洞察之上的做法着实令人担忧.我就曾亲