据史料记载,2000多年前中国就开始用钻井法开采地下石油;公元220年左右开始开采天然气;公元1521年就能从1000多米深的地下开采出石油……然而,当美国人于1896年开始开发海洋油气的试验,1947年在墨西哥湾首次用钢制钻井平台钻出了世界上第一口商业性油井,以及随后在世界范围内涌起勘探开发海洋石油热潮时,我国的海洋石油工业却依然是一片空白。直到上世纪五十年代那个激情燃烧的夜晚!
1956年的一个夜晚,正在观看露天地影《海上巴库》的莺歌海渔民神经被触动了:既然巴库附近海面上那嘟嘟冒出的气泡是宝贵的石油、天然气,我们莺歌海不也有同样的"宝贝"? 于是,油气苗,莺歌海面上那个汩汩跳动的气泡便伴随着一路莺歌,走向广州,走向北京。中国海洋石油这部雄伟壮观的戏剧就这样拉开了序幕……
发展到今天,人们已经开始普遍利用超级计算机来寻找和开发海洋里的石油宝藏。地震数据处理就是石油物探中非常关键的一个环节。日前,中国海洋石油东方数据处理中心和南海西部计算中心就分别采用了两套曙光4000L超级计算机来构建位于塘沽和堪江的两大地震数据处理系统,一个面向渤海,一个面向南海。
超级计算机,走向海洋
中海油的历史就是一部中国海洋石油工业的历史。而高性能计算机是这部历史背后的"幕后英雄"。基于LINUX的高性能计算机主要用在盆地模拟、地震资料处理和油藏数值模拟等三大领域。地震数据处理因为数据量大、计算量大等行业特点,成为高性能计算机这一超级武器威力四射的舞台。
人们通过汽枪、放炮等人工手段获得原始的震源,由检波器在分布于震源附近的检波点定时收集一系列脉冲信号,从而采集到大量原始的地震波信号。随后把海量数据输入到超级计算机里,运行帕拉戴姆、CGG、OMEGA、Landmark、GeoEast等地震资料处理软件,经过常规处理以及叠前偏移等过程,最终得到一个地震剖面图。然后由经验丰富的地质专家通过解释地震剖面图,得到地层的构造情况,从而为石油和天然气矿藏的识别提供依据。其中地震资料处理的过程,因为数据量、计算量和通讯量都很大,所以对计算机的存储能力、计算能力和I/O通讯能力都提出了很高的要求。而这正是高性能计算机的擅长之处。
在我国,曙光公司生产的高性能计算机是国内石油领域应用最广、装机量最多、应用最普及的产品。经过多年发展,曙光的PC Cluster技术已经非常成熟并具有很强的并行化处理能力,而且比国外的产品具有更高的性价比。曙光4000L是曙光和国家智能计算机研究中心联合开发的面向网格的超级计算机。依托曙光成熟的技术、深厚的应用经验积累以及国家智能计算机研究中心强大的技术研发实力,采用IA机群架构的曙光4000L凭借其超强的数据处理能力、高效的处理速度、高可用性以及对多种成熟高端技术的融合,当之无愧地成为石油领域高性能计算机的杰出代表。
曙光高性能计算机的应用不仅使用户可以把叠前偏移等以前的非常规处理程序当作常规处理来对待,而且可以满足现在物探行业测线加密、精度要求增加等更高的需求,这是高性能计算机给地震勘探带来的飞跃,使构造地质分析、井位确定更准确,不仅节省了资金,而且加快了石油勘探的步伐,提升了效益。
超级计算机,有容乃大
为了提高处理精度,测线间距越来越小,而采样点则越来越多,导致采集到的数据量也越来越大,有时一个文件就有200~300GB甚至更多;叠前深度偏移等算法的出现使得CPU资源的耗用越来越多;随着计算能力的提高以及物探行业竞争的加剧,客户对处理中心要求的数据处理周期也越来越短;而石油勘探领域的拓展和深入,也导致处理中心会遇到越来越多的复杂地质构造。而且由于并行用户和任务非常多,对I/O的要求也很苛刻。各种因素的变化对石油物探企业的综合竞争能力提出了更新更苛刻的要求,同样也催生了背后高性能计算技术和产品的发展和成熟。
曙光4000L对于石油勘探的海量数据处理任务,能够很好的提升地震处理的速度,并且具备高度稳定性,从而更好的满足石油行业对于先进技术要求高、变化快的特性。4000L在海量数据的计算、存储、通讯、管理和监控方面已经形成自己的特色。其强大的"在线"扩展能力,可以在保障整个系统应用稳定运行的前提下,及时发现并解决问题,维护系统和数据安全,动态扩展系统的配置。同时曙光提出的数据密集型算法,可支持文件的快速检索和浏览,在密集型科学计算领域如石油行业的数据处理、全3D可视化体解释、油藏模拟、存储管理等方面广泛应用。
地震数据传输和处理的并行,对网络性能也提出了很高的要求,I/O通讯能力也往往成为制约系统效率发挥的一大瓶颈。但一味地增加I/O节点数并不是一个很好的办法。为了解决这一问题,曙光的技术工程师除了对系统进行很多优化外,还在石油行业首创了"双网卡绑定"的做法,通过将两个1000M的网卡绑定使用,使单个I/O节点的带宽增加了到了2G。
LINUX集群系统,凯歌高奏
为了解决海量处理问题,人们曾经使用过主机带阵列机、向量计算机和大规模并行计算机。目前国内数据处理生产使用的系统一般包括有IBM、HP、SUN、SGI origin、PC Cluster集群等并行机、Unix工作站集群(IBM、DEC、SGI、SUN、曙光)和Linux PC图形工作站群等多种平台。
石油行业现在的Unix大型机面临严重老化、主频低、处理能力严重不足等实际问题,但如果进行升级,其高昂的投资成本却离用户的实际承受能力越来越远。而如果采用基于Linux平台的PC Cluster,不仅能获得极强的可用性、可扩展性和可管理性,同时能大大降低成本,性价比远远优于昂贵的大型机系统。据测算,相同运算能力下,Cluster投资大约需Unix并行机的1/10,而速度提高3倍以上。曙光4000L正是基于Linux平台的PC集群高性能并行机,系统的部分指标达到了电信级标准,能抵御8级地震的冲击,而且提供了7项系统监控功能,使系统的可靠性达到了新的高度,是密集型科学计算领域瞩目的焦点。
随着国内外石油勘探技术的快速发展,人们往往把模拟退火静校正、DMO、SCD、SCAC、SMA、PSDM、PSTM纳入常规处理流程。许多新算法如叠前偏移的出现和普遍应用,也使得地震数据处理需要消耗更多宝贵的CPU资源。这都是低主频、小内存的Unix并行机所难以实现的,而PC Cluster正好适合于这种密集型的科学计算。基于LINUX平台的曙光4000L作为IDC数据处理主机,系统最大可"在线"扩展到80个机柜,1300个CPU,每秒6.75万亿次峰值速度,4000G内存,600T存储的海量处理系统。
另外,基于Linux平台的PC高性能专业图形工作站也是解决地震数据交互处理的有效方案,与PC Cluster一起构成地震数据处理与解释一体化系统的实用方案。
曙光,找油之途一路莺歌
早在1997年,曙光天潮1000A落户辽河油田,一举打破了国外高性能计算机一统河山的局面,实现了国产高性能服务器商品化零的突破。随后的两年里,曙光高性能计算机在国内石油领域攻城破掠池,不断取得市场突破。2002年,曙光1700服务器和以色列帕拉代姆公司地震处理软件携手进入东方地球物理公司效力。2003年中石化南京物探采用曙光超级计算机,并在2003年度"中石化系统地质勘探比武"荣获第一。同年6月,中国石油集团东方物探采购具备4.2万亿次计算能力的曙光4000L超级计算机,使东方物探公司成为国内商业领域计算机应用规模最大、运算速度最快、处理能力最强的超级计算机用户。
2004年,曙光在海洋石油勘探领域再次取得新的突破,在湛江和天津两地为中海油成功构建了两大地震数据处理中心。截止到目前,中石油、中石化和中海油三大石化巨头共采购曙光超级服务器的计算力总和已经超过10万亿次每秒。
据国际能源署预测,2004年中国原油进口将达1.2亿吨,成为世界上继美国之后第二大石油消费国。能源短缺已经成为制约中国经济发展的瓶颈。随着一些陆上油田进入枯竭期,海洋石油正快速发展,第11个五年计划期间,我国原油产量中的增量部分将主要来自海上石油。中国是一个海洋大国,拥有大陆海岸线18000多公里,岛屿岸线达14000多公里,"蓝色国土"面积约为300多万平方公里。这既为中国海洋石油工业的生存发展与创造无限可能提供了一个辽阔空间,同时也为高性能计算机的应用营造了一个神奇而壮阔的舞台。