曙光高性能计算在生命科学领域中的应用

  【天极网服务器频道12月16日消息】由于测序技术的飞速发展,人类发现的基因序列数目以指数级增长,对于如此数量庞大的基因进行同源性搜寻、比对、分析、遗传发育分析等等,往往伴随着巨大的">数据处理量和并行计算量。同时,生命科学的研究对象往往是蛋白质和DNA的大分子,对这些分子的三维结构进行预测,研究它们的动力学特性、热力学特性及其在生命过程中如何发生作用等等,这些科学问题也要借助于高性能计算机。所以高性能计算机在生命科学研究中,应用非常广泛,扮演着及其重要的角色。

  生物领域中的高性能计算最大的特点就是种类多,比如,有生物分子的结构测定,首先通过实验仪器对生物分子进行测量,然后使用一些后处理软件对原始的大量数据进行处理。有对DNA分子进行研究的Illumina 公司的测序仪Genome Analys,HiSeq 2000以及相应的后处理软件GAPipeline等;ABI公司的测序仪Solid3,Solid4以及后处理软件Bioscope。有对蛋白质分子进行研究的三维冷冻电镜方法及结构解析软件EMAN,SPIDER;利用Xray方法测量用软件CCP4、ARP/wARP,CNS进行解析等;质谱仪测序以及后续处理软件tandom(X!tandom)等。有生物信息学类计算,以实验测得的蛋白质、核酸序列为研究对象,对序列进行同源及相似性搜寻、比对、序列分析、遗传发育分析等,应用软件数量巨大,各种软件在同源性分析算法上各有特点,最常用的有BLAST,FASTA,HMMER,ClustalW,DNASTAR,PHYLIP,PAML,PAUP,T-Coffee,EMBOSS等。有分子动力学类计算,从原子的角度利用经典力学模拟分子的运动,研究体系动力学和热力学特性,主要软件有AMBER ,Charmm,NAMD,Gromacs等,这类应用非常适合大规模并行。有计算机辅助药物设计类计算,主要是做分子对接,模拟小分子配体与生物大分子受体的相互作用,预测两者间的结合模式和亲和力,从而进行药物的虚拟筛选,根据计算方法的不同分刚性对接、半柔性对接和柔性对接,应用软件有DOCK ,AutoDock,FlexX,Discovery Studio,ZDOCK,RDOCK,MORDOR等。

  对于生物领域的复杂计算需求特点,曙光推荐如下高性能计算集群解决方案:

  计算子系统包括:高密度、低功耗、易管理的刀片服务器,如曙光TC3600/TC4600,刀片节点配置以双路为主,采用最新的64位Intel或AMD处理器,注重浮点峰值和内存性能;单机性能高、大内存、高I/O的SMP四路或八路胖节点;利用图形加速技术大幅度提高计算能力的GPU节点;计算网络采用低延迟、高带宽的InfiniBand,能大幅度提高应用程序的计算速度和并行加速比;针对大规模高性能计算集群系统,全局共享存储的性能和扩展性非常关键,目前主流的解决方案是采用分布式的并行存储系统,如曙光ParaStor 100/200。在软件层面,曙光为生物高性能计算用户配备完备的并行软件开发和运行环境;配置曙光Gridview集群监控管理及作业调度软件,包含针对不同应用软件开发的Web作业提交界面ClusPortal,可以大大降低高性能计算机的使用门槛。

(作者:飞翔的鱼责任编辑:柏景福)

时间: 2024-11-05 19:03:15

曙光高性能计算在生命科学领域中的应用的相关文章

科学领域中的深度学习一览

深度学习在很多商业应用中取得了前所未有的成功.大约十年以前,很少有从业者可以预测到深度学习驱动的系统可以在计算机视觉和语音识别领域超过人类水平.在劳伦斯伯克利国家实验室(LBNL)里,我们面临着科学领域中最具挑战性的数据分析问题.虽然商业应用和科学应用在所有分析任务方面(分类.聚类.异常检测等)存在着相似之处,但是之前的经验让我们没办法相信科学数据集的潜在复杂性会跟ImageNet数据集有可比性. 深度学习方法是否已经强大到可以使科学分析任务产生最前沿的表现?在这篇文章中我们介绍了从不同科学领域

技术驱动:医疗、生命科学领域的本质是对数据的处理和反馈

中国云计算产业最具影响力的盛会之一--2016杭州云栖大会(https://yunqi.aliyun.com/)将在云栖小镇召开.连续举办七届的云栖大会一直是业界了解阿里云计算生态发展和应用趋势.体验前沿技术和产品的最佳平台,来自海内外的上万名开发者.创业者聚集于此,分享着他们对云计算的思考与实践经验.7年来,从产品发布到行业解决方案展示,从关注技术到技术与服务并重,从单一的客户到生态全景的展现,大会的核心内容一直在"进化",而2016年杭州云栖大会,则以"飞天・进化&quo

曙光高性能计算在石油地球物理勘探中的应用

[天极网服务器频道12月16日消息]石油地球物理勘探(简称石油物探),一直是高性能计算技术的传统和主要应用领域.随着人类对于油气资源需求的不断提高,油气勘探工作面临的勘探对象不断复杂化,勘探条件日趋恶劣,从而导致对石油地球物理勘探技术的研究与应用不断深化.地球物理技术的发展与应用高度依赖于包括高性能计算技术在内的信息技术的发展. 地震勘探过程主要由地震数据采集.数据处理和地震资料解释3个阶段组成,而其中地震数据处理又是整个工期中耗时最长.占用资源最多的一个环节.地震数据处理的任务是加工处理野外观

曙光高性能计算在气象海洋领域的应用方案

[天极网服务器频道12月16日消息]气象.海洋预报事业关系国计民生的各个方面,近年来极端天气和极端气候频发,自然灾害增多,也对气象.海洋及相关行业的预报业务提出更高的需求.十二五期间,http://www.aliyun.com/zixun/aggregation/32255.html">天气预报的准确率.时效性.精细化程度和服务水平都需要大幅度提高.数值天气预报是指是指根据流体(大气或海洋)的物理和运动特性,在一定的初值和边值条件下,通过大型计算机进行数值计算,求解描写流体演变过程的流体力

谷歌母公司Alphabet狂挖生命科学与健康领域顶尖人才

据外电报道,谷歌(微博)母公司Alphabet历来以采用激进做法招聘顶级计算机工程师而著称.如今,Alphabet又把目光投向生命科学和医疗保健领域,开始在上述领域招募顶尖人才. 谷歌联合创始人塞吉·布林(Sergey Brin)和拉里·佩奇(Larry Page)过去一直强调,谷歌不会变成为一家医疗保健公司,部分原因在于与该领域相关的监管复杂性.但是如今,Alphabet"其它业务"的三大子公司已经把目光投向了年产值达3万亿美元的医疗保健领域.此外,Alphabet旗下的两家风投子公

3.2 生命科学

图 1:       基因测序是千亿大市场(华大基因) 资料来源:互联网 互联网.云计算.大数据的新科技普及,大幅推动生命科学商业化进程.2016年生命科学将在医疗领域取得诸多技术突破,美国政府宣布投入2亿1500万美元用于"精准医疗计划"(Precision Medicine Initiative),Facebook.Google等科技公司也积极开展此领域投资:中国版精准医疗计划即将启动并投入巨资,包括精准诊断.精准治疗两个方面,前者的重要技术是基因测序,不同患者对疾病易感程度的差异

DHL退出中国快递移师中西部 布局生命科学市场

老牌德国快运公司DHL日前在华高调宣布了其加速国际货运业务向中国内地市场的布局. 这份发自其全球货运部门的"激进网络扩张计划"的主要内核包括--至2015年前,DHL全球货运将新增五个分支机构和20个销售办事处,并要覆盖中国30%的三线城市. "三线城市",第一次以清晰的姿态出现在DHL对中国市场的设想中.此时,距离DHL宣布全面退出中国国内快递业务,不足60天. DHL西行 7月,中外运敦豪国际航空快件有限公司将旗下3家国内快递公司上海全宜快递有限公司.北京中外运

HDS HNAS方案助力生命科学高性能计算

文章讲的是HDS HNAS方案助力生命科学高性能计算, 北京贝瑞和康生物技术有限公司 行业:生命科学 解决方案:文件和内容服务 大数据 硬件:HNAS 3090 (Hitachi NAS Platform 3090) HUS 130 (Hitachi Unified Storage 130) HNAS 3080 (Hitachi NAS Platform 3080) HUS 110 (Hitachi Unified Storage 110) 软件: HNAS Value Cluster Soft

生命科学中的大数据

2014年6月13日,<科学>杂志刊载了一篇由美国科学促进会(AAAS)科技出版顾问Mike May撰写的一篇题为"Big Biological Impacts from Big Data"的文章.鉴于大数据作为目前的一个热点概念,本文对该文进行了编译.本文首先梳理了大数据所包含的三层含义,然后就这三层含义进行了分析和解读.基于基因组数据量越来越多的情况下,很多机构都意识到利用大数据的前景.本文列举了一些机构已开发或正在研发的.用以分析大数据的方法或工具.例如,美国BioD