生活在互联网时代,时时刻刻都与数据打着交道,网购、微信、网络社交、网络服务等等,每次点击都产生着数据。科研、生产和社会管理的活动也同样产生着大量的数据,研究大数据处理技术、构建大数据处理平台显得格外重要。从国家超级计算天津中心了解到,截至目前,“天河一号”已启动为生产科研和智慧城市建设开展大数据研究,通过技术和平台建设支持产业和科技创新。
面向中小企业开放使用
“把城市建筑所有物化的东西,老百姓看得到的和看不到的东西用数字的模型描述出来,就像建筑,建筑实际上是一个建筑体,但把它数字化之后就能保存在电脑里,过去的GIS系统的数字化只能看到建筑的一个外观,但是‘人’进不去;现在BIM系统数字化之后,就像看美国大片一样,‘人’可以进入虚拟空间中到处转。”国家超级计算天津中心主任刘光明介绍,通过大数据处理平台,未来,老百姓如果想在网上看房或选房,通过互联网终端就可以“走进”小区、“走进”房子里,身临其境地观看房子的房型、结构、朝向,甚至建筑用材等。未来,这样的便捷生活将可以通过“天河一号”平台描绘出来,目前,“天河一号”搭建了建筑信息建模系统(BIM),这个系统可以通过数字化的方式描述老百姓在城市生活中看得到的或看不到的东西,如地下管网、煤、电、气等管道都用数字化的模式描述出来。除对建筑物的设计建造和管理提供全方位支持,同时可方便百姓日常生活,并提高政府应对突发事件的决策能力。
刘光明介绍,“天河一号”团队主要通过研究大数据的处理、存储等关键技术,构建大数据的应用支撑平台。大数据的核心是大规模海量数据处理,这就需要很高的计算性能,国家超级计算天津中心将大数据的挖掘处理和高性能计算结合起来,用超级计算来支持大数据的挖掘和处理,提高处理的实效和规模。在构建应用平台方面,目前,很多企业要使用大数据需要有平台的支撑,如果企业自身搭建一个这样的平台就需要很大的投资,对于一些中小型企业承受不了,为了实现资源共享,依托“天河一号”打造的大数据处理平台可以面向中小企业开放使用。
提高人类健康水平
国家超级计算天津中心应用开发部部长孟祥飞介绍,目前,“天河一号”支撑的比较多的是生产科研型和智慧城市建设中的相关数据,在生产科研型的大数据处理方面,基因大数据的应用已经取得了阶段性进展。例如,通过对人类群体大规模基因数据的综合分析,可以发现某个基因片段与某种癌症发生的关联。以此,就可以对人们进行健康咨询,通过基因比对,假如某个个体有某种致癌基因片段,就意味着将来这个个体发生某种癌症的可能性大大增加;对此,医疗结构可以设计个性化治疗方案或开展新药的研发,实现在这类个体发病之前通过药物治疗提前干预,减少发病率。目前,基因大数据已在妇女癌症和新生儿先天性疾病筛查中开始进行研究应用。此外,在生产科研型的大数据处理方面,“天河一号”超级计算机也已应用于油气能源的开发中,将超级计算技术运用到大数据里,帮助企业更加精准、高效地勘探到油气能源分布,实现对产业的支撑。
孟祥飞说,大数据主要分为两大类,一类是网络型的大数据,主要是与电子商务和舆情监控等相关的数据类型;还有一类是生产科研型的大数据,如基因数据和石油勘探数据等。无论是网络型、还是生产科研型大数据,用传统的数据处理技术和软硬件技术都很难支撑。依托天津超算中心“天河一号”超级计算和云计算平台及技术开展大数据的分析处理,可以进一步帮助企业、科研机构和政府进行更加高效全面地获取商业、决策、科研等有效信息,深入挖掘经济发展、科技创新潜力,提升政府管理效率。