那些材料科学下的大数据

从各项发明的产生可以看出一个规律,新材料哺育新发明。Gorilla Glass 已经大量被应用于智能手机;凯夫拉在拯救生命之余开始进入消费级产品;锂离子电池技术为高能耗设施提供了动力来源。尽管这样,研发新材料却是一项极其费时费力的任务。

在和那些依赖这些材料的产品的研发周期相比,创造一种全新的突破性材料是极其费时的过程。波音 787 梦幻客机从概念到商业航行只花了 9 年不到;苹果从 2005 年开始设计 iPhone,2007 年就可以正式上市。作为对比,新型材料的诞生可能要花上长达 20 年的研究和实验。

两年前,美国政府以突破这个科技瓶颈为目标,成立了Materials Genome Initiative(MGI)项目。MGI 的目标是大幅减少新材料研发所需的时间和财力投入。和人类基因组计划为我们的基因绘制地图的任务类似,科学家想要通过 MGI 找出元素间的互相作用对材料的种类和性质带来的广泛影响。以这些知识作为基础,科学家和工程师们将有希望以更短的周期为不同应用“定制”相应的材料。

元素间排列组合的数目多如牛毛,其中大多数对我们来说没有意义。而试图在实验室里穷尽这些排列组合是完全不合实际的。所以,MGI 的一些项目组已经开始借助大数据的力量来模拟所有的可能性,然后通过分析数据向有潜力的方向进行深入研究。

成立多年以来,MGI 促成了一些第三方项目的合作。其中就有来自麻省理工学院的Materials Project和哈佛的Clean Energy Project。这两个计划以相似的理论基础寻求不同的答案。前者的研究集中在无机固体上,尤其以电池材料为主,而后者的清洁能源计划以可用于太阳能电池的分子材料为中心。两者均利用密度泛函理论(Density Functional Theory)收集的巨型数据库来预测模拟物质模型的实际属性。

MIT 的 Material Project 大约在 8 年前在 Gerbrand Ceder 教授的帮助下成立。作为多家公司的顾问,Ceder 积累了大量成果。但是和少数公司的合作使得这些宝贵数据被封闭起来。“如果我们向所有人提供这些数据,人们会创造出很多惊人的成果,这就是 Materials Project,”他说。目前, MIT 的数据库里保存了大约 10 万种已知或理论上的材料信息。为了充分发挥这些数据在新材料研发中的作用,MIT 学者用人工筛选加机器学习的方式来探索各种化学定律。

类似的,哈佛清洁能源计划也用人工加机器组合来探索其数据库。该计划始于一次对有机太阳能电池材料概念的验证实验。学者们完全虚拟的情况下计算了大约 15 种新型混合物在现实世界里的表现。模拟运算的最终结果是一种有超强电气性质的新物质。这还只是一名研究生通过几次实验得出的结果,想象如果从一支志愿者大军那儿借来他们的运算能力,结果会放大多少?

这正是清洁能源计划如今采用的策略:任何人都可以通过在电脑上下载一个程度来进行运算并把返还结果。有了这个可任意支配的巨大资源,学者们已经计算了几百万种潜在组合 – 这仅仅是个开端。“项目进入了一个十分有趣的阶段”Hachmann 博士说,“对我们来说差不多是从辛勤劳动中采集硕果的时候了。”目前,哈佛在网上发布了230万种混合物组合供所有人研究使用。虽然这些数据的初衷是助力太阳能电池的研发,科学家也可用任何有价值的信息来帮助其它方面的研究。MIT 也有个网络入口供人们读取 Materials Project 的数据。

Ceder 希望伟大的 MGI 计划能够完成它的使命。事实上,Ceder 已经看到一些成果了,他正在为一项新的电池材料申请专利,这对于成长中的 MGI 和电池技术开发来说都是很好的成绩。Ceder 认为互联网和大数据的加入能为这个计划带来无法预知的进步和发现,“当拥有这种组合的时候,你无法预测人们将会带给你什么。”

原文链接:http://www.36kr.com/p/206581.html

【编辑推荐】

Oracle大数据机保护企业大数据安全流感防治和大数据大数据热潮中的Informatica新机遇大数据解析美网女单半决赛:李娜为何败给小威存储五年:闪存异军突起 大数据云计算迅速上位【责任编辑:箫韵 TEL:(010)68476606】

时间: 2024-11-01 09:24:22

那些材料科学下的大数据的相关文章

电视台成阿里云下一个大数据重塑目标

本文讲的是电视台成阿里云下一个大数据重塑目标[IT168专稿]继空调之后,电视台成为阿里云计算的下一个大数据重塑目标.3月20日下午,阿里云宣布联手新奥特.华通云数据,打造中国最大的全媒体云计算平台.该平台可以在一周内,帮助传统电视台变成多屏网络电视台,支持电脑网站.手机APP.电视机全终端流畅播放,且可以实现大数据的收集整理和运营.今年内,全国两百家电视台将接入该云计算平台. 阿里云是中国唯一可以将5000台计算机合成一台"超级计算机"的云计算平台,将为全国广播电视媒体提供超级计算.

决胜对话百家名校 互联网教育下的大数据创新

2014年12月1日-3日,中国国际智慧教育展览会将在北京鸟巢•国家会议中心拉开序幕,展览会汇聚了218家教育信息化领域尖端企业,已有万余名横跨政.企.院校人士报名参观,一场教育信息化盛宴即将上演! 教育信息化是现代教育的本质特征之一,是社会信息化浪潮的重要组成部分.如何利用现代信息化技术提高国家教育质量,如何利用高度发达的现代网络实现校园教育跨越式发展,开始受到越来越多的关注与讨论. 以终端用户角度展示校园信息化的"首届中国智慧教育成果巡礼"活动,集合了来自清华大学等全国20所普教.

企业互联网时代下的大数据构建之道

文章讲的是企业互联网时代下的大数据构建之道,"现在企业互联网化正在迅速渗透到企业以及所处的产业链和生态圈中,借助互联网,企业可以更容易与前端供应商.服务商包括后端客户.最终客户建立密切的联系.在此过程中新的业务模式包括供应链优化.智能制造.产业链协同.电子商务等正在不断兴起并迅速发展." 用友网络科技股份有限公司助理总裁,兼集团iUAP中心副总经理谢东在接受记者采访时说道. 企业互联网化 大数据成为核心资产 企业互联网化已经成为一种趋势,它正在改变着企业的传统的业务模式,使得企业内部运

NVIDIA 深度学习部门总监 Jim McHugh :AI 驱动下的大数据之路已铺好

编者按:无论是打败世界冠军的 AlphaGo,还是百度无人驾驶.阿里和腾讯的人工智能都在使用 NVIDIA 的芯片组,它在人工智能领域扮演着大脑的角色.无论软件公司研究出多么先进的算法,最终都需要处理器来进行运算,没有它们的支持,人工智能的良性发展也就无从谈起. 最近,NVIDIA 深度学习部门总经理 Jim McHugh 接受了国外媒体 InsideBigdata 的访谈.从他在 2016 年纽约 Strata + Hadoop World 大会上的发言开始谈起,Jim 讲述了他对 AI 驱动

4项客户生命周期下的大数据应用

2013年,在亿玛智慧峰会暨第五届整合营销高峰论坛上,京东商城高级副总裁徐雷曾指出,企业最重要的就是通过客户来驱动销售与利润,为获得与维持高质量的客户.提高客户的购物频率与篮子.提高客户生命价值.驱动更高的销售.行程品牌忠诚度提供有效的运营.从而进行口碑传递五方面形成闭环. 在会上,徐雷表示,对比新老客户购物轨迹差异可以看到新客户(年龄小于13个月)购买金额在400元左右变化,变化幅度也相对比较明显,流失率较高.而相反,老客户(年龄为12-24月)购买金额在600元左右,变化相对稳定,流失率较低

BAT下的大数据创业机会

(本文转自阿里云大数据孵化器团队的产品专家:九卿发表在知乎上的文章,以下原文分享给大家) 本人目前在A从事2B的大数据解决方案与产品设计工作,以大数据商业化为目标,各行业客户都有,简单跟大家分享下我们目前的大数据落地实操经验. 一.厚积薄发:BAT平台的优势 大数据平台就个人来看,A应该算做的比较好了,从云计算的布局到大数据平台,步步为营,也是筚路蓝缕.大公司的优势在于三个字"熬的起".业务几乎都是以平台.生态的构建为目标,最终是enable别人成功,并从别人成功中获益的模式. 在这个

阿里“神盾局”联合公安打击线下假货 大数据成最可靠情报

ZDNet至顶网软件频道消息:阿里巴巴近日披露了系列打假案件,都是近年来协助各地公安破获的查假货的案例.在阿里巴巴内部,有支神秘的部队被阿里人戏称为"神盾局",这就是阿里巴巴安全部,很多的假货最初都是被神盾局发现,然后根据大数据提取线索报给公安机关,最终促成破案的. 世界杯期间,他们就协助公安查获一家卖假球衣的店铺,阻止了3000多件假球衣从线下流入淘宝用户. 2014年5月,世界杯开赛前期,在阿里巴巴的淘宝指数统计平台上已经可以看到,世界杯球衣的搜索和成交持续升温.这中间会不会有假货

视频监控领域下的大数据与网络安全问题

最近一段时间,有关中国黑客袭击美国公司和媒体的新闻被到处渲染,中国政府和军方否认了此事,并表示中国才是网络攻击最主要的受害者.此事的发酵,使得人们的目光迅速聚焦到网络信息安全上面. 随着计算机技术的飞速发展,信息网络已经成为社会发展的重要保证.有很多敏感信息,甚至是国家机密,放置在网络上,其安全性备受关注.2011年,国内知名程序员网站CSDN遭到黑客攻击,600多万个注册邮箱被迫裸奔;2012年,亚马逊旗下美国电子商务网站Zappos遭到黑客网络攻击,2400万用户的电子邮件和密码等信息被窃取

社会学视角下的大数据方法论及其困境

大数据不仅是一种庞大数据资料的称谓,也是一种获取和分析资料的方法.在社会学研究领域,大数据的引入被认为是定量研究的范式下所做出的收集和分析资料方法的创新.但是大数据在多大程度上反映人群的状况.能否解决被研究者的主观性问题.如何洞悉变量间关系的真伪.如何解决数据缺失问题等方面,还存在一定程度的方法论困境.这就要求研究者在使用大数据进行研究时,能够在研究对象与问题的选择.变量的选取.数据的清理等一系列工作中更加谨慎,切勿犯简化社会生活.盲目推广分析结果的错误. 1.引言 近年来,"大数据"