量子计算:解决大数据洪流的未来方法?

从基因图谱到太空探索,人类不断产生着越来越大的数据集——远超过了人类可以处理、管理和理解的范畴。

机器学习系统能够帮助研究者处理这些日渐增长的信息洪流。一些最强大的分析工具是建立在一种奇特的几何学分支上的,称为拓扑学。拓扑学研究的是那些即使在弯曲或拉伸的状态下依然保持不变的性质。

这样的拓扑系统在分析复杂网络中的联系时,特别有用,例如大脑内部、美国电力网络或国际互联网中的连接。但是,即使用现代最强大的超级计算机,这种问题还是令人生畏,很难解决。现在,MIT、滑铁卢大学和南加州大学共同开发出一种新的方法,将使用量子计算机来解决上述问题。

这个团队在本周的《Nature Communications》杂志上提出了他们的理论。 该论文的第一作者Seth Lloyd教授解释说,这种新方法的关键在于代数拓扑。每次人们在收集真实世界的数据时,都会出现一些不可避免的扭曲,而这种方法可以帮助减轻这种扭曲带来的影响。

在拓扑描述中,数据最基本的特征(它有多少个洞?不同的部分之间如何相连?)将被看做是一样的,无论它们如何拉扯、压缩或扭曲。Lloyd解释说,在试着重构数据应当表征的真实世界的隐藏模式时,这些基本的拓扑属性通常非常重要。

这与分析数据的类别无关,他说。在寻找联系和孔洞时,无论是真实的物理孔洞,还是数据中显示出来的逻辑漏洞,拓扑学方法都能发挥作用。这些漏洞它都能找出来。

采用传统计算机时,这个方法的要求实在太高了,除了最简单的情况以外。拓扑学分析「表现了一种找出数据重要特征的关键方法,但是它在计算上却很昂贵。这就是可以采用量子机制的地方,」Lloyd说。这种基于量子的新方法,将以指数级加快计算速度。

Lloyd举出了一个例子,来说明潜在的加速:如果你有一个数据集,其中包含着300个点,要分析这个系统的拓扑特征,传统的方法需要「一台宇宙那么大的计算机」。也就是说,它需要2^300个运算器,近似等于宇宙中所有粒子的数量。所以,用这种方法根本行不通。

「这就是我们的算法发挥作用之处,」他说。用一台量子计算机的新系统来解决这个问题,只需要300个量子比特——而Lloyd认为这样的机器在接下来的几年内就有可能变成现实。

他说:「我们的算法展示出,你并不需要一台巨大的量子计算机,就能解决这种严峻的拓扑学问题。」

Lloyd说,量子拓扑的方法还可以用在许多重要的巨大数据集中,例如理解大脑中的连接。「将拓扑分析用在脑电图或功能核磁共振的数据集中,你就能揭示出,我们的思维过程之下,放电神经元的复杂连接和拓扑序列。」

同样的方法还可以用在分析其他很多类型的信息。「你可以将其用在世界经济上,或者社交网络上,还有远程货物运输或信息交换的系统上。」而传统的计算机的限制让它们无法解决这些问题。

目前,这个方法还只停留在理论阶段。Lloyd说,实验家们已经开始联系他们,想尝试一下原型机。「在一台非常简单的量子计算机上,你就能找出简单结构的拓扑结构。人们正在尝试这方面的概念验证实验。」

本文转自d1net(转载)

时间: 2024-10-24 13:18:39

量子计算:解决大数据洪流的未来方法?的相关文章

大数据应用的未来发展在何方?

时至今日,我们的数据管理能力日益提升,但数据分析能力则相对落后.尽管工具与流程皆已齐备,但仍然缺少充足的数据科学家人员.在今天的文章中,我们将专注于能够交付实际分析结论的大数据应用,同时追踪其发展及当前状态,最终借此窥探大数据技术的未来发展方向 早期大数据技术采纳方指明令人感兴趣的跨行业发展可能性 根据2012年<福布斯>杂志发表的文章,早期大数据技术采纳方主要来自金融服务.电信.制造(特别是消费级产品)以及政府领域. 早期采纳方在起步阶段会使用其新近安装的大数据基础设施(例如HDFS.Map

Hadoop之父Doug Cutting眼中大数据技术的未来

上次见到(膜拜)Hadoop之父Doug Cutting是在2年前,2014中国大数据技术大会上.今年Hadoop10岁,刚看到他的Hadoop十周年贺词,感觉时间飞逝. Doug Cutting成长史 1985年毕业于美国斯坦福大学的Cutting并不是一开始就决心投身IT行业的.在大学时代的头两年,Cutting学习了诸如物理.地理等常规课程.因为学费的压力,Cutting开始意识到,自己必须学习一些更加实用.有趣的技能.这样,一方面可以帮助自己还清贷款,另一方面,也是为自己未来的生活做打算

LSI:面向渠道转型 全面引领大数据洪流

文章讲的是LSI:面向渠道转型 全面引领大数据洪流,当前,全球数据爆涨.根据IDC最新数字宇宙研究报告,近两年全球的数字信息翻了一番.7年之后,总量将达到40 ZB,相当于地球上所有沙粒数量的57倍.也有人计算出,就在我们阅读本文的3分钟时间内,有18万小时的音乐下载,6亿Email产生,6000万照片被查看,14万个应用下载,390万视频被观看--若干数据在互联网传输,更多的数据被保存,等等.这就是今天大家都面临的大数据问题,LSI则称之为数据洪流(Data Deluge). ▲LSI全球渠道

拥抱大数据 驾驭新未来 2016全球大数据峰会在京成功举行

ZD至顶网CIO与应用频道 01月21日 北京消息: 2016年1月20日,由全球大数据联盟GBDC.全球移动游戏联盟GMGC.世界O2O组织WOO.光合资本主办,中国互联网协会O2O工作组.中国汽 车流通协会支持的2016全球大数据峰会GBDC2016,在国家会议中心举行.这场行业盛会吸引了来自IBM.TalkingData.微软.高通.阿 里巴巴.联想.Akamai中国公司等众多企业的业界精英参与.与此同时,全球大数据联盟(GBDC)也正式成立. WOO总干事.GMGC创始人兼秘书长宋炜致辞

LSI总裁兼CEO Abhi Talwalkar:大数据洪流引爆数据中心革命

第五届中国云计算大会于2013年6月5-7日在北京国家会议中心拉开帷幕.本次大会以国际视野,洞悉全球云计算发展趋势,并从应用出发,探讨云计算与大数据.云计算与移动互联网.云安全及云计算行业应用等焦点话题.大会还特别设立了云计算服务展示区域,交流国际云计算最新研究成果,展示国内云计算试点城市发展成就,分享云计算发展经验,促进全球云计算创新合作. LSI总裁兼CEO Abhi Talwalkar 在第五届云计算大会第二天的演讲上,LSI总裁兼CEO Abhi Talwalkar发表了名为<大数据洪流

大数据之市场未来2年趋势和IT投入重点

文章讲的是大数据之市场未来2年趋势和IT投入重点,为了准确描述中国大数据市场和技术发展趋势,解析大数据发展的各阶段对IT技术的需求,2013年6月,中桥国际调研咨询(以下简称中桥)对中国480家最终用户的IT管理者和专业人员,就大数据市场和技术发展趋势展开了调查.之后中桥首席分析师王丛,将结合其在欧美数据中心领域十几年的市场调研积累,对中国大数据市场趋势的调查数据进行解析,以诠释中国大数据市场和技术趋势.同时,会通过在线讲座(www.webinars-china.com ),和中国读者解读中国大

大数据洪流:冲出绿洲还是淹没一方圣土

2012年,我们看到了很多云计算的应用部署.很多停留在概念阶段的应用和服务,在2012 年已经真真切切地上马.部署应用了.大数据却也因此而得到"弯道超车"般地发展.在云计算环境和BYOD.社交媒体.移动互联等应用增强的趋势下,大数据将在2013带来更为 深刻的影响,这种影响犹如一股肆无忌惮的洪流可能会冲出一片绿洲,亦可能会淹没一方圣土. 近日,美国市场研究公司IDC披露的报告显示,全球大数据技术和服务市场将在未来几年保持31.7%的年复合增长率,也就是大数据市场的增速将达到同期整个信息

AdTime雷永华:大数据下的未来广告

4月24日,在"科技创享 变革未来"这一主题下,2013年艾瑞年度高峰会议在北京国家会议中心拉开帷幕.国内智能数字广告营销领导企业AdTime首席技术官雷永华在数据营销分会上发表了<大数据下的未来广告>主题演讲. 雷永华介绍,大数据运用到互联网营销领域可使未来广告呈现"4M"特征."4M"指More Faster.More Centralized.More Vertical.More Closer.在此基础上介绍了AdTime秉承的时

mysql-利用MySQL数据库如何解决大数据量存储问题?

问题描述 利用MySQL数据库如何解决大数据量存储问题? 各位高手您们好,我最近接手公司里一个比较棘手的问题,关于如何利用MySQL存储大数据量的问题,主要是数据库中的两张历史数据表,一张模拟量历史数据和一张开关量历史数据表,这两张表字段设计的很简单(OrderNo,Value,DataTime).基本上每张表每天可以增加几千万条数据,我想问如何存储数据才能不影响检索速度呢?需不需要换oracle数据库呢?因为我是数据库方面的新手,希望可以说的详细一点,万分感谢!!! 解决方案 查询业务是怎么样