大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
受欧债危机的影响,导致从去年第三季度开始,全球IT企业对IT投入逐渐开始持有谨慎的态度。然而曹宇钦表示,从技术的投入角度来说,虽然我们看到全球对于IT开支持有更加谨慎的态度,但是这并不会影响业界对于大数据的投入、投资,我们认为大数据在业界是一个快速发展的过程。大数据主要是帮助企业在现有的数据、已经产生的数据做整合,相应地做少量投入得到更大的回报。
孙博凯坦言,在我的职业生涯中大部分时间都在做数据,以及与数据相关的技术。此时,是像我这样的数据人最激动人心的时刻。因为数据库、大数据已经成为变革的中心,事实上可以成为一场革命,在IT领域、制造业、零售业、政府管理、科技等,大数据改变整个世界的运行方式。
截止到2012年,数据量已经从TB(">1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍
对大数据发展趋势,赛仕软件总经理刘政充满信心地说,在大数据时代,数据分析的手段是关键,只有通过数据分析才会带来价值。传统的数据分析能力,无法处理这么大量的数据,我们平常分析上千万的数据量或者上亿数据量的时候,都会花费几十个小时(好几天)的时间才能得到结果。当数据达到十亿的时候,软件就根本运行不下去,有时会好几十天,这个速度人们是无法接受的。所以,在新的时代,我们需要高性能的分析软件。
IDC有一个数字,全球的数据使用量到2020天会增长44倍,这一个非常大的增长。英特尔行业合作与解决方案部中国区总监凌琦表示,我们相信44倍的增长,其中主要的增长来源将会是大数据形式。传统的关系型数据仍然会成长,但是它的成长在今天传统关系型数据库的运用和使用方面已经达到了相对比较成熟的阶段。如果有志于在这当中做一些贡献,创造一些新的商业模式和商业机会的话,我们希望在大数据当中进行更多的投入。
(责任编辑:蒙遗善)