雷涛:面对大规模数据最重要的是数据的挖掘问题

随着智能手机、互联网等多媒体的发展,数据呈现爆炸式增长。据IDC全球存储及大数据研究项目副总裁Benjamin?Woo表示,到2020年,全球数据使用量预计暴增44倍,达到35.2ZB。35.2ZB也就是说全球大概需要376亿个1TB硬盘来存储数据。

面对海量数据,传统的IT解决方式已到了“穷途末路”的地步,而云计算的发展及应用却可以使海量数据产生巨大的社会及经济价值。

就此,中云网记者采访了北京云基地副总经理雷涛.

在谈及面对大数据挑战遇到哪些困难时,雷涛表示面对大规模数据最重要的并不仅仅是数据的存储问题,而是数据的挖掘问题。他还表示法律法规和云计算标准是云计算发展的必要条件,但并不是充分条件,谁有能力创造出优秀的产品,谁就有制定标准的优先权。

在被问到云计算会不会人为造成资源浪费时,雷涛表示将来大数据的主体并不是人为产生的数据,而是机器产生的大量数据,也是这部分机器产生的海量数据将会创造出巨大经济及社会价值。

雷涛还表示,扁平化的数据结构是未来的发展趋势。雷涛先生形象的将这种扁平化的数据结构比喻为大英博物馆的图书结构,正如每本图书都有标签一样,云上所有信息也被贴上标签;博物馆的图书可以通过计算机搜索,云上的信息也可以通过智能索索被索索到,而不用在意信息的具体存储位置。

(责任编辑:admin)

时间: 2024-10-31 11:16:03

雷涛:面对大规模数据最重要的是数据的挖掘问题的相关文章

数据报道 | 产业互联网革命 数据是新生产资料

在大数据市场早期结构化还没有出现之前,谁掌握的入口(行业)越多,谁胜出的概率越大.靠技术和产品的时代已经过去了,现在的核心是数据,所有人都要围着数据转. "大数据(BigData)发展到现在,经历了整个思想的泛滥期,大量的项目实施,再到泛滥期,到了2014年,整个行业显得很浮躁.我们应该认真地思考大数据未来的发展和创新到底在哪里."天云大数据首席执行官雷涛如此评价当前的大数据行业. 到了如今这个时代,人类使用的多数工具,包括电脑.电视.手机等,以及人类的身体.行为都在无时无刻地产生数据

天云大数据老总雷涛:大数据的三大金矿

我们现在看,大数据首先还是一个工具,它的工具化体现在哪里呢?对于众多服务型的行业里,大数据要帮你做到怎么识别用户,也就是你服务的这些灰色头像到底是什么,银行上亿用户,可能就一张表就把这些人都包括了,互联网是一个人一个表,通过所有数据的赚取,感知整个生态体系的变化,最终实现一个闭环的干预.通过闭环的干预,再反馈给用户数据,形成一个正向的循环结构. 这个资产我们也再定义一下,大数据到底带来了哪些资产的内容,大数据金矿是什么,我们怎么去找到.如果说我们要找一个好的工作,哪样的企业是未来的核心企业?我们

天云科技雷涛:大数据落地的三种应用方式

5月23日-5月25日,2012第四届中国云计算大会云基地专场拉开帷幕,展示云实践.探讨云趋势,共享云未来.云基地专场全面展示了云计算领域的最新技术和新产品,并以论坛形式探讨云计算发展趋势.大数据的大价值.云时代数据中心的节能等备受业界关注的热点话题.天云科技副总裁雷涛表示目前大数据落地的应用方式有三种.第一个本身就是数据服务,数据服务更多的是提供一些资源服务,以及一些传统的数据能力的服务,比如数据的保存,长期数据的保存,还有面向大企业的一些专业维护,容灾的能力.第二块更多是信息的,这块采用了很

雷涛:大数据时代的大智慧

在"2011中国云计算与云服务发展高峰论坛"上,北京云基地副总经理做了以"大数据时代的大智慧"为主题的演讲,以下为演讲实录. 大家下午好!感谢这么多同事下午可以回到这个会场.先介绍一下我们云基地,云基地是一个组织,田总就是我们基地的带头人,以资金加基地的这种新的产业模式投资了13家公司,从基础设施,比如集装箱式的数据中心到SaaS的软件,我们今天的题目是比较专的在某一个领域,因为这一两年我们发展很快,从去年10月份以来,已经产生了很多的经济效益,投产的这些服务器也有

面对网络上的庞杂海量大数据,如何挖掘出价值?

作者:比特网总编.中国互联网协会网络营销工作委员会专家委员曹增光近年来,互联网技术飞速发展,国内网络基础设施不断完善普及,网络快速应用通道伸向了经济发展的各个角落,越来越多的企业因此而获得更加广阔的发展空间,并逐步走上了国际化信息高速公路,经济效益得到显著提升.相比传统行业,互联网的优势在于它的数据驱动力.在拥抱企业互联网化过程中,如何将互联网的静态信息和动态过程电子数据化.进而挖掘出全新价值,是摆在企业管理者面前的一道必答题.在互联网经济时代,企业CIO眼中的互联网数据经济有哪些,大数据技术对

银行业面对金融科技公司竞争,学会数据的商业化思维和场景应用是关键

  近日,前星展银行中国科技副总裁.现TalkingData首席金融行业专家鲍忠铁,在标准普惠和 Fintech 情报局主办的金融科技大会上发表演讲,就现在经济环境下银行面临的挑战以及如何利用数据技术迎接这些挑战进行了探讨. 鲍忠铁认为,现在银行业面临的主要问题,其一是未来宏观经济的放缓将持续多久具有不确定性,其二是年轻人不愿意到银行办业务,其三是很多传统企业都开始进入金融领域,竞争越来越激烈.银行业在2015年总贷款金额为85万亿,只要增加1%的坏账,就是接近一万亿的损失. 面对金融科技公司的

《大数据、小数据、无数据:网络世界的数据学术》一 2.2 定义与术语

2.2 定义与术语 学术文献.政策声明和大众媒体中到处都充斥着对数据的讨论,它们都尝试定义业内术语.罗森博格(Rosenberg 2013)指出,即使是在科学史和认识论历史中,人们也只是在无意间提及数据(Blair 2010:Daston 1988:Poovey 1998:Porter 1995).其他在科学领域中讨论事实(fact).表示(representation).记录册(inscription)和出版(publication)等含义的基础性作品也很少关注数据本身(Bowker 2005

大数据到底怎么学:数据科学概论与大数据学习误区

"数据科学家走在通往无所不知的路上,走到尽头才发现,自己一无所知."-Will Cukierski,Head of Competitions & Data Scientist at Kaggle 最近不少网友向我咨询如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题.由于大数据技术涉及内容太庞杂,大数据应用领域广泛,而且各领域和方向采用的关键技术差异性也会较大,难以三言两语说清楚,本文从数据科学和大数据关键技术体系角度,来说

数据湖恶化成了数据沼泽?你一定没有注意这3点

多年来,在Apache Hadoop等技术的支持下,组织一直在寻求构建数据湖--企业范围的数据管理平台,允许以原生格式存储所有数据.数据湖可通过提供给一个单一的数据存储库来打破信息孤岛问题,整个组织都可以使用从业务分析到数据挖掘的所有东西.原始和不受约束,数据湖被认为是一个包罗万象的大数据. 但是,商业智能(BI)软件专家,金字塔分析公司的首席技术官Avi Perez说,他看到许多客户的数据湖正在恶化为数据沼泽--完全无法接近终端用户的大量数据存储库. "数据库真的很贵."Perez说