大数据应当追求数据精确而非大而全

在目前的南方大规模降雨中,百度、阿里巴巴等多家公司利用大数据,即时发布武汉等城市街道积雨状况的地图,提醒出行市民提前避让。这显示了大数据的巨大威力和前景。

在日前举办的中国大数据产业峰会暨中国电子商务创新发展峰会上,中国工程院院士、中国互联网协会理事长邬贺铨向记者表示,大数据不能追求以大盖全,而应当追求数据精准并强调规律。“对一个大数据集而言,我们很难要求所有数据都精准,但只要大多数数据有代表性,就不妨碍我们利用数据集合得到较为准确的结果。”

据介绍, 2015年、2016年两年内,全世界新产生的数据量约等于人类有史以来到2014年全球累积数据量的总和。邬贺铨认为,大数据具有增长性、颗粒性、异构性、移动性、多维性、隐私性等特点。他以医疗大数据为例介绍说,一个千万人口的国内城市50年累计的医疗数据量,预计能达到10PB级。这些数据具有多样性和碎片化的特点,颗粒性大小差别很大。未来,人们需要将这些非结构化数据转换为结构化数据进行处理和储存。

“我们正加速进入大数据时代,但并不是所有数据都能开放,而是按照分类来进行部分开放。”邬贺铨说,大数据有很多来源,包括社会空间数据、物理空间数据和信息空间数据。比如国家安全数据、商业秘密数据、个人隐私数据这三方面的数据就不能开放。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-07-29 20:52:32

大数据应当追求数据精确而非大而全的相关文章

如何收集智能数据,而非大数据

今天媒体和IT企业都在极力鼓吹大数据,不过我们可以看看有多少企业现有的数据是利用好的呢?可能很少. 举个简单的例子,在大数据上也废了一番功夫的淘宝.我曾经在淘宝上购买了一个柜子,但是购买完成后,淘宝平台给我推荐的东西却是其他店面的柜子.这种推荐真的让我哭笑不得.我毕竟不是开家具卖场的,不至于短期内要买一堆类似的产品.我相信淘宝上有我的交易数据,也有一些个人信息.数据量是可以分析出我是个人购买还是企业购买. 所以,先撇开大数据不谈,就我们今天有的数据,我们是否真的擅长使用他们吗?最近美国一家数字营

大数据的未来是App 而非基础架构

在大数据被各种媒体热炒的同时,真相被蒙蔽了:App才是大数据的未来.过去http://www.aliyun.com/zixun/aggregation/13748.html">基础架构和平台一直是被捧吹的对象,但它们只提供了承载大数据的环境,无法利用大数据创造长期价值,所以它们并不是大数据的未来核心. 在市场上它需要公司提供大数据App,能够洞察特定市场版块或业务流程.及时反馈数据.到达尽可能多的调差对象.因为很少有熟练的大数据从业者可以为每个组织(公司)提供非常专业的数据分析服务. 而且

大数据,小数据,哪道才是你的菜?

美国著名科技历史学家梅尔文•克兰兹伯格Melvin Kranzberg曾提出过大名鼎鼎的科技六定律其中第三条定律是这样的[1]"技术是总是配"套"而来的但这个"套"有大有小Technology comes in packages, big and small". 这个定律用在当下是非常应景的.因为我们正步入一个"大数据big data"时代但对于以往的"小数据small data"我们能做到"事了

别让商务大数据的思路,误了工业大数据

最近闭幕的十八届五中全会把大数据战略提高到一个前所未有的层面---实施国家大数据战略,推进数据资源开放共享.笔者在此想谈一下对推进工业大数据的一点看法. 大数据的概念与背景 大数据是最近几年才热起来的一个概念.大数据热大约在2012年前后在中国出现.其中,涂子沛先生的<大数据>一书起到了重要的作用."除了上帝,任何人都必须用数据来说话"这句话,更是得到了时任广东省委书记汪洋(现为国务院副总理)的高度肯定. 读过这本书的人都知道:涂子沛关注的重点是大数据对政治.社会.伦理等方

《大数据、小数据、无数据:网络世界的数据学术》一 2.2 定义与术语

2.2 定义与术语 学术文献.政策声明和大众媒体中到处都充斥着对数据的讨论,它们都尝试定义业内术语.罗森博格(Rosenberg 2013)指出,即使是在科学史和认识论历史中,人们也只是在无意间提及数据(Blair 2010:Daston 1988:Poovey 1998:Porter 1995).其他在科学领域中讨论事实(fact).表示(representation).记录册(inscription)和出版(publication)等含义的基础性作品也很少关注数据本身(Bowker 2005

从数据来源、数据生态、数据技术、数加平台等方面,漫谈阿里大数据

目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象.我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的大数据,不是几篇文章就能说清楚的. 一,DT时代 大数据这个概念,其实在上世纪九十年代就有人提出来了,当时希望通过将所有零散的数据归并起来,然后进行数据挖掘,以看到以前存在的问题,去预测未来几年的趋势,来指导商业决策.比如保险行业,人寿保险会通过大数据的统计计算,根据人均寿命来计算保费与回报率. 这

《大数据算法》一1.2 大数据算法

1.2 大数据算法 这一节我们概述大数据算法. 1.2.1 大数据上求解问题的过程 首先我们看一看在大数据上问题求解的过程.我们面对的是一个计算问题,也就是说我们要用计算机来处理一个问题. 拿到一个计算问题之后,首先需要判定这个问题是否可以用计算机进行计算,如果学习过可计算性理论,就可以了解有许多问题计算机是无法计算的,比如判断一个程序是否有死循环,或者是否存在能够杀所有病毒的软件,这些问题都是计算机解决不了的.从"可计算"的角度来看,大数据上的判定问题和普通的判定问题是一样的,也就是

大数据就是占有数据?错,如何使用更重要!

数据,数据,数据. 置身于当下的每个营销峰会,人们讨论的焦点都绕不过这两个字.台上的演讲嘉宾中,开始有了越来越多互联网的身影,从他们口中蹦出的专有名词也不再为传统广告人熟知,每个广告主看起来都开始更关心效果而非创意. 种种迹象表明,广告的变局正悄然开始. 没有人会否认大数据对广告营销的重要性,但也没有人能否认,随着数字营销进程的不断加快,传统营销的经验已经不适用于这个新的时代.广告主们正走入"无人区",它们亟需一套新的方法论解决营销过程中产生的全新的难题:如何解决数据孤岛?如何把数据应

网络已成播放营销主阵地 大数据助力影视数据统计

我常常追热播的电视剧,但是很少打开电视,都是从网上看.""90后"张晓这样说.像她一样,有越来越多的人已经改变了传统习惯,选择从网络而非电视上收看影视剧. 在这样的收视环境下,线上数据成为了影视剧播放.营销的主阵地.云合数据首席执行官李雪琳认为,"就中国影视剧市场而言,内容的变现方式已经逐渐转移到网络上,使数据的重要性得到了极大的提升."那么影视数据线上统计现状如何?未来又会有何新趋势呢? 现状:繁荣与虚假并存 "吴刚老戏骨,演得真好"