FB“大数据”45天耗100万:不是所有公司都需要

也许你并不需要大数据  2012年“大数据”的发展如火如荼,然而本文的作者,数据分析公司SiSense副总裁Bruno Aziza却认为并不是每个人都需要大数据。  “大数据”无处不在。从社交媒体初创公司到纽约的中央公园,每个公司似乎都在部署大数据分析。  著名数据分析公司Gartner的数据似乎也在证明这一点:最近的一份报告显示,大数据将带动2012年全球280亿美元的
IT支出,到2016年这个数字将超过2300亿美元。2300亿美元几乎是葡萄牙全年的国内生产总值。  但是,你需要花大价钱来部署大数据技术解决方案。大多数公司都没有这么多IT预算,也请不起数据科学家或者数据分析团队。  如果那些提供大数据服务的公司想为各种规模的企业提供服务,那么有几个问题必须认识到并加以解决。  大数据太贵了!  您可能听说过那些使用大数据的辉煌案例:Facebook每天要存储大约100TB的用户数据;NASA每天要处理约24TB的数据。这些数字确实令人印象深刻。  那么处理这些数据所需的成本是多少呢?按照亚马逊Redshift的定价,NASA需要为45天数据存储服务支付超过100万美元。  根据最近的一项调查,大多数企业的CIO称他们的预算支付不起大数据部署的成本。数据存储和处理的成本实在太高,我们需要寻求其他的解决方案,让规模较小的公司不被“大数据”拒之门外。  大数据的关键不是“大”  目前全球最大的科技公司都需要和PB级规模的数据打交道。然而,SAP的研究表明,95%的企业通常只需要使用0.5TB到40TB的数据。  Facebook和NASA的例子是个例外,而不是常态。事实是,处理数据并不是大公司的专利。如果你研究一下美国公司的规模,你会发现有超过50000家公司只有20至500名员工,其中大部分都有解决数据问题的需求。所以大数据市场最大的需求并不是来自那些《财富》50强的大企业,而是来自《财富》500000强。为什么我们只关注那些少数的例外,而忽视了那些大多数有数据处理需求,但既不是《财富》50强也没有PB级规模数据的公司?  有时候我在想,如果我们改变了大数据的定义会发生什么?通常人们用3V(velocity,volume,variety)来描述大数据,我们不妨换一个说法:“大数据是一种主观状态,它描述的是一个公司的基础架构无法满足其数据处理需求时的情形。”  这个定义可能没有那么光鲜,但它肯定会更接近今天的现实。

时间: 2024-10-23 03:25:21

FB“大数据”45天耗100万:不是所有公司都需要的相关文章

数据统计-假如有100万条微博,需要统计里面@谁 的次数最多,有什么好算法?

问题描述 假如有100万条微博,需要统计里面@谁 的次数最多,有什么好算法? 假如有一个文本文件,每行存放一条微博. 微博的内容形如:@测试1 @测试2 #话题#test123@测试1 test123test @测试1 数据量是100万行 需求是统计出这些微博中@用户 次数最多的top100 请问有什么好的算法或者思路吗? 解决方案 简单啊,用hash过滤重复的,然后再把用户编号 开一个数组映射啊 解决方案二: 我用过php的,思路: 1.用php把100万行的文件分割成100个1万行的文件,为

“大数据时代”将撬动万亿元级GDP

汹涌澎湃的大数据浪潮,正携带着巨大商机,撞击传统经济的概念和思维.大数据孕育和驱动下的新产品.新服务.新产业层出不穷,并日益深刻地改变着每个人的日常生活.一个基于技术进步的"大数据时代"正在来临. 在互联网基础上发展起来的社交网络.电子商务.移动通信.可穿戴设备等"云计算"技术,让"抽样数据"迅速让位"全体数据","全体数据"即"大数据"时代的来临,使"知全豹"不仅成

【深度】淘金大数据:航空工业催生万亿商机

在被称为"空难年"的2014年,马航MH370失联.MH17被击落,台湾复兴航空GE222迫降重摔,阿尔及利亚航空AH5017坠毁,航空安全再次成为全球焦点. 一场基于互联网和大数据的产业升级战役,在航空业的上游制造企业最先打响. 9月26日,霍尼韦尔(Honeywell)的高级研发工程师王睿获得私人飞行驾驶执照PPL (Private Pilot License)刚好满半年.如果算上此前历时4个多月的飞行训练,过去一年多时间里,从事先进飞机驾驶舱相关研发工作的王睿,经历了一次思维蜕变

Gartner:2015年度大数据相关岗位达到440万人

根据Gartner对未来的预测,2015年度全球与大数据相关的工作岗位将达到440万人.大部分的美国公司都开始争先恐后地寻找到自己在大数据之中的角色,与此同时也发现合适的人才已经越来越难以找到了. 数据科学家独有的技能和与大数据最紧密的关系,使得他们被称为21世纪最为性感的工种. 大数据科学院需要在统计.预测建模.业务决策.系统整合和编程等方面都具有良好的知识功底.他们需要的是,以非技术人员的方式来传递他们所理解的数据,并帮助企业做出决策,如何影响投资回报率.如何控制风险和客户服务等.

新加坡大数据初创公司 Latize 获 150 万美元风险融资

  在过去的两个世纪,我们陆续见证了计算机革命和互联网革命,而紧接着,我们又迎来了大数据革命.然而,如果没有大众的广泛参与和贡献,真正的革命很难发生.新加坡大数据初创公司Latize紧跟大数据变革趋势,推出数据管理平台Ulysses,帮助非技术用户捕捉.整合并使用数据. 在投资领域,大数据也在日益成为主流趋势,正在吸引着越来越多投资者的关注.得益于这种投资大趋势,Latize 近日获得150万美元早期成长资金,投资者包括Tembusu ICT Fund.ACP Venture Capital 和

“十三五”大数据产业规模将过万亿元

日前发布的<2017-2022年中国大数据产业发展前景与投资战略规划分析报告>显示,中国大数据产业市场在未来五年内,仍将保持着高速增长.预计2016年年末,市场规模将达到2485亿元,而随着各项政策的配套落实及推进,到2020年,中国大数据产业规模或达13626亿元的高点. 前瞻产业研究院认为,通过大数据技术使人们可以利用以前不能有效利用的多种数据类型,抓住被忽略的机遇,使企业机构变得更加智能和高效.大数据的重心将从数据的存储和传输过渡到数据的挖掘与应用,这将深刻地影响企业的商业模式,既可直接

一文看懂大数据的技术生态圈,Hadoop,hive,spark都有了

大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的.你可以把它比作一个厨房所以需要的各种工具.锅碗瓢盆,各有各的用处,互相之间又有重合.你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮.但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择. 大数据,首先你要能存的下大数据. 传统的文件系统是单机的,不能横跨不同的机器.HDFS(Hadoop Distributed FileSystem)的设计本质上是为了大量的数据

大数据为中国快递业带来革命:物流公司遇挑战

核心提示:马云在讲话中预测,不出8年,中国每天将生产出10亿个包裹,这将给所有物流公司带来巨大的挑战. 6月10日报道 西媒称,"大数据"正通过计算最佳实时传送路线的算法和无人机为中国的快递服务业带来一场革命. 据西班牙<世界报>网站6月7日报道,世界银行中国.蒙古国和韩国局局长郝福满两周前在杭州召开的2017全球智慧物流峰会上表示,由于人口庞大以及商品生产和消费影响力日益增加,亚洲拥有引领智能物流发展的巨大潜力.峰会汇集了全球5000多名代表以及物流和技术领域的企业,包括

Zynga拟100万美元资助科教公司:开发学习游戏

Zyngahttp://www.aliyun.com/zixun/aggregation/32086.html">首席执行官马克平克斯 北京时间5月2日消息,据国外媒体报道,社交游戏厂商Zynga旗下非盈利组织Zynga.org计划当地时间周三宣布将在一个新项目中投资100万美元,帮助创业公司开发有助于儿童学习的游戏.Zynga已经选定部分创业公司加入该项目,并将帮助创业公司改进产品. Zynga.org合作伙伴是非盈利性投资机构NewSchools Venture Fund.两家机构将从