大数据时代的四类数据和四类公司

大数据用于描述这样的数据组,其规模超出了日常软件在可容忍期限内获取、管理和加工数据的能力。一些网络技术领先的公司持续地投资于昂贵的大数据技术,成效显著。大数据使得创新型公司变成了经营新方法的率先接受者,经营更为成功。

当今世界,大数据无处不在,它影响到了我们的工作、生活和学习,并将继续施加更大的影响。

大数据用于描述这样的数据组,其规模超出了日常软件在可容忍期限内获取、管理和加工数据的能力。一些网络技术领先的公司持续地投资于昂贵的大数据技术,成效显著。大数据使得创新型公司变成了经营新方法的率先接受者,经营更为成功。通过大数据的分析挖掘,公司可以发现新的经营模式,对工艺加以改进。例如,在获悉消费者行为后,可以将发现用于某些改变,如降低成本或增加销售,就会产生价值。在任意大的数据组中应用统计方法可以发现有用信息,将这些信息商业化即可获益。

大数据时代一切在变,应对之策是改变一切。经营方式发生了变化——制定决策变得与开展行动深度融合;运用信息的方式发生了变化——从处在经营的边缘变成了处于所有方面的中心;技术发生了变化——从批处理到实时处理,从分割到融为一体;人们工作的方式发生了变化——从在命令和控制模式下运作到在合作环境下负责自己的信息和交互应用。

根据麦肯锡全球研究所的分析,利用大数据在各行各业能产生显著的财务价值。美国健康护理利用大数据每年产出3000 亿美元,年劳动生产率提高0.7%;欧洲公共管理每年价值2500 亿欧元,年劳动生产率提高0.5%;全球个人定位数据服务提供商收益1000 多亿美元,为终端用户提供高达7000 亿美元的价值;美国零售业净收益可增长6%,年劳动生产率提高0.5—1%;制造业可节省50%的产品开发和装配成本,营运资本下降7%。

根据国际数据公司(IDC)的测算,2011 年数字世界将产生1800EB 的数据,2012 年会增长40%,达到2500EB。截止2020 年,会达到35000EB,似乎没有足够的磁盘空间存储。就传统IT 企业来看,其结构化和非结构化的数据增长也是惊人的。2005 年企业存储的结构化数据为4EB,到2015 年将增至29EB,年复合增长率逾20%。非结构化数据发展更猛。2005 年为22EB,2015 年将增至1600EB,年复合增长率约60%,远远快于摩尔定律。

当今大数据的来源除了专业研究机构产生大量的数据外(CERN 的离子对撞机每秒运行产生的数据高达40TB),与企业经营相关的大数据可以划分为四个来源:

1.越来越多的机器配备了连续测量和报告运行情况的装置。几年前,跟踪遥测发动机运行仅限于价值数百万美元的航天飞机。现在,汽车生产商在车辆中配置了监视器,连续提供车辆机械系统整体运行情况。一旦数据可得,公司将千方百计从中渔利。这些机器传感数据属于大数据的范围。

2.计算机产生的数据可能包含着关于因特网和其他使用者行动和行为的有趣信息,从而提供了对他们的愿望和需求潜在的有用认识。

3.使用者自身产生的数据/信息。人们通过电邮、短信、微博等产生的文本信息。

4.至今最大的数据是音频、视频和符号数据。这些数据结构松散,数量巨大,很难从中挖掘有意义的结论和有用的信息。

大型以Internet 为核心的公司,如Amazon, Google, eBay, Twitter 和Facebook 正使用后三类海量信息认识消费行为,预测特定需求和整体趋势。第一类数据可能产生较少的业务,但可以推动某些经营模式实质变革。例如,汽车传感数据用于评价司机行为会推动汽车保险业的深刻变革。

大数据改变了所有行业全部公司的经营方式。从对市场的理解到如何挖掘经营信息,大数据能洞察每项转变。一个致力于收集和分析大数据的行业业已形成,对现有公司产生了深刻影响。据有关调查,有10%的公司认为在过去的五年中,大数据彻底改变了它们的经营方式。46%的公司认同大数据是其决策的一项重要支持因素。

时间: 2024-10-21 14:41:09

大数据时代的四类数据和四类公司的相关文章

CIO时代APP微讲座:南京邮电大学李涛深度解读大数据时代的数据挖掘

3月13日下午,南京邮电大学计算机学院.软件学院院长.教授李涛在CIO时代APP微讲座栏目作了题为<大数据时代的数据挖掘>的主题分享,深度诠释了大数据及大数据时代下的数据挖掘. 众所周知,大数据时代的大数据挖掘已成为各行各业的一大热点. 一.数据挖掘 在大数据时代,数据的产生和收集是基础,数据挖掘是关键,数据挖掘可以说是大数据最关键也是最基本的工作.通常而言,数据挖掘也称为Data Mining,或知识发现Knowledge Discovery from Data,泛指从大量数据中挖掘出隐含的

李涛:深度解读大数据时代的数据挖掘

3月13日下午,南京邮电大学计算机学院.软件学院院长.教授李涛在CIO时代APP微讲座栏目作了题为<大数据时代的数据挖掘>的主题分享,深度诠释了大数据及大数据时代下的数据挖掘. 众所周知,大数据时代的大数据挖掘已成为各行各业的一大热点. 一.数据挖掘 在大数据时代,数据的产生和收集是基础,数据挖掘是关键,数据挖掘可以说是大数据最关键也是最基本的工作.通常而言,数据挖掘也称为Data Mining,或知识发现Knowledge Discovery from Data,泛指从大量数据中挖掘出隐含的

大数据时代的数字营销趋势

mbaonline网站曾发布了一个有意思的统计叫<互联网的一天>:一天内互联网产生的数据流量可以装满1.68亿张DVD光盘:上传到Facebook的照片打印堆积起来有80个埃菲尔铁塔那么高:上传到Youtube的视频时长可以不间断播放98年:在Pandora播放音乐的时长达到1.87亿小时,如果一台电脑从公元1年开始播放,到现在还没有播完-- 毋庸置疑,我们已经进入大数据(Big Data)时代,这些庞杂的数据是垃圾也孕育商机,而最先将这里数据挖掘清洗产生商业价值的,正是网络广告人.正如Fac

大数据时代的危害性与局限性

2月3日消息,白宫去年曾发表书面声明称,"大数据将作为历史性的驱动因素,帮助美国持久性地促进社会与经济活力",其创造的社会价值与经济价值得以遵从该国提倡的"隐私.公正.平等.自主".然而事实真的如此吗?大数据时代的危害性与局限性又是否会赶超其效益性? 某知名评论人表示,白宫这一努力平衡大数据成本与收益的举措,实则阻碍了其长远发展的大局观.此外,雅虎首席执行官玛丽萨·梅耶尔(Marissa Mayer)表示,数据驱动技术仅仅是政府.工业企业.民间社会做出重大决定的因素

共享+结合 大数据时代几个关键问题剖析

大数据时代来临,每个公司都应该重视起数据部门.以前搜集数据没有足够的时间.能力.资源,因而无法获得更多的支撑.因为数据量不够.当我们有了更多的数据,我们看到的东西发生实质的变化,我们以前从来没有看到过这种情形.足够的数据,让我们更好的理解彼此,达到历史绝无仅有的水平. 大数据的核心在于共享 大数据之父舍恩伯格说"大数据的核心要义在于共享." 我们的各级政府.公共机构汇集了存量大.质量好.增长速度快.与社会公众关系密切的海量数据资源.除了部分分享自用和信息公开外,大部分没有充分发挥数据源

解析:大数据时代的城市设计模式如何?

智慧城市是城市发展的高级形态,需要经过持续的复合创新发展过程才得以实现.城市设计与科技的结合,不仅仅是解决城市问题,还将有利于城市发展,也将是未来发展趋势. 一般而言,城市的向上发展大致经历资源中心(资源输出).生产中心(加工).消费中心.资本中心再到价值中心5个层级.一个城市在同一层级上的发展主要依赖要素的积累和规模增长,实现层级的跃升则要依赖创新.目前,全球城市正处于升级阶段,需要城市不断创新.而城市创新则需要科技创新.文化创新.资本创新和生活方式创新的"四轮"驱动.其中,科技创新

罗伯特·汉姆:在大数据时代生存

在最热的IT话题中,云和大数据的简化IT趋势和一体化理念,早在1996年美国CommVault(康孚)公司成立之初,就被其CEO 罗伯特·汉姆(N.Robert Hammer)确定为发展方向,并在多年后的今天得到市场和业界认可.现在,CommVault常被华尔街分析师们看作惠普.戴尔等IT巨头在软件业务上的收购目标.不过罗伯特·汉姆否认了收购一说:CommVault目前市值29亿美元,单股股价从最初3美分涨到65美元,汉姆认为已经没有公司"买得起" CommVault了.今年年初,这家

全球迈入大数据时代:中国金融第四城崛地而起

[新常态下,在大数据领域把"无"变成了"有"的贵州,抢占先机打造金融枢纽,一个立足贵州.面向西南.服务西部.辐射全国的以大数据.互联网+作为核心竞争力的金融集散中心正在形成] [2015年贵州大数据产业规模总量已达到1000亿元,根据贵州省的规划,到2020年,贵州大数据产值规模达到2000亿元,相关产业产值4500亿元.] 如何在传统经济发展中,利用好当前中国乃至世界经济新常态下转型带来的机遇,发掘新的经济增长点成为更多地域需要思考的问题.而贵州在这一问题上大幅抢

揭开全体数据的神秘面纱(下)--疑读《大数据时代》(四)

本文接着继续对全体数据进行更多的分析. 更多关于全体数据的取样 就上篇文章中迈尔大叔所举的那个全体数据的例子来说,分析人员只取了数据库中四个月的数据进行分析.为什么?因为分析的任务不是要得到数据库中每个顾客长期的人脉关系,而是通过一定时期内http://www.aliyun.com/zixun/aggregation/7185.html">人际关系的分析,了解拥有不同人际关系的个人对整个社区关系网的影响.因此,适当的阶段性数据的取样就十分必要. 试想一下,如果研究人员采用了数据库中所有的数