大数据:在信息的海洋里寻找洞见

什么是「大数据」(Big data)?研究机构 Gartner 给出了这样的定义。「大数据」是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据是数据分析的前沿技术。从各种类型的数据中,快速获得有价值信息的能力,就是大数据技术,这也正是促使大数据技术具备走向众多企业的潜力。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,通过「加工」实现数据的「增值」。

近 10 年来,政府和企业在世界范围内收集了大量互联网用户的数据,不仅仅是姓名和数字,而是一连串数据---大数据。国际数据公司(International Data Corporation) 最近预测大数据行业复合年增长率将达到 26.4%,在 2018 年达到 415 亿美元。这意味着越来越多的企业和组织将花费巨资研究分析大数据并获得有价值的信息。负责美国宇航局在加州帕萨迪纳市的喷气推进实验室大数据的 Chris Mattmann 表示,NASA 总共管理着几百 PB 容量的数据,几乎达到 1EB。

1 EB(Exabyte,艾可萨字节或艾字节) 是多少容量?这意味着 10 亿 GB,像这样:1000000000 GB。

这些巨大的数据扩散的速度如此之快以至于传统的数据技术跟不上它们的节奏。TNS 市场研究公司 (Taylor Nelson Sofres)亚太地区首席执行官 Chris Riquier 告诉我大数据对市场研究有非常大的影响。Riquier 表示,市场研究是建立在调研和问卷调查之上的。他讲道,在过去,调研的过程或花费数周的时间,最终用呈现的数据来分析企业规模和相关信息,通过整合社交媒体数据、搜索数据以及其他形式的大数据来做成报告,而现在我们有机会来「重新思考研究是如何完成的。」Riquier 表示,由于大数据,我们对「市场和决策力的反应已经发生了很大的变化。」

在今天的数字世界里,大数据通过跨行业、政府、科学、公共健康和学术界来发现相关性。在过去,从信息里的海洋里获得有用的数据信息对大多数人来说一直是可望而不可即的事情。直到去年,哈佛杂志在 2014 年刊登的一篇文章,标题为「为什么大数据是一桩大买卖?」(Why「Big Data」is a Big Deal),文中表示通过改进的统计和计算方法, 包括关联数据集、可视化数据以及创建「大算法」等这些关键的创新,能使我们快速处理这些数据并为我们所用。从物理学家到文天学家,他们长期与大数据打交道,数据科学家和社会学家通过结合定量与定性的方法来从大数据中获得有用的信息。实际上,大数据正在创造一个新领域,哈佛大学工程与应用科学学院为此开设数据科学硕士学位。

在《大数据-一场改变我们生活、工作和思考的革命》一书中,Viktor Mayer-Schonberger 和 Kenneth Cukier 谈到企业是如何改变方式来做出决策---基于对大数据的分析。例如,谷歌通过其收集的大数据来预测预测禽流感的散布,其反应速度比美国疾病控制中心还要迅速。

据华尔街日报最近的一篇文章,加拿大银行使用由开源软件开发商 Apache 开发的 Hadoop 来储存和处理大数据,并能识别洗钱和欺诈等犯罪行为。

大数据之于普通人

哈佛、NASA、谷歌和 Apache 利用大数据的分析能力在世界范围内带来先进的技术,但就像我之前提到的,这并不意味着科学家们能很快从大数据中受益。让我们来看一看一些企业和公司在收集和管理大数据的几个方面。

其中大数据最主要的一个用途就是在市场中的搜索引擎优化(SEO)。公司和企业能利用搜索引擎公司如谷歌和必应提供的工具,结合不同的社交媒体数据,收集有用的信息来进行网络营销。咨询公司 Hall Analysis 的研究员 Joe Hall 主要研究搜索引擎优化和大数据,他表示有两种方法能使用大数据来处理搜索引擎优化。

他说:「第一种是处理与大数据集有关联的业务。在大多数情况下这意昧着大品牌和大企业能获得非常多的数据。」Hall 引用一个例子,一个客户有 1600 万个反向链接,或者从其他网站链接指向客户的网站。这些链接对谷歌和其他搜索引擎来说是一个非常重要的排名因素。他解释说,数据集的大小需要像模式分析那样有强大的处理各种任务的能力,并在这种水准下为反向链接分析改变规则。

Hall 表示,第二种方法是公司能利用大数据使搜索引擎优化变得更具态势感知能力。这表明使用相关性研究能更好了解排名因素以及用户点击率、排名结果页面等用户行为分析。这两种分析类型都需要大数据分析来达到最终的目的,并能有效帮助 SEO 专家开阔一个「更大的局面」。

另一方面是大数据在商业活动中能获得用户的忠诚度。举个例子,比如我是一个创业公司的创始人,在我成功运作公司的第一年后,公司业绩蒸蒸日上,于是我给自己放个大假,去夏威夷度假。但在机场安检的时候,检票员告知我由于我的箱子超重,我需要付额外的费用。但是检票员可能不知道,作为一个成功创业公司的创始人和 CEO,我和我的员工将会在全世界各大城市奔波,为航空公司贡献更多的里程。如果航空公司使用大数据整合来自信用卡公司、社交媒体源、博客、酒店等相关信息,他们会可能取消这样的额外收费还能获得一个忠诚的客户。

无论是大公司的 CEO 或是研究癌症的医生,或是一个淘宝店老板,使用大数据分析都将会为他们带来有价值的信息。如今,在日常工作中我们可以利用大数据来获得有价值的信息。当我们进入到这样一个时代:基于大数据分析来作出决策,这将不可避免地改变我们思考世界的方式。

今天这一代人出生在数字化时代。而下一代人将进入大数据时代。

本文作者:佚名

来源:51CTO

时间: 2024-11-14 12:39:09

大数据:在信息的海洋里寻找洞见的相关文章

大数据推动信息安全产品更智慧

文章讲的是大数据推动信息安全产品更智慧,2013年最热门的科技词汇非"大数据"莫属,其相关书籍长期霸占各大畅销书排行榜,人们对于大数据给出了前所未有的关注度.大数据所带来的新思想,正在逐步渗透进每一个行业,改变着我们每一个人作为数据创造者的思维方式.大数据问世之前,正是互联网.云计算.物联网等技术快速发展的时期,而随着智能终端.数字城市等信息体的普及和大范围建设,任何人任何时刻在任何地点都在产生数据,全球数据量出现爆炸式增长,大数据时代已经到来.大数据的出现为信息安全带来了巨大的挑战也

AdTime:大数据 发挥信息消费引擎作用

文章讲的是AdTime:大数据 发挥信息消费引擎作用,当前,拉动我国经济增长的传统"三驾马车"(投资.出口.消费),出现出口下滑,投资谨慎的情况,而消费的巨大空间便受到了前所未有的期待.在消费领域中,信息消费的强劲表现更为抢眼.今年1月~5月,我国信息消费的规模达到1.38万亿元,同比增长了19.8%,信息消费正在成为市场新的亮点和热点. 7月12日,国务院常务会议提出要促进信息消费.信息消费之所以如此受重视,工信部电信研究院曾表示,信息消费不但"稳增长"的潜力巨大

充分利用大数据 从信息爆炸中获取价值

文章讲的是充分利用大数据 从信息爆炸中获取价值,信息优化的目标为构建一个服务于整个企业,从数据安全及合规,到分析和敏捷性的统一基础设施.而由此带来的快速.轻松分析信息的能力能够帮助企业获得更可靠的视图,从而做出准确.有效的决策. 根据Coleman Parkes Research的研究表明,亚太和日本地区62%的私有企业认为有效的信息优化战略能帮助其获得竞争优势. 但是仅有不到一半的企业采用了合适的解决方案并从大数据中获得洞察,而目前仅有15%的企业将非结构化数据纳入了其企业洞察.流程和战略.

大数据成为信息再价值化的金矿

云计算作为新一代信息技术的重要发展方向,已被广泛认为是支撑信息化应用和业务模式创新的核心,其技术与产业发展,以及应用的推广普及,对于我国深入推进两化融合.完善社会管理手段.转变经济发展方式具有重要战略作用.在云计算技术的支撑下,大数据已经成为新时代重要的战略资源.随着经济社会信息化日臻成熟,云计算.移动互联网和物联网等新一代信息技术的广泛应用,数据增长速度越来越快,数据类型越来越丰富,大数据的价值日渐凸显.大数据时代,无论是政府.互联网公司.IT企业还是行业用户都面临巨大挑战及机遇.企业的决策方

个人敏感信息滥用 大数据时代信息保护遭挑战

我们的背后不知道有多少窥视的眼睛,身份.位置.银行账号--各种个人敏感信息正被各形各色的采集者获取,滥用.泄露的风险无处不在.大数据时代,个人信息保护正遭受严峻的挑战. 你放心把自己的钥匙交给陌生人吗? 在不久前支付宝的一次升级中,用户可以提供更多信息用以提升芝麻信用值.当中国移动员工宁宇发现支付宝希望客户提供客服密码,授权给芝麻信用使用时提出了质疑:"把你的客服密码告诉支付宝,就等于把自己家的钥匙交了出去,你放心么?" 我国电信运营商都要求客户设置客服密码,通过这组6位数字的密码可以

个人敏感信息滥用 大数据时代信息保护遭严峻挑战

我们的背后不知道有多少窥视的眼睛,身份.位置.银行账号--各种个人敏感信息正被各形各色的采集者获取,滥用.泄露的风险无处不在.大数据时代,个人信息保护正遭受严峻的挑战. 你放心把自己的钥匙交给陌生人吗? 在不久前支付宝的一次升级中,用户可以提供更多信息用以提升芝麻信用值.当中国移动员工宁宇发现支付宝希望客户提供客服密码,授权给芝麻信用使用时提出了质疑:"把你的客服密码告诉支付宝,就等于把自己家的钥匙交了出去,你放心么?" 我国电信运营商都要求客户设置客服密码,通过这组6位数字的密码可以

Matt Turck:大数据行业信息图以及一些思考

摘要: 编者按:本文来自潘星键投稿(@星键V:微信:akavir),他在汤森路透从事数据质量分析工作近7年,文章编译自 Matt Turck < The State Of Big Data in 2014: a Chart >, Matt Turck曾任Bloomberg Ventu 编者按:本文来自潘星键投稿(@星键V:微信:akavir),他在汤森路透从事数据质量分析工作近7年,文章编译自Matt Turck<The State Of Big Data in 2014: a Char

产品和应用前景广阔 大数据为信息社会赋能

今年5·17世界电信和信息社会日主题是"发展大数据,扩大影响力",这是国际电信联盟首次将"大数据"设为主题.发展大数据最活跃的是互联网公司,与BAT等互联网巨头相似,通信运营商储存和管理的数据量也十分惊人,通过把数据变为工具,使之成为GDP的"倍增器". 目前,整个通信网络正在努力实现支持更大数据流量和更多终端的连接,5G带来的万物互联远景将会使整个通信网络中增加上百亿的连接,这些连接需要通过大数据.云计算等技术赋予更多的智慧,为整个信息社会赋能

大数据时代信息监控VS个人隐私 各国怎么做?

2月中旬,一名中国留美学生向学校请了半个月假回国过年,当她重返美国时,在洛杉矶机场被美国海关盘问.该留学生被要求上交手机供美国海关检查,官员在她和朋友的微信聊天中发现,她曾表示:"我不喜欢这个学校,不是真的想上学,只是临时挂一下身份."美国海关因此认定她隐瞒了来美国的真实目的,拒绝她入境. 美国海关及边境保卫局的公共事务专家称,所有到达美国的国际访客都要经过检查,这种检查包括手机.Ipad等电子设备. 在大数据时代中,人们对电子设备的使用率和依赖度极高,正因此,政府对公民电子设备的监督