深入浅出——大数据那些事

 

现在,大数据是一个被滥用的流行词,但是它真正的价值甚至是一个小企业都可以实现。通过整合不同来源的数据,比如:网站分析、社交数据、用户、本地数据,大数据可以帮助你了解的全面的情况。大数据分析正在变的越来越容易,成本越来越低,而且相比以前能更容易的加速对业务的理解。

 

大数据通常与企业商业智能(BI)和数据仓库有共同的特点:高成本、高难度、高风险。以前的商业智能和数据仓库的举措是失败的,因为他们需要花费数月甚至是数年的时间才能让股东得到可以量化的收益。然而事实并非如此,实际上你可以在当天就获得真实的意图,至少是在数周内。

 

为什么使用大数据?

数据在呈爆炸式的速度增长。其中一个显著的例子来自于我们的客户,他们大多使用谷歌分析。当他们分析一个长时间段数据或者使用高级细分时,谷歌分析的数据开始进行抽样,这会使得数据的真正价值被隐藏。现在我们的工具Clickstreamr可以收集点击级的巨量的数据,因此你可以追踪用户在他们访问路径(或者访问流)中的每一个点击行为。另外,如果你加入一些其他的数据源,他就真正的变成了大数据。

 

更完整的解析

大数据并不仅仅是大量的数据。他的真正意义在于根据相关的数据背景,

来完成一个更加完整的报告。举个例子,如果你把你的CRM数据加入到你网站的数据分析当中,你可能就会找到你早就知道的高价值用户群。她们是女性,住在西海岸,年龄30至45,花费了大量的时间在Pinterest和Facebook。

 

现在你已经被这些知识武装起来了,那就是如何有效的设定和获取更多高价值的用户。类似Tableau和谷歌这样的公司给用户带来了更加强大的数据分析工具(比如:大数据分析)。Tableau提供了一个可视化分析软件的解决方案,每年的价格是2000美金。谷歌提供了BigQuery工具,他可以允许你在数分钟内分析你的数据,并且可以满足任何的预算要求。

 

大数据是什么?

由于大数据往往是一个混合结构、半结构化和非结构化的数据,因此大数据变得难以关联、处理和管理,特别是和传统的关系型数据库。当谈到大数据的时候,高德纳公司(Gartner Group,成立于1979年,它是第一家信息技术研究和分析的公司)的分析师把它分成个3个V加以区分:

  • 量级(Volume):大量的数据
  • 速率(Velocity):高速的数据产出
  • 多样性(Variety):多种类型和来源的数据。

正如我们所说,大部分的企业每一天在不同的领域都在产出大量的数据。这里给出一组样本数据的来源及类型,他们都是企业在做大数据分析时潜在的收集和聚合数据的方式:

  • 网站分析
  • 移动分析
  • 设备/传感器数据
  • 用户数据(CRM)
  • 统一的企业数据(ERP)
  • 社交数据
  • 会计系统
  • 销售点系统
  • 销售体系
  • 消费者数据(例如益佰利的数据、邓氏商联的数据或者普查数据)
  • 公司内部电子表格
  • 公司内部数据库
  • 位置数据(空间位置、GPS定位的位置)
  • 天气数据

但是针对无限的数据来源,不要去做太多事情。把焦点放在相关的数据上,并且从小的数据开始。通常以2-3种数据源开始是一个好的建议,比如网站数据、消费者数据和CRM,这些会让你得到一些有价值的见解。在你最初进入大数据分析之后,你可以开始添加数据源来促进你的分析,并且公布更多的分析结果。想要获得更多关于大数据细节的知识,可以去查阅维基百科的大数据词条。

 

大数据的好处

大数据提供了一种识别和利用高价值机会的前瞻性方法。如果你想,那么大数据可以提供如下好处:

  • 根据数据背景获得更完整的情况
  • 利用数据驱动做出更好的商业决策
  • 降低商业风险
  • 市场上最好的解决方案
  • 开发出更好的定制化产品或服务
  • 更好的预测客户的需求和想法
  • 迅速适应市场
  • 在实时数据的趋势和预测上更加主动
  • 建立精确的生命价值周期(LTV)、地图和用户类型
  • 阅读更长和更复杂的属性窗口(用于网站点击流数据)
  • 对通过细分的更复杂的导航进行可视化,并且改善你的转化漏斗(用于网站点击流数据)

 

并不适用所有人

请记住,大数据分析并不适合所有人。如果你没有安装并且制定分析中的目标、没有准备好归因模型、再营销和高级细分,那么你就没有为大数据做好准备。

如果你把谷歌分析使用到了极限,特别是由于他的采样数据。那么你已经准备好接触大数据的皮毛了。

 

入门级大数据解决方案

目前有一大批面向企业级的大数据解决方案,比如甲骨文、SAP,、IBM、EMC和惠普。但是。这篇文章是面向寻找入门级大数据解决方案的中小型企业的读者。下面我们将讨论数据分析的输出,并且分享两个相对廉价的解决方案,从而帮助你开始使用大数据分析。

 

分析结果的输出

目前对于大多数企业而言,数据分析主要还是针对核心数据。然而在未来,数据分析将不会采用采样数据,并且会结合其他来源的数据,使用更加复杂的工具(比如Tableau)去分析他。谷歌分析是一个伟大的工具,但是你能获得的结果目前已经到达极致了。

汇总数据的第一步往往是你输出数据分析的过程。

 

如果你是一个谷歌分析高级版的用户,这将很容易被推进。因为谷歌分析高级版集成了BigQuery功能来帮助企业推动大数据分析。(学习更多的关于数据分析及BigQuery的集成,请查看视频)

如果你是一个谷歌分析标准版的用户,也不用担心。我们已经开发了一个工具,它可以导出未采样的谷歌分析数据,并且把数据推送到BigQuery,或者其他的可以做大数据分析的数据仓库或者数据工具中。一旦你导出了你的数据,你可以做好准备把它导入到一个大数据分析工具中进行存储、处理和可视化。这就给我们带来了最好的入门级大数据解决方案。

 

谷歌大数据解决方案

 

谷歌BigQuery是一个网络服务,它能够让你执行数十亿行的大规模的数据集的交互分析。重要的是它很容易使用,并且允许精明的用户根据需求开发更加大的功能。BigQuery采用你容易承受的按需定价的原则,当你开始存储和处理你的大数据查询时,每个月的花费只有几百美金。事实上,每个月前100GB的数据处理是免费的。随着你需求的增长,你可以拓展你的数据需求,并且为这部分需求买单。最好的消息是,BigQuery使得大数据存储和处理适用于所有人。

 

Tableau大数据解决方案

 

Tableau提供了4个强大的功能(也许更多)来促进大数据分析和预测分析。

  • Salesforce连接器允许你轻松的连接CRM和销售数据(更快、更容易的连接CRM和销售数据,所以如果你使用Salesforce,没有什么理由不加入大数据)
  • 谷歌分析链接可以帮助你更容易的创建自定义的仪表盘和报告(然而这个功能依旧需要升级才能变的更好)
  • 谷歌BigQuery连接器可以快速的分析在谷歌免费的网络服务中的大量数据。
  • 为任何点击行为的分析添加预测的功能(真正快速的预测)

     

数据分析师是关键

企业想要利用大数据,是需要一个数据分析师的。他必须知道不同数据的用法,并且要授予工具连接数据的权限。

当一个数据分析师使用BigQuery或者Tableau来完成提取和合并数据时,他们可以发现在大型数据集合当中的隐藏的模式。这才是大数据分析的关键。它可以是决策者做出更好的决策,并且加强了更精细颗粒度的数据段的识别。

利用这个新技能,你可以发现不同的用户与网站的互动行为。你可以在谷歌分析中以此来创建新的高级细分规则并且针对你的市场或者网站活动做出更高的价值分析。

 

发现不明情况内的价值

你的很多不同的数据隐藏不明的情况,这些是希望被发现并告知的。开始把网站分析、CRM、社交数据、位置数据等不同的数据源进行结合。这会使你的数据有了相关的背景,并且允许你通过数据看到一个更加完整的情况。这一定会让你胜出竞争对手。

为了说明这点,我们举个例子,通过大数据分析汇总社交数据、位置数据、客户数据、销售数据,你可以发现在旧金山的社会化媒体的趋势。这使你可以利用用户需求的增加来增加特定地区的库存。

不要忘了大数据分析的黄金法则:关注点,在正确的时间关注正确的商业问题。


原文发布时间为:2014-03-17


时间: 2024-09-13 04:11:30

深入浅出——大数据那些事的相关文章

大数据那些事(2):三驾马车之永垂不朽的GFS

但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:Google File System(GFS), MapReduce,BigTable.如果我们拉长时间轴到20年为一个周期来看呢,这三驾马车到今天的影响力其实已然不同. MapReduce作为一个有很多优点又有很多缺点的东西来说,很大程度上影响力已经释微了.BigTable以及以此为代表的各种KeyValue Store还有着它的市场,但是在Google内部Spanner作为下一代的产品,也在很大程度上开始取代各种各样的的BigTab

深入浅出——大数据的所有事情

大数据是什么?为什么要使用大数据?大数据有哪些流行的工具?本文将为您解答.原文请见:Get the Complete Story with Big Data Analytics作者:Kayden Kelly现在,大数据是一个被滥用的流行词,但是它真正的价值甚至是一个小企业都可以实现.通过整合不同来源的数据,比如:网站分析.社交数据.用户.本地数据,大数据可以帮助你了解的全面的情况.大数据分析正在变的越来越容易,成本越来越低,而且相比以前能更容易的加速对业务的理解.大数据通常与企业商业智能(BI)

贵阳市委书记陈刚:大数据时代的贵州

陈刚,男,汉族,1965年生,江苏高邮人,1986年入党,1990年参加工作,研究生毕业,理学博士,教授级高级工程师.曾任北京一轻集团有副总经理兼北京玻璃研究院副院长,北京市委外经贸工委委员.市对外经贸委副主任,中国贸促会北京市分会党组书记.主任,朝阳区委区长.区委书记. 2012年07月 任北京市委常委,朝阳区委书记. 2013年07月 任贵州省委常委,贵阳市委书记. 扩展大数据 贵州有气候和能源优势并提供政策支持 王永治:各位网友大家好!非常荣幸的欢迎贵州省委常委贵阳市市委书记陈刚先生.北京

数据分析师的情怀,一个大数据工作者的感悟

前言:谈起大数据,知晓它的人,都会说,势头猛,高科技,待遇好.城外的人,迫不及待想一头扎进来.熟不知,城里的大部分人却在坐以待毙,茫然无方向,难产. 前段时间在上海,老罗举行Smartisan M1/1L发布会,基本每一次我都会听大半直播内容.很多人笑话老罗总拿情怀忽悠人,烦不烦(这次低调多了).我挺喜欢的,执着,尽心,快感和使命感.情怀这东西,每个人都会曾经拥有过,在大数据圈子里,我也有情怀.而把它写出来,共同分享,找到有共鸣的人,这也是一种欣慰,这也是这篇文章的初衷. 最近3个多月,一直围绕

清华大学软件学院党委书记、副院长王建民:工业大数据理论与实践

5月5日,"2017中国工业大数据大会·钱塘峰会"在杭州国际博览中心举办.本届峰会以"数据驱动创新 融合引领变革"为主题,围绕工业大数据展开分享与交流.清华大学软件学院党委书记.副院长王建民,以"工业大数据理论与实践"为题探讨了自己的看法.   以下为嘉宾演讲实录: 在两三年前,当时讲到工业大数据的话,很多人会有挑战.工业里有大数据吗?工业的大数据在哪儿?今天通过大家的努力研讨,大家对工业大数据非常支持认可并且在应用.我就简单汇报一下自己对工业大

压轴论坛:大数据时代的商业变革

压轴论坛:大数据时代的商业变革 和讯科技消息 1月16日,2012中国互联网产业年会今日在京召开,本次大会的主题是"酝酿2013:在变革中掌握精彩",和讯科技进行全程报道. 以下为"压轴论坛:大数据时代的商业变革"实录: 主持人:高新民理事长 嘉宾:谢文知名IT评论人.徐明强 微软亚太研发集团windows Azure首席架构师.齐向东360公司总裁.姜奇平中国社科院信息化研究中心秘书长 姜奇平:对于大数据现在大家是众说纷纭,想听听大家的看法,高新民老师是中国互联网

大数据时代 市场人员需要了解的五件事

本文讲的是大数据时代 市场人员需要了解的五件事,大多数的市场人员正在认同这样一种观念,即:大数据不仅是一个技术上的挑战,而且对于更加有效地开展市场活动也有着极大的益处. 只要公司已经部署好了市场推广与宣传的战略,那么专业人员就意识到:通过更好地把握客户的信息与动机,并且对所付诸的努力加以评估的话,他们就更加有可能使市场推广活动取得良好的效果. 因此,作为一名市场人员,当你已经跨越过了如何去搜集大数据的初期阶段之后,你就要明白如何去管理和衡量好这些数据,以及它们对于业务发展的重要性.为了帮助这样一

大数据,CIO应该知道的第六件事

在一系列针对大数据提出建议的文章中,IDG集团PCWorld记者Joab Jackson所写的<大数据,CIO应该知道的五件事>我认为绝对是最好的一篇.他提出的五点建议在我们与客户的交谈中几乎每次都会被提到: 1.大数据的入门成本相对较低.我们现在看到http://www.aliyun.com/zixun/aggregation/14294.html">的大数据的入门成本,至少按照CapEx的观点,这个成本是相当低的.诸如Hadoop.Cassandra.MongoDB.Map

依靠大数据让百事签约吴莫愁

百度副总裁曾良携百事中国CMO Richard Lee.时尚集团副总裁张扬正,以及知名歌手吴莫愁共同亮相,以"大数据时代,营销是个技术活儿"为主题,畅谈掌握和运用大数据对选择品牌代言人的重要性.曾良认为,"找代言人不能只凭直觉,依靠百度大数据才是最靠谱的." 为什么通过大数据找品牌代言人最靠谱?曾良表示,随着用户使用互联网习惯的变化,营销已经过了"粗放式"阶段,俨然是一门技术活."广告主的印象和直觉已经不能成为决策的重要依据.灵敏嗅觉,