《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一1.9 示例应用:SuperWebAnalytics.com

本节书摘来自华章出版社《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一书中的第1章,第1.9节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问“华章计算机”公众号查看。

1.9 示例应用:SuperWebAnalytics.com

在本书中,我们将创建一个大数据应用程序示例来说明一些概念。我们将为Google Analytics构建数据管理层—比如服务。该服务将能够每天追踪数十亿的页面浏览量。
该服务将支持多种不同的指标。每个指标都被实时地支持。指标的范围很广—从简单的统计指标,到访客是如何浏览网站的复杂分析指标。
示例应用将支持的指标如下:
按照时间切片基于URL的页面浏览计数—示例查询是“过去一年中每一天的页面浏览量是多少?”和“过去12小时内有多少页面浏览量?”
按照时间切片基于URL的独立访客—示例查询是“2010年有多少独立访客访问这个域名?”和“过去三天内每个小时,有多少访客访问这个域名?”
跳出率分析—“用户访问该站点的某个页面,没有访问其他任何页面的百分比是多少?”
我们将构建存储、处理并为应用程序提供查询的层。

时间: 2024-11-02 13:31:43

《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一1.9 示例应用:SuperWebAnalytics.com的相关文章

大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一3.2 Apache Thrift

本节书摘来自华章出版社<大数据系统构建:可扩展实时数据系统构建原理与最佳实践>一书中的第3章,第3.2节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问"华章计算机"公众号查看. 3.2 Apache Thrift Apache Thrift(http://thrift.apache.org/)是一个可以用来定义静态类型化的.可实施模式的工具.它提供了接口定义语言,以通用数据类型的术

《配置管理最佳实践》——2.5 构建工具评估和选择

2.5 构建工具评估和选择 目前有很多好的构建工具,也有很多相关的最佳实践教程.这些教程可以指导你建立一个可靠.可扩展的构建流程.这里将会讨论一些工具和最佳实践,你可以有选择性地实施其中一些来支持公司的开发工作.目前软件开发中主要有几类比较流行的构建工具.不久以前,有段时间构建自动化仅仅意味着使用 Make(也许还有一些 shell 脚本)自动执行构建过程的每一个步骤.这种方法可以很好地支持 C 和 C++ 的构建.但是在实现的时候,要注意底层不同平台带来的差异性.我在 HP-UX, Solar

【直播】React、AliSQL、BeeHive、JStorm等8大阿里开源项目最佳实践分享

  本次峰会精选了目前较为活跃的阿里开源项目,其中较为有看点的是:在GitHub上拥有超过一万Star.在阿里内部落地超过400个项目的React 组件库 antd在蚂蚁金服的实践:MariaDB基金会唯一的中国成员详解AliSQL功能特性:已在天猫.喵师傅,天猫家装等App中应用大型iOS项目解耦方法--BeeHive:Android平台页面路由框架ARouter的一手开发经验:开源的 Android 平台上的秒级编译方案.阿里巴巴 Github 下排行前十的开源项目Freeline背后的奥秘

《智能数据时代:企业大数据战略与实战》一第3章 大数据:有所为有所不为3.1 大数据分析最佳实践

第3章 大数据:有所为有所不为 3.1 大数据分析最佳实践 很显然,与任何其他技术或过程一样,大数据问题也有最佳实践.在大多数情况下,最佳实践通常来自多年的测试和测量结果,以此作为基础,不断发展.然而,如今的大数据概念要相对新颖,在推导相关最佳实践的过程中人们总会去依赖并利用此前经过证明的有效方法.尽管如此,当前各种新的最佳实践正如雨后春笋般不断浮现,这意味着我们仍然可以从他人的错误和成功中吸取经验教训并由此判断出哪些才是真正有效的方法. 大数据的革命性特质往往会影响最佳实践,因此今日的最佳到明

阿里云Redis典型场景:如何构建可扩展通用排行榜系统

摘要 本文主要介绍通用排行榜的需求功能,并介绍了基于Redis的ZSET数据结构的排序方法,另外探讨了通用排行榜的架构及用户如何通过阿里云Redis解决通用排行架构的技术问题. 背景 移动互联网时代的春风刮来了各种不同的业务场景,直播元年.短视频元年.类微博信息流.各种电商业务也在这个移动互联网快车上集中爆发.在这些业务中信息成为了各种场景的关键,而信息的价值往往隐藏在各种排行中,对于一个直播大V可能关注直播人数的排行榜,因为他希望萃取他家长处:对于一个商家可能关注商品浏览排行榜,因为他希望更好

Asp.net 构建可扩展的的Comet Web 应用(二)

说明 如果你已经阅读了我之前的一篇文章<Asp.net构建可扩展的的Comet Web 应用>.你应该能够理解我将要写的内容.我解释了Comet技术并且解释了怎样用asp.net构建具有可扩展性的应用.然而,我认为之前的的一篇文章写得有点像主线.它展示了足够的技术,但是没有足够包含任何有用的代码.因此,我想我需要写一个API来将之前一篇文章中的功能封装起来.封装为一系列整齐的类,让它们可以被包含到一个通常的web项目中,给你机会去扩展和测试它. 我将不涉及太多关于线程模型的具体细节.因为在之前

使用React + Redux + React-router构建可扩展的前端应用

现在是前端开发最好的时代,有太多很好的框架和工具帮你更好的实现复杂需求;同时又是最困难的时代,因为需要掌握太多的框架和工具.如何利用好各种框架来提高前端开发质量是大家都在探索的问题.本文就将介绍如何使用 React 及其相关技术,来进行实际前端项目的开发.因为主要介绍如何将技术用于实践,所以希望读者已经对相关概念已经有一定的了解. 本文最初来源于笔者在 StuQ 的一次同名课程直播,现在加以整理成文,希望能对更多的人有所启发.为了固化这种实践方式,当时还开发了一个名为 Rekit 的工具,用于确

Shopify构建分布式可扩展应用的最佳实践

本文讲的是Shopify构建分布式可扩展应用的最佳实践,[编者的话]在构建大型分布式系统应用时,如何降低不同部分之间的依赖,增强系统的弹性,电商解决方案提供商 Shopify 给出了解决方法. @Container大会,专为一线开发者和运维工程师设计的顶级容器技术会议. 本文介绍了 Shopify 构建弹性平台的方法.这篇文章不仅读起来有意思,而且你可以把它运用到实践中,构建自有的弹性平台. Shopify 面临的扩展挑战 电商解决方案提供商 Shopify 每个月的独立访问用户大约有 3 亿.

构建可扩展的Java EE应用(一)

对于一个具备使用价值的应用而言,其使用者有可能会在一段时间内疯狂的增 长.随着越来越多的关键性质的应用在Java EE上运行,很多的Java开发者也开始 关注可扩展性的问题了.但目前来说,大部分的web 2.0站点是基于script语言编 写的,对于Java应用可扩展能力,很多人都抱着质疑的态度.在这篇文章中, Wang Yu基于他本身在实验室项目的经验来展示如何构建可扩展的java应用,同时 ,基于一些在可扩展性上做的比较失败的项目给读者带来构建可扩展java应用的 实践.理论.算法.框架和经