《Storm入门》中文版

本文翻译自《Getting Started With Storm》译者:吴京润    编辑:郭蕾 方腾飞

本书的译文仅限于学习和研究之用,没有原作者和译者的授权不能用于商业用途。

译者序

Storm入门终于翻译完了。首先感谢并发编程网同意本人在网站上首发本书译文,同时还要感谢并发编程网的各位大牛们的耐心帮助。这是本人翻译的第一本书,其中必有各种不足请诸位读者朋友不吝斧正。

译完此书之后,我已经忘记了是如何知道的Storm这个工具了。本人读过的所有技术书籍大部分都是在地铁上完成的,现在已经成了习惯。最近发现自己有一阵子没有看书,那个时候大数据已经相当火热,我就想找一些讲大数据分析的书来读一读,虽然一直没有机会接触大数据的工作,不过做一些技术储备也是好的。于是上谷歌和亚马逊用“大数据”、“实时分析”这类关键词搜索相关的技术文章和书籍。然后就知道了Storm,可惜一直没有找到中文的相关内容,只找到这一本《Getting Started with Storm》。可惜本人英文词汇量实在太少,书买来之后一直束之高阁,后来突发奇想我为什么不利用业余时间把这本书翻译了呢?于是由本人完成的《Getting Started with Storm》在并发编程网面世了。在本人之前已有人在CSDN上完成了本书除附录以外的全部翻译,并且有了PDF版。不过既然已经开始就不忍中途放弃了,所以一直坚持把本书译完。再次感谢并发编程网的朋友们的支持。

由于本人是持学习的目的翻译本书,对Storm的了解并不丰富,许多专用术语翻译难免不准确,如有谬误还请读者朋友们不吝指正。
本书基于最新的Storm0.7.1 版本撰写,从Storm开发环境的搭建、Storm工程的组成,到Storm各组件功能与开发,一步步的让读者入门并熟练掌握如何基于Storm的开发并利用Storm完成。本书共分为八个章节和三个附录:
第一章介绍Storm的特性以及可能的应用场景。
第二章讲述了Storm的运行模式,Storm工程包含的组件,以及如何创建一个Storm工程。
第三章对Storm的拓扑结构,各个组件如何分工协作做了详细介绍,数据流分组是本章重点。
第四章介绍Storm的数据源——spouts,Storm的所有数据都从这里开始。
第五章介绍Storm处理数据的组件。
第六章以一个简单的WEB应用讲解如何Storm进行数据分析。
第七章以PHP为例讲述如何使用非JVM语言开发Storm工程。
第八章讲解支持事务的拓扑,当然不要把这里的事务跟关系型数据库的事务等同起来。
附录A安装Storm客户端,以及常用命令。
附录B安装与部署Storm集群。
附录C如何运行第六章的例子
全书目录如下:

章节目录

第一章  基础知识

第二章 起步

第三章 拓扑

第四章 Spouts

第五章 Bolts

第六章 一个实际的例子

第七章 使用非JVM语言开发

第八章 事务性拓扑

附录A

附录B

附录C

时间: 2025-01-03 19:59:26

《Storm入门》中文版的相关文章

Storm入门之第8章事务性拓扑

Storm入门之第8章事务性拓扑 本文翻译自<Getting Started With Storm>译者:吴京润    编辑:郭蕾 方腾飞 正如书中之前所提到的,使用Storm编程,可以通过调用ack和fail方法来确保一条消息的处理成功或失败.不过当元组被重发时,会发生什么呢?你又该如何砍不会重复计算?   Storm0.7.0实现了一个新特性--事务性拓扑,这一特性使消息在语义上确保你可以安全的方式重发消息,并保证它们只会被处理一次.在不支持事务性拓扑的情况下,你无法在准确性,可扩展性,以

MyEclipse Hibernate 快速入门中文版与Hibernate的相关配置属性

MyEclipse Hibernate 快速入门中文版的HTML完整版本下载地址:  http://beansoft.java-cn.org/download/MyEclipse_Hibernate_Quickstart_zh_CN.zip 719KB Hibernate配置属性 属性名 用途 hibernate.dialect Hibernate方言(Dialect)的类名 - 可以让Hibernate使用某些特定的数据库平台的特性 取值. full.classname.of.Dialect

Storm入门之附录C

本文翻译自<Getting Started With Storm>译者:吴京润    编辑:郭蕾 方腾飞 安装实际的例子 译者注:有些软件的最新版本已有变化,译文不会完全按照原文翻译,而是列出当前最新版本的软件. 首先,从下述GitHub的URL克隆这个例子: 1 > git clone git://github.com/storm-book/examples-ch06-real-life-app.git src/main 包含拓扑的源码 src/test 包含拓扑的测试用例 webap

Storm入门 第二章准备开始

本文翻译自<Getting Started With Storm>  译者:吴京润   编辑:方腾飞 准备开始 在本章,我们要创建一个Storm工程和我们的第一个Storm拓扑结构. NOTE: 下面假设你的JRE版本在1.6以上.我们推荐Oracle提供的JRE.你可以到http://www.java .com/downloads/下载. 操作模式 开始之前,有必要了解一下Storm的操作模式.有下面两种方式. 本地模式 在本地模式下,Storm拓扑结构运行在本地计算机的单一JVM进程上.这

Storm入门之第三章拓扑

本文翻译自<Getting Started With Storm>  译者:吴京润   编辑:方腾飞 在这一章,你将学到如何在同一个Storm拓扑结构内的不同组件之间传递元组,以及如何向一个运行中的Storm集群发布一个拓扑. 数据流组 设计一个拓扑时,你要做的最重要的事情之一就是定义如何在各组件之间交换数据(数据流是如何被bolts消费的).一个数据流组指定了每个bolt会消费哪些数据流,以及如何消费它们. NOTE:一个节点能够发布一个以上的数据流,一个数据流组允许我们选择接收哪个. 数据

Storm入门之第四章Spouts

本文翻译自<Getting Started With Storm>  译者:吴京润   编辑:方腾飞 你将在本章了解到spout作为拓扑入口和它的容错机制相关的最常见的设计策略. 可靠的消息 VS 不可靠的消息 在设计拓扑结构时,始终在头脑中记着的一件重要事情就是消息的可靠性.当有无法处理的消息时,你就要决定该怎么办,以及作为一个整体的拓扑结构该做些什么.举个例子,在处理银行存款时,不要丢失任何事务报文就是很重要的事情.但是如果你要统计分析数以百万的tweeter消息,即使有一条丢失了,仍然可

Storm入门之附录A

本文翻译自<Getting Started With Storm>译者:吴京润    编辑:郭蕾 方腾飞 安装Storm客户端 Storm客户端能让我们使用命令管理集群中的拓扑.按照以下步骤安装Storm客户端: 从Storm站点下载最新的稳定版本(https://github.com/nathanmarz/storm/downloads)当前最新版本是storm-0.8.1.(译者注:原文是storm-0.6.2,不过翻译的时候已经是storm-0.8.1了) 把下载的文件解压缩到/usr/

Storm入门之附录B

本文翻译自<Getting Started With Storm>译者:吴京润    编辑:郭蕾 方腾飞 安装Storm集群 译者注:本附录的内容已经有些陈旧了.最新的Storm已不再必须依赖ZeroMQ,各种依赖的库和软件也已经有更新的版本. 有以下两种方式创建Storm集群: 使用Storm部署在亚马逊EC2上面创建一个集群,就像你在第6章看到的. 手工安装(详见本附录) 要手工安装Storm,需要先安装以下软件 Zookeeper集群(安装方法详见管理向导) Java6.0 Python

Storm入门之第一章

原书下载地址 译者:吴京润   编辑:方腾飞 译者注:本文翻译自<Getting Started With Storm>,本书中所有Storm相关术语都用斜体英文表示. 这些术语的字面意义翻译如下,由于这个工具的名字叫Storm,这些术语一律按照气象名词解释 spout 龙卷,读取原始数据为bolt提供数据 bolt 雷电,从spout或其它bolt接收数据,并处理数据,处理结果可作为其它bolt的数据源或最终结果 nimbus 雨云,主节点的守护进程,负责为工作节点分发任务. 下面的术语跟气