《Storm企业级应用：实战、运维和调优》——3.2　Spout数据源

3.2　Spout数据源

消息源Spout是Storm的Topology中的消息生产者（即Tuple的创造者）。
3.2.1　Spout介绍
1.?Spout的结构
Spout是Storm的核心组件之一，最源头的接口是IComponent，如图3-2所示，几个Spout接口都继承自IComponent。

2.?Spout发出的消息
Spout从外部获取数据后，向Topology中发出的Tuple可以是可靠的，也可以是不可靠的。
一个可靠的消息源可以重新发射一个Tuple（如果该Tuple没有被Storm成功处理），但是一个不可靠的消息源Spout一旦发出，一个Tuple就把它彻底“遗忘”，也就不可能再发了。
3.?Spout发射的流
Spout可以发射多个流。要达到这样的效果，使用OutputFieldsDeclarer.declareStream来定义多个流（即定义多个Stream），然后使用SpoutOutputCollector来发射指定的流。
4.?Spout的重要方法
Spout的重要方法是nextTuple。nextTuple方法发射一个新的元组到Topology，如果没有新元组发射，则直接返回。注意任务Spout的nextTuple方法都不要实现成阻塞的，因为Storm是在相同的线程中调用Spout的方法。Spout的另外两个重要方法是ack和fail方法。当Spout发射的元组被拓扑成功处理时，调用ack方法；当处理失败时，调用fail方法。ack和fail方法仅被可靠的Spout调用。
5.?Spout的组件
Spout的最顶层抽象是ISpout接口。在通常情况下（Shell和事务型的除外），实现一个Spout，可以直接实现接口IRichSpout，如果不想写多余的代码，可以直接继承BaseRichSpout。
3.2.2　Spout实例
下面通过创建一个实例RandomSpout来介绍Spout，图3-3为RandomSpout继承自BasicRichSpout及其实现的原理图。
图3-4列出了实例RandomSpout继承自BaseRichSpout中的几个重要方法。
下面对图3-4中的方法进行详细介绍。
（1）open方法
当一个Task被初始化时会调用此open方法。一般都会在此方法中初始化发送Tuple的对象SpoutOutputCollector和配置对象TopologyContext。
代码示例如下：

public void open(Map conf, TopologyContext context,   SpoutOutputCollector collector) {
      this.collector = collector;
      random = new Random();
}

（2）declareOutputFields方法
此方法用于声明当前Spout的Tuple发送流。流的定义是通过OutputFieldsDeclare.declareStream方法完成的，其中的参数包括了发送的域Fields。
示例代码如下：

public void declareOutputFields(OutputFieldsDeclarer declarer) {
      declarer.declare(new Fields("randomInt"));
}

（3）nextTuple方法
这是Spout类中最重要的一个方法。发射一个Tuple到Topology都是通过该方法来实现的。
示例代码如下：

public void nextTuple() {
      while(true){
          Values val = new Values(random.nextInt(100));
          collector.emit(val);
          try {
              Thread.sleep(500);
          } catch (InterruptedException e) {
              e.printStackTrace();
          }
      }
  }

以上代码从100以内的整数中随机生成一个数作为Tuple的值，然后通过_collector发送到Topology。
另外，除了上述几个方法之外，还有getComponentConf?iguration、ack、fail和close方法等。getComponentConf?iguration方法用于配置当前组件的参数，Storm监测到一个Tuple被成功处理时调用ack方法，处理失败时调用fail方法，这两个方法在BaseRichSpout类中已经被隐式-实现了。

时间： 2024-09-15 20:39:40

《Storm企业级应用：实战、运维和调优》——3.2　Spout数据源

3.2　Spout数据源

《Storm企业级应用：实战、运维和调优》——3.2　Spout数据源的相关文章

《Storm企业级应用：实战、运维和调优》——导读

《Storm企业级应用：实战、运维和调优》——3.8　Worker、Task、Executor三者之间的关系

《Storm企业级应用：实战、运维和调优》——2.3　安装部署Storm集群

《Storm企业级应用：实战、运维和调优》——3.3　Bolt消息处理者

《Storm企业级应用：实战、运维和调优》——1.2　Storm是什么

《Storm企业级应用：实战、运维和调优》——1.4　Storm的特性

《Storm企业级应用：实战、运维和调优》——1.1　什么是实时流计算

《Storm企业级应用：实战、运维和调优》——1.5　Storm的功能

《Storm企业级应用：实战、运维和调优》——3.7　Worker工作者进程

《Storm企业级应用：实战、运维和调优》——3.2 Spout数据源

3.2 Spout数据源

《Storm企业级应用：实战、运维和调优》——3.2 Spout数据源的相关文章

《Storm企业级应用：实战、运维和调优》——3.2　Spout数据源

3.2　Spout数据源

《Storm企业级应用：实战、运维和调优》——3.2　Spout数据源的相关文章