Akka实战:分散、聚合模式

分散与聚合:简单说就是一个任务需要拆分成多个小任务,每个小任务执行完后再把结果聚合在一起返回。

代码 http://git.oschina.net/yangbajing/akka-action

实例背景

本实例来自一个真实的线上产品,现将其需求简化如下:

  1. 传入一个关键词:key,根据key从网上抓取相关新闻
  2. 可选传入一个超时参数:duration,设置任务到期时必须反回数据(返回实际已抓取数据)
  3. 若超时到返回实际已爬取数据,则任务应继续运行直到所以数据抓取完成,并存库

设计

根据需求,一个简化的分散、聚合模式可以使用两个actor来实现。

NewsTask:接收请求,并设置超时时间
SearchPageTask:执行实际的新闻抓取操作(本实例将使用TimeUnit模拟抓取耗时)

实现

NewsTask

https://github.com/yangbajing/akka-action/blob/master/src/main/scala/me/yangbajing/akkaaction/scattergather/NewsTask.scala

  override def metricPreStart(): Unit = {
    context.system.scheduler.scheduleOnce(doneDuration, self, TaskDelay)
  }

  override def metricReceive: Receive = {
    case StartFetchNews =>
      _receipt = sender()
      (0 until NewsTask.TASK_SIZE).foreach { i =>
        context.actorOf(SearchPageTask.props(self), "scatter-" + i) ! SearchPage(key)
      }

    case GetNewsItem(newsItem) =>
      _newses ::= newsItem
      if (_newses.size == NewsTask.TASK_SIZE) {
        logger.debug(s"分散任务,${NewsTask.TASK_SIZE}个已全部完成")

        if (_receipt != null) {
          _receipt ! NewsResult(key, _newses)
          _receipt = null
        }
        self ! PoisonPill
      }

    case TaskDelay =>
      if (_receipt != null) {
        _receipt ! NewsResult(key, _newses)
        _receipt = null
      }
  }

metricPreStart方法中设置定时方法,调用时间为从代码运行开始到doneDuration时间为止。定时被触发时将向当前Actor发送一个TaskDelay消息。

在metricReceive方法中,分别对StartFetchNews、GetNewsItem、TaskDelay三个消息进行操作。

在收到StartFetchNews消息时,actor首先保存发送者actor的引用(结果将返回到此actor)。再根据TASK_SIZE生成相应子任务

GetNewsItem消息的处理中,每收到一个消息就将其添加到_newses列表中。并判断当_newses个数等于TASK_SIZE时(所有子任务已完成)将结果发送给_receipt。

self ! PoisonPill,这句代码停止actor自身。它将把“毒药”发送到NewsTask Actor的接收邮箱队列中。

TaskDelay消息被触发时,将直接返回已完成的新闻_newses。返回数据后并不终止当前还未运行完任务。

SearchPageTask

https://github.com/yangbajing/akka-action/blob/master/src/main/scala/me/yangbajing/akkaaction/scattergather/SearchPageTask.scala

  override def metricReceive: Receive = {
    case SearchPage(key) =>
      // XXX 模拟抓取新闻时间
      TimeUtils.sleep(Random.nextInt(20).seconds)

      val item = NewsItem(
        "http://newssite/news/" + self.path.name,
        "测试新闻" + self.path.name,
        self.path.name,
        TimeUtils.now().toString,
        "内容简介", "新闻正文")

      taskRef ! GetNewsItem(item)
      context.stop(self)
  }

SearchPageTask的代码逻辑就比较易懂了,这里使用sleep来模拟实际抓取新闻时的耗时。生成结果后返回数据给`taskRef`,并终止自己。

执行测试

./sbt
akka-action > testOnly me.yangbajing.akkaaction.scattergather.ScatterGatherTest

总结

这是一个简单的Akka实例,实现了任务分发与结果聚合。提供了一种在指定时间内返回部份有效数据,同时任务继续执行的方式。这种分散、聚合的模式在实际生产中很常用,比如对多种数据源的整合,或某些需要长时间运行同时对返回数据完整性无强制要求的情况等。

MetricActor演示了怎么自定义Actor,并为其提供一些侦测点的方式。以后有时间会写篇详文介绍。

文章转载自 开源中国社区[https://www.oschina.net]

时间: 2024-09-16 11:55:15

Akka实战:分散、聚合模式的相关文章

提升NAS网速技能get:网络聚合模式

对于任何一个NAS买家,除了其对4K视频的支持,对Docker的兼容,建立在这一切之上的基础便是网络.这也应和了NAS的本名Network Attached Storage,网络始终是用户关注的焦点. 为了提高网络传输速度,提升用户体验,色卡司采用了网络聚合模式,让色卡司NAS配备多个千兆网络接口. 实际的测试传输速度,原本千兆网络传输速度,色卡司NAS都已破表的优异效能110MB/秒,这是单一千兆网口物理的极限值,通过色卡司NAS的网络聚合功能将5个千兆网口(如:N5810PRO)串联,实测速

百度Hi欲以“兴趣聚合”模式来打破游戏规则

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 7月18日消息,日前,百度即时通讯软件"Hi"在百度世界大会正式亮相,该产品正式对所有网友开放注册,标志着这家国内最著名的搜索引擎公司正式杀入即时通讯领域. 据百度透露的数字,百度Hi自3月26日公测以来,半个月内注册用户量已超过百万.不过,在这次百度世界大会上,百度拒绝透露最新注册用户数字. 百度商业运营副总裁沈皓瑜表示

聚合模式:电商如何摧毁传统商业模式

北京锡恩企业管理顾问有限公司董事长 所有的传统企业,无论是万科这样的房地产企业,还是海尔这样的电子消费品企业,它们的强大都建立在一个最基本的要素之上,那就是规模扩张.今天的电商正摧毁传统的规模扩张模式,正如小米正在摧毁国内手机.腾讯正在摧毁移动联通一般. 小米模式也许不完美,腾讯也许还很幼稚,但如果你不懂小米与腾讯所代表的聚合模式(aggregation)--阿里巴巴也称之为C2B模式,那么,现在拥有的财富与地位,将成为飞翔中挂在翅膀上的金子,成为你坠落的包袱. 传统企业的竞争模式: 做大是唯一

Javascript设计模式理论与实战:桥接模式

桥接模式将抽象部分与实现部分分离开来,使两者都可以独立的变化,并且可以一起和谐地工作.抽象部分和实现部分都可以独立的变化而不会互相影响,降低了代码的耦合性,提高了代码的扩展性. 基本理论 桥接模式定义:将抽象部分与它的实现部分分离,使它们都可以独立地变化. 桥接模式主要有4个角色组成: (1)抽象类 (2)扩充抽象类 (3)实现类接口 (4)具体实现类 根据javascript语言的特点,我们将其简化成2个角色: (1)扩充抽象类 (2)具体实现类 怎么去理解桥接模式呢?我们接下来举例说明 桥接

从海信“全聚合“看智能电视内容合作模式大分裂

3月17日,海信宣布将和CNTV未来电视,以及爱奇艺PPS.凤凰视频.酷6.乐视.PPTV.搜狐视频.腾讯视频.优酷土豆.优朋普乐等11家视频企业合作,实现迄今国内最大范围的互联网视频内容共享,海信将提供终端平台,打造"全聚合"智能电视生态圈,4月17日,海信集团董事长周厚健将亲自上阵揭晓更多合作谜底.          电科技发现,海信此次史无前例联合11家视频网站供应商,甚至连早已远离主流视频行业的酷6,以及主攻儿童影视行业的乐看也不放过,可谓一网打尽,土豪气十足.       海

如何掌握 Windows Server 2012 网卡聚合(NIC Teaming)

Windows Server 2012的推出被称为"云操作系统",想必这个操作系统在虚拟化领域,在网络和存储层面,在接入和安全层面都会有很有实力的功能体现.今天给大家介绍的网卡聚合能力就是充分利用汇总方式提高服务器整体网络性能,进而实现在高密度业务负载环境,高可用网络环境下的需求,当然除了网卡聚合功能单方面提升消除CPU的瓶颈也是重点,例如Offload卡,SRIOV, RSS,VMQ队列等等技术在Server 2012中你都能找到配套的核心技术支撑.今天这篇博客重点介绍一下Windo

Akka Essentials - 1

参考Akka Essentials   1 Introduction to Akka Actor Model Actor模式的由来 In 1973, Carl Hewitt, Peter Bishop, and Richard Steiger wrote a paper-A Universal Modular ACTOR Formalism for Artificial Intelligence, which introduced the concept of Actors. Subsequen

Social Media附加价值开发的四大模式

郑昀 20090830 社会化媒体的可携带可传播数据是海量的,从中打捞珍珠并串成线,还是需要一些手段的.你不能简单地获取那些像水一样流动的数据来展示,无论你的界面多么漂亮,都没有太大价值,你必须增加一些附加价值. 我大致归类这些附加价值,分为六大价值点: Conversations:根据数据之间的关联,建立对话形式: Breaking News:及时发现突发新闻: Trends:热点趋势捕获和展现: Recommendations:根据用户数据做个性化推送: Groups/Tags:按照主题打包

PHP和Socket

文章:   PHP And Socket书名: <PHP Game Programming>作者:   Matt Rutledget翻译:   heiyeluren <heiyeluren_gmail_com> ◇ Socket基础◇ 产生一个服务器◇  产生一个客户端 在这一章里你将了解到迷人而又让人容易糊涂的套接字(Sockets).Sockets在PHP中是没有充分利用的功能.今天你将看到产生一个能使用客户端连接的服务器,并在客户端使用socket进行连接,服务器端将详细的处