Tigon —— 开源的高吞吐量的流处理框架

Tigon 是一个开源的、实时的、低延迟、高吞吐量的流处理框架。基于 Apache Hadoop 和 Apache HBase 构建。Tigon 严重依赖开源项目 Tephra 和 Apache Twill 提供紧密的集成到已有的 Hadoop/HBase 集群中。

文章转载自 开源中国社区 [http://www.oschina.net]

时间: 2024-11-14 12:12:28

Tigon —— 开源的高吞吐量的流处理框架的相关文章

如果你是来12306系架,你如何实现? ——关于构建安全、稳定、高吞吐量的火车票网络售票系统几个方面(2)结束及总结

上节,对12306.cn有了一个很好的铺垫,这节我们来讨论,架构的具体问题  署接上文 于是,在网上纷纷对本系统产生了各种各样的讨论,有的说是系统设计问题.有的说是系统带宽不足.有的说明系统设计时有失公平(竞标).有的说付了款却没了票.有的说是需要用"云计算{技术}"才能解决等等.不管怎么样,重新架构或进行重大调整是必然的.个人觉得云计算只不过是一种资源或信息服务方式,它也需要更好的系统的架构和稳健的系统才能提供这种服务方式,所以通过"云计算"并不能解决本系统的超大

使用Docker、Registrator、Consul、Consul Template和Nginx实现高可扩展的Web框架

本文讲的是使用Docker.Registrator.Consul.Consul Template和Nginx实现高可扩展的Web框架,[编者的话]Consul是一个支持多数据中心分布式高可用的服务发现和配置共享的服务软件,由 HashiCorp 公司用Go语言开发,基于 Mozilla Public License 2.0 的协议开源.本文介绍了如何使用Consul将多个Docker容器组合起来,以提供一个高可扩展的Web服务. 当你开始将容器拼装起来构建你的系统的时候,你会发现Docker非常

一决高下,分布式流处理框架孰优孰劣

本文PPT来自技术专家毛玮于10月16日在2016年杭州云栖大会上发表的<分布式流处理框架--功能对比和性能评估>. 目前,分布式流处理框架数量不少,各有特色,究竟哪个性能更好.哪个效率更高.哪个更适合我呢?一般来说,当选择不同的流处理系统时,我们往往需要关注以下六大方面:1.运行时和编程模型2.函数式原语3.状态管理 4.消息传输保障 5.容错 6.性能. 其中,运行时模型主要包括原生的流处理和微批处理.流处理意味着所有输入的记录一旦到达即会一个接着一个进行处理,微批处理则把输入的数据按照某

流处理框架 Samza 成为 Apache 基金会顶级项目

Samza 是由 LinkedIn 开源的一项技术,它是一个分布式流处理框架,专用于实时数据的处理,非常像Twitter的流处理系统Storm.不同的是Samza基于Hadoop,而且使用了LinkedIn自家的Kafka分布式消息系统. 文章转载自 开源中国社区 [http://www.oschina.net]

Qorvo 802.11ac功率放大器助力领先Wi-Fi平台实现更高吞吐量

中国北京,2016年02月18日 – 移动设备.基础设施与航空航天.国防应用中RF解决方案的领先供应商Qorvo,Inc.(纳斯达克代码:QRVO)近日宣布,公司近期发布的 RFPA55X2 Wi-Fi 功率放大器 (PA) 系列将助力当今许多领先的家庭和企业 WLAN 网络设备实现更大范围内更高的数据吞吐量. Qorvo 的 RFPA55X2 Wi-Fi PA 系列包括 RFPA5512.RFPA5522.RFPA5532 和 RFPA5542产品.此 PA 产品组合以创新设计提供高功率和低功

最新Oracle ZS3存储加快高吞吐量的业务分析和数据查询

北京,2013年9月12日--作为Oracle最新推出的ZFS存储设备,ZS3系列 能够http://www.aliyun.com/zixun/aggregation/17183.html">帮助客户极大地提高运行效率,降低数据中心成本,并提高业务应用性能.借助高级缓存架构和多线程SMP操作系统,与类似的NetApp.EMC.IBM和HP系统相比,ZS3系列实现了最高的吞吐量.最低的迟延和更好的性价比. Oracle 最新的ZS3 系列存储 能够通过高性能.动态自动化和广泛的Oracle联

一脸懵逼学习KafKa集群的安装搭建--(一种高吞吐量的分布式发布订阅消息系统)

1:KafKa的官方网址:http://kafka.apache.org/ 开发流程图,如: 2:KafKa的基础知识: 2.1:kafka是一个分布式的消息缓存系统2.2:kafka集群中的服务器都叫做broker2.3:kafka有两类客户端,一类叫producer(消息生产者),一类叫做consumer(消息消费者),客户端和broker服务器之间采用tcp协议连接2.4:kafka中不同业务系统的消息可以通过topic进行区分,而且每一个消息topic都会被分区,以分担消息读写的负载2.

zan 正式开源,异步+非阻塞的PHP框架

Zan PHP Framework Zan PHP是基于PHP协程的网络服务框架,提供最简单的方式开发面向C10K+的高并发HTTP服务或SOA服务. 核心特效 基于 yield 实现了独立堆栈的协程 类似于 Golang 的并发编程模型实现 基于 swoole 提供非阻塞I/O服务 连接池支持(内置MySQL.Redis.syslog等多种组件) 类似Golang的defer机制解决由于异常导致的资源未释放.锁未释放的问题 可继承的View布局及组件化支持,方便完成bigPipe/bigRen

英特尔开源BigDL,可直接在Spark框架下运行深度学习

雷锋网获悉.近日,英特尔开源了基于 Apache Spark 框架的分布式深度学习库 BigDL.通过使用BigDL,用户可以将他们的深度学习应用程序作为标准的 Spark 程序发布(即将基于BigDL的深度学习代码直接嵌入已有的Spark程序中),同时,BigDL还简化了基于Hadoop框架的数据加载过程. 据团队在GitHub平台上的介绍,BigDL具有如下三大特点: 1. 丰富的深度学习支持. BigDL的源代码基于Scala语言实现,同时从Torch框架中汲取了诸多先进的理念.比如像To