JStorm，让大规模流处理成为可能

本文PPT来自资深专家封仲淹于10月16日在2016年杭州云栖大会上发表的《Large-Scale Stream Processing inside Alibaba》。

JStorm 是阿里巴巴基于storm采用Java重写的一套开源的分布式实时流计算框架，其诞生于2013年，经历多次迭代，至今已经发布25了版本。总体而言，JStorm具有高性能、高稳定性，适于大规模部署这些特点，其他的用户方的特色功能包括用户自定义的调度器和资源用法、先进的日志机制、更细粒度的Metrics、动态规模调整和快速的应用升级等等。

目前，JStorm运行在超过4000台机器上，它不仅能单独部署，也实现了JStorm-on-yarn和JStorm-on-docker，使JStorm能够被部署在框架上。这些集群共形成了超过1500个应用和2000余个拓扑结构，每天产生的数据超过惊人的2PB。在实际运用中，JStorm有许多应用场景，如欺诈检测、广告审核、数据统计、系统监控、数据传输、实时推荐和应用调度等，除了供阿里自身使用，JStorm还被众安保险、科大迅飞、网宿科技等超过50家公司使用。未来，JStorm将支持Apache Beam，并努力成为一个强大的高级语言框架，使其更容易学习和调试，提供更大的吞吐量。

最后关于JStorm和Storm的区别，阿里的JStorm不仅仅是Storm的简单包装，更重要的是JStorm意味着一个流处理生态系统，一个企业级的Java Storm，并且比Storm更快、更稳定、特性也更多。

时间： 2024-09-25 02:11:16

JStorm，让大规模流处理成为可能的相关文章

双11数据大屏背后的秘密：大规模流式增量计算及应用

首先从理解什么是数据流开始今天的分享,其实在真实的世界中,大部分的数据都是连续产生的数据流,比如手机上产生的GPS信号.用户在互联网上的行为.在线搜索.用户的点击.社交网络分享.即时通信以及一些传感器和物联网设备采集的日志信息等,这些数据都是连续产生的,自然就形成了数据流,在这些数据流产生以后,在很多场景下对于数据流的实时分析就会产生很大的价值. 接下来从大家比较熟悉的数据场景切入,比如大家经常会关注的股市情况,股价的波动其实就是实时数据的分析和聚合,除此之外大家在日常生活中还可能比较关心天气预

双11数据大屏背后:大规模流式增量计算及应用（附资料）

首先从理解什么是数据流开始今天的分享,其实在真实的世界中,大部分的数据都是连续产生的数据流,比如手机上产生的GPS信号.用户在互联网上的行为.在线搜索.用户的点击.社交网络分享.即时通信以及一些传感器和物联网设备采集的日志信息等,这些数据都是连续产生的,自然就形成了数据流,在这些数据流产生以后,在很多场景下对于数据流的实时分析就会产生很大的价值. 接下来从大家比较熟悉的数据场景切入,比如大家经常会关注的股市情况,股价的波动其实就是实时数据的分析和聚合,除此之外大家在日常生活中还可能比较关心天气预

Neha Narkhede: 借助Apache Kafka实现大规模流处理

在QCon纽约2016大会上,Neha Narkhede在演讲"借助Apache Kafka实现大规模流处理"中介绍了Kafka Streams,这是Kafka用于处理流式数据的新特性.据Narkhede介绍,因为"无界(unbounded)"数据集随处可见,所以流处理越来越流行.那不再是一个像机器学习那样的小众问题. Narkhede首先介绍了数据操作的基本编程范式: 请求/响应周期批处理流处理然后,Narkhede提供了一个来自零售领域的流处理实例:销售和发

突破流计算极限挑战后，阿里将发力图计算及大规模机器学习

近日,体系结构顶级会议ASPLOS首次在中国举办,阿里巴巴副总裁.阿里云首席科学家周靖人发表主旨演讲,介绍了阿里巴巴云的大数据和AI计算平台,以及其中广泛的产品和服务.同时透露阿里接下来将在图计算和大规模机器学习领域进一步发力. 随着物联网传感器.移动应用和在线服务的普及和广泛应用,越来越多的数据以流的形式源源不断的产生.基于数据流的实时分析变得越来越重要,例如实时化的商业决策依赖高时效性的报表,在线服务优化需要动态捕捉用户行为等. 这一系列应用的背后离不开大规模流计算平台的支撑.从系统架构角度

超越批处理的世界：流计算

今日,流式数据处理是大数据里的很重要一环.原因有不少,其中包括: 商业(竞争)极度渴望更快的数据,而转换成流计算则是一个好的方法来降低延迟. 海量的.无穷数据集在现在的商业环境里变的越来越常见,而用专门设计来处理这样数据的系统来应对这些数据则更为容易. 在数据到达时就对他们进行处理能够更加平均地把负载进行均衡,取得更好的一致性和更可预测的计算资源消耗. 尽管业务驱动带来了对流计算兴趣的猛增,但绝大部分现有的流计算系统相比于批处理还不够成熟,而后者已经产生了很多令人激动的.多产的应用. 作为从事海

使用Kinesis Connector to Elasticsearch进行流数据搜索及交互

近日,亚马逊官方博客发表博文介绍了如何借助Kinesis Connector to Elasticsearch 进行流数据的搜索及交互,从而帮组开发者轻松开发一款用于从Kinesis实时并可靠地下载大规模流数据到Elasticsearch集群的应用程序. 据官方介绍,Elasticsearch 是一个开源搜索及分析引擎,能够实时索引结构化和非结构化数据.Kibana是Elasticsearch的数据可视化引擎,主要是帮助技术运维人员及业务分析人员设置交互面板的.Elasticsearch集群中的

300+篇运维、数据库等实战资料免费下载（文章+PDF+视频，持续更新）

2017年已过去一半,在此小编为大家精心整理了2017上半年热点事件解析.实战技术资料以及特别策划短视频系列,希望可以帮助大家更深入地回顾上半年的技术热点,并储备更充足的技术干粮继续2017的下一半. PART 1 峰会回顾资料云栖大会 [上海云栖大会]2017云栖大会上海峰会资料合计(现场视频+PDF下载) [成都云栖大会]2017云栖大会成都峰会资料合计(现场视频+PDF下载) [南京云栖大会]2017云栖大会南京峰会资料合计(现场视频+PDF下载) 技术峰会 [运维/DevOps峰会]

云栖精选8月刊丨最全2016云栖大会资料大放送！技术精彩值得打call！

"从最初400人参加的站长大会到云栖大会,我每年来云栖小镇,又激动.又恐慌.又感动.激动的是在这里开启了梦想之旅,正如15年前我们所希望的创业热朝.恐慌的是很多创意我几乎看不懂,越看越慌,记得有一次回家路上在想,幸好我是二十年以前创业,如果现在创业,估计自己都不知道自己在哪里,根本没法跟这些年轻人竞争.感动的是:我们在这儿找到了自己,阿里人对云栖大会的热情来源于可以在这里找到很多知己,找到很多当年的我们. 在13日天猫双十一启动会上,外国驻华大使问我:阿里巴巴纽约上市之后的下一个梦想是什么?我认

【资料合集】在线大数据技术峰会：讲义PDF+活动视频！

回顾大数据技术领域大事件,最早可追溯到2006年Hadoop的正式启动,而环顾四下,围绕着数据库及数据处理引擎,业内充斥着各种各样的大数据技术.这是个技术人的好时代,仅数据库领域热门DB就有300+,围绕着Hadoop生态圈的大数据处理技术更是繁花似锦.然而着眼当下,大数据在行业内的实际落地仍然不是件简单的事情,大数据创业成功的案例更是少之又少. 1. MaxCompute 2.0 性能优化揭秘演讲视频:http://yq.aliyun.com/webinar/play/188 PDF下载:h

猜你喜欢

JavaScript改变CSS样式的方法汇总

JavaScript修改CSS有4种方法:1.修改节点style(内联样式);2.改变节点class或id;3.写入新的css;4.替换页面中的样式表.今天主要给大家介绍下前2种,因为后两种个人不 ...

个人网站需要什么？

我可以算是CHINAZ的一般的老会员了,2004年5五月我结识了CHINAZ,这是我第一次在站长站发表自己的文章,我今天要说的是个人站需要什么,我记得那是10年前,我一个小学生在网上看到了许许多多网站 ...

利用Java调用可执行命令实例

执行 package test; /** * Add one sentence class summary here. * Add class description here. * * @autho ...

将ASP动态网页转换成HTM静态页面的方法

动态|静态|网页|页面|转换前段时间有个asp页面执行起来很慢,访问人数又颇多,而且又不经常修改,又懒得直接做成静态的,每次都要从服务器下载来改,只好想办法把asp页面转化成htm静态页面了. 以前 ...

如何捕获音频及输出音频

这是我原来用过的两段代码,输出音频和捕获音频. 构造器里的socket是用来接受来自网络的音频数据.不做网络音频可以去掉它. 希望能与大家分享经验.8-) import java.io.*; impo ...

分享外贸网站优化那点事

由于互联网的迅速发展,网购已经成为市民朋友们不可缺少的一部分了,国内的市场经营的很好以后,就会想着要去经营国外市场,自从经济危机以后,外贸站的营销也是越来越难做,那对于一个外贸公司来说,要怎么去优化外 ...

使用Form和QueryString集合

集合当用户填写页面<FORM>内容时所提供的全部值,或在浏览器地址栏输入在URL后的值,通过Form和QueryString集合为ASP脚本所用.这是在ASP代码中访问值的一种简 ...

字符串近似匹配算法

字符串的近似匹配,就是允许在匹配时有一定的误差,比如在字串"以前高手好久不见"中找"以前是高手"也能成功.具体地说,错误可以有三种类型:加字符(以前也是高手). ...

C++语言的VxD与外界通信的所有接口

一. 什么是VxD 从多任务操作系统Windows 3.1起,计算机中的任一物理设备x可同时被基于Dos或Windows的多个进程使用,这种一对多的关系称为"设备虚拟化",各进程通 ...

java中的double运算

Java中的简单浮点数类型float和double不能够进行运算.不光是Java,在其它很多编程语言中也有这样的问题.在大多数情况下,计算的结果是准确的,但是多试几次(可以做一个循环)就可以试出类似上 ...

ppt怎么制作渐变效果?

ppt怎么制作渐变效果? 渐变的效果样式是多种多样的,现在我们根据渐变的方式来逐步带大家学习下, 方法一:线性渐变:沿着一根轴线(水平或垂直)改变颜色,效果参考下图,线性渐变方式 ...

Android如何添加一个apk使模拟器和真机都编译进去

添加一个apk都需要将LOCAL_PACKAGE_NAME的值添加到PRODUCT_PACKAGES才行. 而PRODUCT_PACKAGES一般在build/target/product/目录下 ...

excel表格中怎么绘制一个漂亮的心形图?

excel表格中怎么绘制一个漂亮的心形图? 1.首先插入一个爱心 2.边框填充为无轮廓 3.格式-形状填充-渐变-其他渐变开发绘制excel表格"> 4.填充-渐变填充,类型选择 ...

php实现RSA加密类实例

这篇文章主要介绍了php实现RSA加密类,实例分析了php自定义RSA类实现加密与解密的技巧,非常具有实用价值,需要的朋友可以参考下本文实例讲述了php实现RSA加密类.分享给大家供大家参 ...

win7桌面快捷方式图标都变成统一样式怎么弄

win7桌面快捷方式图标都变成统一样式怎么弄 1.同时按下键盘上的win+R快捷键打开电脑的运行窗口,之后,咱们在窗口中输入regedit并单击回车,这样就可以打开电脑的注册表编辑器窗口了; 2. ...

PS制作六一儿童节主题贺卡

六一儿童节,是全世界少年儿童的节日,在此祝小朋友们节日快乐!现在使用Photoshop制作儿童节贺卡. 首先我们先看看最终效果图: 主题贺卡-六一儿童节贺卡制作"> PS制作六一儿童节 ...

linux内核设计与实现读书笔记

进程的调度程序是保证进程能有效工作的一个内核子系统.调度程序负责决定将哪个进程投入运行,何时运行以及运行多少时间.简单的来说,调度程序就是在给一堆就绪的进程分配处理器的时间,调度程序是多任务操作系 ...

c#vs怎么计算出来的成绩导入到sql2008数据库相应的字段中？

问题描述 c#vs怎么计算出来的成绩导入到sql2008数据库相应的字段中? 这是一个在线考试系统考试结果的代码,怎么将这个运行出来的成绩score导入到sqlsever中啊? namespace M ...

jquery fullcandar 日程表控件添加上一天下一天点击事件问题

问题描述 jquery fullcandar 日程表控件添加上一天下一天点击事件问题 jquery fullcandar 日程表控件添加上一天下一天点击事件,这样可以获取下一天上一天的日期解决方 ...

SinoBBD Cloud发布一体化推动产业云发展

本文讲的是SinoBBD Cloud发布一体化推动产业云发展[IT168 资讯]9月5日,第五届全球云计算大会在上海世博展览馆盛大开幕,国内外顶尖企业汇聚一堂,新一代云计算技术产品纷纷亮相.作为国内 ...

数据库-c# 中操作csv 文件的方法，用控制台的方式。

问题描述 c# 中操作csv 文件的方法,用控制台的方式. 对excel 操作第一次接触,很多概念都不熟,请大神指点将.csv 文件中的内容存放到数据库中,关键是怎么读出其中的数据,操作需要那些函数? ...

VS2010中项目发布遇到的应用程序池问题(无法识别的属性“targetFramework”)

1.错误情况 2.原因:VS2010中你的应用程序的目标框架与IIS中的应用程序池不同.VS2010中的是.Net Framework4.0,而本机IIS是.Net Framework2.0 ...

如何开发获取当前计算机cpu,内存,硬盘,进程，网络流量等使用率或传输情况

问题描述如何开发获取当前计算机cpu,内存,硬盘,进程,网络流量等使用率或传输情况如何开发获取当前计算机cpu,内存,硬盘,进程,网络流量等使用率或传输情况,参考什么书籍或知识点! 解决方案 ht ...

centos-CentOS 7.0 上源码安装 Xen 4.5出错，怎么解决

问题描述 CentOS 7.0 上源码安装 Xen 4.5出错,怎么解决 xl info xl: error while loading shared libraries: libxlutil.so. ...

Nginx 的线程池与性能剖析

正如我们所知,NGINX采用了异步.事件驱动的方法来处理连接.这种处理方式无需(像使用传统架构的服务器一样)为每个请求创建额外的专用进程或者线程,而是在一个工作进程中处理多个连接和请求.为此,NGIN ...

097_《Delphi5高级编程丛书之三：DataBase与MIDAS编程》

<Delphi5高级编程丛书之三:DataBase与MIDAS编程> Delphi 教程系列书籍 (097) <Delphi5高级编程丛书之三:DataBase与MIDAS编程&g ...

mysql 常用几种密码恢复方法

mysql教程常用几种密码恢复方法 /* 一. MySQL密码的恢复方法之一如果忘记了MySQL的root密码,可以用以下方法重新设置: 1. KILL掉系统里的MySQL进程: killall ...

Slow通道用户迎来Windows 10 Mobile Build 15051更新

今天面向Fast通道用户(桌面端和移动端)发布Windows 10 Build 15055版本更新的同时,微软还面向Slow通道用户(移动端)发布了Windows 10 Mobile Build 15 ...

[翻译] getauxval() and the auxiliary vector

前言英文原文:getauxval() and the auxiliary vector 该文章在2012年10月发表. 翻译用户空间应用程序与内核之间有许多交流机制.系统调用和伪文件系统(诸如:/ ...

信号处理-在信号重采样的时候，滤波器设计的指标怎么确定？

问题描述在信号重采样的时候,滤波器设计的指标怎么确定? 尝试把44.1kHz的信号转换成96kHz的信号. 把L/M=320/147 分解成 (8/7)(4/3)(10/7)的形式,可以知道截至频率 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.028 s.