云栖大会在线用户行为分析场分享:海量流式视频日志收集

本文PPT由2017年云栖大会TI 在线用户行为分析专场阿里云北洲分享的《海量流式视频日志收集》整理而成。

在视频直播场景中,使用日志服务的目的是为了能够对当前直播的服务质量进行监控,比如受当前卡顿影响的人数、在线用户数量的变化趋势等。

为了能拿到服务质量,我们需要收集多种维度的日志数据,在介绍日志服务之前,先来了解下日志采集使用上的一些痛点。

  • 日志产生渠道非常多,怎么用一种统一的方式将这些日志快速的收集上来,并进行结构化,方便后续的分析处理,这里的挑战可以说非常之大。
  • 运维方面的困难。业务越来越复杂,怎么将新增加的模块上的日志采集上来,另外,我们希望采集软件能够自升级,并且升级过程中,用户的日志数据不会丢。
  • 我们往往在系统发生故障时,才想起来看日志调查问题,其实日志系统能做的事情远不止这些。


为了解决这些痛点,阿里云推出了日志服务。
日志服务是针对实时日志的一站式全托管服务,主要包括三方面功能。

  • LogHub,也就是日志数据的采集、存储、和消费。
  • LogShipper,主要是将存储在日志服务中的数据投递到下游数仓,包括OSS、MaxCompute、TableStore等,方便对数据进行离线分析。
  • LogSearch和LogAnalysis功能。主要对日志进行全文检索和进行一些实时的统计分析。

接下来我们重点讲解LogHub功能。

LugHub的功能分成两块:
1. 数据采集,对不同平台、不同类型的日志都提供了便捷、易于扩展的接入方式。
2. 对接多种数据消费系统。

  • 开源层面,我们对接了Flink、Spark Streaming、Storm等主流的流计算引擎。
  • 阿里云这边我们对接了StreamCompute、AliMonitor、ARMS、EMR、JStorm等。
  • 提供了多种语言的高级消费库,这个库屏蔽了日志服务的实现细节,使得用户只需要专注于开发自身业务逻辑。
  • 对接了一些第三方的日志分析工具,比如Splunk、ElasticSearch。


最后我们来看下直播场景中日志系统的架构。
直播系统中有许多设备端,包括摄像头、浏览器、移动端,这些设备端通过流媒体协议RTMP和服务端通信,这里的服务端是搭建在ECS上的。
服务端会周期性的将流媒体的码率、音视频时间戳、卡顿情况记录到本地的日志文件中,通过这个日志我们可以分析出当前直播线路的状况以及在线用户数量等,我们希望将这个文件日志收集到日志服务中。
另外设备端有一些用户行为日志,比如用户开播、进入房间、离开房间等,我们也希望能收集到日志服务中。
使用日志服务收集这两块日志非常简单。
对于服务端的日志,只需要在ECS上安装我们提供的日志采集工具Logtail。对于设备端的日志,使用我们提供的JS库WebTracking直接就可以收集到日志服务中。后面如果服务端要扩容,只需要在新扩的ECS上安装Logtail。数据收集到日志服务中之后,后续可以使用StreamCompute和DataV进行分析展示。
可以说今天Loghub的生态已经非常完善了,我们可以做到让您在5min内将日志从0接入,并且在使用时没有任何运维代价。另外,不管您一天的日志量时1MB还是1PB,也不管您的应用是在杭州还是在美国,都可以快速接入日志服务。最后,我们承诺日志服务一年的故障时间在4个小时以内,也就是99.95%的可用性,使用成本是您使用开源软件自建的15%左右。

参考资料

  1. 日志服务
  2. 日志服务采集方式
  3. WebTracking采集方式
  4. 多实例协同消费库(Consumer Library)
  5. 使用日志服务对接下游消费系统
时间: 2024-09-19 08:16:38

云栖大会在线用户行为分析场分享:海量流式视频日志收集的相关文章

云栖大会变迁史(2009-2017)

作为"世界级·现象级"的大会,2017云栖大会将于10月11-14日在杭州云栖小镇举办.大会内容更加丰满.创意更加跨界:不仅有阿里技术领袖等精彩演讲,还有NASA等黑科技的集体亮相,100+场技术和行业论坛,连续3天的云栖虾米音乐节,以及百家直播伙伴全程直播等.预计大会现场超过5万人参加,直播观看者超数千万.     温馨提示:云栖大会的前身是阿里云开发者大会,而阿里云开发者大会的前身是站长大会,站长大会的前身是中国地方网站发展论坛.其中2009年举办的大会叫做中国地方网站发展论坛,2

云栖大会Serverless场分享:日志处理挑战与展望

本文PPT来自于2017年云栖大会TI Serverless专场阿里云龙悟分享的<Serverless下日志处理的挑战和展望>整理而成. 由于Serverless的诸多优点,现在越来越多的应用采用Serverless的架构,如上图所示,一个典型的Serverless架构 : Api网关作为用户访问的入口,是各类web.手机等客户端的访问入口 应用的静态资源如图片.视频等可放在对象存储OSS上 表格存储保存各类meta信息 函数服务FC承载应用的核心处理逻辑 在应用采用Serverless架构的

云栖大会首开Tech Insight首场爆棚

本文讲的是云栖大会首开Tech Insight首场爆棚4月19-21日,云栖大会·深圳峰会拉开帷幕.首次在云栖大会上亮相的Tech Insight技术论坛人气爆棚,吸引了大量来自企业的CTO.CIO.研发工程师.运维工程师以及高校学生付费报名参会. 据介绍,Tech Insight汇集阿里云诸多顶级技术专家,分享了包括前沿技术.存储与轻计算.解决方案.视频服务.数据库技术等5场技术论坛,以及云端安全.0服务器搭建海量视频网站2场Workshop动手实验课,将云计算热点话题一网打尽. 随着云计算越

云栖大会直播背后是另一场关于技术的直播

    10月16日下午,随着导播间里的8台显示器相继黑屏,为期4天的2016杭州云栖大会网络直播正式结束.16个会场.600+主题演讲.4万名参会嘉宾成就了一场全球规模最大的科技盛会,而这场大会的网络直播也见证了奥点云云播控系统的强大承载能力. (奥点云导播间)   不做直播执行,而是直播播控技术的提供者.奥点云的云播控系统是基于互联网云计算的全IP化播控系统,集信源监控.音视频制作.播出控制.第三方平台监看.电视大屏矩阵显示等功能于一体.  奥点云为本次云栖大会搭建的云播控系统共启动了23个

云栖精选8月刊丨最全2016云栖大会资料大放送!技术精彩值得打call!

"从最初400人参加的站长大会到云栖大会,我每年来云栖小镇,又激动.又恐慌.又感动.激动的是在这里开启了梦想之旅,正如15年前我们所希望的创业热朝.恐慌的是很多创意我几乎看不懂,越看越慌,记得有一次回家路上在想,幸好我是二十年以前创业,如果现在创业,估计自己都不知道自己在哪里,根本没法跟这些年轻人竞争.感动的是:我们在这儿找到了自己,阿里人对云栖大会的热情来源于可以在这里找到很多知己,找到很多当年的我们. 在13日天猫双十一启动会上,外国驻华大使问我:阿里巴巴纽约上市之后的下一个梦想是什么?我认

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《数据可视化:构建实时动态运营数据分析大屏》篇

大数据workshop:<在线用户行为分析:基于流式计算的数据处理及应用>之<数据可视化:构建实时动态运营数据分析大屏>篇 实验背景介绍 了解更多2017云栖大会·成都峰会 TechInsight & Workshop. 本手册为云栖大会Workshop之<在线用户行为分析:基于流式计算的数据处理及应用>场的<数据可视化:构建实时动态运营数据分析大屏>篇所需.主要帮助现场学员熟悉并掌握DataV数据可视化的操作和使用. 实验涉及大数据产品 DataV

《在线用户行为分析:基于流式计算的数据处理及应用》Workshop-入口

云栖大会成都峰会大数据Workshop入口 <在线用户行为分析:基于流式计算的数据处理及应用> 钉钉扫码进入阿里云数加流计算和DataV可视化交流群. 流数据采集:日志数据解析及上传 实时数据分析:海量日志数据多维透视 流数据处理:通过StreamSQL分析用户行为 数据可视化:构建实时动态运营数据分析大屏 该课程是针对一个网站实时产生的Nginx日志进行分析,深度挖掘用户的实时行为,为运营提供策略.包含阿里云DataHub.流式计算引擎StreamCompute和酷炫的DataV可视化大屏.

云栖大会惊现体感互娱 视频云能力全面释放

2017云栖大会已经拉开帷幕,全球4万多名IT从业人员相继奔赴杭州云栖小镇,来共同见证这场全球TOP级云计算盛会.本次大会的主题为飞天智能,通过3场主论坛.22场前沿峰会.100+分论坛,400+科技企业展,共同呈现云计算.大数据.人工智能蓬勃发展的技术生态全景. 此次科技企业展区规模空前,有超过400个科技展位,涵盖安全.健康.交通.新零售.物流.多媒体.制造.金融等十几个行业.在三万多平方的展览区域中,最惹人注目的要数阿里巴巴空间站.该展区将阿里巴巴集团的ET大脑.AIS.IoT.智慧社区.

云栖大会的另一个舞台:全球化的路上,尝试一把带头大哥的感觉

云栖大会的第一天,阿里巴巴达摩院成立,科技行者做了第一手的报道,在今日头条上,科技行者关于达摩院的报道收获了几百条评论,有的网友说,应该把金庸先生请到云栖大会:有的网友说,有了达摩院,藏经阁还远吗:还有的网友说,震撼,霸气,这是中国最亮丽的名片. 是的,达摩院这三个字就带着东方神秘意境,阿里巴巴的员工不知道如何翻译是好,马云就自造英文DAMO,让老外们去学习这个新词吧. 再看达摩院的阵容,首批公布的学术委员会十人中有三位中国两院院士.五位美国科学院院士,堪称科技界"地表最强战队",包括