云栖大会Serverless场分享:日志处理挑战与展望

本文PPT来自于2017年云栖大会TI Serverless专场阿里云龙悟分享的《Serverless下日志处理的挑战和展望》整理而成。

由于Serverless的诸多优点,现在越来越多的应用采用Serverless的架构,如上图所示,一个典型的Serverless架构 :

  • Api网关作为用户访问的入口,是各类web、手机等客户端的访问入口
  • 应用的静态资源如图片、视频等可放在对象存储OSS上
  • 表格存储保存各类meta信息
  • 函数服务FC承载应用的核心处理逻辑

在应用采用Serverless架构的情况下,已经没有应用服务器,应用逻辑以事件为驱动进行触发,这样的改动对于应用的开发、运维、运营、客服都提出了更高的要求和不小的挑战。通常来说,日志数据对于一个应用来说至关重要,关系到应用的稳定,以及能否持续、健康发展。那么在Serverless场景下,日志数据处理又有哪些挑战呢?


我们先看看搭建一个日志处理平台有哪些挑战:

  • 采集多源:是否能够足够高效地从各类数据源(web、手机客户端,api网关、函数服务等)快速、方便、实时进行数据采集;
  • 运营管理成本:维护这样一个日志平台需要投入多少人力、时间、机器资源;
  • 响应速度: 对于开发、运维、运营、客服等人员,是否都可以方便、便捷地使用这个日志平台来满足各自多样的需求

通常,构建一个完整的日志平台,需要使用多种开源系统,其中典型的代表有kafka,elk,hadoop,spark,storm等,以及用于数据采集的各类agent(logstash,fluentd,beats等),这些软件和系统用于解决特定的问题,只有有机地把这些系统组合才来才能最终达到业务目标,但要能够稳定运行好这些系统,可不是一件容易的事情。

阿里云的日志服务提供了另外一种解决思路,以云服务的形式,提供一站式日志解决方案,集合日志多源采集、存储、实时分析和dashboard展示、数仓对接等丰富功能,来满足多种人员的各类需求。这样在即满足需求的情况下,又免去了维护多个复杂系统的代价,大大降低了日志分析的时间成本。


通过简单的配置,一个日志服务平台可以非常便捷地进行创建,按照我们的经验,一个人1小时足够了。
首先,我们看一下serverless应用下日志如何进行采集:

  • 通过嵌入web tracking js代码,可方便地采集客户端的行为日志;
  • 通过SDK,API网关的日志、应用APP中的日志实时将日志写入logstore中;
  • 产生在函数服务的日志,通过一行配置,FC会自动将stdout的日志采集至日志服务中;

当日志写入用户project的logstore之后,可以根据数据流量,进行秒级动态扩容、缩容。配置索引之后,各类人员可以直接使用。

接下来,我们以日志处理中几个通用场景为例,来说明如何方便地使用日志服务解决实际问题。

在DevOps场景下,基于阿里巴巴内部的使用经验,我们将ops的时间进行划分,其中最耗时的部分是问题调查,而问题调查往往需要从多个维度进行综合的分析,才能准确定位问题的根源:

  • Metric : 各类系统、应用指标,常见的如cpu、mem指标,应用访问延时等
  • AdHoc Query :各类条件组合进行的查询,如查询来之某个用户的访问正确率,某个页面的延时等
  • Tracing :对于单次访问的一个完整调用路径,通常可通过访问request id在各个系统中进行关联
  • Log、上下文 :详细的日志数据,以及和关键日志有关联的上下文日志

以下,我们以DevOps下的AdHoc query和tracing、上下文为例来演示如何使用日志服务:

首先,这个查询样例是, 某个用户对某个特定页面进行访问,出现错误或者延时超过1秒的请求情况。我们可以看到,这样的查询方式非常的灵活,可以对各种条件进行自由组合,通常会使用关键词查询、数值比较、模糊查询来进行组合。使用阿里云日志服务,日志写入1秒和即可查询,每次查询,在1秒内,可处理数亿的日志,从容应对海量日志。

接下来,如果当有用户反馈有访问异常的情况下,就可以通过Tracing + 上下午的方式,快速进行定位。

演示视频:

在这个视频中,首先通过用户的id找到错误的访问请求(1);再根据这个request id快速在应用日志中找到核心日志(2),发现错误根本原因是后端缓存队列已经满了,不能请求进行更多的请求;通过核心日志的上下文查询功能,快浏览在出核心错误日志上下文日志(3),用于快速定位问题。


在介绍DevOps场景之后,我们再看一下运营分析的场景。在这个场景下,我们希望运营同学也能很方便地直接使用日志平台进行问题的分析。比如,在进行一个推广活动的时候,该主推哪些产品、主要面向的用户群体又是哪些等的这类问题,都需要从用户浏览、购买等行为日志中进行分析。在日志服务平台上,通过简单的sql分析配合多种模式的视图展示,能非常直观将展示分析的结果。


演示视频:

在以上视频样例中,我们快速分析在一个网站上,售卖价格超过100元的商品中,访问次数最高的top 10的商品,分析的结果以饼图的形式来表示。日志服务的sql查询,支持了sql 92绝大部分语法功能,可在1秒内,对1亿条日志进行多个维度统计分析。


对于我们经常需要关注的核心指标,可将sql视图保存至dashboard做整体展示,下次打开的时候,直接看到结果。同时,在这个dashboard的上,也可以调整任意视图的时间段。


日志服务平台,除了以上所展示的日志实时query和sql分析功能外,也能直接和多个云产品和开源系统对接,比如将数据导入对象存储OSS或MaxCompute中进行归档和超大规模计算,通过Storm/Jstorm等流式系统可直接实时读取写入Logstore中的日志数据。这样可以更方便满足多种个性化的日志处理需求。


最后,我们对比一下,使用日志服务一站式平台和自建方案之间的差异。使用日志服务,可以极大降低硬件持有、系统运维、开发资源等多方面的成本,同时,使用日志服务的另一个好处是,在资源的弹性扩容、安全、权限管理上也有很大的优势。整体来说,可以使用更低的费用,享受更好的服务。

时间: 2024-09-09 03:20:44

云栖大会Serverless场分享:日志处理挑战与展望的相关文章

云栖大会变迁史(2009-2017)

作为"世界级·现象级"的大会,2017云栖大会将于10月11-14日在杭州云栖小镇举办.大会内容更加丰满.创意更加跨界:不仅有阿里技术领袖等精彩演讲,还有NASA等黑科技的集体亮相,100+场技术和行业论坛,连续3天的云栖虾米音乐节,以及百家直播伙伴全程直播等.预计大会现场超过5万人参加,直播观看者超数千万.     温馨提示:云栖大会的前身是阿里云开发者大会,而阿里云开发者大会的前身是站长大会,站长大会的前身是中国地方网站发展论坛.其中2009年举办的大会叫做中国地方网站发展论坛,2

云栖大会上海峰会20日将发布大数据平台

本文讲的是云栖大会上海峰会20日将发布大数据平台 本月20日,2016云栖大会上海峰会将在上海科技馆召开.云栖大会是目前全球最大规模的云计算大数据行业巡回峰会.作为主办方,阿里云将在此次大会上发布全新的大数据平台,并进一步扩展其混合云生态. 大会主题为"HELLO,DT WORDLD",意指通过大数据技术为企业和公众敲开DT世界的大门.阿里云总裁胡晓明认为,人类正从IT时代走向DT时代.在DT时代,计算成为一种生产能力,而数据会成为最大的生产资料."能否获取这种新能源,大数据

云栖大会在线用户行为分析场分享:海量流式视频日志收集

本文PPT由2017年云栖大会TI 在线用户行为分析专场阿里云北洲分享的<海量流式视频日志收集>整理而成. 在视频直播场景中,使用日志服务的目的是为了能够对当前直播的服务质量进行监控,比如受当前卡顿影响的人数.在线用户数量的变化趋势等. 为了能拿到服务质量,我们需要收集多种维度的日志数据,在介绍日志服务之前,先来了解下日志采集使用上的一些痛点. 日志产生渠道非常多,怎么用一种统一的方式将这些日志快速的收集上来,并进行结构化,方便后续的分析处理,这里的挑战可以说非常之大. 运维方面的困难.业务越

云栖大会首开Tech Insight首场爆棚

本文讲的是云栖大会首开Tech Insight首场爆棚4月19-21日,云栖大会·深圳峰会拉开帷幕.首次在云栖大会上亮相的Tech Insight技术论坛人气爆棚,吸引了大量来自企业的CTO.CIO.研发工程师.运维工程师以及高校学生付费报名参会. 据介绍,Tech Insight汇集阿里云诸多顶级技术专家,分享了包括前沿技术.存储与轻计算.解决方案.视频服务.数据库技术等5场技术论坛,以及云端安全.0服务器搭建海量视频网站2场Workshop动手实验课,将云计算热点话题一网打尽. 随着云计算越

云栖大会分享:买单侠的数据库架构之路

互联网金融行业快速发展的浪潮中,面对海量增长的数据,买单侠走出了自己的数据库架构之路. 本文是买单侠DBA负责人赵怀刚在杭州云栖大会上的分享,介绍了数据库运维中遇到的问题.基于阿里云平台数据库架构的演变和案例和云数据库运维的思考.图1 赵怀刚在分享 秦苍科技是一家专注于为年轻人提供消费分期服务互联网消费金融公司,目前有"买单侠"和"星计划"系列产品,"买单侠"面向中国年轻蓝领用户,提供移动端消费分期服务."星计划"为年轻女性用

云栖大会直播背后是另一场关于技术的直播

    10月16日下午,随着导播间里的8台显示器相继黑屏,为期4天的2016杭州云栖大会网络直播正式结束.16个会场.600+主题演讲.4万名参会嘉宾成就了一场全球规模最大的科技盛会,而这场大会的网络直播也见证了奥点云云播控系统的强大承载能力. (奥点云导播间)   不做直播执行,而是直播播控技术的提供者.奥点云的云播控系统是基于互联网云计算的全IP化播控系统,集信源监控.音视频制作.播出控制.第三方平台监看.电视大屏矩阵显示等功能于一体.  奥点云为本次云栖大会搭建的云播控系统共启动了23个

云栖精选8月刊丨最全2016云栖大会资料大放送!技术精彩值得打call!

"从最初400人参加的站长大会到云栖大会,我每年来云栖小镇,又激动.又恐慌.又感动.激动的是在这里开启了梦想之旅,正如15年前我们所希望的创业热朝.恐慌的是很多创意我几乎看不懂,越看越慌,记得有一次回家路上在想,幸好我是二十年以前创业,如果现在创业,估计自己都不知道自己在哪里,根本没法跟这些年轻人竞争.感动的是:我们在这儿找到了自己,阿里人对云栖大会的热情来源于可以在这里找到很多知己,找到很多当年的我们. 在13日天猫双十一启动会上,外国驻华大使问我:阿里巴巴纽约上市之后的下一个梦想是什么?我认

云栖大会|新零售时代供应链的重“构”已经开始

"新零售是阿里巴巴面向未来所做出的全新战略愿景规划,是大数据驱动的线上线下融合,是零售核心元素的数字化."   --阿里巴巴CEO 张勇(逍遥子)五天前,全球超过350名顶级投资机构的投资者和分析师来到阿里园区,阿里巴巴以天猫为引擎驱动的新零售战略实施成果成为全球投资者关注的焦点.当天,阿里股价大涨13%,登顶亚洲市值最高公司,并跃居全球第七. 6月13日, 54家领导品牌掌舵人或大中华区CEO齐聚杭州阿里巴巴西溪园区9号馆,与阿里巴巴集团CEO张勇开了一场关于"新零售&qu

云栖大会番外篇:四美齐亮相,邀你来云栖!

又是2016杭州・云栖大会吗?亲,你猜对了! 不过咱们是番外篇,这回不聊400场技术分论坛,也不聊马云又会有什么语惊四座的发言. 咱们聊一聊...妹纸!没错就是妹纸! 云栖大会上可不只有程序男哦--参会时有与百来个美女擦肩而过的机会哦. 不信--先给你们剧个透...看看我们美不美-- 不只是照片哦--要不要...看视频,想不想...接到我的来电   扫码点我们的头像,就能跟我们视频啦啦-- 看完记得分享哦--