8月2日,第四届Dynatrace Perform 上海用户大会隆重举行。在此次盛会上,Dynatrace与各行业翘楚共同探讨了人工智能技术为应用性能管理带来的新可能,并展示了Dynatrace Davis 人工智能运维助手及其应用场景。
Dynatrace云战略专家Brandon Neo提到,新的时代已经来临,无论组织大小都已经开始了数字变化转型,所以“上云”至关重要。但在上云过程中,企业会遇到哪些问题,如何有效的监控云平台,对此Brandon给出了详细的解答。
Dynatrace云战略专家Brandon Neo
以下为嘉宾演讲实录:
在最近一篇在线文章中,各种不同规模的组织进行了一次调查,调查的是关于各种云供应商的数字转型。在供应商的名单中,在下面看到的四个是有最高的投票数。而调查显示,有多少客户知道或者有听过云的供应商,AWS是在欧洲最认可的,跟随着的是Azure,然后是谷歌和IBM。在中国市场来看,名单中有排行第九位的阿里云。
调查显示之后询问了各类组织在迁移期间有哪些供应商被评估了,AWS再次领先,最后询问到组织对数字业务选择了哪一位云供应商,AWS成为了领导者。所以很明显的,在比较各种组织规模时,各个组织都开始使用了云服务。调查结果也显示,2017年各个规模的企业都彼此增长着。而最大的增长来自中等企业以及中小企业。跟各种组织的规模比较时,很明显开始使用云服务。2017年,可以看到各种不同的组织层面上有16%的增长,AWS预计在接下来五年每年都会增长25%,这意味着在四年时间里,他们的收入将会增加一倍。Azure被视为客户最可能购买或者更新的平台。现在我们面临一个新的时代的来临,无论组织大小,都已经开始了数字变化。所以移动到云至关重要,那组织应该考虑哪些问题?
第一个问题就是当我们进入到云的时候,企业应该怎么样才能确保应用程序没有任何的停滞时间?为了充分利用云平台,是否还要重新构建我们的应用程序?该怎么样才有效率用尽云间的服务呢?我们应该是否更改我们的应用程序,来负责我们的策略?我们也是否应该使用新的云战略?迁移完了之后,是否有高度动态的自动扩展在云微服务的应用程序?毕竟现在的平台成为了应用程序的延伸。全球商业独立研究透露,几乎每个客户每五天都会遇到营业收入影响的问题。要处理这些问题的挑战,由于生产力的损失,各个营业部门每年都失去很多珍贵的时间。这代表收入损失,比如很多隐藏的领域都会受到性能的影响,比如知名度、客户体验差、股票下跌等等。
发现问题之后,怎么样有信心来解决这些问题?从我们的调查当中,大多数的团队似乎缺乏解决问题的信心。关于这些问题,最重要的原因就是复杂性。当我们进入云端时,各种不一样的构造会产生不一样的状况。结合之前的研究结果,证明很清楚,监控云平台和云环境当中的整个步骤并不容易。我们需要的是一个单一管理界面,让我们轻松的监控所有云延伸的应用程序。所以之前有说过,这个图蛮接近的,我们可以谈谈云模型以及云战略。传统的构造,有网络服务器,应用服务器,还有数据库,通常运行在数据中心里。传统的想法就是分离应用程序的不同功能,因此需要独立的团队。从图上可以看得出,每层大多数会有自己的团队,每层也可能有多人组成。当我们迁移到基础设施以及服务时,云的提供商通常负责处理基础设施。人们要维护基础程序。当转向云平台服务时,大部分的云服务商都为了这些服务提供了处理,因此企业能够专注在应用程序。比如说怎么样能够自动拓展,更有效的使用容器。无论是最好的服务商,都不能避免服务中断,数据中心着火之类的。这样的情况下我们怎么才能有效的监控云平台?
我们要监控云原生应用时,我们需要的是一个实时发现应用程序的功能。就像网格、流程、服务、日记、云端、应用程序跟每层都要被监控,而你需要的是一个云内置的引擎,让所有的信息都叠在一起。你可以很容易的指出根本原因,了解了信息的类型关系,你需要真实用户的体验,让你现在该知道用户体验对所有的企业的重要性。你将需要分析用户体验和交易,简化和受影响用户有关的问题交易。在整个过程中,当然人工智能能实时分析数十亿笔的交易,可以轻易的监控容器和微服务。即使服务上下移动时,我们也可以自动检测应用环境的变化。并且建一个当前的模型。
完全展现真正的用户体验,比如在今年举行的全球的Perform当中,我们有一个新的指标,visually complete,我们用用户的交互对用户体验进行测量。需要的也是能完全实时的信息,让你不断跟随高速发展变化的环境。当前,今天也见到了通过DAVIS收集的应用程序信息,我们通过ChatOps和VoiceOps进行沟通,我们的各种语音翻译服务,很多未来的服务,在各种复杂的环境里,你需要解决方案能够分析收集的大数据,无论是分析交易还是请求,都可以轻易了解一切。
还有你需要全堆栈日志分析的功能。不只是监视日志所产生的志标,通过人工智能引擎,你可以了解上下文日志的分析,包括理解异常的问题背景。还有一定需要的就是能监控那些云平台的功能以及服务,这些包括云平台的云环境,刚才所讲解的云原生应用环境复杂,你需要监控云端的各种服务,比如说AWS等等。
在今早的示范,自我修复,我们的API可以导入任何自定义设备,包括网络设备,也可以帮我们导出数据、警报和信息,把资料传给第三方工具。在我们的内部,我们也有使用Dynatrace来监控我们自己的群集。我们已经开始用各种的监控技术,比如说自我修复、自我管理方面,来监控Dynatrace,这也证明这是最好的成功例子。早上也听到,我们还可以用OpenKit来监控云端物联网的设备,比如说是智能电视和智能车,并将设备和平台指标发回云。
由Dynatrace我们可以自动问题监测和根本原因自我修复,智能警报和自动创建新的事件,比如说智能警报问题产生的原因。异常监测,更快更好的打造新的软件,正确的使用用户数据以及大数据分析。智能可视化与信息的仪表盘。智能监测与容量管理。当然还有最重要的,就是智能CMDB,实时智能构造,填充CMDB。
早上有提到,公司通常对使用自己的产品来证明自己的价值观,Dynatrace有一样的想法和价值观,使用Dynatrace的软件来改善,我们灵活的一年内发布了26个版本,而我们的团队经过数字化变化,现在只需四人来运作。我们有93%的错误是由我们自己的开发组来发现的。这证明我们更加稳定,我们有99.99%的可用性,这些都是自动化的,这一切无论是对于组件或者基础设施,都没有人为干扰。
所以我希望我今天的分享能够为您提供一些有关监控的重要性,和使用Dynatrace来推动企业的数字变化。
原文发布时间为: 2017年8月9日
本文作者:孙博