Windows Azure中远程监控基础知识和故障排除

在用于构建强大云应用程序的组件块博客文章中,我们介绍了 Azure CAT 团队的系列博客文章和技术文章,这些文章说明了 MSDN 代码库上发布的 Windows Azure 中的云服务基础代码项目。在该系列中,我们要介绍的第一个组件是远程监控。这是我们在执行各种规模的 Windows Azure 客户项目时最先构建的可复用组件之一。事实上,有人曾经说过:“试图管理复杂的云解决方案,但却没有合适的远程监控基础设施,就像是眼瞎耳聋的人试图穿过一条繁忙的公路”。您不确定或不知道哪里会出现问题,且无法采取预防措施,很容易陷入困境。相反,如果及时收集了关于应用程序组件状态的充分监控和诊断信息,您就能够做出明智的决定,例如成本和效率分析、容量规划和卓越运营。本博客还包含相应的 Wiki 文章,深入介绍了远程监控基础知识和故障排除。

要管理云中任何规模的系统,在性能监控和应用程序运行状况方面,实际上需要使用不同方法来支持运营成果。使用现有工具和技术非常具有挑战性,因为云平台相当抽象。此外,如果您的解决方案需要伸缩,那么数百个 Web/worker role、数据库分区和其他服务生成的信息量将产生风险, 让你被大量统计意义相对较低、不相关和延迟的数据淹没。提供始终围绕运营内幕的端到端体验,有助于客户将其 SLA 与其用户匹配。同时通过对目前和未来资源消耗与部署制定更明智的决策,降低管理成本。只有充分考虑涉及的各层才能实现这一点,包括从基础设施的角度(例如资源的使用情况,如 CPU、I/O、内存等)到应用程序本身(数据库响应时间、异常等)直到业务活动和 KPI。

运营团队(维护服务运行情况、分析资源消耗、管理支持电话)和开发团队(故障排除、规划新版本等)都可从处理、关联和使用这些信息中受益。

远程监控解决方案本身必须设计为可用于跨多个角色实例伸缩, 以执行数据采集和转换的活动,将数据存储到多个原始SQL Azure 数据库中。为便于报告和分析组件,汇总数据将驻留在集中数据库中,该数据库将作为预定义和自定义报告与仪表板的主数据源,如以下简化的体系结构图中所示:

由于该主题本身涉及面很大,我们决定将其分为四篇博客文章和 Wiki 文章,形成一个迷你系列:

1. 远程监控基础知识和故障排除

2. 应用程序运行状况测量

3. 数据采集​​管道

4. 报告和分析

这是第一篇文章,主旨是介绍远程监控解决方案的基本原则,它首先定义了我们的应用程序运行状况的基本指标和关键指标。我们还详细提供了各种信息源,您可以根据这些信息源订阅自动远程监控系统,或对部署不太复杂的应用程序手动执行故障排除会话。

诸如Windows Azure Diagnostics (WAD) 的功能如已正确配置,将是收集和汇总这些关键信息的主要起点。遗憾的是,其中一些数据源目前尚未与 WAD 集成(例如Azure SQL 数据库),因此需要使用稍微不同的方法和 API 来提取这些信息。Azure 存储分析是另一个很好示例,需要特定努力来收集和巩固指标。

要阅读本主题,请参阅远程监控基础知识和故障排除 Wiki 文章,其中我们将重点介绍一种分析方法,可用于将所有这些不同的数据源关联到一个描述端到端解决方案运行状况的视图中。此外,为了帮助您实现此操作,我们提供了一些工具(Microsoft 工具和第三方工具)和脚本,可在故障排除会话中进行实际使用。

这将是我们在以后的文章中介绍的一系列文章的基石。您可在云服务基础 TechNet Wiki 登录页面上找到整个系列。

时间: 2024-09-16 05:09:22

Windows Azure中远程监控基础知识和故障排除的相关文章

Windows Azure云服务基础–RDBMS的分区

编辑人员注释:本文章由AzureCAT 云与企业工程组的高级项目经理 Shaun Tinline-Jones 和 Chris Clayton 共同撰写. "云服务基础"应用程序也称作"CSFundamentals",展示如何构建数据库支持的 Azure 服务.这包括描述日志记录.配置和数据访问的使用场景.实施体系结构及可复用组件.代码库旨在用于根据 Windows Azure 客户咨询团队进行的生产部署,深入挖掘在 Azure 上交付可伸缩的可用服务的最佳实践. 目

OSS服务监控、诊断和故障排除

相对于传统的软件运行环境,云数据分布式托管环境虽然解决了很多应用业务在基础设施搭建.运维管理等方面的问题和成本困难,使得应用服务搭建的门槛降低,但是其复杂的云环境,也大大增加了对其监控.诊断和故障排查的难度. 若要成功管理运行在云环境中应用程序,需要主动监视其行为,并熟悉如何诊断和排查自己的应用程序及其依赖的云服务技术的所有方面的问题.而OSS存储服务为用户提供了可以简化监控.诊断和排查基于云的应用程序中关于存储问题的过程.作为OSS的用户,你可以利用OSS提供的监控服务(即将上线)持续监视应用

Windows XP中网络基础知识简介

网络就是将相同或不同地理位置的多台计算机通过连线和各种外围设备连接在一起,以实现网络中各计算机之间的信息交流及资源共享的系统.网络根据连接范围的大小可分为广域网和局域网.本章以局域网为主要介绍对象. 13.1.1 网络的发展 计算机网络产生于1954 年,当时研制了一种叫做收发器的终端,实现了人们将穿孔卡片上的数据通过电话线发送到其他计算机上的梦想.第一代计算机网络随之出现,但它只是一种面向终端的计算机网络,客户端并不具备数据存储和处理的能力.1969 年出现了第二代计算机网络,第二代计算机网络

《微软云计算Windows Azure开发与部署权威指南》——导读

https://yqfile.alicdn.com/3043625418f9de9de0f6111aaef4f0adbb8afaa5.png" > 前言 云计算技术正在快速地发展,业界各大厂商纷纷制定相应的战略,新的概念.观点和产品不断涌现.云计算的技术热点也呈现百花齐放的局面,比如以互联网为平台的虚拟化解决方案的运行平台,基于多租户技术的业务系统在线开发.运行和运营平台,大规模云存储服务,大规模云通信服务等.云计算的出现为信息技术领域带来了新的挑战,也为信息技术产业带来了新的机遇. 微软

微软Windows Azure平台资源汇总

入门云计算简介 了解云计算的一般概念. Windows Azure平台简介 开始认识Windows Azure平台. Windows Azure入门教学系列 学习Windows Azure平台的基础知识. Windows Azure Platform Training Kit 学习Windows Azure平台的基本任务. "How Do I"系列教学电影 以可视化的方式学习Windows Azure平台. 工具Windows Azure SDK Windows Azure platf

最全的Windows Azure学习教程汇总

Windows Azure 是微软基于云计算的操作系统,能够为开发者提供一个平台,帮助开发可运行在云服务器.数据中心.Web 和 PC 上的应用程序. Azure 是一种灵活和支持互操作的平台,能够将处于云端的开发者个人能力,同微软全球数据中心网络托管的服务,比如存储.计算和网络基础设施服务,紧密结合起来.帮助开发者在"云端"和"客户端"同时部署应用,使得企业与用户都能共享资源. 本文整理了丰富的 Windows Azure 学习资源,帮助开发者能全面地学习 Win

Windows Azure把您的应用程序转移到公共云的正确方法

RightScale® Inc的解决方案架构师.云管理使组织能够轻松地部署和管理跨公共. 私人和混合云的业务关键型应用程序.RightScale提供了有效配置. 监视. 自动化和治理的http://www.aliyun.com/zixun/aggregation/14083.html">云计算基础架构和应用程序. 迁移到云的时候,产生焦虑是正常的.但是这是不应该的-IT产业已经对成功云部署所需的基本元素做了多年的实验:冗余. 可扩展性和自动化.这些想法都不一定是新的,但现在他们可以集体应用

Windows Azure为SAP提供的增强监控解决方案

正如大家在之前公告中所看到的,多个 SAP 应用程序已获得认证可在 http://www.aliyun.com/zixun/aggregation/13357.html">Azure 虚拟机中运行,未来 还会有更多 SAP 应用程序获得认证.对于希望在 Azure 中运行 SAP 应用程序的客户来说,这是个激动人心的进展,更多详情,请单击此处.在此博客中,我想集中讨论Azure为 SAP 提供的增强监控解决方案,当您在 Microsoft Azure 虚拟机上运行基于 SAP NetWea

背水一战 Windows 10 (56) - 控件(集合类): ListViewBase - 基础知识, 拖动项

原文:背水一战 Windows 10 (56) - 控件(集合类): ListViewBase - 基础知识, 拖动项 [源码下载] 背水一战 Windows 10 (56) - 控件(集合类): ListViewBase - 基础知识, 拖动项 作者:webabcd 介绍背水一战 Windows 10 之 控件(集合类 - ListViewBase) 基础知识 拖动项 示例1.ListViewBase 的基础知识Controls/CollectionControl/ListViewBaseDe