如何运维网站能让其稳定高效——稳定篇

作为一名运维工程师,工作中最大的希望就是自己运维的网站能够稳定高效运行,但理想很丰满现实很骨感,实际情况是总会有各种各样状况导致网络、服务器或者应用环境发生故障。面对这种情况,我觉得还是要能从故障中总结出经验规律,让发生的几率不断的降低。要完成稳定和高效两者中的任何一个都是一个极具挑战的事情,这里我以维护自己的blog为例来阐述一下我对稳定这个词的诠释和理解。

       我的Blog架设在wordpress环境上的,记录了工作中的一些经验总结和随笔文章,虽然是个人网站,但麻雀虽小,五脏俱全,有一定的代表性。

一. 稳定之硬件稳定

       硬件是基础设施,必须打好硬件稳定的基础。传统的硬件选型一般都是购买HP,DELL的机架式服务器,根据自己的需求选择CPU,内存,硬盘等,这种方式有一个弊端就是不能很方便的对硬件进行后期扩容,买了后一般情况下就定型了,而且还要托管,购买带宽,后期的硬件维护也是需要自己来做。面对这些问题,我觉得选择当下比较炙手可热的云服务器是个不错的选择。它解决了:

1)硬件型号不再重要,自然也就不会成为网站发展的瓶颈,CPU,内存,硬盘等硬件的大小都是弹性的,根据自己使用的情况随时可以增大和减小

2)云服务器提供商提供托管场地和网络带宽设施

3)因为云服务器提供商一般都有大量的服务器,所以会专门有一个机房工程师每天做硬件,网络的巡检工作,及时发现问题并将基础问题处理在萌芽阶段

4)对磁盘IO要求比较高的,可以选择购买本地磁盘和SSD磁盘来解决问题

总的来说,选择云服务器比较省心,而且国内的云服务器也逐渐的成熟起来,我个人使用云服务器这种方式7个月了,截止目前,硬件,网络都没有出现过问题,还是比较稳定的。当然大型云服务器提供商是比较好的选择,阿里云、腾讯云、Ucloud都不错。具体选择哪家,可以根据自己的实际情况来酌情选择。

二. 稳定之软件稳定

       软件是具体提供服务的应用组件,要做好这个稳定我觉得比硬件难一些了,方方面面都要考虑清楚,这里从下往上来逐个分析吧:

1)Wordpress是一个PHP环境的程序,那么Linux作为系统环境就是一个很好的选择,其实稳定的另一个特征就是当出现了故障时能够很快的排除故障,在成百上千的Linux发布系统中很多人最终选择Redhat,CentOS肯定是有其原因的,CentOS是基于企业级linux系统发布Redhat编译而来,兼容性好而且免费使用,网络中有大量的技术文章可以借阅参考,64位也会逐渐的取代32位系统,我最后选择的是CentOS6 64位系统环境。这里不是说让大家全部选择此发行版,而是一个建议,在实际选择过程中最好根据自己的业务类型,选择一个能用上3到5年的系统,不折腾。

2)nginx、mysql、php的搭档组合有逐步取代AMP组合的趋势,V1.0以上的nginx,V5.1以上的mysql,V5.4以上的PHP,这个版本选择是目前比较实用的组合,能够支撑一段时间不需要在更新了。

3)组件选择好后,比较关键的就是配置好这些组件了,配置这个过程没有一个统一的标准,需要不同参数也就不同,但不管环境怎样,还是有几个比较通用的法则:

A. 一个PHP和nginx进程大约占用内存20M,最大允许的进程数是要根据自己的实际内存大小来动态调整,否则可能导致内存耗尽而系统崩溃

B.调整参数的原则就是让自己的硬件资源能够充分利用,最大使用率根据28原则

C.配置的过程是一个循序渐进的过程,很多时候也是在处理问题时逐步总结出来最优配置

三. 稳定之实时监控

       网站对外发布后,剩下的任务就是要保证网站不出故障,持久稳定运行了。要做到这一点,就要对网站和硬件的运行情况有一个全面的了解才可以。掌握的数据越多,就对自己的网站运行情况越有利。

可用性监控:

网站当下是否能够正常访问,这是一个最基本的要求。但我们不可能实时去盯着,这里需要有个实时监控的服务去不断的探测,提供这样服务的工具有很多,例如nagios,zabbix等开源产品就是专门做这个事情的,周期性的探测网站的可用性,不过这种产品有一个很大的局限性,就是nagios和zabbix是部署在和自己网站同样的网络环境中,常常会出现nagios探测是好的,但外部访问却不行的状况。

这里我选择了一个第三方公司的产品——云智慧的监控宝,来做我的blog的可用性监控,其实现原理是使用它在全世界托管的监测服务器来周期性的访问我的blog,这种监控比较接近于实际用户访问,比较有说服力,如果发现了问题,会有一个告警信息发送到手机、邮件上。

四. 稳定之压力测试

       压力测试的目的是为了能够对自己网站的最大负载能力有一个预估值,原则是测试一个有复杂业务逻辑的动态页面为好,通过压力测试得出自己网站的最大并发值和承载能力。得出这个值之后,剩下的在配置参数的时候就有依据了。压力测试的方法有很多种,比较常见的有ab,loadrunnner等工具。

五.稳定之硬件资源使用监控和并发数监控

       压力测试的目的就是为了能够在这一环节有的放矢,网站上线后通过可用性监控得知网站是否能正常访问。在通过硬件资源使用情况和web服务的并发数监控,在监控中将告警阀值设置为压力测试过程中的80%为准。通过这样的实时监控,就对自己的服务器的运行情况有一个立体式的掌控,让其能够运行在正常的区间中。

总结:

保证服务的稳定是一个持续的过程,通过时间的积累对自己维护的业务运行情况越来越熟悉,对架构的掌握也越来越透彻,将网站架构中的薄弱环节加固,再通过后期的实时监控,对网站的整体运行情况有一个清晰的认识,由此来让自己运维的网站稳定运行。以上五点算是抛砖引玉吧,如果你有好的方法,随时沟通交流

时间: 2024-11-22 21:22:28

如何运维网站能让其稳定高效——稳定篇的相关文章

如何运维网站能让其稳定高效之稳定篇

作为一名运维工程师,工作中最大的希望就是自己运维的网站能够稳定高效运行,但理想很丰满现实很骨感,实际情况是总会有各种各样状况导致网络.服务器或者应用环境发生故障.面对这种情况,我觉得还是要能从故障中总结出经验规律,让发生的几率不断的降低.要完成稳定和高效两者中的任何一个都是一个极具挑战的事情,这里我以维护自己的blog为例来阐述一下我对稳定这个词的诠释和理解. 我的Blog架设在wordpress环境上的,记录了工作中的一些经验总结和随笔文章,虽然是个人网站,但麻雀虽小,五脏俱全,有一定的代表性

专访阿里巴巴B2B事业群高级专家鲁小川:CI&CD的核心还是在于高效稳定的自动化

杭州·云栖大会将于2016年10月13-16日在云栖小镇举办,在这场标签为互联网.创新.创业的云计算盛宴上,众多行业精英都将在这几天里分享超过450个演讲主题. 为了帮助大家进一步了解这场全球前言技术共振盛会的内容,采访了各个论坛的大咖,以飨读者. 以下为正文: 鲁小川,阿里巴巴B2B事业群高级专家,主要负责阿里巴巴云效平台解决方案服务输出.在此之前是阿里巴巴B2B持续集成与持续交付系统宙斯盾系统平台(内部服务系统名称)的核心开发人员之一,负责系统的架构设计及代码研发,在测试自动化.测试环境.持

C++语言结构体高效稳定的排序的实现方式

问题描述 C++语言结构体高效稳定的排序的实现方式 为什么用了函数排序以后结构体数组的结果还是存在顺序不稳的情况,怎么才能确保排序结果的稳定呢?有没有可靠的函数? 解决方案 参考:http://blog.csdn.net/lethic/article/details/7781203

稳定高效扩展灵活 杰和发布四路服务器GCR2524MP-RF

2017年4月20日,杰和在深圳发布了稳定高效.灵活扩展的全新四路服务器GCR2524MP-RF,这是继2016年10月发布2U双子星.四子星服务器后在服务器市场上的又一力作. 厚积薄发,以技术驱动市场 近年来,高性能计算(HPC)已逐渐成为全球成长最快的市场之一.根据IDC预测,该市场将继续增长,从2014年的210亿美元增长到2019年的310亿美元.各个行业和领域对快速计算.数字模拟和制定更明智决策的需求持续推动着高性能计算的快速发展. 作为一家领先的云计算.大数据.物联网设备和解决方案提

稳定高效 扩展灵活 杰和高能效四路服务器发布在即

4月20日,杰和科技将在深圳召开"杰和梦,再出发"的新一代服务器发布会,届时,杰和将推出基于英特尔至强处理器E5 4600 V4家族的四路服务器GCR2524MP-RF. 作为一家领先的云计算.大数据.物联网设备和解决方案提供商,杰和紧跟业界前沿不断推出新品,为服务器市场注入新血液.而即将推出的新品四路服务器采用英特尔高性能处理器,具备强大的计算能力和优异的能效比,能够为客户提供优异的关键业务处理能力,同时在可靠性.稳定性.可扩展性等方面同样表现优异,可广泛应用于高级政府.通信.金融.

运营商站在FMC和移动UC之间无所适从

从技术.应用和市场参与者等角度分析,企业级电信市场正处于一个根本性的转型时期.随着先前独立的语音/数据网络的合并,技术转换也由原来的数据迁移转向现在的语音和视频相结合的基于IP网络的解决方案.这种技术转换也为统一通信解决方案奠定了基础,使之能够将语音.视频.电子邮件.文本和协作工具纳入到一个单一的可管理的"操作面板",并具备一系列用途和具体能力. 据某咨询公司估计,1.1亿美国上班族中,有90%的人至少有20%的时间处于流动状态.如果将范围扩大到移动通信驱动的业务流程(mobile C

四个步骤打造稳定高效友情链接

2012年过去了四分之一,在这些时间里,SEO强调得最多的还是高质量外链,需要以质量为前提再做数量,2012年SEO向成熟又迈进了一步,什么样的外链才是高质量外链?友情链接,博客外链,单向链接,新闻源软文外链等都属于高质量外链.今天笔者知依要分享的是:如何打造高效又稳定的友情链接外链. 笔者身边的同行们经常在抱怨友情接不好做,怎么说呢,对于新站来说,友情链接确实不好做,对于权重站来说相对轻松很多.友情链接要找谁做?为什么要和他做?做友情链接有没有风险?等等问题都要考虑在内,我总结了一下友情链接的

服务器托管全解 甩手掌柜却更高效稳定

服务器托管是企业用户为提高网站访问速度,将自己的服务器及相关设备放到互联网服务提供商ISP所设立的IDC机房内一种服务方式.服务器托管一般需要用户支付必要费用,由ISP运营商代为管理维护,客户端连线服务器进行操作,这样可以帮助系统达到安全.稳定.可靠.高效的目的. 服务器托管的本质 服务器托管又叫做主机托管,这种方式能够摆脱虚拟主机受软硬件资源的限制,提供高性能的处理能力,并且降低维护费用.机房设备投入.线路租用等各种高昂的额外支出.托管后,客户依然对设备拥有所有权和配置权,并可对扩展空间进行预

一个稳定高效的Linux虚拟主机业务完整解决方案

方案背景 在互联网信息高速发展的今天,IDC行业的发展更是势如破竹,因而更多的人亟待简单易行的IDC解决方案.为解决这一个IDC行业普遍关注的问题,我们推出此解决方案以供参考. 整体目标 构建一个完全可运行,实施简单,维护方便且安全稳定的主机运营平台. 需求分析 1. 基础设施 由于此方案是主机运营平台的解决方案,所以在基础设施上我们需要有一台或多台物理服务器.对于物理服务器的配置不做硬性要求,可根据需要自行选择,但要能够保证实现最基本的运营需求. 2. 系统要求 (1)操作系统 在基础设施架构