服务器故障 专业人员该做出什么反应

过去我们对于电视信号不好的解决方案,都有一个共识:拍一拍

现在我们对于电脑、手机死机的解决方案也有一个共识:重启

服务器故障怎么办

但是,当我们面对服务器出现故障时,又该做出什么反应呢?如果你要是拍一拍,估计服务器不会给你任何反应,但是你的同事可能会用狐疑的眼神儿看你;如果你立刻重启,你的上司可能会臭骂你一顿。那么服务器故障时,作为专业的技术人员该做出什么反应?

知己知彼

知己知彼

如果你是新人,想要知己知彼,就一定先要搞清楚服务器硬件情况。因为有时候服务器是裸机状态,所以,如果你不了解服务器的硬件情况,了解一下这里的IT架构和具体的硬件信息是很有必要的。诸如网络状态、有没有不间断电源、硬盘是否支持热插拔、服务器是不是HA高可用集群等问题。

摸清表层

即便只是看清表层,我们也需要尽可能多的了解有用信息,例如:服务器何时故障的?故障表现是什么?故障有没有呈现规律性?上一次更新是什么时候,更新了什么等问题。毕竟服务器不是电脑,如果你没搞清楚状况就进行强行关机,很可能造成数据丢失,而且还没解决问题。要记住,服务器是7*24小时开机的存在。

只有了解了服务器故障的基本逻辑,查看了日志等信息,尽可能的了解问题所在,才能给出具体的解决方案。

了解过去

我们常说以史为鉴或者读史使人明志,其中都体现了了解过去的重要性。所以我们要先看一下过去都发什么可什么。查看历史操作记录,可以了解过去有谁登陆了,都执行了那些命令,更多的信息对于你的判断准确性由很大的提升。但是,作为admin用户,在查看历史记录时,要注意不要利用自己的权限去侵犯别人的隐私。

看清现状

看清现状

做过了以上的准备,你还需要检查一下现在有没有其他人在线。如果有人正在在服务器上工作,而你却莽撞的对服务器进行其他更改,那你可能要面临一个很糟糕的情况。除了看谁在线之外,你还可以了解一下谁登录过。另外,还要看清现在有哪些程序正在运行,并作出相应的调整。

然后你就可以根据自己的判断,对服务器进行修复了。

切记,在服务器上,拍一拍和万能的重启都是莽撞之举,在服务器出现故障时,要了解服务器故障的具体原因,方能对症下药。

本文转自d1net(转载)

时间: 2024-10-29 14:55:35

服务器故障 专业人员该做出什么反应的相关文章

全国部分地区出现顶级域名跟服务器故障

1月21日下午消息,今日全国部分地区出现顶级域名跟服务器故障的同时,百度一个蹊跷的二级页面( n.baidu.com ),再次引发了不少网友的关注.访问这一页面并不涉及任何百度业务,而是犹如"彩蛋"一般仅有简短的英文短句,疑似被黑客攻破. 今日下午3点,全国所有通用顶级域的根出现异常,导致部分国内用户无法访问.com域名网站,对全国互联网链接造成系统性影响. 在这个过程中,百度一个蹊跷的二级页面,再次引发网友的关注.这个二级页面对应的域名为n.baidu.com,此前并没有百度的具体业

SQL Server误区:在服务器故障转移后,正在运行的事务继续执行

误区 #1:在服务器故障转移后,正在运行的事务继续执行 这当然是错误的! 每次故障转移都伴随着某种形式的恢复.但是如果当正在执行的事务没有Commit时,由于服务器或实例崩溃导致连接断开,SQL Server可没有办法在故障转移后的服务器重新建立事务的上下文并继续执行事务-无论你使用的故障转移方式是集群,镜像,日志传送或是SAN复制. 对于故障转移集群来说,当故障转移发生后,一个SQL Server实例在另一个故障转移集群的节点启动.所有实例上的数据库都要经历Recovery阶段-也就是所有没有

服务器故障应急要点

  在服务器发生故障后,如果要数据必需注意以下几点: 1.服务器发生故障后,用户切忌再对服务器进行任何操作,也切忌随意取出硬盘,以免弄乱顺序增加后期数据恢复的难度; 2.如果已经取出硬盘,千万记住要先标记好硬盘的顺序; 3.求助专业服务器数据恢复公司,切忌随意交给不知名的小数据恢复公司(因为服务器故障数据恢复,在全国只有少数人掌握了技术); 4.绝对不要轻易进行Rebuild以及同步等操作,否则可能造成数据错乱,部分文件无法打开; 5.千万不要初始化或者说RAID重组,初始化或说RAID重组是磁

如何排除服务器故障

  本文主要分三部分:第一部分讲的是服务器故障排除的基本原则性问题;第二部分讲述了一些服务器硬件故障排除的实例;第三部分讲述了一些服务器软件故障排除的实例. 第一部分 服务器故障排除的基本原则性问题 一.服务器开机无显示应怎么办 1.检查供电环境,零-火;零-地电压 2.检查电源指示灯,如果亮,正常吗 3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗 4.是否更换过显示器,更换另一台显示器 5.去掉增加内存 6.去掉增加的CPU 7.去掉增加的第三方I/O卡 8.检查内存和CPU 插的是否牢

服务器宕机怎么办?服务器故障应急预案

  昨日携程旅行网站打不开服务器故障,相信大家也看到携程科技大楼彻夜明灯加紧整修的壮观场景,那么对于服务器宕机怎么办?本文小编就来教一下大家服务器故障应急预案. 首先分清导致服务器出故障的因素: 1.外部攻击 2.内部攻击 3.运维误操作 服务器宕机怎么办?服务器故障应急预案 不管是外部攻击还是内部故障,备份好以及冗余措施,可以使宕机时间缩短到最低. 备份问题尽管听起来不可思议,但在实践中,不少企业并未建立起一套检验过的备份系统.备份的意义在于危急时刻可以快速恢复或重建生产系统.在企业网络中,经

VNC远程桌面解决服务器故障三例

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 笔者多年从事运维工作,运维工作平时压力不大,但每个月都有那么几天--服务器抽风!我们公司安装Windows系统的服务器很少连续运行超过三个月,定期重启几乎是必须的,否则死机.蓝屏.响应奇慢等等各种问题都来了. 把定时重启服务器命令添加到定时任务里,对减少服务器故障确有帮助,可只是掩盖了问题而非最终解决,其代价是"抽 to death

ubuntu-非常奇怪的服务器故障,希望大家帮忙解决!

问题描述 非常奇怪的服务器故障,希望大家帮忙解决! 自从公司Web服务器换成Linux系统(Ubuntu 12.04LTS)后,服务器经常死机(大概几天会有一次吧,有时候是一个星期这样),症状为SSH连接上去后,提示输入用户名密码,输完密码后,介面就一直停住没有任何响应,一直搞不明白什么原因,无奈只能叫机房重启.为了解决问题,后来部署了监控宝对服务器进行监控,发现服务器死机时,CPU的使用率到达了100%,但其中用户态使用率(%User)及内核态使用率(%System)相当底,甚至为0,但等待率

《构建高可用Linux服务器 第3版》—— 2.5 紧急处理线上服务器故障的办法

2.5 紧急处理线上服务器故障的办法 很多时候,网站或业务系统的服务器出现了故障,我们必须紧急修复,保证网站或业务系统能够使用.一般我们会遇到哪些系统故障,又该如何来处理呢?接下来逐个分析. 2.5.1 更改Administrator密码导致计划任务无法执行 问题描述:公司有位系统管理员离职了,他曾负责管理多台Windows Server 2003服务器,于是负责安全的部门要求接手的系统管理员更改Administrator密码,粗心的系统管理员急急忙忙地更改了Windows Server 200

如何快速发现服务器故障?FDM系统来帮忙

我最近一直忙着满世界出差,特别是前几天去德国法兰克福参加ISC超算行业盛会的时候,结识了不少国内外的超算供应商.在当天晚饭闲聊的时候,大家很自然的就谈到了不同品牌甚至不同国家对于计算设施,具体来说就是服务器的设计理念. 不同品牌服务器的差别究竟有多大?这个问题可谓是见仁见智. 从业的"新手"说:这东西设计不同.管理不同.这不同那不同,总之很不一样; 从业的"老人"却说:这东西没啥区别,都是英特尔的平台,能有多大区别? 后来这个话题讨论得还相当热烈,不同阵营的人都在列