How to kill an `uninterruptible sleep` process

很早之前就遇到一次这个故障,当时是一台主机故障,这次是上百台主机故障。当时是使用mysqldump向NFS备份时,写数据时大概是NFS出现故障,使得mysqldump进程进入uninterruptible sleep(man ps)状态:

$ps axu|grep mysqldump
mysql 2718 0.0 0.0 51088 672 pts/0 S+ 13:30 0:00 grep mysqldump
mysql 14916 1.4 0.0 0 0 ? D 02:03 10:03 [mysqldump]

进入该状态的进程,会一直等待NFS,不接受任何信号,当然也就无法被杀死(kill/fuser -k)。因为进程一直在运行队列(running queue)中,所以还会导致主机的Load上升(虽然主机并不繁忙)。如果由于这个原因被卡住的进程很多的话,主机的Load可能会看起来非常高。

上次出现这个问题时只有一台主机出了这个症状,当时Google后也注意到很多人有遇到了类似的问题,并且都束手无策(There are some things even root can't do)。Google后,再尝试找了一些Linux原理方面的介绍,依然无解。

解决的终极办法是重启主机(reboot),所以决定等待一段时间(之前遇到过一些僵死进程Z,等待一段时间后也消失了),实在不行就择机重启主机。不过奇怪的是,等了几天过后,这个进程确实消失了(正常结束了?应该是)。

1. Why is Linux so "stupid"?

有人就问,Linux设计是不是有问题,为什么会有一些进程root也无法杀死呢?

jra在How to kill a process in uninterruptible sleep state中给了一个解释:

  There's fairly extensive discussion of this in a couple of the kernel
design books, and I think in Nemeth, Snyder and Seebass: the problem stems
from the fact that there are two types of device drivers -- those
for "fast" devices and those for "slow" devices:

    Slow-device drivers -- for things like terminals, and such -- are
                usually split in two pieces, and can therefore be
                interrupted while they're in the middle of something.

    Fast-device drivers -- which service things like hard drives and (I
                think) ethernet cards -- are designed to expect that
                when they call out to hardware, it will respond  instantly
                (in human terms), and that they won't have to wait
                on anything. Such drivers have, as a rule, proven
                extremely intolerant of hardware trouble -- if your hard
                drive start having to do hardware retries to read a
                sector, your system perfromance is going int he toilet,
                even if you have more than one drive...

大概意思是说,Linux中设备驱动程序可以分为“slow device”和“fast device”两类。磁盘属于“fast device”(如果当作“slow device”处理效率会很低),在这类设备上操作时会以uninterruptible的方式进行。

2. 真的没办法吗?

理论上,除了重启主机,貌似没什么办法了。不过,根据实际经验和运气,也还是有一些办法可以尝试的。

办法1:umount -f

如果是由于NFS故障导致的,可以尝试使用先umount/mount重新挂载NFS。如果NFS无法卸载(如果遇到上述情况,八成是这样),可以尝试使用 -f 参数卸载。最近一次遇到这个故障,有接近上百台主机出现这个故障,就是使用umount -f成功卸载NFS后,相关uninterruptible的进程也都随之正常结束。当时发现,连续重试多次 umount -f 才行:

root>#umount -f /nfsdir
umount2: Device or resource busy
umount: /nfsdir: device is busy
root>#umount -f /nfsdir
umount2: Device or resource busy
umount: /nfsdir: device is busy

办法2:等

最早mysqldump遇到这个问题时,束手无策后,就等了几天,发现进程确实结束了。所以如果情况不是很紧急,“等”也是一个办法。

遇到的僵死进程这个办法也可能有效。

办法3:killall -KILL rpciod

一篇文章中,还提到,进程处于uninterruptible sleep(即ps的D状态),进程处于rpc_execute调用状态,而rpc_execute调用是由rpciod提供,所以可以通过杀死rpciod来解决问题。(rpciod被杀死后会自动重启过来)【没有实验过,慎用,希望有经验者分享一下】

办法4:reboot

实在不行,就只能reboot了。这是最不推荐的做法,毕竟每次遇到都reboot,代价还是比较大,特别是当你在追求HA的时候。

3. 能够避免这种情况吗?

在RTFM之后,发现可以通过挂载NFS时指定一些参数,尽可能的避免这个问题:


    soft       If an NFS file operation has a major timeout then report
                 an I/O error to the calling program.  The default is  to
                 continue retrying NFS file operations indefinitely.

      hard       If an NFS file operation has a major timeout then report
                 "server not responding"  on  the  console  and  continue
                 retrying indefinitely.  This is the default.

      intr       If  an  NFS file operation has a major timeout and it is
                 hard mounted, then allow signals to  interupt  the  file
                 operation  and  cause  it to return EINTR to the calling
                 program.  The default is to not allow file operations to
                 be interrupted.

上面3个参数,其中hard是默认的。我们通过断开网络模拟NFS故障,测试了 intr 选项,发现能够一定程度上避免上述的情况。在测试 soft 选项时,并没有上面描述的那么好用,在实验中,使用 soft 挂载是现象和 hard 类似(不知道我是不是忽略哪些细节了)。

如果你被这个问题困扰,可以试试使用intr参数挂载NFS:

mount -o intr 172.23.119.25:/nfs /nfsdir

时间: 2024-10-24 11:33:05

How to kill an `uninterruptible sleep` process的相关文章

oracle中11.2中手工kill所有的CRS进程而不导致主机重启方法

我们都知道,在RAC环境中,如果kill ocssd.bin进程,会引起主机重启. 但是有时候系统已经异常了了,且CRS不能正常关闭,而主机可能是几年没重启的老系统,没人敢重启,现在怎么办? 我们只能尝试手工kill进程的方式,然后手工修复CRS(注意,在10.2 RAC中,只有3个d.bin进程). 测试环境:操作系统是OEL 6.6 [root@lunar1 ~]# cat /etc/oracle-release Oracle Linux Server release 6.6 [root@l

ps aux grep-如图所示,进程就是kill不掉 如何彻底杀掉rsc.sh的进程

问题描述 如图所示,进程就是kill不掉 如何彻底杀掉rsc.sh的进程 [root@app01 ~]# ps aux|grep rsc.sh root 63891 0.0 0.0 103252 852 pts/1 S+ 10:35 0:00 grep rsc.sh [root@app01 ~]# kill -9 63891 -bash: kill: (63891) - No such process [root@app01 ~]# ps aux|grep rsc.sh root 63968 0

【会话】Oracle kill session系列

[会话]Oracle kill session系列   1.1  BLOG文档结构图 Oracle kill session相关问题 - 3 - 1.1 BLOG文档结构图 - 4 - 1.2 前言部分 - 5 - 1.2.1 导读和注意事项 - 5 - 1.2.2 相关参考文章链接 - 6 - 1.2.3 本文简介 - 7 - 1.3 相关知识点扫盲(摘自网络+个人总结) - 7 - 1.3.1 得到当前会话的几个SQL - 7 - 1.3.2 Session 状态说明 - 8 - 1.3.3

win2000 2003命令大全

_cmd_.exe > Famous command prompt 没什么好说的! cmdl32.exe > Connection Manager Auto-Download 自动下载连接管理  cmmgr32.exe > Connection Manager 连接管理器 cmmon32.exe > Connection Manager Monitor 连接管理器监视  cmstp.exe > Connection Manager Profile Manager 连接管理器配

windows2000秘密武器之任务进程终止工具

3.任务与进程的中止工具 上篇介绍的任务与进程显示工具tlist,其主要作用是为管理任务和进程提供信息.所谓"管理",不外乎是中止某个任务或进程,或改变它们的优先权.命令行形式的任务与进程管理工具,只有中止进程功能,没有改变优先权的功能.程序名是Kill.EXE.kill的意思为杀死!即可以用它来"杀死"一个现存的任务或进程!听起来是不是有点恐怖啊?为了不致觉得吓人,我改用"中止"这个名称.中止也好杀死也罢,都有一个惟谁试问拿谁开刀的问题:你要中止哪个任务或哪个进程?它的名字如何得到?从什么地方

Mysql 报错PID file could not be found!解决办法

今天想把之前在cetnos6上编译安装的mariadb改下PATH环境变量,操作几次之后,关闭或重启mysql就失败了,提示如下: [root@web1 ~]# service mysqld stop MySQL server PID file could not be found!                  [FAILED] google了下,解决方案如下: 查看一下进程: [root@web1 ~]# ps aux |grep mysq* mysql     16058  0.2 1

【实战】Docker容器资源管理

本文讲的是[实战]Docker容器资源管理,[编者的话]本文作者是Red Hat的软件工程师 - Marek Goldmann,这篇文章详细介绍了Docker容器的资源管理,总共分了三大部分:CPU.内存以及磁盘IO.作者通过实践举例给读者勾勒出一幅清晰明了的Docker资源管理的画卷. 在这篇博客文章中,我想谈谈Docker容器资源管理的话题.我们往往不清楚它是怎样工作的以及我们能做什么不能做什么.我希望你读完这篇博客文章之后,可以帮助你更容易理解有关Docker资源管理的内容. 注意:我们假

VNC常用操作及常见问题解决办法汇总

  VNC登录用户缺省是root,但在安装oracle时必须用oracle用户的身份登录,下面我们就以oracle为例说明如何配置VNC,从而可以使用不同的用户登录到主机.步骤描述如下:    步骤一:修改/etc/sysconfig/vncservers,添加oracle用户,修改后内容如下:        VNCSERVERS="1:root 2:root 3:oracle"        VNCSERVERARGS[1]="-geometry 1024x768"

配置vnc远程连接Linux和Unix远程服务器图形界面安装oracle

1.配置并开启vnc服务 [oracle@localhost ~]$ vncserver You will require a password to access your desktops. Password:              ---这里要求输入vnc客户端登录的密码并重复 Verify:               New 'localhost.localdomain:2 (oracle)' desktop is localhost.localdomain:2 Creating