top对僵尸进程的处理
<1>现象。
i249 ~ # top
top - 13:35:49 up 738 days,  1:46,  3 users,  load average: 3.91, 4.64, 4.94
Tasks: 175 total,   1 running, 168 sleeping,   0 stopped,   6 zombie
Cpu0  : 93.8%us,  0.0%sy,  0.0%ni,  6.2%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  : 21.4%us,  0.0%sy,  0.0%ni, 78.6%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  : 23.5%us,  5.9%sy,  0.0%ni, 64.7%id,  0.0%wa,  0.0%hi,  5.9%si,  0.0%st
Mem:  16385312k total, 15502200k used,   883112k free,   947972k buffers
Swap: 33574908k total,        0k used, 33574908k free,  9233612k cached
  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                           
 7854 uuwatch   20   0 2496m 1.2g  11m S  216  7.8  48377:55 java                                                                                                               
31880 uuwatch   20   0 3993m 2.8g  12m S   39 18.1   1013:10 java                                                                                                               
13279 root      20   0 10696 1152  796 R    7  0.0   0:00.03 top
<2>查找。
i249 ~ # ps -A -o stat,ppid,pid,cmd |grep -e "^[Zz]"
Zs   12798 12800 [runscript.sh] <defunct>
Zs   12896 12897 [runscript.sh] <defunct>
Zs   12964 12965 [runscript.sh] <defunct>
Zs   13060 13061 [runscript.sh] <defunct>
Zs   13126 13127 [runscript.sh] <defunct>
Zs   13199 13200 [runscript.sh] <defunct>
<3>解决。
i249 ~ # ps -A -o stat,ppid,pid,cmd |grep -e "^[Zz]"|awk ‘{print $2}‘|xargs kill -9
D=不可中断的睡眠状态
R=运行
S=睡眠
T=跟踪/停止
Z=僵尸进程
定义
In UNIX System terminology, a process that has terminated,but whose parent has not yet waited for it, is called a zombie.
在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他, 那么他将变成一个僵尸进程. 在fork()/execve()过程中,假设子进程结束时父进程仍存在,而父进程fork()之前既没安装SIGCHLD信号处理函数调用 waitpid()等待子进程结束,又没有显式忽略该信号,则子进程成为僵尸进程。
如何查看linux系统上的僵尸进程,如何统计有多少僵尸进程?
#ps -ef | grep defunct
或者查找状态为Z的进程,Z就是代表zombie process,僵尸进程的意思。
另外使用top命令查看时有一栏为S,如果状态为Z说明它就是僵尸进程。
Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie
top命令中也统计了僵尸进程。或者使用下面的命令:
ps -ef | grep defunct | grep -v grep | wc -l
如何杀死僵尸进程呢?
一般僵尸进程很难直接kill掉,不过您可以kill僵尸爸爸。父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。
ps -e -o ppid,stat | grep Z |cut -d" " -f 2| xargs kill -9
或
kill -HUP `ps -A -ostat,ppid`|grep -e ‘^[Zz]‘|awk ‘{print $2}‘
另外子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信号后,执行waitpid()函数为子进程收尸。就是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD消息,而此时,尽管对它的默认处理是忽略,如果想响应这个消息,可以设置一个处理函数。
如何避免僵尸进程呢?
处理SIGCHLD信号并不是必须的。但对于某些进程,特别是服务器进程往往在请求到来时生成子进程处理请求。如果父进程不等待子进程结束,子进程将成为僵尸进程(zombie)从而占用系统资源。如果父进程等待子进程结束,将增加父进程的负担,影响服务器进程的并发性能。在Linux下 可以简单地将 SIGCHLD信号的操作设为SIG_IGN。
signal(SIGCHLD,SIG_IGN);
这样,内核在子进程结束时不会产生僵尸进程。这一点与BSD4不同,BSD4下必须显式等待子进程结束才能释放僵尸进程
或者
用两次fork(),而且使紧跟的子进程直接退出,是的孙子进程成为孤儿进程,从而init进程将负责清除这个孤儿进程。