红联Linux门户
Linux帮助

小议Linux中的僵死进程

发布时间:2016-04-11 09:54:35来源:linux网站作者:小菜鸟上校

在读《unix环境高级编程》时,发现忽然对僵死进程的处理机制很感兴趣,经过查阅资料弄清楚了其中的原理,在这里做一个记录。


1.一个进程的离去

在一个进程调用  exit  函数,或者  return  语句,或者是调用  abort  等函数终止后,总之不管进程是怎样终止的,它们在终止之后,都会去执行内核中的一个代码片断。这个代码片断负责关闭终止进程打开的文件描述符,释放终止进程占用的内存空间。但是,是否终止进程在系统中就从此消失,以后该进程在系统中,就再也找不到这个终止进程的一点踪影呢,答案是否定的。


2.僵死进程

一个进程在终止之后,会释放它所占用的一切资源。但是会在进程表中保留该进程的一些生前的信息,比如进程ID,进程使用的CPU时间,退出状态等。这时这个终止进程的状态就称之为僵死状态,它要等待它的父进程来为它收尸。这时候在  linux  系统中,僵死进程的状态被打印为  ‘Z’,它的父进程通过调用  wait  或者是  waitpid  函数来为其善后。


3.动手做,理解僵死进程

僵死进程是怎么产生的呢?这是因为,在一个程序中,不断的调用fork函数,却没有调用  wait  或者  waitpid  函数来做清除工作,而该程序又没有终止,这样就会在系统中产生僵死进程。解释了这么多概念,不如给一个例子可能会更加的清晰,下面的一个例子用来在系统中产生僵死进程:

#include <stdio.h> 
#include <unistd.h> 
int main(void) 

pid_t pid; 
while(1) 

if( (pid=fork())<0 ) 

printf("fork error\n"); 
return -1; 

else if( pid==0 ) 

printf("child\n"); 
_exit(0); 

else 

sleep(1); 


return 0; 
}    

将程序编译完成之后,执行,会每隔1秒钟产生一个子进程。在子进程中输出提示信息  child  之后就立即退出。这个程序在执行的时候,我们再开一个终端,输入命令:

ps aux | grep 'Z' 

可以看到输出结果如下:
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND 
asus      3213  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3214  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3215  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3217  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3271  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3272  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3273  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3274  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3275  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3276  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3277  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3282  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3343  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 
asus      3344  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct> 

我们可以看到这些进程的STAT都为僵死进程。如果我们按  ctrl+c  把执行的程序终止,再次执行这个命令,会发现在系统中所有产生的僵死进程都消失了。

感觉很奇怪吧,既然这些僵死进程都消失了,那么就一定有一个进程为系统种的僵死进程收尸,这个进程就是  init  进程,它的PID为1。原来在  linux  中,当一个进程的父进程终止时,这个进程就成为了孤儿进程,那么  init  进程就是一个好心的人了,它专门收养孤儿进程。而  init  进程又被实现为,当它有一个子进程终止时,就立即调用  wait  函数来善后。所以就我们刚才的例子来说,当我们把程序终止后,所有僵死进程的父进程就变成了  init,而  init  发现,哦,原来你们都是僵死进程啊,所以它给每一个僵死进程调用  wait  函数,是使它们能够安心离去。init  进程的这种实现方式使得  linux  系统中的僵死进程不会太多。当然,如果这个程序永远不终止,那么系统中的僵死进程就会越来越多。

注意:一个僵死进程在内存中已经没有程序的正文和数据,所以不能使用  kill  来杀死一个僵死的进程。只能通过杀死僵死进程的父进程来清除僵死进程,或者在父进程中调用wait或waipid函数来清除。


本文永久更新地址://m.ajphoenix.com/linux/19674.html