自动杀死Unix僵死的进程
# autokill
ps -ef | awk &apos{ print $1,$2,$7,$8 }&apos | \
awk &apos/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }&apos | \
awk &apos!/root/ { print "kill -9 " $2}&apos > /tmp/k_kill
chmod 777 /tmp/k_kill
/tmp/k_kill
现在对Autokill程序加以解释。
首先,用Unix 命令 ps -ef 查看进程状态,通过管道传送给 AWK 进行处理。
在第一个 AWK 中,获取进程的用户标识(UID)、进程号(PID)、进程占用CPU时间(Time)、进程执行命令(CMD)四个字段的值。
在第二个AWK 中,通过模式匹配,选取所有匹配模式的行。在AWK 中,[0-9]匹配0~9中任一个数字,[1-9]匹配1~9中任何一个数字,连用两个[0-9][0-9]则匹配一个任意两位数,因此[0-9][0-9]:[0-9][0-9]:[1-9][0-9]则匹配 Time 时间字段值,查找占用 CPU 时间超过 10 秒的进程,如果要查找占用 CPU 时间超过半小时的进程,则把模式改成 [0-9][0-9]:[3-9][0-9]:[0-9][0-9]。
在第三个 AWK 中,用 "!/root/ "过滤掉由 root用户生成的进程,并进行Shell语言拼装,将最终结果定向到文件 /tmp/k_kill。在 /tmp/k_kill 文件中,都是形如 kill -9123 的Shell命令。
在Autokill程序的最后,执行 /tmp/k_kill 杀死进程。
Autokill程序采用了管道处理方式,如要查看中间结果,则可以依次断开管道。
第一步执行:
ps -ef
第二步执行:
ps -ef | AWK &apos{ print $1,$2,$7,$8 }&apos
第三步执行:
ps -ef | AWK &apos{ print $1,$2,$7,$8 }&apos | \
AWK &apos/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }&apos
第四步执行:
ps -ef | AWK &apos{ print $1,$2,$7,$8 }&apos | \
AWK &apos/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }&apos | \
AWK &apos!/root/ { print "kill -9 " $2}&apos > /tmp/k_kill
最终查看 /tmp/k_kill 文件。
再有,如只想自动杀死由某一用户执行的进程(如jdc3206),只要将模式"!/root/"改成 "/jdc3206/"即可;如只想杀死执行某一命令的进程(如 xinmu ),只要将模式"!/root/" 改成"/xinmu/"即可。
最后用 crontab -e 增加一个 cron 作业。
0,30 /tmp/autokill
经过以上步骤,系统每隔半小时执行一次/tmp/autokill。但在Unix系统中,有些僵死的进程会莫名其妙地不能用 kill 命令杀死,这就需要重新引导机器,一方面清除系统垃圾,另一方面需要对资源重新分配。