Defunct Process - 僵死进程管理 |
置之死地而后生 |
词 | 释义 |
---|---|
Defunct | adj. 非现存的; 死的 |
zombies | n. 僵尸;生性怪癖的人;僵尸电脑(zombie的复数) |
SIGINT,SIGKILL,SIGTERM 三者都是结束/终止进程运行.但略微有区别,一般对应不同的键盘按键操作。
状态 | 完整 | 对比 |
---|---|---|
SIGINT | Signal Interrupt | - 产生方式: 键盘Ctrl+C - 产生结果: 只对当前前台进程,和他的所在的进程组的每个进程都发送 SIGINT 信号,之后这些进程会执行信号处理程序再终止. |
SIGKILL | Signal Kill | 产生方式: 和任何控制字符无关,用kill函数发送 本质: 相当于shell> kill -9 pid. 产生结果: 当前进程收到该信号,注意该信号时无法被捕获的,也就是说进程无法执行信号处理程序,会直接发送默认行为,也就是直接退出.这也就是为何kill -9 pid一定能杀死程序的原因. 故这也造成了进程被结束前无法清理或者关闭资源等行为,这样时不好的. |
SIGTERM | Signal Terminate | 产生方式: 和任何控制字符无关,用kill函数发送 本质: 相当于shell> kill不加-9时 pid. 产生结果: 当前进程会收到信号,而其子进程不会收到.如果当前进程被kill(即收到SIGTERM),则其子进程的父进程将为init,即pid为1的进程. 与SIGKILL的不同: SIGTERM可以被阻塞,忽略,捕获,也就是说可以进行信号处理程序,那么这样就可以让进程很好的终止,允许清理和关闭文件. |
SIGQUIT | Signal Quit | 在POSIX兼容平台上,SIGQUIT是当用户请求进程执行核心转储时由其控制终端发送到进程的信号。 SIGQUIT通常可以用Control- \诱导。在Linux上,也可以使用Ctrl-4或在虚拟控制台上使用SysRq密钥。 |
注:更多参考1
在UNIX/Linux 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他, 那么他将变成一个僵尸进程. 在fork()/execve()过程中,假设子进程结束时父进程仍存在,而父进程fork()之前既没安装SIGCHLD信号处理函数调用 waitpid()等待子进程结束,又没有显式忽略该信号,则子进程成为僵尸进程。
如何查看linux系统上的僵尸进程,如何统计有多少僵尸进程?
xxxxxxxxxx
1# ps -ef | grep defunct
2或
3# ps aux | grep Z
或者查找状态为Z的进程,Z就是代表zombie process,僵尸进程的意思。
另外使用top命令查看时有一栏为S,如果状态为Z说明它就是僵尸进程。
xxxxxxxxxx
31# top
2
3Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, **0 zombie**
如何杀死僵尸进程呢?
一般僵尸进程很难直接kill掉,不过您可以kill僵尸爸爸。父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。
1ps -e -o ppid,stat | grep Z | cut -d” ” -f2 | xargs kill -9
2
3或
4
5kill -HUP `ps -A -ostat,ppid | grep -e ’^[Zz]‘ | awk ’{print $2}’`
当然您可以自己编写更好的shell脚本.
另外子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信号后,执行waitpid()函数为子进程收尸。就是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD消息,而此时,尽管对它的默认处理是忽略,如果想响应这个消息,可以设置一个处理函数。
如何避免僵尸进程呢?
处理SIGCHLD信号并不是必须的。但对于某些进程,特别是服务器进程往往在请求到来时生成子进程处理请求。如果父进程不等待子进程结 束,子进程将成为僵尸进程(zombie)从而占用系统资源。如果父进程等待子进程结束,将增加父进程的负担,影响服务器进程的并发性能。在Linux下 可以简单地将 SIGCHLD信号的操作设为SIG_IGN。 signal(SIGCHLD,SIG_IGN); 这样,内核在子进程结束时不会产生僵尸进程。这一点与BSD4不同,BSD4下必须显式等待子进程结束才能释放僵尸进程
或者
用两次fork(),而且使紧跟的子进程直接退出,是的孙子进程成为孤儿进程,从而init进程将负责清除这个孤儿进程。
xxxxxxxxxx
151-bash-4.2$ kill -l # 通过linux命令查看信号序号
2 1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP
3 6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1
411) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM
516) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP
621) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ
726) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR
831) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN+2 37) SIGRTMIN+3
938) SIGRTMIN+4 39) SIGRTMIN+5 40) SIGRTMIN+6 41) SIGRTMIN+7 42) SIGRTMIN+8
1043) SIGRTMIN+9 44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
1148) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
1253) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7
1358) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2
1463) SIGRTMAX-1 64) SIGRTMAX
15-bash-4.2$
xxxxxxxxxx
361
2SIGHUP 本信号在用户终端连接(正常或非正常)结束时发出, 通常是在终端的控
3制进程结束时, 通知同一session内的各个作业, 这时它们与控制终端
4不再关联.
5SIGINT 程序终止(interrupt)信号, 在用户键入INTR字符(通常是Ctrl-C)时发出
6SIGQUIT 和SIGINT类似, 但由QUIT字符(通常是Ctrl-)来控制. 进程在因收到
7SIGQUIT退出时会产生core文件, 在这个意义上类似于一个程序错误信
8号.
9SIGILL 执行了非法指令. 通常是因为可执行文件本身出现错误, 或者试图执行
10数据段. 堆栈溢出时也有可能产生这个信号.
11SIGTRAP 由断点指令或其它trap指令产生. 由debugger使用.
12SIGABRT 程序自己发现错误并调用abort时产生.
13SIGIOT 在PDP-11上由iot指令产生, 在其它机器上和SIGABRT一样.
14SIGBUS 非法地址, 包括内存地址对齐(alignment)出错. eg: 访问一个四个字长的整数, 但其地址不是4的倍数.
15SIGFPE 在发生致命的算术运算错误时发出. 不仅包括浮点运算错误, 还包括溢出及除数为0等其它所有的算术的错误.
16SIGKILL 用来立即结束程序的运行. 本信号不能被阻塞, 处理和忽略.
17SIGUSR1 留给用户使用
18SIGSEGV 试图访问未分配给自己的内存, 或试图往没有写权限的内存地址写数据.
19SIGUSR2 留给用户使用
20SIGPIPE Broken pipe
21SIGALRM 时钟定时信号, 计算的是实际的时间或时钟时间. alarm函数使用该信号.
22SIGTERM 程序结束(terminate)信号, 与SIGKILL不同的是该信号可以被阻塞和处理. 通常用来要求程序自己正常退出. shell命令kill缺省产生这个信号.
23SIGCHLD 子进程结束时, 父进程会收到这个信号.
24SIGCONT 让一个停止(stopped)的进程继续执行. 本信号不能被阻塞. 可以用一个handler来让程序在由stopped状态变为继续执行时完成特定的工作. 例如, 重新显示提示符
25SIGSTOP 停止(stopped)进程的执行. 注意它和terminate以及interrupt的区别: 该进程还未结束, 只是暂停执行. 本信号不能被阻塞, 处理或忽略.
26SIGTSTP 停止进程的运行, 但该信号可以被处理和忽略. 用户键入SUSP字符时(通常是Ctrl-Z)发出这个信号
27SIGTTIN 当后台作业要从用户终端读数据时, 该作业中的所有进程会收到SIGTTIN信号. 缺省时这些进程会停止执行.
28SIGTTOU 类似于SIGTTIN, 但在写终端(或修改终端模式)时收到.
29SIGURG 有"紧急"数据或out-of-band数据到达socket时产生.
30SIGXCPU 超过CPU时间资源限制. 这个限制可以由getrlimit/setrlimit来读取/改变
31SIGXFSZ 超过文件大小资源限制.
32SIGVTALRM 虚拟时钟信号. 类似于SIGALRM, 但是计算的是该进程占用的CPU时间.
33SIGPROF 类似于SIGALRM/SIGVTALRM, 但包括该进程用的CPU时间以及系统调用的时间.
34SIGWINCH 窗口大小改变时发出.
35SIGIO 文件描述符准备就绪, 可以开始进行输入/输出操作.
36SIGPWR Power failure