最近又遇到 SIGPIPE 问题,虽然这个问题是经典的老生常谈,但发现还是有些东西需要明确一下的。
如何处理 SIGPIPE 信号问题?应该在库里处理,还是在可执行程序里处理?
常见代码片段
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
|
注:关于传统 signal 系统调用的问题,可以参考《Linux signal那些事儿》
产生 SIGPIPE 的条件
对一个已经收到 FIN 包的 socket 调用 read 方法,如果接收缓冲已空,则返回 0,这就是常说的“连接关闭”表示。
对一个已经收到 FIN 包的 socket 第一次调用 write 方法时,如果发送缓冲没问题,则 write 调用会返回写入的数据量,同时进行数据发送。但是发送出去的报文会导致对端发回 RST 报文。因为对端的 socket 已经调用了 close 进行了完全关闭,已经处于既不发送,也不接收数据的状态。所以第二次调用 write 方法时(假设在收到 RST 之后)会生成 SIGPIPE 信号,导致进程退出(这就是为什么第二次 write 才能触发 SIGPIPE 的原因)。
民间描述:
对一个对端已经关闭的 socket 调用两次 write,第二次 write 将会生成 SIGPIPE 信号,该信号默认结束进程。
APUE 上的描述:
如果在写到管道时读进程已经终止,则产生此信号(管道角度)。当类型为 SOCK_STREAM 的套接字已不再连接时,进程写到该套接字也产生此信号(socket 角度)。
SIGPIPE 的处理方式
为了避免进程退出,既可以对 SIGPIPE 信号进行捕获,也可以将其忽略,即为其设置 SIG_IGN 信号处理函数(在系统头文件 <signal.h> 中定义的常量):
1 |
|
这样,当第二次调用 write 方法时,会返回 -1,同时 errno 会被设置成 EPIPE ,程序便能知道对端已经关闭。
-=-=-=-
关于 signal() 函数的说明:
- signal 函数由 ISO C 定义。因为 ISO C 不涉及多进程,进程组以及终端 I/O 等,所以它对信号的定义非常含糊,以至于对 UNIX 系统而言几乎毫无用处。
- 因为 signal 的语义与系统实现有关,所以最好使用 sigaction 函数代替 signal 函数。
- signal 函数的限制:不改变信号的处理方式,就不能确定信号的当前处理方式(因为需要通过 signal 函数的返回值来确定以前的处理配置);sigaction 函数则没有这个问题。
- 基于 signal 函数实现的信号处理可能是不可靠的(在早期的 UNIX 版本中,进程每次接到信号进行处理时,(内核已经在投递前)将该信号的动作复位为默认值 SIG_DFL,所以从信号发生之后到在信号处理程序中再次调用 signal 函数之前这段时间中有一个时间窗口。若在这个窗口中再发生一次该信号,则会导致执行该信号的默认动作,可能导致进程的终止)
-=-=-=-
另外,还有其他方法来处理 SIGPIPE 信号:设置 socket 在进行写操作时不产生 SIGPIPE 信号。
1 2 |
|
这样做的好处在于:在某些情况 下我们并不需要一个全局的 SIGPIPE handler 。但是 SO_NOSIGPIPE 不具有可移植性,后续有说明。
-=-=-=-
查阅资料后找到了两个方法:
- 使用 signal(SIGPIPE, SIG_IGN) 忽略 SIGPIPE 。经实验在 ios7 模拟器上虽然 xcode 还是会捕获 SIGPIPE,但是程序不会崩溃,继续后可以执行。但是在真机上依然会崩溃。
- 使用 SO_NOSIGPIPE 。经实验在多个 ios 版本下都不再触发 SIGPIPE,完美解决问题。
SO_NOSIGPIPE 在 mac 中存在,可惜在 android 中不存在。请使用 MSG_NOSIGNAL 来代替
1 2 3 |
|
在我的系统上
1 2 3 4 5 |
|
查看 man 手册,可以看到
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
====
一下内容取自 glib-2.35.4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
|
下面是 stackoverflow 上的一篇关于 SIGPIPE 的讨论:
http://stackoverflow.com/questions/108183/how-to-prevent-sigpipes-or-handle-them-properly