TCP异常断开是指在突然断电,直接拔网线等等情况下,如果通信双方没有进行数据发送通信等处理的时候,无法获知连接已经断开的情况.
在通常的情况下,为了使得socket通信不受操作系统的限制,需要自己在应用层实现心跳包机制,来检查异常断开的情况,一般的方式就是服务器在一段时间没有收到客户端数据包时,定时发包,然后客户端回应,如果已经出现异常断开则服务器接收会返回错误,而客户端在指定时间内没有收到数据包,则主动向服务器发包,得到错误就说明断开.诸如此类的方式就是自己实现的心跳包机制.
但操作系统本身也自带了一些心跳包机制,这些机制是由socket的TCP栈底层实现的,不会影响应用层通信,也不需要应用层自己处理,发现异常断开可以自行检查出来并返回错误(它的本质也是在空闲时发送心跳包).以下介绍一下Windows以及linux下的方法.
首先介绍Windows下的方法,该方式要求通信双方必须都是Windows NT以上操作系统(如果是其它版本操作系统,如linux等等,不敢保证100%无效).MSDN中有描述WSAIoctl中的SIO_KEEPALIVE_VALS选项,该选项以及struct tcp_keepalive的定义在MSTCPiP.h有,不进行说明了,直接看代码:
#include <MSTCPiP.h>
DWORD retBytes;
tcp_keepalive inKeepSetting;
tcp_keepalive retKeepSetting;
inKeepSetting.onoff = 1; //探测次数
inKeepSetting.keepalivetime = 5500; // 首次探测开始前的tcp无数据收发空闲时间
inKeepSetting.keepaliveinterval = 3000; // 每次探测的间隔时间
if (WSAIoctl(aptSock, SIO_KEEPALIVE_VALS,
&inKeepSetting,
sizeof(inKeepSetting),
&retKeepSetting,
sizeof(retKeepSetting),
&retBytes,
NULL,
NULL) != 0)
{
printf("WSAIoctl Error: %d/n", WSAGetLastError());
}
Linux下的方式是通过setsockopt来设置选项,见代码(代码从网络上摘录了部分):
#include <netinet/tcp.h>
……
#define SOCKET_ERROR (-1)
// 以秒为单位
int keepAlive = 1; //设定KeepAlive
int keepIdle = 5; //首次探测开始前的tcp无数据收发空闲时间
int keepInterval = 3; //每次探测的间隔时间
int keepCount = 2; //探测次数
if(setsockopt(s,SOL_SOCKET,SO_KEEPALIVE,(void*)&keepAlive,sizeof(keepAlive)) == SOCKET_ERROR)
printf("Call setsockopt error, errno is %d/n", errno);
if(setsockopt(s,SOL_TCP,TCP_KEEPIDLE,(void *)&keepIdle,sizeof(keepIdle)) == SOCKET_ERROR)
printf("Call setsockopt error, errno is %d/n", errno);
if(setsockopt(s,SOL_TCP,TCP_KEEPINTVL,(void *)&keepInterval,sizeof(keepInterval)) == SOCKET_ERROR)
printf("Call setsockopt error, errno is %d/n", errno);
if(setsockopt(s,SOL_TCP,TCP_KEEPCNT,(void *)&keepCount,sizeof(keepCount)) == SOCKET_ERROR)
printf("Call setsockopt error, errno is %d/n", errno);