这篇文章是总结自Swoole
微课程《网络编程第四讲-长连接的常见问题》。这一节学习到了很多的知识,可以说干货满满。
连接失效问题
例子
其中,Redis
常见的报错就是:
1 | 配置项:timeout |
Redis
可以配置如果客户端经过多少秒还不给Redis
服务器发送数据,那么就会把连接close
掉。
MySQL
常见的报错:
1 | 配置项:wait_timeout & interactive_timeout |
和Redis
服务器一样,MySQL
也会定时的去清理掉没用的连接。
如何解决
1 | 1、用的时候进行重连 |
用的时候进行重连
优点是简单,缺点是面临短连接的问题。
定时发送心跳维持连接
推荐。
如何维持长连接
tcp协议中实现的tcp_keepalive
操作系统底层提供了一组tcp
的keepalive
配置:
1 | tcp_keepalive_time (integer; default: 7200; since Linux 2.2) |
Swoole
底层把这些配置开放出来了,例如:
1 |
|
其中:
1 | 'open_tcp_keepalive' => 1, // 总开关,用来开启tcp_keepalive |
我们来实战测试体验一下,服务端脚本如下:
1 |
|
我们启动这个服务器:
1 | ~/codeDir/phpCode/hyperf-skeleton # php server.php |
然后通过tcpdump
进行抓包:
1 | ~/codeDir/phpCode/hyperf-skeleton # tcpdump -i lo port 6666 |
我们此时正在监听lo
上的6666
端口的数据包。
然后我们用客户端去连接它:
1 | ~/codeDir/phpCode/hyperf-skeleton # nc 127.0.0.1 6666 |
此时服务端会打印出消息:
1 | ~/codeDir/phpCode/hyperf-skeleton # php server.php |
tcpdump
的输出信息如下:
1 | 01:48:40.178439 IP localhost.33933 > localhost.6666: Flags [S], seq 43162537, win 43690, options [mss 65495,sackOK,TS val 9833698 ecr 0,nop,wscale 7], length 0 |
我们会发现最开始的时候,会打印三次握手的包:
1 | 01:48:40.178439 IP localhost.33933 > localhost.6666: Flags [S], seq 43162537, win 43690, options [mss 65495,sackOK,TS val 9833698 ecr 0,nop,wscale 7], length 0 |
然后,停留了4s
没有任何包的输出。
之后,每隔1s
左右就会打印出一组:
1 | 01:52:54.359341 IP localhost.6666 > localhost.43101: Flags [.], ack 1, win 342, options [nop,nop,TS val 9859144 ecr 9858736], length 0 |
其实这就是我们配置的策略:
1 | 'tcp_keepinterval' => 1, // 1s探测一次 |
因为我们操作系统底层会自动的给客户端回ack
,所以这个连接不会在5
次探测后被关闭。操作系统底层会持续不断的发送这样的一组包:
1 | 01:52:54.359341 IP localhost.6666 > localhost.43101: Flags [.], ack 1, win 342, options [nop,nop,TS val 9859144 ecr 9858736], length 0 |
如果我们要测试5
次探测后关闭这个连接,可以禁掉6666
端口的包:
1 | ~/codeDir/phpCode/hyperf-skeleton # iptables -A INPUT -p tcp --dport 6666 -j DROP |
这样会把所有从6666
端口进来的包给禁掉,自然,服务器就接收不到从客户端那一边发来的ack
包了。
然后服务器过5
秒就会打印出close
(服务端主动的调用了close
方法,给客户端发送了FIN
包):
1 | ~/codeDir/phpCode/hyperf-skeleton # php server.php |
我们恢复一下iptables
的规则:
1 | ~/codeDir/phpCode # iptables -D INPUT -p tcp -m tcp --dport 6666 -j DROP |
即把我们设置的规则给删除了。
通过tcp_keepalive
的方式实现心跳的功能,优点是简单,不要写代码就可以完成这个功能,并且发送的心跳包小。缺点是依赖于系统的网络环境,必须保证服务器和客户端都实现了这样的功能,需要客户端配合发心跳包。还有一个更为严重的缺点是如果客户端和服务器不是直连的,而是通过代理来进行连接的,例如socks5
代理,它只会转发应用层的包,不会转发更为底层的tcp
探测包,那这个心跳功能就失效了。
所以,Swoole
就提供了其他的解决方案,一组检测死连接的配置。
1 | 'heartbeat_check_interval' => 1, // 1s探测一次 |
swoole实现的heartbeat
我们来测试一下:
1 |
|
然后启动服务器:
1 | ~/codeDir/phpCode/hyperf-skeleton # php server.php |
然后启动tcpdump
:
1 | ~/codeDir/phpCode # tcpdump -i lo port 6666 |
然后再启动客户端:
1 | ~/codeDir/phpCode/hyperf-skeleton # nc 127.0.0.1 6666 |
此时服务器端打印:
1 | ~/codeDir/phpCode/hyperf-skeleton # php server.php |
然后tcpdump
打印:
1 | 02:48:32.516093 IP localhost.42123 > localhost.6666: Flags [S], seq 1088388248, win 43690, options [mss 65495,sackOK,TS val 10193342 ecr 0,nop,wscale 7], length 0 |
这是三次握手信息。
然后过了5s
后,tcpdump
会打印出:
1 | 02:48:36.985027 IP localhost.6666 > localhost.42123: Flags [F.], seq 1, ack 1, win 342, options [nop,nop,TS val 10193789 ecr 10193342], length 0 |
也就是服务端发送了FIN
包。因为客户端没有发送数据,所以Swoole
关闭了连接。
然后服务器端会打印:
1 | ~/codeDir/phpCode/hyperf-skeleton # php server.php |
所以,heartbeat
和tcp keepalive
还是有一定的区别的,tcp keepalive
有保活连接的功能,但是heartbeat
存粹是检测没有数据的连接,然后关闭它,并且只可以在服务端这边配置,如果需要保活,也可以让客户端配合发送心跳。
如果我们不想让服务端close
掉连接,那么就得在应用层里面不断的发送数据包来进行保活,例如我在nc
客户端里面不断的发送包:
1 | ~/codeDir/phpCode/hyperf-skeleton # nc 127.0.0.1 6666 |
我发送了9
个ping
包给服务器,tcpdump
的输出如下:
1 | // 省略了三次握手的包 |
有9
组数据包的发送。(这里的Flags [P.]
代表Push
的含义)
此时服务器还没有close
掉连接,实现了客户端保活连接的功能。然后我们停止发送ping
,过了5
秒后tcpdump
就会输出一组:
1 | 02:58:14.811761 IP localhost.6666 > localhost.44195: Flags [F.], seq 1, ack 46, win 342, options [nop,nop,TS val 10251636 ecr 10251145], length 0 |
服务端那边发送了FIN
包,说明服务端close
掉了连接。服务端的输出如下:
1 | ~/codeDir/phpCode/hyperf-skeleton # php server.php |
然后我们在客户端那边ctrl + c
来关闭连接:
1 | ~/codeDir/phpCode/hyperf-skeleton # nc 127.0.0.1 6666 |
此时,tcpdump
的输出如下:
1 | 03:03:02.257667 IP localhost.44195 > localhost.6666: Flags [F.], seq 46, ack 2, win 342, options [nop,nop,TS val 10280414 ecr 10251636], length 0 |
应用层心跳
1 | 1、制定ping/pong协议(mysql等自带ping协议) |
例如:
1 | $server->on('receive', function (\Swoole\Server $server, $fd, $reactor_id, $data) |
结论
1 | 1、tcp的keepalive最简单,但是有兼容性问题,不够灵活 |