使用 docker 后出现的网络异常现象

硬件:

[root@sh-storage-128204 ~]# dmidecode -t system
 dmidecode 2.12
SMBIOS 2.7 present.

Handle 0x0001, DMI type 1, 27 bytes
System Information
        Manufacturer: To be filled by O.E.M.
        Product Name: Tecal RH2288H V2-24S
        Version: V100R002
        Serial Number: 2102310QPE10E9000146
        UUID: 4A190814-D21D-B211-8DC0-000000821800
        Wake-up Type: Power Switch
        SKU Number: Type1Sku0
        Family: Type1Family

环境:

[root@sh-storage-128204 ~]# docker info
Containers: 4
Images: 153
Storage Driver: devicemapper
 Pool Name: docker-8:17-1075308946-pool
 Pool Blocksize: 65.54 kB
 Backing Filesystem: xfs
 Data file: /dev/loop0
 Metadata file: /dev/loop1
 Data Space Used: 3.478 GB
 Data Space Total: 107.4 GB
 Data Space Available: 103.9 GB
 Metadata Space Used: 6.689 MB
 Metadata Space Total: 2.147 GB
 Metadata Space Available: 2.141 GB
 Udev Sync Supported: true
 Deferred Removal Enabled: false
 Data loop file: /var/lib/docker/devicemapper/devicemapper/data
 Metadata loop file: /var/lib/docker/devicemapper/devicemapper/metadata
 Library Version: 1.02.107-RHEL7 (2015-10-14)
Execution Driver: native-0.2
Logging Driver: json-file
Kernel Version: 3.10.0-229.el7.x86_64
Operating System: CentOS Linux 7 (Core)
CPUs: 24
Total Memory: 125.7 GiB
Name: sh-storage-128204.sh.vclound.com
ID: QV4X:VHQE:EMOI:4TBJ:FZ6K:3N3C:A64Y:PRYR:X2QZ:HHUB:OTND:ZSFF

用法:
用于搭建 docker private registry
架构:


                  nginx    <- 本地 docker
                    |
    |---------------+-------------------|
   registry       registry        registry  <- 本地 docker
    |---------------+-------------------|
                    |
                ceph 集群 (rados) <- 另外一个集群

问题:
搭建了 docker, 启动成功后, 发现上传镜像时偶尔会出现连接卡住问题
检测与 mon 连接发现:

[root@sh-storage-128204 ~]# nmap -p 6789 10.198.128.200
Starting Nmap 6.40 ( http://nmap.org ) at 2016-01-20 09:47 CST
sendto in send_ip_packet_sd: sendto(5, packet, 44, 0, 10.198.128.200, 16) => Operation not permitted
Offending packet: TCP 10.198.128.204:43301 > 10.198.128.200:6789 S ttl=48 id=11619 iplen=44  seq=2271879518 win=1024 <mss 1460>
sendto in send_ip_packet_sd: sendto(5, packet, 44, 0, 10.198.128.200, 16) => Operation not permitted
Offending packet: TCP 10.198.128.204:43302 > 10.198.128.200:6789 S ttl=45 id=9421 iplen=44  seq=2271945055 win=1024 <mss 1460>
Nmap scan report for sh-storage-128200.sh.vclound.com (10.198.128.200)
Host is up (0.000091s latency).
PORT     STATE    SERVICE
6789/tcp filtered ibm-db2-admin
MAC Address: 90:E2:BA:85:21:28 (Intel Corporate)
Nmap done: 1 IP address (1 host up) scanned in 0.29 seconds

[root@sh-storage-128204 ~]# nmap -p 6789 10.198.128.200
Starting Nmap 6.40 ( http://nmap.org ) at 2016-01-20 09:47 CST
sendto in send_ip_packet_sd: sendto(5, packet, 44, 0, 10.198.128.200, 16) => Operation not permitted
Offending packet: TCP 10.198.128.204:48544 > 10.198.128.200:6789 S ttl=54 id=17389 iplen=44  seq=1275261731 win=1024 <mss 1460>
sendto in send_ip_packet_sd: sendto(5, packet, 44, 0, 10.198.128.200, 16) => Operation not permitted
Offending packet: TCP 10.198.128.204:48545 > 10.198.128.200:6789 S ttl=53 id=40168 iplen=44  seq=1275327266 win=1024 <mss 1460>
Nmap scan report for sh-storage-128200.sh.vclound.com (10.198.128.200)
Host is up (0.000092s latency).
PORT     STATE    SERVICE
6789/tcp filtered ibm-db2-admin
MAC Address: 90:E2:BA:85:21:28 (Intel Corporate)
Nmap done: 1 IP address (1 host up) scanned in 0.28 seconds

[root@sh-storage-128204 ~]# nmap -p 6789 10.198.128.200
Starting Nmap 6.40 ( http://nmap.org ) at 2016-01-20 09:47 CST
Nmap scan report for sh-storage-128200.sh.vclound.com (10.198.128.200)
Host is up (0.00039s latency).
PORT     STATE SERVICE
6789/tcp open  ibm-db2-admin
MAC Address: 90:E2:BA:85:21:28 (Intel Corporate)
Nmap done: 1 IP address (1 host up) scanned in 0.21 seconds

与 mon 连接时, 会经常出现 6789/tcp filtered ibm-db2-admin 异常现象

另外, 参考系统日志
会出现下面异常 (过滤了大部分, 只显示重要部分信息

/var/log/messages
Jan 20 09:49:16 sh-storage-128204 kernel: nf_conntrack: table full, dropping packet
Jan 20 09:49:16 sh-storage-128204 kernel: nf_conntrack: table full, dropping packet
Jan 20 09:49:16 sh-storage-128204 kernel: nf_conntrack: table full, dropping packet
....
Jan 20 09:49:44 sh-storage-128204 kernel: net_ratelimit: 137 callbacks suppressed
Jan 20 09:49:49 sh-storage-128204 kernel: net_ratelimit: 166 callbacks suppressed
Jan 20 09:49:54 sh-storage-128204 kernel: net_ratelimit: 64 callbacks suppressed
Jan 20 09:50:01 sh-storage-128204 kernel: net_ratelimit: 132 callbacks suppressed

ping 也会出现异常现场

[root@sh-storage-128204 ~]# ping localhost
PING localhost (127.0.0.1) 56(84) bytes of data.
ping: sendmsg: Operation not permitted

原因: 当前的网络连接数过大, 导致内核无法响应

解决方法:
修改 /et/sysctl.conf 进行内核参数优化

[root@sh-storage-128204 ~]# sysctl  -p
vm.swappiness = 10
net.ipv4.ip_forward = 1
net.ipv4.tcp_max_syn_backlog = 8192
net.core.netdev_max_backlog = 8192
net.ipv4.tcp_fin_timeout = 15
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.netfilter.nf_conntrack_max = 1048576
net.nf_conntrack_max = 1048576
net.netfilter.nf_conntrack_tcp_timeout_established = 54000
net.netfilter.nf_conntrack_generic_timeout = 120
时间: 2024-09-20 00:04:37

使用 docker 后出现的网络异常现象的相关文章

在C#中利用Keep-Alive处理Socket网络异常断开的方法

断开|网络 最近我负责一个IM项目的开发,服务端和客户端采用TCP协议连接.服务端采用C#开发,客户端采用Delphi开发.在服务端开发中我碰到了各种各样的网络异常断开现象.在处理这些异常的时候有了一些心得,现在写出来和大家分享一下. 那网络异常断开原因主要有那些呢?归纳起来主要有以下两种: 1.客户端程序异常. 对于这种情况,我们很好处理,因为客户端程序异常退出会在服务端引发ConnectionReset的Socket异常(就是WinSock2中的10054异常).只要在服务端处理这个异常就可

SEO博客优化过程中出现的异常现象总结

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 Winter和大家一样,在做苏州SEO的时候也会遇到一些SEO异常现象,但由于接触的时间越长对这些现象也有了自己的一些看法,苏州SEO认为, 这些有时会发生的SEO异常现象没什么好担心的.下面Winter就为大家列举部分异常现象作个人看法的阐述: 1,网站排名下降了 对于网站的排名发生变化,苏州SEO认为应该要注意的是: 首先看一下,之前排前

三星手机由于不良应用程序出现异常现象问题解决办法

手机由于不良应用程序可能出现如下异常现象:  1.通话功能出现异常.   电话无法接通或者通话时没有声音.开启扬声器等设备时可能无法正常通话. 2.数据网随意变更.   无线网和数据网同时开启后随意变更网络连接. 3.应用程序停止运行或运行速度缓慢.   由于应用程序不稳,智能机可能停止运行或者运行速度缓慢. 4.电池耗电量大.   由于过度占用CPU,继续执行后台工程序等原因,电池消耗量会增多.  5.其他异常现象.   可能发生无法关闭屏幕或者闹钟不响等现象. 解决方案: 1.进入安全模式后

android 4 0-连接网络异常java.net.SocketTimeoutException

问题描述 连接网络异常java.net.SocketTimeoutException 我用模拟器Android2.3.3版本跑,是可以连接网络获取到数据的,但用真机(Android4.0版本)运行就出现android.os.NetworkOnMainThreadException at android.os.StrictMode$AndroidBlockGuardPolicy.onNetwork(StrictMode.java:1099) at libcore.io.BlockGuardOs.c

猩猩助手网络异常、连接失败、无法连接解决方法

  多个用户反映猩猩助手出现"更新失败.网络异常.更新安装包出错.无法连接"等问题. 大家可以尝试下面修改DNS的方法 如果还无法解决可以尝试重启模拟器.路由器多试试. 一般网络问题只是一时的问题,还不能解决可以耐心等待下,再次重启. 一.修改DNS方法 WIN7用户: 1.开始菜单中打开"控制面板"之后选择"网络和共享中心"如图: 2.跟着下图来进行操作 点击"以太网/本地连接"后,会弹出下图窗口: 点击"属性&q

硅谷杂志:基于内容的网络异常信息过滤

[硅谷网12月3日文]据<硅谷>杂志2012年第18期刊文,虽然网络促进社会经济的发展与进步, 但是在互联网规模的不断扩大下,恶意邮件和不良网络,以及不健康网络内容的传播等都将严重影响网络健康运行.因此,对内容的网络异常信息过滤的安全保护成为人们关注的焦点.通过简要介绍网络异常信息过滤,对网络异常信息过滤模型进行分析,并设计基于内容的网络异常信息过滤系统,同时通过试验与分析证明 其实用的价值. 为了确保网络内容安全,主要是针对数据和社会安全信息的过滤.这种基于内容的网络异常信息过滤可以分为以用

android httpclient处理网络异常

问题描述 android httpclient处理网络异常 如题,如何设置网络超时,或网络异常,并且提示用户异常,哪位大侠,给个详细代码,感激不进 解决方案 转载自: ? ? ? ? ? ??http://android.tgbus.com/Android/tutorial/201108/364645.shtml ? (Android开发实现HttpClient工具类) ? ? ? ? ??http://www.open-open.com/lib/view/open1329101420890.h

认识计算机感染病毒异常现象

只要感染了病毒,计算机系统总会出现异常现象.当发现了这些现象时,通常应当怀疑系统被病毒侵人.下面列举一些常见的异常现象: 磁盘的主引导区.引导扇区.文件分配表或根目录被修改. 系统文件的长度或内容发生了变化. 磁盘出现了固定的"坏扇区",磁盘可用空间变小. 屏幕上显示不正常的信息. 系统引导过程明显变慢,机器速度明显减慢,磁盘访问时间变长. 磁盘上原有的正常文件不能运行或运行反常. 系统设备无故不能使用.例如系统不能识别C盘.键盘突然不能使用. 计算机出现蜂鸣声. 系统出现异常的重启动

win7系统重启路由器后无法连接网络怎么办

  win7系统重启路由器后无法连接网络怎么办           1.打开电脑浏览器随便哪个都行; 2.如果没浏览器,可以打开我的电脑; 3.输入路由器密码,成功进入界面; 4.选择高级连接; 5.输入你上网卡的帐号密码,登录成功就可以继续上网了; 6.还有一种路由器的方法也说一下吧,这种路由器是最常用的.默认登录帐号密码都是admin; 7.登录后点击设置导向,按步骤完成就可以了.