Docker NAT iptables实现 及网络配置 (网络二)
Docker NAT iptables实现
默认情况下,容器可以主动访问到外部网络的连接,但是外部网络无法访问到容器
容器访问外部实现
容器所有到外部网络的连接,源地址都会被 NAT 成本地系统的 IP 地址(即docker0地址)。这是使用 iptables 的源地址伪装操作实现的
查看主机的 NAT 规则
# iptables -t nat -vnL Chain POSTROUTING (policy ACCEPT 0 packets, 0 bytes)
pkts bytes target prot opt in out source destination
271713 MASQUERADEall--* !docker0172.17.0.0/16 0.0.0.0/0
其中,上述规则将所有源地址在 172.17.0.0/16 网段,目标地址为其他网段(外部网络)的流量动态伪装为从系统网卡发出。MASQUERADE 跟传统 SNAT 的好处是它能动态从网卡获取地址。
外部访问容器实现
容器允许外部访问,可以在 docker run 时候通过 -p 或 -P 参数来启用,不管用那种办法,其实也是在本地的 iptable 的 nat 表中添加相应的规则
使用-P 时:
# docker run -d -P centos:http a10b560d2e31ee07bb3be04ea8ecc66bcbcc03f0a1360973c993538393e1b71f
# dockerps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
a10b560d2e31 centos:http "/bin/bash /run.sh" About an hour ago Up About an hour 0.0.0.0:32773->22/tcp, 0.0.0.0:32772->80/tcp, 0.0.0.0:32771->443/tcp compassionate_shockley
# # iptables -t nat –nvL Chain DOCKER (2 references)
pkts bytes target prot opt in out source destination
0 0 RETURN all--docker0 * 0.0.0.0/0 0.0.0.0/0
0 0 DNAT tcp--!docker0 * 0.0.0.0/0 0.0.0.0/0 tcp dpt:32771 to:172.17.0.3:443
0 0 DNAT tcp--!docker0 * 0.0.0.0/0 0.0.0.0/0 tcp dpt:32772 to:172.17.0.3:80
0 0 DNAT tcp--!docker0 * 0.0.0.0/0 0.0.0.0/0 tcp dpt:32773 to:172.17.0.3:22
使用 -p 80:80 时:
# dockerrun-d -p 80:80 centos:http WARNING: IPv4 forwarding is disabled. Networking will not work.
e2e606c90755d334d1cdce0e2dbc907614236231f4482819b25d839e4042b17b
# dockerps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
e2e606c90755 centos:http "/bin/bash /run.sh" 8 seconds ago Up 6 seconds 22/tcp, 443/tcp, 0.0.0.0:80->80/tcp clever_fermi
# iptables-tnat -nvL Chain DOCKER (2 references)
pkts bytes target prot opt in out source destination
0 0 DNAT tcp--!docker0 * 0.0.0.0/0 0.0.0.0/0 tcp dpt:80 to:172.17.0.2:80
docker0网桥
Docker服务默认会创建一个 docker0 网桥(其上有一个 docker0 内部接口),它在内核层连通了其他的物理或虚拟网卡,这就将所有容器和本地主机都放到同一个物理网络。
Docker 默认指定了 docker0 接口的 IP 地址和子网掩码,让主机和容器之间可以通过网桥相互通信
由于目前 Docker 网桥是 Linux 网桥,用户可以使用 brctl show 来查看网桥和端口连接信息。
# brctl show bridge namebridge idSTP enabledinterfaces
docker08000.024281ecab1cnoveth89dc50c
vethd69e7b9
virbr08000.525400e7be5fyesvirbr0-nic
注:brctl 命令在centos中可以使用yuminstall bridge-utils 来安装
每次创建一个新容器的时候,Docker 从可用的地址段中选择一个空闲的 IP 地址分配给容器的eth0端口。使用本地主机上 docker0 接口的 IP 作为所有容器的默认网关。
# dockerps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
a10b560d2e31 centos:http "/bin/bash /run.sh" 22 hours ago Up 22 hours 0.0.0.0:32773->22/tcp, 0.0.0.0:32772->80/tcp, 0.0.0.0:32771->443/tcp compassionate_shockley
583d46c7cea8 centos:http "/bin/bash /run.sh" 22 hours ago Exited (137) 22 hours ago zen_jones
root@localhost ~]# ifconfig docker0 docker0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>mtu 1500
inet 172.17.0.1netmask 255.255.0.0broadcast 0.0.0.0
inet6 fe80::42:81ff:feec:ab1cprefixlen 64scopeid 0x20<link>
ether 02:42:81:ec:ab:1ctxqueuelen 0(Ethernet)
RX packets 46802bytes 2152876 (2.0 MiB)
RX errors 0dropped 0overruns 0frame 0
TX packets 58776bytes 102598730 (97.8 MiB)
TX errors 0dropped 0 overruns 0carrier 0collisions 0
# ssh admin@192.168.1.107 -p 32773 The authenticity of host ':32773 (:32773)' can't be established.
RSA key fingerprint is 1e:c3:c2:f8:0c:46:2e:1a:e4:f9:eb:71:5e:e7:fd:0b.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added ':32773' (RSA) to the list of known hosts.
$ ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
94: eth0@if95: <BROADCAST,MULTICAST,UP,LOWER_UP,M-DOWN> mtu 1500 qdisc noqueue state UP
link/ether 02:42:ac:11:00:03 brd ff:ff:ff:ff:ff:ff
inet 172.17.0.3/16 scope global eth0
valid_lft forever preferred_lft forever
inet6 fe80::42:acff:fe11:3/64 scope link
valid_lft forever preferred_lft forever
Docker 网络配置
Docker 四种网络模式
docker run 创建 Docker 容器时,可以用 --net 选项指定容器的网络模式,Docker 有以下 4 种网络模式:
· host 模式,使用 --net=host 指定。
· container 模式,使用 --net=container:NAMEorID 指定。
· none 模式,使用 --net=none 指定。
· bridge 模式,使用 --net=bridge 指定,默认设置。
host 模式
如果启动容器的时候使用 host 模式,那么这个容器将不会获得一个独立的 Network Namespace,而是和宿主机共用一个 Network Namespace。容器将不会虚拟出自己的网卡,配置自己的 IP 等,而是使用宿主机的 IP 和端口。
例如,我们在192.168.1.102/24 的机器上用 host 模式启动一个含有 web 应用的 Docker 容器,监听 tcp 80 端口。当我们在容器中执行任何类似 ifconfig 命令查看网络环境时,看到的都是宿主机上的信息。而外界访问容器中的应用,则直接使用192.168.1.102:80 即可,不用任何 NAT 转换,就如直接跑在宿主机中一样。但是,容器的其他方面,如文件系统、进程列表等还是和宿主机隔离的。
启动容器前,执行pgrep http查看宿主机httpd进程
# pgrephttpd
#
上面显示结果说明宿主机没有httpd进程运行
用 host 模式启动一个含有 web 应用的 Docker 容器
# dockerimages REPOSITORY TAG IMAGE ID CREATED SIZE
centos http f1d1edeedc66 22 hours ago 298.6 MB
docker.io/centos centos6 cf2c3ece5e41 13 months ago 194.6 MB
# dockerrun -dit --net=host centos:http a795da45a727173c281a548e55ee0e261a391a97f50c746270090072f4bfb57d
# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
a795da45a727 centos:http "/bin/bash /run.sh" 31 seconds ago Up 29 seconds mad_pike
# pgrephttpd
7221
7222
7223
7224
7225
7226
7227
7228
7229
用浏览器访问宿主机地址的80端口
注意防火墙:
# firewall-cmd--add-port=80/tcp success
container 模式
这个模式指定新创建的容器和已经存在的一个容器共享一个 Network Namespace,而不是和宿主机共享。新创建的容器不会创建自己的网卡,配置自己的 IP,而是和一个指定的容器共享 IP、端口范围等。同样,两个容器除了网络方面,其他的如文件系统、进程列表等还是隔离的。两个容器的进程可以通过 lo 网卡设备通信。
运行一个容器:查看容器的IP
# dockerimages REPOSITORY TAG IMAGE ID CREATED SIZE
centos http f1d1edeedc66 22 hours ago 298.6 MB
docker.io/centos centos6 cf2c3ece5e41 13 months ago 194.6 MB
# docker run -it docker.io/centos:centos6 WARNING: IPv4 forwarding is disabled. Networking will not work.
# ifconfig
注意ID号f1e18599659f下面会用到
eth0 Link encap:EthernetHWaddr 02:42:AC:11:00:02
inet addr:172.17.0.2Bcast:0.0.0.0Mask:255.255.0.0
inet6 addr: fe80::42:acff:fe11:2/64 Scope:Link
UP BROADCAST RUNNING MULTICASTMTU:1500Metric:1
RX packets:6 errors:0 dropped:0 overruns:0 frame:0
TX packets:6 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:508 (508.0 b)TX bytes:508 (508.0 b)
lo Link encap:Local Loopback
inet addr:127.0.0.1Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNINGMTU:65536Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:0 (0.0 b)TX bytes:0 (0.0 b)
将容器切换到后台运行:ctrl+pctrl+q
在运行一个容器使用container模式:查看新容器的地址
# docker run -it --net=container:f1e18599659f docker.io/centos:centos6 WARNING: IPv4 forwarding is disabled. Networking will not work.
# ifconfig eth0 Link encap:EthernetHWaddr 02:42:AC:11:00:02
inet addr:172.17.0.2Bcast:0.0.0.0Mask:255.255.0.0
inet6 addr: fe80::42:acff:fe11:2/64 Scope:Link
UP BROADCAST RUNNING MULTICASTMTU:1500Metric:1
RX packets:8 errors:0 dropped:0 overruns:0 frame:0
TX packets:8 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:648 (648.0 b)TX bytes:648 (648.0 b)
lo Link encap:Local Loopback
inet addr:127.0.0.1Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNINGMTU:65536Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:0 (0.0 b)TX bytes:0 (0.0 b)
注意使用container模式docker run -it --net=container:f1e18599659f docker.io/centos:centos6 是第一次执行
# docker run -it docker.io/centos:centos6
WARNING: IPv4 forwarding is disabled. Networking will not work.
# ifconfig高亮中的ID
none模式
这个模式和前两个不同。在这种模式下,Docker 容器拥有自己的 Network Namespace,但是,并不为 Docker容器进行任何网络配置。也就是说,这个 Docker 容器没有网卡、IP、路由等信息。需要我们自己为 Docker 容器添加网卡、配置 IP 等。
bridge模式
当 docker 启动时,会在主机上创建一个 docker0 的虚拟网卡。他随机挑选 RFC1918 私有网络中的一段地址给 docker0 。比如 172.17.0.1/16,16 位掩码的网段可以拥有 65534 个地址可以使用,这对主机和容器来说应该足够了。
docker0不是普通的网卡,他是桥接到其他网卡的虚拟网卡,容器使用它来和主机相互通信。当创建一个 docker 容器的时候,它就创建了一个对接口,当数据包发送到一个接口时,另外一个接口也可以收到相同的数据包,它们是绑在一起的一对孪生接口。这对接口在容器中那一端的的名字是 eth0 ,宿主主机端的会指定一个唯一的名字,比如 vethAQI2QT 这样的名字。
所有的 veth* 的接口都会桥接到 docker0 ,这样 docker 就创建了在主机和所有容器之间一个虚拟共享网
bridge 模式是 Docker 默认的网络设置,此模式会为每一个容器分配 Network Namespace、设置 IP 等,并将一个主机上的 Docker 容器连接到一个虚拟网桥上。当 Docker server 启动时,会在主机上创建一个名为 docker0 的虚拟网桥,此主机上启动的 Docker 容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过交换机连在了一个二层网络中。接下来就要为容器分配 IP 了,Docker 会从 RFC1918 所定义的私有 IP 网段中,选择一个和宿主机不同的IP地址和子网分配给 docker0,连接到 docker0 的容器就从这个子网中选择一个未占用的 IP 使用。如一般 Docker 会使用 172.17.0.0/16 这个网段,并将 172.17.0.1/16 分配给 docker0 网桥(在主机上使用 ifconfig 命令是可以看到 docker0 的,可以认为它是网桥的管理接口,在宿主机上作为一块虚拟网卡使用)
Docker完成以上网络配置的过程大致是这样的:
1.在主机上创建一对虚拟网卡veth pair设备。veth设备总是成对出现的,它们组成了一个数据的通道,数据从一个设备进入,就会从另一个设备出来。因此,veth设备常用来连接两个网络设备。
2.Docker将veth pair设备的一端放在新创建的容器中,并命名为eth0。另一端放在主机中,以veth65f9这样类似的名字命名,并将这个网络设备加入到docker0网桥中,可以通过brctl show命令查看。
注:brctl 工具依赖 bridge-utils 软件包
# brctl show bridge namebridge idSTP enabledinterfaces
docker08000.024281ecab1cnoveth90f8ae3
3.从docker0子网中分配一个IP给容器使用,并设置docker0的IP地址为容器的默认网关。
容器内部访问外网以及容器和主机之间的端口映射都是通过Iptables实现的,可以查看Iptables表分析。
查看当前 docker0地址
# ifconfigdocker0 docker0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>mtu 1500
inet 172.17.0.1netmask 255.255.0.0broadcast 0.0.0.0
inet6 fe80::42:81ff:feec:ab1cprefixlen 64scopeid 0x20<link>
ether 02:42:81:ec:ab:1ctxqueuelen 0(Ethernet)
RX packets 46867bytes 2161613 (2.0 MiB)
RX errors 0dropped 0overruns 0frame 0
TX packets 58860bytes 102609673 (97.8 MiB)
TX errors 0dropped 0 overruns 0carrier 0collisions 0
在容器运行时,每个容器都会分配一个特定的虚拟机口并桥接到 docker0。每个容器都会配置同 docker0 ip 相同网段的专用 ip 地址,docker0 的 IP 地址被用于所有容器的默认网关。
运行一个容器:
查看当前运行的容器:
# dockerrun -ditcentos:http 23ddd3fe37aa7b3e0b192eeced547b05ef451fb409f5ba26ca7d5907af69f77b
查看当前运行的容器:
# docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
23ddd3fe37aa centos:http "/bin/bash /run.sh" 2 minutes ago Up 2 minutes 22/tcp, 80/tcp, 443/tcp condescending_brown
6a80dd0b8c4a docker.io/centos:centos6 "/bin/bash" 2 minutes ago Up 2 minutes peaceful_cray
通过brctl show命令查看
# brctlshow bridge namebridge idSTP enabledinterfaces
docker08000.024281ecab1cnoveth49a07d1
vethd7ee715
以上, docker0 扮演着6d51c11aa19b和e6901fb7ab36这两个容器的虚拟接口 vethxx interface 桥接的角色。
执行dockernetworkinspectbridge查看桥接网络的详细信息
# dockernetworkinspectbridge
[
{
"Name": "bridge",
"Id": "baeed3bb5ffc64a7a9329979781a9af432fa66a7993e77726b606faf98b8df0b",
"Scope": "local",
"Driver": "bridge",
"EnableIPv6": false,
"IPAM": {
"Driver": "default",
"Options": null,
"Config": [
{
"Subnet": "172.17.0.0/16",
"Gateway": "172.17.0.1"
}
]
},
"Internal": false,
"Containers": {
"23ddd3fe37aa7b3e0b192eeced547b05ef451fb409f5ba26ca7d5907af69f77b": {
"Name": "condescending_brown",
"EndpointID": "4acfa63b6859f3f9b6ce7a39d9b4bb18880a6e5b15df84f009d4e8352f72c51b",
"MacAddress": "02:42:ac:11:00:03",
"IPv4Address": "172.17.0.3/16",
"IPv6Address": ""
},
"6a80dd0b8c4afc41ecfe194d75125c316a5b97822cfacd6831cc437f25809044": {
"Name": "peaceful_cray",
"EndpointID": "90889fd355608221b06abf677c3f8fdd831fd99b6539032199c4119e0336e4cc",
"MacAddress": "02:42:ac:11:00:02",
"IPv4Address": "172.17.0.2/16",
"IPv6Address": ""
}
},
"Options": {
"com.docker.network.bridge.default_bridge": "true",
"com.docker.network.bridge.enable_icc": "true",
"com.docker.network.bridge.enable_ip_masquerade": "true",
"com.docker.network.bridge.host_binding_ipv4": "0.0.0.0",
"com.docker.network.bridge.name": "docker0",
"com.docker.network.driver.mtu": "1500"
},
"Labels": {}
}
]
自定义网桥
除了默认的docker0网桥,用户也可以指定网桥来连接各个容器。在启动 Docker 服务的时候,使用-b BRIDGE或 --bridge=BRIDGE来指定使用的网桥。
Docker 允许你管理 docker0 桥接或者通过-b选项自定义桥接网卡,需要安装bridge-utils软件包。
基本步骤如下:
1.确保 docker 的进程是停止的
2.创建自定义网桥
3.给网桥分配特定的 ip
4.以 -b 的方式指定网桥
具体操作步骤:
如果服务已经运行,那需要先停止服务,并删除旧的网桥
# systemctl stop docker
# ip linkset devdocker0down
# brctldelbr docker0
# brctl show bridge namebridge idSTP enabledinterfaces
virbr08000.525400e7be5fyesvirbr0-nic
然后创建一个网桥bridge0,给网桥分配特定的 ip
# brctl addbrbridge0
# ipaddr add192.168.10.1/24 devbridge0
# ip link setdevbridge0up 查看确认网桥创建并启动
# brctl show bridge namebridge idSTP enabledinterfaces
bridge08000.000000000000no
或
# ip addr show bridge0 106: bridge0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UNKNOWN
link/ether fe:09:c2:02:d7:cb brd ff:ff:ff:ff:ff:ff
inet 192.168.10.1/24 scope global bridge0
valid_lft forever preferred_lft forever
inet6 fe80::fc09:c2ff:fe02:d7cb/64 scope link
valid_lft forever preferred_lft forever
修改/etc/sysconfig/docker文件
修改前:
OPTIONS='--selinux-enabled --log-driver=journald --signature-verification=false'
修改后:添加前面所新建的网桥
# vim /etc/sysconfig/docker # /etc/sysconfig/docker
# Modify these options if you want to change the way the docker daemon runs
OPTIONS='--selinux-enabled --log-driver=journald -b=bridge0'
启动 Docker 服务。
# systemctl startdocker 新建一个容器,可以看到它已经桥接到了bridge0上
# dockerrun-dit docker.io/centos:centos6 fda8c846484dd543728ae7ed814ca45aefd816b7146dce105d217649e92a1321
# brctlshow bridge namebridge idSTP enabledinterfaces
bridge08000.e230240caa2dnovethf1f9dec
virbr08000.525400e7be5fyesvirbr0-nic
进入容器,查看容器的IP
# dockerattachfda8c846484dd543728ae7ed814ca45aefd816b7146dce105d217649e92a1321
# ifconfig eth0 eth0 Link encap:EthernetHWaddr 02:42:C0:A8:0A:02
inet addr:192.168.10.2Bcast:0.0.0.0Mask:255.255.255.0
inet6 addr: fe80::42:c0ff:fea8:a02/64 Scope:Link
UP BROADCAST RUNNING MULTICASTMTU:1500Metric:1
RX packets:8 errors:0 dropped:0 overruns:0 frame:0
TX packets:8 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:648 (648.0 b)TX bytes:648 (648.0 b)
docker 服务启动成功并绑定容器到新的网桥,新建一个容器,你会看到它的 ip 是我们的设置的新 ip段, docker 会自动检测到它。用 brctl show 可以看到容器启动或则停止后网桥的配置变化,在容器中使用 ip a 和 ip r 来查看 ip 地址配置和路由信息。
页:
[1]