3.5 可能发生的网络配置问题
如果VSAN VMkernel没能配置正确,在VSAN群集对象的Monitor(监控)页面上的Virtual SAN→Health(运行状况)部分会显示一条配置警告消息。点击(特定测试失败的)warning,关于群集中所有主机网络状态的进一步具体信息会显示出来(如图3-11所示)。这个例子中显示的是一个8主机群集中的某单台主机位于一个不同的IP子网,可想而知这会引起网络连接问题。
对于VSAN 6.1及更早版本,另一个可以观察到VSAN通信故障的地方是在Summary(摘要)页,如图3-12所示。如果主机无法和群集中的其他主机通信,Summary页会显示“Host cannot communicate with all other nodes in the VSAN enabled cluster”(主机无法与已启用VSAN群集中的所有其他节点进行通信)。此时,你需要回到VMkernel端口属性页面进行检查,确保设置是正确的。
另一个常常困扰很多客户的问题就是对组播流量传输的依赖。VSAN的一个必要条件是允许组播流量在VSAN群集中的ESXi主机之间的VSAN网络上传输。不过,组播仅用于相对不频繁的操作,例如,VSAN群集中主机的初次发现,以及群集中主机之间持续的“心跳”检查。
那么缺乏组播支持是怎样表现出来的呢?你在群集上启用了VSAN后会看见一条显示在群集层面上的警告消息。如果你去VSAN群集对象的Monitor(监控)标签页下查看Virtual SAN菜单下的Health(运行状况)部分,会显示一条关于“Multicast Assessment”(基于其他检查的组播评估)或“All hosts have matching multicast settings”(所有主机组播配置已匹配)的警告消息,即使此时你可以ping/vmkping通所有主机的VSAN接口。另一个表象是你可能会发现形成了多个单主机的VSAN群集,每个ESXi主机处在自己唯一的群集分区中。
如何解决这个问题?很多我们的VSAN客户在VMware社区的VSAN论坛中讨论过一些可用的选择,下面列出了一些建议。
选择1:在用于VSAN流量的VCAN上禁用IGMP(Internet Group Management Protoco1)窥探(snooping)。这会允许所有组播流量通过,但是如果仅有的流量是VSAN,流量应该小到可以忽略,所以应该可以安全使用。
选择2:配置IGMP窥探查询器(snooping querier)。如果存在其他组播流量,而且你担心禁用IGMP窥探会引起组播洪流,那么这是推荐的选择。
遇到过这个问题的客户声称这两种方法都可行。不过,我们建议你还是要参考交换机供应商的文档来了解如何进行组播相关的配置。某些交换机把组播转换成广播,数据包将被发往所有端口。VMware建议客户在可能的情况下应该避免将此类交换机用于VSAN。具有IGMP窥探功能的更智能的交换机可以把组播数据包只发送到那些需要的端口,这类交换机更适用于VSAN部署。原因是非智能交换机只是简单地把组播流量转换成广播流量,这可能会导致网络洪流并影响连在同一个交换机上的非VSAN主机。
最后需要解释的是如何判断哪台或哪些主机处于隔离于群集的状态。最方便的方法是在VSAN的Manage(管理)页面的Disk Managment(磁盘管理)中查看Disk Groups(磁盘组)视图。这个视图包含一个名为Network Partition Group(网络分区组)的列,其中会显示一个组号来突出显示某台特定的主机现在位于哪个分区组内。如果群集被成功地创建并且所有主机都能相互通信,在这个视图中的所有主机都将具有相同的网络分区组号,如图3-13所示。注意,此视图还显示了主机是否健康,是否已连入VSAN群集。