ESX的NFS存储Failover机制问答

ESX的NFS存储通常都会配置备份链路。当主链路出现故障时自动切换到备份链路上,这叫做Failover。

问:什么时候发起failover?答:当发现存储链路失败时。

问:如何判断一条存储链路中断了?答:找不到心跳了呗。

问:心跳是怎么回事?怎样才算找不到心跳?

答:通常ESX Host会每隔一定的间隔(HeartbeatFrequency)发起一次到存储的心跳检测,每次心跳检测必须在一定的时间内(HeartbeatTimeout)收到回复,否则就算是一次心跳检测失败(HeartbeatFailure),连续失败到一定的次数(HeartbeatMaxFailure)就算链路失败。

这些参数应该修改为以下推荐的值 (无论是NetApp还是EMC的NAS设备)

NFS.HeartbeatDelta (NFS.HeartbeatFrequency in ESX 3.x)   12

NFS.HeartbeatTimeout         5

NFS.HeartbeatMaxFailures   10

上面这些推荐参数值的含义是:NFS.HeartbeatFrequency=12说明每12秒会发起一次心跳检测。5秒没有响应就算Timeout,一直累计到10次没有响应才算NFS存储丢失,才发起failover的动作。这中间其实经过了12s*10+5s=125秒时间。也就是说,真正要发起一次failover事件,ESX Host要等上125秒。

问:那么,在这125秒内,从VM的角度看,发生了什么状况呢?

答:VM会发现其vSCSI控制器上连接的磁盘停止响应,这取决于Guest OS会忍受多长时间的磁盘不响应才认为是一个error (delayed write error),当这个IO error发生在Guest OS的系统盘时,就会导致OS崩溃。Windows操作系统默认的disk Timeout是60秒。也就是说,当ESX Host还在125秒的等待时间内而不去执行Failover动作时,Guest OS就已经崩溃了。在Guest级别HA启用的情况下,Guest OS会在NFS Storage恢复的时候重启。但是重新配置Guest OS的参数以使其也能够等待125秒不是更好吗?如何做到?用Regedit,修改HKLM\System\CurrentControlSet\Services\Disk下的TimeOutValue值为125即可。(修改注册表有风险,请一定先备份后修改)

本文出自 “delxu的Live记事本” 博客,请务必保留此出处http://delxu.blog.51cto.com/975660/277510

时间: 2024-12-31 04:39:21

ESX的NFS存储Failover机制问答的相关文章

NFS存储与VSphere配合使用

公司服务器的虚拟化使用的是VM ESXi 5.0,为了更有效的利用服务器的硬盘空间.就把所有的镜像文件存放到另外一台linux服务器上,这样在使用vsphere安装虚拟机时可以直接使用linux服务器上的镜像文件,从而到达节省ESXi硬盘的空间的好处. 要达到这个目的,我们首先要在linux服务器上配置NFS网络文件系统. 本次实验linux OS:centos 6.4 64bit esxi:5.0 vsphere:5.0 NFS网络文件所需要的软件包包括:nfs-utils和rpcbind.

MySql数据库插入式的多存储引擎机制

什么是MySql数据库? 通常意义上,数据库也就是数据的集合,具体到计算机上数据库可以是存储器上一些文件的集合或者一些内存数据的集合. 我们通常说的MySql数据库,sql server数据库等等其实是数据库管理系统,它们可以存储数据,并提供查询和更新数据库中的数据的功能等等.根据数据库如何存储数据和如何操作数据的实现机制不同,这些数据库之间即有区别又有共同点. MySql数据库是开放源代码的关系型数据库.目前,它可以提供的功能有:支持sql语言.子查询.存储过程.触发器.视图.索引.事务.锁.

内存管理-连续分配、分页和分段三种存储分配机制的优缺点

问题描述 连续分配.分页和分段三种存储分配机制的优缺点 操作系统中的内存管理习题,请分析和比较连续分配.分页和分段三种存储分配机制的优缺点 解决方案 连续,设计简单,直接寻址,效率高.缺点:内存利用效率最低.分页,设计最复杂,容易产生碎片,无论数据有多少,都只能按照页面大小分配,造成浪费.分段,可以有效利用内存,缺点,无法利用碎片,必须搬移内存,造成性能损失.

tomcat集群的failover机制

集群要提供高可用性就必须要有某种机制去保证,常用的机制为failover(故障转移),简单说就是通过一定的heartbeat检测是否有故障,一旦故障发生备份节点则接管故障节点的工作. tomcat使用BackupManager模式管理会话必须由负载均衡器提供会话黏贴(Session Stick)机制配合,所谓会话黏贴其实是一种会话定位技术,即在tomcat节点上生成一种包含位置信息的会话id,一般是附带了tomcat实例名,当客户端再次请求时负载均衡器会解析会话id中的位置信息并转发到响应节点上

Apche Kafka 的生与死 – failover 机制详解

Kafka 作为 high throughput 的消息中间件,以其性能,简单和稳定性,成为当前实时流处理框架中的主流的基础组件. 当然在使用 Kafka 中也碰到不少问题,尤其是 failover 的问题,常常给大家带来不少困扰和麻烦.  所以在梳理完 kafka 源码的基础上,尽量用通俗易懂的方式,把 Kafka 发生 failover 时的机制解释清楚,让大家在使用和运维中,做到心中有数. 如果对 kafka 不了解的,可以先参考https://kafka.apache.org/08/de

技术论文:一种面向纠删码技术的云存储可靠性机制

一种面向纠删码技术的云存储可靠性机制 杜芸芸 在云存储中,数据可以分为三种类型:读频繁.写频繁以及冷数据.对不同类型的数据设置不同的编码机制:对读频繁数据采用多副本技术,频繁写的数据采用单文件编码方案,冷数据采用跨文件编码方案.在云存储系统中提出了一种新的纠删码技术的可靠性机制-魔方码,该编码易于实现,具备高的容错性并且相比多副本机制可以减少资源的消耗.以HDFS上的一个RAID包为基础,实现魔方码的原型,并添加BlaumRoth.RDP以对比测试.虽然各种编码各有优缺点,通过单机和集群测试RA

NFS存储服务部署

第1章 NFS介绍 1.1 NFS服务内容的概述 □ RPC服务知识概念介绍说明,以及RPC服务存在价值(必须理解掌握) □ NFS服务工作原理讲解(必须理解掌握) □ NFS共享文件系统使用原理讲解(必须理解掌握) □ NFS服务配罝文件exports编写格式说明(必须理解掌握) 1.2 NFS是什么 NFS(Network File System)即网络文件系统    它的主要功能是通过网络(一般是局域网)让不同的主机系统之间可以共享文件或目录.    分布式文件系统Moosefs(mfs)

nfs ftp-用nfs存储做ftp,访问ftp的时候出现问题,啥都看不到……

问题描述 用nfs存储做ftp,访问ftp的时候出现问题,啥都看不到-- 搭了个nfs服务器,然后在另一台服务器上(windows 2008 r2和centos6.5都试过了),挂载这个nfs,然后搭建ftp服务.在客户端访问ftp服务器的时候,看不到任何东西,是什么原因? 追加一下,在linux上用vsftpd搭建ftp server,可以正常使用,但是上传的文件名不能有中文. 2015年12月17日10:12:24原因找到了,windows和linux系统编码不一样,windows是gbk,

NFS做存储与KVM集成

以前有关NFS的文章,我们介绍的都是NFS的使用挂载等等.这篇文章我们介绍有关NFS作为存储使用. 既然本篇文章的主题是有关NFS的,我们还是先把NFS服务器搭建完毕.具体搭建过程可参考<烂泥:NFS存储与VSphere配合使用>,这篇文章. 在此有关NFS配置文件/etc/exports中的几个参数,我们需要先介绍下: ro 该主机对该共享目录有只读权限. rw 该主机对该共享目录有读写权限,需要配合no_root_squash参数使用. root_squash 该参数为缺省参数,客户机用r