参考答案钱,可以给你带来药,但不可以给你带来健康.--易普生
可能是仲裁磁盘出现格式故障,也可以使用仲裁按钮,更改由默认自动选择的磁盘指派的仲裁磁盘.
转自:集群故障转移的仲裁
Windows服务器故障转移集群(Windows Server Failover Cluster,简称WSFC)使用仲裁投票(Quorum Voting)决定集群的健康状况,或使故障自动转移,或使集群离线. 当集群中的结点发生故障时,会由其他结点接手继续提供服务 ,不过, 当结点之间通信出现问题,或大多数结点发生故障时,集群就会停止服务,可是集群可以容忍多少个结点发生故障呢? 这要由仲裁配置(Quorum Configuration)决定,仲裁配置采用少数服从多数(Majority)原则,只要集群中健康运行的结点数量达到仲裁规定的数量(多数结点投赞成票),集群就会继续提供服务,否则集群就停止提供服务.在停止提供服务期间,正常结点持续监控故障结点是否恢复正常,一旦正常结点的数量恢复到仲裁规定的数量,集群就恢复正常,继续提供服务.仲裁投票默认是启用的(Cluster Manged Voting:Enable).
一,仲裁模式
仲裁模式是在WSFC 集群级别配置的,规定仲裁投票的方法,默认情况下,故障转移集群管理器会基于集群结点的数量,自动推荐一个仲裁模式.仲裁配置影响集群的可用性,在集群中,重组的集群结点必须在线,否则集群将由于仲裁不足而必须停止服务.
①.,术语解释
仲裁(Quorum):法定数量,预先规定具有投票权的结点或见证(Witness)的数量;
仲裁投票(Quorum Voting)指法定数量的结点和见证进行投票,如果多数投赞成票,那么判断集群处于健康状态;
投票节点(Voting Node):在集群中,拥有投票权的结点称作投票结点,如果投票结点投赞成票,代表该结点认为集群是健康的;但是,单个结点不能决定集群整体的健康状态.
投票见证(Voting Witness):除了投票结点能够进行投票之外,共享的 File 和 Disk 也能投票,称作投票见证, 共享的File 投票见证,称作文件共享见证(File Share Witness);共享的Disk 投票见证,称作硬盘见证(Disk Witness) ;
仲裁结点集合(Quorum Node Set):拥有投票的结点和Witness统称仲裁结点集合;由仲裁结点集合的投票结果决定集群整体的健康状态.
结点多数 (Node Majority):在集群中,投票结点都是集群的结点服务器,如果一半以上的投票结点(Voting Node)投赞成票,那么WSFC判定集群是健康的;
结点和文件共享多数 (Node and File Share Majority):和Node Majority模式相似,除了将远程文件共享配置为一个投票见证(Voting Witness)之外,该共享文件称作仲裁文件,或见证文件.使用仲裁文件,远程文件拥有投票权,如果其他结点能够连接到该共享文件,那么认为该文件投一个赞成票.如果投票结点和文件共享投的赞成票占一半以上,那么WSFC判定集群是健康的.作为一个最佳实践,文件共享见证(File Share Witness)不要存储在集群中的任何一个结点服务器上,并且设置任何一个结点服务器都有权限访问.
结点和硬盘多数 (Node and Disk Majority):和Node Majority模式相似,除了将共享硬盘配置为一个投票见证(Voting Witness)之外,该共享硬盘称作仲裁硬盘,或见证硬盘.仲裁硬盘需要共享存储,集群中各个结点都需要挂载同一个共享硬盘.
只硬盘(Disk Only) :没有多数,仅仅把一个共享的硬盘作为唯一见证,集群中的任何一个结点能够访问该共享硬盘,这意味着,一旦仲裁硬盘脱机,集群就会停止提供服务.
常见的仲裁模式是结点多数(Node Majority) 和 结点和文件共享多数(Node and File Share Majority) ,如果集群结点数量是 奇数 ,那么使用结点多数仲裁模式;如果集群结点数量是 偶数 ,那么使用结点和文件共享多数仲裁模式,该模式需要配置一个共享文件夹,集群中的各个结点都有权限访问该共享文件夹,并且该共享文件夹不能创建是集群的结点上.
在任何时刻,从每一个的结点的角度来看,其他结点可能处于离线状态,或正在进行故障转移,或由于网络连接失败而处于不响应状态,仲裁投票的关键在于确定所有投票结点的真实状态.除了"Disk Only"仲裁模式之外,其他仲裁模式都依赖于投票结点之间周期性的心跳信号通信,一旦某个结点因为网络通信故障,系统宕机,硬件损坏,机房停电等异常而无法回应心跳信号,那么剩余的结点就认为该结点出现异常,把该结点从当前集群排除.WSFC统计所有投票结点的仲裁结果,决定集群的健康状态.
WSFC在集群的结点之间进行健康检测和仲裁投票,每一个结点通过周期性地发送心跳信号,检测其他其他结点的健康状态,并和其他结点共享健康数据,无法响应心跳信号的结点被认为处于异常状态,集群的所有健康结点都会很快知道该结点出现故障.
仲裁结点集合是投票结点和见证结点(Witness)结合,仲裁结果由多数(Majority)结点决定,集群整体的健康状态是由周期性的仲裁投票的结果决定的,WSFC根据仲裁投票的结果,执行自动故障转移或者使集群离线:如果仲裁结点集合(Quorum Node Set)的投票结果表明大多数结点是健康的,那么集群将进行故障转移,继续提供服务;如果投票结果是少数结点,那么集群将处于离线状态.
在传统的终端/主机的网络模式时代,终端功能简单,无需维护工作,在主机一端进行专门的管理与维护,具有资源共享、便于管理的特点.但是,主机造价昂贵,终端没有处理能力,限制了网络的规模化发展.之后的客户机/服务器模式推进了计算产业的标准化和开发化的发展,为系统提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大的开销.
面向Internet的服务型应用,需要高性能的硬件平台作为支持,将并行技术应用在服务器领域中,是计算机发展的必然趋势.并行处理技术在高性能计算领域中,高可用和高性能是集群服务器系统发展的两个重要方向.
集群的概念
集群英文名称是CLUSTER,是一组相互独立的、通过高速网络互联的计算机,它们构
成了一个组,并以单一系统的模式加以管理.一个客户与集群相互作用时,集群像是一个独立的服务器.集群配置是用于提高可用性和可缩放性.
和传统的高性能计算机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具有较高的响应能力,能够满足当今日益增长的信息服务的需求.
集群技术应用的需求
Internet用户数量呈几何级数增长和科学计算的复杂性要求计算机有更高的处理能力,而CPU的发展无法跟上不断增长的需求,于是我们面临以下问题:
●大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性能.
●应用规模的发展使单个服务器难以承担负载.
●不断增长的需求需要硬件有灵活的可扩展性.
●关键性的业务需要可靠的容错机制.
IA集群系统(CLUSTER)的特点
●由若干完整的计算机互联组成一个统一的计算机系统;
●可以采用现成的通用硬件设备或特殊应用的硬件设备,例如专用的通讯设备;
●需要特殊软件支持,例如支持集群技术的操作系统或数据库等等;
●可实现单一系统映像,即操作控制、IP登录点、文件结构、存储空间、I/O空间、作业管理系统等等的单一化;
●在集群系统中可以动态地加入新的服务器和删除需要淘汰的服务器,从而能够最大限度地扩展系统以满足不断增长的应用的需要;
●可用性是集群系统应用中最重要的因素,是评价和衡量系统的一个重要指标;
●能够为用户提供不间断的服务,由于系统中包括了多个结点,当一个结点出现故障的时候,整个系统仍然能够继续为用户提供服务;
●具有极高的性能价格比,和传统的大型主机相比,具有很大的价格优势;
●资源可充分利用,集群系统的每个结点都是相对独立的机器,当这些机器不提供服务或者不需要使用的时候,仍然能够被充分利用.而大型主机上更新下来的配件就难以被重新利用了.
实现服务器集群的硬件配置
●网络服务器 两台
●服务器操作系统硬盘 两块
●网络服务网卡 四块
服务器集群的实践步骤
●在安装机群服务之前的准备:
●安装配置服务器网络要点
①.、在这一部分,每个服务器需要两个网络适配器,一个连接公众网,一个连接内部网(它只包含了群集节点). 内部网适配器建立点对点的通信、群集状态信号和群集管理.每个节点的公众网适配器连接该群集到公众网上,并在此驻留客户.
●安装配置阵列
配置数据库的检测点和日志文件.这是集群中一个重要的关键分区,一但他出现故障,将导
致整个集群的失败.这里我们分配给他1G的空间,并命名为X盘符.
●安装集群服务软件
【配置首节点】
①.、所有的设备都先关闭(两台服务器、一台磁盘阵列).
务.在安装过程中选择这是集群的首节点.创建集群名称.我们给命名为Mycluster.
都配置成群集磁盘.
【配置第二个节点】
①.、保持阵列和第一个节点的开机和可用.给第二个节点上电开机.
在创建或添加群集对话框中,在群集中选择第二个或下一个节点,并单击下一步.
输入前面所创建的群集名称(在本例中,是MyCluster),并单击下一步.
将连接到群集设为未选中.群集服务配置向导将自动提供,在安装首节点时选定 的用户帐号名称.
输入该帐号的口令(如果有的话),并单击下一步.
在下一个对话框中,单击完成,结束配置.
将启动群集服务.单击确定.
关闭添加/删除程序
如果要安装额外的节点,重复这些步骤,以便在其它节点上安装群集服务.
检验安装
单击开始,单击程序,单击管理工具,并单击群集管理器.显示的两个节点表明,存在群集,而且它在运行.
效能评测
●容错能力的检验
对于他的容错能力我们做了以下几个实验:
●负载均衡能力的检验
注意要点
我们在做集群实验的过程当中遇到了一些问题,虽然最后都顺利的解决了,但我想还是要今天这一节提出来让大家注意,避免在今后的工作中出现不必要的重复的错误.
①.、共享磁盘之中X盘的重要性.在实验的过程中我们也知道X盘相当重要,为了验证他的重要地位,我们做了如下实验:我们首先看到在X盘下面只有一个MSDN的文件夹,其中有两个文件*.tmp和*.log,这就是上文所说的群集配置数据库的检测点和日志文件.我们试着删除这两个文件,结果*.tmp可以删除,*.log文件正在使用而无法删除.删除了*.tmp文件之后我们重新启动两台节点和集群.一切正常,进入X盘看他的文件,发现被删除的*.tmp文件又重新回到了里面,只是名字稍有些改变.这表明*.tmp文件是每次集群启动时自动生成的一个文件,而集群启动以后,这个文件就不在被使用.接着我们进行了一个后来被证明
是毁灭性的实验,我们在我的电脑管理里面的调整了磁盘管理,把X盘删除了.结果可怕的事情发生了,在不到10秒钟的时间内两台节点相继报告机群服务发生错误将不能运行且终止服务.我们尝试再次进入磁盘管理,发现阵列的磁盘已经变成了不可读取.无奈之下我们重新启动所有设备,期望能发生超乎设想的好的结果,但是事实让我们不得不失望.集群服务无法启动,阵列磁盘不可读取.在没有任何办法的情况下我们不得不重新配置集群.
呃......那个......这个问题......提的地方有点不对呃,这里是电脑常识呃......您的这个问题不是电脑常识吧?
这个情况我不是很熟悉,但是有一点我想提醒您一下,注意第一个错误,或者是前面的错误,最后一个错误的原因可能是因为前面几个错误而导致的,比如有一点我比较在意,就是那个"无法验证节点'admin.wnt.com'是否可以主持仲裁资源......"您想想,如果节点都无法确定了,那当然找不到仲裁磁盘咯,所以我觉得这个问题并不能只看最后一步的错误,要看前面的呃,因为很多时候最后的提示都是因为前面的提示导致的.