在我们实际使用IBM服务器的时候,当ServerRAID发生故障是往往会导致逻辑盘掉线,下面的处理方法为IBM工程师提供,供大家在实际解决阵列时参考,">解决问题主要看思路,思路正确,只要不是11585.html">硬件设备损坏,我想应该是可以解决的,好了我们先来看一下解决的步骤吧。
1、由于逻辑盘已经掉线,如果硬盘数据很重要的话,务必联系专业的数据备份公司,替您备份出数据
2、备份好数据之后,您可以尝试让逻辑盘强制上线恢复.
a.使用server raid support cd引导,选择controller 8k-l,右边您可以看到两个Logical driver,其中有一个有个红X,右键点击标示红X的逻辑盘,选择force online,让逻辑盘恢复,稍等,看逻辑盘是否能恢复正常状态,红X消失.如果消失,退出,重启服务器就可以进入操作系统.
3、如果恢复不了,建议您重建您的raid0阵列.
4、重建好阵列之后,建议您更新阵列卡的驱动和微码至最新,硬盘微码至最新.
5、请登陆IBM的官方网站查询相对应的软件升级程序。
下面的一则实际为在网上搜集整理出来的,大家也可以在实际解决问题的过程中借鉴与参考:
周末朋友打电话求助,说机器Raid完蛋了,赶了过去,开机提示logical driver offline, Ctrl+I进入Raid查看状态:
0号盘为HSP(热拔插),1号盘是ONL(在线),其余两个他拔过的盘都是DDD(故障)
问朋友机器怎么坏掉的, 他说打扫卫生时看正在运行服务器上做Raid5的4块SCSI硬盘(支持热拔插)有很多灰,就准备拔出来擦灰,擦第一块没问题,擦完放回去这个硬盘上警示黄灯亮了,他觉的好奇又顺手拔出旁边一块SCSI盘, 这下机器完蛋了当掉了,赶紧关闭电源重起提示找不到逻辑盘, 显示disk reset错误,当时就傻眼了,一面让朋友找IBM的ServerRaid安装盘,一面给他解释当机的原因:
虽然盘是支持热拔插的,但如果不重新配置,重新插进去的盘不会自动变回在线online的,4块盘做Raid5一般是3块盘做Raid,一块做冗余,坏一个盘(包括拔一个盘出来)Raid卡自动会用冗余盘替换,这时候如果再拔一个盘出来,实际上只剩下2个盘在用了,Raid5做不下去机器当然就当掉了。
由于朋友机器安装时间较早,ServerRaid4Lx卡随机盘找不到了,只好从其他部门借了一套高版本的ServerRaid7安装盘,
1、插入ServerRaid7光盘后,开机加电引导:
由于光盘上firmware版本比机器里Raid卡的版本高,进入ServerRaid管理界面前提示是否Update,选择Cancel不升级。
原因:升级firmware可能导致机器目前操作系统中驱动和Raid固件版本不符导致不能使用,所以不能随便就Update
2、进入ServerRaid管理,点localhost打开raid成员, 果然Raid成员中两个SCSI盘都是错误的故障状态,让朋友确认最后拔的是3号盘后,在3号盘图标上点鼠标右键选则change to online强制改回为在线状态。
原因:由于3号盘最后拔的,系统就立即当机了,所以3号盘上内容应该是完整的
而第一个拔掉的4号盘由于Raid卡当时可能会重新组织,上面的数据有效性可能保证不了
3、保存后退出ServerRaid管理重新启动机器(不取出光盘),重新进入ServerRaid管理,此时管理菜单右下角的进度状态条提示正在rebuild Raid,0号硬盘狂闪,耐心等待0到3号盘重做Raid吧!
等了大约半个小时后终于做完了,虽然此时0号-3号盘上的图标上还有!号警示,但逻辑盘肯定是已经恢复了,接着在被朋友第一个拔掉的4号盘图标上点右键选择replace new drive, 把4号盘作为新的HSP重新加入Raid组,退出ServerRaid管理,取出光盘,重新启动机器。
系统开机提示logical driver online状态正常,Ctrl+I看0到3号盘为ONL,4号盘为HSP, 一切正常继续引导应用系统顺利启动,数据还好未丢失。