联想X 3650服务器断电后报错现Critical Message解决办法

Author: 4条评论

最近公司机房断电,刚好又不在公司。同事问及解决办法,有空写了个case,也分享给大家一下。

解决联想服务器 X3650启动中出现”Critical Message”。

20170124141101638

原因分析:
配备有回写缓存的SAS RAID卡在进行写入数据操作时,数据会经过RAID卡缓存再写入到硬盘中。如果数据在未完全写入到硬盘时,服务器发生断电,缓存中未写入部分的数据可能会丢失。待服务器通电启动时,RAID卡自检发现有未完整写入的数据,即出现此报错。

注意:不同系列服务器机型报错界面略有不同。
任何非正常关机都可造成此异常,包括:
1. 停电;
2. 手动强制关机;
3. 服务器宕机。
阵列卡缓存数据丢失可能导致操作系统出错、文件损坏,严重时可能造成阵列出错、掉线或者阵列卡进入安全模式。
解决方案:
当出现缓存数据丢失的报错时,通常只能忽略报错,并建议首先检查RAID状态。具体操作如下:
在”Critical Message”界面将光标下移到”Enter Your Input Here:”处,按回车,在输入框中输入字母”A”,再按回车;

20170124141928795

然后会提示”Critical Message handing completed. Please exit.” 处理完成,按ESC键退出;

20170124141952452

接下来按字母”Y”键继续;

20170124142132501

随后服务器会继续POST及引导过程,建议在此时进入RAID卡配置界面查看RAID状态,如果RAID状态正常,可以继续正常引导。

如果无法引导系统或者系统报错,可能是缓存数据丢失所导致,需要对系统进行修复或者重新安装。

如果已按照上述进行操作,关机或者重启后依然出现”Critical Message”界面提示,则可能发生硬件故障,建议及时联系售后服务报修。

一些可以降低发生缓存数据丢失问题的方案:

1. 将Virtual Drive的Write Cache Policy设置为Write Through(直写模式),但此模式会明显降低RAID性能,特别是RAID5和RAID6;
2. 加装、配备电池(BBU)或者闪存备份单元(Flash Backup Write Cache及Super Capacitor);
3. 配备UPS(不间断电源)。

相关内容

4条评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注