DELL服务器硬件报错及对应的解决方法(R720)
前言
由于我们的服务器的型号较多,前面板的报错的信息的格式也是多样的,下面是从网上总结DELLR720的报错及对应的解决方法。
正文
代称含义
特定的系统组件 name
组件号 number
位置 bay
AMP0302
1 > The system board <name> current is greater than the upper warning threshold.
2 > 系统板 <name> 电流超出适宜范围
操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。
AMP0303
1 System board <name> current is outside of range.
2系统板 <name> 电流超出适宜范围
操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。
ASR0000
1 The watchdog timer expired.
2 操作系统或应用程序在超时时段内通信失败
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0001
1 The watchdog timer reset the system.
2 操作系统或应用程序在超时时段内通信失败,系统被重设
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0002
1 The watchdog timer powered off the system.
2 操作系统或应用程序在超时时段内通信失败,系统被关闭
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0003
1 The watchdog timer power cycled the system.
2 操作系统或应用程序在超时时段内通信失败,系统在关闭后再次开启。
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
BAT0002
1 The system board battery has failed. Check battery.
2 系统板电池失效。
操作
更换电池。
BAT0017
1 The <name> battery has failed. Check battery.
2 电池 <name> 可能出现缺失、故障因为温度问题导致无法充电。
操作
检查系统风扇。
如非风扇问题,更换电池。
CPU0000
1 CPU <number> has an internal error (IERR).
2 CPU <number> 出现内部错误.也许异常出现在处理器之外
操作
审查系统事件日志和操作系统日志。
CPU0001
1 CPU <number> has a thermal trip. Check CPU heat sink.
2 CPU <number> 出现热断路,检查 CPU 散热器
操作
检查风扇故障日志。
如果未检测到风扇故障,请检查进气孔温度(若适用)并重新安装处理器散热片
CPU0005
1 CPU <number> configuration is unsupported. Check CPU or BIOS revision.
2 CPU <number> 配置受支持,检查 CPU 或 BIOS 修订版本。系统无法引导,或正在降级运行。
操作
检查所支持的处理器类型的技术规格。
CPU0010
1 CPU <number> is throttled.
2 因为温度或电源情况导致 CPU<number>被节流。
操作
查阅系统日志排查电源或温度异常。
CPU0023
1 CPU <number> is absent. Check CPU.
2 CPU <number> 缺失,检查 CPU。
操作
验证处理器安装。
如果存在,则重新安装处理器。
CPU0204
1 CPU voltage is outside of range. Re-seat CPU.
2 CPU 电压超出范围,重新安装 CPU。电压超出容许范围可能损坏电气组件,或导致系统关闭。
操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0700
1 CPU <number> initialization error detected. Power cycle system.
2 检测到 CPU <number> 初始化错误,系统电源关闭然后打开。
操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0701
1 CPU protocol error detected. Power cycle system.
2 检测到 CPU 协议错误,系统电源关闭然后打开
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0702
1 CPU bus parity error detected. Power cycle system.
2 检测到 CPU 总线奇偶校验错误,系统电源关闭然后打开。
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0703
1 CPU bus initialization error detected. Power cycle system.
2 检测到 CPU 总线初始化错误,系统电源关闭然后打开。
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0704
1 CPU <number> machine check error detected. Power cycle system.
2 检测到 CPU <number> 机器检查错误,系统电源关闭然后打开。
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
FAN0000
1 Fan <number> RPM is less than the lower warning threshold.
2 风扇<number>运行速度超出范围。
操作
卸下并重新安装风扇。
FAN0001
1 Fan <number> RPM is outside of range. Check fan.
2 风扇 <number> 运行速度超出范围。
操作
卸下并重新安装风扇。
FAN1201
1 Fan redundancy lost. Check fans.
2 风扇发生故障。
操作
卸下并重新安装故障的风扇或安装其它风扇。
HWC1001
1 The <name> is absent. Check hardware.
2 硬件<name> 缺失,检查硬件。可能导致系统功能降级。
操作
重新安装或重新连接硬件。
HWC2003
1 Storage <name> cable or interconnect failure. Check connection.
2 存储设备 <name> 电缆或互联故障,请检查连接。可能导致系统功能降级。
操作
检查电缆是否存在,重新安装或重新连接。
HWC2005
1 System board <name> cable connection failure. Check connection.
2 系统板 <name> 电缆连接故障,请检查连接。可能导致系统功能降级。
操作
检查电缆是否存在,然后重新安装或重新连接。
MEM0000
1 Persistent correctable memory errors detected on a memory device at location(s) <location>.
2 在内存设备的位置 <location> 处检测到永久可纠正的内存错误。
操作
重新安装内存。
MEM0001
1 Multi-bit memory error on <location>. Re-seat memory.
2 <location> 处的多位内存错误,重新安装内存。可能导致系统功能降级,操作系统和/或应用程序可能会发生故障。
操作
重新安装内存。
MEM0007
1 Unsupported memory configuration. Check memory <location>.
2 内存可能安装不正确,配置错误,或者发生故障,内存大小减少。
操作
检查内存配置。重新安装内存。
MEM0701
1 Correctable memory error rate exceeded for <location>.
2 内存可能无法操作。
操作
重新安装内存。
MEM0702
1 Correctable memory error rate exceeded for <location>. Re-seat memory.
2 <location> 的可纠正内存错误比率超限,重新安装内存。
操作
重新安装内存。
MEM1205
1 Memory mirror lost on <location>. Power cycle system.
2 内存可能安装不正确,配置错误,或者发生故障。
操作
检查内存配置。重新安装内存。
MEM1208
1 Memory spare lost on <location>. Power cycle system.(
2 内存备份不再可用。
操作
重新安装内存。
MEM8000
1 SBE log disabled on <location>. Re-seat memory.
2 <location> 上 SBE 日志已禁用,重新安装内存。
操作
检查系统日志排查内存异常。
重新安装位于 处的内存。
PCI1302
1 A bus time-out was detected on a component at bus <bus> device<device> function <func>.
2 总线 <bus> 设备 <device> 功能 <func> 的组件上检测到总线超时。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1304
1 I/O channel check error detected. Power cycle system.
2 检测到 I/O 通道检查错误,系统电源关闭然后打开。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1308
1 PCI parity error on bus <bus> device <device> function <func>. Power cycle system.
2 总线 <bus> 设备 <device> 功能 <func> 上的 PCI 奇偶校验错误,关闭并打开系统电源。可能导致系统功能降级,PCI 设备可能无法运行,或系统无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1320
1 Bus fatal error on bus <bus> device <device> function <func>. Power cycle system.
2 总线 <bus> 设备 <device> 功能 <func> 上的总线严重错误,关闭然后打开系统电源。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1342
1 A bus time-out was detected on a component at slot <number>.
2 插槽 <number> 的组件上检测到总线超时。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1348
1 PCI parity error on slot <number>. Re-seat PCI card.
2 插槽 <number> 上的 PCI 奇偶校验错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1360
1 Bus fatal error on slot <number>. Re-seat PCI card.
2 插槽 <number> 的严重总线错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PDR0001
1 Fault detected on drive <number>. Check drive.
2 控制器在磁盘上检测到故障,并已使磁盘脱机。
操作
卸下然后重新安装有故障的磁盘。
1 Drive <number> removed from disk drive bay <bay>. Check drive.
2 控制器检测到驱动器已卸下。
操作
验证驱动器的安装。
重新安装有故障的驱动器。
PST0128
1 No memory is detected. Inspect memory devices.
2 系统 BIOS 无法检测到系统中的内存。
操作
重新安装内存。
PST0129
1 Memory is detected, but is not configurable. Check memory devices.
2 系统 BIOS 检测到内存,但无法基于系统运行对其进行配置。
操作
将系统内存安装与支持的系统内存配置进行比较。
PSU0001
1 PSU <number> failed. Check PSU.
2 PSU <number> 故障,检查 PSU。
操作
卸下并重新安装电源设备。
PSU0002
1 Predictive failure on PSU <number>. Check PSU.
2 PSU <number> 上的预测故障,检查 PSU。
操作
卸下电源设备并重新安装。
PSU0003
1 Power input for PSU <number> is lost. Check PSU cables.
2 PSU <number>电源设备安装正确,但输入源未连接或未起作用。
操作
验证输入源连接到设备。
验证输入源符合电源设备的操作要求。
PSU0006
1 Power supply is incorrectly configured. Check PSU.
2 电源设备 未正确配置,检查 PSU。电源设备的输入类型和额定功率应当相同。
操作
安装匹配的电源设备。
PSU0016
1 PSU <number> is absent. Check PSU.
2 PSU <number> 电源设备已卸下或出现故障。
操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。
PSU0031
1 Cannot communicate with PSU <number>. Re-seat PSU.
2 电源设备可以运行,但是电源设备的监控已降级,系统性能将降级。
操作
卸下并重新安装电源设备。
PSU0032
1 The temperature for power supply <number> is in a warning range.
2 电源设备 <number> 的温度在警告范围内。
操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。
PSU0033
1 PSU temperature outside of range. Check PSU.
2 PSU 温度超出范围,请检查 PSU。
操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。
PSU0034
1 An under voltage fault detected on PSU <number>. Check power source.
2 在 PSU <number> 上检测到电压过低故障,请检查电源。
操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。
PSU0035
1 Over voltage fault on PSU <number>. Check PSU.
2 在 PSU <number> 上发生电压高过故障,请检查 PSU。
操作
检查输入电源或重新安装电源设备。
PSU0036
1 An over current fault detected on PSU <number>. Check PSU.
2 在 PSU <number> 上检测到电流过高故障,请检查 PSU。
操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。
PSU0037
1 Fan failure detected on PSU <number>. Check PSU.
2 在 PSU <number> 上检测到风扇故障,请检查 PSU。
操作
检查风扇是否阻塞。
PSU0076
1 PSU wattage mismatch; PSU <number> = <value >watts
2 PSU 功率不匹配;PSU <number> = <value > 瓦特 ,电源设备的输入类型和额定功率应当相同。
操作
安装匹配的电源设备。
PSU1201
1 Power supply redundancy is lost.
2 电源设备冗余缺失。
操作
检查输入电源。
重新安装电源设备。
PSU1204
1 PSU redundancy degraded. Check PSU cables.
2 PSU 冗余降级,检查 PSU 电缆。电源设备异常、电源设备资源变化,或系统电源资源变化。
操作
检查事件日志排查电源设备故障。
查看系统配置和功耗。
PWR1004
1 The system performance degraded because power capacity has changed.
2 因为电源容量变化系统性能已降级。
操作
检查事件日志排查电源设备故障。
查看系统配置和功耗,并据此升级或安装电源设备。
PWR1005
1 The system performance degraded because the user-defined power capacity has changed.
2 用户定义的电源设置影响系统运行。
操作
如果是意外导致,查看系统配置变化和电源策略。
PWR1006
1 System power demand exceeds capacity. System halted.
2 系统电源需求超出容量,系统已停止。
操作
查看系统配置,升级电源设备或降低系统功耗。
RFM1008
1 Removable Flash Media <name> failed. Check SD Card.
2 可移动的闪存介质 <name> 出现故障,检查 SD 卡。SD 卡读取或写入过程中报告了错误。
操作
重置闪存介质。
RFM1014
1 Removable Flash Media <name> is write protected. Check SD Card.
2 可移动的闪存介质 <name> 为写保护状态,检查 SD 卡。该卡被 SD 卡上的物理锁进行了写保护,写保护状态的卡无法使用。
操作
如果是意外导致,卸下介质并禁用写保护。
RFM1201
1 Internal Dual SD Module redundancy is lost. Check SD Card.
2 其中一块或两块 SD 卡工作不正常。
RFM2001
1 Internal Dual SD Module <name> is absent. Check SD Card.
2 未检测到 SD 卡模块或该卡未安装。
操作
如果无意如此,则重新安装 SD 模块。
RFM2002
1 Internal Dual SD Module <name> is offline.
2 SD 卡模块已安装,但可能安装不正确,或配置不正确。
操作
重新安装 SD 模块。
RFM2004
1 Internal Dual SD Module <name> failed. Check SD Card.
2 SD 卡模块已安装,但配置不正确,或无法初始化。
操作
重新安装 SD 模块,然后卸下并重新安装 SD 卡。
RFM2006
1 Internal Dual SD Module <name> is write protected.
2 此模块为写保护,更改可能无法写入到介质。
操作
如果是意外导致,卸下介质并禁用写保护。
SEC0031
1 Intrusion detected. Check chassis cover.
2 检测到侵入,检查机箱盖。
操作
关闭机箱,检查系统日志。
SEC0033
1 Intrusion detected. Check chassis cover.
2 电源关闭状态下机箱打开。
操作
关闭机箱并验证硬件资源。
检查系统日志。
SEL0006
1 All event logging is disabled.
2 当用户禁用所有事件日志。
操作
若是意外导致,则重新启用日志。
SEL0008
1 Log is full.
2 日志已满。日志已满时,其他事件将不会写入到日志。早期的事件可能被覆盖并丢失。如果用户禁用了事件记录,也可能显示此消息。
操作
备份并清除日志。
SEL0012
1 Could not create or initialize the system event log.
2 无法创建或初始化系统事件日志。系统事件日志初始化失败,将不会捕获平台状态和故障事件,某些管理软件不会报告平台异常。
操作
重新引导管理控制器或 iDRAC。
关闭然后打开输入电源。
SEL1204
1 Unknown system hardware failure.
2 未知系统硬件故障。
操作
将系统重新配置为所支持的最低配置。
TMP0118
1 System inlet temperature is outside of range.
2 环境气温过低.
操作
检查系统运行环境。
TMP0119
1 System inlet temperature is outside of range.
2 环境气温过低。
操作
检查系统运行环境。
TMP0120
1 System inlet temperature is outside of range.
2 环境气温过高,或者可能一个或多个风扇发生故障。
操作
检查系统运行环境并查看事件日志排查风扇故障。
TMP0121
1 System inlet <name> temperature is outside of range. Check Fans.
2 环境气温过高,或者可能一个或多个风扇发生故障。
操作
检查系统运行环境并查看事件日志排查风扇故障。
VLT0204
1 System board voltage is outside of range.
2 系统硬件检测到电压过高或过低的情况。如果连续出现多个电压异常,系统可能切换到故障安全模式。
操作
查看系统日志了解电源设备异常。
将系统重新配置为最低配置,检查并重新安装系统电缆。