恢复和排除 Managed System 故障:Dell Remote Access Controller 5 固件版本 1.30 用户指南
返回目录页
对 Managed System 进行恢复和故障排除
Dell Remote Access Controller 5 固件版本 1.30 用户指南
本节介绍了如何使用 DRAC 5 基于 Web 的界面执行与远程崩溃系统恢复和故障排除有关的任务。有关排除 DRAC 5 故障的信息,请参阅“使用 VM-CLI 部署操作系统” 。
排除远程系统故障
管理远程系统上的电源
使用系统事件日志 (SEL)
查看上次系统崩溃屏幕
使用 RAC 日志
使用诊断控制台
排除远程系统故障首先需要进行的步骤
以下是在排除 managed system 高级别故障时常见的一些问题:
系统开机还是关机?
如果是开机,操作系统是运作正常、崩溃,或者只是冻结?
如果是关机,电源是意外关闭的吗?
对于崩溃的系统,可以检查上次崩溃屏幕(请参阅“查看上次系统崩溃屏幕” ),并使用控制台重定向(请参阅“Managed System 上支持的屏幕分辨率刷新率” )以及远程电源管理(请参阅“管理远程系统上的电源” )重新启动系统并观察重新引导过程。
管理远程系统上的电源
DRAC 5 允许在 managed system 上远程执行几种电源管理操作,以在系统崩溃或出现其它系统事件后尝试恢复。
使用电源管理 页执行以下操作:
当重新引导、打开或关闭系统电源时,对系统执行秩序关机。
查看系统当前的电源状况 —打开 或关闭 。
要从系统 树访问电源管理 页,请单击“ System ”( 系统 ) ,然后单击“ Power Management ”( 电源管理 ) 选项卡。
注: 必须具有执行服务器操作命令 权限才能执行电源管理操作。
选择电源控制操作
选择以下电源控制操作 之一。
“ Power On System ”( 打开系统电源 ) — 打开系统电源(相当于系统电源关闭时按电源按钮)。
“Power Off System”(关闭系统电源) — 关闭系统电源(与系统电源打开时按电源按钮等效)。
“ Reset System ”( 重设系统 ) — 重设系统(相当于按重启动按钮);使用此功能不关闭电源。
“ Power Cycle System ”( 系统关机后再开机 ) — 关闭系统电源,然后重新引导(冷引导)系统。
单击“Apply”(应用) 执行电源管理操作(例如,使系统关机后再开机)。
单击相应的“Power Management”(电源管理) 页按钮继续(参阅表 5-1 )。
表 5-1. 电源管理页按钮(右上)
按钮
操作
“Print”(打印)
打印电源管理 页
“Refresh”(刷新)
重载电源管理 页
查看系统信息
系统摘要 页显示关于以下系统组件的信息:
主系统机箱
Remote Access Controller
底板管理控制器
要访问系统信息,请展开系统 树并单击“ Properties ”( 属性 ) 。
主系统机箱
表 5-2 和表 5-3 说明主系统机箱属性。
注: 要接收主机名 和操作系统名称 信息,managed system 上必须安装有 DRAC 5 服务。
表 5-2. 系统信息字段
字段
说明
说明
系统说明
“BIOS Version”(BIOS 版本)
系统 BIOS 版本。
“Service Tag”(服务标签)
系统服务标签号码。
“Host Name”(主机名)
主机系统名称。
“OS Name”(操作系统名称)
系统上运行的操作系统。
表 5-3. 自动恢复字段
字段
说明
“Recovery Action”(恢复操作)
检测到“系统挂起”时,DRAC 可配置为执行以下操作之一:无操作、硬重设、断电或关机或再开机。
“ Initial Countdown ”( 初始倒计数 )
在 DRAC 将执行恢复操作时检测“系统挂起”后经过的秒数。
“ Present Countdown ”( 当前倒计数 )
倒计数计时器的当前值,以秒为单位。
Remote Access Controller
表 5-4 说明 Remote Access Controller 属性。
表 5-4. RAC 信息字段
字段
说明
“Name”( 名称)
短名称。
“Product Information”( 产品信息)
详细名称。
“Hardware Version”( 硬件版本)
Remote Access Controller 卡版本,或“未知”。
“Firmware Version”( 固件版本)
DRAC 5 当前固件版本级别。
“Firmware Updated”( 固件更新)
固件上次更新的日期和时间。
“RAC Time”( RAC 时间)
系统时钟设置。
底板管理控制器
表 5-5 说明底板管理控制器属性。
表 5-5. BMC 信息字段
字段
说明
“Name”( 名称)
“底板管理控制器”。
“IPMI Version”( IPMI 版本)
智能平台管理接口 (IPMI) 版本。
“Number of Possible Active Sessions”( 可能激活的会话数)
同时可激活的最大会话数。
“Number of Current Active Sessions”( 目前激活的会话数)
目前激活的总会话数。
“Firmware Version”( 固件版本)
BMC 固件版本。
“LAN Enabled”( LAN 已启用)
LAN 已启用或 LAN 已禁用。
使用系统事件日志 (SEL)
SEL 日志 页显示 managed system 上发生的系统重要事件。
要查看系统事件日志,请执行以下步骤:
在系统 树中单击“ System ”( 系统) 。
单击“ Logs ”( 日志 ) 选项卡,然后单击“ System Event Log ”( 系统事件日志 ) 。
系统事件日志 页显示事件严重性并提供其他信息,如表 5-6 所示。
单击相应的“System Event Log”(系统事件日志) 页按钮继续(参阅表 5-7 )。
表 5-6. 状况指示器图标
图标/类别
说明
绿色复选标记表示健康(正常)状况。
黄色带有感叹号的三角表示警告(不严重)状况。
红色 X 表示严重(故障)状况。
问号图标指示状态未知。
日期/时间
事件发生的日期和时间。如果日期为空白,则事件发生在系统引导时。格式为 mm/dd/yyyy hh:mm:ss,按照 24 小时表示。
说明
事件的简要说明
表 5-7. SEL 页按钮
按钮
操作
“Print”(打印)
按窗口中显示的排序顺序打印 SEL 。
“Clear Log”(清除日志)
清除 SEL 。
注: “ Clear Log”( 清除日志) 按钮仅当具有“ Clear Logs”( 清除日志) 权限时显示。
“Save As”(另存为)
打开一个弹出窗口,使您能够将 SEL 保存到所选的目录。
注: 如果正在使用 Internet Explorer 并且在保存时遇到问题,请确保下载 Internet Explorer 的累积安全更新,下载位置是 Microsoft 支持网站 support.microsoft.com。
“Refresh”(刷新)
重新载入 SEL 页。
查看上次系统崩溃屏幕
注意: 上次崩溃屏幕功能要求 managed system 配置了 Server Administrator 中的“ Auto Recovery”( 自动恢复) 功能。此外,确保使用 DRAC 启用了“ Automated System Recovery”( 自动系统恢复) 功能。导航至“ Remote Access”( 远程访问) 部分中“ Configuration”( 配置) 选项卡下“ Services”( 服务) 页以启用此功能。
上次崩溃屏幕 页显示最近的崩溃屏幕,包含系统崩溃前发生的事件的信息。上次系统崩溃信息保存在 DRAC 5 内存中并且可以远程访问。
要查看上次崩溃屏幕 页,请执行以下步骤:
在系统 树中单击“ System ”( 系统) 。
单击“ Logs ”( 日志 ) 选项卡,然后单击“ Last Crash ”( 上次崩溃 ) 。
上次崩溃屏幕 页提供屏幕右上角的以下按钮(参阅表 5-8 ):
表 5-8. 上次崩溃屏幕页按钮
按钮
操作
“Print”(打印)
打印上次崩溃屏幕 页。
“ Save ”( 保存 )
打开一个弹出窗口,使您能够将上次崩溃屏幕保存到所选的目录。
“ Delete ”( 删除 )
删除上次崩溃屏幕 页。
“Refresh”(刷新)
重新载入上次崩溃屏幕 页。
注: 由于自动恢复计时器的波动,当系统重设计时器设置为小于 30 秒时上次崩溃屏幕 可能无法捕获。使用 Server Administrator 或 IT Assistant 将系统重设计时器设置为至少 30 秒,并确保上次崩溃屏幕 运行正常。请参阅“配置 Managed System 以捕获上次崩溃屏幕” 了解其它信息。
使用 RAC 日志
RAC 日志 是 DRAC 5 固件中的一个持续日志。日志中的列表记录了用户操作(比如登录、注销和安全策略更改)以及由 DRAC 5 发出的警报。当日志记录满后,会将最旧的条目覆盖掉。
要访问 RAC 日志,请执行以下步骤:
在系统 树中单击“ Remote Access ” ( 远程访问 ) 。
单击“ Logs ”( 日志 ) 选项卡,然后单击“ RAC Log ”( RAC 日志 ) 。
RAC 日志 提供表 5-9 中的信息。
表 5-9. RAC 日志页信息
字段
说明
日期/时间
日期和时间(例如 Dec 19 16:55:47)。
当 DRAC 5 最初启动并且无法与 managed system 通信时,时间将会显示为系统引导。
源
引起事件的接口。
说明
DRAC 5 中记录的事件和用户名的简要说明。
使用 RAC 日志页按钮
RAC 日志 页提供以下按钮(参阅表 5-10 )。
表 5-10. RAC 日志按钮
按钮
操作
“Print”(打印)
打印“RAC Log”(RAC 日志) 页。
“Clear Log”(清除日志)
清除“RAC Log”(RAC 日志) 条目。
注: “ Clear Log”( 清除日志) 按钮仅当具有“ Clear Log”( 清除日志) 权限时显示。
“Save As”(另存为)
打开一个弹出窗口,使您能够将“RAC Log”(RAC 日志) 保存到所选的目录。
注: 如果正在使用 Internet Explorer 并且在保存时遇到问题,请确保下载 Internet Explorer 的累积安全更新,下载位置是 Microsoft 支持网站 support.microsoft.com。
“Refresh”(刷新)
重新载入“RAC Log”(RAC 日志) 页。
使用诊断控制台
DRAC 5 提供一组标准网络诊断工具(参阅表 5-11 ),与基于 Microsoft® Windows® 或 Linux 的系统提供的工具类似。使用 DRAC 5 基于 Web 的接口,可以访问网络调试工具。
要访问诊断控制台 页,请执行以下步骤:
在系统 树中单击“ Remote Access ” ( 远程访问 ) 。
单击“ Diagnostics ”( 诊断 ) 选项卡。
表 5-11 说明诊断控制台 页上可用的选项。键入命令并单击“ Submit ”( 提交 ) 。调试结果显示在诊断控制台 页中。
要刷新诊断控制台 页,请单击“ Refresh ”( 刷新 ) 。要执行其他命令,请单击“ Go Back to Diagnostics Page ”( 退回到诊断页 ) 。
表 5-11. 诊断命令
命令
说明
arp
显示地址解析协议 (ARP) 表的内容。ARP 条目不能添加或删除。
ifconfi
显示网络接口表的内容。
netstat
打印路由选择表的内容。如果在 NetStat 选项右边的文本字段中提供可选接口号,NetStat 将输出与通过该接口的通信量有关的其它信息、缓冲区的使用情况以及其它网络接口信息。
ping <IP 地址 >
是否可以使用当前路由选择表的内容从 DRAC 5 访问验证目标 IP 地址。必须在该选项右侧的字段中输入目标 IP 地址。根据当前的路由选择表内容,将 Internet 控制报文协议 (ICMP) 回音数据包发送到目标 IP 地址。
gettracelog
显示 DRAC 5 跟踪日志。有关详情请参阅“gettracelog” 。
排除网络故障
内部 DRAC 5 跟踪日志可以由管理员用来调试 DRAC 5 警报或联网。可以从 DRAC 5 基于 Web 的界面访问跟踪日志,方法是单“ Diagnostics ” ( 诊断 ) 选项卡,键入 gettracelog 命令,或键入 racadm gettracelog 命令。有关详情请参阅“gettracelog” 。
跟踪日志跟踪以下信息:
DHCP – 跟踪发送到 DHCP 服务器和从 DHCP 服务器接收的信息包。
IP – 跟踪发送和接收的 IP 信息包。
跟踪日志还可能包含 DRAC 5 固件特定的错误代码,与内部 DRAC 5 固件有关,而不是 managed system 的操作系统。
注: DRAC 5 不会回送信息包大小超过 1500 字节的 ICMP (ping)。
排除警报故障
可以使用记录的 SNMP 陷阱信息来排除特定类型的 DRAC 5 警报故障。默认情况下,SNMP 陷阱传输将记录在跟踪日志中。但是,由于 SNMP 并不确认陷阱的传输,因此请使用网络分析器或 Microsoft 的 snmputil 等工具跟踪 managed system 中的信息包。
返回目录页