Nothing Special   »   [go: up one dir, main page]

CN104809044A - 基板管理控制器启动状态检测方法及系统 - Google Patents

基板管理控制器启动状态检测方法及系统 Download PDF

Info

Publication number
CN104809044A
CN104809044A CN201410034384.9A CN201410034384A CN104809044A CN 104809044 A CN104809044 A CN 104809044A CN 201410034384 A CN201410034384 A CN 201410034384A CN 104809044 A CN104809044 A CN 104809044A
Authority
CN
China
Prior art keywords
bmc
response value
value
remote management
management console
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410034384.9A
Other languages
English (en)
Inventor
孙阿南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN201410034384.9A priority Critical patent/CN104809044A/zh
Publication of CN104809044A publication Critical patent/CN104809044A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种基板管理控制器启动状态检测方法,包括:控制远程管理控制台发送自身状态检测指令至基板管理控制器BMC;判断远程管理控制台是否在一个预设时间内接收到来自BMC的回应值;当远程管理控制台在所述预设时间内接收到回应值时,判断所述回应值是否为一个预设值;当所述回应值为所述预设值时,判定BMC为正常启动;当所述回应值不为所述预设值时,判定BMC为非正常启动;及当远程管理控制台在所述预设时间内没有接收到回应值时,判定BMC启动失败。本发明还提供一种基板管理控制器启动状态检测系统。本发明通过远程管理控制台来实现基板管理控制器启动状态的及时检测。

Description

基板管理控制器启动状态检测方法及系统
技术领域
本发明涉及一种基板管理控制器检测方法及系统,尤其是涉及一种检测基板管理控制器的启动状态的方法及系统。
背景技术
目前在服务器机柜(例如机架式机柜)开机时,机柜每片主板开机启动过程中,如果主板的基板管理控制器(Baseboard Management Controller,BMC)启动失败,主板无法及时报告该处异常,且BIOS(Basic Input Output System,基本输入输出系统)不会采取任何措施。此时,需要维护人员来了解BMC初始化出现的问题。当今的服务器架构多采用总体电源供电和风扇墙调节服务器机柜温度,而电力的消耗和温度大小这些数据均由远程管理控制台(Remote Management Console,RMC)在BMC正常启动后收集,若BMC在启动过程中缺乏必要的监控手段,则BMC在启动过程中当机时,会对服务器机柜的稳定性和安全性产生严重的影响。
发明内容
鉴于以上内容,有必要提供一种基板管理控制器启动状态检测方法及系统,可以通过远程管理控制台来实现BMC启动状态的及时检测。
一种基板管理控制器启动状态检测方法,应用于服务器机柜中,该方法包括步骤:(a)控制远程管理控制台发送自身状态检测指令至基板管理控制器BMC,该自身状态检测指令用于控制BMC在启动过程中返回一个回应值至远程管理控制台;(b)判断远程管理控制台是否在一个预设时间内接收到回应值;(c)当远程管理控制台在所述预设时间内接收到回应值时,判断所述回应值是否为一个预设值;(d)当所述回应值为所述预设值时,判定BMC为正常启动;(e)当所述回应值不为所述预设值时,判定BMC为非正常启动;及(f)当远程管理控制台在所述预设时间内没有接收到回应值时,判定BMC启动失败。
一种基板管理控制器启动状态检测系统,运行于服务器机柜中,该系统包括:控制模块,用于控制远程管理控制台发送自身状态检测指令至基板管理控制器BMC,该自身状态检测指令用于控制BMC在启动过程中返回一个回应值至远程管理控制台;判断模块,用于判断远程管理控制台是否在一个预设时间内接收到回应值;所述判断模块,还用于当远程管理控制台在所述预设时间内接收到回应值时,判断所述回应值是否为一个预设值;状态判定模块,用于当所述回应值为所述预设值时,判定BMC为正常启动;所述状态判定模块,还用于当所述回应值不为所述预设值时,判定BMC为非正常启动;及所述状态判定模块,还用于当远程管理控制台在所述预设时间内没有接收到回应值时,判定BMC启动失败。
相较于现有技术,利用本发明所提供的基板管理控制器启动状态检测方法及系统,可以控制远程管理控制台发送自身状态检测指令至BMC,并根据BMC的回应值来确定BMC的启动状态,以实现BMC启动状态的及时检测,从而提高了服务器机柜的稳定性和安全性。
附图说明
图1是本发明基板管理控制器启动状态检测系统较佳实施例的硬件架构图。
图2是本发明基板管理控制器启动状态检测系统较佳实施例的功能模块图。
图3是本发明基板管理控制器启动状态检测方法较佳实施例的作业流程图。
主要元件符号说明
服务器机柜 100
基板管理控制器启动状态检测系统 10
控制模块 11
判断模块 12
状态判定模块 13
提示模块 14
远程管理控制台 20
闪存 21
主板 30
基板管理控制器 31
存储设备 40
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
参阅图1所示,是本发明基板管理控制器启动状态检测系统较佳实施例的硬件架构图。该基板管理控制器启动状态检测系统10运行于服务器机柜100中,该服务器机柜100可以是机架式(Rack Mount)机柜等。该服务器机柜100还包括部件,如远程管理控制台(Remote Management Console,RMC)20、多个主板30及存储设备40。服务器机柜100的部件10-40通过系统总线进行通信。
每个主板30包括一个基板管理控制器(Baseboard Management Controller,BMC)31,该BMC31用于监控服务器机柜100的电力消耗及温度大小。所述BMC31与远程管理控制台20通过智能平台管理接口(Intelligent Platform Management Interface,IPMI)或I2C(Inter-Integrated Circuit)总线连接。所述远程管理控制台20用于发送自身状态检测(Get Self Test Result)指令至主板30,以使BMC31在启动过程中返回一个回应值。此时,BMC31的启动状态不同,BMC31所产生的回应值不同,例如,当BMC31为正常启动时,回应值为一个预设值(例如55h),当BMC31为非正常启动时,回应值为不是所述预设值的值(例如57h或58h),当BMC31启动失败时,无回应值。
所述远程管理控制台20包括闪存21,该闪存21用于存储BMC31在启动失败或非正常启动时所产生的系统事件日志(System Event Log,SEL)。该SEL用于记录BMC31在非正常启动及启动失败时的错误信息,该错误信息包括时间、错误原因等。所述存储设备40用于存储BMC31在非正常启动时,其返回值与错误类型的对应关系,例如,当返回值为57h时,错误类型为不可获得数据或设备,当返回值为58h时,错误类型为需要更换或修复的硬件致命错误。
所述基板管理控制器启动状态检测系统10用于控制远程管理控制台20发送自身状态检测指令至BMC31,并根据BMC31的回应值来实现BMC31启动状态的检测。
参阅图2所示,是本发明基板管理控制器启动状态检测系统较佳实施例的功能模块图。该基板管理控制器启动状态检测系统10包括控制模块11、判断模块12、状态判定模块13及提示模块14。模块11-14包括计算机化程序指令。
在服务器机柜100开机时,控制模块11用于控制远程管理控制台20发送自身状态检测指令至BMC31,其中,该自身状态检测指令用于控制BMC31在启动过程中返回一个回应值至远程管理控制台20。在本较佳实施例中,对应BMC31的启动状态不同,BMC31所产生的回应值不同。
判断模块12用于判断远程管理控制台20是否在一个预设时间内接收到回应值。所述预设时间由服务器机柜100的性能决定,如为45秒。
所述判断模块12还用于当远程管理控制台20在所述预设时间内接收到回应值时,判断该回应值是否为所述预设值。该预设值由BMC31所支持的行业标准决定,如为55h。
状态判定模块13用于当所述回应值为所述预设值时,判定BMC31为正常启动。
所述状态判定模块13还用于当所述回应值不为所述预设值时,判定BMC31为非正常启动,根据存储设备40中存储的返回值与错误类型的对应关系来确定BMC31的错误类型,并将该错误类型及BMC31所产生的SEL存储至远程管理控制台20的闪存21中。
所述状态判定模块13还用于当远程管理控制台20在所述预设时间内没有接收到回应值时,判定BMC31启动失败,并将BMC31所产生的SEL存储至远程管理控制台20的闪存21中。
提示模块14用于控制服务器机柜100显示提示信息,以提示BMC31的启动状态。所述提示信息可以为服务器机柜100的显示屏幕所显示的文字,或服务器机柜100上的发光器件所显示的不同颜色等。
本发明控制远程管理控制台20发送自身状态检测指令至BMC31,并根据BMC31的返回值来判定BMC31的启动状态,在BMC31为非正常启动或启动失败时,提供SEL予维护人员进行分析,从而可以实现BMC31启动过程中错误的快速确定,提高了服务器机柜的稳定性和安全性。
参阅图3所示,是本发明基板管理控制器启动状态检测方法较佳实施例的流程图。
步骤S10,在服务器机柜100开机时,控制模块11控制远程管理控制台20发送自身状态检测指令至BMC31,该自身状态检测指令用于控制BMC31在启动过程中返回一个回应值至远程管理控制台20。
步骤S20,判断模块12判断远程管理控制台20是否在一个预设时间内接收到回应值。当远程管理控制台20在所述预设时间内接收到回应值时,执行步骤S30,否则,执行步骤S60。
步骤S30,判断模块12判断该回应值是否为所述预设值。当该回应值为所述预设值时,执行步骤S40,否则,执行步骤S50。
步骤S40,状态判定模块13判定BMC31为正常启动。
步骤S50,状态判定模块13判定BMC31为非正常启动,根据存储设备40中存储的返回值与错误类型的对应关系来确定BMC31的错误类型,并将该错误类型及BMC31所产生的SEL存储至远程管理控制台20的闪存21中。
步骤S60,状态判定模块13判定BMC31启动失败,并将BMC31所产生的SEL存储至远程管理控制台20的闪存21中。
步骤S70,提示模块14控制服务器机柜100显示提示信息,以提示BMC31的启动状态。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照以上较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种基板管理控制器启动状态检测方法,应用于服务器机柜中,其特征在于,该方法包括:
控制步骤:控制远程管理控制台发送自身状态检测指令至基板管理控制器BMC,该自身状态检测指令用于控制BMC在启动过程中返回一个回应值至远程管理控制台;
第一判断步骤:判断远程管理控制台是否在一个预设时间内接收到回应值;
第二判断步骤:当远程管理控制台在所述预设时间内接收到回应值时,判断所述回应值是否为一个预设值;
第一状态判定步骤:当所述回应值为所述预设值时,判定BMC为正常启动;
第二状态判定步骤:当所述回应值不为所述预设值时,判定BMC为非正常启动;及
第三状态判定步骤:当远程管理控制台在所述预设时间内没有接收到回应值时,判定BMC启动失败。
2.如权利要求1所述的基板管理控制器启动状态检测方法,其特征在于,还包括提示步骤:
控制服务器机柜显示提示信息以提示BMC的启动状态。
3.如权利要求1所述的基板管理控制器启动状态检测方法,其特征在于,所述第二状态判定步骤还包括:
根据返回值与错误类型的对应关系确定BMC的错误类型,并将该错误类型及BMC所产生的系统事件日志存储至远程管理控制台的闪存中。
4.如权利要求1所述的基板管理控制器启动状态检测方法,其特征在于,所述第三状态判定步骤还包括:
将BMC所产生的系统事件日志存储至远程管理控制台的闪存中。
5.如权利要求1所述的基板管理控制器启动状态检测方法,其特征在于,所述BMC的启动状态不同,BMC所产生的回应值不同,当BMC为正常启动时,回应值为所述预设值,当BMC为非正常启动时,回应值为不是所述预设值的值,当BMC启动失败时,无回应值。
6.一种基板管理控制器启动状态检测系统,运行于服务器机柜中,其特征在于,该系统包括:
控制模块,用于控制远程管理控制台发送自身状态检测指令至基板管理控制器BMC,该自身状态检测指令用于控制BMC在启动过程中返回一个回应值至远程管理控制台;
判断模块,用于判断远程管理控制台是否在一个预设时间内接收到回应值;
所述判断模块,还用于当远程管理控制台在所述预设时间内接收到回应值时,判断所述回应值是否为一个预设值;
状态判定模块,用于当所述回应值为所述预设值时,判定BMC为正常启动;
所述状态判定模块,还用于当所述回应值不为所述预设值时,判定BMC为非正常启动;及
所述状态判定模块,还用于当远程管理控制台在所述预设时间内没有接收到回应值时,判定BMC启动失败。
7.如权利要求6所述的基板管理控制器启动状态检测系统,其特征在于,该系统还包括:
提示模块,用于控制服务器机柜显示提示信息以提示BMC的启动状态。
8.如权利要求6所述的基板管理控制器启动状态检测系统,其特征在于,所述状态判定模块还用于当所述回应值不为所述预设值时,根据返回值与错误类型的对应关系确定BMC的错误类型,并将该错误类型及BMC所产生的系统事件日志存储至远程管理控制台的闪存中。
9.如权利要求6所述的基板管理控制器启动状态检测系统,其特征在于,所述状态判定模块还用于当远程管理控制台在所述预设时间内没有接收到回应值时,将BMC所产生的系统事件日志存储至远程管理控制台的闪存中。
10.如权利要求6所述的基板管理控制器启动状态检测系统,其特征在于,所述BMC的启动状态不同,BMC所产生的回应值不同,当BMC为正常启动时,回应值为所述预设值,当BMC为非正常启动时,回应值为不是所述预设值的值,当BMC启动失败时,无回应值。
CN201410034384.9A 2014-01-24 2014-01-24 基板管理控制器启动状态检测方法及系统 Pending CN104809044A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410034384.9A CN104809044A (zh) 2014-01-24 2014-01-24 基板管理控制器启动状态检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410034384.9A CN104809044A (zh) 2014-01-24 2014-01-24 基板管理控制器启动状态检测方法及系统

Publications (1)

Publication Number Publication Date
CN104809044A true CN104809044A (zh) 2015-07-29

Family

ID=53693889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410034384.9A Pending CN104809044A (zh) 2014-01-24 2014-01-24 基板管理控制器启动状态检测方法及系统

Country Status (1)

Country Link
CN (1) CN104809044A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106130815A (zh) * 2016-06-15 2016-11-16 乐视控股(北京)有限公司 板级测试方法及装置
CN106411643A (zh) * 2016-09-22 2017-02-15 杭州昆海信息技术有限公司 Bmc检测方法以及装置
CN106547660A (zh) * 2015-09-23 2017-03-29 鸿富锦精密工业(深圳)有限公司 基板管理控制器状态侦测系统及方法
CN109766110A (zh) * 2018-12-27 2019-05-17 联想(北京)有限公司 一种控制方法、基板管理控制器及控制系统
CN111475218A (zh) * 2020-04-26 2020-07-31 中国长城科技集团股份有限公司 一种服务器的开机方法、服务器及计算机可读存储介质
CN111813600A (zh) * 2020-06-29 2020-10-23 中国长城科技集团股份有限公司 一种控制器的恢复方法、装置、终端和介质
CN112084049A (zh) * 2019-06-14 2020-12-15 佛山市顺德区顺达电脑厂有限公司 用于监控基板管理控制器的常驻程序的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547660A (zh) * 2015-09-23 2017-03-29 鸿富锦精密工业(深圳)有限公司 基板管理控制器状态侦测系统及方法
CN106130815A (zh) * 2016-06-15 2016-11-16 乐视控股(北京)有限公司 板级测试方法及装置
CN106130815B (zh) * 2016-06-15 2020-01-17 乐融致新电子科技(天津)有限公司 板级测试方法及装置
CN106411643A (zh) * 2016-09-22 2017-02-15 杭州昆海信息技术有限公司 Bmc检测方法以及装置
CN109766110A (zh) * 2018-12-27 2019-05-17 联想(北京)有限公司 一种控制方法、基板管理控制器及控制系统
CN112084049A (zh) * 2019-06-14 2020-12-15 佛山市顺德区顺达电脑厂有限公司 用于监控基板管理控制器的常驻程序的方法
CN111475218A (zh) * 2020-04-26 2020-07-31 中国长城科技集团股份有限公司 一种服务器的开机方法、服务器及计算机可读存储介质
CN111813600A (zh) * 2020-06-29 2020-10-23 中国长城科技集团股份有限公司 一种控制器的恢复方法、装置、终端和介质

Similar Documents

Publication Publication Date Title
CN104809044A (zh) 基板管理控制器启动状态检测方法及系统
US8886998B2 (en) Server and power supply test method
US10157115B2 (en) Detection system and method for baseboard management controller
US20150113309A1 (en) Rogue Hardware Detection Through Power Monitoring
US8751868B2 (en) Control server and method for switching running of test programs stored in multiple storage mediums of test server
TWI541643B (zh) 確定電源供應模組的故障狀態
CN106055440A (zh) 一种通过bmc实现服务器异常断电的测试方法及系统
EP2835716A1 (en) Information processing device and virtual machine control method
TW201506613A (zh) 固件檢測系統及方法
US9727104B2 (en) Various PSUs adaptive server and method
CN105425932A (zh) 一种整机柜服务器电源的管理方法及系统
TWI486761B (zh) 機櫃伺服器系統及其檢測方法
TW201516672A (zh) 伺服器監控系統及方法
JP2008225929A (ja) 情報処理装置
JP2009133253A (ja) ポンプ運転制御システム
CN108449225B (zh) 确定和修复网络连接问题的系统和方法
TW201516665A (zh) 伺服器之系統錯誤資訊偵測系統及方法
US10507162B2 (en) Massage bathing maintenance system and maintenance method of the same
US7782217B2 (en) System and method for monitoring motor
CN107391324B (zh) 一种存储系统的测试控制装置及方法
CN106254104B (zh) 一种安装状态的获取方法及装置
JP2020052956A (ja) Bmc、判定方法及びbmcファームウェア
CN115687021A (zh) 一种服务器内存部署方法及服务器
CN104598337A (zh) 服务器开关机测试方法及系统
TW201535109A (zh) 基板管理控制器啟動狀態檢測方法及系統

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150729

WD01 Invention patent application deemed withdrawn after publication