Nothing Special   »   [go: up one dir, main page]

TW201714432A - 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體 - Google Patents

管理方法、服務控制器裝置以及非暫態電腦可讀取媒體 Download PDF

Info

Publication number
TW201714432A
TW201714432A TW104144170A TW104144170A TW201714432A TW 201714432 A TW201714432 A TW 201714432A TW 104144170 A TW104144170 A TW 104144170A TW 104144170 A TW104144170 A TW 104144170A TW 201714432 A TW201714432 A TW 201714432A
Authority
TW
Taiwan
Prior art keywords
network
physical layer
layer device
controller
server
Prior art date
Application number
TW104144170A
Other languages
English (en)
Other versions
TWI618380B (zh
Inventor
周樂生
施思勤
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW201714432A publication Critical patent/TW201714432A/zh
Application granted granted Critical
Publication of TWI618380B publication Critical patent/TWI618380B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0618Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on the physical or logical position
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一種服務控制器裝置,包括:一個或者多個網路介面,用以與伺服器中之其它裝置進行通信;一處理器,耦接至網路介面,以及適用於處理一個或者多個處理程序;一記憶體,用以儲存可由處理器執行之複數指令。當指令透過處理器執行時,使得處理器執行之複數操作包括:監控伺服器中之實體層裝置以及與實體層裝置連接之至少一網路連接器,其中實體層裝置用以於至少一媒體存取控制器以及網路連接器之間交換數據;判斷實體層裝置之狀態或者網路連接器之狀態以指示警示或者故障;以及傳輸對應於警示或者故障之警示訊號至機櫃管理控制器。

Description

管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
本發明係有關於一種包括伺服器系統之網路系統,特別係有關於一種經改良之伺服器系統診斷以及監測。
網路服務(例如雲端運算服務)之需求日益增長係反映著產業之轉移,企業以及消費者同樣地皆可於遠端伺服器上儲存、管理或者以其他方式存取大量之數據。遠端伺服器通常設置於一個或者多個數據中心內。數據中心係可設置包括其相應之硬體或者軟體元件之數百甚至數千個遠端伺服器。而數量眾多之硬體或者軟體元件以及其可能之配置往往造成每個數據中心內裝置網路之複雜。因此,裝置網路之複雜往往使得錯誤或者故障(failure)之根本原因難以被快速地以及有效地辨識以及排除。
本發明係提供一個或者多個診斷技術之實施例。於一實施例中,診斷技術係提供計算機裝置(例如設置於數據 中心內之伺服器)新的網路介面配置。診斷技術更透過新的網路介面配置提供服務控制器給對應之伺服器以監控網路條件,例如包括與實體層裝置相關之參數、網路介面之網路連接等等。透過上述之方式,診斷技術可有效率地量測各種伺服器之條件,並可快速地辨識潛在之網路問題,包括錯誤、故障等等。
舉例來說,根據本發明另一實施例,一伺服器係包括一服務控制器,例如一基板管理控制器(baseboard management controller,BMC),可用於監控伺服器中一實體層(physical layer,PHY)裝置以及與實體層裝置連接之至少一網路連接器/網路電纜。一般而言,實體層裝置用以於至少一媒體存取控制器(Media Access Controller,MAC)以及至少一網路連接器/網路電纜之間交換數據。透過上述之方式,實體層裝置可自平台路徑控制器(Platform Controller Hub,PCH)中獨立出來。平台路徑控制器可包括嵌入式媒體存取控制器電路/裝置。基板管理控制器更可判斷實體層裝置之狀態或者至少一網路連接器/網路電纜之狀態以指示至少一警示或者故障,並傳送對應於至少一警示或者故障之警示訊號至一機櫃管理控制器(rack management controller,RMC)。機櫃管理控制器可自一伺服器機櫃中對應於每個伺服器之每個基板管理控制器蒐集上述警示訊號,並經由一通信網路提供警示訊號給一遠端管理員。
值得注意的是,於一些實施例中,基板管理控制器係透過一內部整合電路(Inter Integrated Circuit,I2C)通信頻 道監控對應於實體層裝置以及至少一網路連接器/網路電纜之網路參數。
於其它實施例中,基板管理控制器可透過一內部整合電路通信頻道於乙太網路之10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者中初始化實體層裝置。另外,基板管理控制器亦可使用一基板自動協商協定(backplane auto-negotiation protocol)於實體層裝置以及至少一媒體存取控制器之間配置一網路介面。同樣地,網路介面可用以操作於乙太網路之10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者中。
於另一實施例中,當基板管理控制器判斷實體層裝置之狀態或者網路連接器/網路電纜之狀態時,基板管理控制器監控對應於實體層裝置或者至少一網路連接器/網路電纜之一個或者多個網路參數。於上述實施例中,基板管理控制器亦可接收用以定義警示、故障、錯誤等等之閥值條件(例如接收自機櫃管理控制器)。基板管理控制器可透過比較網路參數以及閥值條件以判斷狀態並接著傳送相應之警示訊號。
本發明一個或者多個實施例之細節係描述於以下之圖式以及敘述中。本發明之其它特徵、樣式以及潛在優點將描述於後附之說明書、圖式、以及申請專利範圍中。
100‧‧‧示意圖
105‧‧‧數據中心
110‧‧‧伺服器機櫃
115‧‧‧伺服器
116‧‧‧機櫃管理控制器(RMC)
120‧‧‧中央處理器(CPU)
125‧‧‧基板管理控制器(BMC)
130‧‧‧網路裝置
135‧‧‧感應器
140‧‧‧硬體儲存裝置
145‧‧‧管理員
150‧‧‧網路
201、202‧‧‧習知伺服器配置
205‧‧‧平台路徑控制器
210‧‧‧實體層裝置
215‧‧‧網路連接器
220‧‧‧網路介面控制器/特殊應用積體電路裝置
300‧‧‧網路裝置
310‧‧‧網路介面
320‧‧‧處理器
330‧‧‧服務控制器
340‧‧‧記憶體
342‧‧‧作業系統
344‧‧‧診斷監控程序/服務
345‧‧‧數據結構
350‧‧‧匯流排
400‧‧‧伺服器配置
500、600‧‧‧流程圖
505~540、605~640‧‧‧步驟流程
有關本發明之示範實施例請配合圖式參考,其中在整篇說明書中,類似的元件係以類似的標號表示。於接下來之敘述中,目的在於提出具體之細節以幫助了解本發明之內容。必須了解的是,上述之敘述與以下之詳述僅為本發明之示範以及說明,並非用來限制本發明所主張之專利範圍。可藉由結合附圖以及附加之特徵以及細節可描述以及解釋本發明之原理,其中:第1圖係顯示根據本發明一實施例所述之數據中心之示意圖;第2A、2B圖係顯示根據習知伺服器配置之示意圖;第3圖係顯示根據本發明一實施例所述之網路裝置示例之方塊圖;第4圖係顯示根據本發明一實施例所述之新的伺服器配置之方塊圖;第5圖係顯示根據本發明一實施例所述之伺服器系統中用以診斷監測之簡化流程,特別係使用於如第4圖中所述之新的伺服器配置中之一個或者多個裝置;以及第6圖係顯示根據本發明另一實施例所述之伺服器系統中用以診斷監測之簡化流程。
下文係揭露本發明各個實施例,並配合所附圖式,作詳細說明如下。熟悉此技藝之人士可利用這些實施例或其他實施例所描述之細節及其他可利用之元件以及配置,在不 離開本發明之精神與範圍之下以實施發明。
如前所述,數據中心可設置包括各種硬體以及軟體元件(例如微處理器、開關、路由器、儲存裝置、儲存適配器、記憶體模塊、電源供應器、風扇等等)之數百甚至數千個伺服器或者伺服器系統。這些伺服器(以及硬體/軟體元件)通常用以構成複雜之網路(例如網路之骨架等等),並可提供複數應用程式和/或平台(例如網路伺服器、郵件伺服器、數據庫伺服器等等)。一般而言,於每個數據中心內,多個伺服器係設置於一個或者多個實體機殼或者機櫃(通常被稱為伺服器機櫃)中。
舉例來說,第1圖係顯示根據本發明一實施例所述之數據中心105之示意圖100。數據中心105包括多個伺服器機櫃110,其中每個伺服器機櫃110包括一個或者多個如同伺服器115之伺服器。如圖所示,位於每個伺服器機櫃110中之伺服器通常係透過機櫃管理控制器(rack management controller,RMC)116(例如位於一伺服器網路中)進行管理。此外,伺服器機櫃110中之機櫃管理控制器116可包括一獨立之伺服器或者控制裝置。
伺服器115係特別包括各種元件,例如一個或者多個中央處理器120(central processing unit,CPU)、服務微控制器模組或者裝置、感應器135、以及硬體儲存裝置140。服務微控制器模組或者裝置包括基板管理控制器125(baseboard management controller,BMC))以及一個或者多個網路裝置130(例如PCIe(Peripheral Component Interconnect Express)擴充 卡(add-on card)、PCI仲介承載板(Mezzanine Card)等等)。可以理解的是,前述之伺服器115僅作為描述以及討論之目的,並非用以限制本發明。此外,本領域技術人員亦可理解本發明更可包括或者不包括其它不同之硬體和/或軟體元件(未顯示)。
中央處理器120可包括複數個核心,並可作為伺服器115之主要處理器。此外,在此所述之基板管理控制器125和/或網路裝置130可獨立操作於中央處理器120外。舉例來說,基板管理控制器125可獨立地與特定伺服硬體(例如感應器135)進行通信,並監控中央伺服器之狀態或者參數。網路裝置130亦可讀立操作於中央處理器120外,並可與基板管理控制器125進行通信。
基板管理控制器125可操作性地包括嵌於每個伺服器之主機板上之專用微控制器(微處理器)(在此即為伺服器115),以及用以管理各種伺服器操作以及監控伺服器之狀況。舉例來說,基板管理控制器125可提供介於系統管理軟體以及平台硬體之間之介面。本領域技術人員皆可了解本發明中所述之介面可以為通信頻道或者通信媒介。
此外,基板管理控制器125可構成一智慧平台管理介面(Intelligent Platform Management Interface,IPMI)之一部分,用以代表系統監控以及事件恢復之標準。上述標準係定義一使用共同訊息之介面,用以存取伺服器中可管理之功能。智慧平台管理介面特別包括預設指令,用以讀取溫度、電壓、風扇速度、機櫃防盜(chassis intrusion)、以及其它參數。系統事件日誌、硬體式看門狗(hardware watchdog)、以及功率控制亦 可透過智慧平台管理介面進行存取,並由基板管理控制器125提供。一般而言,伺服器主機係將智慧平台管理介面訊息透過LPC(Low Pin Count)匯流排轉移至基板管理控制器,以及一些裝置通道係建立於LPC匯流排上以作為轉移訊息之用途(例如鍵盤控制器規格(Keyboard Controller Style,KCS)介面、字組(Block Transfer)介面等)。基板管理控制器125可管理智慧平台管理介面之監測以及控制維護功能(例如電源週期、警示訊號之發佈等等)。此外,基板管理控制器125可提供其他功能,例如包括SuperIO、SOL(Serial-over-LAN)、系統基本輸入/輸出系統(BIOS)檢修、視頻圖像(例如視頻圖像適配器(Video Graphics Adapter,VGA),用以嵌於基板管理控制器125中以顯示輸出)、以及遠端管理。
關於遠端管理,可理解的是由於系統以及元件之數量眾多,使得數據中心之管理(例如監控、維修等)變得困難。因此,基板管理控制器125可透過網路將每個伺服器之遠端管理提供給管理員。值得注意的是,基板管理控制器125通常係與機櫃管理控制器116同時運作以藉由一個或者多個管理員提供遠端管理。如圖所示,遠端管理係透過網路150提供給管理員145。管理員145通常透過網路150利用遠端管理控制協定(Remote Management Control Protocol,RMCP)與機櫃管理控制器116和/或基板管理控制器125進行通信。透過上述之方式,機櫃管理控制器116和/或基板管理控制器125可透過網路150接收相應於對應伺服器115和/或監控感應器135之數據或者狀態之命令和/或請求,並透過網路150傳送警示訊號(例如當監控 參數超過預設限制時)給管理員145。
第2A、2B圖係分別顯示習知伺服器配置201、202之示意圖。
如圖所示,伺服器配置201包括透過LPC匯流排或者介面耦接至一平台路徑控制器205(包括於系統單晶片(System on Chip,SoC)中)之基板管理控制器125。
平台路徑控制器205包括嵌入式鏈結層電路,又稱為媒體存取控制器。本領域技術人員可以理解的是,媒體存取控制器或者媒體存取控制器裝置係為用以控制網路媒介或者網路介面之存取以及於網路媒介或者網路介面上進行通信之電子電路和/或軟體模組。平台路徑控制器205亦透過一管理數據輸入/輸出(Management Data Input/Output,MDIO)介面(有時亦被稱為時序管理介面(Serial Management Interface,SMI)或者媒體獨立介面管理(Media Independent Interface Managememt,MIIM))以及一KR/KR1/KR2/KR4介面(亦被稱為乙太網路基準)連接至一外部實體層裝置(例如收發器等)。反之,實體層裝置210係透過一使用乙太網路之大頻寬介面連接至網路連接器215(例如用以提供伺服器數據通信)。值得注意的是,於伺服器配置201中實體層裝置210係為用以於平台路徑控制器205以及網路連接器215之間交換數據之外部裝置。此外,本發明所使用之”網路連接器”一詞以及作為網路連接器之網路連接器215可包括連接器、網路纜線、和/或可提供相同功能之電路。
值得注意的是,如圖所示,平台路徑控制器205亦 透過內部整合電路介面或者通信頻道連接至網路連接器215。本領域技術人員可以理解的是內部整合電路介面係提供纜線診斷協定,例如於一光纖收發模組上提供I2C EEPROM位址(A0,A2)以用於診斷之SFF-8472。
伺服器配置202係類似於伺服器配置201,用以於基板管理控制器125以及平台路徑控制器205之間提供一LPC介面。然而,伺服器配置202係使用一網路介面控制器(Network Interface Controller,NIC)/特殊應用積體電路(Application-Specific Integrated Circuit,ASIC)裝置220來傳輸數據,而不使用如伺服器配置201中所示之嵌入式媒體存取控制器電路以及獨立實體層裝置210。因此,平台路徑控制器205係透過單一PCIe介面連接至網路介面控制器/特殊應用積體電路裝置220。網路介面控制器/特殊應用積體電路裝置220係類似於實體層裝置210,用以透過使用乙太網路之介面連接至網路連接器215。此外,網路介面控制器/特殊應用積體電路裝置220更可透過內部整合電路介面連接至網路連接器215。
總而言之,習知伺服器配置201、202將診斷監控限制於伺服器115之各種硬體/軟體元件之間。具體而言,基板管理控制器125僅透過LPC介面連接至平台路徑控制器205,這將限制基板管理控制器125之網路監控功能。因此,當潛在之網路問題成為伺服器115中之根本原因或者根本來源時,可將其歸咎於任何數量之裝置。診斷之動作(例如辨識潛在網路問題之根本原因)將因為數據中心內大量之伺服器、系統、以及元件而大量增加或者加倍。
第3圖係顯示根據本發明一實施例所述使用診斷監控技術之網路裝置300之方塊圖。舉例來說,裝置300可包括任何電子裝置,例如伺服器、電腦、智慧型手機、平板電腦、其它電子裝置等。裝置300可包括一個或者多個網路介面310(例如有線、無線、LPC(Low Pin Count)、管理數據輸入/輸出(MDIO)、內部整合電路、使用乙太網路之介面等等)、至少一處理器320、至少一服務控制器330、以及一記憶體340,上述每個元件可透過至少一匯流排350互相連接。
網路介面310包含機械、電子、以及訊號電路,用以透過各種媒介傳遞數據。網路介面310可用以傳輸和/或接收使用各種不同通訊協定之數據。記憶體340包括複數由處理器320、服務控制器330、和/或網路介面310所定址之儲存位置。記憶體340儲存與本發明實施例有關之軟體程式以及數據結構345(data structures)。值得注意的是,某些裝置可能具有有限之記憶體或者不具有記憶體(例如除了儲存操作於裝置上之程式/程序以及相關之快取外,並不包含其它記憶體)。
處理器320和/或服務控制器330可包括硬體元件或者硬體邏輯,用以執行軟體程式以及處理數據架構345。作業系統342之一部分通常係常駐於記憶體340中,並透過處理器320/服務控制器330執行,用以功能性地組織裝置,除了透過軟體程序所提供之調用操作和/或裝置上所執行之服務之外。這些軟體程序和/或服務可包括診斷監控程序/服務344。當程序/服務344出現於集中式記憶體時,使得提供給程序/服務344之可選擇的示例執行程序可操作於網路介面310中(例如透過實 體層和/或媒體存取控制器電路或者裝置)。
其它處理器或者記憶體類型(包括各種電腦可讀取媒體)可用以儲存以及執行關於本發明所述之診斷技術之程式指令對本領域技術人員而言為顯而易見的。此外,儘管本發明已揭示各種程序,但本領域技術人員可明確地聯想到各種程序可實施為用以根據本發明所述之技術來進行操作(例如根據類似程序之功能來進行操作)之各種模組。以及,儘管本發明所揭示之一些程序為單獨操作,但本領域技術人員可理解上述之程序可為其它處理程序中之子程式(routine)或者模組。舉例來說,本發明所述之技術可藉由硬體、軟體、和/或韌體(例如根據本發明一實施例所述之診斷監控程序344),例如包括透過處理器320和/或服務控制器330(或者介面310之獨立處理器)所執行之電腦可執行指令,以執行對應於本發明所述之技術之功能。
第4圖係顯示根據本發明一實施例所述之新伺服器配置400之方塊圖。伺服器配置400係提供本發明所述之診斷監控技術(例如診斷監控程序344)。如前所述,習知伺服器配置201、202係將診斷監控限制於對應之伺服器中。然而,可以理解的是現在的伺服器越來越多係提供與第2A圖類似之伺服器配置,例如包括具有嵌入式媒體存取控制器電路/軟體之平台路徑控制器以及負責處理伺服器或者網路流量之外部實體層裝置。
新的伺服器配置400係提供與基板管理控制器125、實體層裝置210、以及網路連接器215連接之內部整合電 路網路介面。在新的伺服器配置400中,基板管理控制器125可對每個實體層裝置210以及網路連接器215執行診斷監控以偵測伺服器115中潛在之網路問題。透過上述之方式,基板管理控制器125可快速地辨識出潛在網路問題之根本原因,並回報該網路問題給管理員。在此基板管理控制器125係透過網路150回報給管理員145。此外,對內部整合電路介面而言,新的伺服器配置400亦於平台路徑控制器205(例如媒體存取控制器電路)以及實體層210之間配置一乙太網路介面(例如KR/KR1/KR2/KR4等等)。
於操作上,新的伺服器配置400係提供額外之基板管理控制器診斷功能。具體而言,基板管理控制器125可透過新的伺服器配置400中之內部整合電路介面控制以及監控實體層裝置210以及網路連接器125。此外,基板管理控制器125更可接收和/或定義閥值條件,並透過比較監控之網路參數以及閥值條件以判斷潛在之網路問題、錯誤、故障等等。於一些實施例中,基板管理控制器125更可調整上述閥值條件(例如根據管理員145之更新、機櫃管理控制器116之更新、伺服器條件之歷史紀錄等等)。較佳的是,基板管理控制器125傳送監控之網路參數(包括警示、故障、錯誤等等)至機櫃管理控制器116。反之,機櫃管理控制器116可提供管理工具給管理員145以簡單且有效之方式透過網路150排除潛在網路問題。
第5圖係顯示根據本發明一實施例所述之伺服器系統中用以診斷監測之簡化流程500,特別係使用於如第4圖中所述之新的伺服器配置中之一個或者多個裝置(例如基板管理 控制器125和/或機櫃管理控制器116)。
第5圖係起始於步驟505,並進入步驟510,啟動伺服器(例如伺服器115)。一旦啟動伺服器,伺服器中之基板管理控制器(例如基板管理控制器125)係初始化實體層裝置(例如實體層裝置210)(步驟515)。舉例來說,基板管理控制器可利用例如新的伺服器配置400中所示之內部整合電路介面來初始化實體層裝置。
於步驟520以及525,處理流程500等到實體層裝置初始化後,進入步驟530,如前所述,基板管理控制器可存取實體層裝置和/或網路連接器/網路電纜。舉例來說,基板管理控制器可監控實體層裝置以及網路連接器/網路電纜之各種網路條件,並執行前述之一個或者多個診斷程序。
處理流程500接著進入步驟535,基板管理控制器回報實體層裝置之資訊(例如狀態)以及網路連接器/網路電纜資訊至機櫃管理控制器。一般而言,機櫃管理控制器可蒐集和/或集結伺服器機櫃中對應至不同伺服器之每個基板管理控制器之回報。此外,如前所述,機櫃管理控制器(與基板管理控制器結合)可透過通訊網路(例如網路150)提供管理工具給管理員。上述管理工具可用以簡單且有效率地監控、辨識、以及排除潛在之網路問題。
處理流程500係結束於步驟540,但亦可持續初始化實體層裝置(步驟515)和/或監控實體層裝置和/或網路連接器/網路電纜(步驟530)。
第6圖係顯示根據本發明另一實施例所述之伺服 器系統中用以診斷監測之簡化流程600。
處理流程600係起始於步驟605,並進入步驟610,其中上述之步驟之細節係如前所述,於伺服器內之基板管理控制器、實體層裝置、以及至少一網路連接器之間建立一內部整合電路通信頻道。舉例來說,上述之內部整合電路通信頻道係顯示於新的伺服器配置400中。
處理流程600接著進入步驟615,基板管理控制器配置或者初始化介於實體層裝置以及媒體存取控制器之間之網路介面。較佳的是,基板管理控制器係配置網路介面以作為以太網路之10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之一者。此外,基板管理控制器可使用基板自動協商協定(backplane auto-negotiation protocol)來執行上述之配置或者初始化。
基板管理控制器更可接收一個或者多個閥值條件,用以定義警示、故障、錯誤等等(步驟620)。舉例來說,機櫃管理控制器(例如機櫃管理控制器116)可傳送上述之閥值條件至伺服器機櫃內對應於每個伺服器之每個基板管理控制器。每個基板管理控制器更監控實體層裝置之狀態或者網路連接器/網路電纜之狀態,並於步驟625中判斷上述之狀態是否指示一特定之網路狀況,例如警示、故障、錯誤等等。舉例來說,基板管理控制器可監控對應至實體層裝置和/或網路連接器/網路電纜之狀態之參數,並比較上述參數以及閥值條件以判斷網路狀況是否存在。較佳的是,基板管理控制器係透過內部整合電路通信頻道監控實體層裝置以及網路連接器/網路電纜之參 數。於一些實施例中,基板管理控制器可使用數位診斷監測介面協定(例如SFF-8472)。此外,機櫃管理控制器可提供更新過後之閥值條件至基板管理控制器以繼續後續之監控。
基板管理控制器更可傳輸警示訊號至機櫃管理控制器以指示發生於伺服器中實體層裝置或者網路連接器/網路電纜中之警示、故障、錯誤等等(步驟630)。此外,如前所述,機櫃管理控制器更可提供警示訊號至遠端管理員以使用各種管理工具(步驟635)。上述管理工具更可用以協助網路管理員辨識、排除、以及定址潛在之網路問題。
處理流程係結束於步驟640,但亦可返回步驟625,基板管理控制器監控以及判斷實體層裝置或者網路連接器/網路電纜中之狀態。
值得注意的是,處理流程500、600中之某些步驟為可選擇的,以及第5、6圖所示之步驟僅為示範實施例。某些其它步驟可包括於或者排除於處理流程中。此外,本發明之步驟之特定順序僅為示範實施例,在不脫離本發明實施例之範圍內可對步驟進行適當之調整。以及儘管處理流程500、600係為獨立執行,但每個處理流程中之某些步驟亦可併入另一處理流程中,且上述處理流程並不代表其為互斥的。
本發明係提供一種適用於數據中心之改良診斷監控,特別係有關於透過服務控制器經由對應之伺服器中之內部整合電路介面或者通信頻道服務控制器(基板管理控制器)來執行之改良診斷監控。這些改良之診斷監控具體上係透過利用伺服器中之獨立實體層裝置執行之程序來提供新的硬體以及軟 體配置。總而言之,改良之診斷監控技術係提供數據中心內與每個伺服器之特定硬體裝置以及軟體模組相關之有價值的資訊,並提升分析潛在網路問題之根本原因之效率。
上述之實施例以足夠之細節敘述使所屬技術領域之具有通常知識者能藉由上述之描述實施本發明所揭露之系統以及方法,以及必須了解的是,在不脫離本發明之精神以及範圍內,當可做些許更動與潤飾。舉例來說,本發明之實施例已顯示以及描述對應伺服器中之特定服務控制器(例如基板管理控制器)。然而上述之實施例並非用以限制本發明之實施,並可與其它數量之裝置、控制器、處理器等等一併使用。
前面之描述已指向具體之實施例。然而,顯而易見的是可對所描述之實施例做出其他變化和修改以實現它們的一部分或全部優勢。舉例來說,可明確地預期的是本發明特定實施之元件、步驟和/或程序在不脫離本發明所公開之範圍之情況下可被替換地包括(或者甚至排除)於其它實施中。此外,本發明所描述之元件和/或單元能夠被實施為存儲於有形(非暫態)電腦可讀介質(例如,盤/CD/RAM/EEPROM等等)中的、具有在電腦、硬體、固件或它們的組合中執行的程式指令的軟體。此外,本發明之方法所描述之各種功能以及技術可透過儲存或者其它來自電腦可存取媒介之電腦可執行指令執行。上述指令可包括,例如包括,使通用電腦、專用電腦、或專用處理設備執行某一功能或某組功能的指令和資料。一部分之電腦資源可透過網路進行存取。電腦可執行指令可為,例如二進制代碼、中介格式指令(例如組合語言)、韌體、或者原始 程式碼。電腦可讀取媒體可用以儲存指令、所使用之資訊、和/或執行方法期間所建立之資訊,而前述實施例可包括磁碟或者光碟、快閃記憶體、具有非易失性記憶體之USB裝置、網路儲存裝置等。此外,根據本發明所公開之裝置可包括硬體、韌體和/或軟體、以及可為各種之外型規格。上述外型規格之典型示例包括膝上型電腦、智慧型手機、小規格之個人電腦、個人數位助理等。本發明所述之功能亦可被具體實施於週邊裝置或者外接卡中。上述之功能亦可透過其它實施例執行於不同晶片上之電路板或者執行於單一裝置之不同程序中。指令、用以傳輸上述指令之媒介、用以執行指令之計算機資源、以及用以提供上述計算機資源之其它架構係為提供本發明實施例所述之功能之手段。本發明之描述僅作為示範實施例,但並非用以限制其它實施例之範圍。因此,所屬技術領域中具有通常知識者亦能夠理解不脫離本發明之精神和範圍的等效構造可在不脫離本發明之精神和範圍內作任意之更動、替代與潤飾。
100‧‧‧示意圖
105‧‧‧數據中心
110‧‧‧伺服器機櫃
115‧‧‧伺服器
116‧‧‧機櫃管理控制器
120‧‧‧中央處理器
125‧‧‧基板管理控制器
130‧‧‧網路裝置
135‧‧‧感應器
140‧‧‧硬體儲存裝置
145‧‧‧管理員
150‧‧‧網路

Claims (10)

  1. 一種管理方法,包括:透過一基板管理控制器監控一伺服器中之一實體層裝置以及與上述實體層裝置連接之至少一網路連接器/網路電纜,其中上述實體層裝置用以於至少一媒體存取控制器以及上述至少一網路連接器/網路電纜之間交換數據;透過上述基板管理控制器判斷上述實體層裝置之一狀態或者上述至少一網路連接器/網路電纜之一狀態,以指示一警示或者一故障;以及透過上述基板管理控制器傳輸對應於上述警示或者上述故障之一警示訊號至一機櫃管理控制器。
  2. 如申請專利範圍第1項所述之管理方法,更包括:於上述基板管理控制器、上述實體層裝置以及上述至少一網路連接器/網路電纜之間建立一內部整合電路通信頻道;透過上述基板管理控制器經由上述內部整合電路通信頻道初始化上述實體層裝置,以與乙太網路中10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者中之上述至少一媒體存取控制器進行通信;以及其中判斷上述狀態之步驟更包括:透過上述內部整合電路通信頻道判斷上述實體層裝置之上述狀態或者上述至少一網路連接器/網路電纜之上述狀態。
  3. 如申請專利範圍第1項所述之管理方法,更包括:利用一基板自動協商協定於上述實體層裝置以及上述至少 一媒體存取控制器之間配置一網路介面;於上述實體層裝置以及上述至少一媒體存取控制器之間配置上述網路介面以作為乙太網路之10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者。
  4. 如申請專利範圍第1項所述之管理方法,其中判斷上述狀態之步驟更包括:利用一數位診斷偵測介面協定判斷上述實體層裝置之上述狀態或者上述至少一網路連接器/網路電纜之上述狀態;透過上述基板管理控制器自上述機櫃管理控制器接收一個或者多個更新後閥值條件以定義上述警示以及上述故障;以及其中判斷對應至上述實體層裝置之上述狀態或者上述網路連接器/網路電纜之上述狀態之上述一個或者多個網路參數之步驟更包括:判斷對應至上述實體層裝置之上述狀態或者上述網路連接器/網路電纜之上述狀態之上述一個或者多個網路參數是否超過上述一個或者多個更新後閥值條件。
  5. 如申請專利範圍第1項所述之管理方法,更包括:透過上述基板管理控制器接收一個或者多個閥值條件,其中上述閥值條件用以定義上述警示以及上述故障;以及透過上述機櫃管理控制器經由一通信網路提供複數管理工具給一管理員以遠端排除上述警示訊號;其中判斷上述狀態之步驟更包括:判斷對應至上述實體層裝置之上述狀態或者上述網路連接 器/網路電纜之上述狀態之一個或者多個網路參數是否超過上述一個或者多個閥值條件;以及其中上述伺服器為一第一伺服器以及上述機櫃管理控制器為一第二伺服器,以及上述第一伺服器以及上述第二伺服器係設置於一共享伺服器機櫃上。
  6. 一種服務控制器裝置,包括:一個或者多個網路介面,用以與一伺服器中之至少一其它裝置進行通信;一處理器,耦接至上述網路介面,以及適用於處理一個或者多個處理程序;以及一記憶體,用以儲存可由上述處理器執行之複數指令,當上述指令透過上述處理器執行時,使得上述處理器執行之複數操作包括:監控上述伺服器中之一實體層裝置以及與上述實體層裝置連接之至少一網路連接器/網路電纜,其中上述實體層裝置用以於至少一媒體存取控制器以及上述至少一網路連接器/網路電纜之間交換數據;判斷上述實體層裝置之一狀態或者上述至少一網路連接器/網路電纜之一狀態以指示一警示或者一故障;以及傳輸對應於上述警示或者上述故障之一警示訊號至一機櫃管理控制器。
  7. 如申請專利範圍第6項所述之服務控制器裝置,其中上述指令更使得上述處理器執行之上述操作更包括:透過一內部整合電路通信頻道初始化一乙太網路中 10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者中之上述實體層裝置;利用一基板自動協商協定於上述實體層裝置以及上述至少一媒體存取控制器之間配置一網路介面;於上述實體層裝置以及上述至少一媒體存取控制器之間配置上述網路介面以作為一乙太網路中10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者。
  8. 如申請專利範圍第6項所述之服務控制器裝置,其中上述一個或者多個網路介面包括一內部整合電路通信頻道,用以於上述服務控制器裝置以及上述實體層裝置、上述至少一網路連接器/網路電纜之間進行數據傳遞,判斷上述實體層裝置之上述狀態或者上述至少一網路連接器/網路電纜之上述狀態之上述操作更包括:經由上述內部整合電路通信頻道判斷上述實體層裝置之上述狀態或者上述至少一網路連接器/網路電纜之上述狀態。
  9. 一種非暫態電腦可讀取媒體,具有軟體編程於其中,當上述軟體透過一處理器執行時,使得上述處理器執行之複數操作,上述操作包括:監控一伺服器中之一實體層裝置以及與上述實體層裝置連接之至少一網路連接器/網路電纜,其中上述實體層裝置用以於至少一媒體存取控制器以及上述至少一網路連接器/網路電纜之間交換數據;判斷上述實體層裝置之一狀態或者上述至少一網路連接器 /網路電纜之一狀態以指示一警示或者一故障;以及傳輸對應於上述警示或者上述故障之一警示訊號至一機櫃管理控制器。
  10. 如申請專利範圍第9項所述之非暫態電腦可讀取媒體,其中上述操作更包括:透過一內部整合電路通信頻道初始化一乙太網路中10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者中之上述實體層裝置;利用一基板自動協商協定於上述實體層裝置以及上述至少一媒體存取控制器之間配置一網路介面;於上述實體層裝置以及上述至少一媒體存取控制器之間配置上述網路介面以作為一乙太網路中10GBASE-KR/25GBASE-KR1/50GBASE-KR2/40GBASE-KR4/100GBASE-KR4模式之至少一者。
TW104144170A 2015-10-14 2015-12-29 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體 TWI618380B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/883,161 2015-10-14
US14/883,161 US10333771B2 (en) 2015-10-14 2015-10-14 Diagnostic monitoring techniques for server systems

Publications (2)

Publication Number Publication Date
TW201714432A true TW201714432A (zh) 2017-04-16
TWI618380B TWI618380B (zh) 2018-03-11

Family

ID=58526062

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104144170A TWI618380B (zh) 2015-10-14 2015-12-29 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體

Country Status (3)

Country Link
US (1) US10333771B2 (zh)
CN (1) CN106603265B (zh)
TW (1) TWI618380B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2709677C1 (ru) * 2019-04-09 2019-12-19 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре
RU2710288C1 (ru) * 2019-04-09 2019-12-25 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре
TWI685740B (zh) * 2018-12-28 2020-02-21 營邦企業股份有限公司 運用於資料中心的機櫃異常狀態的遠端排除方法(一)
TWI685736B (zh) * 2018-12-28 2020-02-21 營邦企業股份有限公司 運用於資料中心的機櫃異常狀態的遠端排除方法(二)
TWI689811B (zh) * 2018-08-01 2020-04-01 英業達股份有限公司 週期性事件紀錄方法
CN111414274A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
US10842041B2 (en) 2019-03-22 2020-11-17 Aic Inc. Method for remotely clearing abnormal status of racks applied in data center

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI587128B (zh) * 2016-05-11 2017-06-11 神雲科技股份有限公司 用於電腦裝置的錯誤狀態資料自動提供方法
US10582636B2 (en) * 2017-08-07 2020-03-03 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Server having a dual-mode serial bus port enabling selective access to a baseboard management controller
JP7007570B2 (ja) * 2017-12-27 2022-01-24 株式会社ソシオネクスト 処理装置、半導体集積回路及び状態監視方法
US10860311B2 (en) * 2018-06-13 2020-12-08 Dell Products, L.P. Method and apparatus for drift management in clustered environments
CN109189640A (zh) * 2018-08-24 2019-01-11 平安科技(深圳)有限公司 服务器的监控方法、装置、计算机设备及存储介质
US11119876B2 (en) * 2018-10-09 2021-09-14 Super Micro Computer, Inc. Device and method for testing computer system
TWI701594B (zh) * 2018-12-05 2020-08-11 英業達股份有限公司 遠端硬體診斷系統與診斷方法
TWI715005B (zh) * 2019-04-08 2021-01-01 神雲科技股份有限公司 用於監控基板管理控制器之常駐程序的方法
RU2711469C1 (ru) * 2019-04-09 2020-01-17 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре
CN110752946B (zh) * 2019-10-16 2021-10-29 苏州浪潮智能科技有限公司 一种bmc网络的恢复方法、系统及装置
US11762747B2 (en) 2020-08-26 2023-09-19 Mellanox Technologies, Ltd. Network based debug
TWI767392B (zh) * 2020-11-04 2022-06-11 英業達股份有限公司 PCIe頻寬自動調配系統及方法
CN114691400A (zh) * 2020-12-31 2022-07-01 联想企业解决方案(新加坡)有限公司 故障处理方法及故障处理装置
TWI767773B (zh) 2021-06-30 2022-06-11 緯穎科技服務股份有限公司 入侵偵測裝置及其方法
KR102695993B1 (ko) * 2021-11-23 2024-08-16 주식회사 클레버로직 5g 통신을 수행하기 위하여 모뎀에 의해 구현되는 물리계층의 상태진단 및 감시를 수행하는 방법 및 통신시스템
CN116546234A (zh) * 2023-05-31 2023-08-04 广州融生信息技术有限公司 国产化视频服务器的故障处理方法、装置、服务器及介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI437426B (zh) * 2011-07-08 2014-05-11 Quanta Comp Inc 伺服器機櫃系統
CN103138971B (zh) * 2011-11-28 2016-06-01 英业达科技有限公司 服务器机柜系统
TW201325137A (zh) 2011-12-05 2013-06-16 Hon Hai Prec Ind Co Ltd 數據中心伺服器穩定性測試裝置及測試方法
CN103777734A (zh) * 2012-10-25 2014-05-07 英业达科技有限公司 机柜式服务器系统与其操作方法
CN103793238A (zh) 2012-10-31 2014-05-14 英业达科技有限公司 机柜与其同时更新多个基本输入输出系统的方法
CN103853636A (zh) 2012-11-30 2014-06-11 英业达科技有限公司 机柜服务器系统及其检测方法
CN103902433A (zh) 2012-12-29 2014-07-02 鸿富锦精密工业(深圳)有限公司 机箱状态监控系统
US9582010B2 (en) 2013-03-14 2017-02-28 Rackspace Us, Inc. System and method of rack management
TWI597139B (zh) 2014-02-18 2017-09-01 廣達電腦股份有限公司 自走式機器人、資料中心及資料中心之維修方法
US10015023B2 (en) * 2014-09-08 2018-07-03 Quanta Computer Inc. High-bandwidth chassis and rack management by VLAN
US20160239370A1 (en) * 2015-02-12 2016-08-18 Aic Inc. Rack having automatic recovery function and automatic recovery method for the same

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI689811B (zh) * 2018-08-01 2020-04-01 英業達股份有限公司 週期性事件紀錄方法
TWI685740B (zh) * 2018-12-28 2020-02-21 營邦企業股份有限公司 運用於資料中心的機櫃異常狀態的遠端排除方法(一)
TWI685736B (zh) * 2018-12-28 2020-02-21 營邦企業股份有限公司 運用於資料中心的機櫃異常狀態的遠端排除方法(二)
CN111414274A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
US10842041B2 (en) 2019-03-22 2020-11-17 Aic Inc. Method for remotely clearing abnormal status of racks applied in data center
RU2709677C1 (ru) * 2019-04-09 2019-12-19 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре
RU2710288C1 (ru) * 2019-04-09 2019-12-25 ЭйАйСи ИНК. Способ удаленного сброса ненормального состояния стоек, применяемых в дата-центре

Also Published As

Publication number Publication date
CN106603265B (zh) 2020-06-09
TWI618380B (zh) 2018-03-11
US20170111215A1 (en) 2017-04-20
CN106603265A (zh) 2017-04-26
US10333771B2 (en) 2019-06-25

Similar Documents

Publication Publication Date Title
TWI618380B (zh) 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
TWI531907B (zh) 基板管理系統架構
US10404690B2 (en) Authentication-free configuration for service controllers
US9619243B2 (en) Synchronous BMC configuration and operation within cluster of BMC
US9934187B2 (en) Hot-pluggable computing system
JP5640154B2 (ja) デバイスハードウェアエージェント
US10127170B2 (en) High density serial over LAN management system
US10127095B2 (en) Seamless automatic recovery of a switch device
CN108768730B (zh) 用于操作智能网卡的方法和装置
US20150058659A1 (en) Automatic failover in modular chassis systems
JP2016045968A (ja) 複数のモジュールを備えるサーバ
US11411753B2 (en) Adding network controller sideband interface (NC-SI) sideband and management to a high power consumption device
CN104639380A (zh) 服务器监控方法
US9898435B2 (en) Aggregate baseboard management controller (BMC) controller
US10425287B2 (en) Systems and methods for network topology discovery
US9804980B2 (en) System management through direct communication between system management controllers
CN112015689B (zh) 串口输出路径切换方法、系统及装置和交换机
US9779037B2 (en) Establishing connectivity of modular nodes in a pre-boot environment
US10785118B2 (en) Systems and methods for network topology validation
EP2981898B1 (en) Microcontroller at a cartridge of a chassis
CN118626428A (zh) 带宽分配方法、服务器、设备、介质及程序产品
CN117648276A (zh) 带外管理系统及方法
CN118033468A (zh) 电源监测模块复位方法和电源监测系统复位方法
CN118713973A (zh) 基于bmc的网络管理系统
CN118245295A (zh) 一种服务器的PCIe链路状态检测方法及服务器