Nothing Special   »   [go: up one dir, main page]

JP2001337873A - 障害監視システム - Google Patents

障害監視システム

Info

Publication number
JP2001337873A
JP2001337873A JP2000156633A JP2000156633A JP2001337873A JP 2001337873 A JP2001337873 A JP 2001337873A JP 2000156633 A JP2000156633 A JP 2000156633A JP 2000156633 A JP2000156633 A JP 2000156633A JP 2001337873 A JP2001337873 A JP 2001337873A
Authority
JP
Japan
Prior art keywords
manager
fault
state
sub
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000156633A
Other languages
English (en)
Inventor
Keigo Nakamura
圭吾 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000156633A priority Critical patent/JP2001337873A/ja
Publication of JP2001337873A publication Critical patent/JP2001337873A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

(57)【要約】 【課題】 マネージャの処理の負荷を削減し、リアルタ
イムにエージェントの正しい障害状態を認識できるよう
にする。 【解決手段】 マネージャ10が複数のエージェント3
1〜34の障害状態の変化を、通信プロトコルとしてS
NMPを用いて監視する際に、サブマネージャ21、2
2を設ける。サブマネージャ21、22は、エージェン
ト31、32およびエージェント33、34の障害状態
の変化の監視をそれぞれ行い、各エージェントの監視項
目のいずれかに障害が発生した場合、当該エージェント
に障害が発生したことをマネージャ10に通知する。マ
ネージャ10の処理をサブマネージャ21、22が分散
して行うので、マネージャ10の処理の負荷が削減さ
れ、マネージャ10はリアルタイムにエージェント31
〜34の正しい障害状態を認識できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マネージャ(監視
装置)と複数のエージェント(被監視装置)により構成
されていて、マネージャにより各エージェントの障害状
態の変化を監視する障害監視システムに関し、特に通信
プロトコルとしてSNMP(SimpleNetwor
k Management Protocol)を用い
ている障害監視システムに関する。
【0002】
【従来の技術】マネージャとエージェントから構成さ
れ、通信プロトコルとしてSNMPを用いている障害監
視システムでは、エージェントにおいて状態変化が発生
したとき、エージェントがマネージャに状態変化を通知
する方法として“TRAP”というメッセージが使用さ
れている。
【0003】しかし、SNMPはTCP/IPのような
送信データが相手先に確実に届いたことを確認できるよ
うなコネクション型のプロトコルではなく、一方的に相
手先にデータを送信するコネクションレスのプロトコル
であるUDP(User Datagram Prot
ocol)を用いているので、エージェントから送信さ
れた“TRAP”は必ずしもマネージャに届くとは限ら
ず、エージェントから送信された“TRAP”がマネー
ジャに到達しない“TRAP”抜けが発生する場合があ
る。このような“TRAP”抜けが発生すると、マネー
ジャは各エージェントの正しい状態を認識することがで
きなくなる。
【0004】そのため、“TRAP”がマネージャに届
かない可能性があることを考慮して、マネージャは各エ
ージェントに対して“Get Request”という
メッセージを用いて定期的に各エージェントの全監視項
目の状態を獲得するといった処理(ポーリング)を行う
必要がある。
【0005】しかし、各エージェントの全監視項目の状
態の獲得を行う場合、ポーリングを行う間隔を長くする
と“TRAP”抜けが発生した場合、正しい状態を認識
できない時間が長くなってしまう。逆に、逆にポーリン
グを行う間隔を短くすると“TRAP”抜けが発生した
場合でも正しい状態を認識できない時間は短くなるが、
ポーリングを頻繁に行うことによるネットワーク上のト
ラフィック負荷が高くなってしまい、“TRAP”抜け
が発生する可能性が増大してしまうという問題があっ
た。
【0006】上記で説明したような従来の障害監視シス
テムを図4に示す。この従来の障害監視システムは、マ
ネージャ10と、エージェント31〜34とを備えてい
る。
【0007】各エージェント31〜34では、それぞれ
監視項目A11〜A13、監視項目A21〜A23、監視項目A
31〜A33、監視項目A41〜A43の障害状態(正常または
障害)を監視している。そして、マネージャ10はエー
ジェント31〜34の全ての監視項目A11〜A13、監視
項目A21〜A23、監視項目A31〜A33、監視項目A41
43の監視を行っている。
【0008】そして、マネージャ10はそれぞれのエー
ジェント31〜34と通信プロトコルとしてSNMPを
用いていて、“Get Request”または“TR
AP”を利用してエージェント31〜34の全項目の監
視を直接行っている。また、この従来の障害監視システ
ムでは、ネットワーク51〜53はLAN(Local
Area Network)またはWAN(Wide
Area Network:広域通信網)40を介し
てネットワーク接続されている。
【0009】監視端末であるマネージャ10はネットワ
ーク51に接続され、ネットワーク52に接続されてい
るエージェント31、32およびネットワーク53に接
続されているエージェント33、34の監視をリアルタ
イムで行っている。
【0010】このような従来の障害監視システムでは、
マネージャ10は、エージェント31〜34の全ての監
視項目を直接監視する必要があるため、マネージャ10
の処理の負荷およびマネージャ10が接続されているネ
ットワーク51のトラフィックの負荷が大きくなる。そ
のため、マネージャ10からの定期的な“Get Re
quest”の頻度をあまり多くすることはできず、ポ
ーリング間隔が長くなってしまいマネージャ10がリア
ルタイムにエージェント31〜34の障害状態を認識す
ることが困難であった。
【0011】
【発明が解決しようとする課題】上述した従来の障害監
視システムでは、マネージャはエージェントの全ての監
視項目を直接監視する必要がるため、マネージャの処理
の負荷およびマネージャが接続されているネットワーク
のトラフィックの負荷が大きくなり、マネージャがリア
ルタイムにエージェントの正しい障害状態を認識するこ
とが困難であるという問題点があった。
【0012】本発明の目的は、マネージャの処理の負荷
およびマネージャが接続されているネットワークのトラ
フィックの負荷を削減し、マネージャがリアルタイムに
エージェントの正しい障害状態を認識することができる
障害監視システムを提供することである。
【0013】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、マネージャと複数のエージェントから構
成され、前記マネージャにより前記各エージェントの障
害状態の変化を監視する障害監視システムにおいて、前
記複数のエージェントのうちの一部のエージェントの障
害状態の変化の監視を行い、監視を行っているエージェ
ントの監視項目のいずれかに障害が発生した場合、当該
エージェントに障害が発生したことを前記マネージャに
通知する複数のサブマネージャが設けられていることを
特徴とする。
【0014】本発明は、マネージャとエージェント間に
サブマネージャを設け、マネージャの処理をサブマネー
ジャが分散して行うようにすることにより、マネージャ
はエージェントの障害状態のトータル情報だけを監視す
るだけでよいので、マネージャの処理の負荷が削減さ
れ、マネージャがリアルタイムにエージェントの正しい
障害状態を認識することができる。
【0015】また、本発明の他の障害監視システムで
は、前記サブマネージャは、既に発生している障害より
も優先度の高い障害が発生した場合、および優先度の高
い障害が復旧した場合には前記マネージャに通知を行
う。本発明によれば、障害状態に対して優先度を設ける
ことにより、マネージャは優先度の低い障害が既に発生
している場合でも、優先度の高い障害状態の変化をリア
ルタイムで認識することができる。
【0016】また、本発明の他の障害監視システムによ
れば、前記サブマネージャは、監視を行うエージェント
と同一のネットワークに接続されている。本発明によれ
ば、マネージャが接続されているネットワークのトラフ
ィックの負荷を削減することができる。
【0017】また、本発明の他の障害監視システムによ
れば、前記マネージャと前記各サブマネージャとの間お
よび、前記サブマネージャと前記各エージェントとの間
で行われる通信の通信プロトコルとしてSNMPが用い
られている。
【0018】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0019】(第1の実施形態)図1は本発明の第1の
実施形態の障害監視システムの構成を示すブロック図で
ある。図1において、図4中の構成要素と同一の構成要
素には同一の符号を付す。
【0020】本実施形態の障害監視システムでは、図1
に示されるように、図4に示した従来の障害監視システ
ムに対して、マネージャ10とエージェント31〜34
間にサブマネージャ21、22が設けられている。
【0021】サブマネージャ21はネットワーク52上
に接続され、同一ネットワーク上にあるエージェント3
1、32のすべての監視項目A11〜A13、A21〜A23
監視をリアルタイムで行っている。そして、サブマネー
ジャ21は、エージェント31、32の監視項目A11
13、A21〜A23のいずれかに障害が発生しているかい
ないかを、トータル情報B1、B2を用いて管理してい
る。例えば、サブマネージャ21は、エージェント31
の監視項目A11〜A13のうちのいずれか1つでも障害状
態になっている場合には、エージェント31のトータル
情報B1を障害状態とする。
【0022】サブマネージャ22はネットワーク53上
に接続され、同一ネットワーク上にあるエージェント3
3、34のすべての監視項目A31〜A33、A41〜A43
監視をリアルタイムで行っている。そして、サブマネー
ジャ22は、サブマネージャ21と同様に、エージェン
ト33、34の監視項目A31〜A33、A41〜A43のいず
れかに障害が発生しているかいないかを、トータル情報
3、B4を用いて管理している。
【0023】本実施形態におけるマネージャ10はサブ
マネージャ21、22により解析された各エージェント
31〜34の全体での障害状態を示すトータル情報B1
〜B4だけをリアルタイムで監視している。
【0024】サブマネージャ21、22はそれぞれエー
ジェント31、32またはエージェント33、34から
通知された状態変化をすべてマネージャ10に通知する
のではなく、各エージェント31〜34のトータル状態
だけをマネージャ10に通知する。
【0025】本実施形態の障害監視システムでは、エー
ジェント31〜34の監視項目のいずれかの状態変化が
発生した場合、エージェント31、32ならばサブマネ
ージャ21に対して、エージェント33、34ならばサ
ブマネージャ22に対して状態変化が発生したことを示
す“TRAP”を送信する。
【0026】サブマネージャ21および22はそれぞれ
エージェント31、32およびエージェント33、34
の監視項目およびトータル情報を保持し、各エージェン
トのトータル状態が変化した場合のみ、マネージャ10
にエージェントのトータル情報の変化が発生したことを
“TRAP”を用いて通知する。
【0027】“TRAP”ぬけが発生したことを考慮し
て、マネージャ10からサブマネージャ21、22に対
して、定期的に“Get Request”を使用し
て、各エージェント31〜34のトータル状態を示すト
ータル情報B1〜B4の状態を獲得する。
【0028】また、サブマネージャ21はエージェント
31、32に対して、エージェント31、32の監視項
目(A11〜A13、A21〜A23)の状態を“Get Re
quest”を用いて定期的に獲得し、サブマネージャ
22はエージェント33、34に対して、エージェント
33、34の監視項目(A31〜A33、A41〜A43)の状
態を“Get Request”を用いてて定期的に獲
得する。
【0029】図4に示した従来の障害監視システムでは
マネージャ10が全てのエージェント31〜34に対し
て全ての監視項目(A11〜A13、A21〜A23、A31〜A
33、A41〜A43)の状態を“Get Request”
を用いて直接獲得する必要があった。これに対して、本
実施形態の障害監視システムでは、マネージャ10は、
サブマネージャ21、22に対して、各エージェント3
1〜34のトータル情報B1〜B4の状態の獲得だけを行
えばよいため、送信を行う“Get Request”
数が少なくなり、“Get Request”のパケッ
トサイズも小さくなるため、マネージャ10の処理負荷
およびびネットワーク51のトラフィック負荷を少なく
することができる。
【0030】本実施形態の障害監視システムによれば、
既に障害状態が発生しているエージェントにおいて、他
の監視項目の障害が発生したり、障害状態が復旧した場
合に、まだそのエージェントにて他の監視項目の障害が
発生してる場合、エージェントからマネージャ10に
“TRAP”を送信する必要がなくなり、送信される
“TRAP”の量が少なくなることによって、マネージ
ャ10の処理負荷が少なくなる。つまり、マネージャ1
0は通信する相手先が少なくなり、かつ獲得する情報量
が少なくなるため、定期的に“Get Reques
t”を行う頻度を多くすることが可能となる。
【0031】本実施形態は、このような構成とすること
によって、マネージャ10の処理負荷およびマネージャ
10が接続されているネットワーク51のトラフィック
負荷を少なくすることによって、SNMPの“TRA
P”を抜けをできるかぎり少なくし、マネージャ10か
らの定期的な“Get Request”の頻度を多く
することが可能になるため、エージェント31〜34の
障害状態をできるだけリアルタイムに正しく認識するこ
とが可能になる。
【0032】次に図2を参照して、本実施例のエージェ
ントにおける状態変化発生時の動作について詳細を説明
する。この図2では、エージェント31の監視項目A11
〜A 13の状態変化を監視する場合について説明するが。
【0033】エージェント31の監視項目A11〜A13
全て正常状態の場合、サブマネージャ21が保持してい
るエージェント31の監視項目A11〜A13およびトータ
ル情報B1の状態は全て正常状態となっていて、マネー
ジャ10が保持しているエージェント31のトータル情
報B1も正常状態となっている。
【0034】この状態から、監視項目A11の状態が正常
状態から障害状態に変化した場合(ステップ111)、
エージェント31は、監視項目A11の状態変化が発生し
たことを“TRAP”を用いてサブマネージャ21に通
知する(ステップ112)。
【0035】サブマネージャ21はエージェント31か
ら送信されてきた“TRAP”を解析して、監視項目A
11が正常状態から障害状態に変化したことを認識し、ト
ータル情報B1を正常状態から障害状態に変化させる。
(ステップ113)そして、サブマネージャ21は、エ
ージェント31のトータル情報B1の状態が変化したこ
とを“TRAP”を用いてマネージャ10に通知する
(ステップ114)。
【0036】マネージャ10はサブマネージャ21から
送信されてきた“TRAP”を解析して、トータル情報
1の状態が正常状態から障害状態に変化したことを認
識する(ステップ115)。
【0037】次に、監視項目A11の障害が発生している
状態において、さらに監視項目A12の状態が正常状態か
ら障害状態に変化した場合(ステップ121)、エージ
ェント31は、監視項目A12の状態変化が発生したこと
を“TRAP”を用いてサブマネージャ21に通知す
る。(ステップ122) サブマネージャ21はエージェント31から送信されて
きた“TRAP”を解析して、監視項目A12が正常状態
から障害状態に変化したことを認識する(ステップ12
3)。
【0038】ただし、エージェント31のトータル情報
1の状態はすでに障害状態になっているため、トータ
ル情報B1の状態変化は発生しない。従ってサブマネー
ジャ21はマネージャ10に状態変化を通知するための
“TRAP”を送信しない。
【0039】次に、監視項目A11、A12の障害が発生し
ている状態で、監視項目A11の状態が障害状態から正常
状態に変化した場合(ステップ131)、エージェント
31は、監視項目A11の状態変化が発生したことを“T
RAP”を用いてサブマネージャ21に通知する。(ス
テップ132) サブマネージャ21はエージェント31から送信されて
きた“TRAP”を解析して、監視項目A11が障害状態
から正常状態に変化したことを認識する(ステップ13
3)。
【0040】ただし、エージェント31の監視項目A11
の状態が正常状態になっても、監視項目A12の状態は依
然として障害状態のため、トータル情報B1の状態は障
害状態のままであり、トータル情報B1の状態変化は発
生しない。従ってサブマネージャ21はマネージャ10
には状態変化を通知するための“TRAP”を送信しな
い。
【0041】次に、監視項目A12の障害が発生している
状態において、監視項目A12の状態が障害状態から正常
状態に変化した場合(ステップ141)、エージェント
31は、監視項目A12の状態変化が発生したことを“T
RAP”を用いてサブマネージャ21に通知する。(ス
テップ142) サブマネージャ21はエージェント31から送信されて
きた“TRAP”を解析して、監視項目A12が障害状態
から正常状態に変化したことを認識し、トータル情報B
1を障害状態から正常状態に変化させる。(ステップ1
43) そして、サブマネージャ21は、エージェント31のト
ータル情報B1の状態が変化したことを“TRAP”を
用いてマネージャ10に通知する(ステップ144)。
【0042】マネージャ10はサブマネージャ21から
送信されてきた“TRAP”を解析して、トータル情報
1の状態が障害状態から正常状態に変化したことを認
識する(ステップ145)。
【0043】図4に示した従来の障害監視システムで
は、エージェント31〜34の監視項目のいずれかが変
化した場合、常にマネージャ10に状態変化を通知する
ための“TRAP”の送信が行われていたが、本実施形
態の障害監視システムによれば、いずれかの監視項目に
て既に障害が発生している際に他の監視項目の障害が発
生した場合、または障害が復旧しても他の項目がまだ障
害状態の場合、サブマネージャ21、22からマネージ
ャ10に対して“TRAP”が送信されない。そのた
め、マネージャ10の処理負荷およびネットワーク51
のトラフィック負荷を少なくすることができる。
【0044】上記の説明では、マネージャ10によりエ
ージェント31の障害状態の監視を行う場合を用いて説
明したが、エージェント32〜34の障害状態の監視を
行う場合でも同様にして行われる。 (第2の実施形態)次に、本発明の第2の実施形態の障
害監視システムについて説明する。
【0045】上記で説明した本発明の第1の実施形態で
は、サブマネージャ21、22がマネージャ10の代わ
りにエージェント31〜34の監視項目(A11〜A13
21〜A23、A31〜A33、A41〜A43)を管理して、マ
ネージャ10ではサブマネージャ21、22が作成した
各エージェントのトータル情報(B1〜B4)だけを監視
するようにしている。
【0046】しかし、上記第1の実施形態の障害監視シ
ステムでは、ある監視項目に障害が発生している状態
で、後から他の項目の障害が発生した場合、後から発生
した障害の発生はリアルタイムでマネージャ10に通知
されない。つまり、後から発生した障害が重大な障害で
ありその障害の発生をリアルタイムでマネージャ10に
通知する必要がある場合でも、サブマネージャがエージ
ェントのトータル情報だけをマネージャに通知する方法
だとマネージャは後から発生した重大な障害を認識する
ことができないという問題が発生する。
【0047】本発明の第2の実施形態の障害監視システ
ムは、このような問題を解決するために障害状態に優先
度を持たせるようにしたものである。本実施形態の障害
監視システムでは、障害状態の優先度として軽度/重度
の2つの障害状態を設けており、重度の障害状態の方が
軽度の障害状態より優先度が高いものとして、優先度の
高い障害が発生している場合、優先度の低い障害の状態
変化が発生してもエージェントの障害状態は変化しない
ものとする。
【0048】次に、本実施形態の障害監視システムの動
作を図3のシーケンス図を参照して説明する。図3はエ
ージェント31の監視項目A11の障害状態を軽度の障害
状態、監視項目A12の障害状態を重度の障害状態と設定
した場合のシーケンス図である。
【0049】エージェント31の監視項目A11〜A13
全て正常状態の場合、サブマネージャ21が保持してい
るエージェント31の監視項目A11〜A13およびトータ
ル情報B1の状態は全て正常状態となっていて、マネー
ジャ10が保持しているエージェント31のトータル情
報B1は正常状態となっている。
【0050】この状態から、監視項目A11の状態が正常
状態から障害状態に変化した場合(ステップ211)、
エージェント31は、エージェント31の監視項目A11
の状態変化が発生したことを“TRAP”を用いてサブ
マネージャ21に通知する(ステップ212)。
【0051】サブマネージャ21はエージェント31か
ら送信されてきた“TRAP”を解析して、監視項目A
11が正常状態から障害状態に変化したことを認識する。
そして、サブマネージャ21は、監視項目A11は優先度
が低い障害状態であるため、トータル情報B1を正常状
態から軽度の障害状態に変化させる(ステップ21
3)。
【0052】そして、サブマネージャ21は、エージェ
ント31のトータル情報B1の状態が変化したことを
“TRAP”を用いてマネージャ10に通知する。(ス
テップ214)マネージャ10はサブマネージャ21か
ら送信されてきた“TRAP”を解析して、トータル情
報B1の状態が正常状態から軽度の障害状態に変化した
ことを認識する(ステップ215)。
【0053】次に、監視項目A11の障害が発生している
状態で、監視項目A12の状態が正常状態から障害状態に
変化した場合(ステップ221)、エージェント31
は、監視項目A12の状態変化が発生したことを“TRA
P”を用いてサブマネージャ21に通知する(ステップ
222)。
【0054】サブマネージャ21はエージェント31か
ら送信されてきた“TRAP”を解析して、監視項目A
12が正常状態から障害状態に変化したことを認識し、監
視項目A12は優先度が高いため、トータル情報B1を軽
度の障害状態から重度の障害状態に変化させる(ステッ
プ223)。
【0055】エージェント31のトータル情報B1の状
態の状態が軽度の障害状態から重度の障害状態に変化し
たため、サブマネージャ21はエージェント31のトー
タル情報B1の状態が変化したことを“TRAP”を用
いてマネージャ10に通知する(ステップ224)。
【0056】マネージャ10はサブマネージャ21から
送信されてきた“TRAP”を解析して、トータル情報
1の状態が軽度の障害状態から重度の障害状態に変化
したことを認識する(ステップ225)。
【0057】次に、監視項目A11、監視項目A12の障害
が発生している状態で、監視項目A 11の状態が障害状態
から正常状態に変化した場合(ステップ231)、エー
ジェント31は、エージェント31の監視項目A11の状
態変化が発生したことを“TRAP”を用いてサブマネ
ージャ21に通知する(ステップ232)。
【0058】サブマネージャ21はエージェント31か
ら送信されてきた“TRAP”を解析して、監視項目A
11が障害状態から正常状態に変化したことを認識する
(ステップ233)。
【0059】ただし、エージェント31の監視項目A11
の状態が正常状態になっても、監視項目A12の状態が障
害状態のため、トータル情報B1の状態は重度の障害状
態のままとし、状態変化は発生しない。従ってサブマネ
ージャ21はマネージャ10には状態変化を通知するた
めの“TRAP”を送信しない。
【0060】次に、監視項目A12の障害が発生している
状態で、監視項目A12の状態が障害状態から正常状態に
変化した場合(ステップ241)、エージェント31は
エージェント31の監視項目A12の状態変化が発生した
ことを“TRAP”を用いてサブマネージャ21に通知
する(ステップ242)。
【0061】サブマネージャ21はエージェント31か
ら送信されてきた“TRAP”を解析して、監視項目A
12が障害状態から正常状態に変化したことを認識し、ト
ータル情報B1が重度の障害状態から正常状態に変化し
たことを認識する(ステップ243)。
【0062】エージェント31のトータル情報B1の状
態の状態が重度の障害状態から正常状態に変化したた
め、サブマネージャ21はエージェント31のトータル
情報B 1の状態が変化したことを“TRAP”を用いて
マネージャ10に通知する(ステップ244)。
【0063】マネージャ10はサブマネージャ21から
送信されてきた“TRAP”を解析して、トータル情報
1の状態が重度の障害状態から正常状態に変化したこ
とを認識する(ステップ245)。
【0064】上記で説明したように、本実施形態の障害
監視システムによれば、既に障害が発生していてもその
障害の優先度より高い優先度の障害が発生した場合に
は、サブマネージャ21、22はマネージャ10にその
障害状態の変化を“TRAP”を使用して通知するが、
優先度の高い障害が既に発生している場合、その障害よ
りも優先度の低い障害が発生/復旧してもサブマネージ
ャからマネージャ10には“TRAP”を送信しない。
また、優先度の高い障害と低い障害が既に発生している
場合、優先度の低い障害が復旧した場合には、サブマネ
ージャ21、22はマネージャ10に障害状態の変化を
通知しないが、優先度の高い障害が復旧した場合には、
マネージャ10に障害状態の変化を通知する。
【0065】したがって、本実施形態によれば、上記第
1の実施形態による効果に加えて、障害状態に対して優
先度を設けることにより、マネージャ10は優先度の低
い障害が既に発生している場合でも、優先度の高い障害
状態の発生/復旧の変化をリアルタイムで認識すること
ができる。
【0066】上記第1および第2の実施形態では、マネ
ージャ10とサブマネージャ21、22との間およびサ
ブマネージャ21、22と各エージェント31〜34と
の間の通信は、通信プロトコルとしてSNMPが用いら
れている場合について説明したが、本発明はこのような
場合に限定されるものではなく、コネクションレスの他
の通信プロトコルが用いられる場合でも同様に適用する
ことができるものである。
【0067】
【発明の効果】以上説明したように、本発明によれば、
下記のような効果を得ることができる。 (1)マネージャの処理を複数のサブマネージャに分散
させることでマネージャの処理負荷を削減することがで
き、またサブマネージャをエージェントと同一のネット
ワーク上に置くことによって、マネージャが接続されて
いるネットワークのトラフィックの負荷を削減すること
ができる。そのため、“Get Request”を使
用する頻度を多くすることが可能になり、よりリアルタ
イムにエージェントの正しい障害状態を認識することが
できる。 (2)さらに、障害状態に優先度を設けることにより、
ある監視項目で障害が既に発生している際に、その監視
項目の優先度よりも高い優先度の監視項目で障害が発生
した場合には、マネージャはその障害の発生をリアルタ
イムに認識することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の障害監視システムの
構成を示すブロック図である。
【図2】図1の障害監視システムの動作を示すシーケン
ス図である。
【図3】本発明の第2の実施形態の障害監視システムの
動作を示すシーケンス図である。
【図4】従来の障害監視システムの構成を示すブロック
図である。
【符号の説明】
10 マネージャ 21、22 サブマネージャ 31〜34 エージェント 40 WAN/LAN 51〜53 ネットワーク 111〜145 ステップ 211〜245 ステップ A11〜A13、A21〜A23、A31〜A33、A41〜A43
監視項目 B1〜B4 トータル情報

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 マネージャと複数のエージェントから構
    成され、前記マネージャにより前記各エージェントの障
    害状態の変化を監視する障害監視システムにおいて、 前記複数のエージェントのうちの一部のエージェントの
    障害状態の変化の監視を行い、監視を行っているエージ
    ェントの監視項目のいずれかに障害が発生した場合、当
    該エージェントに障害が発生したことを前記マネージャ
    に通知する複数のサブマネージャが設けられていること
    を特徴とする障害監視システム。
  2. 【請求項2】 前記サブマネージャは、既に発生してい
    る障害よりも優先度の高い障害が発生した場合、および
    優先度の高い障害が復旧した場合には前記マネージャに
    通知を行う請求項1記載の障害監視システム。
  3. 【請求項3】 前記サブマネージャは、監視を行うエー
    ジェントと同一のネットワークに接続されている請求項
    1または2記載の障害監視システム。
  4. 【請求項4】 前記マネージャと前記各サブマネージャ
    との間および、前記サブマネージャと前記各エージェン
    トとの間で行われる通信の通信プロトコルとしてSNM
    Pが用いられている請求項1から3のいずれか1項記載
    の障害監視システム。
JP2000156633A 2000-05-26 2000-05-26 障害監視システム Pending JP2001337873A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000156633A JP2001337873A (ja) 2000-05-26 2000-05-26 障害監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000156633A JP2001337873A (ja) 2000-05-26 2000-05-26 障害監視システム

Publications (1)

Publication Number Publication Date
JP2001337873A true JP2001337873A (ja) 2001-12-07

Family

ID=18661395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000156633A Pending JP2001337873A (ja) 2000-05-26 2000-05-26 障害監視システム

Country Status (1)

Country Link
JP (1) JP2001337873A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007166234A (ja) * 2005-12-14 2007-06-28 Matsushita Electric Works Ltd Ipアドレス管理方法及び当該方法を用いた遠隔監視装置
US7577098B2 (en) 2005-03-15 2009-08-18 Fujitsu Limited Device and method for network monitoring
US7580361B2 (en) 2002-06-21 2009-08-25 Brother Kogyo Kabushiki Kaisha Network system, information processor and electronic apparatus
JP2012015762A (ja) * 2010-06-30 2012-01-19 Hitachi Systems Ltd リモート監視システムにおけるエージェント実装方式
JP2016146519A (ja) * 2015-02-06 2016-08-12 Necエンジニアリング株式会社 ネットワーク監視システム、監視装置および監視方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07183932A (ja) * 1993-12-24 1995-07-21 Hitachi Ltd 階層型ネットワーク管理システム
JPH07334445A (ja) * 1994-06-14 1995-12-22 Hitachi Ltd 階層型ネットワーク管理システム
JPH09172435A (ja) * 1995-12-20 1997-06-30 Pfu Ltd 分散管理システム
JPH09247144A (ja) * 1996-03-01 1997-09-19 Mitsubishi Electric Corp 階層型ネットワーク管理方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07183932A (ja) * 1993-12-24 1995-07-21 Hitachi Ltd 階層型ネットワーク管理システム
JPH07334445A (ja) * 1994-06-14 1995-12-22 Hitachi Ltd 階層型ネットワーク管理システム
JPH09172435A (ja) * 1995-12-20 1997-06-30 Pfu Ltd 分散管理システム
JPH09247144A (ja) * 1996-03-01 1997-09-19 Mitsubishi Electric Corp 階層型ネットワーク管理方式

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7580361B2 (en) 2002-06-21 2009-08-25 Brother Kogyo Kabushiki Kaisha Network system, information processor and electronic apparatus
US7577098B2 (en) 2005-03-15 2009-08-18 Fujitsu Limited Device and method for network monitoring
JP2007166234A (ja) * 2005-12-14 2007-06-28 Matsushita Electric Works Ltd Ipアドレス管理方法及び当該方法を用いた遠隔監視装置
JP2012015762A (ja) * 2010-06-30 2012-01-19 Hitachi Systems Ltd リモート監視システムにおけるエージェント実装方式
JP2016146519A (ja) * 2015-02-06 2016-08-12 Necエンジニアリング株式会社 ネットワーク監視システム、監視装置および監視方法

Similar Documents

Publication Publication Date Title
CN108965123B (zh) 一种链路切换方法和网络通信系统
US6665262B1 (en) Distributed fault management architecture
US8171350B2 (en) Method and system for providing automatic disabling of network debugging
EP1643681B1 (en) Scheduled determination of networks resource availability
JP4707288B2 (ja) ネットワーク監視装置およびネットワーク監視方法
US8180882B2 (en) Distributed messaging system and method for sharing network status data
US20040105390A1 (en) Method and system for implementing a fast recovery process in a local area network
US20050005271A1 (en) Methods, systems and computer program products for early warning of potential service level agreement violations
JP3206644B2 (ja) ネットワーク管理方式
US10911295B2 (en) Server apparatus, cluster system, cluster control method and program
US20090310483A1 (en) Network device and link switching method
EP1547311A2 (en) Monitoring telecommunication network elements
JP2001337873A (ja) 障害監視システム
JP2000134203A (ja) ネットワーク管理システム及びその管理方法
JP2010205234A (ja) 監視システム、ネットワーク機器、監視情報提供方法およびプログラム
Cisco Operation, Administration, and Maintenance
Cisco Operation, Administration, and Maintenance
CN108964955A (zh) 一种丢失Trap报文查找方法和网络管理系统及一种SNMP代理
JPH09282252A (ja) ネットワーク管理方式
JP3256506B2 (ja) フォールトトレラントネットワーク管理システム
KR20180002180A (ko) Ntp 서버와 ntp 클라이언트 간 시각 동기 상태의 실시간 모니터링 및 분석 장치
WO2022247675A1 (zh) 设备运维方法、网络设备及存储介质
CN112328375B (zh) 一种用于跟踪分布式系统的数据片段的关联方法和装置
KR20000009172A (ko) 장애 등급에 따른 장애 메시지 처리 방법
JPH10336177A (ja) 通信ネットワークにおけるヘルスチェック方式

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041117

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041118

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050406