JP2003345620A - Process monitoring method for multi-node cluster system - Google Patents
Process monitoring method for multi-node cluster systemInfo
- Publication number
- JP2003345620A JP2003345620A JP2002150973A JP2002150973A JP2003345620A JP 2003345620 A JP2003345620 A JP 2003345620A JP 2002150973 A JP2002150973 A JP 2002150973A JP 2002150973 A JP2002150973 A JP 2002150973A JP 2003345620 A JP2003345620 A JP 2003345620A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- server
- monitored
- cluster group
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、多ノードクラスタ
システムにおけるサーバプロセスの監視方法に関する。The present invention relates to a method for monitoring a server process in a multi-node cluster system.
【0002】[0002]
【従来の技術】従来、サーバプロセスを監視する方法と
しては、特開2001−117789号公報に記載のも
のが知られている。これは、プログラム監視条件設定部
を備え、グラフィカルユーザインタフェースまたは定義
ファイルといった外部入力装置により、プログラムの監
視条件とし、第1に監視するプログラム名称を任意の文
字列で設定でき、第2にプログラムを構成する全てまた
は一部のプロセス名称を実行ファイル名またはコマンド
ライン名で設定でき、第3にこの第2の設定で指定した
プロセス名称単位に正常稼動と判断するプロセス数の下
限値および上限値などを閾値として設定できるものであ
り、プロセス数による幅広いプロセス監視を実現してい
る。2. Description of the Related Art Conventionally, as a method for monitoring a server process, a method described in JP-A-2001-117789 has been known. This is provided with a program monitoring condition setting unit, which can be set as a program monitoring condition by an external input device such as a graphical user interface or a definition file, and a program name to be monitored can be set with an arbitrary character string first, and a program can be set secondly. The names of all or some of the constituent processes can be set by the name of the executable file or the name of the command line. Thirdly, the lower limit and upper limit of the number of processes that are determined to be operating normally for each process name specified by the second setting Can be set as a threshold, and a wide range of process monitoring by the number of processes is realized.
【0003】[0003]
【発明が解決しようとする課題】ところで、近年、信頼
性向上及び低コスト化の観点から、複数のシステムに共
通の待機系サーバを準備し、どのシステムでプロセスの
待機系への切り替えが発生しても、同じ待機系サーバへ
切り替わるという多ノードクラスタシステムが存在す
る。しかしながら、現状のプロセス監視方法では、多ノ
ードクラスタシステムにおける待機系サーバ上のプロセ
スを常に監視することは難しい。In recent years, a stand-by server common to a plurality of systems has been prepared from the viewpoints of improving reliability and reducing costs, and in which system a process has been switched to a stand-by system. However, there is a multi-node cluster system that switches to the same standby server. However, with the current process monitoring method, it is difficult to constantly monitor the process on the standby server in the multi-node cluster system.
【0004】以下、これを図7を用いて説明する。[0004] This will be described below with reference to FIG.
【0005】同図において、ここで、1つの監視サーバ
1と、2つの監視対象サーバ2,3と、1つの待機系サ
ーバ4とからなる3ノードクラスタシステムを例にして
説明する。In FIG. 1, a three-node cluster system including one monitoring server 1, two monitored servers 2 and 3, and one standby server 4 will be described as an example.
【0006】監視サーバ1は常時起動した監視サーバ側
監視プロセス(以下、単に監視プロセスという)5を有
し、この監視プロセス5によって監視対象サーバ2,3
を監視する。また、監視対象サーバ2は、1以上のプロ
セス10から構成されてパッケージ(プログラム)をな
すクラスタグループ8を起動し、かかるプロセス10を
監視対象としてこのクラスタグループ8を監視する監視
対象側監視プロセス(以下、単に監視プロセスという)
6を備えている。この監視プロセス6の監視結果は、監
視対象プロセス情報Aとして、監視サーバ1の監視プロ
セス5に送られる。同様にして、監視対象サーバ3も、
1以上のプロセス10から構成されてパッケージ(プロ
グラム)をなすクラスタグループ9を起動し、かかるプ
ロセス10を監視対象としてこのクラスタグループ9を
監視する監視対象側監視プロセス(以下、単に監視プロ
セスという)7を備えている。この監視プロセス7の監
視結果は、監視対象プロセス情報Aとして、監視サーバ
1の監視プロセス5に送られる。The monitoring server 1 has a monitoring server-side monitoring process (hereinafter, simply referred to as a monitoring process) 5 which is always started.
To monitor. Further, the monitoring target server 2 starts a cluster group 8 that is composed of one or more processes 10 and forms a package (program), and monitors the cluster group 8 with the process 10 as a monitoring target. (Hereafter simply referred to as the monitoring process)
6 is provided. The monitoring result of the monitoring process 6 is sent to the monitoring process 5 of the monitoring server 1 as monitoring target process information A. Similarly, the monitored server 3
A monitoring target side monitoring process (hereinafter, simply referred to as a monitoring process) 7 that activates a cluster group 9 that is configured by one or more processes 10 and forms a package (program) and monitors the cluster group 9 with the process 10 as a monitoring target. It has. The monitoring result of the monitoring process 7 is sent to the monitoring process 5 of the monitoring server 1 as monitoring target process information A.
【0007】監視プロセス5では、これら監視対象サー
バ2,3のクラスタグループ8,9毎に、プロセスの監
視項目やクラスタグループが正常と判断するためのプロ
セス数の範囲などの監視設定がなされており、監視対象
サーバ2,3からの監視対象プロセス情報Aと該当する
監視設定とを対比することにより、クラスタグループ
8,9の状態を監視する。In the monitoring process 5, for each of the cluster groups 8 and 9 of the monitored servers 2 and 3, monitoring settings such as a process monitoring item and a range of the number of processes for determining that the cluster group is normal are set. The status of the cluster groups 8 and 9 is monitored by comparing the monitored process information A from the monitored servers 2 and 3 with the corresponding monitoring settings.
【0008】ここで、起動しているクラスタグループ8
に異常をきたして監視対象サーバ2に障害が発生し、こ
の監視対象サーバ2でこのクラスタグループ8を実行で
きなくなると、このクラスタグループ8を待機系サーバ
4で実行させるようにする切り替え、即ち、待機系サー
バ切り替えが行なわれる。このようなとき、監視サーバ
1がこの待機系サーバ4を監視することが考えられる
が、このためには、この監視サーバ1の監視プロセス5
に待機系サーバ4でのクラスタグループ8に対して監視
設定がなされなければならない。Here, the activated cluster group 8
When a failure occurs in the monitored server 2 due to an abnormality in the monitored server 2 and the monitored server 2 cannot execute the cluster group 8, switching to execute the cluster group 8 on the standby server 4 is performed, that is, The standby server is switched. In such a case, it is conceivable that the monitoring server 1 monitors the standby server 4. For this purpose, the monitoring process 5 of the monitoring server 1 is performed.
First, the monitoring setting for the cluster group 8 in the standby server 4 must be performed.
【0009】しかしながら、このようにするためには、
待機系サーバ4にも監視プロセスを設け、その監視結果
を監視サーバ1の監視プロセス5に通知するように構成
することが考えられるが、待機系サーバ4は、システム
が正常な状態では、起動中のクラスタグループが存在せ
ず、このような場合、待機系サーバの監視プロセスから
のかかる状態に対する監視対象プロセス情報とこの待機
系サーバに対する監視設定とから、監視サーバ1の監視
プロセス5は、待機系サーバ4に障害があると、判定す
ることになる。However, in order to do this,
It is conceivable to provide a monitoring process in the standby server 4 and to notify the monitoring process 5 of the monitoring server 1 of the monitoring result. However, when the system is in a normal state, the standby server 4 is running. In such a case, the monitoring process 5 of the monitoring server 1 determines that the monitoring process 5 of the monitoring server 1 is based on the monitoring target process information for the status from the monitoring process of the standby server and the monitoring setting for the standby server. It is determined that the server 4 has a failure.
【0010】そこで、かかる状態で監視対象サーバ2か
らクラスタグループ8の待機系サーバ切り替えがある
と、監視サーバ1での監視プロセス5では、待機系サー
バ4に対し、このクラスタグループ8に該当する監視設
定への変更(更新)が行なわれなければならないが、図
示する構成のシステムでは、待機系サーバ切り替えに対
し、該当する監視設定への正確な変更を自動的に行なう
ことができない。このため、現状では、待機系サーバ4
の監視は行なわれていない。[0010] Therefore, if the standby server is switched from the monitored server 2 to the cluster group 8 in this state, the monitoring process 5 in the monitoring server 1 monitors the standby server 4 for the monitoring corresponding to the cluster group 8. The setting must be changed (updated). However, in the system having the configuration shown in the figure, it is not possible to automatically change the monitoring setting to the corresponding setting when the standby server is switched. For this reason, at present, the standby server 4
Is not monitored.
【0011】そこで、待機系サーバ切り替え後では、こ
の待機系サーバ4で起動しているクラスタグループ8の
状態を監視することができず、これに異常が発生して
も、それを知るすべがなかった。Therefore, after the standby server is switched, the state of the cluster group 8 running on the standby server 4 cannot be monitored, and even if an abnormality occurs, there is no way to know it. Was.
【0012】本発明の目的は、かかる問題を解消し、ク
ラスタグループの動き(状態の遷移)を常に把握し、こ
れに合わせて監視設定を自動的に変更することを可能と
し、多ノードクラスタシステムにおける待機系切り替え
に対応できるようにしたプロセス監視方法を提供するこ
とにある。SUMMARY OF THE INVENTION An object of the present invention is to solve such a problem, to constantly grasp the movement (change of state) of a cluster group, and to automatically change a monitoring setting in accordance with the movement. It is an object of the present invention to provide a process monitoring method adapted to cope with the switching of a standby system.
【0013】[0013]
【課題を解決するための手段】上記目的を達成するため
に、本発明は、監視サーバと、監視サーバによってクラ
スタグループが監視される監視対象サーバと、監視対象
サーバに共通の待機系サーバとからなる多ノードクラス
タシステムのプロセス監視方法において、監視対象サー
バと待機系サーバとは夫々、常時起動しているチェック
プロセスによってオペレーティングシステムのプロセス
管理テーブルを一定時間間隔で確認して、クラスタグル
ープの起動,停止を示す確認結果を監視サーバ上の監視
設定変更プロセスに通知し、監視設定変更プロセスは、
通知されたこの確認結果を基に、監視対象サーバと待機
系サーバとの間でのクラスタグループの切り替わりを認
識し、監視設定変更プロセスでのこの認識を基に、クラ
スタグループが起動している監視対象サーバと待機系サ
ーバとのプロセス監視を行なうものである。In order to achieve the above object, the present invention provides a monitoring server, a monitored server whose cluster group is monitored by the monitoring server, and a standby server common to the monitored server. In the process monitoring method of a multi-node cluster system, the monitored server and the standby server respectively check the process management table of the operating system at regular time intervals by a check process that is always running, and start and stop the cluster group. The confirmation result indicating the stop is notified to the monitoring setting change process on the monitoring server.
Based on the result of the notification, the switch of the cluster group between the monitored server and the standby server is recognized, and based on this recognition in the monitoring setting change process, the monitoring that the cluster group is running It monitors processes of the target server and the standby server.
【0014】そして、監視サーバには、起動中のクラス
タグループと監視対象サーバ,待機系サーバとの対応関
係、及び起動中のクラスタグループに対応する監視設定
とを示す監視設定テーブルが設けられており、監視設定
変更プロセスにより、監視対象サーバと待機系サーバと
の夫々毎に、チェックプロセスから通知される確認結果
と監視設定テーブルとを比較して、監視対象サーバと待
機系サーバとの間のクラスタグループの切り替わりを認
識し、かつこの切り替わりの認識とともに、監視設定テ
ーブルを変更するものである。The monitoring server is provided with a monitoring setting table indicating the correspondence between the activated cluster group, the monitored server, and the standby server, and the monitoring settings corresponding to the activated cluster group. The monitoring setting change process compares the confirmation result notified from the check process with the monitoring setting table for each of the monitored server and the standby server, and compares the cluster between the monitored server and the standby server. The switching of the group is recognized, and the monitoring setting table is changed together with the recognition of the switching.
【0015】また、監視設定変更プロセスによるクラス
タグループの切り替わりの認識に伴って、クラスタグル
ープが起動もしくは停止した監視対象サーバまたは待機
系サーバに対する監視設定の変更処理を行なうものであ
る。Further, in accordance with the recognition of the switching of the cluster group by the monitoring setting change process, a process of changing the monitoring setting for the monitored server or the standby server in which the cluster group has been started or stopped is performed.
【0016】また、この監視設定は、予め各クラスタグ
ループ毎に及びクラスタグループの組み合わせに応じ
て、監視サーバに設けられており、クラスタグループが
起動した監視対象サーバもしくは1以上のクラスタグル
ープが起動した待機系サーバを、該当する監視設定を選
択・設定することにより、監視するものである。The monitoring setting is provided in the monitoring server in advance for each cluster group and in accordance with the combination of the cluster groups, and the monitoring target server started by the cluster group or one or more cluster groups are started. The standby server is monitored by selecting and setting the corresponding monitoring setting.
【0017】[0017]
【発明の実施の形態】以下、本発明を実施形態を図面を
参照して具体的に説明する。図1〜図4は本発明による
多ノードクラスタシステムのプロセス監視方法の一実施
形態を示すシステム図であって、11は監視設定変更プ
ロセス、12はメモリ、13は監視設定テーブル、14
は監視プロセス、15〜17はチェックプロセスであ
り、図7に対応する部分には同一符号をつけている。な
お、ここでは、図7の場合と同様に、3ノードクラスタ
システムの場合を例に挙げて説明することとする。Embodiments of the present invention will be specifically described below with reference to the drawings. 1 to 4 are system diagrams showing an embodiment of a process monitoring method for a multi-node cluster system according to the present invention, wherein 11 is a monitoring setting change process, 12 is a memory, 13 is a monitoring setting table, 14
Is a monitoring process, 15 to 17 are check processes, and portions corresponding to those in FIG. 7 are denoted by the same reference numerals. Here, as in the case of FIG. 7, a case of a three-node cluster system will be described as an example.
【0018】図1は通常時のプロセス監視形態を示すも
のである。FIG. 1 shows a normal process monitoring mode.
【0019】同図において、各監視対象サーバ2,3に
は、チェックプロセス15,16が設けられ、また、待
機系サーバ4においても、監視プロセス14とチェック
プロセス17とが設けられて監視対象サーバとしても機
能することにしている。また、監視サーバ1において
は、監視設定変更プロセス11とメモリ12とが設けら
れ、このメモリ12には、夫々の監視対象サーバ2,
3,4に対する監視設定テーブル13が書込み,読出し
可能に記憶されている。In FIG. 1, each of the monitored servers 2 and 3 is provided with a check process 15 and 16, and the standby server 4 is provided with a monitor process 14 and a check process 17. It also works as well. In the monitoring server 1, a monitoring setting change process 11 and a memory 12 are provided.
The monitoring setting table 13 for 3 and 4 is stored so as to be writable and readable.
【0020】クラスタグループ8,9が起動する監視対
象サーバ2,3での監視プロセス6,7は、該当するク
ラスタグループ8,9の監視対象プロセス情報Aを取得
し、これを監視サーバ1の監視プロセス5に通知する。
この監視プロセス5では、各クラスタグループ8,9の
監視設定(夫々を監視設定a,bとする)やこれらクラ
スタグループ8,9の組み合わせの監視設定(これを監
視設定cとする)が設けられており、監視対象サーバ2
に対しては、クラスタグループ8に対する監視設定a
が、監視対象サーバ3に対しては、クラスタグループ9
に対する監視設定bが夫々選択・設定され、監視対象サ
ーバ2,3毎に、通知された監視対象プロセス情報Aと
該当する監視設定とを対比することにより、クラスタグ
ループ8,9の起動状態を監視している。そして、監視
プロセス5は、例えば、監視対象サーバ2からの監視対
象プロセス情報Aと監視設定aとから、クラスタグルー
プ8のプロセス数が規定の範囲外となったり、プロセス
が異常終了したりしたことを認識すると、この監視対象
サーバ2が異常と判定し、設定された処理(例えば、パ
トランプを鳴動させたり、警告メッセージを管理者に通
知するなどの処理)を実行する。The monitoring processes 6 and 7 of the monitored servers 2 and 3 started by the cluster groups 8 and 9 acquire the monitored process information A of the corresponding cluster groups 8 and 9 and monitor the monitored process information A of the monitoring server 1. Notify process 5.
In the monitoring process 5, monitoring settings for each of the cluster groups 8 and 9 (respectively referred to as monitoring settings a and b) and monitoring settings for a combination of the cluster groups 8 and 9 (referred to as monitoring settings c) are provided. Monitoring server 2
Is a monitoring setting a for the cluster group 8
However, for the monitored server 3, the cluster group 9
Of the cluster groups 8 and 9 by comparing the notified monitoring target process information A with the corresponding monitoring setting for each of the monitoring target servers 2 and 3. are doing. The monitoring process 5 determines, for example, that the number of processes in the cluster group 8 is out of the specified range or that the process has terminated abnormally based on the monitoring target process information A and the monitoring setting a from the monitoring target server 2. When the monitoring target server 2 is recognized, the monitoring target server 2 determines that there is an abnormality, and executes a set process (for example, a process of sounding a patrol lamp or notifying an administrator of a warning message).
【0021】以上の動作は従来のシステムとほとんど変
わりないが、この実施形態は、監視対象サーバ2,3,
4や監視サーバ1を図示する上記の構成とすることによ
り、本来の待機系サーバ4も監視対象サーバとして含め
て、クラスタグループ8,9の動き(状態の遷移)を常
時監視し、この動きとともに、該当する監視対象サーバ
2,3,4に対して、監視プロセス5で正しい監視設定
を自動的に行なうことができるようにしたものである。
これを可能とするために、監視対象サーバ2,3にチェ
ックプロセス15,16を追加し、待機系サーバ4に監
視プロセス14とチェックプロセス17とを設けて監視
対象サーバの構成とし、さらに、監視サーバ1では、監
視設定変更プロセス11と監視設定テーブル13を備え
たメモリ12とを追加したものである。The above operation is almost the same as that of the conventional system, however, in this embodiment, the monitored servers 2, 3,
4 and the monitoring server 1 in the above-described configuration, the original standby server 4 is also included as a monitoring target server, and the movement (state transition) of the cluster groups 8 and 9 is constantly monitored. The monitoring process 5 can automatically perform the correct monitoring setting for the corresponding monitoring target servers 2, 3, and 4.
In order to make this possible, check processes 15 and 16 are added to the monitored servers 2 and 3, and a monitoring process 14 and a check process 17 are provided in the standby server 4 to configure a monitored server. In the server 1, a monitoring setting change process 11 and a memory 12 having a monitoring setting table 13 are added.
【0022】ここで、監視サーバ1の監視設定変更プロ
セス11と監視対象サーバ2,3,4のチェックプロセ
ス15,16,17とは常時起動しており、監視設定変
更プロセス11と監視対象サーバ2,3,4のチェック
プロセス15,16,17との間で、図5に示す処理動
作が行なわれる。Here, the monitoring setting change process 11 of the monitoring server 1 and the check processes 15, 16, and 17 of the monitoring target servers 2, 3, and 4 are always running, and the monitoring setting change process 11 and the monitoring target server 2 , 3, and 4 check processes 15, 16, and 17, the processing operations shown in FIG.
【0023】即ち、チェックプロセス15,16,17
は、一定時間間隔で監視対象サーバ2,3,4のオペレ
ーティングシステムのプロセス管理テーブルを確認し
(ステップ100)、その確認結果を、起動中クラスタ
グループ情報Bとして、監視サーバ1上の監視設定変更
プロセス11に通知する(ステップ101)。監視設定
変更プロセス11は、かかる起動中クラスタグループ情
報Bをメモリ12での監視設定テーブル13の内容と比
較し、クラスタグループ8,9に動きがないかどうか
(即ち、待機系サーバ切り替わりなどによって状態の変
化(遷移)がないかどうか)を検出する。That is, the check processes 15, 16, 17
Checks the process management tables of the operating systems of the monitored servers 2, 3, and 4 at regular time intervals (step 100), and uses the check result as the active cluster group information B to change the monitoring setting on the monitoring server 1. The process 11 is notified (step 101). The monitoring setting change process 11 compares the running cluster group information B with the contents of the monitoring setting table 13 in the memory 12 and determines whether or not the cluster groups 8 and 9 are moving (that is, whether the cluster groups 8 and 9 are in a state due to switching of the standby server, etc. Change (transition) is detected).
【0024】監視設定テーブル13では、各クラスタグ
ループ8,9がどの監視対象サーバで起動しているかを
示す情報とそのときの監視プロセス5で設定される監視
対象サーバに対する監視設定とが表わされている。この
監視設定テーブル13の図示の状態では、クラスタグル
ープ8が監視対象サーバ2で起動しており、監視プロセ
ス5において、監視対象サーバ2に対し、クラスタグル
ープ8の監視設定aが選択・設定されていることを示し
ており、また、クラスタグループ9が監視対象サーバ3
で起動しており、監視プロセス5において、この監視対
象サーバ3に対し、クラスタグループ9の監視設定bが
選択・設定されていることを示しており、さらに、監視
対象サーバ(待機系サーバ)4では、このとき待機系サ
ーバ切り替えがなされていないので、起動するクラスタ
グループが存在せず、従って、監視プロセス5では、こ
の監視対象サーバ4に対する監視設定の選択・設定がな
されていないことを示している。従って、監視プロセス
5は、待機系サーバ4を監視していない。The monitoring setting table 13 shows information indicating which monitoring target server each of the cluster groups 8 and 9 is running and the monitoring setting for the monitoring target server set by the monitoring process 5 at that time. ing. In the illustrated state of the monitoring setting table 13, the cluster group 8 is activated on the monitored server 2, and the monitoring setting a of the cluster group 8 is selected and set for the monitored server 2 in the monitoring process 5. And that the cluster group 9 is the monitored server 3
Indicates that the monitoring setting b of the cluster group 9 has been selected and set for the monitoring target server 3 in the monitoring process 5, and the monitoring target server (standby server) 4 In this case, since the standby server has not been switched at this time, there is no cluster group to be activated, and therefore, the monitoring process 5 indicates that the monitoring setting has not been selected and set for the monitoring target server 4. I have. Therefore, the monitoring process 5 does not monitor the standby server 4.
【0025】そして、夫々の監視対象サーバ2,3,4
のチェックプロセス15,16,17から起動中クラス
タグループ情報Bが通知されると、監視設定変更プロセ
ス11は、監視対象サーバ2,3,4毎に受信した起動
中クラスタグループ情報Bと監視設定テーブル13での
該当する監視対象サーバの情報とを比較する。この場
合、各監視対象サーバ2,3,4からの起動中クラスタ
グループ情報Bは監視設定テーブル13の内容と合致し
ており、これにより、図5に示す動作が行なわれる毎
に、図6におけるステップ200,201からなる処理
が行なわれることになる。The respective monitored servers 2, 3, and 4
When the starting cluster group information B is notified from the check processes 15, 16, and 17 of the monitoring target, the monitoring setting change process 11 executes the starting cluster group information B and the monitoring setting table received for each of the monitored servers 2, 3, and 4. 13 and the information of the corresponding monitored server is compared. In this case, the running cluster group information B from each of the monitored servers 2, 3, and 4 matches the contents of the monitoring setting table 13, so that each time the operation shown in FIG. The processing consisting of steps 200 and 201 is performed.
【0026】図1に示すかかる状態で、いま、監視対象
サーバ2に障害が発生したとすると、監視対象サーバ2
の待機系サーバ切り替えが発生し、クラスタグループ8
が待機系サーバである監視対象サーバ4に切り替わり、
この監視対象サーバ4で起動することになる。図2はシ
ステムのかかる状態を示すものであり、この場合の処理
動作を図6を用いて説明する。In the state shown in FIG. 1, if it is assumed that a failure has occurred in the monitored server 2,
Switching of the standby server of cluster group 8
Is switched to the monitored server 4 which is a standby server,
The monitoring target server 4 is started. FIG. 2 shows such a state of the system, and the processing operation in this case will be described with reference to FIG.
【0027】図2及び図6において、先に説明したよう
に、監視サーバ1上の監視設定変更プロセス11は、各
監視対象サーバ2,3,4から起動中クラスタグループ
情報Bの通知を受けており(ステップ200)、待機系
サーバ切り替えが発生しなければ(ステップ201)、
一定時間間隔での図5に示す処理動作に伴い、ステップ
200,201の動作を繰り返すことになる。In FIG. 2 and FIG. 6, as described above, the monitoring setting change process 11 on the monitoring server 1 receives notification of the active cluster group information B from each of the monitored servers 2, 3, and 4. If there is no standby server switching (step 201),
With the processing operation shown in FIG. 5 at regular time intervals, the operations of steps 200 and 201 are repeated.
【0028】しかし、上記のように、監視対象サーバ2
のみで待機系サーバ切り替えが発生すると、監視対象サ
ーバ4上のチェックプロセス17は、この監視対象サー
バ4のオペレーティングシステムのプロセス管理テーブ
ルで起動中クラスタグループ8を確認し(図5のステッ
プ100)、監視サーバ1上の監視設定変更プロセス1
1に起動中クラスタグループ情報Bを通知する(図5の
ステップ101)。このときには、監視サーバ1のメモ
リ12上に管理している監視設定テーブル13では、情
報が変更されずに図1に示した内容がそのまま保持され
ているが、監視設定変更プロセス11は、監視設定サー
バ4のチェックプロセス17からの起動中クラスタグル
ープ情報Bを受信すると(ステップ200)、これとメ
モリ12上に管理している図1に示す監視設定テーブル
13での監視対象サーバ4に対する情報とを比較する
(ステップ201)。このとき、このチェックプロセス
17からの起動中クラスタグループ情報Bは、監視対象
サーバ4でクラスタグループ8のみが起動したことを表
わしているので、監視設定変更プロセス11は、これを
監視設定テーブル13での監視対象サーバ4に対する情
報(即ち、起動中クラスタグループがないことを示す情
報)と比較することにより(ステップ201)、監視対
象サーバ4で起動中クラスタグループがない状態からク
ラスタグループ8のみが起動した状態に遷移したことを
認識し(ステップ202)、監視プロセス5で監視設定
の変更処理を実行する(ステップ205)。この変更処
理は、監視プロセス5で、監視対象サーバ4に対し、正
常時に監視対象サーバ2を監視するのに使用していた監
視設定aを選択設定するものである。これにより、監視
プロセス5が監視対象サーバ4の監視を開始する。However, as described above, the monitored server 2
When the standby server switching occurs only in the standby server, the check process 17 on the monitored server 4 checks the active cluster group 8 in the process management table of the operating system of the monitored server 4 (Step 100 in FIG. 5), Monitoring setting change process 1 on monitoring server 1
1 is notified of the running cluster group information B (step 101 in FIG. 5). At this time, in the monitoring setting table 13 managed on the memory 12 of the monitoring server 1, the information shown in FIG. When the booting cluster group information B is received from the check process 17 of the server 4 (step 200), it is compared with the information for the monitored server 4 in the monitoring setting table 13 shown in FIG. Compare (step 201). At this time, since the running cluster group information B from the check process 17 indicates that only the cluster group 8 has been started on the monitored server 4, the monitoring setting change process 11 indicates this in the monitoring setting table 13. Of the monitored server 4 (that is, information indicating that there is no active cluster group) (step 201), only the cluster group 8 is activated from the state in which there is no active cluster group on the monitored server 4. The monitoring process 5 recognizes that the state has transitioned to the changed state (step 202), and executes the monitoring setting changing process in the monitoring process 5 (step 205). In this change process, the monitoring process 5 selects and sets the monitoring setting a used for monitoring the monitoring target server 2 when the monitoring target server 4 is normal. Thereby, the monitoring process 5 starts monitoring the monitored server 4.
【0029】しかる後、監視設定変更プロセス11は、
メモリ12上の監視設定テーブル13の変更処理を実行
する(ステップ206)。この変更処理は、クラスタグ
ループ8のみが監視対象サーバ4で起動中であり、この
とき、監視プロセス5での監視対象サーバ4に対する監
視設定が監視設定aであるように、監視設定テーブル1
3の内容を変更するものである。Thereafter, the monitoring setting change process 11
The monitoring setting table 13 on the memory 12 is changed (step 206). In this change processing, only the cluster group 8 is running on the monitored server 4, and at this time, the monitoring setting table 1 is set so that the monitoring setting for the monitored server 4 in the monitoring process 5 is the monitoring setting a.
3 is to be changed.
【0030】一方、監視対象サーバ2では、クラスタグ
ループ8の待機系サーバ切り替えがあると、この監視対
象サーバ2上のチェックプロセス15も、監視サーバ1
上の監視設定変更プロセス11へ起動中のクラスタグル
ープが存在しない状態になったことを示す起動中クラス
タグループ情報Bを通知する(図5のステップ10
1)。この通知を受信すると(ステップ200)、この
監視設定変更プロセス11は、この起動中クラスタグル
ープ情報Bとメモリ12上の監視設定テーブル13での
監視対象サーバ2の情報とを比較することにより(ステ
ップ201)、起動中のクラスタグループが存在しない
状態になったことを認識し(ステップ202)、監視プ
ロセス5での監視対象サーバ2での監視設定aを解除さ
せてこの監視サーバ2の監視を終了する(ステップ20
3)。これにより、監視対象サーバ2は監視設定の対象
外となる。On the other hand, in the monitored server 2, when the standby server of the cluster group 8 is switched, the check process 15 on the monitored server 2 is also performed by the monitoring server 1.
The running cluster group information B indicating that the running cluster group does not exist is notified to the monitoring setting change process 11 (step 10 in FIG. 5).
1). Upon receiving this notification (step 200), the monitoring setting change process 11 compares the running cluster group information B with the information of the monitoring target server 2 in the monitoring setting table 13 on the memory 12 (step 200). 201), it is recognized that there is no active cluster group (step 202), the monitoring setting a on the monitoring target server 2 in the monitoring process 5 is canceled, and the monitoring of this monitoring server 2 is ended. (Step 20
3). As a result, the monitored server 2 is excluded from the monitoring setting.
【0031】なお、監視設定変更プロセス11は、監視
対象サーバ2のチェックプロセス15からの起動中クラ
スタグループ情報Bと監視対象サーバ4のチェックプロ
セス17からの起動中クラスタグループ情報Bとによ
り、監視対象サーバ2のクラスタグループ8の待機系サ
ーバ切り替えを認識することができ、この認識のもとに
して、上記のように、監視プロセス5が監視対象サーバ
4に対して監視設定aを選択・設定することができる。The monitoring setting change process 11 uses the starting cluster group information B from the check process 15 of the monitoring target server 2 and the starting cluster group information B from the checking process 17 of the monitoring target server 4. The switching of the standby server of the cluster group 8 of the server 2 can be recognized, and based on this recognition, the monitoring process 5 selects and sets the monitoring setting a for the monitoring target server 4 as described above. be able to.
【0032】また、監視対象サーバ2の監視終了処理
(ステップ203)と監視対象サーバ4に対する監視設
定aの選択・設定(ステップ205)とともに、監視設
定変更プロセス11は、監視設定テーブル13の変更処
理を実行する(ステップ206)。これは、図1に示し
た監視設定テーブル13をシステムの新たな状態に合致
するように変更するものであり、クラスタグループ8が
監視対象サーバ4で起動中とし、このときの監視対象サ
ーバ4に対して監視プロセス5での監視設定を監視設定
aとし、図2に示すような内容とするものである。In addition to the process of terminating the monitoring of the monitored server 2 (step 203) and the selection and setting of the monitoring setting a for the monitored server 4 (step 205), the monitoring setting change process 11 performs the process of changing the monitoring setting table 13. Is executed (step 206). This is to change the monitoring setting table 13 shown in FIG. 1 so as to match the new state of the system. It is assumed that the cluster group 8 is starting up on the monitored server 4 and the monitored server 4 On the other hand, the monitoring setting in the monitoring process 5 is referred to as monitoring setting a, and has the contents as shown in FIG.
【0033】以上の処理が終わると、監視サーバ1の監
視プロセス5は、上記と同様にして、監視対象サーバ
3,4を監視し、また、夫々の監視対象サーバ2,3,
4のチェックプロセス15,16,17が一定時間間隔
で図5に示す動作を繰り返す。When the above process is completed, the monitoring process 5 of the monitoring server 1 monitors the monitored servers 3 and 4 in the same manner as described above, and monitors the monitored servers 2 and 3 respectively.
The check processes 15, 16, and 17 of 4 repeat the operation shown in FIG. 5 at regular time intervals.
【0034】以上説明した図2に示す状態で、さらに、
他の監視対象サーバ、この場合、監視対象サーバ3にも
障害が発生して、監視対象サーバ3のクラスタグループ
9が待機系サーバである監視対象サーバ4に切り替わる
場合もある。図3はかかる状態を示すものであって、こ
のための処理動作を、以下、これを図3及び図6を用い
て説明する。In the state shown in FIG. 2 described above,
In some cases, a failure occurs in another monitored server, in this case, the monitored server 3, and the cluster group 9 of the monitored server 3 is switched to the monitored server 4 that is a standby server. FIG. 3 shows such a state, and the processing operation for this will be described below with reference to FIGS.
【0035】図3及び図6において、先に説明したよう
に、監視サーバ1上の監視設定変更プロセス11は、各
監視対象サーバ2,3,4から起動中クラスタグループ
情報Bの通知を受けており(ステップ200)、待機系
サーバ切り替えが発生しなければ(ステップ201)、
図2に示す状態で、一定時間間隔での図5に示す処理動
作に伴い、ステップ200,201の動作を繰り返すこ
とになる。In FIG. 3 and FIG. 6, as described above, the monitoring setting change process 11 on the monitoring server 1 receives notification of the active cluster group information B from each of the monitored servers 2, 3, and 4. If there is no standby server switching (step 201),
In the state shown in FIG. 2, the operations of steps 200 and 201 are repeated with the processing operation shown in FIG. 5 at regular time intervals.
【0036】かかる状態で、上記のように、監視対象サ
ーバ3で待機系サーバ切り替えが発生すると、監視対象
サーバ4上のチェックプロセス17は、この監視対象サ
ーバ4のオペレーティングシステムのプロセス管理テー
ブルで起動中クラスタグループ8,9を確認し(図5の
ステップ100)、組み合わせチェック処理を実行する
とともに、監視サーバ1上の監視設定変更プロセス11
にこの組み合わせチェック処理を示す起動中クラスタグ
ループ情報Bを通知する(図5のステップ101)。In this state, when the standby server switching occurs in the monitored server 3 as described above, the check process 17 on the monitored server 4 starts up in the process management table of the operating system of the monitored server 4. The middle cluster groups 8 and 9 are confirmed (step 100 in FIG. 5), the combination check process is executed, and the monitoring setting change process 11 on the monitoring server 1 is performed.
Is notified of the activated cluster group information B indicating the combination check processing (step 101 in FIG. 5).
【0037】この組み合わせチェック処理は、起動して
いるクラスタグループが2個以上となった場合にコール
されるものであって、これら起動しているクラスタグル
ープを夫々チェックし、監視サーバ1で予め設定されて
いる監視設定の中からクラスタグループの組み合わせに
対応した監視設定(この場合、上記の監視設定c)を選
択させるための処理である。This combination check process is called when the number of activated cluster groups becomes two or more. Each of the activated cluster groups is checked and set in the monitoring server 1 in advance. This is a process for selecting a monitoring setting corresponding to the combination of cluster groups (in this case, the above-described monitoring setting c) from the monitoring settings that have been set.
【0038】そして、このときには、監視サーバ1のメ
モリ12上に管理している監視設定テーブル13では、
情報が変更されずに図2に示した内容がそのまま保持さ
れているが、監視設定変更プロセス11は、監視設定サ
ーバ4のチェックプロセス17からの起動中クラスタグ
ループ情報Bを受信すると(ステップ200)、これと
メモリ12上に管理している図2に示す監視設定テーブ
ル13での監視対象サーバ4に対する情報とを比較する
(ステップ201)。このとき、このチェックプロセス
17からの起動中クラスタグループ情報Bは、監視対象
サーバ4でクラスタグループ8,9が起動したことを表
わしているので、監視設定変更プロセス11は、これを
監視設定テーブル13での監視対象サーバ4に対する情
報(即ち、クラスタグループ8のみが起動しているを示
す情報)と比較することにより(ステップ201)、監
視対象サーバ4でクラスタグループ8のみが起動してい
る状態からクラスタグループ8,9が起動した状態に遷
移したことを認識し(ステップ202)、これに伴って
監視プロセス5が監視設定の変更処理を実行する。この
変更処理は、2以上のクラスタグループの組み合わせを
確認し(ステップ204:この場合には、2つのクラス
タグループ8,9の組み合わせであることを確認す
る)、監視プロセス5で、監視対象サーバ4に対し、か
かる組み合わせに対応した上記の監視設定cを選択・設
定するものである(ステップ205)。これにより、監
視プロセス5が監視対象サーバ4の監視を続行する。At this time, in the monitoring setting table 13 managed on the memory 12 of the monitoring server 1,
Although the information shown in FIG. 2 is maintained as it is without being changed, the monitoring setting change process 11 receives the starting cluster group information B from the check process 17 of the monitoring setting server 4 (step 200). This is compared with the information for the monitored server 4 in the monitoring setting table 13 shown in FIG. 2 managed on the memory 12 (step 201). At this time, since the running cluster group information B from the check process 17 indicates that the cluster groups 8 and 9 have been started on the monitored server 4, the monitoring setting change process 11 indicates this to the monitoring setting table 13. From the state in which only the cluster group 8 is running on the monitored server 4 by comparing with the information on the monitored server 4 in step (i.e., information indicating that only the cluster group 8 is running) (step 201). Recognizing that the cluster groups 8 and 9 have transitioned to the activated state (step 202), the monitoring process 5 executes a process of changing the monitoring settings accordingly. In this change process, a combination of two or more cluster groups is confirmed (step 204: in this case, it is confirmed that the combination is a combination of two cluster groups 8 and 9). In response to this, the above-mentioned monitoring setting c corresponding to such a combination is selected and set (step 205). As a result, the monitoring process 5 continues monitoring the monitoring target server 4.
【0039】しかる後、監視設定変更プロセス11は、
メモリ12上の監視設定テーブル13の変更処理を実行
する(ステップ203)。この変更処理は、クラスタグ
ループ8,9が監視対象サーバ4で起動中であり、この
とき、監視プロセス5での監視対象サーバ4に対する監
視設定が監視設定cであるように、監視設定テーブル1
3の内容を変更するものである。Thereafter, the monitoring setting change process 11
The monitoring setting table 13 on the memory 12 is changed (step 203). In this change processing, the monitoring setting table 1 is set so that the cluster groups 8 and 9 are running on the monitored server 4 and the monitoring setting for the monitored server 4 in the monitoring process 5 is the monitoring setting c at this time.
3 is to be changed.
【0040】一方、監視対象サーバ3では、クラスタグ
ループ9の待機系サーバ切り替えがあると、この監視対
象サーバ3上のチェックプロセス16も、監視サーバ1
上の監視設定変更プロセス11へ起動中のクラスタグル
ープ9が存在しない状態になったことを示す起動中クラ
スタグループ情報Bを通知する(図5のステップ10
1)。この通知を受信すると(ステップ200)、監視
サーバ1上の監視設定変更プロセス11は、この起動中
クラスタグループ情報Bとメモリ12上の監視設定テー
ブル13での監視対象サーバ3の情報とを比較すること
により(ステップ201)、起動中のクラスタグループ
が存在しない状態になったことを認識し(ステップ20
2)、監視プロセス5での監視対象サーバ3での監視設
定bを解除させてこの監視サーバ3の監視を終了する
(ステップ203)。これにより、監視対象サーバ3も
監視設定の対象外となる。On the other hand, in the monitored server 3, when the standby server of the cluster group 9 is switched, the check process 16 on the monitored server 3 is also performed by the monitoring server 1.
The running cluster group information B indicating that the running cluster group 9 does not exist is notified to the monitoring setting change process 11 (step 10 in FIG. 5).
1). Upon receiving this notification (step 200), the monitoring setting change process 11 on the monitoring server 1 compares the running cluster group information B with the information of the monitoring target server 3 in the monitoring setting table 13 on the memory 12. As a result (step 201), it is recognized that the active cluster group does not exist (step 20).
2) The monitoring setting b of the monitoring target server 3 in the monitoring process 5 is released, and the monitoring of the monitoring server 3 is terminated (step 203). As a result, the monitored server 3 is also excluded from the monitoring setting.
【0041】なお、この場合も、監視設定変更プロセス
11は、監視対象サーバ4のチェックプロセス17から
の起動中クラスタグループ情報Bと監視対象サーバ3の
チェックプロセス16からの起動中クラスタグループ情
報Bとにより、監視対象サーバ3のクラスタグループ9
の待機系サーバ切り替えを認識することができ、この認
識のもとにして、上記のように、監視プロセス5が監視
対象サーバ4に対して監視設定cを選択・設定するよう
にすることもできる。In this case as well, the monitoring setting change process 11 includes the starting cluster group information B from the check process 17 of the monitored server 4 and the starting cluster group information B from the check process 16 of the monitored server 3. The cluster group 9 of the monitored server 3
Can be recognized, and based on this recognition, the monitoring process 5 can select and set the monitoring setting c for the monitoring target server 4 as described above. .
【0042】また、監視対象サーバ3の監視終了処理
(ステップ203)と監視対象サーバ4に対する監視設
定cの選択・設定(ステップ205)とともに、監視設
定変更プロセス11は、監視設定テーブル13の変更処
理を実行する(ステップ206)。これは、図2に示し
た監視設定テーブル13をシステムの新たな状態に合致
するように変更するものであり、クラスタグループ9も
監視対象サーバ4で起動中とし、このときの監視対象サ
ーバ4に対して監視プロセス5での監視設定を監視設定
cとし、図3に示すような内容とするものである。In addition to the process of terminating the monitoring of the monitored server 3 (step 203) and the selection and setting of the monitoring setting c for the monitored server 4 (step 205), the monitoring setting change process 11 performs the process of changing the monitoring setting table 13. Is executed (step 206). This changes the monitoring setting table 13 shown in FIG. 2 so as to match the new state of the system. The cluster group 9 is also activated on the monitored server 4 and the monitored server 4 On the other hand, the monitoring setting in the monitoring process 5 is referred to as monitoring setting c, and has the contents shown in FIG.
【0043】次に、障害が発生した監視対象サーバが回
復し、待機系サーバで起動していたクラスタグループが
元の監視対象サーバに復帰する(切り戻る)場合の動作
について説明する。Next, a description will be given of the operation in the case where the monitored server in which a failure has occurred is recovered, and the cluster group which has been activated in the standby server returns (switches back) to the original monitored server.
【0044】システムが図3に示す状態となり、その
後、待機系サーバである監視対象サーバ4で起動中のク
ラスタグループ8が元の監視対象サーバ2に戻るような
場合もある(これを、以下、待機系サーバ切り戻りとい
う)。図4はかかる状態を示すものであって、このため
の処理動作を、以下、これを図4及び図6を用いて説明
する。In some cases, the system enters the state shown in FIG. 3, and thereafter the cluster group 8 running on the monitored server 4 which is the standby server returns to the original monitored server 2 (this will be described below). Standby server switchback). FIG. 4 shows such a state, and the processing operation for this will be described below with reference to FIGS.
【0045】図4及び図6において、先に説明したよう
に、監視サーバ1上の監視設定変更プロセス11は、各
監視対象サーバ2,3,4から起動中クラスタグループ
情報Bの通知を受けており(ステップ200)、クラス
タグループ8,9の状態の遷移が発生しなければ(ステ
ップ201)、図3に示す状態で、一定時間間隔での図
5に示す処理動作に伴い、ステップ200,201の動
作を繰り返すことになる。4 and 6, as described above, the monitoring setting change process 11 on the monitoring server 1 receives notification of the active cluster group information B from each of the monitored servers 2, 3, and 4. If the state transition of the cluster groups 8 and 9 does not occur (step 201) and the processing shown in FIG. 5 is performed at regular time intervals in the state shown in FIG. Operation is repeated.
【0046】かかる状態で、上記のように、監視対象サ
ーバ4でそこから監視対象サーバ2へクラスタグループ
8が切り替わる待機系サーバ切り戻りが発生すると、監
視対象サーバ4上のチェックプロセス17は、この監視
対象サーバ4のオペレーティングシステムのプロセス管
理テーブルで起動中クラスタグループ9のみを確認し
(図5のステップ100)、監視サーバ1上の監視設定
変更プロセス11にこの旨を示す起動中クラスタグルー
プ情報Bを通知する(図5のステップ101)。このと
きには、監視サーバ1のメモリ12上に管理している監
視設定テーブル13では、情報が変更されずに図3に示
した内容がそのまま保持されているが、監視設定変更プ
ロセス11は、監視設定サーバ4のチェックプロセス1
7からの起動中クラスタグループ情報Bを受信すると
(ステップ200)、これとメモリ12上に管理してい
る図3に示す監視設定テーブル13での監視対象サーバ
4に対する情報とを比較する(ステップ201)。この
とき、このチェックプロセス17からの起動中クラスタ
グループ情報Bは、監視対象サーバ4でクラスタグルー
プ9のみが起動したことを表わしているので、監視設定
変更プロセス11は、これを監視設定テーブル13での
監視対象サーバ4に対する情報(即ち、クラスタグルー
プ9のみが起動しているを示す情報)と比較することに
より(ステップ201)、監視対象サーバ4でクラスタ
グループ8,9が起動している状態からクラスタグルー
プ9のみが起動した状態に遷移したことを認識し(ステ
ップ202)、これに伴って監視プロセス5で監視設定
の変更処理を実行する。この変更処理は、監視プロセス
5で、監視対象サーバ4に対し、正常時に監視対象サー
バ3を監視するのに使用していた監視設定bを選択・設
定するものである。これにより、監視プロセス5が監視
設定bでもって監視対象サーバ4の監視を継続する(ス
テップ205)。In this state, as described above, when the standby server returns from the monitored server 4 where the cluster group 8 is switched to the monitored server 2, the check process 17 on the monitored server 4 performs this process. Only the running cluster group 9 is checked in the process management table of the operating system of the monitored server 4 (step 100 in FIG. 5), and the running cluster group information B indicating this to the monitoring setting change process 11 on the monitoring server 1 (Step 101 in FIG. 5). At this time, in the monitoring setting table 13 managed on the memory 12 of the monitoring server 1, the information shown in FIG. Check process 1 of server 4
7 (step 200), it compares this with the information for the monitored server 4 in the monitoring setting table 13 shown in FIG. 3 managed in the memory 12 (step 201). ). At this time, since the running cluster group information B from the check process 17 indicates that only the cluster group 9 has been started on the monitored server 4, the monitoring setting change process 11 indicates this in the monitoring setting table 13. From the state in which the cluster groups 8 and 9 are running on the monitored server 4 by comparing with the information on the monitored server 4 (that is, information indicating that only the cluster group 9 is running) (step 201). Recognizing that only the cluster group 9 has transitioned to the activated state (step 202), the monitoring process 5 executes a process of changing the monitoring setting in accordance with this. This change process selects and sets the monitoring setting b used for monitoring the monitoring target server 3 in the monitoring process 5 when the monitoring target server 3 is normal. Thus, the monitoring process 5 continues monitoring the monitoring target server 4 with the monitoring setting b (step 205).
【0047】しかる後、監視設定変更プロセス11は、
メモリ12上の監視設定テーブル13の変更処理を実行
する(ステップ206)。この変更処理は、クラスタグ
ループ9のみが監視対象サーバ4で起動中であり、この
とき、監視プロセス5での監視対象サーバ4に対する監
視設定が監視設定bであるように、監視設定テーブル1
3の内容を変更するものである。After that, the monitoring setting change process 11
The monitoring setting table 13 on the memory 12 is changed (step 206). In this change process, only the cluster group 9 is running on the monitored server 4, and at this time, the monitoring setting table 1 is set so that the monitoring setting for the monitored server 4 in the monitoring process 5 is the monitoring setting b.
3 is to be changed.
【0048】一方、監視対象サーバ2では、クラスタグ
ループ8の待機系サーバ切り戻りがあると、この監視対
象サーバ2上のチェックプロセス15も、監視サーバ1
上の監視設定変更プロセス11へ起動中クラスタグルー
プ8が存在する状態になったことを示す起動中クラスタ
グループ情報Bを通知する(図5のステップ101)。
この通知を受信すると(ステップ200)、監視サーバ
1上の監視設定変更プロセス11は、この起動中クラス
タグループ情報Bとメモリ12上の図3に示す監視設定
テーブル13での監視対象サーバ2の情報とを比較する
ことにより(ステップ201)、起動中クラスタグルー
プ8が存在する状態になったことを認識し(ステップ2
02)、監視プロセス5で監視設定の変更処理を実行す
る(ステップ205)。この変更処理は、監視プロセス
5で、正常時に監視対象サーバ2を監視するのに使用す
る監視設定aを選択・設定するものである。これによ
り、監視プロセス5が監視対象サーバ2の監視を開始す
る。On the other hand, in the monitored server 2, when the standby server of the cluster group 8 returns, the check process 15 on the monitored server 2 also performs the monitoring process 1.
The monitoring setting change process 11 is notified of the starting cluster group information B indicating that the starting cluster group 8 is present (step 101 in FIG. 5).
Upon receiving this notification (step 200), the monitoring setting change process 11 on the monitoring server 1 executes the startup cluster group information B and the information of the monitoring target server 2 in the monitoring setting table 13 shown in FIG. (Step 201), it is recognized that the activated cluster group 8 is in a state of being present (step 2).
02), a monitoring setting change process is executed by the monitoring process 5 (step 205). This change process selects and sets a monitoring setting a used by the monitoring process 5 to monitor the monitoring target server 2 in a normal state. Thereby, the monitoring process 5 starts monitoring the monitoring target server 2.
【0049】なお、この場合も、監視設定変更プロセス
11は、監視対象サーバ4のチェックプロセス17から
の起動中クラスタグループ情報Bと監視対象サーバ2の
チェックプロセス15からの起動中クラスタグループ情
報Bとにより、監視対象サーバ4から監視対象サーバ2
へのクラスタグループ8の待機系サーバ切り戻しを認識
することができ、この認識のもとにして、上記のよう
に、監視プロセス5が監視対象サーバ4に対して監視設
定bを、監視対象サーバ2に対して監視設定aを夫々選
択・設定することができる。In this case as well, the monitoring setting change process 11 includes the starting cluster group information B from the check process 17 of the monitored server 4 and the starting cluster group information B from the check process 15 of the monitored server 2. As a result, from the monitored server 4 to the monitored server 2
The switching back of the standby server of the cluster group 8 to the monitoring target server 4 can be recognized, and based on this recognition, the monitoring process 5 transmits the monitoring setting b to the monitoring target server 4 as described above. 2, the monitoring setting a can be selected and set.
【0050】また、監視対象サーバ2の監視開始処理
(ステップ205)と監視対象サーバ4に対する監視設
定変更(ステップ205)とともに、監視設定変更プロ
セス11は、監視設定テーブル13の変更処理を実行す
る(ステップ206)。これは、図3に示した監視設定
テーブル13の内容をシステムの新たな状態に合致する
ように変更するものであり、クラスタグループ9が監視
対象サーバ4で、クラスタグループ8が監視対象サーバ
2で夫々起動中とし、このときの監視対象サーバ4に対
して監視プロセス5での監視設定を監視設定bとし、ま
た、監視対象サーバ2に対して監視プロセス5での監視
設定を監視設定aとする図4に示すような内容とするも
のである。In addition to the monitoring start processing of the monitored server 2 (step 205) and the monitoring setting change of the monitored server 4 (step 205), the monitoring setting change process 11 executes the processing of changing the monitoring setting table 13 (step 205). Step 206). This changes the contents of the monitoring setting table 13 shown in FIG. 3 so as to match the new state of the system. The cluster group 9 is the monitored server 4 and the cluster group 8 is the monitored server 2. It is assumed that each of them is running, the monitoring setting of the monitoring process 5 for the monitoring target server 4 at this time is a monitoring setting b, and the monitoring setting of the monitoring target server 2 for the monitoring process 5 is a monitoring setting a. The contents are as shown in FIG.
【0051】なお、図4に示す状態で、監視対象サーバ
4で起動中のクラスタグループ9が監視対象サーバ3に
待機系サーバ切り戻しがある場合も同様であるが、この
場合には、監視対象サーバ4がクラスタグループ9が起
動している状態から起動クラスタグループが存在しない
状態に切り替わるものであるから、この監視対象サーバ
4に対する監視プロセス5の監視が解除され、メモリ1
2上の監視設定テーブル13の内容は、図1に示す内容
となる。In the state shown in FIG. 4, the same applies to the case where the cluster group 9 running on the monitored server 4 has the monitored server 3 switched back to the standby server. Since the server 4 switches from a state in which the cluster group 9 is running to a state in which the starting cluster group does not exist, the monitoring of the monitoring process 5 for the monitoring target server 4 is released, and the memory 1
2 has the contents shown in FIG.
【0052】以上のようにして、この実施形態では、監
視サーバ1側の監視設定変更プロセス11とメモリ12
上の監視設定テーブル13により、待機系サーバ4をも
監視対象サーバとして、これら監視対象サーバ間にわた
るクラスタグループの動き(遷移)を常時監視すること
ができ、しかも、この動きに応じて各監視対象サーバに
該当する監視設定を正確かつ自動的に選択・設定するこ
とができるものであり、待機系サーバ切り替えがあって
も、クラスタグループの正しい監視を行なうことができ
る。As described above, in this embodiment, the monitoring setting change process 11 and the memory 12 on the monitoring server 1 side
With the above monitoring setting table 13, the standby server 4 can also be used as a monitoring target server to constantly monitor the movement (transition) of the cluster group between these monitoring target servers. The monitoring setting corresponding to the server can be accurately and automatically selected and set. Even if the standby server is switched, correct monitoring of the cluster group can be performed.
【0053】なお、以上の実施形態では、監視対象サー
バを2個とし、待機系サーバを1個とし、また、監視サ
ーバを1個とするシステムについて説明したが、本発明
はこれのみに限るものではなく、これら各サーバが任意
の個数のシステムにも該当することはいうまでもない。
勿論、この場合には、各監視対象サーバでのクラスタグ
ループに対する監視設定ばかりでなく、これらクラスタ
グループの全てのもしくはその一部の実際に実現可能な
組み合わせに対する監視設定が予め作成されており、監
視サーバでの監視プロセスに選択可能に設定されている
ことになる。In the above embodiment, a system in which the number of monitored servers is two, the number of standby servers is one, and the number of monitoring servers is one has been described, but the present invention is not limited to this. Instead, it goes without saying that each of these servers also corresponds to an arbitrary number of systems.
Of course, in this case, not only the monitoring settings for the cluster groups in each monitored server, but also the monitoring settings for all or a part of these cluster groups that are actually feasible are created in advance. This means that the server can be selected for the monitoring process.
【0054】また、上記実施形態では、監視サーバ1側
の監視プロセス5は、監視設定変更プロセス11での各
監視対象サーバ2,3,4からの起動クラスタグループ
情報Bによるクラスタグループの動きの認識(図6のス
テップ202)に基づいて、監視対象サーバの監視設定
の選択・設定(図6のステップ205)や監視終了処理
(図6のステップ203)を行なうようにしたが、監視
設定変更プロセス11は、各監視対象サーバ2,3,4
からの起動クラスタグループ情報Bによるクラスタグル
ープの動きを認識すると(図6のステップ202)、ま
ず、メモリ12上の監視設定テーブル13の変更処理を
行ない、しかる後、監視プロセス5が監視設定テーブル
13の確認を行なって、監視設定の選択・設定や監視終
了処理を行なうようにしてもよい。この場合、監視プロ
セス5は少なくとも監視対象サーバのいずれかからの監
視対象プロセス情報Aにより、クラスタグループの動き
(待機系サーバ切り替えや切り戻り)を認識することが
でき、これを認識してから監視設定変更プロセス11に
よって変更された監視設定テーブル13を確認すること
により、監視設定の選択・設定や監視終了処理を行なう
ことができる。In the above embodiment, the monitoring process 5 of the monitoring server 1 recognizes the movement of the cluster group based on the starting cluster group information B from each of the monitored servers 2, 3, and 4 in the monitoring setting change process 11. Based on (Step 202 in FIG. 6), the selection and setting of the monitoring setting of the monitoring target server (Step 205 in FIG. 6) and the monitoring end processing (Step 203 in FIG. 6) are performed. 11 is each monitored server 2, 3, 4
When the movement of the cluster group is recognized based on the startup cluster group information B from the server (step 202 in FIG. 6), first, the monitor setting table 13 in the memory 12 is changed. May be checked to perform the selection / setting of the monitoring setting and the monitoring end processing. In this case, the monitoring process 5 can recognize the movement of the cluster group (switching of the standby server or switching back) based on the monitoring target process information A from at least one of the monitoring target servers. By checking the monitoring setting table 13 changed by the setting changing process 11, it is possible to select and set the monitoring setting and perform the monitoring end processing.
【0055】[0055]
【発明の効果】以上、説明したように、本発明によれ
ば、多ノードクラスタシステムにおいて、待機系サーバ
のプロセス監視をも可能となり、クラスタグループの動
きに合わせて待機系サーバを含めた監視対象サーバに対
する監視設定の変更を正しくかつ自動的に行なうことが
でき、常に適切なプロセス監視を実現できる。As described above, according to the present invention, in a multi-node cluster system, it is also possible to monitor the process of the standby server, and the monitoring target including the standby server according to the movement of the cluster group. The monitoring setting for the server can be correctly and automatically changed, and appropriate process monitoring can always be realized.
【0056】また、待機系サーバで同時に起動する可能
性のある複数のクラスタグループの組み合わせに対する
監視設定を作成することにより、クラスタシステムを構
成するサーバの台数に関係なく、クラスタグループの組
み合わせに対しても、監視設定やその変更が可能とな
り、汎用性・利便性を高めることができる。Further, by creating a monitoring setting for a combination of a plurality of cluster groups that may be simultaneously activated on the standby server, the combination of the cluster groups can be controlled regardless of the number of servers constituting the cluster system. Also, the monitoring setting and its change can be made, and the versatility and convenience can be improved.
【図1】本発明による多ノードクラスタシステムのプロ
セス監視方法の一実施形態での通常状態時のプロセス監
視形態を示すシステム図である。FIG. 1 is a system diagram showing a process monitoring mode in a normal state in an embodiment of a process monitoring method for a multi-node cluster system according to the present invention.
【図2】図1に示す状態で1つの監視対象サーバにのみ
障害が発生したことによる待機系サーバ切り替え後のプ
ロセス監視形態を示すシステム図である。FIG. 2 is a system diagram showing a process monitoring mode after a standby server is switched due to a failure occurring in only one monitored server in the state shown in FIG. 1;
【図3】図2に示す状態でさらに他の監視対象サーバで
待機系サーバ切り替えが発生したことによる待機系サー
バ切り替え後のプロセス監視形態を示すシステム図であ
る。FIG. 3 is a system diagram showing a process monitoring mode after a standby server switchover due to a standby server switchover occurring in still another monitored server in the state shown in FIG. 2;
【図4】図3に示す状態での待機系サーバのクラスタグ
ループが待機系サーバ切り戻りした場合のプロセス監視
形態を示すシステム図である。FIG. 4 is a system diagram showing a process monitoring mode when the cluster group of the standby server switches back to the standby server in the state shown in FIG. 3;
【図5】図1〜図4での監視対象サーバでのチェックプ
ロセス7の処理動作の一具体例を示すフローチャートで
ある。FIG. 5 is a flowchart showing a specific example of a processing operation of a check process 7 in the monitoring target server in FIGS. 1 to 4;
【図6】図1〜図4に示す実施形態の監視設定変更処理
動作の一具体例を示すフローチャートである。FIG. 6 is a flowchart showing a specific example of a monitoring setting change processing operation of the embodiment shown in FIGS. 1 to 4;
【図7】従来の多ノードクラスタシステムのプロセス監
視方法の一例を示すシステム図である。FIG. 7 is a system diagram showing an example of a conventional process monitoring method of a multi-node cluster system.
1 監視サーバ 2,3 監視対象サーバ 4 監視対象(待機系)サーバ 5 監視サーバ側の監視プロセス 6,7 監視対象サーバ側の監視プロセス 8,9 クラスタグループ 10 監視対象プロセス 11 監視設定変更プロセス 12 メモリ 13 監視設定テーブル 14 監視対象サーバ側の監視プロセス 15〜17 チェックプロセス 1 monitoring server 2-3 Monitoring target server 4 Monitored (standby) server 5 Monitoring process on the monitoring server 6,7 Monitoring process on the monitored server 8,9 cluster group 10 Processes to be monitored 11 Monitoring setting change process 12 memory 13 Monitoring setting table 14 Monitoring process on the monitored server 15-17 Check process
Claims (5)
ラスタグループが監視される監視対象サーバと、該監視
対象サーバに共通の待機系サーバとからなる多ノードク
ラスタシステムのプロセス監視方法において、 該監視対象サーバと該待機系サーバとは夫々、常時起動
しているチェックプロセスによってオペレーティングシ
ステムのプロセス管理テーブルを一定時間間隔で確認し
て、クラスタグループの起動,停止を示す確認結果を該
監視サーバ上の監視設定変更プロセスに通知し、 該監視設定変更プロセスは、該確認結果の通知を受け
て、該監視対象サーバと該待機系サーバとの間でのクラ
スタグループの切り替わりを認識し、 該監視設定変更プロセスでの該認識を基に、クラスタグ
ループが起動している該監視対象サーバと該待機系サー
バとのプロセス監視を行なうことを特徴とする多ノード
クラスタシステムプロセス監視方法。1. A process monitoring method for a multi-node cluster system, comprising: a monitoring server; a monitored server whose cluster group is monitored by the monitoring server; and a standby server common to the monitored server. The server and the standby server respectively check the process management table of the operating system at regular time intervals by a check process that is constantly running, and monitor the monitoring results on the monitoring server to indicate the start and stop of the cluster group. Notifying the setting change process, the monitor setting change process receives the notification of the confirmation result, recognizes the switching of the cluster group between the monitored server and the standby server, and Based on the recognition in the above, the monitored server in which the cluster group is running and the standby server A multi-node cluster system process monitoring method characterized by monitoring a process with a server.
監視対象サーバ,前記待機系サーバとの対応関係、及び
該起動中のクラスタグループに対応する監視設定とを示
す監視設定テーブルが設けられており、 前記監視設定変更プロセスにより、前記監視対象サーバ
と前記待機系サーバとの夫々毎に、前記チェックプロセ
スから通知される前記確認結果と該監視設定テーブルと
を比較して、前記監視対象サーバと前記待機系サーバと
の間のクラスタグループの切り替わりを認識し、かつ該
切り替わりの認識に伴って、該監視設定テーブルを変更
することを特徴とする多ノードクラスタシステムプロセ
ス監視方法。2. The monitoring server according to claim 1, wherein the monitoring server stores a correspondence between the active cluster group, the monitored server, and the standby server, and a monitoring setting corresponding to the active cluster group. A monitoring setting table is provided, and for each of the monitored server and the standby server, the monitoring result is compared with the confirmation result notified from the checking process by the monitoring setting change process. A multi-node cluster system process for recognizing switching of a cluster group between the monitored server and the standby server, and changing the monitoring setting table with the recognition of the switching. Monitoring method.
の切り替わりの認識に伴って、クラスタグループが起動
もしくは停止した前記監視対象サーバまたは前記待機系
サーバに対する監視設定の変更処理を行なうことを特徴
とする多ノードクラスタシステムプロセス監視方法。3. The monitoring setting change for the monitoring target server or the standby server in which a cluster group is started or stopped in accordance with the recognition of the switching of the cluster group by the monitoring setting change process according to claim 1 or 2. A multi-node cluster system process monitoring method, characterized by performing processing.
スタグループの組み合わせに応じて、前記監視サーバに
設けられており、 クラスタグループが起動した前記監視対象サーバもしく
は1以上のクラスタグループが起動した前記待機系サー
バを、該当する前記監視設定を選択・設定することによ
り、監視することを特徴とする多ノードクラスタシステ
ムプロセス監視方法。4. The monitoring server according to claim 3, wherein the monitoring setting is provided in the monitoring server in advance for each cluster group and in accordance with a combination of cluster groups, and A multi-node cluster system process monitoring method, wherein the standby server started by the cluster group is monitored by selecting and setting the corresponding monitoring setting.
ラスタグループが監視される監視対象サーバと、該監視
対象サーバに共通の待機系サーバとからなる多ノードク
ラスタシステムにおいて、 請求項1〜4のいずれか1つに記載の多ノードクラスタ
システムプロセス監視方法を実行することを特徴とする
多ノードクラスタシステム。5. A multi-node cluster system comprising a monitoring server, a monitored server whose cluster group is monitored by the monitoring server, and a standby server common to the monitored server. A multi-node cluster system, characterized by executing the multi-node cluster system process monitoring method according to any one of the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002150973A JP2003345620A (en) | 2002-05-24 | 2002-05-24 | Process monitoring method for multi-node cluster system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002150973A JP2003345620A (en) | 2002-05-24 | 2002-05-24 | Process monitoring method for multi-node cluster system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003345620A true JP2003345620A (en) | 2003-12-05 |
Family
ID=29768688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002150973A Pending JP2003345620A (en) | 2002-05-24 | 2002-05-24 | Process monitoring method for multi-node cluster system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003345620A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007531091A (en) * | 2004-03-25 | 2007-11-01 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Method, apparatus and computer program for monitoring resources |
JP2008146397A (en) * | 2006-12-11 | 2008-06-26 | Hitachi Ltd | Device and method for monitoring process |
GB2452715A (en) * | 2007-09-11 | 2009-03-18 | Loadbalancer Org Ltd | Method and system for monitoring a cluster database |
JP2010066967A (en) * | 2008-09-10 | 2010-03-25 | Nec Corp | Server monitoring system and method thereof |
JP2010108445A (en) * | 2008-10-31 | 2010-05-13 | Fujitsu Ltd | Program, apparatus and method for generating configuration definition information, and monitoring program |
CN102622290A (en) * | 2012-03-07 | 2012-08-01 | 苏州阔地网络科技有限公司 | Process monitoring method and system |
WO2012120634A1 (en) * | 2011-03-08 | 2012-09-13 | 株式会社日立製作所 | Management computer, storage system management method, and storage system |
WO2013080977A1 (en) * | 2011-11-28 | 2013-06-06 | 日本電気株式会社 | Fault-tolerant system, fault-tolerant method and program |
JP2019212244A (en) * | 2018-06-08 | 2019-12-12 | 富士通株式会社 | Notification control program, notification control method and information processing device |
-
2002
- 2002-05-24 JP JP2002150973A patent/JP2003345620A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007531091A (en) * | 2004-03-25 | 2007-11-01 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Method, apparatus and computer program for monitoring resources |
JP2008146397A (en) * | 2006-12-11 | 2008-06-26 | Hitachi Ltd | Device and method for monitoring process |
GB2452715A (en) * | 2007-09-11 | 2009-03-18 | Loadbalancer Org Ltd | Method and system for monitoring a cluster database |
JP2010066967A (en) * | 2008-09-10 | 2010-03-25 | Nec Corp | Server monitoring system and method thereof |
JP2010108445A (en) * | 2008-10-31 | 2010-05-13 | Fujitsu Ltd | Program, apparatus and method for generating configuration definition information, and monitoring program |
WO2012120634A1 (en) * | 2011-03-08 | 2012-09-13 | 株式会社日立製作所 | Management computer, storage system management method, and storage system |
US8656012B2 (en) | 2011-03-08 | 2014-02-18 | Hitachi, Ltd. | Management computer, storage system management method, and storage system |
WO2013080977A1 (en) * | 2011-11-28 | 2013-06-06 | 日本電気株式会社 | Fault-tolerant system, fault-tolerant method and program |
JP5664886B2 (en) * | 2011-11-28 | 2015-02-04 | 日本電気株式会社 | Fault tolerant system, fault tolerant method and program |
US9053023B2 (en) | 2011-11-28 | 2015-06-09 | Nec Corporation | Fault-tolerant system, fault-tolerant method and program |
CN102622290A (en) * | 2012-03-07 | 2012-08-01 | 苏州阔地网络科技有限公司 | Process monitoring method and system |
JP2019212244A (en) * | 2018-06-08 | 2019-12-12 | 富士通株式会社 | Notification control program, notification control method and information processing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015169199A1 (en) | Anomaly recovery method for virtual machine in distributed environment | |
US20010037473A1 (en) | Backup apparatus and a backup method | |
CN109462502B (en) | Control method and device for configuration information storage instruction and SDN controller | |
CN108897658B (en) | Method and device for monitoring master database, computer equipment and storage medium | |
CN112199240B (en) | Method for switching nodes during node failure and related equipment | |
CN110072244B (en) | Control method and device of radio link failure timer | |
CN105577444A (en) | Wireless controller management method and wireless controller | |
JP2003345620A (en) | Process monitoring method for multi-node cluster system | |
CN111585797B (en) | Ethernet link switching method, device, equipment and computer readable storage medium | |
CN111585835B (en) | Control method and device for out-of-band management system and storage medium | |
CN117435405A (en) | Dual hot standby and failover system and method | |
CN105515838A (en) | Service configuration method and HA (High Available) cluster system | |
US11068348B2 (en) | Method and enable apparatus for starting physical device | |
CN109189854B (en) | Method and node equipment for providing continuous service | |
CN113645048B (en) | Network card switching method and device and field programmable gate array FPGA | |
JP6421516B2 (en) | Server device, redundant server system, information takeover program, and information takeover method | |
KR102131863B1 (en) | Method of performing transition of operation mode for a routing processor | |
EP3933596B1 (en) | A method for failure detection and role selection in a network of redundant processes | |
KR20150102378A (en) | Apparatus for electing a master in redundancy system | |
CN111258823A (en) | Method and system for switching master server and slave server | |
CN110661599B (en) | HA implementation method, device and storage medium between main node and standby node | |
CN114124803B (en) | Device management method and device, electronic device and storage medium | |
CN111078454A (en) | Cloud platform configuration recovery method and device | |
CN113438105B (en) | Method, device and equipment for assisting multi-IRF (inter-range radio frequency) splitting detection by MAD (multi-object detection) | |
CN107087021B (en) | Master-slave server determination method and device |