JPH05250195A - Health check control system of information processing system - Google Patents
Health check control system of information processing systemInfo
- Publication number
- JPH05250195A JPH05250195A JP4032460A JP3246092A JPH05250195A JP H05250195 A JPH05250195 A JP H05250195A JP 4032460 A JP4032460 A JP 4032460A JP 3246092 A JP3246092 A JP 3246092A JP H05250195 A JPH05250195 A JP H05250195A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- active
- standby
- magnetic disk
- disk device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
- Multi Processors (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、デュプレックス構成に
よるホットスタンバイ方式を採用している情報処理シス
テムのヘルスチェック制御方式に関し、特に無人化運転
によるリモート運用を行っている情報処理システムのヘ
ルスチェック制御方式に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a health check control system for an information processing system which employs a hot standby system having a duplex configuration, and particularly to a health check control for an information processing system which is operated remotely by unmanned operation. Regarding the scheme.
【0002】[0002]
【従来の技術】デュプレックス構成によるホットスタン
バイ方式を採用している情報処理システムの従来のヘル
スチェック制御方式は、2台のプロセッサの間に設置し
た通信回線を介する相互データ通信によってのみ、相手
側のプロセッサの稼働状況を監視している。2. Description of the Related Art A conventional health check control method for an information processing system that employs a hot standby method with a duplex configuration allows the other side to communicate only by mutual data communication via a communication line installed between two processors. Monitoring the operating status of the processor.
【0003】[0003]
【発明が解決しようとする課題】上述したように、デュ
プレックス構成によるホットスタンバイ方式を採用して
いる従来の情報処理システムのヘルスチェック制御方式
は、2台のプロセッサの間に設置した通信回線を介する
相互データ通信によってのみ、相手側のプロセッサの稼
働状況を監視しているため、現用系のプロセッサの通信
制御装置や通信回線の障害等によって現用系のプロセッ
サからのデータの送信が不可能になった場合、待機系の
プロセッサが、現用系のプロセッサがシステムダウンを
起していると誤認するという欠点を有している。As described above, the health check control system of the conventional information processing system which employs the hot standby system having the duplex configuration uses the communication line installed between the two processors. Since the operating status of the processor on the other side is monitored only by mutual data communication, it is impossible to send data from the active processor due to a failure of the communication control unit or communication line of the active processor. In this case, the standby system processor has a disadvantage that the active system processor mistakenly recognizes that the system is down.
【0004】また、システムの初期立上げのとき、2台
のプロセッサを共に待機系のプロセッサとして立上げる
と、それぞれが正常に稼働して互いに相手側のプロセッ
サの正常な稼働状況を認識できているときは、あらかじ
め定められている方のプロセッサが現用系のプロセッサ
として稼働するように切替え動作を行い、以後現用系の
プロセッサとして稼働するが、何らかの原因によって相
手側のプロセッサからのデータの受信が行えなかったと
き、2台のプロセッサが共に現用系のプロセッサへの切
替え動作を行ってしまうという欠点も有している。Further, when the two processors are both started up as standby processors at the initial startup of the system, each of them operates normally and the other processors can recognize the normal operating status of each other. In this case, the predetermined processor performs the switching operation so that it operates as the active processor, and then operates as the active processor.However, due to some reason, data from the other processor can be received. If not, both of the two processors also have a drawback that they switch to the active processor.
【0005】[0005]
【課題を解決するための手段】本発明の情報処理システ
ムのヘルスチェック制御方式は、デュプレックス構成に
よるホットスタンバイ方式を採用している情報処理シス
テムのヘルスチェック制御方式において、待機系のプロ
セッサの稼働状況を現用系のプロセッサと前記待機系の
プロセッサとの間に設置した複数の通信回線を介するデ
ータ通信により前記現用系のプロセッサによって監視し
て前記待機系のプロセッサのダウンを検出したときシス
テム運用者に対してそのことを通知し、前記現用系のプ
ロセッサの稼働状況を前記現用系のプロセッサと前記待
機系のプロセッサとの間に設置した複数の通信回線を介
するデータ通信と前記待機系のプロセッサと前記現用系
のプロセッサとの間に設けた磁気ディスク装置に格納し
たファイル情報を複数回読出してそれらを比較すること
によって前記現用系のプロセッサのダウンを検出したと
き、前記待機系のプロセッサを切替えて現用系のプロセ
ッサとして稼働させることを含んでいる。A health check control method for an information processing system according to the present invention is a health check control method for an information processing system that employs a hot standby method with a duplex configuration. Is monitored by the active processor by data communication via a plurality of communication lines installed between the active processor and the standby processor, and the system operator is notified when the standby processor is down. To that effect, the operating status of the active processor is communicated via a plurality of communication lines installed between the active processor and the standby processor, and the standby processor and the File information stored in the magnetic disk unit installed between the active processor and Wherein when detecting the down of the active system processor includes be operated as a processor of the active system by switching processor of the standby system by reading several times Te compare them.
【0006】[0006]
【実施例】次に、本発明の実施例について図面を参照し
て説明する。Embodiments of the present invention will now be described with reference to the drawings.
【0007】図1は本発明の一実施例を示す模式図、図
2は図1の実施例を適用する情報処理システムの一例を
示すブロック図、図3は図2の例の磁気ディスク装置内
のファイルの内容の一例を示すレコードフオーマット図
である。FIG. 1 is a schematic diagram showing an embodiment of the present invention, FIG. 2 is a block diagram showing an example of an information processing system to which the embodiment of FIG. 1 is applied, and FIG. 3 is a magnetic disk device of the example of FIG. 5 is a record format diagram showing an example of the contents of the file of FIG.
【0008】図2の情報処理システムは、デュプレック
ス構成の2台のプロセッサ11および12の間を、めす
・めすひねりコネクタケーブルによって2本の直結回線
15aおよび15bを接続し、またそれらの間に正副2
台の磁気ディスク装置13および14を接続している。
直結回線および磁気ディスク装置は、障害対策上、それ
ぞれ2回線および2台となっている。In the information processing system of FIG. 2, two direct connection lines 15a and 15b are connected by a female-female twist connector cable between the two processors 11 and 12 having a duplex configuration, and the primary and secondary circuits are provided between them. Two
The two magnetic disk devices 13 and 14 are connected.
The direct connection line and the magnetic disk device are two lines and two units, respectively, as a countermeasure against failure.
【0009】磁気ディスク装置13および14のファイ
ルは、256バイトの1個のレコードを有する相対編成
ファイルであり、レコード内には、図3に示すように、
磁気ディスク装置の正副の種別を示す正副種別固定情報
21と、現用系のプロセッサによって更新されるカウン
タ値22と、現在値の情報を出力したプロセッサの種別
を示すプロセッサ種別情報23とを含んでいる。現用系
のプロセッサは、一定の時間間隔で正副両方の磁気ディ
スク装置13および14のファイルの情報の更新を行
い、待機系のプロセッサ12は、直結回線15aまたは
15bを介するデータ通信において、現用系のプロセッ
サ11から応答が送られてこない場合は、正の磁気ディ
スク装置13内のファイルの情報を読出し、前回磁気デ
ィスク装置13から読出したファイル情報が更新されて
いるか否かを判断する。このとき、正の磁気ディスク装
置13が障害を発生しているためにそのファイル情報の
読出しが不可能な場合は、副の磁気ディスク装置14の
ファイル情報を読出す。The files of the magnetic disk devices 13 and 14 are relative organization files having one record of 256 bytes, and in the record, as shown in FIG.
It includes primary / secondary type fixed information 21 indicating the primary / secondary type of the magnetic disk device, a counter value 22 updated by the active processor, and processor type information 23 indicating the type of the processor that has output the current value information. .. The active processor updates the file information of both the primary and secondary magnetic disk devices 13 and 14 at regular time intervals, and the standby processor 12 updates the information of the active system in the data communication via the direct connection line 15a or 15b. When the response is not sent from the processor 11, the information of the file in the positive magnetic disk device 13 is read and it is judged whether or not the file information read from the magnetic disk device 13 last time is updated. At this time, if the file information cannot be read because the primary magnetic disk device 13 has a failure, the file information of the secondary magnetic disk device 14 is read.
【0010】本実施例は、図1に示すように、現用系の
プロセッサとして稼働しているプロセッサ11と、待機
系のプロセッサとして稼働しているプロセッサ12との
間では、プロセッサ12からプロセッサ11に対してサ
イクリックタイマ32によって一定の時間間隔で送信さ
れる通知電文33と、この通知電文33に対してプロセ
ッサ11からプロセッサ12に対して送信される応答電
文34とによって、相互に稼働状態の監視を行ってい
る。また、現用系のプロセッサ11は、これとは非同期
で、サイクリックタイマ31によって一定の時間間隔で
磁気ディスク装置13および14のファイルの情報のカ
ウンタ値22の更新を行っている。現用系のプロセッサ
11のサイクリックタイマ31のタイマ値は、待機系の
プロセッサ12のサイクリックタイマ32のタイマ値の
2倍よりも小さく設定してある。In this embodiment, as shown in FIG. 1, between the processor 11 operating as the active processor and the processor 12 operating as the standby processor, the processor 12 changes from the processor 12 to the processor 11. On the other hand, a notification message 33 transmitted at a constant time interval by the cyclic timer 32 and a response message 34 transmitted from the processor 11 to the processor 12 in response to the notification message 33 mutually monitor the operating state. It is carried out. Further, the active processor 11 updates the counter value 22 of the file information of the magnetic disk devices 13 and 14 at a fixed time interval by the cyclic timer 31, asynchronously with this. The timer value of the cyclic timer 31 of the active processor 11 is set to be smaller than twice the timer value of the cyclic timer 32 of the standby processor 12.
【0011】障害が発生して現用系のプロセッサ11が
待機系のプロセッサ12からの通知電文33を受信でき
なくなると、応答電文34の送信ができなくなるため、
待機系のプロセッサ12は、現用系のプロセッサ11の
稼働状態が把握できなくなる。従って、待機系のプロセ
ッサ12は、通知電文33の送信後一定時間を経過して
も現用系のプロセッサ11からの応答電文34の受信が
できない場合は、正の磁気ディスク装置13内のファイ
ルの情報を読出し、別の回線によって再度通知電文33
を送信する。一定時間経過後、それに対する 応答電文
34の受信ができないときは、回線を変えてもう一度通
知電文33を送信する。これに対してもなお応答電文3
4の受信ができないときは、磁気ディスク装置13内の
ファイルの情報を再度読出し、前回磁気ディスク装置1
3から読出したファイル情報とのカウンタ値22の比較
を行う。現用系のプロセッサ11のサイクリックタイマ
31のタイマ値が待機系のプロセッサ12のサイクリッ
クタイマ32のタイマ値の2倍よりも小さく設定してあ
るため、現用系のプロセッサ11が稼働中であれば、待
機系のプロセッサ12が二度目に磁気ディスク装置13
から読出したファイル情報とのカウンタ値22は、一度
目に磁気ディスク装置13から読出したファイル情報と
のカウンタ値22から少くとも1回の更新が行われてい
る筈である。従って、待機系のプロセッサ12における
カウンタ値22の比較の結果、現用系のプロセッサ11
によるカウンタ値22の更新が行われていないと判断し
た場合は、待機系のプロセッサ12は、現用系のプロセ
ッサ11がシステムダウンとなっていると認識し、待機
系から現用系への切替え動作を行い、以後は現用系のプ
ロセッサとして動作する。When a failure occurs and the active processor 11 cannot receive the notification message 33 from the standby processor 12, the response message 34 cannot be transmitted.
The standby system processor 12 cannot grasp the operating state of the active system processor 11. Therefore, if the processor 12 of the standby system cannot receive the response message 34 from the processor 11 of the active system even after the elapse of a certain time after the transmission of the notification message 33, the information of the file in the positive magnetic disk device 13 is obtained. Read again and notify again by another line 33
To send. If the response message 34 cannot be received after a certain period of time, the line is changed and the notification message 33 is transmitted again. Response message 3
4 cannot be received, the information of the file in the magnetic disk device 13 is read again and the previous magnetic disk device 1 is read.
The counter value 22 is compared with the file information read from 3. Since the timer value of the cyclic timer 31 of the active processor 11 is set to be smaller than twice the timer value of the cyclic timer 32 of the standby processor 12, if the active processor 11 is operating. , The standby processor 12 is the second time the magnetic disk device 13
The counter value 22 with the file information read from the magnetic disk device 13 should have been updated at least once from the counter value 22 with the file information read from the magnetic disk device 13 at the first time. Therefore, as a result of the comparison of the counter values 22 in the standby system processor 12, the active system processor 11
When it is determined that the counter value 22 has not been updated by, the standby-system processor 12 recognizes that the active-system processor 11 is down, and switches the standby system to the active system. After that, it operates as an active processor.
【0012】[0012]
【発明の効果】以上説明したように、本発明のデュプレ
ックス構成によるホットスタンバイ方式を採用している
情報処理システムのヘルスチェック制御方式は、通信回
線を介する相互データ通信によって相手側のプロセッサ
の稼働状況を監視する方法と併せて、それらの間に接続
した磁気ディスク装置にファイル情報を設け、一定の時
間間隔でカウンタ値の更新を行うことにより、現用系の
プロセッサの稼働状態をる待機系のプロセッサによって
調査できるようにすることにより、現用系のプロセッサ
が正常に稼働中であるにも拘わらず、通信回線の障害等
によって現用系のプロセッサからのデータの送信が不可
能になった場合、待機系のプロセッサが、現用系のプロ
セッサがシステムダウンを起していると誤認するのを防
止できるという効果がある。また、システムの初期立上
げのとき、何らかの原因によって相手側のプロセッサか
らのデータの受信が行えなかったとき、2台のプロセッ
サが共に現用系のプロセッサへの切替え動作を行うのを
防止できるという効果もある。As described above, according to the health check control method of the information processing system which employs the hot standby method with the duplex configuration of the present invention, the operating status of the processor on the other side is controlled by the mutual data communication via the communication line. In addition to the method for monitoring the standby system, the file information is provided in the magnetic disk device connected between them, and the counter value is updated at regular time intervals, so that the active processor of the active system is activated. By making it possible to investigate by using the standby system, even if the active processor is operating normally, if the data transmission from the active processor becomes impossible due to a communication line failure, etc. Can prevent the active processor from erroneously recognizing that the active processor is down. There is. Further, at the time of initial startup of the system, when data cannot be received from the processor on the other side for some reason, it is possible to prevent the two processors from both switching to the active processor. There is also.
【図1】本発明の一実施例を示す模式図である。FIG. 1 is a schematic view showing an embodiment of the present invention.
【図2】図1の実施例を適用する情報処理システムの一
例を示すブロック図である。FIG. 2 is a block diagram showing an example of an information processing system to which the embodiment of FIG. 1 is applied.
【図3】図2の例の磁気ディスク装置内のファイルの内
容の一例を示すレコードフオーマット図である。3 is a record format diagram showing an example of the contents of a file in the magnetic disk device of the example of FIG.
11 プロセッサ 12 プロセッサ 13 磁気ディスク装置 14 磁気ディスク装置 15a・15b 直結回線 21 正副種別固定情報 22 カウンタ値 23 プロセッサ種別情報 31 サイクリックタイマ 32 サイクリックタイマ 33 通知電文 34 応答電文 11 processor 12 processor 13 magnetic disk device 14 magnetic disk device 15a / 15b direct connection line 21 primary / secondary type fixed information 22 counter value 23 processor type information 31 cyclic timer 32 cyclic timer 33 notification message 34 response message
Claims (2)
のプロセッサと前記待機系のプロセッサとの間に設置し
た複数の通信回線を介するデータ通信により前記現用系
のプロセッサによって監視して前記待機系のプロセッサ
のダウンを検出したときシステム運用者に対してそのこ
とを通知し、前記現用系のプロセッサの稼働状況を前記
現用系のプロセッサと前記待機系のプロセッサとの間に
設置した複数の通信回線を介するデータ通信と前記待機
系のプロセッサと前記現用系のプロセッサとの間に設け
た磁気ディスク装置に格納したファイル情報によって監
視して前記現用系のプロセッサのダウンを検出したとき
前記待機系のプロセッサを切替えて現用系のプロセッサ
として稼働させることを含む特徴とする情報処理システ
ムのヘルスチェック制御方式。1. An operating state of a standby system processor is monitored by the active system processor by data communication via a plurality of communication lines installed between the active system processor and the standby system processor, and the standby system is monitored. When a down state of the processor is detected, the system operator is notified of that fact, and the operating status of the active processor is set between the active processor and the standby processor. Data communication through the standby system and the standby system processor when the down of the active system processor is detected by monitoring by file information stored in the magnetic disk device provided between the standby system processor and the active system processor. Checking the health of an information processing system, including switching between the two to operate as the active processor control method.
バイ方式を採用している情報処理システムのヘルスチェ
ック制御方式において、待機系のプロセッサの稼働状況
を現用系のプロセッサと前記待機系のプロセッサとの間
に設置した複数の通信回線を介するデータ通信により前
記現用系のプロセッサによって監視して前記待機系のプ
ロセッサのダウンを検出したときシステム運用者に対し
てそのことを通知し、前記現用系のプロセッサの稼働状
況を前記現用系のプロセッサと前記待機系のプロセッサ
との間に設置した複数の通信回線を介するデータ通信と
前記待機系のプロセッサと前記現用系のプロセッサとの
間に設けた磁気ディスク装置に格納したファイル情報を
複数回読出してそれらを比較することによって前記現用
系のプロセッサのダウンを検出したとき、前記待機系の
プロセッサを切替えて現用系のプロセッサとして稼働さ
せることを含む特徴とする情報処理システムのヘルスチ
ェック制御方式。2. In a health check control method for an information processing system that employs a hot standby method with a duplex configuration, the operating status of a standby system processor is set between an active system processor and the standby system processor. When the active processor monitors the active processor by data communication via a plurality of communication lines and detects that the standby processor is down, the system operator is notified of the fact and the operating status of the active processor is checked. Data communication via a plurality of communication lines installed between the active processor and the standby processor, and a file stored in a magnetic disk device provided between the standby processor and the active processor By reading the information a plurality of times and comparing them, the data of the active processor is reduced. A health check control method for an information processing system, which comprises switching the standby system processor to operate as an active system processor when an error is detected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4032460A JPH05250195A (en) | 1992-02-20 | 1992-02-20 | Health check control system of information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4032460A JPH05250195A (en) | 1992-02-20 | 1992-02-20 | Health check control system of information processing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05250195A true JPH05250195A (en) | 1993-09-28 |
Family
ID=12359586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4032460A Withdrawn JPH05250195A (en) | 1992-02-20 | 1992-02-20 | Health check control system of information processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05250195A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123747A (en) * | 1994-10-20 | 1996-05-17 | Fujitsu Ltd | Distributed processing system for facility management system |
JP2008299369A (en) * | 2007-05-29 | 2008-12-11 | Nomura Research Institute Ltd | Cluster system, computer, and failure coping method |
-
1992
- 1992-02-20 JP JP4032460A patent/JPH05250195A/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123747A (en) * | 1994-10-20 | 1996-05-17 | Fujitsu Ltd | Distributed processing system for facility management system |
JP2008299369A (en) * | 2007-05-29 | 2008-12-11 | Nomura Research Institute Ltd | Cluster system, computer, and failure coping method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62226271A (en) | Automatic switching device for pos loop | |
JPH05250195A (en) | Health check control system of information processing system | |
KR101262278B1 (en) | redundant system and control method | |
US6412016B1 (en) | Network link bypass device | |
JP3630824B2 (en) | Auxiliary relay drive circuit | |
JP3107104B2 (en) | Standby redundancy method | |
JPH06311568A (en) | Power control system | |
JP2007026038A (en) | Path monitoring system, path monitoring method and path monitoring program | |
JP2000013469A (en) | Device and method for recovering communication equipment | |
JP2003248633A (en) | Method of encoding/decoding binary signal state in fault tolerant environment | |
JP2706027B2 (en) | Programmable controller | |
JPS62102646A (en) | Self-diagnosis system | |
KR100439370B1 (en) | Method and System for managing interference of u-link condition in total access mode | |
JPH1168802A (en) | Faulty environment supervisory system | |
JPS63197197A (en) | Load control system | |
JPH10283225A (en) | Information collection system | |
JP3160927B2 (en) | Loop test circuit | |
JPS6367842A (en) | Load controlling system | |
JPH08116579A (en) | Data communication equipment | |
JP2001325117A (en) | Stand-by duplex system information processor and its system state checking method | |
JPH11338721A (en) | Automatic reset device for microcomputer | |
JPH027119B2 (en) | ||
JPS6122494B2 (en) | ||
JPS59201126A (en) | Common bus control system | |
JPS6165553A (en) | Power off detection of modulating/demodulating device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990518 |