JP3951835B2 - 業務管理方法及び業務処理システム - Google Patents
業務管理方法及び業務処理システム Download PDFInfo
- Publication number
- JP3951835B2 JP3951835B2 JP2002194083A JP2002194083A JP3951835B2 JP 3951835 B2 JP3951835 B2 JP 3951835B2 JP 2002194083 A JP2002194083 A JP 2002194083A JP 2002194083 A JP2002194083 A JP 2002194083A JP 3951835 B2 JP3951835 B2 JP 3951835B2
- Authority
- JP
- Japan
- Prior art keywords
- business
- job
- storage device
- schedule
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007726 management method Methods 0.000 title claims 12
- 238000011084 recovery Methods 0.000 claims description 45
- 238000012217 deletion Methods 0.000 claims 1
- 230000037430 deletion Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 32
- 238000010586 diagram Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1469—Backup restoration techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99951—File or database maintenance
- Y10S707/99952—Coherency, e.g. same view to multiple users
- Y10S707/99953—Recoverability
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Multi Processors (AREA)
Description
【発明の属する技術分野】
本発明は,業務の運用管理を行うための業務運用管理システムに関するものである。
【0002】
【従来の技術】
コンピュータが処理を行う複数のジョブを1つの業務とし、更に複数の業務をスケジュールに従って実行する技術がある。またこれらの業務を実行するためにコンピュータは、データを記憶する記憶装置と接続されたシステムとなっている。このような技術において障害は発生した場合、できるだけ早急に業務を復帰させる必要がある。
【0003】
例えば、特開平7−56793号公報には、ファイル障害が発生した際に、オペレータの介在無しに障害復旧を行うために、障害ファイル名、障害装置名に基づいて障害復旧手順及び障害復旧用ジョブ制御分を組み立てることが記載されている。また、特開2000−76110号広報には、障害を受けた分散ファイルシステムにおいて、障害を受けたファイルだけを検出し、そのファイルだけをバックアップ情報から回復し、短時間でシステムを自動回復する技術が記載されている。また、特開2001−350673号公報には、実行済みでないジョブの処理終了予定時刻を算出し、この時刻が各ジョブの終了すべき時刻より前であればスケジュールに組み込み、優先度に従って抽出された順に実行順序を付与してスケジュールを再構成し、再構成されたスケジュールによりジョブを実行することが開示されている。
【0004】
【発明が解決しようとする課題】
特開平7−56793号公報及び特開2000−76110号に記載された技術では、業務のスケジュールを再構成することについては開示されていない。また、特開2001−350673号は復電時に、復電時刻に応じたジョブスケジュールを再構成するものであり、ファイルの障害については開示されていない。
【0005】
本発明は、記憶装置に障害が発生した場合に業務の実行スケジュールを再構成するシステム、方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
業務に使われているファイルと業務の最終完了時間、その業務の重要度を業務運用管理のスケジュールデータの中に組み込んでおき、障害が起こった時にスケジュールデータを参照することにより問題となる業務を把握し、さらにディスク回復時間の条件から、それぞれにおける業務の緊急度を割り出しスケジュールの再構築を自動で行う。
【0007】
【発明の実施の形態】
以下、図面を用いて説明する。
【0008】
図1は業務を実行するシステム構成を示したものである。本システムは、業務の運用管理と業務の実行を行う複数の業務管理サーバ100、業務の実行により生成されたデータ又は業務の実行に必要なデータを記憶する複数のディスク装置125、126、ディスク装置125、126へのデータの書き込み及び読み出しを制御するディスク管理サーバ120、ディスク装置125、126に記憶されたデータが記憶されている記憶装置135、記憶装置135へのデータの書き込み及び読み出しを制御するバックアップサーバ130とを有している。
ここで、記憶装置135は、ディスク装置125、126のデータのバックアップに利用されるものであり、ディスクにより構成されたものであっても、テープで構成されたものであってもよい。図1に示された業務管理サーバ100、ディスク管理サーバ120、バックアップサーバ130は、プログラムやデータを記憶する記憶部101、121、131と、プログラムの実行を行うCPUなどの処理部102、122、132とを有している。従って、各サーバは汎用のコンピュータであっても、また専用のハードウェアにより構成されているものでもよい。以下、各サーバについて具体的に説明する。
【0009】
ここで、業務管理サーバ100は同じ機能を実現するものであり、構成も同じものである。但し、各業務管理サーバで実行される業務又はジョブは異なる場合がある。
【0010】
業務管理サーバ100は、ジョブを実行するジョブ実行制御モジュール103、障害ディスクの回復にどれほどの時間が掛かるかを算出し、障害に影響のない業務をどのように処理するかを決めるスケジュール前処理モジュール104と、業務のスケジュールの再構築を行う優勢順位判別モジュール105と、障害が起こったとき業務に対して処理の緊急度を画面に表示し、それぞれの業務の担当者に障害の通知をする表示・通知モジュール106、データのバックアップやリストアを行うためにデータ転送モジュール107と、実行される複数のジョブ108とを有している。これらのモジュール及びジョブはソフトウェアプログラムであり、記憶部101に格納されている。尚、業務とは1つのジョブ108或いは複数のジョブ108の塊を意味する。また、記憶部101には、業務が実行されるスケジュールを定義したスケジュールデータ109、障害が発生したときにスケジュールを変更する業務の情報が登録された再スケジュールデータ110が記憶されるようになっている。
【0011】
ディスク管理サーバ120は、ディスク管理モジュール123、どのディスク装置にどのファイルが記憶されているかを記したディスク・ファイル対応データ124とを有している。ディスク管理モジュール123はいくつかの機能を有しており、各機能について説明する。まず第1に、ディスク装置125、126へのデータの書き込みやデータの読み出しを行うアクセス制御機能である。次に、ディスク装置125、126へのデータの書き込み、読み出しを監視し、書き込み又は読み出しができない場合に、ディスク装置の障害であると判断し、障害が発生したディスク装置を特定する識別子を業務管理サーバ100へ報告する機能である。この場合、業務管理サーバ100からのアクセス要求によりディスク装置へアクセスした際に、読み出し又は書き込みができずディスク装置に障害が発生したことを検出する。従って、障害が発生した場合にはアクセス要求を受けた業務管理サーバ100へ報告を行う。また、管理サーバ100からのアクセス要求に基づいてディスク装置に格納されるデータのファイル名をファイル・ディスク対応データ124として格納する機能である。また、管理サーバ100からの要求に応じてファイル・ディスク対応データ124を管理サーバ100へ送る機能である。尚、ディスク管理モジュール123は、ソフトウェアプログラムであり記憶部121に記憶されている。
【0012】
ディスク管理サーバ120に接続されたディスク装置125、126は、管理サーバ100で実行されたジョブの結果や、ジョブに利用されるデータが格納されている。
【0013】
バックアップサーバ130は、記憶装置135へのアクセスを管理するアクセス管理モジュール133を有している。尚、このモジュールもソフトウェアプログラムであり、バックアップサーバ130の記憶部131に記憶されている。記憶装置135は、バックアップのための記憶装置であり、業務管理サーバ100、110によりディスク装置125、126のバックアップの対象となったデータが記憶されている。
【0014】
図2にスケジュールデータ109の一例を示す。このスケジュールデータは、管理者によって設定され、ジョブ実行制御モジュール103は、このスケジュールデータを監視し、このスケジュールデータに従ってジョブを実行する。スケジュールデータ109は、業務の運用を管理するための情報であって、業務をどのように行っていくのかといった情報と、障害時における業務の優先度が含まれている。具体的には、開始時間202、実行時間203、スキップ設定204、リミッタ設定205、使用ファイル206、状態207が登録されている。開始時間202とは業務の開始時刻を示すものであり、実行時間203とは業務が終了するまでかかる時間である。スキップ設定204とは、これが「あり」と設定されると、この業務は実行しなくても良いことを示す。例えば、次の日に行ってもそれほど問題とならないような業務に対して設定される。リミッタ設定205とは、必ず終了しなければならない時刻である。使用ファイル206とは、当該業務を行う上で必要となるファイルである。状態207とは、業務の状態が登録されるもので、業務が終了した場合には「終了」、業務を実行中の場合は「実行中」が登録される。何も登録されていない場合は、まだ実行されていない状態を意味する。この実行状態207は、ジョブ実行制御モジュール103により登録される。尚、各々の業務は既に説明したように1つ又は複数のジョブによって構成されており、それぞれのジョブは業務と対応付けられており、業務が特定されるとジョブが特定できるようになっている。ジョブ実行制御モジュール103は、スケジュールデータ109を監視し、業務の実行時刻になったら、当該業務により特定されるジョブ108を実行する。
【0015】
業務管理サーバ100内の再スケジュールデータ110も図2に示したのとほぼ同じ情報を有している。つまり、業務名、開始時間、実行時間、スキップ設定、リミッタ設定、使用ファイルが登録される。但し、状態は登録されていない。
【0016】
図3にファイル・ディスク対応データ124の一例を示す。ファイル・ディスク対応データ124は、それぞれのディスク装置125、126に記憶されているファイル情報302、303を示すものである。ディスク装置125、126はデータの塊としてファイル単位で記憶されており、ファイル情報302、303は、そのファイル名を意味する。
【0017】
図1に示した業務管理サーバ100は、ディスク装置の障害がディスク管理サーバ120から報告されると、スケジュール通りに業務が実行できるかを判断し、スケジュール通りに業務が実行できない場合には、スケジュールデータを変更する。以下、障害の報告を受けた業務管理サーバ100の処理について説明する。
【0018】
図4は、スケジューリングの再構築の処理全体を示したものである。ディスク装置の障害の報告を受けた業務管理サーバは、優先順位判別モジュール105を実行する。優先順位判別モジュール105により、スケジュールデータ109に登録されている業務で、まだ実行されていない業務の情報(業務名、開始時間、実行時間、スキップ設定、リミッタ設定、使用ファイル)をスケジュールデータ109から削除し、再スケジュールデータ110へ登録する(401)。次に、ファイル・ディスク対応データ124を送るようにディスク管理サーバ120へ要求する(402)。ディスク管理サーバ120のディスク管理モジュール123は、障害が発生したディスク装置のファイル・ディスク対応データ124を業務管理サーバへ送る。ファイル・ディスク対応データ124を受取った業務管理サーバは、優先順位判別モジュール105により障害が発生したディスク装置に記憶されたファイルを利用する業務を特定する(403)。例えば、ディスク装置125に障害が発生した場合、図2と図3よりディスク装置125に入っていたa,b,cというファイルを使用する業務A、業務B、業務Cが特定される。
【0019】
次に、スケジュール前処理モジュール104により、障害が発生したディスク装置の回復時間を求めると共に、再スケジュールデータ110に登録されている業務で障害が発生したディスクを利用しない業務についてのスケジュールの調整を行う(404)。
【0020】
図5は、スケジュール前処理モジュール104の処理を示したものである。まず、障害が発生したディスク装置に格納されたファイル情報をバックアップサーバ130に送る。バックアップサーバ130のアクセス管理モジュール133は、送られてきたファイル情報から、それぞれのファイルの容量を求め、業務管理サーバへ送る。スケジュール前処理モジュール104は、送られてきたファイルの容量から、障害が発生したディスク装置が回復するまでにかかる時間を次式により求める(501)。
〔回復時間〕=〔ボリューム交換時間〕+〔容量〕/〔転送速度〕
ここで、ボリューム交換時間、転送速度は予め定数として与えておく。尚、ここでは、ファイル情報に基づいてアクセス管理モジュール133が容量を求める構成としているが、バックアップサーバ130でディスク装置ごとにファイルを管理している場合には、業務管理サーバから障害が発生したディスク装置を特定する識別子を送ることでディスク装置に記憶されたファイルの容量を求めることができる。
【0021】
次に、再スケジュールデータ110に登録されている業務の中で、障害が発生したディスク装置を利用しない業務を特定し、この特定された業務の中から処理501で求めた回復時間内に実行される業務を求める(502)。回復時間内で実行される業務がある場合(処理502で「Yes」)、その業務がディスク回復時間(上記の式で求めた回復時間。)内に終了できる業務かどうかを判別する(503)。回復時間の間に終了できる業務(処理503で「Yes」)ならば当該業務をスケジュールデータ109に登録し、この業務を再スケジュールデータ110から削除し(510)、処理を終了する。回復時間の間に終了できない業務である場合(処理503で「No」)、業務の開始時間を早める(504)。
【0022】
その業務開始時間を早めることによって、回復時間内に終了するか判別する(505)。回復時間内に業務が終了する場合(処理505で「Yes」)、開始時間を変更した業務の情報をスケジュールデータ109に登録し、再スケジュールデータ110から削除し(510)、処理を終了する。尚、処理503で「No」となり、スケジュールデータ109に登録されている業務のスケジュールが密なため、開始時間を早めることができない業務も、処理505の判断を行い処理が行われる。
【0023】
回復時間内に業務が終了しない場合(処理505で「No」)、回復時間の終了時点で、その業務が所定のしきい値以上で終らせることができるかどうかを判別する(506)。しきい値は予め設定され、ここでは80%として説明する。再スケジュールデータ110の実行時間より業務の実行にかかる時間が分かるので、業務の開始時間が決まれば、回復時間終了時点で、どの程度業務が行われたかがわかる。処理506では、回復時間の終了時点で業務の80%が終了しているかを判断する。しきい値以上の業務が終了しない場合(処理506で「No」)、他の業務管理サーバで実行可能か判断する(507)。具体的には、業務名、業務の開始時間、実行時間、リミッタ設定値とを他の業務管理サーバへ送り、他の業務管理サーバから業務実行の可否の報告を受ける。他の業務管理サーバから実行が可能であるとの報告を受けると(処理507で「Yes」)、報告を受けた業務管理サーバに業務実行の依頼を通知する。この時に、再スケジュールデータ110に登録されている当該業務を削除する。尚、他の業務管理サーバで当該業務を実行するためには、他の業務管理サーバで当該業務を実行するためのジョブが予め登録されている必要があるが、当該ジョブを有していない場合、業務を依頼する業務サーバへ業務の実行を依頼する際に、業務の実行に必要なジョブを転送する。他の業務管理サーバで業務を実行できない場合(処理507で「No」)、処理を終了する。
【0024】
しきい値以上の処理が終了できる場合(処理506で「Yes」)、当該業務の終了時間を新たな回復時間として(509)、スケジュールデータ109へ当該業務の情報を登録し、再スケジュールデータ110から当該業務の情報を削除する。尚、このとき開始時間が変更されていれば、変更された開始時間がスケジュールデータ109に登録される。再スケジュールデータ110に他の登録されている業務があれば(処理511で「Yes」)、再び処理502から処理を実行する。ジョブ実行制御モジュール103は、スケジュールデータ109によりジョブを実行しており、図5の処理510でスケジュールデータ109に登録された業務を実行する。
【0025】
スケジュール前処理モジュール104でスケジュールの調整が終了すると、再び優先順位判別モジュール105により、図4の処理が行われる。
【0026】
優先順位判別モジュール105は、再スケジュールデータ110に登録されている業務についてのスケジュールを決定する(405)。ここで、再スケジュールデータ110に登録されている業務は、障害が発生した以降に実行される業務から、回復時間内に終了する業務を除いたものとなっている。
【0027】
図6、7は、処理405のスケジュール決定の処理を示したものである。
【0028】
まずディスク装置の回復を行った後に業務を実行するため、それぞれの業務のリミッタ時刻から回復時間を差し引く(601)。次に、再スケジュールデータ110に登録された業務を、開始時間が早い順に整理し直し、全ての業務が問題なく行えるかどうかを判定する(602)。すべての業務が問題なく行えるとは、各業務についてリミッタ設定値を超えることなく業務が終了される場合をいう。全ての業務が問題なく行える場合(処理602で「Yes」)、この順番でスケジュールデータ109へ業務の情報を登録し、再スケジュールデータから当該業務の情報を削除し(607)、処理を終了する。
【0029】
このままの順番ではリミッタ設定値を超える業務がある場合(処理602で「No」)、業務終了時刻がリミッタ設定に最も近い業務を1番目の業務になるように業務の順番を入れ替える(603)。
【0030】
並び替えた業務の順番で全ての業務がリミッタ設定値を超えることなく行えるかどうかを判定する(604)。全ての業務がリミッタ設定値を超えない場合(処理604で「Yes」)、並び替えた順番で各業務の開始時刻を設定し、スケジュールデータ109に業務の情報を登録し、再スケジュールデータ110から当該業務の情報を削除し(607)、処理を終了する。
【0031】
並び替えてもリミッタ設定値を超える業務がある場合(処理604で「No」)、業務の合計とリミッタにより処理した数を比較する(605)。まだ動かしていない業務がある場合(処理605で「Yes」)、次にリミッタが近い業務にたいして同様の処理を行う。
【0032】
動かせる業務がなくなった場合(処理605で「No」)、業務の中でスキップするものがあるかどうかの判定を行う(608)。
【0033】
スキップ可能な業務がある場合(処理608で「Yes」)、先頭にあるスキップ可能な業務を再スケジュールデータ110から削除する(608)。尚、このときの再スケジュールデータ110は、図6により決定された順番で処理されるよう、開始時間が設定されている。また、先頭にあるスキップ可能な業務とは、設定された開始時間が早いものを意味する。スキップ(削除)した結果、再スケジュールデータ110に登録されている業務がリミッタ設定値を超えないかどうかの判別を行う(610)。全ての業務がリミッタ設定値を超えない場合(処理610で「Yes」)、再スケジュールデータ110に登録された業務の情報をスケジュールデータ110に登録し、再スケジュールデータから業務の情報を削除する(611)。次に、スキップした業務を、通知・表示部に通知する(612)。リミッタ設定値を超える業務がある場合(処理610で「No」)、処理608に戻り次にスキップできる業務を求める。スキップするものがない場合は、現在再スケジュールデータ110に登録されている業務の情報をスケジュールデータ109へ登録し、再スケジュールデータ110から業務の情報を削除する(613)。また、リミッタ設定値内に終了しない業務を、通知・表示部に通知する(614)。図7の処理が終了すると再スケジュールデータ110に登録された業務の情報は、スケジュールデータ109に全て登録され、再スケジュールデータ110の業務の情報は全て削除されている。
【0034】
再び、図4の処理に戻り、スケジュールが決まったら、業務ビューアに変更後の業務スケジュールを表示し、管理者へ通知する(406)。このとき、リミッタ設定値を超える業務が管理者に分かるように例えば赤色で表示したり、リミッタ設定値を超える業務だけを他の業務と分けて表示する。
【0035】
図8は、表示・通知モジュール106の処理を示したものである。まず通知された業務が、スキップされた業務なのか、リミッタの制限内に終了しなかった業務なのかを判定する(701)。スキップされた業務ならば、スキップした業務に対して、業務担当者にメールで通知する(702)。業務ビューアにスキップした業務を青色で表示する(703)。リミッタ設定値以内で終了しない業務に対しては、業務がリミッタからどれだけ遅れてることになるのかを計算する(704)。これは、スケジュールデータ109のリミッタ設定値、開始時刻、実行時間から求めることができる。業務の遅れが緊急連絡時間を越えるかどうかの判定を行う(705)。緊急連絡時間とは、管理者によって予め決められた値である。業務の遅れが緊急連絡時間を超える場合は,その業務の担当者に電話で緊急の連絡を行う(706)。業務ビューアにリミッタ設定値を超えてしまう業務に対して赤色で表示する(707)。業務の遅れが緊急連絡時間以内である場合は、その業務の担当者にメールで通知を行う(708)。業務ビューアにリミッタ設定以内に終了しない業務に対して黄色で表示する(709)。
【0036】
図9は、業務ビューア表示例を示したものである。
【0037】
業務ビューア801には管理している業務示す業務名802とジョブ実行スケジュール803が表示される。ジョブ実行スケジュールのノード811〜814を緊急度によって色で分別する。デフォルトは緑色、緊急度が高いものを赤色、緊急度が低いものを黄色、業務をスキップしたものを青色で表示する。
【0038】
再び図4の処理に戻り、障害が起こったディスク装置のディスク回復を行うためデータ転送モジュール107を実行する(407)。データ転送モジュール107は、バックアップサーバ130から障害の発生したディスク装置へデータのリストアを実行する。
【0039】
図10は障害の発生によるスケジュールの変更と管理者への通知を具体的に示したものである。901は実行される予定の業務であり、911〜914はそれぞれの業務のノードであり、921〜924はそれぞれの業務のリミッタ設定値である。障害が発生しない場合は、ノード911〜914で示したように業務が実行される。931のdowNoは、ディスクに障害が発生した時点を示したものである。尚、この時のスケジュールデータ109を図12(a)に示す。
【0040】
ディスク装置125で障害が発生した場合、ディスク装置125を利用している業務はファイル・ディスク対応データ124より業務A,業務B,業務Cとなる。941はディスク装置125に格納されるデータの容量から求めた回復時間である。ケース0は、業務の開始時間に基づいて並べかえた業務のスケジュールである。
ケース1は、図6に示した処理603〜606により業務が並替えられたスケジュールである。具体的には、ケース0のスケジュールに対して、終了時刻がリミッタ設定値を超える業務(ここでは、業務Aと業務Cである。)のうち、終了時刻がリミッタ設定値から最も離れている業務(ここでは、業務C)を、最初に実行する業務とする。ここでは、業務C、業務A、業務B、業務Dとなる。並替えたスケジュールに基づいて、再び終了時刻がリミッタ設定値を超える業務のうち、終了時刻がリミッタ設定値から最も離れている業務を、最初に実行する業務とする。これにより、ケース1に示すように業務A、業務C、業務B、業務Dの順に並替えられる。
【0041】
順序を変更しても,リミッタ設定を超える業務があるので,次に図7の処理を行う。しかしながら、図12(a)に示すように、スキップ設定に「あり」と示された業務がないので、そのまま処理を終了する。これにより表示・通知モジュール106は、リミッタ設定値を超える業務について次のように処理が行われる。
【0042】
業務Aと業務Cの担当者に連絡を送る。連絡の選択の方法は,リミッタ設定値から終了時刻がどれだけ離れているかによって決まる。リミッタ設定値から離れている時間が、緊急連絡時間以内である業務Aに対しては、業務Aの担当者にメールで連絡を送ると共に、業務ビューアに業務Aを黄色で表示する。リミッタ設定値から離れている時間が緊急連絡時間を超える業務Cに対しては、業務Cの担当者に電話で連絡すると共に、業務ビューアに業務Cを赤色で表示する。ディスク回復後に、スケジュールデータ109に登録された通りにジョブの実行を行い、担当者は必要があればスケジュールデータ109を変更する。
【0043】
ケース2は、図12(b)に示すように、スキップする業務があった場合に設定されたスケジュールを示したものである。ここでは、図12(b)より業務Aがスキップ設定「あり」となっているので、業務Aがスケジュールから削除されている。この場合、表示・通知モジュール106により、業務ビューアに再スケジュールした業務スケジュールを表示する。また、業務Aがスキップしたことを担当者にメールで連絡し、業務ビューアには業務Aを青色で表示する。
【0044】
図11は、図12(c)のるように障害発生前に業務A、業務D、業務B、業務Cとスケジュールデータ109が設定されている場合のスケジュールの変更の例を示したものである。図10と同じ符号のものは、図10と同じ意味を示すものである。ディスク装置125で障害が発生した場合、図10で説明したのと同様に業務A、業務B、業務Cがディスク装置125を利用する業務であると特定される。
【0045】
次に、図5に示した処理により、障害が発生したディスク障害125を利用しない業務で、回復時間内に実行予定の業務があるかを判別する。ここで、業務Dは障害の発生したディスク装置125を利用しない業務であり、回復時間内に実行が予定されている業務である。
【0046】
業務Dは、ディスク回復時間内で終了しないので(1)、業務Dの開始時間を早める(2)。開始時間を早めても業務Dの終了時刻は、回復時間を超えてしまうので、回復時間の終了時点でどの程度業務が終了しているかを求める。業務が終了した程度が、予めさだめたしきい値(例えば、80%。)以上終了している場合には、業務Dを実行させ、業務Dの終了時刻を回復時間の終了時点として、障害が発生したディスク装置124を利用する業務(ここでは、業務A、業務B、業務C)について図6、図7に示した処理を行う。これにより、業務D、業務B、業務Cの順でスケジュールが設定される(3)。尚、業務Aについてはスキップの設定がありスケジュールから削除している。
【0047】
最後に表示・通知モジュール106により、業務Aがスキップしたことを担当者にメールで連絡し、業務ビューアには業務Aを青色で表示する。
【0048】
尚、スケジュールデータ109に登録されたデータは、障害の発生により変更されるが、例えばスケジュールデータが1日単位で決まっている場合、次の日になれば変更前のスケジュールデータ109に設定されるようになっている。
【0049】
また、障害が発生すると障害が発生した後に実行されるすべての業務を対象に図4〜8の処理を行ったが、業務の終了時刻と業務の開始時刻との間が回復時間よりも大きければ、その後の業務については図4〜8の処理を行う必要がない。例えば、業務A、業務B、業務C、業務D、業務Eとあり、業務Cの終了時刻から業務Dの開始時刻までの時間が、回復時間よりも大きければ、業務D、業務Eについては、図4〜8の対象外としてもよい。これを実現するためには、例えば図5の処理501で回復時間が求められた後に、業務の終了時刻から次の業務の開始時刻までの時間を求め、この時間が回復時間より大きければ、それ以降の業務の情報をスケジュールデータ109に登録し、再スケジュールデータから削除する処理を行えばよい。
【0050】
このように、障害によってどの業務に問題があるのかを管理者が探す必要がなくなる。また業務のスケジューリングを自動的に組みなおすことができる。スケジューリングできない場合でも、画面に問題となる業務とその緊急度を表示するので、管理者は問題となる業務の早期発見と修正を行うことができる。
【0051】
【発明の効果】
以上説明したように、ディスクの障害に対した業務のスケジュールを設定することができる。
【図面の簡単な説明】
【図1】システムの構成を示した図である。
【図2】スケジュールデータの一例を示した図である。
【図3】ディスク・ファイル対応データの一例を示した図である。
【図4】スケジュール設定の処理を示した図である。
【図5】スケジュール設定の処理を示した図である。
【図6】スケジュール設定の処理を示した図である。
【図7】スケジュール設定の処理を示した図である。
【図8】表示及び通知の処理を示した図である。
【図9】設定されたスケジュールの表示例を示した図である。
【図10】処理の具体例を示した図である。
【図11】処理の具体例を示した図である。
【図12】スケジュールデータの一例を示した図である。
【符号の説明】
100 業務管理サーバ
103 ジョブ実行制御モジュール
104 スケジュール前処理モジュール
105 優先順位判別モジュール
106 表示・通知モジュール
107 データ転送モジュール
108 ジョブ
109 スケジュールデータ
110 再スケジュールデータ
120 ディスク管理サーバ
123 ディスク管理モジュール
124 ファイル・ディスク対応データ
125 ディスク装置
126 ディスク装置
130 バックアップサーバ
133 バックアップ管理モジュール
135 記憶装置
Claims (4)
- スケジュールに従って業務を実行する少なくとも一つの業務管理サーバと、前記業務管理サーバによって処理されるデータを記憶する少なくとも一つの第1の記憶装置と、前記第1の記憶装置のデータのバックアップデータを記憶する少なくとも一つの第2の記憶装置とからなる業務処理システムにおいて、前記業務管理サーバは、
前記第1の記憶装置の障害発生時に、前記スケジュールから未実行の業務を抽出し、
業務が使用するファイルと記憶装置との対応を示す対応テーブルに基づいて、障害が発生した前記第1の記憶装置内のファイルを使用する少なくとも一つの第1の業務を、前記未実行の業務から抽出し、前記第1の業務について、前記第2の記憶装置のバックアップデータを用いて障害が発生した前記第1の記憶装置を回復するためのディスク回復時間を算出し、
障害が発生した前記第1の記憶装置を使用せず、前記算出したディスク回復時間内に実行できる少なくとも一つの第2の業務を前記未実行の業務から抽出し、前記算出したディスク回復時間の時間帯に前記第2の業務をスケジュールし、
前記第1の記憶装置の障害回復後の時間帯に、それぞれの開始時間の順に少なくとも一つの前記第1の業務の実行順序を並べ、業務が必ず終了しなければならない時刻であるリミッタ値を越える前記第1の業務の前記実行順序を変えることによって前記第1の業務をスケジュールすることを特徴とする業務管理方法。 - 請求項1記載の業務管理方法において、前記第2の業務のスケジュールは、前記ディスク回復時間内に実行が終了しない前記第2の業務の開始時間を早め、さらに、前記ディスク回復時間内に前記第2の業務の実行が終了しない場合、前記ディスク回復時間内に、しきい値以上の業務が終了しないときは前記第2の業務の実行を他の業務管理サーバに依頼し、しきい値以上の業務が終了するときは前記第2の業務をスケジュールするとともに、時間を超えた場合のそれぞれに応じて警告の表示形態を変えることを特徴とする業務管理方法。
- 請求項1記載の業務管理方法において、前記第1の業務のスケジュールは、前記リミッタ値を越え、かつ、開始時間を動かせる他の業務がないときは、前記第1の業務が削除可能であればスケジュールから削除し、削除したことをユーザに通知し、さらに、前記リミッタ値を越えない前記第1の業務をスケジュールし、前記リミッタ値を越える業務をユーザに通知することを特徴とする業務管理方法。
- 業務処理システムは、
スケジュールに従って業務を実行する少なくとも一つの業務管理サーバと、
前記業務管理サーバによって処理されるデータを記憶する少なくとも一つの第1の記憶装置と、
前記第1の記憶装置のデータのバックアップデータを記憶する少なくとも一つの第2の記憶装置とを有し、
前記業務管理サーバは、
前記第1の記憶装置の障害発生時に、前記スケジュールから未実行の業務を抽出する手段、
業務が使用するファイルと記憶装置との対応を示す対応テーブルに基づいて、障害が発生した前記第1の記憶装置内のファイルを使用する少なくとも一つの第1の業務を、前記未実行の業務から抽出し、前記第1の業務について、前記第2の記憶装置のバックアップデータを用いて障害が発生した前記第1の記憶装置を回復するためのディスク回復時間を算出する手段、
障害が発生した前記第1の記憶装置を使用せず、前記算出したディスク回復時間内に実行できる少なくとも一つの第2の業務を前記未実行の業務から抽出し、前記算出したディスク回復時間の時間帯に前記第2の業務をスケジュールする手段、及び
前記第1の記憶装置の障害回復後の時間帯に、それぞれの開始時間の順に少なくとも一つの前記第1の業務の実行順序を並べ、業務が必ず終了しなければならない時刻であるリミッタ値を越える前記第1の業務の前記実行順序を変えることによって前記第1の業務をスケジュールする手段を有することを特徴とする業務処理システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002194083A JP3951835B2 (ja) | 2002-07-03 | 2002-07-03 | 業務管理方法及び業務処理システム |
US10/371,212 US7036041B2 (en) | 2002-07-03 | 2003-02-24 | Method, program and system for managing operation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002194083A JP3951835B2 (ja) | 2002-07-03 | 2002-07-03 | 業務管理方法及び業務処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004038516A JP2004038516A (ja) | 2004-02-05 |
JP3951835B2 true JP3951835B2 (ja) | 2007-08-01 |
Family
ID=31702863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002194083A Expired - Fee Related JP3951835B2 (ja) | 2002-07-03 | 2002-07-03 | 業務管理方法及び業務処理システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7036041B2 (ja) |
JP (1) | JP3951835B2 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4141875B2 (ja) | 2003-03-27 | 2008-08-27 | 株式会社日立製作所 | リカバリ処理方法及びその実施システム並びにその処理プログラム |
JP2005018510A (ja) * | 2003-06-27 | 2005-01-20 | Hitachi Ltd | データセンタシステム及びその制御方法 |
JP2005031771A (ja) * | 2003-07-08 | 2005-02-03 | Hitachi Ltd | ジョブスケジューリング管理方法及びシステム並びにプログラム |
JP4485763B2 (ja) * | 2003-07-10 | 2010-06-23 | 株式会社日立製作所 | 運用管理方法及び装置 |
JP4267420B2 (ja) * | 2003-10-20 | 2009-05-27 | 株式会社日立製作所 | ストレージ装置及びバックアップ取得方法 |
GB2409297A (en) * | 2003-12-16 | 2005-06-22 | Ibm | Method of assessing the impact of the failure of a component on the temporal activity of the services supported by the component |
DE602004025515D1 (de) * | 2004-01-09 | 2010-03-25 | T W Storage Inc | Verfahren und vorrichtung zum durchsuchen von backup-daten auf der basis von inhalt und attributen |
JP4831599B2 (ja) * | 2005-06-28 | 2011-12-07 | ルネサスエレクトロニクス株式会社 | 処理装置 |
US7707451B2 (en) * | 2005-06-28 | 2010-04-27 | Alcatel-Lucent Usa Inc. | Methods and devices for recovering from initialization failures |
JP2007122167A (ja) * | 2005-10-25 | 2007-05-17 | Fujitsu Ltd | データ転送プログラム、データ転送方法およびデータ転送装置 |
GB0605064D0 (en) * | 2006-03-14 | 2006-04-26 | Ibm | A method and system for transaction recovery time estimation |
JP2009282581A (ja) * | 2008-05-19 | 2009-12-03 | Hitachi Ltd | ビジネスプロセス実行装置およびビジネスプロセス実行方法 |
US8738854B2 (en) * | 2010-09-03 | 2014-05-27 | Hitachi, Ltd. | Storage apparatus and control method of storage apparatus |
JP5586551B2 (ja) * | 2011-09-21 | 2014-09-10 | 東芝テック株式会社 | コンピュータシステム、及びジョブ制御方法 |
US20140040447A1 (en) * | 2012-07-31 | 2014-02-06 | Hitachi, Ltd. | Management system and program product |
US9430335B2 (en) * | 2013-09-18 | 2016-08-30 | International Business Machines Corporation | Optimizing the number and type of database backups to achieve a given recovery time objective (RTO) |
JP6369235B2 (ja) * | 2014-09-02 | 2018-08-08 | 富士通株式会社 | ストレージ制御装置およびストレージ制御プログラム |
JP2016057795A (ja) * | 2014-09-09 | 2016-04-21 | 富士通株式会社 | ストレージ制御装置,ストレージシステム及びストレージ制御プログラム |
CN106651161B (zh) * | 2016-12-08 | 2020-10-20 | 国网浙江杭州市富阳区供电公司 | 采集运维动态派工方法 |
US11068357B2 (en) * | 2019-06-03 | 2021-07-20 | EMC IP Holding Company LLC | Uninterrupted restore operation using a time based approach |
WO2022014089A1 (ja) * | 2020-07-16 | 2022-01-20 | 富士フイルム株式会社 | 超音波システムおよび超音波システムの制御方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5574897A (en) * | 1992-09-30 | 1996-11-12 | International Business Machines Corporation | System managed logging of objects to speed recovery processing |
US5455934A (en) | 1993-03-23 | 1995-10-03 | Eclipse Technologies, Inc. | Fault tolerant hard disk array controller |
US6208913B1 (en) | 1993-06-25 | 2001-03-27 | Yz Systems, Inc. | Chemical injection system |
JP2853527B2 (ja) | 1993-08-17 | 1999-02-03 | 日本電気株式会社 | ファイル障害自動復旧システム |
US5613113A (en) * | 1993-10-08 | 1997-03-18 | International Business Machines Corporation | Consistent recreation of events from activity logs |
FR2751106B1 (fr) * | 1996-07-11 | 1999-01-08 | Alsthom Cge Alcatel | Methode de planification de transactions distribuees |
US6351754B1 (en) * | 1998-06-23 | 2002-02-26 | Oracle Corporation | Method and system for controlling recovery downtime |
JP2000076110A (ja) | 1998-08-28 | 2000-03-14 | Hitachi Ltd | 分散ファイルシステムにおける回復処理システム |
US6757850B1 (en) * | 1998-12-30 | 2004-06-29 | Ncr Corporation | Remote services management fault escalation |
US6728879B1 (en) * | 1999-06-02 | 2004-04-27 | Microsoft Corporation | Transactional log with multi-sector log block validation |
US6658590B1 (en) * | 2000-03-30 | 2003-12-02 | Hewlett-Packard Development Company, L.P. | Controller-based transaction logging system for data recovery in a storage area network |
JP2001350637A (ja) | 2000-06-09 | 2001-12-21 | Nec Corp | 情報処理装置の復電時自動運転制御方式,方法および自動運転制御プログラムを記録した記録媒体 |
WO2002007385A1 (fr) * | 2000-07-13 | 2002-01-24 | Fujitsu Limited | Dispositif de commande de surveillance |
US6820217B2 (en) * | 2001-10-29 | 2004-11-16 | International Business Machines Corporation | Method and apparatus for data recovery optimization in a logically partitioned computer system |
US7152181B2 (en) * | 2002-02-22 | 2006-12-19 | Bea Systems, Inc. | Method for highly available transaction recovery for transaction processing systems |
US6947956B2 (en) * | 2002-06-06 | 2005-09-20 | International Business Machines Corporation | Method and apparatus for selective caching of transactions in a computer system |
US6944789B2 (en) * | 2002-06-11 | 2005-09-13 | Hitachi, Ltd. | Method and apparatus for data backup and recovery |
JP4141875B2 (ja) | 2003-03-27 | 2008-08-27 | 株式会社日立製作所 | リカバリ処理方法及びその実施システム並びにその処理プログラム |
US7139629B2 (en) | 2003-04-28 | 2006-11-21 | Palo Alto Research Center Incorporated | Planning and scheduling for failure recovery system and method |
US7100076B2 (en) | 2003-05-09 | 2006-08-29 | Hewlett-Packard Development Company, L.P. | Minimum latency reinstatement of database transaction locks |
-
2002
- 2002-07-03 JP JP2002194083A patent/JP3951835B2/ja not_active Expired - Fee Related
-
2003
- 2003-02-24 US US10/371,212 patent/US7036041B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004038516A (ja) | 2004-02-05 |
US20040078628A1 (en) | 2004-04-22 |
US7036041B2 (en) | 2006-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3951835B2 (ja) | 業務管理方法及び業務処理システム | |
US7721290B2 (en) | Job scheduling management method using system resources, and a system and recording medium for implementing the method | |
CN103154901B (zh) | 自动及自调节的数据备份操作的方法和系统 | |
US10725965B1 (en) | Systems and methods for managing copy creation and deletion | |
JP4255317B2 (ja) | 運用監視方法及び実施システム並びに処理プログラム | |
CN110309024B (zh) | 数据处理系统及其执行数据处理任务的方法 | |
US8959509B1 (en) | Techniques for virtual machine backup scheduling | |
US8856793B2 (en) | System, method and program for scheduling computer program jobs | |
US8321644B2 (en) | Backing up filesystems to a storage device | |
US8909603B2 (en) | Backing up objects to a storage device | |
US20180011742A1 (en) | Job scheduling management | |
US20050015641A1 (en) | System and method for automatically and dynamically optimizing application data resources to meet business objectives | |
US20120072582A1 (en) | Method, apparatus and program storage device for scheduling the performance of maintenance tasks to maintain a system environment | |
US7657583B2 (en) | Calculating recovery time of an application system | |
CN112052095B (zh) | 一种分布式高可用的大数据挖掘任务调度系统 | |
CN105096014A (zh) | 远程录制作业运行情况的方法和系统 | |
US8972352B1 (en) | Probe based backup | |
JP4120371B2 (ja) | 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム | |
JP6157420B2 (ja) | 業務処理システムおよび業務処理方法 | |
CN110955556B (zh) | 数据库恢复方法及装置、存储介质、数据库系统 | |
US8589354B1 (en) | Probe based group selection | |
JP4464655B2 (ja) | コンピュータの監視装置および監視対象のコンピュータに関するメッセージの処理方法 | |
CN108920344B (zh) | 一种存储方法及设备、计算机可读存储介质 | |
CN107888453B (zh) | 一种基于Nginx下的多服务器状态监控方法及系统 | |
CN114510433A (zh) | 光传输设备的内存管理方法、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060322 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060518 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060822 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060919 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20061025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070416 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110511 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110511 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120511 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120511 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130511 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130511 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |