JP2005055995A

JP2005055995A - ストレージ制御方法、および、冗長化機能を有するサーバシステム

Info

Publication number: JP2005055995A
Application number: JP2003206404A
Authority: JP
Inventors: Kazuhisa Abe; 和寿安部; Hironobu Kashiwagi; 博信柏樹; Keiji Yamahara; 圭司山原; Masaaki Higuchi; 正明樋口
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2003-08-07
Filing date: 2003-08-07
Publication date: 2005-03-03

Abstract

【課題】保守などでシステム全体ではサービスを停止することなく、障害発生時には、短時間で運用系切替えによる障害回復をおこなう冗長化機能を、シンプルな構成で、低コストで実現する。
【解決手段】Ｎ台の運用系サーバと一台の待機系サーバを用意し、ハードディスクを冗長化してミラーリングしておく。運用系を保守などのために停止するときに、ミラーリング動作を中断して、一方のハードディスクで、サービスに伴ったデータ書き込みの更新アドレス情報を記憶しながら、運用系のサービスを継続する。他の一方のハードディスクから待機系のハードディスクにデータをコピーする。コピーが終了した後に、更新アドレス情報に基づき、運用系と待機系のハードディスクを一致させて、待機系と運用系を切替える。また、障害が発生したときには、運用系から待機系に無条件でデータのコピーをおこなうようにする。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は、サーバシステムのストレージ制御方法に係り、特に冗長化機能を有するサーバシステムで、運用系システムと待機系システムが用意されるシステムであって、無停止でシステムの運用をおこなうサーバシステムに用いて好適なサーバシステムのストレージ制御方法に関する。
【０００２】
【従来の技術】
近年、サーバシステムは、情報処理社会における基幹技術となっており、高い信頼性が求められるようになってきている。このような信頼性確保のためのサーバシステム一般における冗長化の技術の例としては、単体で必要とされる機能を満たすサーバを複数台集めて、あたかも一つのシステムであるかのように動作させるクラスタサーバシステムが挙げられる、クラスタサーバシステムでは一台のサーバがダウンしても、クラスタ内の他のサーバが必要なリソースを引き継いで、短時間に業務を再開する。クラスタサーバシステムにおけるデータの引継ぎ手段としては、共有ディスクタイプが有り、これは、二つのサーバで、拡張ディスクアレイ装置を共有し、データの引継ぎを実現する。
【０００３】
例えば、下記の特許文献１では、各サーバの状態を共有ディスクに保存して、複数のサーバを管理できるようになっている。
【０００４】
また、その他の冗長化技術として、一台のサーバ内でプロセッサ、メモリーからＰＣＩモジュール、ストレージまで、主要なハードウェアコンポーネントの完全二重化をおこなうフォールトレラントサーバシステムが挙げられる。
【０００５】
【特許文献１】
特開平１０−２４７９１１号公報
【０００６】
【発明が解決しようとする課題】
システム設計者は、システムのリスク、可用性、コストを勘案してシステム設計をおこなうことになる。特に、障害が起こったときのサーバシステムにおけるデータ資産の引継ぎは、冗長化されたシステムのキーポイントである。
【０００７】
上記クラスタサーバシステムにおける共有ディスク方式にておこなわれるサーバ間のデータの共有によるデータ引継ぎは、無停止でデータ資産も損なうことがない。しかしながら、一般的に共有ディスクが高価であるために、システム構築のコストが大きくなる傾向にある。またデータを共有するため、各サーバのＯＳが同一であることが必要であるというシステム設計上の制約もある。また、保守のために一定時間、サーバシステムを停止させて、ディスク内のデータの更新作業等のメンテナンスをおこなう際に、共有データの使用に影響を与えないための特別な配慮が必要となる等の保守上の制約も生じる。
【０００８】
また、一方フォールトトレラントサーバシステムにおいては完全なハードウェアの二重化をおこない、高信頼性動作を保証するが、システム構築のコストが膨大となる。
【０００９】
本発明は、上記問題点を解決するためになされたもので、その目的は、サーバシステムのストレージ制御に関し、冗長化機能を有するサーバシステムの運用系と待機系を用意して、通常サーバ停止を必要とする保守作業においては、運用系切替えによりサービスを継続可能とし、障害発生時には、短時間で運用系切替えによる障害回復をおこなう冗長化機能を、シンプルな構成で、低コストで実現することのできるサーバシステムを提供することにある。
【００１０】
【課題を解決するための手段】
上記目的を達成するために、本発明のストレージ制御方法においては、Ｎ台の運用系サーバと一台の待機系サーバを用意し、運用系サーバ、待機系サーバのハードディスクを冗長化して、ミラーリングしておく。
【００１１】
そして、運用系サーバを、保守などのために停止するときに、運用系サーバの冗長化動作を中断して、ミラーリングのハードディスクの一方のハードディスクで運用系サーバのサービスを継続する。
【００１２】
このときに、運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶しておく。
【００１３】
一方、運用系サーバのミラーリングされたハードディスクの他の一方のハードディスクから待機系サーバのハードディスクにデータをコピーする。
【００１４】
そして、コピーが終了して、かつ、運用系サーバのサービスに伴ったデータ書き込みがないときに、記憶された更新アドレスに基づいて、運用系サーバのサービスに伴って書き込まれたデータを、待機系サーバにコピーする。
【００１５】
コピーが終了して、運用系サーバと待機系サーバのハードディスクのデータが全て一致したときに、待機系サーバを運用系サーバに切り替え、運用系サーバを待機系サーバに切り替えて、運用系サーバの停止をおこなって、メインテナンスなどをおこなう。
【００１６】
また、障害が発生したときには、運用系サーバから待機系サーバに無条件でデータのコピーをおこなうようにする。
【００１７】
各運用系サーバと待機系サーバは、同一のシャーシ内に搭載し、ハードディスクを高速の専用バスで接続して、コピーをおこなったり、他のサーバへのコピーの制御の中継を切り替えられるようにする。
【００１８】
このように、本発明のサーバシステムの構成によれば、保守などによる停止時、、障害発生時の各々の状態において、運用系サーバのＨＤＤ内データを完全にコピーすることから、二台以上の運用系サーバに対して、一台の待機系サーバのみによる低コストな冗長構成が実現できるものとなっている。
【００１９】
また、保守などによる停止時には、冗長化された二台以上のＨＤＤのうち、一台のＨＤＤの冗長化動作を停止させて、サーバの運用切替えのためのデータコピーに使用する。そのため、運用系のサービスを停止せずに、高速に運用系と待機系を切替えることができる。また、最も故障頻度が多いＨＤＤに関しては、ＨＤＤの冗長化構成により障害時の継続動作が可能であり、ＨＤＤ以外の故障時には、運用系サーバから待機系サーバへのコピー終了後の切替えを実現する。
【００２０】
【発明の実施の形態】
以下、本発明に係る一実施形態を、図１ないし図６を用いて説明する。
【００２１】
〔冗長化機能を有するサーバシステムの構成〕
先ず、図１を用いて本発明の一実施形態に係る冗長化機能を有するサーバシステムの構成について説明する。
図１は、本発明の一実施形態に係る冗長化機能を有するサーバシステムの構成図である。
【００２２】
本実施形態のサーバシステムは、図１に示されるように、通常、複数台のサーバ部２と、予備のために設けられる予備サーバ部３、マネージメント部４、ＬＡＮスイッチ部５から構成されている。
【００２３】
サーバ部２の台数は、システムの信頼性、可用性、パーフォマンスなどの要素を勘案して、システム設計の際に決定される。予備サーバ部３は、システムの運用にあたって予備的に設けられるサーバであり、複数台設けてもよいが、通常は、運用されているサーバ部２の台数よりは少なくなっている。
【００２４】
マネージメント部４は、各サーバの相互に関係のある動作を管理する部分であり、各サーバ部２、予備サーバ部３の監視・制御マネージメント部２０に接続されている。ＬＡＮスイッチ部５は、外部のＬＡＮ８と接続されて、各サーバ部２、予備サーバ部３とネットワークの中継をおこなう部分である。
【００２５】
また、ＬＡＮ８には、保守端末６とクライアント群７が接続されていて、保守端末６からは、システムの保守、各種の設定をおこない、クライアント群７からは、サーバの提供するサービスを利用する。
【００２６】
サーバ部２は、監視・制御マネージメント部２０、ＣＰＵ２１、メモリ２２、ＬＡＮ／ＩＦ２３、デバイス制御部２４、ディスクコントローラ部２５、ＨＤＤ２８，２９からなっている。この構成は、予備サーバ部３も同様である。
【００２７】
監視・制御マネージメント部２０は、サーバの故障監視と、マネージメント部４からの指令を受け、デバイス制御部２４とディスクコントローラ部２５を制御してサーバ部２全体の制御をおこなう部分である。
【００２８】
デバイス制御部２４は、サーバの各デバイスの制御をおこなう部分である。
【００２９】
ディスクコントローラ部２５は、同期制御部２６とディスク制御部２７からなり、ＨＤＤの制御をおこなう部分である。
【００３０】
ディスクコントローラ部２５の同期制御部２６は、サーバ部２のＨＤＤ２８，２９と、予備サーバ部３のＨＤＤ３８，３９のデータの同期のための制御をおこなう部分である。
【００３１】
ディスクコントローラ部２５のディスク制御部２７は、ＨＤＤ２８，２９を直接制御し、ＨＤＤの冗長化動作と、同期制御部２６から指示を受けて、サーバ部２と予備サーバ部３のデータの同期のための入出力制御を司る。
【００３２】
また、同期制御部２６は、更新アドレスメモリ部２６１と、ディスク制御監視部２６２からなる。更新アドレスメモリ部２６１は、ハードディスクのデータが更新される際の書き込みアドレスを記憶する部分である。ディスク制御監視部２６２は、ハードディスクのサービスに伴うアクセスを監視する部分である。これらは、サーバ部２のＨＤＤと、予備サーバ部３のＨＤＤのデータの同期を保つために必要なコンポーネントであり、詳細な動作については後に説明する。
【００３３】
〔冗長化機能を有するサーバシステムの動作〕
次に、図２ないし図５を用いて本発明の一実施形態に係る冗長化機能を有するサーバシステムの動作について説明する。
（Ｉ）予定停止時の動作
先ず、図２を用いてサーバシステムを保守・メンテナンス作業のために停止させる場合のサーバシステムの動作について説明する。
【００３４】
以下では、サーバシステムを保守・メンテナンス作業などで保守者が意図したときに、運用系のシステムを停止させることを「予定停止」と言うことにする。
【００３５】
また、サーバ部２を運用系として、予備サーバ部３を待機系として運用する場合を考え、それぞれ、運用系サーバ部２、待機系予備サーバ部３ということにする。
図２は、予定停止させるときのシステム動作を説明するためのタイミングチャートである。
【００３６】
運用系サーバ部２では、通常の運転では、ＨＤＤ２８とＨＤＤ２９は、冗長化されていて、ミラーリング（ＲＡＩＤ１）の動作で読み書きのアクセスがなされている。一方の待機系予備サーバ部３の動作は停止している。
【００３７】
ここで、ＬＡＮ８に接続された保守端末６から運用系サーバ部２の予定停止が指示されたとする。
【００３８】
この指示は、マネージメント部４により、運用系サーバ部２の監視・制御マネージメント部２０と、待機系予備サーバ部３の監視・制御マネージメント部３０に伝えられて、ディスクコントローラ部２５とディスクコントローラ部３５を制御することにより以下の動作が開始される。
【００３９】
ディスクコントローラ部２５のディスク制御部２７は、図２に示されるようにミラーリングされていた一方のＨＤＤ２８に対しては、運用系サーバ部２の読み書きのアクセスを継続しておこなわせる。
【００４０】
そして、ディスクコントローラ部２５のディスク制御部２７とディスクコントローラ部３５のディスク制御部３７は、ミラーリングされていた他の一方のＨＤＤ２９に対して、待機系予備サーバ部３のＨＤＤ３８とＨＤＤ３９の両方に同じデータをコピーする。
【００４１】
運用系サーバ部２の読み書きのアクセスは、ＨＤＤ２８によりおこなわれるので、この段階でも運用系の動作は継続している。ディスクコントローラ部２５の同期制御部２６の更新アドレスメモリ部２６１は、冗長化動作を停止してから、ＨＤＤ２８に書き込まれた更新データ１０００の更新アドレス情報２６０ａを記憶する。このときに、同一アドレスのデータ更新に対しては、上書きして最終的なデータの更新の情報のみが有効になるようにする。
【００４２】
一方のＨＤＤ２９からのコピー動作が終了すると、待機系予備サーバ部３の監視・制御マネージメント部３０は、デバイス制御部３４を介して、運用の準備のためにＯＳ、アプリケーションソフトウェアを起動する。
【００４３】
また、同期制御部２６のディスク制御監視部２６２と同期制御部３６のディスク制御監視部３６２は、更新アドレスメモリ部２６１内の更新アドレス情報２６０ａに基づいて、ＨＤＤ２８の冗長化動作が停止してからの更新データ１０００を、同じ運用系サーバ部２のＨＤＤ２９と、待機系予備サーバ部３のＨＤＤ３８、ＨＤＤ３９にコピーする。
【００４４】
ここで、ＨＤＤ２８が他のＨＤＤに更新データ１０００をコピーしているときにも、運用系のサービス要求のための読み書きのアクセスがあったときには、新たに更新アドレスメモリ部２６１内の更新アドレス情報２６０ａに記憶される。
【００４５】
運用系のサービス要求による大量なデータ更新が長時間継続し、コピー動作が長時間継続する状況においては、この更新データ１０００の他のＨＤＤによるコピー動作がなかなか終了しないときが考えられる。
【００４６】
そのようなときには、予め保守端末６により与えられた時間的指示をおこなって、その条件に従い、監視・制御マネージメント部２０を介してマネージメント部４にサービス停止要求を通知する。そして、マネージメント部４は、ＬＡＮスイッチ部５に対し該当ポートをブロッキング制御するよう指示することで、更新データのコピー動作が長時間継続する状況の回避が可能である。
【００４７】
ＨＤＤ２８からの更新データ１０００のコピーが終了して、全てのＨＤＤの内容が同一になった瞬間を捉え、監視・制御マネージメント部２０は、ディスクコントローラ部２５により、冗長化動作を開始し、ＨＤＤ２８、ＨＤＤ２９に対してミラーリング動作を開始する。
【００４８】
また、監視・制御マネージメント部２０と監視・制御マネージメント部３０は、マネージメント部４を介して、同期をとって、ディスクコントローラ部３５により、待機系予備サーバ部３の冗長化動作を開始し、ＨＤＤ３８、ＨＤＤ３９に対してミラーリング動作を開始する。
【００４９】
すなわち、この瞬間には、運用系サーバ部２と待機系予備サーバ部３の全てのＨＤＤが同一の内容でミラーリング動作をおこなっていることになる。
【００５０】
その後に、マネージメント部４は、監視・制御マネージメント部２０と監視・制御マネージメント部３０に指示を与えて、運用系を待機系予備サーバ部３に切り替える。
【００５１】
これ以降は、サーバ部２に対して、保守・メンテナンス作業がおこなわれるが、同期制御部２６の更新アドレスメモリ部２６１は、保守・メンテナンス作業時にＨＤＤに書き込まれたデータ１００１の更新アドレス情報２６０ｂを記憶する。
【００５２】
また、予備サーバ部３が新たに運用系となるが、同期制御部３６の更新アドレスメモリ部３６１は、この代替運用の期間中に生じたＨＤＤに書き込まれたデータ１００２の更新アドレス情報２６０ｃを記憶する。
【００５３】
これらのサーバ部２での保守・メンテナンス作業時にＨＤＤに書き込まれたデータ１００１の更新アドレス情報２６０ｂと、予備サーバ部３の代替運用の期間中に生じたＨＤＤに書き込まれたデータ１００２の更新アドレス情報２６０ｃは、以下の復旧の手順のときにＨＤＤのデータを回復するときに用いられる。
（ＩＩ）保守終了後の復旧動作（その一）
次に、図３を用いて保守・メンテナンス作業が終了して、サーバシステムを復旧させる場合のサーバシステムの動作について説明する。
図３は、サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである（その一）。
【００５４】
保守・メンテナンス作業時には、予備サーバ部３が新運用系予備サーバ部３、サーバ部２が新待機系サーバ部２となっている。
【００５５】
そして、新運用系予備サーバ部３では、ＨＤＤ３８とＨＤＤ３９は、冗長化されていて、ミラーリングの動作で読み書きのアクセスがなされている。
【００５６】
ここで、新待機系サーバ部２の保守・メンテナンス作業が終了して、ＬＡＮ８に接続された保守端末６からサーバ部２の保守・メンテナンス作業後の復旧が指示されたとする。
【００５７】
この指示は、マネージメント部４により、新待機系サーバ部２２の監視・制御マネージメント部２０と、新運用系予備サーバ部３の監視・制御マネージメント部３０に伝えられて、ディスクコントローラ部２５とディスクコントローラ部３５を制御することにより以下の動作が開始される。
【００５８】
指示されると、新運用系予備サーバ部３でのミラーリング動作を停止し、予備サーバ部３の代替運用の期間中に生じたＨＤＤに書き込まれたデータ１００２の更新アドレス情報２６０ｃを基にして、ＨＤＤ３９から新待機系サーバ部２のＨＤＤ２８、ＨＤＤ２９に対してデータを追加データとしてコピーする。このように、保守・メインテナンス作業のおこなわれたＨＤＤのデータに、新しいデータを追加しておこなうコピー動作を、本明細書中で、「マージコピー」ということにする。
【００５９】
一方、ミラーリングの他の一方のＨＤＤ３８には、新運用系予備サーバ部３の読み書きのアクセスを継続する。これによって、新運用系予備サーバ部３は、停止することなくサービスを継続することができる。
【００６０】
また、同期制御部３６の更新アドレスメモリ部３６１は、このミラーリング動作停止以降に、ＨＤＤ３８にあった読み書きのアクセスの更新データ１００３のアドレスを更新アドレス情報２６０ｄとして、記憶する。
【００６１】
この段階で、更新アドレス情報が二種類存在することになるが、例えば、更新アドレス情報を記憶するテーブルにフラグをつけることにより区別することができる。ここでは、復旧中にＨＤＤ３８にあった読み書きのアクセスの更新データの更新アドレス情報２６０ｄを「フラグ付き更新アドレス情報」として区別することにする。
【００６２】
そして、新待機系サーバ部２のＨＤＤ２８、ＨＤＤ２９に対する代替運用の期間中に生じたＨＤＤに書き込まれたデータ１００２の更新アドレス情報２６０ｃを基にしたマージコピーが終了すると、新待機系サーバ部２の監視・制御マネージメント部２０は、デバイス制御部２４を介して、運用の準備のためにＯＳ、アプリケーションソフトウェアを起動する。
【００６３】
そして、次に、フラグ付き更新アドレス情報２６０ｄを基にして、ＨＤＤ３８から新待機系サーバ部２のＨＤＤ２８、ＨＤＤ２９にコピーをおこなう。
【００６４】
これにより、復旧動作中の新運用系予備サーバ部３に新たにアクセスのあったデータが新待機系サーバ部２のＨＤＤ２８、ＨＤＤ２９に反映される。
【００６５】
また、新運用系のサービス要求による大量なデータ更新が長時間継続し、コピー動作が長時間継続する状況においては、この更新データ１００３の他のＨＤＤによるコピー動作がなかなか終了しないときが考えられる。
【００６６】
そのようなときには、予め保守端末６により与えられた時間的指示をおこなって、その条件に従い、監視・制御マネージメント部３０を介してマネージメント部４にサービス停止要求を通知する。そして、マネージメント部４は、ＬＡＮスイッチ部５に対し該当ポートをブロッキング制御するよう指示することで、更新データ１００３のコピー動作が長時間継続する状況の回避が可能である。
【００６７】
これは、（Ｉ）のときに、運用系サーバ２のサービスを一時停止した動作と同様である。
【００６８】
そして、更新データのＨＤＤ３８からの更新データ１００３のコピーが終了して、全てのＨＤＤの内容が同一になった瞬間を捉え、監視・制御マネージメント部２０は、ディスクコントローラ部２５により、冗長化動作を開始し、ＨＤＤ２８、ＨＤＤ２９に対してミラーリング動作を開始する。
【００６９】
その後に、マネージメント部４は、監視・制御マネージメント部２０と監視・制御マネージメント部３０に指示を与えて、運用系をサーバ部２に切り替える。これで復旧動作は、終了して、サーバ部２は、通常運転に戻り、予備サーバ部３は、待機系に戻される。
（ＩＩＩ）保守終了後の復旧動作（その二）
次に、図４を用いて保守・メンテナンス作業が終了して、サーバシステムを復旧させる場合のサーバシステムの他の動作について説明する。
図４は、サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである（その二）。
【００７０】
この復旧動作をおこなう場合は、予備サーバ部３の代替運用の期間が長期にわたるなどして、予備サーバ部３の代替運用の期間中に生じたＨＤＤに書き込まれたデータの更新アドレス情報が、予め定められた一定の数を超した場合である。
【００７１】
この場合には、代替運用の期間中に生じたＨＤＤに書き込まれたデータ１００２の更新アドレス情報２６０ｃを用いるのは能率的ではないので、新運用系予備サーバ部３のＨＤＤの内容を一旦、新待機系サーバ部２のＨＤＤに一括してコピーするものである。
【００７２】
この場合も、（ＩＩ）と同様に、新運用系予備サーバ部３では、ＨＤＤ３８とＨＤＤ３９は、冗長化されていて、ミラーリングの動作で読み書きのアクセスがなされている。そして、（ＩＩ）と同様に、新待機系サーバ部２の保守・メンテナンス作業が終了して、ＬＡＮ８に接続された保守端末６からサーバ部２の保守・メンテナンス作業後の復旧が指示されたとする。
【００７３】
予備サーバ部３の代替運用の期間中に生じたＨＤＤに書き込まれたデータの更新アドレス情報が、予め定められた一定の数を超しているか否かを判断する。一定の数を超していないときには、（ＩＩ）の動作と同様にして復旧するが、一定の数を超しているときには、以下のようにして復旧動作をおこなうものとする。
【００７４】
先ず、新運用系予備サーバ部３のＨＤＤ３９の内容を、新待機系サーバ部２のＨＤＤ２９に一括コピーする。
【００７５】
この一括コピーしている間に、新運用系予備サーバ部３の読み書きのアクセスの更新アドレスをフラグ付き更新アドレス情報２６０ｄとして、記憶しておくことは、（ＩＩ）の動作と同様である。
【００７６】
ＨＤＤ３９から新待機系サーバ部２のＨＤＤ２９に一括コピーが終了すると、次に、（Ｉ）に説明した保守・メンテナンス作業時にＨＤＤに書き込まれたデータ１００１の更新アドレス情報２６０ｂを基にして、ＨＤＤ２８のデータをＨＤＤ２９にマージコピーする。これにより、ＨＤＤ２９の内容は、新待機系サーバ部２で保守されたデータの内容と、新運用系予備サーバ部３でのサービスでの読み書きのアクセスにより更新されたデータを併せたものになる。
【００７７】
その後に、ＨＤＤ２９の内容を全て、ＨＤＤ２８にコピーし直して、ＨＤＤ２８とＨＤＤ２９の内容を同一にする。
【００７８】
これ以降は、フラグ付き更新アドレス２６０ｄに基づいて、一括コピー中の読み書きのアクセスの更新データ１００３の内容をコピーして、新待機系サーバ部２を運用系に切り替える動作は、（ＩＩ）と同様である。
（ＩＶ）障害時の動作
次に、図５を用いてサーバシステムの障害時の動作について説明する。
図５は、サーバシステムを障害時のシステム動作を説明するためのタイミングチャートである。
【００７９】
ここでは、運用系サーバ部２の、ＨＤＤが冗長化されており、ミラーリング動作をおこなっているときに、ＨＤＤ以外の障害がおこったときについて説明する。なお、ＨＤＤに障害がおこったときの動作は、通常のＲＡＩＤによりシステムを復旧させる動作と同様になる。
【００８０】
例えば、回路の異常、運転温度の上昇など、運用系サーバ部２が障害を検知されたときには、監視・制御マネージメント部２０は、ディスクコントローラ部２５に指示を与え、運用系サーバ部２のミラーリングされた一方のＨＤＤ２９から、待機系予備サーバ部３のＨＤＤ３８、ＨＤＤ３９にコピーを開始する。
【００８１】
そして、コピーが終了すると、待機系予備サーバ部３の監視・制御マネージメント部３０は、デバイス制御部３４を介して、運用の準備のためにＯＳ、アプリケーションソフトウェアを起動する。
【００８２】
そして、待機系予備サーバ部３を運用系に切り替えて、ＨＤＤ３８とＨＤＤ３９により、ミラーリング動作を開始する。
【００８３】
〔サーバ間のストレージ制御のための高速専用バス〕
次に、図６を用いてサーバ間のストレージ制御のための高速専用バスについて説明する。
図６は、サーバ間のストレージ制御をおこなう部分に重点をおいた構成図である。
【００８４】
発明の実施形態の冒頭では、図１を用いて冗長化機能を有するサーバシステムの構成全体を説明したが、ここでは、サーバ間でストレージ制御をおこなう手段としての高速専用バスを設ける構成について説明する。
【００８５】
本実施形態のサーバシステムの各サーバは、ブレードサーバ（ＢｌａｄｅＳｅｒｖｅｒ）として実装することができる。ここで、ブレードサーバとは、一枚の基盤にコンピュータとして必要な要素を実装し、必要な枚数を接続して構成するサーバ専用機のことをいう。
【００８６】
ここで、図６に示されたように、サーバ部Ａ１０、サーバ部Ｂ１１、予備サーバ部１２がマネージメント部９を介して接続されている。これらの各サーバ部は、ブレードサーバとして、一つのシャーシ内に実装されているものとする。
【００８７】
各サーバ部は、ディスク制御切替え部により、高速専用バスで接続されていて、データや制御の指令を受け渡せるようになっている。各サーバ部のディスク制御切替え部は、デバイス制御部の指示をうけてＨＤＤの接続を切り替えるようになっている。
【００８８】
この高速専用バスのインタフェースとしては、ＳＣＳＩ（ＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅ）、ＡＴＡ（ＡＴＡｔｔａｃｈｍｅｎｔ）、シリアルＡＴＡ、ファイバチャネル（ＦｉｂｒｅＣｈａｎｎｅｌ）などを用いることができる。
【００８９】
ここで、サーバ部Ｂは、（Ｉ）の手順で説明したように、運用したままサーバ部Ａを予定停止させることにする。
【００９０】
このときのサーバ部ＡのＨＤＤ１０４は、デバイス制御部１０７を指示を受けて、運用系のサービスを継続させる。一方のＨＤＤ１０５のデータは、予備サーバ部１２のＨＤＤ１２４とＨＤＤ１２５にコピーされる。
【００９１】
このときに、ディスク制御切替え部１０６は、ＨＤＤ１０５から専用高速バスＡ１３を介して、サーバ部Ｂ１１のディスク制御切替え部１１６に、コピーをおこなえるように接続する。サーバ部Ｂ１１のディスク制御切替え部１１６は、予備サーバ部１２に専用高速バスＢ１４により、予備サーバ部１２のディスク制御切替え部１２６によるコピー制御の中継をするように接続する。そして、サーバ部Ｂ１１を中継して、サーバ部ＡのＨＤＤ１０５から、予備サーバ部１２のＨＤＤ１２４と、ＨＤＤ１２５にデータがコピーされる。
【００９２】
運用系であるサーバ部Ｂ１１のディスク制御切替え部１１６は、ミラーリング動作をおこなうようにＨＤＤ１１４とＨＤＤ１１５を接続している。
【００９３】
なお、これらのストレージ制御は、各監視・制御マネージメント部がマネージメント部７を介して、他の監視・制御マネージメント部と情報をやり取りしておこなうものである。また、図６では、ディスク制御切替えは、機械的なスイッチのように模式的に示したが、実際には、電気的に切替えをおこなうものである。
【００９４】
このように、本実施形態では、各サーバ部は同一シャーシ内で隣接するサーバ間を接続する専用高速バスを有し、運用系から予備系切替えに伴うコピー動作の対象外であった場合には、バスの中継制御をおこなっている。これにより同一シャーシ内の全てのサーバ部が連結された場合にも、シャーシ内のバックプレーン上のパターン配置が容易となり、かつ、数十〜数百ＭＨｚ以上の速度をもつ高速なＨＤＤ制御バスの電気的な中継がおこなわれ、複数台サーバが同一シャーシに搭載される場合の待機系サーバまでの長距離な伝送を可能とする。
【００９５】
【発明の効果】
本発明によれば、サーバシステムのストレージ制御に関し、冗長化機能を有するサーバシステムの運用系と待機系を用意して、通常サーバ停止を必要とする保守作業においては、運用系切替えによりサービスを継続可能とし、障害発生時には、短時間で運用系切替えによる障害回復をおこなう冗長化機能を、低コストで、シンプルな構成のサーバシステムで実現することができる
【図面の簡単な説明】
【図１】本発明の一実施形態に係る冗長化機能を有するサーバシステムの構成図である。
【図２】予定停止させるときのシステム動作を説明するためのタイミングチャートである。
【図３】サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである（その一）。
【図４】サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである（その二）。
【図５】サーバシステムを障害時のシステム動作を説明するためのタイミングチャートである。
【図６】サーバ間のストレージ制御をおこなう部分に重点をおいた構成図である。
【符号の説明】
１…サーバシステム
２…サーバ部
３，１２…予備サーバ部
４，９…マネージメント部
５…ＬＡＮスイッチ部
６…保守端末
７…クライアント郡
８…ＬＡＮ
１０…サーバ部Ａ
１１…サーバ部Ｂ
１３…専用高速バスＡ
１４…専用高速バスＢ
２０，３０，１０１，１１１，１２１…監視・制御マネージメント部
２１，３１…ＣＰＵ
２２，３２…メモリ
２３，３３…ＬＡＮ／ＩＦ
２４，３４，１０７，１１７，１２７…デバイス制御部
２５，３５，１０２，１１２，１２２…ディスクコントローラ部
２６，３６…同期制御部
２７，３７，１０３，１１３，１２３…ディスク制御部
２８，２９，３８，３９，１０４，１０５，１１４，１１５，１２４，１２５…ＨＤＤ
２６１，３６１…更新アドレスメモリ部
２６２，３６２…ディスク制御監視部
１０６，１１６，１２６…ディスク制御切替え部
２６０ａ〜２６０ｄ…更新アドレス情報
１０００〜１００３…ＨＤＤに書き込まれる各種データ

Claims

運用系システムと待機系システムとを有する計算機システムのストレージ制御方法において、
前記運用系システムは、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
前記運用系システムを予定停止するときに、
（１）前記運用系システムの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで運用系システムのサービスを継続する手順と、
（２）前記運用系システムの二台以上のハードディスクの他の一方のハードディスクから前記待機系システムのハードディスクにコピーする手順と、
（３）前記（１）の手順で、運用系システムのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
（４）前記（２）の手順のコピーが終了して、かつ、運用系システムのサービスに伴ったデータ書き込みがないときに、前記（３）の手順の更新アドレスに基づいて、前記運用系システムのサービスに伴って書き込まれたデータを、前記待機系システムにコピーする手順と、
（５）前記（４）の手順のコピーが終了して、前記運用系システムと前記待機系システムのハードディスクのデータが全て一致したときに、前記待機系システムを運用系システムに切り替え、前記運用系システムを待機系システムに切り替えて、前記運用系システムの予定停止をおこなう手順と
を有することを特徴とする計算機システムのストレージ制御方法。
待機系システムから切り替えられた新運用系システムも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
運用系システムから切り替えられた新待機系システムの復旧動作をするときに、
（１０）新運用系システムに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
（１１）前記新運用系システムの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系システムのサービスを継続する手順と、
（１２）前記新運用系システムの二台以上のハードディスクの他の一方のハードディスクから前記新待機系システムのハードディスクに、前記（１０）の手順の更新アドレスに基づいて、マージコピーする手順と、
（１３）前記（１２）の手順のマージコピーしている間の前記新運用系システムのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
（１４）前記（１２）の手順のマージコピーが終了して、かつ、新運用系システムのサービスに伴ったデータ書き込みがないときに、前記（１３）の手順の更新アドレスに基づいて、前記新運用系システムのサービスに伴って書き込まれたデータを、前記新待機系システムにコピーする手順と、
（１５）前記（１４）の手順のコピーが終了して、前記新運用系システムと前記新待機系システムのハードディスクのデータが全て一致したときに、前記新待機系システムを運用系システムに切り替え、前記新運用系システムを待機系システムに切り替えて、前記新待機系システムの復旧動作をおこなう手順と
を有することを特徴とする請求項１記載の計算機システムのストレージ制御方法。
待機系システムから切り替えられた新運用系システムも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
運用系システムから切り替えられた新待機系システムの復旧動作をするときに、
（２０）新待機系システムの保守時に更新されたデータのハードディスクの更新アドレスを記憶する手順と、
（２１）新運用系システムに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
（２２）前記（２１）の手順の更新アドレスの数が所定の数を超えるか否かを判断する手順と、
（２４）前記新運用系システムの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系システムのサービスを継続する手順と、
（２５）前記（２２）の手順で、更新アドレスの数が所定の数を超えた場合に、前記新運用系システムの二台以上のハードディスクの他の一方のハードディスクから前記新待機系システムのハードディスクの一方に、一括コピーする手順と、
（２６）前記（２５）の手順の一括コピーしている間の前記新運用系システムのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
（２７）前記新待機系システムの一括コピーされたハードディスクに、他の一方のハードディスクのデータを、前記（２０）の手順の保守時に更新された更新アドレスに基づいて、マージコピーする手順と、
（２８）前記（２７）の手順でマージコピーされた一方のハードディスクのデータを、前記新待機系システムの他の一方のハードディスクに一括コピーする手順と、
（２９）前記（２８）の手順のマージコピーが終了して、かつ、新運用系システムのサービスに伴ったデータ書き込みがないときに、前記（２６）の手順の更新アドレスに基づいて、前記新運用系システムのサービスに伴って書き込まれたデータを、前記新待機系システムにコピーする手順と、
（３０）前記（２９）の手順のコピーが終了して、前記新運用系システムと前記新待機系システムのハードディスクのデータが全て一致したときに、前記新待機系システムを運用系システムに切り替え、前記新運用系システムを待機系システムに切り替えて、前記新待機系システムの復旧動作をおこなう手順と
を有することを特徴とする請求項１記載の計算機システムのストレージ制御方法。
前記（４）の手順のコピー中に、前記運用系システムのサービスによって、このコピー動作が長時間停止したときに、前記運用系システムのサービスを停止する処理を含むことを特徴とする請求項１記載の計算機システムのストレージ制御方法。
前記（１４）の手順のコピー中に、前記新運用系システムのサービスによって、このコピー動作が長時間停止したときに、前記新運用系システムのサービスを停止する処理を含むことを特徴とする請求項２記載の計算機システムのストレージ制御方法。
前記（２９）の手順のコピー中に、前記新運用系システムのサービスによって、このコピー動作が長時間停止したときに、前記新運用系システムのサービスを停止する処理を含むことを特徴とする請求項３記載の計算機システムのストレージ制御方法。
運用系サーバと待機系サーバとを有する冗長化機能を有するサーバシステムにおいて、
前記運用系サーバは、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有し、
さらに、前記運用系サーバは、
この運用系サーバを予定停止するときに、前記運用系サーバの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで運用系サーバのサービスを継続する手段と、
この運用系サーバの二台以上のハードディスクの他の一方のハードディスクから前記待機系サーバのハードディスクにコピーする手段と、
この運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手段と、
前記待機系サーバのハードディスクにコピーが終了して、かつ、運用系サーバのサービスに伴ったデータ書き込みがないときに、記憶された前記更新アドレスに基づいて、この運用系サーバのサービスに伴って書き込まれたデータを、前記待機系サーバにコピーする手段とを有し、
前記待機系サーバのハードディスクにコピーが終了して、前記運用系サーバと前記待機系サーバのハードディスクのデータが全て一致したときに、前記待機系サーバを運用系サーバに切り替え、前記運用系サーバを待機系サーバに切り替えて、前記運用系サーバの予定停止をおこなうことを有することを特徴とする冗長化機能を有するサーバシステム。
待機系サーバから切り替えられた新運用系サーバも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有し、
さらに、前記新運用系サーバは、
運用系サーバから切り替えられた新待機系サーバの復旧動作をするときに、新運用系サーバに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手段と、
前記新運用系サーバの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系サーバのサービスを継続する手段と、
前記新運用系サーバの二台以上のハードディスクの他の一方のハードディスクから前記新待機系サーバのハードディスクに、前記更新アドレスに基づいて、マージコピーする手段と、
前記マージコピーしている間の前記新運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを、フラグつき更新アドレスとして記憶する手段と、
前記マージコピーが終了して、かつ、新運用系サーバのサービスに伴ったデータ書き込みがないときに、前記フラグつき更新アドレスに基づいて、前記新運用系サーバのサービスに伴って書き込まれたデータを、前記新待機系サーバのハードディスクにコピーする手段とを有し、
前記新待機系サーバのハードディスクへのコピーが終了して、前記新運用系サーバと前記新待機系サーバのハードディスクのデータが全て一致したときに、前記新待機系サーバを運用系サーバに切り替え、前記新運用系サーバを待機系サーバに切り替えて、前記新待機系サーバの復旧動作をおこなうことを特徴とする請求項７記載の冗長化機能を有するサーバシステム。
待機系サーバから切り替えられた新運用系サーバも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
前記新運用系サーバは、
運用系サーバから切り替えられた新待機系サーバの復旧動作をするときに、この新運用系サーバに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手段と、
前記更新アドレスの数が所定の数を超えるか否かを判断する手段と、
この新運用系サーバの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系サーバのサービスを継続する手段と、
前記更新アドレスの数が所定の数を超えた場合に、この新運用系サーバの二台以上のハードディスクの他の一方のハードディスクから前記新待機系サーバのハードディスクの一方に、一括コピーする手段と、
一括コピーしている間のこの新運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを、フラグつき更新アドレスとして記憶する手段とを有し、
前記新待機系サーバは、
新待機系サーバの保守時に更新されたデータのハードディスクの更新アドレスを、保守時更新アドレスとして記憶する手段と、
前記新運用系サーバから一括コピーされたハードディスクに、他の一方のハードディスクのデータを、前記保守時に更新された保守時更新アドレスに基づいて、マージコピーする手段と、
マージコピーされた一方のハードディスクのデータを、この新待機系サーバの他の一方のハードディスクに一括コピーする手段とを有し、
さらに、前記新運用系サーバは、
前記新待機系サーバでおこなわれるマージコピーが終了して、かつ、この新運用系サーバのサービスに伴ったデータ書き込みがないときに、前記フラグつき更新アドレスに基づいて、この新運用系サーバのサービスに伴って書き込まれたデータを、前記新待機系サーバにコピーする手段を有し、
前記新待機系サーバへのコピーが終了して、前記新運用系サーバと前記新待機系サーバのハードディスクのデータが全て一致したときに、前記新待機系サーバを運用系サーバに切り替え、前記新運用系サーバを待機系サーバに切り替えて、前記新待機系サーバの復旧動作をおこなうことを特徴とする請求項７記載の冗長化機能を有するサーバシステム。
運用系サーバがＮ台（Ｎ≧１）で、待機系サーバが一台で構成されたこと特徴とする請求項７記載の冗長化機能を有するサーバシステム。
前記運用系サーバのハードディスク以外の障害が発生したときに、障害が発生した運用系サーバのハードディスクから、前記待機系サーバのハードディスクにコピーする手段を有し、
コピーが終了したときに、前記待機系サーバを運用系サーバに切り替えることを特徴とする請求項７記載の冗長化機能を有するサーバシステム。
前記運用系サーバと前記待機系サーバとは、同一シャーシ上に搭載され、
隣接する前記運用系サーバのハードディスクと前記待機系サーバのハードディスクとは、他の隣接する前記運用系サーバのハードディスクと前記待機系サーバのハードディスクと高速専用バスで接続され、
前記運用系サーバのハードディスクと前記待機系サーバのハードディスク間で、コピーが必要になったときに、
各運用系サーバと待機系サーバとでのコピー制御の動作を判断し、前記高速専用バスで、コピーをおこなうか、コピー制御の中継をおこなうかを切り替えて制御することを特徴とする請求項７および請求項９記載のいずれかの冗長化機能を有するサーバシステム。