Nothing Special   »   [go: up one dir, main page]

JP2005055995A - ストレージ制御方法、および、冗長化機能を有するサーバシステム - Google Patents

ストレージ制御方法、および、冗長化機能を有するサーバシステム Download PDF

Info

Publication number
JP2005055995A
JP2005055995A JP2003206404A JP2003206404A JP2005055995A JP 2005055995 A JP2005055995 A JP 2005055995A JP 2003206404 A JP2003206404 A JP 2003206404A JP 2003206404 A JP2003206404 A JP 2003206404A JP 2005055995 A JP2005055995 A JP 2005055995A
Authority
JP
Japan
Prior art keywords
server
new
active
standby
hard disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003206404A
Other languages
English (en)
Inventor
Kazuhisa Abe
和寿 安部
Hironobu Kashiwagi
博信 柏樹
Keiji Yamahara
圭司 山原
Masaaki Higuchi
正明 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003206404A priority Critical patent/JP2005055995A/ja
Publication of JP2005055995A publication Critical patent/JP2005055995A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】保守などでシステム全体ではサービスを停止することなく、障害発生時には、短時間で運用系切替えによる障害回復をおこなう冗長化機能を、シンプルな構成で、低コストで実現する。
【解決手段】N台の運用系サーバと一台の待機系サーバを用意し、ハードディスクを冗長化してミラーリングしておく。運用系を保守などのために停止するときに、ミラーリング動作を中断して、一方のハードディスクで、サービスに伴ったデータ書き込みの更新アドレス情報を記憶しながら、運用系のサービスを継続する。他の一方のハードディスクから待機系のハードディスクにデータをコピーする。コピーが終了した後に、更新アドレス情報に基づき、運用系と待機系のハードディスクを一致させて、待機系と運用系を切替える。また、障害が発生したときには、運用系から待機系に無条件でデータのコピーをおこなうようにする。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、サーバシステムのストレージ制御方法に係り、特に冗長化機能を有するサーバシステムで、運用系システムと待機系システムが用意されるシステムであって、無停止でシステムの運用をおこなうサーバシステムに用いて好適なサーバシステムのストレージ制御方法に関する。
【0002】
【従来の技術】
近年、サーバシステムは、情報処理社会における基幹技術となっており、高い信頼性が求められるようになってきている。このような信頼性確保のためのサーバシステム一般における冗長化の技術の例としては、単体で必要とされる機能を満たすサーバを複数台集めて、あたかも一つのシステムであるかのように動作させるクラスタサーバシステムが挙げられる、クラスタサーバシステムでは一台のサーバがダウンしても、クラスタ内の他のサーバが必要なリソースを引き継いで、短時間に業務を再開する。クラスタサーバシステムにおけるデータの引継ぎ手段としては、共有ディスクタイプが有り、これは、二つのサーバで、拡張ディスクアレイ装置を共有し、データの引継ぎを実現する。
【0003】
例えば、下記の特許文献1では、各サーバの状態を共有ディスクに保存して、複数のサーバを管理できるようになっている。
【0004】
また、その他の冗長化技術として、一台のサーバ内でプロセッサ、メモリーからPCIモジュール、ストレージまで、主要なハードウェアコンポーネントの完全二重化をおこなうフォールトレラントサーバシステムが挙げられる。
【0005】
【特許文献1】
特開平10−247911号公報
【0006】
【発明が解決しようとする課題】
システム設計者は、システムのリスク、可用性、コストを勘案してシステム設計をおこなうことになる。特に、障害が起こったときのサーバシステムにおけるデータ資産の引継ぎは、冗長化されたシステムのキーポイントである。
【0007】
上記クラスタサーバシステムにおける共有ディスク方式にておこなわれるサーバ間のデータの共有によるデータ引継ぎは、無停止でデータ資産も損なうことがない。しかしながら、一般的に共有ディスクが高価であるために、システム構築のコストが大きくなる傾向にある。またデータを共有するため、各サーバのOSが同一であることが必要であるというシステム設計上の制約もある。また、保守のために一定時間、サーバシステムを停止させて、ディスク内のデータの更新作業等のメンテナンスをおこなう際に、共有データの使用に影響を与えないための特別な配慮が必要となる等の保守上の制約も生じる。
【0008】
また、一方フォールトトレラントサーバシステムにおいては完全なハードウェアの二重化をおこない、高信頼性動作を保証するが、システム構築のコストが膨大となる。
【0009】
本発明は、上記問題点を解決するためになされたもので、その目的は、サーバシステムのストレージ制御に関し、冗長化機能を有するサーバシステムの運用系と待機系を用意して、通常サーバ停止を必要とする保守作業においては、運用系切替えによりサービスを継続可能とし、障害発生時には、短時間で運用系切替えによる障害回復をおこなう冗長化機能を、シンプルな構成で、低コストで実現することのできるサーバシステムを提供することにある。
【0010】
【課題を解決するための手段】
上記目的を達成するために、本発明のストレージ制御方法においては、N台の運用系サーバと一台の待機系サーバを用意し、運用系サーバ、待機系サーバのハードディスクを冗長化して、ミラーリングしておく。
【0011】
そして、運用系サーバを、保守などのために停止するときに、運用系サーバの冗長化動作を中断して、ミラーリングのハードディスクの一方のハードディスクで運用系サーバのサービスを継続する。
【0012】
このときに、運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶しておく。
【0013】
一方、運用系サーバのミラーリングされたハードディスクの他の一方のハードディスクから待機系サーバのハードディスクにデータをコピーする。
【0014】
そして、コピーが終了して、かつ、運用系サーバのサービスに伴ったデータ書き込みがないときに、記憶された更新アドレスに基づいて、運用系サーバのサービスに伴って書き込まれたデータを、待機系サーバにコピーする。
【0015】
コピーが終了して、運用系サーバと待機系サーバのハードディスクのデータが全て一致したときに、待機系サーバを運用系サーバに切り替え、運用系サーバを待機系サーバに切り替えて、運用系サーバの停止をおこなって、メインテナンスなどをおこなう。
【0016】
また、障害が発生したときには、運用系サーバから待機系サーバに無条件でデータのコピーをおこなうようにする。
【0017】
各運用系サーバと待機系サーバは、同一のシャーシ内に搭載し、ハードディスクを高速の専用バスで接続して、コピーをおこなったり、他のサーバへのコピーの制御の中継を切り替えられるようにする。
【0018】
このように、本発明のサーバシステムの構成によれば、保守などによる停止時、、障害発生時の各々の状態において、運用系サーバのHDD内データを完全にコピーすることから、二台以上の運用系サーバに対して、一台の待機系サーバのみによる低コストな冗長構成が実現できるものとなっている。
【0019】
また、保守などによる停止時には、冗長化された二台以上のHDDのうち、一台のHDDの冗長化動作を停止させて、サーバの運用切替えのためのデータコピーに使用する。そのため、運用系のサービスを停止せずに、高速に運用系と待機系を切替えることができる。また、最も故障頻度が多いHDDに関しては、HDDの冗長化構成により障害時の継続動作が可能であり、HDD以外の故障時には、運用系サーバから待機系サーバへのコピー終了後の切替えを実現する。
【0020】
【発明の実施の形態】
以下、本発明に係る一実施形態を、図1ないし図6を用いて説明する。
【0021】
〔冗長化機能を有するサーバシステムの構成〕
先ず、図1を用いて本発明の一実施形態に係る冗長化機能を有するサーバシステムの構成について説明する。
図1は、本発明の一実施形態に係る冗長化機能を有するサーバシステムの構成図である。
【0022】
本実施形態のサーバシステムは、図1に示されるように、通常、複数台のサーバ部2と、予備のために設けられる予備サーバ部3、マネージメント部4、LANスイッチ部5から構成されている。
【0023】
サーバ部2の台数は、システムの信頼性、可用性、パーフォマンスなどの要素を勘案して、システム設計の際に決定される。予備サーバ部3は、システムの運用にあたって予備的に設けられるサーバであり、複数台設けてもよいが、通常は、運用されているサーバ部2の台数よりは少なくなっている。
【0024】
マネージメント部4は、各サーバの相互に関係のある動作を管理する部分であり、各サーバ部2、予備サーバ部3の監視・制御マネージメント部20に接続されている。LANスイッチ部5は、外部のLAN8と接続されて、各サーバ部2、予備サーバ部3とネットワークの中継をおこなう部分である。
【0025】
また、LAN8には、保守端末6とクライアント群7が接続されていて、保守端末6からは、システムの保守、各種の設定をおこない、クライアント群7からは、サーバの提供するサービスを利用する。
【0026】
サーバ部2は、監視・制御マネージメント部20、CPU21、メモリ22、LAN/IF23、デバイス制御部24、ディスクコントローラ部25、HDD28,29からなっている。この構成は、予備サーバ部3も同様である。
【0027】
監視・制御マネージメント部20は、サーバの故障監視と、マネージメント部4からの指令を受け、デバイス制御部24とディスクコントローラ部25を制御してサーバ部2全体の制御をおこなう部分である。
【0028】
デバイス制御部24は、サーバの各デバイスの制御をおこなう部分である。
【0029】
ディスクコントローラ部25は、同期制御部26とディスク制御部27からなり、HDDの制御をおこなう部分である。
【0030】
ディスクコントローラ部25の同期制御部26は、サーバ部2のHDD28,29と、予備サーバ部3のHDD38,39のデータの同期のための制御をおこなう部分である。
【0031】
ディスクコントローラ部25のディスク制御部27は、HDD28,29を直接制御し、HDDの冗長化動作と、同期制御部26から指示を受けて、サーバ部2と予備サーバ部3のデータの同期のための入出力制御を司る。
【0032】
また、同期制御部26は、更新アドレスメモリ部261と、ディスク制御監視部262からなる。更新アドレスメモリ部261は、ハードディスクのデータが更新される際の書き込みアドレスを記憶する部分である。ディスク制御監視部262は、ハードディスクのサービスに伴うアクセスを監視する部分である。これらは、サーバ部2のHDDと、予備サーバ部3のHDDのデータの同期を保つために必要なコンポーネントであり、詳細な動作については後に説明する。
【0033】
〔冗長化機能を有するサーバシステムの動作〕
次に、図2ないし図5を用いて本発明の一実施形態に係る冗長化機能を有するサーバシステムの動作について説明する。
(I)予定停止時の動作
先ず、図2を用いてサーバシステムを保守・メンテナンス作業のために停止させる場合のサーバシステムの動作について説明する。
【0034】
以下では、サーバシステムを保守・メンテナンス作業などで保守者が意図したときに、運用系のシステムを停止させることを「予定停止」と言うことにする。
【0035】
また、サーバ部2を運用系として、予備サーバ部3を待機系として運用する場合を考え、それぞれ、運用系サーバ部2、待機系予備サーバ部3ということにする。
図2は、予定停止させるときのシステム動作を説明するためのタイミングチャートである。
【0036】
運用系サーバ部2では、通常の運転では、HDD28とHDD29は、冗長化されていて、ミラーリング(RAID1)の動作で読み書きのアクセスがなされている。一方の待機系予備サーバ部3の動作は停止している。
【0037】
ここで、LAN8に接続された保守端末6から運用系サーバ部2の予定停止が指示されたとする。
【0038】
この指示は、マネージメント部4により、運用系サーバ部2の監視・制御マネージメント部20と、待機系予備サーバ部3の監視・制御マネージメント部30に伝えられて、ディスクコントローラ部25とディスクコントローラ部35を制御することにより以下の動作が開始される。
【0039】
ディスクコントローラ部25のディスク制御部27は、図2に示されるようにミラーリングされていた一方のHDD28に対しては、運用系サーバ部2の読み書きのアクセスを継続しておこなわせる。
【0040】
そして、ディスクコントローラ部25のディスク制御部27とディスクコントローラ部35のディスク制御部37は、ミラーリングされていた他の一方のHDD29に対して、待機系予備サーバ部3のHDD38とHDD39の両方に同じデータをコピーする。
【0041】
運用系サーバ部2の読み書きのアクセスは、 HDD28によりおこなわれるので、この段階でも運用系の動作は継続している。ディスクコントローラ部25の同期制御部26の更新アドレスメモリ部261は、冗長化動作を停止してから、HDD28に書き込まれた更新データ1000の更新アドレス情報260aを記憶する。このときに、同一アドレスのデータ更新に対しては、上書きして最終的なデータの更新の情報のみが有効になるようにする。
【0042】
一方のHDD29からのコピー動作が終了すると、待機系予備サーバ部3の監視・制御マネージメント部30は、デバイス制御部34を介して、運用の準備のためにOS、アプリケーションソフトウェアを起動する。
【0043】
また、同期制御部26のディスク制御監視部262と同期制御部36のディスク制御監視部362は、更新アドレスメモリ部261内の更新アドレス情報260aに基づいて、HDD28の冗長化動作が停止してからの更新データ1000を、同じ運用系サーバ部2のHDD29と、待機系予備サーバ部3のHDD38、HDD39にコピーする。
【0044】
ここで、HDD28が他のHDDに更新データ1000をコピーしているときにも、運用系のサービス要求のための読み書きのアクセスがあったときには、新たに更新アドレスメモリ部261内の更新アドレス情報260aに記憶される。
【0045】
運用系のサービス要求による大量なデータ更新が長時間継続し、コピー動作が長時間継続する状況においては、この更新データ1000の他のHDDによるコピー動作がなかなか終了しないときが考えられる。
【0046】
そのようなときには、予め保守端末6により与えられた時間的指示をおこなって、その条件に従い、監視・制御マネージメント部20を介してマネージメント部4にサービス停止要求を通知する。そして、マネージメント部4は、LANスイッチ部5に対し該当ポートをブロッキング制御するよう指示することで、更新データのコピー動作が長時間継続する状況の回避が可能である。
【0047】
HDD28からの更新データ1000のコピーが終了して、全てのHDDの内容が同一になった瞬間を捉え、監視・制御マネージメント部20は、ディスクコントローラ部25により、冗長化動作を開始し、HDD28、HDD29に対してミラーリング動作を開始する。
【0048】
また、監視・制御マネージメント部20と監視・制御マネージメント部30は、マネージメント部4を介して、同期をとって、ディスクコントローラ部35により、待機系予備サーバ部3の冗長化動作を開始し、HDD38、HDD39に対してミラーリング動作を開始する。
【0049】
すなわち、この瞬間には、運用系サーバ部2と待機系予備サーバ部3の全てのHDDが同一の内容でミラーリング動作をおこなっていることになる。
【0050】
その後に、マネージメント部4は、監視・制御マネージメント部20と監視・制御マネージメント部30に指示を与えて、運用系を待機系予備サーバ部3に切り替える。
【0051】
これ以降は、サーバ部2に対して、保守・メンテナンス作業がおこなわれるが、同期制御部26の更新アドレスメモリ部261は、保守・メンテナンス作業時にHDDに書き込まれたデータ1001の更新アドレス情報260bを記憶する。
【0052】
また、予備サーバ部3が新たに運用系となるが、同期制御部36の更新アドレスメモリ部361は、この代替運用の期間中に生じたHDDに書き込まれたデータ1002の更新アドレス情報260cを記憶する。
【0053】
これらのサーバ部2での保守・メンテナンス作業時にHDDに書き込まれたデータ1001の更新アドレス情報260bと、予備サーバ部3の代替運用の期間中に生じたHDDに書き込まれたデータ1002の更新アドレス情報260cは、以下の復旧の手順のときにHDDのデータを回復するときに用いられる。
(II)保守終了後の復旧動作(その一)
次に、図3を用いて保守・メンテナンス作業が終了して、サーバシステムを復旧させる場合のサーバシステムの動作について説明する。
図3は、サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである(その一)。
【0054】
保守・メンテナンス作業時には、予備サーバ部3が新運用系予備サーバ部3、サーバ部2が新待機系サーバ部2となっている。
【0055】
そして、新運用系予備サーバ部3では、HDD38とHDD39は、冗長化されていて、ミラーリングの動作で読み書きのアクセスがなされている。
【0056】
ここで、新待機系サーバ部2の保守・メンテナンス作業が終了して、 LAN8に接続された保守端末6からサーバ部2の保守・メンテナンス作業後の復旧が指示されたとする。
【0057】
この指示は、マネージメント部4により、新待機系サーバ部22の監視・制御マネージメント部20と、新運用系予備サーバ部3の監視・制御マネージメント部30に伝えられて、ディスクコントローラ部25とディスクコントローラ部35を制御することにより以下の動作が開始される。
【0058】
指示されると、新運用系予備サーバ部3でのミラーリング動作を停止し、予備サーバ部3の代替運用の期間中に生じたHDDに書き込まれたデータ1002の更新アドレス情報260cを基にして、HDD39から新待機系サーバ部2のHDD28、HDD29に対してデータを追加データとしてコピーする。このように、保守・メインテナンス作業のおこなわれたHDDのデータに、新しいデータを追加しておこなうコピー動作を、本明細書中で、「マージコピー」ということにする。
【0059】
一方、ミラーリングの他の一方のHDD38には、新運用系予備サーバ部3の読み書きのアクセスを継続する。これによって、新運用系予備サーバ部3は、停止することなくサービスを継続することができる。
【0060】
また、同期制御部36の更新アドレスメモリ部361は、このミラーリング動作停止以降に、HDD38にあった読み書きのアクセスの更新データ1003のアドレスを更新アドレス情報260dとして、記憶する。
【0061】
この段階で、更新アドレス情報が二種類存在することになるが、例えば、更新アドレス情報を記憶するテーブルにフラグをつけることにより区別することができる。ここでは、復旧中にHDD38にあった読み書きのアクセスの更新データの更新アドレス情報260dを「フラグ付き更新アドレス情報」として区別することにする。
【0062】
そして、新待機系サーバ部2のHDD28、HDD29に対する代替運用の期間中に生じたHDDに書き込まれたデータ1002の更新アドレス情報260cを基にしたマージコピーが終了すると、新待機系サーバ部2の監視・制御マネージメント部20は、デバイス制御部24を介して、運用の準備のためにOS、アプリケーションソフトウェアを起動する。
【0063】
そして、次に、フラグ付き更新アドレス情報260dを基にして、HDD38から新待機系サーバ部2のHDD28、HDD29にコピーをおこなう。
【0064】
これにより、復旧動作中の新運用系予備サーバ部3に新たにアクセスのあったデータが新待機系サーバ部2のHDD28、HDD29に反映される。
【0065】
また、新運用系のサービス要求による大量なデータ更新が長時間継続し、コピー動作が長時間継続する状況においては、この更新データ1003の他のHDDによるコピー動作がなかなか終了しないときが考えられる。
【0066】
そのようなときには、予め保守端末6により与えられた時間的指示をおこなって、その条件に従い、監視・制御マネージメント部30を介してマネージメント部4にサービス停止要求を通知する。そして、マネージメント部4は、LANスイッチ部5に対し該当ポートをブロッキング制御するよう指示することで、更新データ1003のコピー動作が長時間継続する状況の回避が可能である。
【0067】
これは、(I)のときに、運用系サーバ2のサービスを一時停止した動作と同様である。
【0068】
そして、更新データのHDD38からの更新データ1003のコピーが終了して、全てのHDDの内容が同一になった瞬間を捉え、監視・制御マネージメント部20は、ディスクコントローラ部25により、冗長化動作を開始し、HDD28、HDD29に対してミラーリング動作を開始する。
【0069】
その後に、マネージメント部4は、監視・制御マネージメント部20と監視・制御マネージメント部30に指示を与えて、運用系をサーバ部2に切り替える。これで復旧動作は、終了して、サーバ部2は、通常運転に戻り、予備サーバ部3は、待機系に戻される。
(III)保守終了後の復旧動作(その二)
次に、図4を用いて保守・メンテナンス作業が終了して、サーバシステムを復旧させる場合のサーバシステムの他の動作について説明する。
図4は、サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである(その二)。
【0070】
この復旧動作をおこなう場合は、予備サーバ部3の代替運用の期間が長期にわたるなどして、予備サーバ部3の代替運用の期間中に生じたHDDに書き込まれたデータの更新アドレス情報が、予め定められた一定の数を超した場合である。
【0071】
この場合には、代替運用の期間中に生じたHDDに書き込まれたデータ1002の更新アドレス情報260cを用いるのは能率的ではないので、新運用系予備サーバ部3のHDDの内容を一旦、新待機系サーバ部2のHDDに一括してコピーするものである。
【0072】
この場合も、(II)と同様に、新運用系予備サーバ部3では、HDD38とHDD39は、冗長化されていて、ミラーリングの動作で読み書きのアクセスがなされている。そして、(II)と同様に、新待機系サーバ部2の保守・メンテナンス作業が終了して、 LAN8に接続された保守端末6からサーバ部2の保守・メンテナンス作業後の復旧が指示されたとする。
【0073】
予備サーバ部3の代替運用の期間中に生じたHDDに書き込まれたデータの更新アドレス情報が、予め定められた一定の数を超しているか否かを判断する。一定の数を超していないときには、(II)の動作と同様にして復旧するが、一定の数を超しているときには、以下のようにして復旧動作をおこなうものとする。
【0074】
先ず、新運用系予備サーバ部3のHDD39の内容を、新待機系サーバ部2のHDD29に一括コピーする。
【0075】
この一括コピーしている間に、新運用系予備サーバ部3の読み書きのアクセスの更新アドレスをフラグ付き更新アドレス情報260dとして、記憶しておくことは、(II)の動作と同様である。
【0076】
HDD39から新待機系サーバ部2のHDD29に一括コピーが終了すると、次に、(I)に説明した保守・メンテナンス作業時にHDDに書き込まれたデータ1001の更新アドレス情報260bを基にして、HDD28のデータをHDD29にマージコピーする。これにより、HDD29の内容は、新待機系サーバ部2で保守されたデータの内容と、新運用系予備サーバ部3でのサービスでの読み書きのアクセスにより更新されたデータを併せたものになる。
【0077】
その後に、HDD29の内容を全て、HDD28にコピーし直して、HDD28とHDD29の内容を同一にする。
【0078】
これ以降は、フラグ付き更新アドレス260dに基づいて、一括コピー中の読み書きのアクセスの更新データ1003の内容をコピーして、新待機系サーバ部2を運用系に切り替える動作は、(II)と同様である。
(IV)障害時の動作
次に、図5を用いてサーバシステムの障害時の動作について説明する。
図5は、サーバシステムを障害時のシステム動作を説明するためのタイミングチャートである。
【0079】
ここでは、運用系サーバ部2の、HDDが冗長化されており、ミラーリング動作をおこなっているときに、HDD以外の障害がおこったときについて説明する。なお、HDDに障害がおこったときの動作は、通常のRAIDによりシステムを復旧させる動作と同様になる。
【0080】
例えば、回路の異常、運転温度の上昇など、運用系サーバ部2が障害を検知されたときには、監視・制御マネージメント部20は、ディスクコントローラ部25に指示を与え、運用系サーバ部2のミラーリングされた一方のHDD29から、待機系予備サーバ部3のHDD38、HDD39にコピーを開始する。
【0081】
そして、コピーが終了すると、待機系予備サーバ部3の監視・制御マネージメント部30は、デバイス制御部34を介して、運用の準備のためにOS、アプリケーションソフトウェアを起動する。
【0082】
そして、待機系予備サーバ部3を運用系に切り替えて、HDD38とHDD39により、ミラーリング動作を開始する。
【0083】
〔サーバ間のストレージ制御のための高速専用バス〕
次に、図6を用いてサーバ間のストレージ制御のための高速専用バスについて説明する。
図6は、サーバ間のストレージ制御をおこなう部分に重点をおいた構成図である。
【0084】
発明の実施形態の冒頭では、図1を用いて冗長化機能を有するサーバシステムの構成全体を説明したが、ここでは、サーバ間でストレージ制御をおこなう手段としての高速専用バスを設ける構成について説明する。
【0085】
本実施形態のサーバシステムの各サーバは、ブレードサーバ(Blade Server)として実装することができる。ここで、ブレードサーバとは、一枚の基盤にコンピュータとして必要な要素を実装し、必要な枚数を接続して構成するサーバ専用機のことをいう。
【0086】
ここで、図6に示されたように、サーバ部A10、サーバ部B11、予備サーバ部12がマネージメント部9を介して接続されている。これらの各サーバ部は、ブレードサーバとして、一つのシャーシ内に実装されているものとする。
【0087】
各サーバ部は、ディスク制御切替え部により、高速専用バスで接続されていて、データや制御の指令を受け渡せるようになっている。各サーバ部のディスク制御切替え部は、デバイス制御部の指示をうけてHDDの接続を切り替えるようになっている。
【0088】
この高速専用バスのインタフェースとしては、SCSI( Small Computer System Interface)、ATA(AT Attachment)、シリアルATA、ファイバチャネル(Fibre Channel)などを用いることができる。
【0089】
ここで、サーバ部Bは、(I)の手順で説明したように、運用したままサーバ部Aを予定停止させることにする。
【0090】
このときのサーバ部AのHDD104は、デバイス制御部107を指示を受けて、運用系のサービスを継続させる。一方のHDD105のデータは、予備サーバ部12のHDD124とHDD125にコピーされる。
【0091】
このときに、ディスク制御切替え部106は、HDD105から専用高速バスA13を介して、サーバ部B11のディスク制御切替え部116に、コピーをおこなえるように接続する。サーバ部B11のディスク制御切替え部116は、予備サーバ部12に専用高速バスB14により、予備サーバ部12のディスク制御切替え部126によるコピー制御の中継をするように接続する。そして、サーバ部B11を中継して、サーバ部AのHDD105から、予備サーバ部12のHDD124と、HDD125にデータがコピーされる。
【0092】
運用系であるサーバ部B11のディスク制御切替え部116は、ミラーリング動作をおこなうようにHDD114とHDD115を接続している。
【0093】
なお、これらのストレージ制御は、各監視・制御マネージメント部がマネージメント部7を介して、他の監視・制御マネージメント部と情報をやり取りしておこなうものである。また、図6では、ディスク制御切替えは、機械的なスイッチのように模式的に示したが、実際には、電気的に切替えをおこなうものである。
【0094】
このように、本実施形態では、各サーバ部は同一シャーシ内で隣接するサーバ間を接続する専用高速バスを有し、運用系から予備系切替えに伴うコピー動作の対象外であった場合には、バスの中継制御をおこなっている。これにより同一シャーシ内の全てのサーバ部が連結された場合にも、シャーシ内のバックプレーン上のパターン配置が容易となり、かつ、数十〜数百MHz以上の速度をもつ高速なHDD制御バスの電気的な中継がおこなわれ、複数台サーバが同一シャーシに搭載される場合の待機系サーバまでの長距離な伝送を可能とする。
【0095】
【発明の効果】
本発明によれば、サーバシステムのストレージ制御に関し、冗長化機能を有するサーバシステムの運用系と待機系を用意して、通常サーバ停止を必要とする保守作業においては、運用系切替えによりサービスを継続可能とし、障害発生時には、短時間で運用系切替えによる障害回復をおこなう冗長化機能を、低コストで、シンプルな構成のサーバシステムで実現することができる
【図面の簡単な説明】
【図1】本発明の一実施形態に係る冗長化機能を有するサーバシステムの構成図である。
【図2】予定停止させるときのシステム動作を説明するためのタイミングチャートである。
【図3】サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである(その一)。
【図4】サーバシステムを復旧させるときのシステム動作を説明するためのタイミングチャートである(その二)。
【図5】サーバシステムを障害時のシステム動作を説明するためのタイミングチャートである。
【図6】サーバ間のストレージ制御をおこなう部分に重点をおいた構成図である。
【符号の説明】
1…サーバシステム
2…サーバ部
3,12…予備サーバ部
4,9…マネージメント部
5…LANスイッチ部
6…保守端末
7…クライアント郡
8…LAN
10…サーバ部A
11…サーバ部B
13…専用高速バスA
14…専用高速バスB
20,30,101,111,121…監視・制御マネージメント部
21,31…CPU
22,32…メモリ
23,33…LAN/IF
24,34,107,117,127…デバイス制御部
25,35,102,112,122…ディスクコントローラ部
26,36…同期制御部
27,37,103,113,123…ディスク制御部
28,29,38,39,104,105,114,115,124,125…HDD
261,361…更新アドレスメモリ部
262,362…ディスク制御監視部
106,116,126…ディスク制御切替え部
260a〜260d…更新アドレス情報
1000〜1003…HDDに書き込まれる各種データ

Claims (12)

  1. 運用系システムと待機系システムとを有する計算機システムのストレージ制御方法において、
    前記運用系システムは、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
    前記運用系システムを予定停止するときに、
    (1)前記運用系システムの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで運用系システムのサービスを継続する手順と、
    (2)前記運用系システムの二台以上のハードディスクの他の一方のハードディスクから前記待機系システムのハードディスクにコピーする手順と、
    (3)前記(1)の手順で、運用系システムのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
    (4)前記(2)の手順のコピーが終了して、かつ、運用系システムのサービスに伴ったデータ書き込みがないときに、前記(3)の手順の更新アドレスに基づいて、前記運用系システムのサービスに伴って書き込まれたデータを、前記待機系システムにコピーする手順と、
    (5)前記(4)の手順のコピーが終了して、前記運用系システムと前記待機系システムのハードディスクのデータが全て一致したときに、前記待機系システムを運用系システムに切り替え、前記運用系システムを待機系システムに切り替えて、前記運用系システムの予定停止をおこなう手順と
    を有することを特徴とする計算機システムのストレージ制御方法。
  2. 待機系システムから切り替えられた新運用系システムも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
    運用系システムから切り替えられた新待機系システムの復旧動作をするときに、
    (10)新運用系システムに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
    (11)前記新運用系システムの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系システムのサービスを継続する手順と、
    (12)前記新運用系システムの二台以上のハードディスクの他の一方のハードディスクから前記新待機系システムのハードディスクに、前記(10)の手順の更新アドレスに基づいて、マージコピーする手順と、
    (13)前記(12)の手順のマージコピーしている間の前記新運用系システムのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
    (14)前記(12)の手順のマージコピーが終了して、かつ、新運用系システムのサービスに伴ったデータ書き込みがないときに、前記(13)の手順の更新アドレスに基づいて、前記新運用系システムのサービスに伴って書き込まれたデータを、前記新待機系システムにコピーする手順と、
    (15)前記(14)の手順のコピーが終了して、前記新運用系システムと前記新待機系システムのハードディスクのデータが全て一致したときに、前記新待機系システムを運用系システムに切り替え、前記新運用系システムを待機系システムに切り替えて、前記新待機系システムの復旧動作をおこなう手順と
    を有することを特徴とする請求項1記載の計算機システムのストレージ制御方法。
  3. 待機系システムから切り替えられた新運用系システムも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
    運用系システムから切り替えられた新待機系システムの復旧動作をするときに、
    (20)新待機系システムの保守時に更新されたデータのハードディスクの更新アドレスを記憶する手順と、
    (21)新運用系システムに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
    (22)前記(21)の手順の更新アドレスの数が所定の数を超えるか否かを判断する手順と、
    (24)前記新運用系システムの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系システムのサービスを継続する手順と、
    (25)前記(22)の手順で、更新アドレスの数が所定の数を超えた場合に、前記新運用系システムの二台以上のハードディスクの他の一方のハードディスクから前記新待機系システムのハードディスクの一方に、一括コピーする手順と、
    (26)前記(25)の手順の一括コピーしている間の前記新運用系システムのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手順と、
    (27)前記新待機系システムの一括コピーされたハードディスクに、他の一方のハードディスクのデータを、前記(20)の手順の保守時に更新された更新アドレスに基づいて、マージコピーする手順と、
    (28)前記(27)の手順でマージコピーされた一方のハードディスクのデータを、前記新待機系システムの他の一方のハードディスクに一括コピーする手順と、
    (29)前記(28)の手順のマージコピーが終了して、かつ、新運用系システムのサービスに伴ったデータ書き込みがないときに、前記(26)の手順の更新アドレスに基づいて、前記新運用系システムのサービスに伴って書き込まれたデータを、前記新待機系システムにコピーする手順と、
    (30)前記(29)の手順のコピーが終了して、前記新運用系システムと前記新待機系システムのハードディスクのデータが全て一致したときに、前記新待機系システムを運用系システムに切り替え、前記新運用系システムを待機系システムに切り替えて、前記新待機系システムの復旧動作をおこなう手順と
    を有することを特徴とする請求項1記載の計算機システムのストレージ制御方法。
  4. 前記(4)の手順のコピー中に、前記運用系システムのサービスによって、このコピー動作が長時間停止したときに、前記運用系システムのサービスを停止する処理を含むことを特徴とする請求項1記載の計算機システムのストレージ制御方法。
  5. 前記(14)の手順のコピー中に、前記新運用系システムのサービスによって、このコピー動作が長時間停止したときに、前記新運用系システムのサービスを停止する処理を含むことを特徴とする請求項2記載の計算機システムのストレージ制御方法。
  6. 前記(29)の手順のコピー中に、前記新運用系システムのサービスによって、このコピー動作が長時間停止したときに、前記新運用系システムのサービスを停止する処理を含むことを特徴とする請求項3記載の計算機システムのストレージ制御方法。
  7. 運用系サーバと待機系サーバとを有する冗長化機能を有するサーバシステムにおいて、
    前記運用系サーバは、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有し、
    さらに、前記運用系サーバは、
    この運用系サーバを予定停止するときに、前記運用系サーバの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで運用系サーバのサービスを継続する手段と、
    この運用系サーバの二台以上のハードディスクの他の一方のハードディスクから前記待機系サーバのハードディスクにコピーする手段と、
    この運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手段と、
    前記待機系サーバのハードディスクにコピーが終了して、かつ、運用系サーバのサービスに伴ったデータ書き込みがないときに、記憶された前記更新アドレスに基づいて、この運用系サーバのサービスに伴って書き込まれたデータを、前記待機系サーバにコピーする手段とを有し、
    前記待機系サーバのハードディスクにコピーが終了して、前記運用系サーバと前記待機系サーバのハードディスクのデータが全て一致したときに、前記待機系サーバを運用系サーバに切り替え、前記運用系サーバを待機系サーバに切り替えて、前記運用系サーバの予定停止をおこなうことを有することを特徴とする冗長化機能を有するサーバシステム。
  8. 待機系サーバから切り替えられた新運用系サーバも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有し、
    さらに、前記新運用系サーバは、
    運用系サーバから切り替えられた新待機系サーバの復旧動作をするときに、新運用系サーバに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手段と、
    前記新運用系サーバの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系サーバのサービスを継続する手段と、
    前記新運用系サーバの二台以上のハードディスクの他の一方のハードディスクから前記新待機系サーバのハードディスクに、前記更新アドレスに基づいて、マージコピーする手段と、
    前記マージコピーしている間の前記新運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを、フラグつき更新アドレスとして記憶する手段と、
    前記マージコピーが終了して、かつ、新運用系サーバのサービスに伴ったデータ書き込みがないときに、前記フラグつき更新アドレスに基づいて、前記新運用系サーバのサービスに伴って書き込まれたデータを、前記新待機系サーバのハードディスクにコピーする手段とを有し、
    前記新待機系サーバのハードディスクへのコピーが終了して、前記新運用系サーバと前記新待機系サーバのハードディスクのデータが全て一致したときに、前記新待機系サーバを運用系サーバに切り替え、前記新運用系サーバを待機系サーバに切り替えて、前記新待機系サーバの復旧動作をおこなうことを特徴とする請求項7記載の冗長化機能を有するサーバシステム。
  9. 待機系サーバから切り替えられた新運用系サーバも、二台以上のハードディスクに同一のデータを冗長化して書き込む冗長化手段を有するシステムであって、
    前記新運用系サーバは、
    運用系サーバから切り替えられた新待機系サーバの復旧動作をするときに、この新運用系サーバに切り替えられた以降のサービスに伴ったデータ書き込みのハードディスクの更新アドレスを記憶する手段と、
    前記更新アドレスの数が所定の数を超えるか否かを判断する手段と、
    この新運用系サーバの冗長化動作を中断して、前記二台以上のハードディスクの一方のハードディスクで新運用系サーバのサービスを継続する手段と、
    前記更新アドレスの数が所定の数を超えた場合に、この新運用系サーバの二台以上のハードディスクの他の一方のハードディスクから前記新待機系サーバのハードディスクの一方に、一括コピーする手段と、
    一括コピーしている間のこの新運用系サーバのサービスに伴ったデータ書き込みのハードディスクの更新アドレスを、フラグつき更新アドレスとして記憶する手段とを有し、
    前記新待機系サーバは、
    新待機系サーバの保守時に更新されたデータのハードディスクの更新アドレスを、保守時更新アドレスとして記憶する手段と、
    前記新運用系サーバから一括コピーされたハードディスクに、他の一方のハードディスクのデータを、前記保守時に更新された保守時更新アドレスに基づいて、マージコピーする手段と、
    マージコピーされた一方のハードディスクのデータを、この新待機系サーバの他の一方のハードディスクに一括コピーする手段とを有し、
    さらに、前記新運用系サーバは、
    前記新待機系サーバでおこなわれるマージコピーが終了して、かつ、この新運用系サーバのサービスに伴ったデータ書き込みがないときに、前記フラグつき更新アドレスに基づいて、この新運用系サーバのサービスに伴って書き込まれたデータを、前記新待機系サーバにコピーする手段を有し、
    前記新待機系サーバへのコピーが終了して、前記新運用系サーバと前記新待機系サーバのハードディスクのデータが全て一致したときに、前記新待機系サーバを運用系サーバに切り替え、前記新運用系サーバを待機系サーバに切り替えて、前記新待機系サーバの復旧動作をおこなうことを特徴とする請求項7記載の冗長化機能を有するサーバシステム。
  10. 運用系サーバがN台(N≧1)で、待機系サーバが一台で構成されたこと特徴とする請求項7記載の冗長化機能を有するサーバシステム。
  11. 前記運用系サーバのハードディスク以外の障害が発生したときに、障害が発生した運用系サーバのハードディスクから、前記待機系サーバのハードディスクにコピーする手段を有し、
    コピーが終了したときに、前記待機系サーバを運用系サーバに切り替えることを特徴とする請求項7記載の冗長化機能を有するサーバシステム。
  12. 前記運用系サーバと前記待機系サーバとは、同一シャーシ上に搭載され、
    隣接する前記運用系サーバのハードディスクと前記待機系サーバのハードディスクとは、他の隣接する前記運用系サーバのハードディスクと前記待機系サーバのハードディスクと高速専用バスで接続され、
    前記運用系サーバのハードディスクと前記待機系サーバのハードディスク間で、コピーが必要になったときに、
    各運用系サーバと待機系サーバとでのコピー制御の動作を判断し、前記高速専用バスで、コピーをおこなうか、コピー制御の中継をおこなうかを切り替えて制御することを特徴とする請求項7および請求項9記載のいずれかの冗長化機能を有するサーバシステム。
JP2003206404A 2003-08-07 2003-08-07 ストレージ制御方法、および、冗長化機能を有するサーバシステム Pending JP2005055995A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003206404A JP2005055995A (ja) 2003-08-07 2003-08-07 ストレージ制御方法、および、冗長化機能を有するサーバシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003206404A JP2005055995A (ja) 2003-08-07 2003-08-07 ストレージ制御方法、および、冗長化機能を有するサーバシステム

Publications (1)

Publication Number Publication Date
JP2005055995A true JP2005055995A (ja) 2005-03-03

Family

ID=34363280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003206404A Pending JP2005055995A (ja) 2003-08-07 2003-08-07 ストレージ制御方法、および、冗長化機能を有するサーバシステム

Country Status (1)

Country Link
JP (1) JP2005055995A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285808A (ja) * 2005-04-04 2006-10-19 Hitachi Ltd ストレージシステム
JP2007066216A (ja) * 2005-09-02 2007-03-15 Hitachi Ltd ブート構成変更方法
KR100740850B1 (ko) 2005-03-17 2007-07-20 후지쯔 가부시끼가이샤 에러 통지 방법 및 정보 처리 장치
JP2007328595A (ja) * 2006-06-08 2007-12-20 Nec Corp サーバシステムおよびそのシステムにおける同期化方法
JP2008108019A (ja) * 2006-10-25 2008-05-08 Hitachi Ltd ブレードサーバシステム
JPWO2006100723A1 (ja) * 2005-03-18 2008-08-28 富士通株式会社 ファイル管理システム
JP2010033398A (ja) * 2008-07-30 2010-02-12 Internatl Business Mach Corp <Ibm> トランザクションを処理する本番システムと該本番システムのバックアップ・システムである代行システムとを含む本番−代行システム
JP2011096275A (ja) * 2010-12-17 2011-05-12 Fujitsu Ltd ファイル管理システム
JP2013016194A (ja) * 2012-09-18 2013-01-24 Hitachi Ltd ブート構成変更方法
US8972777B2 (en) 2012-03-30 2015-03-03 Fujitsu Limited Method and system for storage management
CN111897697A (zh) * 2020-08-11 2020-11-06 腾讯科技(深圳)有限公司 服务器硬件故障修复方法和装置
US11010269B2 (en) 2017-06-15 2021-05-18 Hitachi, Ltd. Distributed processing system and method for management of distributed processing system

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100740850B1 (ko) 2005-03-17 2007-07-20 후지쯔 가부시끼가이샤 에러 통지 방법 및 정보 처리 장치
JPWO2006100723A1 (ja) * 2005-03-18 2008-08-28 富士通株式会社 ファイル管理システム
JP5184078B2 (ja) * 2005-03-18 2013-04-17 富士通株式会社 ファイル管理システム
JP2006285808A (ja) * 2005-04-04 2006-10-19 Hitachi Ltd ストレージシステム
JP4701929B2 (ja) * 2005-09-02 2011-06-15 株式会社日立製作所 ブート構成変更方法、管理サーバ、及び計算機システム
JP2007066216A (ja) * 2005-09-02 2007-03-15 Hitachi Ltd ブート構成変更方法
JP2007328595A (ja) * 2006-06-08 2007-12-20 Nec Corp サーバシステムおよびそのシステムにおける同期化方法
JP2008108019A (ja) * 2006-10-25 2008-05-08 Hitachi Ltd ブレードサーバシステム
JP2010033398A (ja) * 2008-07-30 2010-02-12 Internatl Business Mach Corp <Ibm> トランザクションを処理する本番システムと該本番システムのバックアップ・システムである代行システムとを含む本番−代行システム
JP2011096275A (ja) * 2010-12-17 2011-05-12 Fujitsu Ltd ファイル管理システム
US8972777B2 (en) 2012-03-30 2015-03-03 Fujitsu Limited Method and system for storage management
JP2013016194A (ja) * 2012-09-18 2013-01-24 Hitachi Ltd ブート構成変更方法
US11010269B2 (en) 2017-06-15 2021-05-18 Hitachi, Ltd. Distributed processing system and method for management of distributed processing system
CN111897697A (zh) * 2020-08-11 2020-11-06 腾讯科技(深圳)有限公司 服务器硬件故障修复方法和装置

Similar Documents

Publication Publication Date Title
EP2281240B1 (en) Maintaining data integrity in data servers across data centers
CN101488077B (zh) 冗余磁盘控制服务器系统
JP2011060055A (ja) 仮想計算機システム、仮想マシンの復旧処理方法及びそのプログラム
US7360047B2 (en) Storage system, redundancy control method, and program
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
WO2012112308A1 (en) Power failure management in components of storage area network
JPH09231016A (ja) Raid記憶サブシステムにおけるデ−タのスナップショットコピ−作成方法とその装置
US20060179218A1 (en) Method, apparatus and program storage device for providing geographically isolated failover using instant RAID swapping in mirrored virtual disks
US20200042416A1 (en) Information processing system, information processing system management method, and program thereof
CN104536971A (zh) 一种具备高可用性的数据库
JP2005055995A (ja) ストレージ制御方法、および、冗長化機能を有するサーバシステム
CN113254275A (zh) 一种基于分布式块设备的MySQL高可用架构方法
US11409471B2 (en) Method and apparatus for performing data access management of all flash array server
JP2006227964A (ja) ストレージシステム、処理方法及びプログラム
CN111240903A (zh) 数据恢复方法及相关设备
CN101686261A (zh) 一种基于rac的冗余服务器系统
JP6335336B2 (ja) ストレージシステムおよびその制御方法
CN113961397A (zh) 一种基于备份容灾系统的高可用集群容灾方法
US9542273B2 (en) Storage control apparatus, storage control system, and storage control method for failure detection and configuration of cascaded storage cabinets
JP2006058960A (ja) 冗長構成のサーバシステムにおける同期化方法及びシステム
JP2009265973A (ja) データ同期システム、障害復旧方法、及び、プログラム
US9158666B2 (en) Computer system and computer system information storage method
JPH09293001A (ja) 無停止保守システム
JP2008276281A (ja) データ同期システム、方法、及び、プログラム
Dell