Nothing Special   »   [go: up one dir, main page]

JP2004265110A - メタデータ配置方法、プログラムおよびディスク装置 - Google Patents

メタデータ配置方法、プログラムおよびディスク装置 Download PDF

Info

Publication number
JP2004265110A
JP2004265110A JP2003054397A JP2003054397A JP2004265110A JP 2004265110 A JP2004265110 A JP 2004265110A JP 2003054397 A JP2003054397 A JP 2003054397A JP 2003054397 A JP2003054397 A JP 2003054397A JP 2004265110 A JP2004265110 A JP 2004265110A
Authority
JP
Japan
Prior art keywords
logical
physical
metadata
secondary storage
storage devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003054397A
Other languages
English (en)
Inventor
Toshiyuki Ukai
敏之 鵜飼
Yoshifumi Takamoto
良史 高本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003054397A priority Critical patent/JP2004265110A/ja
Priority to US10/641,069 priority patent/US20040172501A1/en
Publication of JP2004265110A publication Critical patent/JP2004265110A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】メタデータの読み出しを高速化し、共有論理ボリュームの切り換えを高速化する。
【解決手段】論理ボリュームを共有するホスト101,102が、障害時にホスト切り換えを行うことによって高信頼性化を図っている計算機システムであって、物理ボリューム104上に存在する、論理ボリュームを構成するために必要なメタデータを、物理ボリュームの数よりも少ない数の物理ボリュームに一括化して配置する。それにより、メタデータの読み出しを高速化し、共有論理ボリュームの切り換えを高速化することができる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、論理ボリュームによるボリューム管理に関し、特に、論理ボリュームを使用可能にするための時間の短縮に適用して有効な技術に関するものである。
【0002】
【従来の技術】
多くのオペレーティング・システムにおいて、論理ボリュームによるボリューム管理が主流となっている。論理ボリュームは、1つ以上の物理ボリュームの集合(ボリューム・グループ)から、新たに定義される仮想的なボリュームである。
【0003】
論理ボリュームにより、ファイルシステムとして使用するボリュームを抽象化し、物理的なボリュームとは切り離された仮想的なストレージを管理することができる。
【0004】
論理ボリュームを使用することによって、計算機システムでの柔軟なボリューム管理が可能となる。たとえば、論理ボリュームでは、複数のディスク装置を統合して単一のボリュームとして使用できる。その逆に、1つの大きなボリュームを複数の小さなボリュームとして使用できる。
【0005】
また、ファイルシステムに空きが無くなった場合、ボリューム・グループに物理ボリュームを追加して、論理ボリュームの容量を増やすようなこともできる。
【0006】
このような論理ボリュームを実現するために、オペレーティング・システムは、論理ボリュームを管理するための情報として、ボリューム・グループ管理用メタデータを物理ボリュームに格納する。
【0007】
ボリューム・グループ管理用メタデータは、論理―物理のマッピングをはじめ、ボリューム・グループや論理ボリュームの構成に関する情報である。このようなメタデータは、ボリューム・グループや論理ボリュームの構成が変更される場合などに更新されることが主であるため、メタデータ更新の頻度は比較的少ない。
【0008】
一般に、メタデータと通常データは、同じボリューム(ソフトウェアの階層により「物理」の場合も「論理」の場合もありうる)内の離れた場所に配置される。このため、たとえばメタデータが頻繁に更新される場合などでは、メタデータの入出力の影響を受けて通常データの入出力性能が劣化することがある。
【0009】
Technical Overview Sun QFS(サン・マイクロシステムズ社、2001年8月)に開示されているサン・マイクロシステムズ社のQFSでは、ファイルシステムのメタデータ(iノードなど)と通常データを分離して異なるデバイス(ボリューム)に配置することを可能にしている。
【0010】
一方、メタデータに限らず、2次記憶装置の特性を活かしてデータの最適な配置を実現する方法がある(たとえば、特許文献1参照)。
【0011】
この場合では、新規にデータを格納する領域を割り当てる場合、2次記憶装置において割り当てるブロックを決定し、それをホストに通知する手段を用意している。
【0012】
2次記憶装置側でデータの最適配置を行うことが可能であるため、これをメタデータの配置の決定に使用すれば、メタデータを通常データのアクセスに影響を及ぼしにくくなる場所へ配置することも可能である。
【0013】
【特許文献1】
特開2001−273176号公報
【0014】
【発明が解決しようとする課題】
ところが、上記のような論理ボリュームによるボリューム管理技術では、次のような問題点があることが本発明者により見い出された。
【0015】
計算機システムにおいて、論理ボリュームを使用する場合、オペレーティング・システムは、ボリューム・グループ管理用メタデータを読み出し、その情報に基づき、論理ボリュームを使用可能にするための処理(ボリューム・グループ有効化処理)を実施する。
【0016】
ボリューム・グループ管理用メタデータは、各物理ボリュームに格納されているため、物理ボリュームの数が多いほど、論理ボリュームが使用可能になるまでの時間が増える。複数のホストでディスク装置を共有した高信頼化システムを構成している場合、前記の増加はシステム切り換え時間の増加につながる。このため、ボリューム・グループ管理用メタデータの読み出しを高速化することが課題となる。
【0017】
ファイルシステムのメタデータと通常データとを分離して異なるデバイスに配置する場合、1つのファイルシステムに対して、メタデータ専用のボリュームと、通常データ専用のボリュームを用いる構成が可能である。
【0018】
そのような構成をとることにより、通常データの入出力においてメタデータ更新の影響を受けないようにしている。この方法では、それぞれのボリュームは、メタデータまたは通常データの専用ボリュームであり、障害などによりどちらかのボリュームに対するアクセスが不能になった場合に、ファイルシステム上のデータの一部のみならず全部の読み出しが困難になることが課題である。
【0019】
また、2次記憶装置の特性を活かしてデータの最適な配置を実現する場合には、2次記憶装置側でボリューム上のデータを配置する場所を決定している。この方法をメタデータに対して適用する場合の課題は、格納場所を決定しようとしているデータが、メタデータか否かを2次記憶装置側に通知する必要がある点である。
【0020】
本発明の目的は、メタデータを、物理ボリュームの数よりも少ない数の物理ボリュームに一括化して配置することにより、メタデータの読み出しを高速化し、ホスト切り換えに伴う共有論理ボリュームの切り換えを高速化することのできるメタデータ配置方法、プログラムおよびディスク装置を提供することにある。
【0021】
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
【0022】
【課題を解決するための手段】
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。
(1)1つ以上の計算機と、複数の物理的または論理的な2次記憶装置とからなり、該計算機のOS(Operating System)は、複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、論理的な記憶装置として管理するためにメタデータを複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムによるメタデータ配置方法であって、該論理的な記憶装置として管理するメタデータの複製を、第1の領域を有する物理的、または論理的な2次記憶装置の数よりも少ない数の物理的、または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置するステップを有するものである。
【0023】
また、本願のその他の発明の概要を簡単に示す。
(2)複数の計算機と、複数の物理的または論理的な2次記憶装置とからなり、該計算機のOSは、複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、論理的な記憶装置として管理するためにメタデータを複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムによるメタデータ配置方法であって、論理的な記憶装置として管理するためのメタデータの複製を、第1の領域を有する物理的または論理的な2次記憶装置の数よりも少ない数の物理的または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置するステップを有し、複数の計算機は複数の物理的または論理的な2次記憶装置を共有し、複数の計算機のうち、第1の計算機が不正な状態になると第2の計算機が第1の計算機の処理を引き継ぐ際に、第2の領域に配置されたメタデータの複製を読み出すものである。
(3)1つ以上の計算機と複数の物理的または論理的な2次記憶装置からなり、該計算機のOSは、複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、論理的な記憶装置として管理するためにメタデータを複数の物理的または論理的な2次記憶装置上の領域に配置する機能とを有する計算機システムによるメタデータ配置方法であって、該領域が2次記憶装置のキャッシュメモリに常駐化するよう設定されているものである。
(4)計算機システムに実行させるプログラムであり、該計算機システムは、1つ以上の計算機と、複数の物理的または論理的な2次記憶装置とからなり、該計算機のOSは、複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、論理的な記憶装置として管理するためにメタデータを複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムに、論理的な記憶装置として管理するメタデータの複製を、第1の領域を有する物理的、または論理的な2次記憶装置の数よりも少ない数の物理的、または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置する手順を実行させるものである。
(5)計算機システムに実行させるプログラムであり、該計算機システムは、複数の計算機と、複数の物理的または論理的な2次記憶装置とからなり、該計算機のOSは、複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、論理的な記憶装置として管理するためにメタデータを複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムに、論理的な記憶装置として管理するためのメタデータの複製を、第1の領域を有する物理的または論理的な2次記憶装置の数よりも少ない数の物理的または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置する手順を実行させ、複数の計算機は複数の物理的または論理的な2次記憶装置を共有し、複数の計算機のうち、第1の計算機が不正な状態になると第2の計算機が第1の計算機の処理を引き継ぐ際に、第2の領域に配置されたメタデータの複製を読み出すものである。
(6)1つ以上の物理的な2次記憶装置からなるディスク装置であって、物理的な2次記憶装置を統合して1つ以上の論理的な2次記憶装置を提供する機能を有し、1つ以上の論理的な2次記憶装置の所定の領域を常駐させるキャッシュメモリを備えたものである。
【0024】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。
【0025】
(実施の形態1)
図1は、本発明の実施の形態1による計算システムの構成図、図2は、図1の計算システムにおける物理ボリュームに存在する論理ボリューム管理用のメタデータの一例を示した説明図、図3は、図1の計算システムにおけるボリューム・グループ構成管理テーブルの構成例を示した図、図4は、図1の計算システムにおける一括化メタデータ領域管理テーブルの一例を示す構成図、図5は、計算システムにおける一括化メタデータ配置の概要を示した説明図、図6は、図1の計算機システムにおけるボリューム・グループ有効化処理のフローチャート、図7は、図1の計算機システムにおける一括化メタデータ読み出し機構のフローチャート、図8は、図1の計算機システムによる一括化メタデータ書き込み機構のフローチャートである。
【0026】
本実施の形態において、計算機システムは、図1に示すように、ホスト(計算機)101,102から構成されている。これらホスト101,102は、ネットワーク103により相互に接続されており、物理ボリューム104を共有している。
【0027】
ここで述べる物理ボリュームは、ホスト101,102から見て「物理ボリューム」として見えるものである。それが単体ディスク装置か、ディスクアレイ装置かは問題ではない。また、ディスク装置側で論理的にディスク装置として見せているものでも構わない。
【0028】
ホスト101,102では、様々なアプリケーション105やオペレーティング・システム(OS)などシステムソフトウェアの一部として論理ボリューム・マネージャ106が動作している。論理ボリューム・マネージャ106は、アプリケーション105などからの論理ボリュームに対するアクセスを物理ボリュームへのアクセスに変換している。
【0029】
また、ホスト101,102は、ネットワーク103を使って相互で通信し、ホットスタンバイ構成をとり、現用ホスト101に障害が発生すると、もう一方の待機ホスト102に切り換えて、アプリケーションの処理などを継続することができる。
【0030】
本実施の形態では、論理ボリューム・マネージャ106に、ボリューム・グループ有効化機能111と一括化メタデータ読み出し機構112、一括化メタデータ書き込み機能113、ボリューム・グループ構成管理テーブル114、および一括化メタデータ領域管理テーブル115を追加することにより、ホスト切り換えに伴う、論理ボリューム切り換えを高速化する機能を有している。
【0031】
図2は、物理ボリュームに存在する論理ボリューム管理用のメタデータ201の例を示した説明図である。
【0032】
メタデータ201は、物理ボリュームの先頭から物理ボリューム管理用領域202、ボリューム・グループ・ステータス領域203、ボリューム・グループ・ディスクリプタ領域204などに区別される。
【0033】
物理ボリューム管理用領域202には、物理ボリュームの識別子や不良セクタの情報など、物理ボリュームに閉じた情報を保持する。ボリューム・グループ・ステータス領域203は、ボリューム・グループを構成する全物理ボリュームの領域の状態を保持する。また、ボリューム・グループ・ディスクリプタ領域204は、ボリューム・グループの識別子や論理−物理のマッピングの情報を保持する。
【0034】
なお、物理ボリューム管理用領域202の物理ボリュームの識別子は、OSが物理ボリュームを一意に識別し、物理ボリュームの物理的あるいは論理的な接続場所を特定(構成認識)するために用いる。接続場所が特定された物理ボリュームは、OSの管理する構成テーブルに登録され、OSがその物理ボリュームに正しくアクセスすることが可能になる。もちろん、物理ボリュームを識別する手段は、その物理ボリュームが一意に識別できればどのような手段でも構わない。
【0035】
通常、この構成認識処理はシステム起動時に行われるが、システム起動時でなくてもよく、少なくともホスト計算機の切り替えが発生する前に実行されていればよい。ホスト計算機または物理ボリュームなどに不揮発メモリが搭載され、それにテーブルが保持されていれば、計算機のリブートごとに構成認識処理を実行する必要もない。
【0036】
構成認識処理の概要は次のようになる。
【0037】
ホスト計算機101および102は、接続されている各物理ボリューム104の物理ボリューム識別子を物理ボリューム104から読み出し、その物理ボリュームの論理的または物理的な接続場所を関連付け、OSが管理する構成テーブルに登録する。ただし、システム運用中に、装置の電源投入や装置接続場所の変更などにより、起動当初の構成と変更が生じた場合は、構成認識処理を再度実行し、OSの管理する構成テーブルを更新する必要がある。
【0038】
図3は、ボリューム・グループ構成管理テーブル114の構成例を示した図である。
【0039】
このボリューム・グループ構成管理テーブル114では、ボリューム・グループを構成する物理ボリュームにおいて、一括化メタデータが有効か無効かを表している。
【0040】
ボリューム・グループ名301のカラムには、本計算機システムにおいて定義されるボリューム・グループ名が示されている。カラム302にはそのボリューム・グループを構成する物理ボリューム名が示されている。
【0041】
そのボリューム・グループにおいて一括化メタデータが有効になっているか、無効になっているかをカラム303に示している。たとえばボリューム・グループVG1は、物理ボリューム1および2から構成され、一括化メタデータが有効であり、メタデータの一括化が行われていることが示されている。
【0042】
図4は、一括化メタデータ領域管理テーブル115の構成例を示す図である。
【0043】
この一括化メタデータ領域管理テーブル115には、図3のボリューム・グループ構成管理テーブルにおいて、一括化メタデータが有効であると表示されている物理ボリュームの、一括化メタデータが格納されている場所を示している。
【0044】
カラム401は物理ボリューム名を表し、その物理ボリュームの一括化メタデータがどの物理ボリュームに格納されているかをカラム402で表している。カラム403は、一括化メタデータの格納場所の開始セクタ番号を保持し、カラム404はそのメタデータのサイズ(セクタ数)を保持している。これにより、一括化メタデータが有効になっている物理ボリュームにおいて、その一括化メタデータの格納場所を明らかにすることができる。
【0045】
図5は、本方式における一括化メタデータ配置の概要を示した図である。ホスト102に他のホストと共有される、n+1台の物理ボリューム104が接続されている例である。
【0046】
いずれの共有物理ボリューム104も、それぞれの記憶領域(第1の領域)511〜514の先頭に論理ボリュームを管理するためのメタデータ1〜nを保持している。このとき、一括化メタデータ領域管理テーブル115において、物理ボリューム1〜nがいずれも一括化メタデータが有効になっており、一括化メタデータの保存先が物理ボリューム0である例を図示している。一括化メタデータの記憶領域(第2の領域)515の保存位置は任意の位置でもかまわないが、読み出しの効率を考えると、連続領域に配置することが有利である。
【0047】
図に示すように一括化メタデータが有効になっている場合、一括化メタデータとしては、元の物理ボリュームの先頭に配置されているメタデータ1〜nの複製を使用する。これにより、たとえ物理ボリューム0に障害が発生し、一括化メタデータの読み出しが不可能になった場合でも、各物理ボリュームの先頭のメタデータ1〜nを読み込むことによって、ボリューム・グループの有効化処理を続行することが可能になる。
【0048】
図6はボリューム・グループ有効化処理のフローチャートである。図示していないが、本処理はホットスタンバイ構成をとっているホスト計算機を制御するソフトウェアあるいはハードウェアにより、現用ホスト計算機で障害が発生し、待機ホスト計算機への切り替えが必要と判断された場合に、実行される処理である。
【0049】
まず、ホスト切り替えに伴い、待機側において有効化すべきボリューム・グループを評価する(ステップS601)。この評価自体は、システム切り替えを司るアプリケーションなどが行う処理である。
【0050】
評価後、論理ボリューム・マネージャが、有効化すべきボリューム・グループの情報を受け取り、実際のボリューム・グループ有効化処理を実施する。
【0051】
このとき、そのボリューム・グループの一括化メタデータが有効になっているか否かを、ボリューム・グループ構成管理テーブル114で調査する(ステップS602)。
【0052】
一括化メタデータ有効であった場合は、一括化メタデータ読み出し処理を実行する(ステップS603)。また、ステップS602の処理において、無効であれば、各物理ボリュームの先頭から物理ボリューム・メタデータの読み出しを行う。
【0053】
図7は、一括化メタデータ読み出し機構のフローチャートである。
【0054】
一括化メタデータ領域管理テーブル115を参照し、一括化メタデータを保持する物理ボリュームを特定し、読み出すべきセクタを決定し(ステップS701)、実際の一括化メタデータの読み出しを行う(ステップS702)。
【0055】
その後、読み出した一括化メタデータを利用し、ボリューム・グループの有効化が可能かどうかを評価する(ステップS703)。評価自体は従来通りの基準に基づいて行ったり、その物理ボリュームがレディ状態かどうかを検査することで行えばよい。また、読み出した一括化メタデータの物理ボリューム識別子を使って、あらかじめ構成認識時に作成している、物理ボリュームとその論理的または物理的な接続場所を関連付けを記した構成テーブルに基づき、読み出した一括化メタデータに対応する物理ボリュームの論理的あるいは物理的な接続場所を特定する処理も行う。ここで可能と判断されれば、ボリューム・グループを有効化し(ステップ704)、判断できなければそのまま処理を終える。
【0056】
図8は、一括化メタデータ書き込み機構のフローチャートである。
【0057】
メタデータを更新する場合、通常通り、物理ボリューム先頭のメタデータの更新を行う(ステップS801)。
【0058】
そして、そのボリューム・グループの一括化メタデータが有効になっているか否かを、ボリューム・グループ構成管理テーブル114で調査する(ステップS802)。一括化メタデータ有効であった場合は、一括化メタデータの更新処理を実行する(ステップS803)。無効であれば、そのまま処理を終える。
【0059】
それにより、本実施の形態によれば、ホスト切り替え時の論理ボリューム104を使用可能にするための処理(ボリューム・グループ有効化処理)において必要な、各物理ボリュームのメタデータ読み出しを、一括化メタデータから行うことによって高速化することができる。
【0060】
また、一括化メタデータを利用するケースでも、各物理ボリューム104に配置されているメタデータも使えるようにするため、一括化メタデータの読み出しが不可能になった場合でも、特別な処理を行うことなくボリューム・グループ有効化処理を可能にすることができる。
【0061】
(実施の形態2)
図9は、本発明の実施の形態2による計算システムにおける一括化メタデータ配置の概要を示した説明図、図10は、図9の計算システムにおけるキャッシュ常駐化登録機構のフローチャートである。
【0062】
本実施の形態2において、図9は計算機システム、および一括化メタデータ配置の概要を示した図である。前記実施の形態1の図5との違いは、ディスク・キャッシュ901を明記している点と、論理ボリューム内にディスク・キャッシュ常駐化登録機構902がある点である。
【0063】
ディスク・キャッシュ901は、ホスト102からその存在は意識されずに、ホスト102からの物理ボリュームに対する入出力の際、物理ボリューム104を構成する物理的なメディアに対する入出力が効率よく行われる目的で使用される。
【0064】
この物理ボリューム104は、物理ボリューム104の任意のセクタをディスク・キャッシュ901内に常駐化させることが可能なインタフェースをホスト102に提供しているものとする。
【0065】
ディスク・キャッシュ901に常駐化されるように設定されたセクタに対する入出力要求は、一旦ディスク・キャッシュ901内にデータが格納されれば、以降はディスク・キャッシュ901への入出力で処理が完結する。
【0066】
本実施の形態2では、一括化メタデータを有効にするまでの処理は、前記実施の形態1と同様である。異なる点は、物理ボリューム0の、一括化メタデータを格納している領域を、ディスク・キャッシュ常駐化登録機構902により、常駐化設定する点である。
【0067】
一括化メタデータを格納する領域が常駐化設定されることにより、ホットスタンバイ構成の論理ボリューム引き継ぎにおけるメタデータの読み出しが、より一層高速に処理でき、それによって高速な引き継ぎが可能になる。
【0068】
図10は、キャッシュ常駐化登録機構902のフローチャートである。
【0069】
まず、ディスク・キャッシュ常駐化登録が可能か否かを評価する(ステップS1001)。この評価は、常駐化登録されたエントリ数や領域のサイズが、制限を越えていないことを確認するためのものである。
【0070】
登録不可能であればそのまま処理を中止する。また、登録可能であれば、一括化メタデータ領域管理テーブル115に基づき、一括化メタデータを保持する領域のディスク・キャッシュ常駐化登録を行う(ステップS1001)。
【0071】
それにより、本実施の形態2においては、前記実施の形態1においてメタデータを一括化した効果に加え、ホスト102が決めた一括化メタデータの格納場所をディスク・キャッシュ901に常駐化させることにより、より高速なメタデータ読み出しを可能にし、ホスト切り替え時の論理ボリュームを使用可能にするための処理をより高速化することができる。
【0072】
また、ホスト102側は、本実施の形態2のようなケースでは、メタデータを高速に読み出すことが有効であることを知っているため、その目的でディスク・キャッシュ901を効率的に使用できるという効果もある。
【0073】
(実施の形態3)
図11は、本発明の実施の形態3による計算システムにおける一括化メタデータ配置の概要を示した説明図である。
【0074】
本実施の形態3において、図11は計算機システム、および一括化メタデータ配置の概要を示した図である。前記実施の形態2の図9との違いは、各物理ボリューム104で、図9におけるディスク・キャッシュ901と同様のディスク・キャッシュ1101を明記している点と、論理ボリューム・マネージャ106で一括化メタデータ領域管理テーブルを持たない点、それに伴って一括化メタデータも持たない点である。
【0075】
本実施の形態3では、ホスト102側で物理ボリューム0〜nの先頭にあるメタデータ領域0からnを、それぞれディスク・キャッシュ1101に常駐化登録することによって、一括化メタデータを用いること無しに、メタデータ読み出の高速化、およびホスト切り替え時の論理ボリュームを使用可能にする処理の高速化を実現できる。
【0076】
このとき論理ボリューム・マネージャ106におけるディスク・キャッシュ常駐化登録機構1102は、図10のステップS1002で、一括化メタデータ領域管理テーブルに基づき、ディスク・キャッシュ常駐化登録をする代わりに、各物理ボリュームにおけるメタデータ0〜nの記憶領域511〜514をディスク・キャッシュ1101に登録する。
【0077】
それにより、本実施の形態3では、一括化メタデータを使用せずとも、各物理ボリューム104のメタデータ領域をディスク・キャッシュ1101に常駐化させることにより、一括化メタデータを用いずに、より高速なメタデータ読み出しを可能にし、ホスト切り替え時の論理ボリュームを使用可能にするための処理をより高速化することができる。
【0078】
(実施の形態4)
図12は、本発明の実施の形態4による計算システムにおける一括化メタデータ配置の概要を示した説明図である。
【0079】
本実施の形態4において、図12は計算機システム、および一括化メタデータ配置の概要を示した図である。ホスト102に接続されているディスク装置は、ディスク・コントローラ1232、ディスク・キャッシュ1233、スイッチ1234、真に物理的なストレージからなる。
【0080】
本ディスク装置では、ディスク・コントローラ1232が、ホストに対して、真に物理的なストレージを論理的に再構成した形で、物理ボリューム1201として見せている。
【0081】
論理ボリュームを実現するために使用されるメタデータは、物理ボリュームの先頭部分に配置されることが多い。そのため、本実施例では、ディスク・コントローラに、物理ボリュームにおける先頭領域のキャッシュ常駐化機構1235を用意して、各物理ボリュームにおける先頭領域1211をあらかじめ、ディスク・キャッシュ1233に常駐するように設定しておく。
【0082】
それにより、本実施の形態4においては、ホスト102側からキャッシュ常駐領域を指示せずとも、ディスク装置側で各物理ボリューム1201の先頭領域1211をディスク・キャッシュ1233に常駐化させることにより、より高速なメタデータ読み出しを可能にし、ホスト切り替え時の論理ボリュームを使用可能にするための処理をより高速化することができる。
【0083】
以上、本発明者によってなされた発明を発明の実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0084】
【発明の効果】
本願によって開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば、以下のとおりである。
【0085】
(1)論理ボリュームを使用するために必要なメタデータの読み出しを高速化することができる。
【0086】
(2)また、上記(1)により、複数の計算機を利用したホットスタンバイ構成において、システム切り替えを高速化することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1による計算システムの構成図である。
【図2】図1の計算システムにおける物理ボリュームに存在する論理ボリューム管理用のメタデータの一例を示した説明図である。
【図3】図1の計算システムにおけるボリューム・グループ構成管理テーブルの構成例を示した図である。
【図4】図1の計算システムにおける一括化メタデータ領域管理テーブルの一例を示す構成図である。
【図5】計算システムにおける一括化メタデータ配置の概要を示した説明図である。
【図6】図1の計算機システムにおけるボリューム・グループ有効化処理のフローチャートである。
【図7】図1の計算機システムにおける一括化メタデータ読み出し機構のフローチャートである。
【図8】図1の計算機システムによる一括化メタデータ書き込み機構のフローチャートである。
【図9】本発明の実施の形態2による計算システムにおける一括化メタデータ配置の概要を示した説明図である。
【図10】図9の計算システムにおけるキャッシュ常駐化登録機構のフローチャートである。
【図11】本発明の実施の形態3による計算システムにおける一括化メタデータ配置の概要を示した説明図である。
【図12】本発明の実施の形態4による計算システムにおける一括化メタデータ配置の概要を示した説明図である。
【符号の説明】
101 ホスト(計算機)
102 ホスト(計算機)
103 ネットワーク
104 物理ボリューム
105 アプリケーション
106 論理ボリューム・マネージャ
111 ボリューム・グループ有効化機能
112 一括化メタデータ読み出し機構
113 一括化メタデータ書き込み機能
114 ボリューム・グループ構成管理テーブル
115 一括化メタデータ領域管理テーブル
201 メタデータ
202 物理ボリューム管理用領域
203 ボリューム・グループ・ステータス領域
204 ボリューム・グループ・ディスクリプタ領域
205 ボリューム・グループ構成管理テーブル
301 ボリューム・グループ名
302,303 カラム
401〜404 カラム
511〜514 記憶領域(第1の領域)
515 記憶領域(第2の領域)
901 ディスク・キャッシュ
902 ディスク・キャッシュ常駐化登録機構
1101 ディスク・キャッシュ
1232 ディスク・コントローラ
1233 ディスク・キャッシュ
1234 スイッチ
1235 キャッシュ常駐化機構
VG1 ボリューム・グループ

Claims (8)

  1. 1つ以上の計算機と、複数の物理的または論理的な2次記憶装置とからなり、前記計算機のOSは、前記複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、前記論理的な記憶装置として管理するためにメタデータを前記複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムによるメタデータ配置方法であって、
    前記論理的な記憶装置として管理するメタデータの複製を、第1の領域を有する物理的、または論理的な2次記憶装置の数よりも少ない数の物理的、または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置するステップを有することを特徴とするメタデータ配置方法。
  2. 請求項1記載のメタデータ配置方法において、
    前記所定の条件が、前記2次記憶装置において、複数のメタデータの複製が隣り合うように配置する条件であることを特徴とするメタデータ配置方法。
  3. 請求項1または2記載のメタデータ配置方法において、
    前記所定の条件が、前記2次記憶装置のキャッシュメモリに常駐化するよう設定されている条件であることを特徴とするメタデータ配置方法。
  4. 複数の計算機と、複数の物理的または論理的な2次記憶装置とからなり、前記計算機のOSは、前記複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、前記論理的な記憶装置として管理するためにメタデータを前記複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムによるメタデータ配置方法であって、
    前記論理的な記憶装置として管理するためのメタデータの複製を、第1の領域を有する物理的または論理的な2次記憶装置の数よりも少ない数の物理的または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置するステップを有し、
    前記複数の計算機は前記複数の物理的または論理的な2次記憶装置を共有し、前記複数の計算機のうち、第1の計算機が不正な状態になると第2の計算機が前記第1の計算機の処理を引き継ぐ際に、前記第2の領域に配置されたメタデータの複製を読み出すことを特徴とするメタデータ配置方法。
  5. 1つ以上の計算機と複数の物理的または論理的な2次記憶装置からなり、前記計算機のOSは、前記複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、前記論理的な記憶装置として管理するためにメタデータを前記複数の物理的または論理的な2次記憶装置上の領域に配置する機能とを有する計算機システムによるメタデータ配置方法であって、
    前記領域が前記2次記憶装置のキャッシュメモリに常駐化するよう設定されていることを特徴とするメタデータ配置方法。
  6. 1つ以上の計算機と、複数の物理的または論理的な2次記憶装置とからなり、前記計算機のOSは、前記複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、前記論理的な記憶装置として管理するためにメタデータを複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムに、前記論理的な記憶装置として管理するメタデータの複製を、前記第1の領域を有する物理的、または論理的な2次記憶装置の数よりも少ない数の物理的、または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置する手順を実行させることを特徴とするプログラム。
  7. 複数の計算機と、複数の物理的または論理的な2次記憶装置とからなり、前記計算機のOSは、前記複数の物理的または論理的な2次記憶装置を統合して論理的な記憶装置として管理する機能と、前記論理的な記憶装置として管理するためにメタデータを複数の物理的または論理的な2次記憶装置上の第1の領域に配置する機能とを有する計算機システムに、
    前記論理的な記憶装置として管理するためのメタデータの複製を、第1の領域を有する物理的または論理的な2次記憶装置の数よりも少ない数の物理的または論理的な2次記憶装置上の所定の条件を満たす第2の領域に配置する手順を実行させ、
    前記複数の計算機は前記複数の物理的または論理的な2次記憶装置を共有し、前記複数の計算機のうち、第1の計算機が不正な状態になると第2の計算機が前記第1の計算機の処理を引き継ぐ際に、前記第2の領域に配置されたメタデータの複製を読み出すことを特徴とするプログラム。
  8. 1つ以上の物理的な2次記憶装置からなるディスク装置であって、前記物理的な2次記憶装置を統合して1つ以上の論理的な2次記憶装置を提供する機能を有し、前記1つ以上の論理的な2次記憶装置の所定の領域を常駐させるキャッシュメモリを備えたことを特徴とするディスク装置。
JP2003054397A 2003-02-28 2003-02-28 メタデータ配置方法、プログラムおよびディスク装置 Pending JP2004265110A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003054397A JP2004265110A (ja) 2003-02-28 2003-02-28 メタデータ配置方法、プログラムおよびディスク装置
US10/641,069 US20040172501A1 (en) 2003-02-28 2003-08-15 Metadata allocation method in a storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003054397A JP2004265110A (ja) 2003-02-28 2003-02-28 メタデータ配置方法、プログラムおよびディスク装置

Publications (1)

Publication Number Publication Date
JP2004265110A true JP2004265110A (ja) 2004-09-24

Family

ID=32905804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003054397A Pending JP2004265110A (ja) 2003-02-28 2003-02-28 メタデータ配置方法、プログラムおよびディスク装置

Country Status (2)

Country Link
US (1) US20040172501A1 (ja)
JP (1) JP2004265110A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257317A (ja) * 2006-03-23 2007-10-04 Hitachi Ltd 記憶システム及び記憶領域解放方法並びにストレージシステム
JP2007305013A (ja) * 2006-05-15 2007-11-22 Fujitsu Ltd Hsm制御プログラム、hsm制御装置、hsm制御方法
JP2008084053A (ja) * 2006-09-28 2008-04-10 Hitachi Ltd 仮想化システム及び領域割当て制御方法
JP2010186284A (ja) * 2009-02-12 2010-08-26 Hitachi Ltd ファイル入出力方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050138011A1 (en) * 2003-12-23 2005-06-23 Royer Robert J.Jr. Meta-data storage and access techniques
US7617321B2 (en) * 2004-05-07 2009-11-10 International Business Machines Corporation File system architecture requiring no direct access to user data from a metadata manager
US7444360B2 (en) * 2004-11-17 2008-10-28 International Business Machines Corporation Method, system, and program for storing and using metadata in multiple storage locations
TW200627277A (en) * 2005-01-24 2006-08-01 Lite On Technology Corp OS selection method and computer system utilizing same
US20060242380A1 (en) * 2005-04-20 2006-10-26 Anuja Korgaonkar Virtually unlimited storage
JP4704161B2 (ja) * 2005-09-13 2011-06-15 株式会社日立製作所 ファイルシステムの構築方法
JP4884041B2 (ja) * 2006-03-15 2012-02-22 株式会社日立製作所 自動拡張可能なボリュームに対して最適なi/oコマンドを発行するストレージシステム及びその制御方法
US8074020B2 (en) * 2008-02-13 2011-12-06 International Business Machines Corporation On-line volume coalesce operation to enable on-line storage subsystem volume consolidation
WO2012106923A1 (zh) * 2011-07-25 2012-08-16 华为技术有限公司 对象调整方法、迁移控制设备、节点设备及存储系统
US9069468B2 (en) 2011-09-11 2015-06-30 Microsoft Technology Licensing, Llc Pooled partition layout and representation
US9811456B2 (en) * 2014-11-26 2017-11-07 Advanced Micro Devices, Inc. Reliable wear-leveling for non-volatile memory and method therefor
CN109885551B (zh) * 2019-01-04 2024-03-12 平安科技(深圳)有限公司 电子装置、元数据处理方法和计算机可读存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5129088A (en) * 1987-11-30 1992-07-07 International Business Machines Corporation Data processing method to create virtual disks from non-contiguous groups of logically contiguous addressable blocks of direct access storage device
JP2773424B2 (ja) * 1990-11-20 1998-07-09 株式会社日立製作所 ネットワークシステムおよび接続コンピュータ切替え方法
US5619690A (en) * 1993-06-21 1997-04-08 Hitachi, Ltd. Computer system including a computer which requests an access to a logical address in a secondary storage system with specification of a local address in the secondary storage system
US5504858A (en) * 1993-06-29 1996-04-02 Digital Equipment Corporation Method and apparatus for preserving data integrity in a multiple disk raid organized storage system
US5710907A (en) * 1995-12-22 1998-01-20 Sun Microsystems, Inc. Hybrid NUMA COMA caching system and methods for selecting between the caching modes
US5884098A (en) * 1996-04-18 1999-03-16 Emc Corporation RAID controller system utilizing front end and back end caching systems including communication path connecting two caching systems and synchronizing allocation of blocks in caching systems
US5897661A (en) * 1997-02-25 1999-04-27 International Business Machines Corporation Logical volume manager and method having enhanced update capability with dynamic allocation of storage and minimal storage of metadata information
US6487547B1 (en) * 1999-01-29 2002-11-26 Oracle Corporation Database appliance comprising hardware and software bundle configured for specific database applications
US6438661B1 (en) * 1999-03-03 2002-08-20 International Business Machines Corporation Method, system, and program for managing meta data in a storage system and rebuilding lost meta data in cache
JP3763992B2 (ja) * 1999-03-30 2006-04-05 富士通株式会社 データ処理装置及び記録媒体
US6553511B1 (en) * 2000-05-17 2003-04-22 Lsi Logic Corporation Mass storage data integrity-assuring technique utilizing sequence and revision number metadata
US6606629B1 (en) * 2000-05-17 2003-08-12 Lsi Logic Corporation Data structures containing sequence and revision number metadata used in mass storage data integrity-assuring technique
US6834281B1 (en) * 2002-03-26 2004-12-21 Veritas Operating Corporation Method and apparatus to support multi-node direct access to file system data
US7032125B2 (en) * 2002-04-25 2006-04-18 Lsi Logic Corporation Method for loosely coupling metadata and data in a storage array
US7051155B2 (en) * 2002-08-05 2006-05-23 Sun Microsystems, Inc. Method and system for striping data to accommodate integrity metadata
US7010645B2 (en) * 2002-12-27 2006-03-07 International Business Machines Corporation System and method for sequentially staging received data to a write cache in advance of storing the received data

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257317A (ja) * 2006-03-23 2007-10-04 Hitachi Ltd 記憶システム及び記憶領域解放方法並びにストレージシステム
JP2007305013A (ja) * 2006-05-15 2007-11-22 Fujitsu Ltd Hsm制御プログラム、hsm制御装置、hsm制御方法
JP2008084053A (ja) * 2006-09-28 2008-04-10 Hitachi Ltd 仮想化システム及び領域割当て制御方法
US8356157B2 (en) 2006-09-28 2013-01-15 Hitachi, Ltd. Virtualization system and area allocation control method
JP2010186284A (ja) * 2009-02-12 2010-08-26 Hitachi Ltd ファイル入出力方法

Also Published As

Publication number Publication date
US20040172501A1 (en) 2004-09-02

Similar Documents

Publication Publication Date Title
EP3764237B1 (en) System startup method and apparatus, electronic device and storage medium
JP6708929B2 (ja) ストレージ制御装置、ストレージシステムおよびストレージ制御プログラム
JP4464378B2 (ja) 同一データを纏める事で格納領域を節約する計算機システム、ストレージシステム及びそれらの制御方法
US7689803B2 (en) System and method for communication using emulated LUN blocks in storage virtualization environments
JP4199993B2 (ja) スナップショット取得方法
US8239648B2 (en) Reclamation of thin provisioned disk storage
US8204858B2 (en) Snapshot reset method and apparatus
US20190339896A1 (en) System for migrating virtual tape volumes between filesystems
JP2004265110A (ja) メタデータ配置方法、プログラムおよびディスク装置
US20060047926A1 (en) Managing multiple snapshot copies of data
JP5207367B2 (ja) ストレージシステムの消費電力を削減する計算機システム及びその制御方法
US20060271754A1 (en) Storage system
US20070061540A1 (en) Data storage system using segmentable virtual volumes
JP2004110218A (ja) Dbms向け仮想ボリューム作成・管理方法
JP2010211681A (ja) ストレージ装置及び仮想化装置
JP2006268534A (ja) 記憶装置システムの制御技術
WO2011079787A1 (zh) 磁盘阵列的实现方法和数据读写方法及装置
JP2006268139A (ja) データ複製装置、方法及びプログラム並びに記憶システム
US8140886B2 (en) Apparatus, system, and method for virtual storage access method volume data set recovery
WO2018076633A1 (zh) 一种远程数据复制方法、存储设备及存储系统
JP6197816B2 (ja) ストレージシステム、ストレージの管理方法、及び、コンピュータ・プログラム
US8566541B2 (en) Storage system storing electronic modules applied to electronic objects common to several computers, and storage control method for the same
US20080005745A1 (en) Management server and server system
JP5355603B2 (ja) ディスクアレイ装置及び論理ボリュームアクセス方法
JP4390618B2 (ja) データベース再編成プログラム、データベース再編成方法、及びデータベース再編成装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090519