JP5817558B2 - 情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法 - Google Patents
情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法 Download PDFInfo
- Publication number
- JP5817558B2 JP5817558B2 JP2012015693A JP2012015693A JP5817558B2 JP 5817558 B2 JP5817558 B2 JP 5817558B2 JP 2012015693 A JP2012015693 A JP 2012015693A JP 2012015693 A JP2012015693 A JP 2012015693A JP 5817558 B2 JP5817558 B2 JP 5817558B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- node
- unit
- data
- page cache
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1021—Server selection for load balancing based on client or server locations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/288—Distributed intermediate devices, i.e. intermediate devices for interaction with other intermediate devices on the same level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/568—Storing data temporarily at an intermediate stage, e.g. caching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Description
図1は、実施例1に係る分散処理システムの全体構成例を示す図である。図1に示すように、分散処理システムは、複数のノードで構成されており、ここではノード10とノード20とノード30とを図示している。なお、各ノードは、ネットワーク等で接続されている。また、ノードの台数等は任意に設定することができる。実施例では、ファイルを例にして説明するが、これに限定されるものではなく、様々なデータ形式を対象とすることができる。
次に、分散処理システムを構成するマスターノードについて説明する。なお、図1の場合、名前管理を実行するノード30がマスターノードであるので、ここでは、マスターノード30として説明する。
次に、分散処理システムを構成するノードのうちマスターノード以外のノードについて説明する。ここで説明するノードは、図1のノード10やノード20である。ノード10とノード20とは同様の構成を有するので、ここでは、ノード10を例にして説明する。
次に、分散処理システムで実行される各種処理について説明する。ここでは、一例として、参照要求元のノードがノード10、マスターノードがノード30であるとする。なお、マスターノードであってもノード10と同様の処理を実行する。すなわち、ノード30も図4や図6のフローを実行する。
図4は、実施例1に係る要求元のノードが実行する処理の流れを示すフローチャートである。図4に示すように、ノード10でアプリケーションが実行されてファイルのアクセスが発生すると(S101)、分散処理部14は、マスターノードに対してファイルのアクセス要求を送信する(S102)。
図5は、実施例1に係るマスターノードが実行する処理の流れを示すフローチャートである。図5に示すように、ノード30の要求受信部36aが分散処理部34を介してアクセス要求を受信すると(S201肯定)、問合せ実行部36bは、各ノードに対して、該当ファイルがキャッシュされているか否かの問合せを実行する(S202)。
図6は、実施例1に係る各ノードが実行する処理の流れを示すフローチャートである。ここでは、ノード20を例にして説明する。なお、ノード20の各処理部の符号は、ノード10と同様とする。一例を挙げると、ノード20の分散処理部24などとする。
実施例1では、各ノードがローカルディスクを有する例を説明したが、これに限定されるものではなく、各ノードが共有ディスクに接続されていてもよい。図7は、共有ディスクを用いた場合の分散処理システムの全体構成例を示す図である。図7に示すように、各ノードは、実施例1と同様の構成を有している。実施例1とは、各ノードが接続されるディスクがローカルディスクではなくて、共有ディスク50である点が異なる。
実施例1では、各ノードが1台のサーバ等で構成される例を説明したが、これに限定されるものではない。例えば、複数のラックマウント型サーバで構成されていてもよく、複数のシステムボードを有する1台のサーバであってもよい。例えば、1ノードが、分散処理部34と名前管理部35と処理実行部38を有するラックマウント型サーバ、グローバルキャッシュ管理部36を有するラックマウント型サーバ、キャッシュ管理部37を有するラックマウント型サーバの3台で構成されてもよい。また、1ノードが、複数のシステムボードを有するサーバであり、各システムボードが1つの処理部を実行するようにしてもよい。また、ローカルディスクは、各ノードの内部であっても外部でもよい。
実施例1では、参照処理を例にして説明したが、これに限定されるものではなく、例えば書込み処理等においても同様に処理することができる。また、書込み処理や更新処理等は、分散処理フレームワークの使用上、ファイルを記憶するノードが処理を実行する場合がある。また、処理対象のファイルが複数のノードに分割されて格納されている場合、ファイルの一部を記憶する各ノードで処理が並列に実行される。そして、代表ノードが各処理を統合して要求元に応答する。なお、代表ノードの決定については、例えば予め指定しておく、要求元に最も近いノードとするなど、一般的な手法を用いることができる。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
ところで、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。
11 通信制御部
12 ページキャッシュ
13 制御部
14 分散処理部
15 キャッシュ管理部
15a 問合せ受信部
15b 判定部
15c 問合せ応答部
16 処理実行部
19 ローカルディスク
30 マスターノード
31 通信制御部
32 ページキャッシュ
33 制御部
34 分散処理部
35 名前管理部
36 グローバルキャッシュ管理部
36a 要求受信部
36b 問合せ実行部
36c 要求応答部
37 キャッシュ管理部
37a 問合せ受信部
37b 判定部
37c 問合せ応答部
38 処理実行部
39 ローカルディスク
Claims (6)
- 複数の情報処理装置が分散して処理を実行する分散処理システムにおける前記複数の情報処理装置のいずれかからデータのアクセス要求を受信する受信部と、
前記受信部によって前記データのアクセス要求が受信された場合に、オペレーティングシステムが管理するページキャッシュに前記データを記憶しているか否かの問合せを前記複数の情報処理装置各々に実行する問合せ実行部と、
前記問合せ実行部による問合せに対して、前記オペレーティングシステムが管理するページキャッシュに前記データを記憶すると応答した情報処理装置を特定する情報を、アクセス先として要求元の情報処理装置に応答する応答部と
を有することを特徴とする情報処理装置。 - 前記応答部は、前記オペレーティングシステムが管理するページキャッシュに前記データを記憶すると応答した情報処理装置が複数ある場合には、最も速く処理を開始できる情報処理装置を特定する情報を、前記要求元の情報処理装置に応答することを特徴とする請求項1に記載の情報処理装置。
- 前記複数の情報処理装置各々と、各情報処理装置がディスクに格納するデータを識別する情報とを対応付けて記憶する記憶部を有し、
前記応答部は、前記オペレーティングシステムが管理するページキャッシュに前記データを記憶すると応答した情報処理装置がない場合には、前記データを記憶する情報処理装置を前記記憶部から特定し、特定した情報処理装置を特定する情報を応答することを特徴とする請求項1に記載の情報処理装置。 - 複数の情報処理装置が分散して処理を実行する分散処理システムにおいて、
前記複数の情報処理装置のうちの第1の情報処理装置は、
他の情報処理装置からデータのアクセス要求を受信する要求受信部と、
前記要求受信部によって前記アクセス要求が受信された場合に、前記データをオペレーティングシステムが管理するページキャッシュに記憶しているか否かの問合せを前記複数の情報処理装置各々に実行する問合せ実行部と、
前記問合せ実行部による問合せに対して、前記データをオペレーティングシステムが管理するページキャッシュに記憶すると応答した情報処理装置を特定する情報を、アクセス要求元の情報処理装置に応答する要求応答部と、を有し、
前記複数の情報処理装置各々は、
前記第1の情報処理装置から、前記データをオペレーティングシステムが管理するページキャッシュに記憶しているか否かの問合せを受信する問合せ受信部と、
前記問合せ受信部によって前記問合せが受信された場合に、自装置のオペレーティングシステムが管理するページキャッシュを参照して、前記データをオペレーティングシステムが管理するページキャッシュに記憶しているか否かを判定する判定部と、
前記判定部によって判定された結果を、前記第1の情報処理装置に応答する結果応答部と
を有することを特徴とする分散処理システム。 - コンピュータに、
複数のコンピュータが分散して処理を実行する分散処理システムにおける前記複数のコンピュータのいずれかからデータのアクセス要求を受信し、
アクセス要求先のデータをオペレーティングシステムが管理するページキャッシュに記憶しているか否かの問合せを前記複数のコンピュータ各々に実行し、
前記問合せに対して前記データをオペレーティングシステムが管理するページキャッシュに記憶すると応答したコンピュータを特定する情報を、アクセス先として要求元のコンピュータに応答する
処理を実行させることを特徴とするキャッシュ管理プログラム。 - 複数の情報処理装置が分散して処理を実行する分散処理システムにおいて、
前記複数の情報処理装置のうちの第1の情報処理装置が、
他の情報処理装置からデータのアクセス要求を受信し、
アクセス要求先のデータをオペレーティングシステムが管理するページキャッシュに記憶しているか否かの問合せを前記複数の情報処理装置各々に実行し、
前記問合せに対して、前記データをオペレーティングシステムが管理するページキャッシュに記憶すると応答した情報処理装置を特定する情報を、前記参照要求元の情報処理装置に応答する処理を実行し、
前記複数の情報処理装置各々が、
前記第1の情報処理装置から、前記データをオペレーティングシステムが管理するページキャッシュに記憶しているか否かの問合せを受信し、
自装置のオペレーティングシステムが管理するページキャッシュを参照して、前記データをオペレーティングシステムが管理するページキャッシュに記憶しているか否かを判定し、
判定された結果を、前記第1の情報処理装置に応答する
処理を実行することを特徴とする分散処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012015693A JP5817558B2 (ja) | 2012-01-27 | 2012-01-27 | 情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法 |
EP12195821.9A EP2621143A1 (en) | 2012-01-27 | 2012-12-06 | Information processing apparatus, distributed processing system, and distributed processing method |
CN201210575905.2A CN103297490B (zh) | 2012-01-27 | 2012-12-26 | 信息处理装置、分布式处理系统和分布式处理方法 |
US13/740,302 US9483523B2 (en) | 2012-01-27 | 2013-01-14 | Information processing apparatus, distributed processing system, and distributed processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012015693A JP5817558B2 (ja) | 2012-01-27 | 2012-01-27 | 情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013156765A JP2013156765A (ja) | 2013-08-15 |
JP5817558B2 true JP5817558B2 (ja) | 2015-11-18 |
Family
ID=47520689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012015693A Active JP5817558B2 (ja) | 2012-01-27 | 2012-01-27 | 情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9483523B2 (ja) |
EP (1) | EP2621143A1 (ja) |
JP (1) | JP5817558B2 (ja) |
CN (1) | CN103297490B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014155553A1 (ja) | 2013-03-27 | 2014-10-02 | 富士通株式会社 | 分散処理のための情報処理方法、情報処理装置及びプログラム、並びに分散処理システム |
TW201508484A (zh) * | 2013-08-22 | 2015-03-01 | Acer Inc | 資料寫入方法、硬碟模組以及資料寫入系統 |
US10366102B2 (en) | 2014-02-19 | 2019-07-30 | Snowflake Inc. | Resource management systems and methods |
WO2016020977A1 (ja) | 2014-08-05 | 2016-02-11 | 株式会社日立製作所 | ストレージシステム、及びキャッシュ制御方法 |
CN105335513B (zh) * | 2015-10-30 | 2018-09-25 | 迈普通信技术股份有限公司 | 一种分布式文件系统及文件存储方法 |
JP7279450B2 (ja) * | 2019-03-22 | 2023-05-23 | 富士通株式会社 | 並列コンピュータシステム |
US11928336B2 (en) * | 2022-03-03 | 2024-03-12 | Samsung Electronics Co., Ltd. | Systems and methods for heterogeneous storage systems |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05143435A (ja) * | 1991-11-22 | 1993-06-11 | Fuji Xerox Co Ltd | データベースシステム |
JPH07182220A (ja) | 1993-12-21 | 1995-07-21 | Hitachi Ltd | 分散ファイルシステムおよびそのファイルキャッシング方法 |
US5935207A (en) * | 1996-06-03 | 1999-08-10 | Webtv Networks, Inc. | Method and apparatus for providing remote site administrators with user hits on mirrored web sites |
US5944780A (en) * | 1997-05-05 | 1999-08-31 | At&T Corp | Network with shared caching |
JPH1115718A (ja) | 1997-06-19 | 1999-01-22 | Sharp Corp | 分散ファイルシステムおよびその分散ファイルシステムで用いられるゲートウェイ計算機 |
US6115790A (en) * | 1997-08-29 | 2000-09-05 | Silicon Graphics, Inc. | System, method and computer program product for organizing page caches |
US6823048B2 (en) * | 2001-03-21 | 2004-11-23 | Qwest Communications International Inc. | Calling name information caching |
US7155571B2 (en) | 2002-09-30 | 2006-12-26 | International Business Machines Corporation | N-source in-kernel cache for high performance in computer operating systems |
JP2005004282A (ja) * | 2003-06-09 | 2005-01-06 | Nec Corp | ディスクアレイ装置、ディスクアレイ装置の管理方法及び管理プログラム |
US7209934B2 (en) * | 2003-11-21 | 2007-04-24 | Bellsouth Intellectual Property Corporation | Methods, systems and computer program products for monitoring files |
JP4300133B2 (ja) | 2004-02-20 | 2009-07-22 | 株式会社日立製作所 | クラスタメモリファイルシステム |
JP4404751B2 (ja) * | 2004-11-16 | 2010-01-27 | 富士通株式会社 | 情報処理システム,ストレージ装置,ストレージ制御プログラム,及びストレージ制御プログラムを記録したコンピュータ読取可能な記録媒体 |
US7953083B1 (en) * | 2006-12-12 | 2011-05-31 | Qurio Holdings, Inc. | Multicast query propagation scheme for a peer-to-peer (P2P) network |
CN101262362A (zh) * | 2007-03-09 | 2008-09-10 | 电子科技大学 | 一种利用激励实现的p2p网络资源搜索方法 |
JP2012133416A (ja) * | 2010-12-17 | 2012-07-12 | Toshiba Corp | メモリシステム |
US8849899B1 (en) * | 2011-01-30 | 2014-09-30 | Israel L'Heureux | Accelerated delivery of media content via peer caching |
JP5789660B2 (ja) * | 2011-05-30 | 2015-10-07 | 株式会社日立製作所 | 計算機システムの管理装置及び管理方法 |
-
2012
- 2012-01-27 JP JP2012015693A patent/JP5817558B2/ja active Active
- 2012-12-06 EP EP12195821.9A patent/EP2621143A1/en not_active Withdrawn
- 2012-12-26 CN CN201210575905.2A patent/CN103297490B/zh active Active
-
2013
- 2013-01-14 US US13/740,302 patent/US9483523B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US9483523B2 (en) | 2016-11-01 |
JP2013156765A (ja) | 2013-08-15 |
US20130198230A1 (en) | 2013-08-01 |
EP2621143A1 (en) | 2013-07-31 |
CN103297490B (zh) | 2017-04-19 |
CN103297490A (zh) | 2013-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5817558B2 (ja) | 情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法 | |
US11561930B2 (en) | Independent evictions from datastore accelerator fleet nodes | |
JP6607783B2 (ja) | 分散キャッシュクラスタ管理 | |
JP6542909B2 (ja) | ファイル操作方法及び装置 | |
WO2017050014A1 (zh) | 一种数据存储处理方法和装置 | |
US20150215405A1 (en) | Methods of managing and storing distributed files based on information-centric network | |
US20130290643A1 (en) | Using a cache in a disaggregated memory architecture | |
TW201220197A (en) | for improving the safety and reliability of data storage in a virtual machine based on cloud calculation and distributed storage environment | |
Chang et al. | Complete and fragmented replica selection and retrieval in Data Grids | |
Cassell et al. | Nessie: A decoupled, client-driven key-value store using RDMA | |
Xiong et al. | Metadata distribution and consistency techniques for large-scale cluster file systems | |
US11080207B2 (en) | Caching framework for big-data engines in the cloud | |
CN112948178A (zh) | 一种数据处理方法、装置、系统、设备及介质 | |
WO2015100674A1 (zh) | 数据迁移方法、装置和处理器 | |
JP7392168B2 (ja) | Cdnにおけるurlリフレッシュ方法、装置、機器及びcdnノード | |
Feng et al. | HQ-Tree: A distributed spatial index based on Hadoop | |
CA2976132A1 (en) | Method for accessing data visitor directory in multi-core system and device | |
CN117539915B (zh) | 一种数据处理方法及相关装置 | |
WO2015067004A1 (zh) | 一种并发访问请求的处理方法及装置 | |
CN101483668A (zh) | 热点数据的网络存储和访问方法、设备及系统 | |
JP2004272668A (ja) | 分散ファイルシステム | |
JP6189266B2 (ja) | データ処理装置、データ処理方法及びデータ処理プログラム | |
JP6607044B2 (ja) | サーバー装置、分散ファイルシステム、分散ファイルシステム制御方法、および、プログラム | |
JP7458610B2 (ja) | データベースシステム、及びクエリ実行方法 | |
Kuhn et al. | Dynamic file system semantics to enable metadata optimizations in PVFS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5817558 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |