Nothing Special   »   [go: up one dir, main page]

JP2019144785A - 監視プログラム、監視装置及び監視方法 - Google Patents

監視プログラム、監視装置及び監視方法 Download PDF

Info

Publication number
JP2019144785A
JP2019144785A JP2018027525A JP2018027525A JP2019144785A JP 2019144785 A JP2019144785 A JP 2019144785A JP 2018027525 A JP2018027525 A JP 2018027525A JP 2018027525 A JP2018027525 A JP 2018027525A JP 2019144785 A JP2019144785 A JP 2019144785A
Authority
JP
Japan
Prior art keywords
monitoring
information
abnormality
virtual machine
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018027525A
Other languages
English (en)
Inventor
陽一郎 井浦
Yoichiro Iura
陽一郎 井浦
敏 伊與田
Satoshi Iyoda
敏 伊與田
栄介 道場
Eisuke Michiba
栄介 道場
隆弘 小島
Takahiro Kojima
隆弘 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018027525A priority Critical patent/JP2019144785A/ja
Publication of JP2019144785A publication Critical patent/JP2019144785A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】監視対象において発生した異常に起因する影響を特定する監視プログラム、監視装置及び監視方法を提供する。【解決手段】仮想化ソフトウェア上に、仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、所定間隔において監視用の仮想マシンによって実行された所定のテストの結果を取得し、取得したテストの結果から監視用の仮想マシンの異常有無を判定し、監視用の仮想マシンが異常である場合、複数の監視対象の所定の状態を取得し、監視用の仮想マシンの異常有無の判定結果と、複数の監視対象の所定の状態とを出力する。【選択図】図5

Description

本発明は、監視プログラム、監視装置及び監視方法に関する。
利用者に対してサービスを提供する事業者(以下、サービス事業者とも呼ぶ)は、例えば、サービスの提供を実現するために業務システム(以下、情報処理システムとも呼ぶ)を構築する。具体的に、サービス事業者は、例えば、クラウドコンピューティングサービスを提供する事業者(以下、クラウド事業者とも呼ぶ)から仮想マシン等のリソース(以下、単に仮想マシンとも呼ぶ)を借り受け、サービスの提供を実現する業務システムの構築を行う。
この場合、クラウド事業者は、サービス事業者に対して貸し出した仮想マシンを動作させるハイパーバイザ等(以下、単に監視対象とも呼ぶ)の監視を行う。これにより、クラウド事業者は、例えば、監視対象において発生した異常(障害)によって仮想マシンに影響が及ぶことを防止することが可能になる(例えば、特許文献1及び2参照)。
国際公開第2017/134758号 国際公開第2013/190649号
ここで、上記のようなクラウド事業者は、一般的に、サービス事業者に貸し出した仮想マシンに対して自由にアクセスを行うことができず、仮想マシンに関する情報(例えば、仮想マシンの動作状態を示す情報)を取得することができない。
そのため、クラウド事業者は、例えば、監視対象において発生した異常を検知した場合であっても、その異常が仮想マシンに与える影響を特定することができない。また、クラウド事業者は、例えば、監視対象において発生した異常を検知できなかった場合、その異常が仮想マシンに影響を与えている場合であっても、これを検知することができない。
そこで、一つの側面では、本発明は、監視対象において発生した異常に起因する影響を特定する監視プログラム、監視装置及び監視方法を提供することを目的とする。
実施の形態の一態様では、仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、取得した前記結果から前記仮想マシンの異常有無を判定し、前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、処理をコンピュータに実行させる。
一つの側面によれば、監視対象において発生した異常に起因する影響を特定することを可能とする。
図1は、情報処理システム10の構成を示す図である。 図2は、監視装置1のハードウエア構成を示す図である。 図3は、監視装置1の機能のブロック図である。 図4は、第1の実施の形態における監視処理の概略を説明するフローチャート図である。 図5は、第1の実施の形態における監視処理の概略を説明するフローチャート図である。 図6は、第1の実施の形態における監視処理の概略を説明する図である。 図7は、第1の実施の形態における監視処理の概略を説明する図である。 図8は、第1の実施の形態における監視処理の概略を説明する図である。 図9は、第1の実施の形態における監視処理の詳細を説明するフローチャート図である。 図10は、第1の実施の形態における監視処理の詳細を説明するフローチャート図である。 図11は、第1の実施の形態における監視処理の詳細を説明するフローチャート図である。 図12は、第1の実施の形態における監視処理の詳細を説明するフローチャート図である。 図13は、対応情報132の具体例について説明する図である。 図14は、テスト結果情報131及び状態情報133の具体例について説明する図である。 図15は、テスト結果情報131及び状態情報133の具体例について説明する図である。 図16は、対応情報132の具体例について説明する図である。 図17は、テスト結果情報131及び状態情報133の具体例について説明する図である。 図18は、テスト結果情報131及び状態情報133の具体例について説明する図である。 図19は、対応情報132の具体例について説明する図である。 図20は、テスト結果情報131及び状態情報133の具体例について説明する図である。 図21は、通知情報134の具体例について説明する図である。 図22は、第2の実施の形態における監視処理を説明するフローチャート図である。 図23は、第2の実施の形態における監視処理を説明するフローチャート図である。 図24は、第2の実施の形態における監視処理を説明するフローチャート図である。 図25は、第2の実施の形態における監視処理を説明するフローチャート図である。 図26は、第2の実施の形態における対応情報132の具体例を説明する図である。 図27は、第2の実施の形態におけるAPI結果情報135及び状態情報133の具体例について説明する図である。 図28は、第2の実施の形態におけるAPI結果情報135及び状態情報133の具体例について説明する図である。 図29は、第2の実施の形態における通知情報134を説明する図である。
[情報処理システムの構成]
図1は、情報処理システム10の構成を示す図である。図1に示す情報処理システム10は、例えば、監視装置1と、監視者端末1aと、物理マシン2と、ストレージ装置3と、APIサーバ4と、ネットワーク機器5とを有する。
監視装置1及び物理マシン2は、例えば、それぞれ1台以上の物理マシンから構成される。各物理マシンは、CPU(Central Computing Unit)、メモリ(DRAM:Dynamic Random Access Memory)及びハードディスク(HDD:Hard Disk Drive)等の物理リソースを有する。
物理マシン2で動作するハイパーバイザ2c(以下、仮想化ソフトウェア2cとも呼ぶ)は、物理マシン2やストレージ装置3の物理リソースを割り当てることによって、1台以上の仮想マシンを生成する。具体的に、ハイパーバイザ2cは、この場合、サービス事業者に対して貸し出す仮想マシン(以下、利用者VM2aとも呼ぶ)を生成する。
APIサーバ4は、例えば、サービス事業者が利用者端末(図示しない)に対して新たな利用者VM2aの生成や生成済の利用者VM2aの削除等を行う旨の入力を行った場合、物理マシン2等の物理リソースの管理を行うコントローラ(図示しない)に対し、新たな利用者VM2aの生成や生成済の利用者VM2aの削除等を行う旨の指示を行う。そして、コントローラは、この場合、ハイパーバイザ2cに対して、新たな利用者VM2aの生成や生成済の利用者VM2aの削除等を行う旨の指示を行う。
ネットワーク機器5は、例えば、監視装置1や物理マシン2等の各装置を接続する物理スイッチである。
監視装置1は、例えば、物理マシン2において動作するハイパーバイザ2c、ストレージ装置3、APIサーバ4及びネットワーク機器5の監視を行う。そして、クラウド事業者は、監視者端末1aを介して監視装置1による監視結果の閲覧等を行う。
これにより、クラウド事業者は、例えば、ハイパーバイザ2cやストレージ装置3等の監視対象において発生した異常によって、サービス事業者に貸し出しているリソースである利用者VM2aの動作状態に影響が及ぶことを防止することが可能になる。
ここで、上記のような監視装置1は、一般的に、サービス事業者に貸し出した利用者VM2aに対して自由にアクセスを行うことができず、利用者VM2aに関する情報(例えば、利用者VM2aの動作状態を示す情報)を取得することができない。
そのため、クラウド事業者は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合であっても、その異常が利用者VM2aに与える影響を特定することができない。また、クラウド事業者は、例えば、ハイパーバイザ2cにおいて発生した異常を検知できなかった場合、その異常が利用者VM2aに影響を与えている場合であっても、これを検知することができない。
そこで、本実施の形態における監視装置1は、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用の仮想マシン(以下、監視用VMとも呼ぶ)を配置する。
そして、監視装置1は、所定間隔において、監視用VM2cによって実行された所定のテストの結果を取得し、取得した結果から監視用VM2cの異常有無を判定する。その結果、監視用VM2cが異常であると判定した場合、監視装置1は、複数の監視対象の所定の状態を取得し、監視用VM2cの異常有無の判定結果と、複数の監視対象の所定の状態とを出力する。
すなわち、本実施の形態における監視装置1は、例えば、監視装置1が情報を取得することができない利用者VM2aが動作するハイパーバイザ2c上に、監視装置1が情報を取得することができる仮想マシンである監視用VMを配置する。そして、監視装置1は、監視用VMから取得した動作状態を、利用者VM2aにおける現在の動作状態として推定する。
これにより、監視装置1は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合、監視用VMから取得した動作状態を参照することによって、発生した異常が利用者VM2aに与えている影響度合いを推定することが可能になる。また、監視装置1は、例えば、監視用VMから取得した動作状態を参照することによって、ハイパーバイザ2cにおいて検知できなかった異常(ハイパーバイザ2cに起因する異常)についても検知することが可能になる。
[情報処理システムのハードウエア構成]
次に、情報処理システム10のハードウエア構成について説明する。図2は、監視装置1のハードウエア構成を示す図である。
監視装置1は、図2に示すように、プロセッサであるCPU101と、メモリ102と、外部インターフェース(以下、I/Oユニットとも呼ぶ)103と、記憶媒体104とを有する。各部は、バス105を介して互いに接続される。
記憶媒体104は、例えば、記憶媒体104内のプログラム格納領域(図示しない)に、監視対象の監視を行う処理(以下、監視処理とも呼ぶ)を行うためのプログラム110を記憶する。記憶媒体104は、例えば、HDDであってよい。
また、記憶媒体104は、例えば、監視処理を行う際に用いられる情報を記憶する記憶部130(以下、情報格納領域130とも呼ぶ)を有する。
CPU101は、記憶媒体104からメモリ102にロードされたプログラム110を実行して監視処理を行う。
外部インターフェース103は、例えば、ネットワーク(図示しない)を介して物理マシン2、ストレージ装置3、APIサーバ4及びネットワーク機器5と通信を行う。
[監視装置の機能]
次に、監視装置1の機能について説明する。図3は、監視装置1の機能のブロック図である。
監視装置1は、CPU101やメモリ102等のハードウエアとプログラム110とが有機的に協働することにより、図3に示すように、仮想マシン配置部111と、テスト結果取得部112と、異常有無判定部113と、状態取得部114と、実行指示部115と、結果出力部116とを含む各種機能を実現する。
また、監視装置1は、図3に示すように、テスト結果情報131と、対応情報132と、状態情報133と、通知情報134と、API結果情報135とを情報格納領域130に記憶する。
仮想マシン配置部111は、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VMを配置する。具体的に、仮想マシン配置部111は、例えば、ハイパーバイザ2cに対し、利用者VM2aと同様の処理を行うことが可能な監視用VMの配置を指示する。
テスト結果取得部112は、所定間隔において監視用VMによって実行された所定のテスト結果を示すテスト結果情報131を取得する。所定のテストは、クラウド事業者によって予め定められた各種テストであり、例えば、監視用VMのCPUがメモリやディスクに対して行うアクセス速度が所定の閾値以上であるか否かを判定するテストである。
異常有無判定部113は、テスト結果取得部112が取得したテストの結果から、監視用VMにおいて異常が発生しているか否かの判定を行う。
状態取得部114は、異常有無判定部113が監視用VMにおいて異常が発生していると判定した場合、複数の監視対象(例えば、図1で説明したストレージ装置3やAPIサーバ4)の所定の状態を示す状態情報133を取得する。所定の状態は、例えば、各監視対象が行う通常処理を正常に実行しているか否かを示す情報を含む。
実行指示部115は、APIサーバ4に対して所定の処理を指示する。所定の処理は、例えば、物理マシン2における新たな利用者VM2aの生成や生成済の利用者VM2aの削除である。そして、状態取得部114は、この場合、例えば、実行指示部115が指示した所定の処理の実行結果を示すAPI結果情報135を、APIサーバ4の状態を示す情報として取得する。
結果出力部116は、例えば、異常有無判定部113における監視用VMの異常有無の判定結果と、状態取得部114が取得した状態情報133やAPI結果情報135とを含む通知情報134を出力する。具体的に、結果出力部116は、例えば、監視者端末1aの出力装置(図示しない)に対して通知情報134の出力を行う。対応情報132についての説明は後述する。
[第1の実施の形態の概略]
次に、第1の実施の形態の概略について説明する。図4及び図5は、第1の実施の形態における監視処理の概略を説明するフローチャート図である。図6から図8は、第1の実施の形態における監視処理の概略を説明する図である。図6から図8を参照しながら、図4及び図5の監視処理の詳細を説明する。なお、図6から図8では、図1で説明したネットワーク機器5についての記載及び説明を省略する。
監視装置1は、図4に示すように、仮想マシン配置タイミングまで待機する(S1のNO)。仮想マシン配置タイミングは、例えば、クラウド事業者が監視者端末1aに対して利用者VM2aの監視を開始する旨の入力を行ったタイミングであってよい。
そして、仮想マシン配置タイミングになった場合(S1のYES)、監視装置1は、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置する(S2)。
具体的に、監視装置1は、例えば、図6に示すように、利用者VM2aが配置されたハイパーバイザ2c上に、利用者VM2a等を監視するための監視用VM2bを配置する。
その後、監視装置1は、図5に示すように、異常判定タイミングになるまで待機する(S11のNO)。異常判定タイミングは、例えば、クラウド事業者によって予め定められた所定間隔ごとのタイミングであってよい。
そして、異常判定タイミングになった場合(S11のYES)、監視装置1は、監視用の仮想マシンによって実行された所定のテストの結果を取得する(S12)。さらに、監視装置1は、S12の処理で取得した結果から監視用の仮想マシンの異常有無を判定する(S13)。
具体的に、監視装置1は、例えば、図7に示すように、監視用VM2bから所定のテストの結果(例えば、テスト結果情報131)を取得し、取得した結果から監視用VM2bの異常有無を判定する。
その結果、監視用の仮想マシンに異常があると判定した場合(S14のYES)、監視装置1は、複数の監視対象の所定の状態を取得する(S15)。その後、監視装置1は、S13の処理における監視用の仮想マシンの異常有無についての判定結果と、S15の処理で取得した複数の監視対象の所定の状態とを出力する(S16)。
具体的に、監視装置1は、例えば、図8に示すように、監視対象に含まれるストレージ装置3やAPIサーバ4からそれぞれ状態(例えば、状態情報133)を取得する。そして、監視装置1は、例えば、監視用VM2bが異常であったか否かを示す情報と、ストレージ装置3やAPIサーバ4等の状態を示す情報とを監視者端末1aに出力する。
一方、監視用の仮想マシンに異常がないと判定した場合(S14のNO)、監視装置1は、S15及びS16の処理を行わない。
すなわち、本実施の形態における監視装置1は、例えば、監視装置1が情報を取得することができない利用者VM2aが動作するハイパーバイザ2c上に、監視装置1が情報を取得することができる監視用VM2bを配置する。そして、監視装置1は、監視用VM2bから取得した動作状態を、利用者VM2aにおける現在の動作状態として推定する。
これにより、監視装置1は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合、監視用VM2bから取得した動作状態を参照することによって、発生した異常が利用者VM2aに与えている影響度合いを推定することが可能になる。また、監視装置1は、例えば、監視用2bVMから取得した動作状態を参照することによって、ハイパーバイザ2cにおいて検知できなかった異常(ハイパーバイザ2cに起因する異常)についても検知することが可能になる。
そのため、監視装置1は、利用者VM2aに対して直接アクセスを行うことができず、利用者VM2aの動作状態を示す情報を取得することができない場合であっても、クラウド事業者の監視対象における異常に起因するサービス事業者のリソースへの影響度合いを特定することが可能になる。したがって、クラウド事業者は、例えば、クラウド事業者の監視対象において異常が発生した場合、サービス事業者のリソースにおける実際の影響度合いに応じた対処を行うことが可能になる。
[第1の実施の形態の詳細]
次に、第1の実施の形態の詳細について説明する。図9から図12は、第1の実施の形態における監視処理の詳細を説明するフローチャート図である。また、図13から図21は、第1の実施の形態における監視処理の詳細を説明する図である。図13から図21を参照しながら、図9から図12の監視処理の詳細を説明する。なお、以下、利用者VM2aの監視を行う監視用の仮想マシンが監視用VM2bであるものとして説明を行う。
[監視用VMを配置する処理]
初めに、監視処理のうち、監視用VM2bを配置する処理について説明を行う。
監視装置1の仮想マシン配置部111は、図9に示すように、仮想マシン配置タイミングまで待機する(S21のNO)。そして、仮想マシン配置タイミングになった場合(S21のYES)、仮想マシン配置部111は、1以上のハイパーバイザ2c上に、各ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bをそれぞれ配置する(S22)。
具体的に、仮想マシン配置部111は、例えば、情報格納領域130に記憶された情報のうち、各利用者VM2aが配置されているハイパーバイザ2cを示す情報(図示しない)を参照し、各利用者VM2aが配置されている1以上のハイパーバイザ2cをそれぞれ特定する。そして、仮想マシン配置部111は、特定したハイパーバイザ2cのそれぞれに対し、監視用VM2bの配置を指示する。
その後、仮想マシン配置部111は、S22の処理で配置した監視用VM2bと、各監視用VM2bが配置されたハイパーバイザ2cとを対応付けた対応情報132を生成する(S23)。そして、仮想マシン配置部111は、生成した対応情報132を情報格納領域130に記憶する。以下、S23の処理で生成された対応情報132の具体例について説明を行う。
[対応情報の具体例(1)]
図13は、対応情報132の具体例について説明する図である。
図13に示す対応情報132(以下、対応情報132aとも呼ぶ)は、各情報を識別する「項番」と、各ハイパーバイザ2cを識別する「HVID」と、各監視用VM2bを識別する「監視用VMID」とを項目として有する。
具体的に、図13に示す対応情報132aにおいて、「項番」が「1」である情報には、「HVID」として「001」が設定されており、「監視用VMID」として「xxx」が設定されている。また、図13に示す対応情報132aにおいて、「項番」が「2」である情報には、「HVID」として「002」が設定されており、「監視用VMID」として「yyy」が設定されている。図13に含まれる他の情報については説明を省略する。
[監視用VMにおいて異常が検知された場合の処理]
次に、監視処理のうち、監視用VM2bにおいて異常が検知された場合の処理について説明を行う。
監視装置1のテスト結果取得部112は、図10に示すように、異常判定タイミングになるまで待機する(S31のNO)。そして、異常判定タイミングになった場合(S31のYES)、テスト結果取得部112は、各監視用VM2bに対して予め実行を指示した所定のテストの結果を示すテスト結果情報131を各監視用VM2bから取得する(S32)。その後、テスト結果取得部112は、各監視用VM2bから取得したテスト結果情報131を情報格納領域130に記憶する。以下、S32の処理で取得したテスト結果情報131の具体例について説明を行う。
[テスト結果情報の具体例(1)]
図14は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図14(A)は、テスト結果情報131の具体例について説明する図である。
図14(A)に示すテスト結果情報131(以下、テスト結果情報131a1とも呼ぶ)は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、各監視用VM2bに実行を指示した所定のテストの結果が設定される「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」とを項目として有する。「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」には、テスト結果が正常であったことを示す「OK」、テスト結果が異常であったことを示す「NG」、または、テスト結果を取得することができなかったことを示す「未取得」のいずれかが設定される。
具体的に、図14(A)に示すテスト結果情報131a1において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「テスト結果(第1テスト)」として「OK」が設定され、「テスト結果(第2テスト)」として「OK」が設定されている。すなわち、図14(A)に示すテスト結果情報131a1は、「監視用VMID」が「xxx」である監視用VM2bが正常であったことを示す情報を含んでいる。
一方、図14(A)に示すテスト結果情報131a1において、「項番」が「2」である情報には、「監視用VMID」として「yyy」が設定され、「テスト結果(第1テスト)」として「OK」が設定され、「テスト結果(第2テスト)」として「NG」が設定されている。すなわち、図14(A)に示すテスト結果情報131a1は、「監視用VMID」が「xxx」である監視用VM2bが異常であったことを示す情報を含んでいる。図14に示すテスト結果情報131a1に含まれる他の情報についての説明は省略する。
図10に戻り、監視装置1の異常有無判定部113は、情報格納領域130に記憶されたテスト結果情報131を参照し、異常がある監視用VM2bが存在するか否かを判定する(S33)。
具体的に、異常有無判定部113は、例えば、情報格納領域130に記憶されたテスト結果情報131(S32の処理において取得したテスト結果情報131)を参照し、「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」のいずれかに「NG」または「未取得」が設定されている情報が存在するか否かを判定する。そして、異常有無判定部113は、「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」のいずれかに「NG」または「未取得」が設定されている情報が存在しないと判定した場合、全ての監視用VM2bが正常であると判定する。また、異常有無判定部113は、「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」のいずれかに「NG」または「未取得」が設定されている情報が存在すると判定した場合、存在すると判定した情報に対応する監視用VM2bが異常であると判定する。
その結果、異常があると判定された監視用VM2bが存在しないと判定した場合(S34のNO)、テスト結果取得部112は、S31以降の処理を再度行う。
一方、異常があると判定された監視用VM2bが存在すると判定した場合(S34のYES)、監視装置1の状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S34の処理で異常があると判定した監視用VM2bに対応する監視対象を特定する(S35)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S35)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、S35の処理で取得された状態情報133の具体例について説明を行う。
[状態情報の具体例(1)]
図14(B)は、状態情報133の具体例について説明する図である。
図14(B)に示す状態情報133(以下、状態情報133a1とも呼ぶ)は、各情報を識別する「項番」と、各ハイパーバイザ2cを識別する「HVID」と、各ハイパーバイザ2cの状態を示す「状態」とを項目として有している。「状態」には、ハイパーバイザ2cの状態が正常であったことを示す「OK」、ハイパーバイザ2cの状態が異常であったことを示す「NG」、または、ハイパーバイザ2cから情報を取得できなかったことを示す「未取得」のいずれかが設定される。
具体的に、図14(B)に示す状態情報133a1において、「項番」が「1」である情報には、「HVID」として「002」が設定され、「状態」として「OK」が設定されている。
すなわち、図14(A)で説明したテスト結果情報131a1において、「項番」が「2」である情報(「監視用VMID」が「yyy」である情報)の「テスト結果(第2テスト)」には、「NG」が設定されている。そして、図13で説明した対応情報132aにおいて、「監視用VMID」に「yyy」が設定された情報の「HVID」には、「002」が設定されている。そのため、状態取得部114は、S35の処理において、「HVID」が「002」であるハイパーバイザ2cにアクセスし、図14(B)に示す状態情報133a1に含まれる情報を取得する。
その後、監視装置1の結果出力部115は、S34の処理に監視用VM2bの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とを出力する(S36)。
具体的に、結果出力部115は、例えば、S34の処理に監視用VM2bの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。通知情報134の具体例については後述する。
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知が行われたか否かに依らず、監視用VM2bにおいて異常が検知された場合、その異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の検知漏れを防止することが可能になる。
また、監視装置1は、監視用VM2bにおいて検知された異常の内容だけでなく、異常が検知された監視用VM2bに関連する監視対象の情報についても出力することにより、検知された異常の原因究明を行うために必要な情報を迅速に出力することが可能になる。
[クラウド事業者の監視対象において異常が検知された場合の処理]
次に、監視処理のうち、クラウド事業者の監視対象において異常が検知された場合の処理について説明を行う。
状態取得部114は、図11に示すように、異常判定タイミングまで待機する(S41のNO)。図11に示す異常判定タイミングは、例えば、図10において説明した異常判定タイミングと同じタイミングであってよい。
そして、異常判定タイミングになった場合(S41のYES)、状態取得部114は、1以上の監視対象のそれぞれの状態を示す状態情報133を取得する(S42)。その後、状態取得部114は、各監視対象から取得した状態情報133を情報格納領域130に記憶する。以下、S42の処理で取得された状態情報133の具体例について説明を行う。
[状態情報の具体例(2)]
図15は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図15(B)は、状態情報133の具体例について説明する図である。
図15(B)に示す状態情報133(以下、状態情報133a2とも呼ぶ)において、「項番」が「1」である情報には、「HVID」として「001」が設定され、「状態」として「OK」が設定されている。また、図15(B)に示す状態情報133a2において、「項番」が「3」である情報には、「HVID」として「003」が設定され、「状態」として「NG」が設定されている。図15(B)に含まれる他の情報についての説明は省略する。
図11に戻り、異常有無判定部113は、情報格納領域130に記憶された状態情報133を参照し、異常がある監視対象が存在するか否かを判定する(S43)。
具体的に、異常有無判定部113は、例えば、情報格納領域130に記憶された状態情報133(S42の処理において取得した状態情報133)を参照し、「状態」に「NG」または「未取得」が設定されている情報が存在するか否かを判定する。そして、異常有無判定部113は、「状態」に「NG」または「未取得」が設定されている情報が存在しないと判定した場合、全ての監視対象が正常であると判定する。また、異常有無判定部113は、「状態」のいずれかに「NG」または「未取得」が設定されている情報が存在すると判定した場合、存在すると判定した情報に対応する監視対象が異常であると判定する。
その結果、異常があると判定された監視対象が存在しないと判定した場合(S44のNO)、状態取得部114は、S41以降の処理を再度行う。
一方、異常があると判定された監視対象が存在すると判定した場合(S44のYES)、テスト結果取得部112は、情報格納領域130に記憶された対応情報132を参照し、S44の処理で異常があると判定した監視対象に対応する監視用VM2bを特定する(S45)。そして、テスト結果取得部112は、特定した監視用VM2bのテスト結果情報131を取得する(S45)。以下、S45の処理で取得されたテスト結果情報131の具体例について説明を行う。
[テスト結果情報の具体例(2)]
図15(A)は、テスト結果情報131の具体例について説明する図である。
図15(A)に示すテスト結果情報131(以下、テスト結果情報131a2とも呼ぶ)において、「項番」が「1」である情報には、「監視用VMID」として「zzz」が設定され、「テスト結果(第1テスト)」として「OK」が設定され、「テスト結果(第2テスト)」として「OK」が設定されている。
すなわち、図15(B)で説明した状態情報133a2において、「項番」が「3」である情報(「HVID」が「003」である情報)の「状態」には、「NG」が設定されている。そして、図13で説明した対応情報132aにおいて、「HVID」に「003」が設定された情報の「監視用VMID」には、「zzz」が設定されている。そのため、テスト結果取得部112は、S45の処理において、「監視用VMID」が「zzz」である監視用VM2bにアクセスし、図15(A)に示すテスト結果情報131a2に含まれる情報を取得する。
図12に戻り、異常有無判定部113は、情報格納領域130に記憶されたテスト結果情報131を参照し、S45の処理でテスト結果情報131を取得した監視用VM2bに、異常がある監視用VM2bが存在するか否かを判定する(S51)。
その結果、異常があると判定された監視用VM2bが存在すると判定した場合(S51のYES)、結果出力部115は、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第1異常(例えば、緊急度が「高」である異常)であることを示す情報とを出力する(S52)。
具体的に、結果出力部115は、例えば、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第1異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
一方、異常があると判定された監視用VM2bが存在しないと判定した場合(S51のNO)、結果出力部115は、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第2異常(例えば、緊急度が「低」である異常)であることを示す情報とを出力する(S53)。
具体的に、結果出力部115は、例えば、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第2異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知された場合、監視用VM2bにおける異常の発生状況を考慮した上で、検知した異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の度合いに応じた情報を出力することが可能になる。したがって、クラウド事業者は、監視装置1によって出力された情報を参照することによって、サービス事業者のリソースに対する影響の度合いに応じた対処を行うことが可能になる。
[第1の実施の形態における他の具体例(1)]
次に、第1の実施の形態における他の具体例について説明を行う。図16から図18は、第1の実施の形態における他の具体例について説明する図である。
仮想マシン配置部111は、図9に示すように、仮想マシン配置タイミングになった場合(S21のYES)、1以上のハイパーバイザ2c上に、各ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bをそれぞれ配置する(S22)。
具体的に、仮想マシン配置部111は、各利用者VM2aが配置されているハイパーバイザ2cをそれぞれ特定する。そして、仮想マシン配置部111は、特定したハイパーバイザ2cのそれぞれにおいて監視用VM2bの配置を行う。また、仮想マシン配置部111は、この場合、例えば、図1等で説明したストレージ装置3において、監視用VM2bのそれぞれに対応する監視用ボリュームを確保する。
そして、仮想マシン配置部111は、S22の処理で配置した監視用VM2bと、各監視用VM2bが配置されたハイパーバイザ2cとを対応付けた対応情報132を生成する(S23)。その後、仮想マシン配置部111は、生成した対応情報132を情報格納領域130に記憶する。以下、S23の処理で生成された対応情報132の具体例について説明を行う。
[対応情報の具体例(2)]
図16は、対応情報132の具体例について説明する図である。具体的に、図16(A)は、ストレージ装置3と監視用ボリュームとの対応を示す対応情報132(以下、対応情報132b1とも呼ぶ)を説明する図である。また、図16(B)は、監視用VM2bと監視用ボリュームとの対応を示す対応情報132(以下、対応情報132b2とも呼ぶ)を説明する図である。
図16(A)に示す対応情報132b1は、各情報を識別する「項番」と、各ストレージ装置3を識別する「ストレージID」と、各監視用ボリュームを識別する「監視用ボリュームID」とを項目として有する。
具体的に、図16(A)に示す対応情報132b1において、「項番」が「1」である情報には、「ストレージID」として「011」が設定されており、「監視用ボリュームID」として「vol_xxx」が設定されている。また、図16(A)に示す対応情報132b1において、「項番」が「2」である情報には、「ストレージID」として「012」が設定されており、「監視用ボリュームID」として「vol_yyy」が設定されている。図16(A)に含まれる他の情報については説明を省略する。
一方、図16(B)に示す対応情報132b2は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、各監視用ボリュームを識別する「監視用ボリュームID」とを項目として有する。
具体的に、図16(B)に示す対応情報132b2において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定されており、「監視用ボリュームID」として「vol_xxx」が設定されている。また、図16(B)に示す対応情報132b2において、「項番」が「2」である情報には、「監視用VMID」として「yyy」が設定されており、「監視用ボリュームID」として「vol_yyy」が設定されている。図16(B)に含まれる他の情報については説明を省略する。
続いて、テスト結果取得部112は、図10に示すように、異常判定タイミングになった場合(S31のYES)、各監視用VM2bに対して予め実行を指示した所定のテストの結果を示すテスト結果情報131を各監視用VM2bや各監視用ボリュームから取得する(S32)。具体的に、テスト結果取得部112は、この場合、例えば、各監視用VM2bが各監視用ボリュームに対してアクセスを行う際のアクセス速度が所定の閾値以上であるか否かを判定するテストの結果を取得する。そして、テスト結果取得部112は、各監視用VM2bや監視用ボリュームから取得したテスト結果情報131を情報格納領域130に記憶する。以下、S32の処理で取得されたテスト結果情報131の具体例について説明を行う。
[テスト結果情報の具体例(3)]
図17は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図17(A)は、テスト結果情報131の具体例について説明する図である。
図17(A)に示すテスト結果情報131(以下、テスト結果情報131b1とも呼ぶ)は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、各監視用ボリュームを識別する「監視用ボリュームID」と、監視用VM2bに実行を指示したテストの結果が設定される「テスト結果(第3テスト)」及び「テスト結果(第4テスト)」とを項目として有する。
具体的に、図17(A)に示すテスト結果情報131b1において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「監視用ボリュームID」として「vol_xxx」が設定され、「テスト結果(第3テスト)」として「OK」が設定され、「テスト結果(第4テスト)」として「OK」が設定されている。すなわち、図17(A)に示すテスト結果情報131b1は、「監視用VMID」が「xxx」である監視用VM2b及び「監視用ボリュームID」が「vol_xxx」である監視用ボリュームが正常であったことを示す情報を含んでいる。
一方、図17(A)に示すテスト結果情報131b1において、「項番」が「2」である情報には、「監視用VMID」として「yyy」が設定され、「監視用ボリュームID」として「vol_yyy」が設定され、「テスト結果(第3テスト)」として「OK」が設定され、「テスト結果(第4テスト)」として「NG」が設定されている。すなわち、図17(A)に示すテスト結果情報131b1は、「監視用VMID」が「yyy」である監視用VM2b及び「監視用ボリュームID」が「vol_yyy」である監視用ボリュームのうちの少なくともいずれかが異常であったことを示す情報を含んでいる。図17(A)に示すテスト結果情報131b1に含まれる他の情報についての説明は省略する。
図10に戻り、異常有無判定部113は、情報格納領域130に記憶されたテスト結果情報131(S32の処理で取得したテスト結果情報131)を参照し、異常がある監視用VM2bや監視用ボリュームが存在するか否かを判定する(S33)。
その結果、異常があると判定された監視用VM2bや監視用ボリュームが存在する場合(S34のYES)、状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S34の処理で異常があると判定した監視用VM2bや監視用ボリュームに対応する監視対象を特定する(S35)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S35)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、S35の処理で取得された状態情報133の具体例について説明を行う。
[状態情報の具体例(3)]
図17(B)は、状態情報133の具体例について説明する図である。
図17(B)に示す状態情報133(以下、状態情報133b1とも呼ぶ)は、各情報を識別する「項番」と、各ストレージ装置3を識別する「ストレージID」と、各ストレージ装置3の状態を示す「状態」とを項目として有している。
具体的に、図17(B)に示す状態情報133b1において、「項番」が「1」である情報には、「ストレージID」として「012」が設定され、「状態」として「OK」が設定されている。
すなわち、図17(A)で説明したテスト結果情報131b1において、「項番」が「2」である情報(「監視用VMID」が「yyy」である情報)の「テスト結果(第4テスト)」には、「NG」が設定されている。そして、図16(A)で説明した対応情報132b1において、「監視用VMID」に「yyy」が設定された情報の「ストレージID」には、「012」が設定されている。そのため、状態取得部114は、S35の処理において、「ストレージID」が「012」であるストレージ装置3にアクセスし、図17(B)に示す状態情報133b1に含まれる情報を取得する。
その後、結果出力部115は、S34の処理に監視用VM2bや監視用ボリュームの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とを出力する(S36)。
また、状態取得部114は、図11に示すように、異常判定タイミングになった場合(S41のYES)、1以上の監視対象のそれぞれの状態を示す状態情報133を取得する(S42)。その後、状態取得部114は、各監視対象から取得した状態情報133を情報格納領域130に記憶する。以下、S42の処理で取得された状態情報133の具体例について説明を行う。
[状態情報の具体例(4)]
図18は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図18(B)は、状態情報133の具体例について説明する図である。
図18(B)に示す状態情報133(以下、状態情報133b2とも呼ぶ)において、「項番」が「1」である情報には、「ストレージID」として「011」が設定され、「状態」として「NG」が設定されている。また、図18(B)に示す状態情報133b2において、「項番」が「2」である情報には、「ストレージID」として「012」が設定され、「状態」として「OK」が設定されている。図18(B)に含まれる他の情報についての説明は省略する。
図11に戻り、異常有無判定部113は、情報格納領域130に記憶された状態情報133を参照し、異常がある監視対象が存在するか否かを判定する(S43)。
その結果、異常があると判定された監視対象が存在する場合(S44のYES)、テスト結果取得部112は、情報格納領域130に記憶された対応情報132を参照し、S44の処理で異常があると判定した監視対象に対応する監視用VM2bや監視用ボリュームを特定する(S45)。その後、テスト結果取得部112は、特定した監視用VM2bや監視用ボリュームのテスト結果情報131を取得する(S45)。以下、S45の処理で取得された状態情報133の具体例について説明を行う。
[テスト結果情報の具体例(4)]
図18(A)は、テスト結果情報131の具体例について説明する図である。
図18(A)に示すテスト結果情報131(以下、テスト結果情報131b2とも呼ぶ)において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「監視用ボリュームID」として「vol_xxx」が設定され、「テスト結果(第3テスト)」として「OK」が設定され、「テスト結果(第4テスト)」として「OK」が設定されている。
すなわち、図18(B)で説明した状態情報133b2において、「項番」が「1」である情報(「ストレージID」が「011」である情報)の「状態」には、「NG」が設定されている。そして、図16(A)で説明した対応情報132b1において、「ストレージID」に「011」が設定された情報の「監視用ボリュームID」には、「vol_xxx」が設定されている。そのため、テスト結果取得部112は、S45の処理において、「監視用ボリュームID」が「vol_xxx」である監視用ボリュームにアクセスし、図18(A)に示すテスト結果情報131b2に含まれる情報を取得する。
図12に戻り、異常があると判定された監視用VM2bが存在する場合(S51のYES)、結果出力部115は、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第1異常であることを示す情報とを出力する(S52)。
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ストレージ装置3)において異常の検知が行われたか否かに依らず、監視用VM2bや監視用ボリュームにおいて異常が検知された場合、その異常と関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の検知漏れを防止することが可能になる。
また、監視装置1は、クラウド事業者の監視対象において異常の検知された場合、監視用VM2bや監視用ボリュームにおける異常の発生状況を考慮した上で、検知した異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の度合いに応じた情報を出力することが可能になる。したがって、クラウド事業者は、監視装置1によって出力された情報を参照することによって、サービス事業者のリソースに対する影響の度合いに応じた対処を行うことが可能になる。
[第1の実施の形態における他の具体例(2)]
次に、第1の実施の形態における他の具体例について説明を行う。図19及び図20は、第1の実施の形態における他の具体例について説明する図である。
仮想マシン配置部111は、図9に示すように、仮想マシン配置タイミングになった場合(S21のYES)、1以上のハイパーバイザ2c上に、各ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bをそれぞれ配置する(S22)。
そして、仮想マシン配置部111は、S22の処理で配置した監視用VM2bと、各監視用VM2bが配置されたハイパーバイザ2cとを対応付けた対応情報132を生成する(S23)。その後、仮想マシン配置部111は、生成した対応情報132を情報格納領域130に記憶する。以下、S23の処理で対応情報132について説明を行う。
[対応情報の具体例(3)]
図19は、対応情報132の具体例について説明する図である。具体的に、図19に示す対応情報132(以下、対応情報132cとも呼ぶ)は、図16で説明した対応情報132aに対して、監視用VM2bとスイッチ等のネットワーク機器5との関係を示す情報を追加した情報である。
図19に示す対応情報132cは、各情報を識別する「項番」と、各ハイパーバイザ2cを識別する「HVID」と、各監視用VM2bを識別する「監視用VMID」とを項目として有する。また、図19に示す対応情報132cは、各ハイパーバイザ2cが使用する物理NIC(Network interface card)を識別する「NICID」と、各ネットワーク機器5を識別する「NW機器ID」と、各ネットワーク機器5が有する各ポートを識別する「ポートID」とを項目として有する。
具体的に、図19に示す対応情報132cにおいて、「項番」が「1」である情報には、「HVID」として「001」が設定され、「監視用VMID」として「xxx」が設定され、「NICID」として「NIC_01」が設定され、「NW機器ID」として「1」が設定され、「ポート1−1」が設定されている。また、図19に示す対応情報132cにおいて、「項番」が「3」である情報には、「HVID」として「002」が設定され、「監視用VMID」として「yyy」が設定され、「NICID」として「NIC_11」が設定され、「NW機器ID」として「1」が設定され、「ポートID」として「ポート1−2」が設定されている。図19に含まれる他の情報については説明を省略する。
図10に戻り、テスト結果取得部112は、異常判定タイミングになった場合(S31のYES)、各監視用VM2bに対して予め実行を指示した所定のテストの結果を示すテスト結果情報131を各監視用VM2bから取得する(S32)。その後、テスト結果取得部112は、各監視用VM2bから取得したテスト結果情報131を情報格納領域130に記憶する。以下、S32の処理で取得されたテスト結果情報131の具体例について説明を行う。
[テスト結果情報の具体例(5)]
図20は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図20(A)は、テスト結果情報131の具体例について説明する図である。
図20(A)に示すテスト結果情報131(以下、テスト結果情報131cとも呼ぶ)は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、監視用VM2bに実行を指示したテストの結果が設定される「テスト結果(第5テスト)」及び「テスト結果(第6テスト)」とを項目として有する。
具体的に、図20(A)に示すテスト結果情報131cにおいて、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「テスト結果(第5テスト)」として「未取得」が設定され、「テスト結果(第6テスト)」として「未取得」が設定されている。すなわち、図20(A)に示すテスト結果情報131cは、「監視用VMID」が「xxx」である監視用VM2bから情報の取得を行うことができなかったこと(「監視用VMID」が「xxx」である監視用VM2bが異常であったこと)を示す情報を含んでいる。図20(A)に示すテスト結果情報131b1に含まれる他の情報についての説明は省略する。
図10に戻り、異常があると判定された監視用VM2bが存在する場合(S34のYES)、状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S34の処理で異常があると判定した監視用VM2bに対応する監視対象を特定する(S35)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S35)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、S35の処理で取得された状態情報133の具体例について説明を行う。
[状態情報の具体例(5)]
図20(B)は、ハイパーバイザ2cが使用する物理NICの状態情報133c1の具体例について説明する図である。また、図20(C)は、ハイパーバイザ2cと接続するネットワーク機器5が有するポートの状態情報133c2の具体例について説明する図である。
図20(B)に示す状態情報133c1は、各情報を識別する「項番」と、各物理NICを識別する「NICID」と、各物理NICの状態を示す「状態」とを項目として有している。
具体的に、図20(B)に示す状態情報133c1において、「項番」が「1」である情報には、「NICID」として「NIC_01」が設定され、「状態」として「OK」が設定されている。図20(B)に含まれる他の情報についての説明は省略する。
一方、図20(C)に示す状態情報133c2は、各情報を識別する「項番」と、各ポートを識別する「ポートID」と、各ポートの状態を示す「状態」とを項目として有している。
具体的に、図20(C)に示す状態情報133c2において、「項番」が「2」である情報には、「ポートID」として「ポート1−1」が設定され、「状態」として「OK」が設定されている。なお、図20(C)に示す状態情報133c2における「ポートID」に「機器体」が設定された情報は、各ポートを有するネットワーク機器5に関する情報を示している。図20(C)に含まれる他の情報についての説明は省略する。
すなわち、図20(A)で説明したテスト結果情報131cにおいて、「項番」が「1」である情報(「監視用VMID」が「xxx」である情報)の「テスト結果(第5テスト)」及び「テスト結果(第6テスト)」には、「未取得」が設定されている。そして、図19で説明した対応情報132cにおいて、「監視用VMID」に「xxx」が設定された情報には、「NICID」に「NIC_01」が設定され、「NW機器ID」に「1」が設定され、「ポートID」に「ポート1−1」が設定された情報と、「NICID」に「NIC_02」が設定され、「NW機器ID」に「2」が設定され、「ポートID」に「ポート2−1」が設定された情報とが含まれている。そのため、状態取得部114は、S35の処理において、「NICID」が「NIC_01」であるNICと、「NICID」が「NIC_02」であるNICと、ネットワーク機器5自体と、「ポートID」が「ポート1−1」であるポートと、「ポートID」が「ポート2−1」であるポートとにアクセスし、図20(B)に示す状態情報133c1と、図20(C)に示す状態情報133c2とのそれぞれに含まれる情報を取得する。
図10に戻り、結果出力部115は、S34の処理における監視用VM2bの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とを出力する(S36)。
具体的に、図20(B)及び図20(C)における「状態」には、全て「OK」が設定されている。そのため、結果出力部115は、この場合、例えば、監視装置1と監視用VM2bとの間の通信が経由する機器等のうち、状態情報133c1及び状態情報133c2に情報が含まれていない仮想ブリッジにおいて異常が発生した可能性があることを示す情報を、通知情報134として出力するものであってよい。
これにより、監視装置1は、例えば、監視用VM2bにおいて発生した異常を検知した場合、監視用VM2bによって実行されたテストの結果と、クラウド事業者の監視対象(例えば、ネットワーク機器5)の状態とに基づいて、監視用VM2bにおいて発生した異常の原因箇所の推定を行うことが可能になる。そのため、監視装置1は、監視用VM2bにおいて検知された異常の内容だけでなく、検知された異常の原因究明をより迅速に行うことを可能とする情報を出力することが可能になる。
[通知情報の具体例(1)]
次に、通知情報134の具体例について説明を行う。図21は、通知情報134の具体例について説明する図である。
図21に示す通知情報134(以下、通知情報134aとも呼ぶ)は、各情報(検知した異常に対応する情報)を識別する「項番」と、各異常の緊急度が設定される「緊急度」と、各異常を検知したリソースが設定される「対象リソース」と、各異常の内容が設定される「メッセージ」とを項目として有する。また、図21に示す通知情報134aは、各異常の原因被疑箇所が設定される「被疑箇所」と、「被疑箇所」に設定された箇所における異常状態(推定)が設定される「推定異常状態」と、各異常の影響範囲(推定)が設定される「推定影響範囲」とを項目として有する。
具体的に、結果出力部115は、S34の処理において監視用VM(3)に対するアクセスができないと判定されている場合、図21に示すように、例えば、「項番」が「1」である情報の「対象リソース」として「監視用VM(3)」を設定し、「メッセージ」として「アクセス不可」を設定する。また、結果出力部115は、S35の処理においてHV(3)及びNIC(1)から状態情報133を取得した場合、例えば、「被疑箇所」として「HV(3)」及び「NIC(1)」を設定する。また、結果出力部115は、「被疑箇所」に「NIC(1)」が設定された場合、例えば、「推定異常状態」として、「被疑箇所」に「NIC(1)」が設定された場合に対応する情報(予め定められた情報)である「ハード異常」を設定する。また、結果出力部115は、「被疑箇所」に「HV(3)」が設定された場合、例えば、「推定影響範囲」として、「被疑箇所」に「HV(3)」が設定された場合に対応する情報(予め定められた情報)である「HV(3)」を設定する。さらに、結果出力部115は、「対象リソース」に監視用VM2bが設定されている場合、例えば、「緊急度」として「高」を設定する。
そして、結果出力部115は、S44の処理においてストレージ(1)に含まれるディスク(3)においてディスク故障が発生していると判定されている場合、図21に示すように、例えば、「項番」が「5」である情報の「対象リソース」として「ストレージ(1)」及び「ディスク(3)」を設定し、「メッセージ」として「ディスク故障」を設定する。また、結果出力部115は、「対象リソース」に「ストレージ(1)」及び「ディスク(3)」が設定されている場合、例えば、「被疑箇所」として「ストレージ(1)」及び「ディスク(3)」を設定する。また、結果出力部115は、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」が設定されている場合、例えば、「推定異常状態」として、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」が設定された場合に対応する情報(予め定められた情報)である「ハード故障」を設定する。また、結果出力部115は、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」のみが設定された場合、例えば、「推定影響範囲」として、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」のみが設定された場合に対応する情報(予め定められた情報)である「なし」を設定する。さらに、結果出力部115は、「推定影響範囲」に「なし」が設定されている場合、例えば、「緊急度」として「低」を設定する。
[第2の実施の形態]
次に、第2の実施の形態について説明する。図22から図25は、第2の実施の形態における監視処理を説明するフローチャート図である。また、図26から図29は、第2の実施の形態における監視処理を説明する図である。図26から図29を参照しながら、図22から図25の監視処理を説明する。
第2の実施の形態における監視装置1は、監視用VM2bを生成する代わりに、クラウド事業者の監視対象(例えば、図1等で説明したAPIサーバ4)に対して所定の処理の実行指示(以下、API(Application Programming Interface)とも呼ぶ)を送信する。そして、第2の実施の形態における監視装置1は、各監視対象から取得する状態情報133と、各監視対象に対して送信したAPIの実行結果とを参照することにより、各監視対象において発生した異常の検知を行う。
[APIの送信によって検知された場合の処理]
初めに、監視処理のうち、APIの送信によって異常が検知された場合の処理について説明を行う。
監視装置1の実行指示部115は、図22に示すように、異常判定タイミングになるまで待機する(S61のNO)。そして、異常判定タイミングになった場合(S61のYES)、実行指示部115は、1以上のAPIサーバのそれぞれに対して所定の処理の実行を指示するAPIを送信する(S62)。
その後、実行指示部115は、S62の処理で送信した実行指示に対応する所定の処理の実行が終了するまで待機する(S63のNO)。
具体的に、例えば、S62の処理において送信したAPIが同期型のAPI(以下、同期APIとも呼ぶ)である場合、実行指示部115は、S62の処理において送信したAPIの応答があるまで待機する。
また、例えば、S62の処理において送信したAPIが非同期型のAPI(以下、非同期APIとも呼ぶ)である場合、実行指示部115は、S62の処理においてAPIを送信した後、所定時間ごとに処理状況を確認するためのAPI(以下、参照APIとも呼ぶ)を送信する。そして、実行指示部115は、参照APIの送信を行うことによって、S62の処理において送信したAPIに対応する処理の完了が確認できるまで待機する。なお、非同期APIによって行われる処理は、例えば、新たな利用者VM2aの生成を行う処理や生成済の利用者VM2aの削除を行う処理であってよい。
そして、S62の処理で送信したAPIに対応する所定の処理の実行が終了した場合(S63のYES)、実行指示部115は、S63の処理で実行が終了した所定の処理の結果を示すAPI結果情報135を生成する(S64)。その後、実行指示部115は、例えば、生成したAPI結果情報135を情報格納領域130に記憶する。以下、S64の処理で生成されたAPI結果情報135の具体例について説明を行う。
[API結果情報の具体例(1)]
図27は、第2の実施の形態におけるAPI結果情報135及び状態情報133の具体例について説明する図である。具体的に、図27(A)は、第2の実施の形態におけるAPI結果情報135の具体例について説明する図である。
図27(A)に示すAPI結果情報135(以下、API結果情報135d1とも呼ぶ)は、各情報を識別する「項番」と、各APIサーバ4を識別する「APIID」と、各APIサーバ4における所定の処理の実行結果を示す「実行結果」とを項目として有している。「実行結果」には、APIサーバ4による実行結果が正常であったことを示す「OK」、APIサーバ4による実行結果が異常であったことを示す「NG」、または、APIサーバ4から実行結果を取得することができなかったことを示す「未取得」のいずれかが設定される。
具体的に、図27(A)に示すAPI結果情報135において、「項番」が「1」である情報には、「APIID」として「021」が設定され、「実行結果」として「OK」が設定されている。また、図27(A)に示すAPI結果情報135において、「項番」が「2」である情報には、「APIID」として「022」が設定され、「実行結果」として「NG」が設定されている。図27(A)に含まれる他の情報についての説明は省略する。
図22に戻り、異常有無判定部113は、情報格納領域130に記憶されたAPI結果情報135を参照し、実行結果に異常があるAPIが存在するか否かを判定する(S65)。
具体的に、異常有無判定部113は、例えば、情報格納領域130に記憶されたテスト結果情報131(S64の処理において生成したAPI結果情報135)を参照し、「実行結果」に「NG」が設定されている情報が存在するか否かを判定する。そして、異常有無判定部113は、「実行結果」に「NG」が設定されている情報が存在しないと判定した場合、全てのAPIの実行結果が正常であると判定する。また、異常有無判定部113は、「実行結果」に「NG」が設定されている情報が存在すると判定した場合、存在すると判定した情報に対応するAPIの実行結果が異常であると判定する。
その結果、図23に示すように、実行結果に異常があると判定されたAPIが存在しないと判定した場合(S71のNO)、実行指示部115は、S61以降の処理を再度行う。
一方、実行結果に異常があると判定されたAPIが存在すると判定した場合(S71のYES)、状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S71の処理で実行結果に異常があると判定したAPIに対応する監視対象を特定する(S72)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S72)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、情報格納領域130に予め記憶された対応情報132と、S72の処理で取得された状態情報133との具体例について説明を行う。
[対応情報の具体例(4)]
初めに、第2の実施の形態における対応情報132の具体例について説明を行う。図26は、第2の実施の形態における対応情報132の具体例を説明する図である。なお、第2の実施の形態における対応情報132(以下、対応情報132dとも呼ぶ)は、クラウド事業者によって生成され、情報格納領域130に予め記憶されている情報であるものとして説明を行う。
図26に示す対応情報132dは、各情報を識別する「項番」と、各APIを識別する「APIID」と、クラウド事業者による各監視対象を識別する「監視対象ID」とを項目として有する。「監視対象ID」には、ハイパーバイザ2c、ストレージ装置3、APIサーバ4及びネットワーク機器5の他、新たな利用者VM2aの生成に要する物理リソースの確保等を行うコントローラ(図示しない)や、APIサーバ4に対して処理要求を振り分ける負荷分散サーバ(図示しない)や、コントローラに対する処理要求を蓄積するキューサーバ(図示しない)等を識別する情報が設定される。
具体的に、図26に示す対応情報132dにおいて、「項番」が「1」である情報には、「APIID」として「021」が設定され、「監視対象ID」として「1」及び「2」が設定されている。また、図26に示す対応情報132dにおいて、「項番」が「2」である情報には、「APIID」として「022」が設定され、「監視対象ID」として「4」、「8」及び「9」が設定されている。図26に含まれる他の情報についての説明は省略する。
[状態情報の具体例(6)]
次に、第2の実施の形態における状態情報133(以下、状態情報133d1とも呼ぶ)の具体例について説明を行う。
図27(B)に示す状態情報133d1は、各情報を識別する「項番」と、クラウド事業者による各監視対象を識別する「監視対象ID」と、各監視対象の状態を示す「状態」とを項目として有している。「状態」には、監視対象の状態が正常であったことを示す「OK」、監視対象の状態が異常であったことを示す「NG」、または、監視対象から情報を取得することができなかったことを示す「未取得」が設定される。
具体的に、図27(B)に示す状態情報133d1において、「項番」が「1」である情報には、「監視対象ID」として「4」が設定され、「状態」として「OK」が設定されている。また、図27(B)に示す状態情報133d1において、「項番」が「2」である情報には、「監視対象ID」として「8」が設定され、「状態」として「OK」が設定されている。図27(B)に含まれる他の情報についての説明は省略する。
すなわち、図27(A)で説明したAPI結果情報135d1において、「項番」が「2」である情報(「APIID」が「022」である情報)の「実行結果」には、「NG」が設定されている。そして、図26で説明した対応情報132dにおいて、「APIID」に「022」が設定された情報の「監視対象ID」には、「4」、「8」及び「9」が設定されている。そのため、状態取得部114は、S71の処理において、「監視対象ID」が「4」、「8」及び「9」である監視対象にアクセスし、図27(B)に示す状態情報133d1に含まれる情報を取得する。
図23に戻り、結果出力部115は、S71の処理におけるAPIの実行結果についての異常有無の判定結果と、S72の処理で取得した監視対象の状態情報133とを出力する(S73)。
具体的に、結果出力部115は、S71の処理におけるAPIの実行結果についての異常有無の判定結果と、S72の処理で取得した監視対象の状態情報133とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知が行われたか否かに依らず、各監視対象に送信したAPIに対応する実行結果において異常が検知された場合、その異常と関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の検知漏れを防止することが可能になる。また、監視装置1は、APIを送信することによって検知された異常の内容だけでなく、異常が検知されたAPIに対応する監視対象についての情報を出力することにより、検知された異常の原因究明を行うために必要な情報を迅速に出力することが可能になる。
[クラウド事業者の監視対象において異常が検知された場合の処理]
次に、監視処理のうち、クラウド事業者の監視対象において異常が検知された場合の処理について説明を行う。
状態取得部114は、図24に示すように、異常判定タイミングまで待機する(S81のNO)。そして、異常判定タイミングになった場合(S81のYES)、状態取得部114は、1以上の監視対象のそれぞれの状態を示す状態情報133を取得する(S82)。その後、状態取得部114は、各監視対象から取得した状態情報133を情報格納領域130に記憶する。以下、状態情報133の具体例について説明を行う。
[状態情報の具体例(7)]
図28は、第2の実施の形態におけるAPI結果情報135及び状態情報133の具体例について説明する図である。具体的に、図28(B)は、第2の実施の形態における状態情報133の具体例について説明する図である。
図28(B)に示す状態情報133(以下、状態情報133d2とも呼ぶ)において、「項番」が「1」である情報には、「監視対象ID」として「1」が設定され、「状態」として「OK」が設定されている。また、図28(B)に示す状態情報133d2において、「項番」が「3」である情報には、「監視対象ID」として「3」が設定され、「状態」として「NG」が設定されている。図28(B)に含まれる他の情報についての説明は省略する。
図24に戻り、異常有無判定部113は、情報格納領域130に記憶された状態情報133(S82の処理で取得した状態情報133)を参照し、異常がある監視対象が存在するか否かを判定する(S83)。
その結果、異常があると判定された監視対象が存在しないと判定した場合(S84のNO)、状態取得部114は、S81以降の処理を再度行う。
一方、異常があると判定された監視対象が存在すると判定した場合(S84のYES)、実行指示部115は、1以上のAPIサーバのそれぞれに対して、異常があると判定した監視対象に対応するAPIを送信する(S85)。
その後、実行指示部115は、S85の処理で送信したAPIに対応する所定の処理の実行が終了するまで待機する(S86のNO)。
そして、S85の処理で送信したAPIに対応する所定の処理の実行が終了した場合(S86のYES)、実行指示部115は、図25に示すように、実行が終了した所定の処理の結果を示すAPI結果情報135を生成する(S91)。その後、実行指示部115は、例えば、生成したAPI結果情報135を情報格納領域130に記憶する。以下、S91の処理で生成されたAPI結果情報135の具体例について説明を行う。
[API結果情報の具体例(2)]
図28は、API結果情報135及び状態情報133の具体例について説明する図である。具体的に、図28(A)は、API結果情報135の具体例について説明する図である。
図27(A)に示すAPI結果情報135(以下、API結果情報135d2とも呼ぶ)において、「項番」が「1」である情報には、「APIID」として「023」が設定され、「実行結果」として「OK」が設定されている。
すなわち、図28(B)で説明した状態情報133d2において、「項番」が「3」である情報(「監視対象ID」が「3」である情報)の「状態」には、「NG」が設定されている。そして、図26で説明した対応情報132dにおいて、「監視対象ID」に「3」が設定された情報の「APIID」には、「023」が設定されている。そのため、実行指示部115は、S85の処理において、「APIID」が「3」であるAPIを送信する。そして、実行指示部115は、S91の処理において、図28(A)に示すAPI結果情報135d2を生成する。
図25に戻り、異常有無判定部113は、情報格納領域130に記憶されたAPI結果情報135を参照し、実行結果に異常があるAPIが存在するか否かを判定する(S92)。
その結果、実行異常があると判定されたAPIが存在すると判定した場合(S92のYES)、結果出力部115は、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第3異常(例えば、緊急度が「高」である異常)であることを示す情報とを出力する(S93)。
具体的に、結果出力部115は、例えば、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第3異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
一方、実行異常があると判定されたAPIが存在しないと判定した場合(S92のNO)、結果出力部115は、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第4異常(例えば、緊急度が「低」である異常)であることを示す情報とを出力する(S94)。
具体的に、結果出力部115は、例えば、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第4異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知された場合、各監視対象に対して送信したAPIの実行結果を考慮した上で、検知した異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の度合いに応じた情報を出力することが可能になる。そのため、クラウド事業者は、監視装置1によって出力された情報を参照することによって、サービス事業者のリソースに対する影響の度合いに応じた対処を行うことが可能になる。
[通知情報の具体例(2)]
次に、第2の実施の形態における通知情報134(以下、通知情報134bとも呼ぶ)の具体例について説明を行う。図29は、第2の実施の形態における通知情報134を説明する図である。
結果出力部115は、S71の処理において「仮想NW一覧表示」を行うためのAPIの実行結果に異常があると判定されており、APIの応答に含まれていたエラーメッセージが「エラー503」であった場合、図29に示すように、例えば、「項番」が「1」である情報の「対象リソース」として「仮想NW一覧表示」を設定し、「メッセージ」として「エラー503」を設定する。また、結果出力部115は、S72の処理においてコントローラ(1)及び負荷分散サーバ(2)から状態情報133を取得した場合、例えば、「被疑箇所」として「コントローラ(1)」を設定する。また、結果出力部115は、「被疑箇所」に「コントローラ(1)」が設定された場合、例えば、「推定異常状態」として、「被疑箇所」に「コントローラ(1)」が設定された場合に対応する情報(予め定められた情報)である「仮想NWコントローラプロセスダウン」を設定する。また、結果出力部115は、「被疑箇所」に「コントローラ(1)」が設定された場合、例えば、「推定影響範囲」として、「被疑箇所」に「コントローラ(1)」が設定された場合に対応するAPIの一覧を示す情報(予め定められた情報)を設定する。さらに、結果出力部115は、「対象リソース」に「仮想NW一覧表示」が設定されている場合、例えば、「緊急度」として「高」を設定する。
そして、結果出力部115は、S84の処理においてAPIサーバ(1)においてプロセスダウンが発生していると判定されている場合、図29に示すように、例えば、「項番」が「4」である情報の「対象リソース」として「APIサーバ(1)」を設定し、「メッセージ」として「プロセスダウン」を設定する。また、結果出力部115は、「対象リソース」に「APIサーバ(1)」が設定されている場合、例えば、「被疑箇所」として「APIサーバ(1)」を設定する。また、結果出力部115は、「メッセージ」に「プロセスダウン」が設定された場合、例えば、「推定異常状態」として、「メッセージ」に「プロセスダウン」が設定された場合に対応する情報(予め定められた情報)である「プロセスダウン」を設定する。また、結果出力部115は、「被疑箇所」に「APIサーバ(1)」のみが設定された場合、例えば、「項番」が「1」である情報の「推定影響範囲」として、「被疑箇所」に「APIサーバ(1)」のみが設定された場合に対応する情報(予め定められた情報)である「なし」を設定する。さらに、結果出力部115は、「推定影響範囲」に「なし」が設定されている場合、例えば、「緊急度」として「低」を設定する。
このように、本実施の形態における監視装置1は、例えば、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bを配置する。
そして、監視装置1は、所定間隔において監視用VM2bによって実行された所定のテストの結果を取得し、取得した結果から監視用VM2bの異常有無を判定する。その結果、監視用VM2bが異常である場合、監視装置1は、複数の監視対象の所定の状態を取得し、監視用VM2bの異常有無の判定結果と、複数の監視対象の所定の状態とを出力する。
すなわち、本実施の形態における監視装置1は、例えば、サービス事業者に貸し出している利用者VM2aを動作させるハイパーバイザ2c上に、監視装置1がアクセスを行うことができる監視用VM2bを配置する。そして、監視装置1は、監視用VMに対してアクセスすることによって取得した動作状態を、利用者VM2a(監視装置1がアクセスを行うことができない仮想マシン)の動作状態として推定する。
これにより、監視装置1は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合、監視用VM2bから取得した動作状態を参照することによって、発生した異常が利用者VM2aに与えている影響度合いを推定することが可能になる。また、監視装置1は、例えば、監視用VM2aから取得した動作状態を参照することによって、ハイパーバイザ2cにおいて検知できなかった異常(ハイパーバイザ2cに起因する異常)についても検知することが可能になる。
以上の実施の形態をまとめると、以下の付記のとおりである。
(付記1)
仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。
(付記2)
付記1において、さらに、
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定する、
処理をコンピュータに実行させ、
前記出力する処理では、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
ことを特徴とする監視プログラム。
(付記3)
付記1において、
前記所定のテストは、前記仮想マシンによる監視用の記憶領域に対するアクセスを伴うテストを含み、
前記複数の監視対象は、前記記憶領域を有するストレージ装置を含み、
前記異常有無を判定する処理では、前記仮想マシンまたは前記記憶領域の異常有無を判定し、
前記所定の状態を取得する処理では、前記仮想マシンまたは前記記憶領域が異常である場合、前記ストレージ装置の所定の状態を取得し、
前記出力する処理では、前記仮想マシンまたは前記記憶領域の異常有無の判定結果と、前記ストレージ装置の所定の状態とを出力する、
ことを特徴とする監視プログラム。
(付記4)
付記1において、
前記所定のテストは、前記仮想マシンからの応答有無を判定するテストであり、
前記複数の監視対象は、前記仮想マシンとの通信を行う際に経由するネットワーク機器を含み、
前記異常有無を判定する処理では、前記仮想マシンからの応答有無を判定し、
前記所定の状態を取得する処理では、前記仮想マシンからの応答がない場合、前記ネットワーク機器の所定の状態を取得し、
前記出力する処理では、前記仮想マシンからの応答有無の判定結果と、前記ネットワーク機器の所定の状態とを出力する、
ことを特徴とする監視プログラム。
(付記5)
付記1において、さらに、
前記複数の監視対象は、複数の処理をそれぞれ実行する複数の情報処理装置を含み、
所定間隔において前記複数の情報処理装置に対して前記複数の処理の実行指示を行い、
前記実行指示に対応する前記複数の処理の実行結果から、前記複数の処理の実行結果についての異常有無をそれぞれ判定し、
前記複数の処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記複数の監視対象のうち、前記いずれかの処理に対応する監視対象の所定の状態を取得し、
前記複数の処理の実行結果についての異常有無の判定結果と、前記いずれかの処理に対応する監視対象の所定の状態とを出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。
(付記6)
付記5において、
前記複数の処理は、仮想マシンの作成及び仮想マシンの削除を含む、
ことを特徴とする監視プログラム。
(付記7)
付記5において、さらに、
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象のそれぞれの異常有無を判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記複数の処理のうち、前記いずれかの監視対象に対応する処理の実行指示を前記複数の情報処理装置に対して行い、
前記いずれかの監視対象に対応する処理の実行結果から、前記いずれかの監視対象に対応する処理の実行結果についての異常有無をそれぞれ判定する、
処理をコンピュータに実行させ、
前記複数の処理の実行結果についての異常有無の判定結果を出力する処理では、前記いずれかの監視対象に対応する処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記いずれかの監視対象の異常が第3異常であることを示す情報を出力し、前記いずれかの監視対象に対応する処理の実行結果が異常でない場合、前記いずれかの監視対象の異常が第4異常であることを示す情報を出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。
(付記8)
仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置する仮想マシン配置部と、
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得するテスト結果取得部と、
取得した前記結果から前記仮想マシンの異常有無を判定する異常有無判定部と、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得する状態取得部と、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する結果出力部と、を有する、
ことを特徴とする監視装置。
(付記9)
付記8において、
前記状態取得部は、所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
前記異常有無判定部は、取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
前記テスト結果取得部は、前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
前記異常有無判定部は、取得した前記結果から前記仮想マシンの異常有無を判定し、
前記結果出力部は、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
ことを特徴とする監視装置。
(付記10)
仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
ことを特徴とする監視方法。
(付記11)
付記10において、さらに、
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記出力する工程では、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
ことを特徴とする監視方法。
1:監視装置 1a:監視者端末
2:物理マシン 2a:利用者VM
2c:ハイパーバイザ 3:ストレージ装置
4:APIサーバ 5:ネットワーク機器

Claims (9)

  1. 仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、
    所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
    取得した前記結果から前記仮想マシンの異常有無を判定し、
    前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
    前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
    処理をコンピュータに実行させることを特徴とする監視プログラム。
  2. 請求項1において、さらに、
    所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
    取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
    前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
    取得した前記結果から前記仮想マシンの異常有無を判定する、
    処理をコンピュータに実行させ、
    前記出力する処理では、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
    ことを特徴とする監視プログラム。
  3. 請求項1において、
    前記所定のテストは、前記仮想マシンによる監視用の記憶領域に対するアクセスを伴うテストを含み、
    前記複数の監視対象は、前記記憶領域を有するストレージ装置を含み、
    前記異常有無を判定する処理では、前記仮想マシンまたは前記記憶領域の異常有無を判定し、
    前記所定の状態を取得する処理では、前記仮想マシンまたは前記記憶領域が異常である場合、前記ストレージ装置の所定の状態を取得し、
    前記出力する処理では、前記仮想マシンまたは前記記憶領域の異常有無の判定結果と、前記ストレージ装置の所定の状態とを出力する、
    ことを特徴とする監視プログラム。
  4. 請求項1において、
    前記所定のテストは、前記仮想マシンからの応答有無を判定するテストであり、
    前記複数の監視対象は、前記仮想マシンとの通信を行う際に経由するネットワーク機器を含み、
    前記異常有無を判定する処理では、前記仮想マシンからの応答有無を判定し、
    前記所定の状態を取得する処理では、前記仮想マシンからの応答がない場合、前記ネットワーク機器の所定の状態を取得し、
    前記出力する処理では、前記仮想マシンからの応答有無の判定結果と、前記ネットワーク機器の所定の状態とを出力する、
    ことを特徴とする監視プログラム。
  5. 請求項1において、さらに、
    前記複数の監視対象は、複数の処理をそれぞれ実行する複数の情報処理装置を含み、
    所定間隔において前記複数の情報処理装置に対して前記複数の処理の実行指示を行い、
    前記実行指示に対応する前記複数の処理の実行結果から、前記複数の処理の実行結果についての異常有無をそれぞれ判定し、
    前記複数の処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記複数の監視対象のうち、前記いずれかの処理に対応する監視対象の所定の状態を取得し、
    前記複数の処理の実行結果についての異常有無の判定結果と、前記いずれかの処理に対応する監視対象の所定の状態とを出力する、
    処理をコンピュータに実行させることを特徴とする監視プログラム。
  6. 請求項5において、
    前記複数の処理は、仮想マシンの作成及び仮想マシンの削除を含む、
    ことを特徴とする監視プログラム。
  7. 請求項5において、さらに、
    所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
    取得した前記所定の状態のそれぞれから前記複数の監視対象のそれぞれの異常有無を判定し、
    前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記複数の処理のうち、前記いずれかの監視対象に対応する処理の実行指示を前記複数の情報処理装置に対して行い、
    前記いずれかの監視対象に対応する処理の実行結果から、前記いずれかの監視対象に対応する処理の実行結果についての異常有無をそれぞれ判定する、
    処理をコンピュータに実行させ、
    前記複数の処理の実行結果についての異常有無の判定結果を出力する処理では、前記いずれかの監視対象に対応する処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記いずれかの監視対象の異常が第3異常であることを示す情報を出力し、前記いずれかの監視対象に対応する処理の実行結果が異常でない場合、前記いずれかの監視対象の異常が第4異常であることを示す情報を出力する、
    処理をコンピュータに実行させることを特徴とする監視プログラム。
  8. 仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置する仮想マシン配置部と、
    所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得するテスト結果取得部と、
    取得した前記結果から前記仮想マシンの異常有無を判定する異常有無判定部と、
    前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得する状態取得部と、
    前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する結果出力部と、を有する、
    ことを特徴とする監視装置。
  9. 仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、
    所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
    取得した前記結果から前記仮想マシンの異常有無を判定し、
    前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
    前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
    ことを特徴とする監視方法。
JP2018027525A 2018-02-20 2018-02-20 監視プログラム、監視装置及び監視方法 Pending JP2019144785A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018027525A JP2019144785A (ja) 2018-02-20 2018-02-20 監視プログラム、監視装置及び監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018027525A JP2019144785A (ja) 2018-02-20 2018-02-20 監視プログラム、監視装置及び監視方法

Publications (1)

Publication Number Publication Date
JP2019144785A true JP2019144785A (ja) 2019-08-29

Family

ID=67773788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018027525A Pending JP2019144785A (ja) 2018-02-20 2018-02-20 監視プログラム、監視装置及び監視方法

Country Status (1)

Country Link
JP (1) JP2019144785A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021123370A1 (de) 2020-09-14 2022-03-17 Panasonic Intellectual Property Management Co., Ltd. Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren, und programm
WO2022185626A1 (ja) * 2021-03-01 2022-09-09 パナソニックIpマネジメント株式会社 監視システム
WO2022239331A1 (ja) * 2021-05-12 2022-11-17 日立Astemo株式会社 電子制御装置及び異常判定方法
WO2022255247A1 (ja) 2021-05-31 2022-12-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 監視装置、監視システム及び監視方法
WO2023238438A1 (ja) * 2022-06-10 2023-12-14 パナソニックIpマネジメント株式会社 監視装置および監視方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021123370A1 (de) 2020-09-14 2022-03-17 Panasonic Intellectual Property Management Co., Ltd. Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren, und programm
US12116002B2 (en) 2020-09-14 2024-10-15 Panasonic Automotive Systems Co., Ltd. Information processing apparatus, information processing method, and recording medium
WO2022185626A1 (ja) * 2021-03-01 2022-09-09 パナソニックIpマネジメント株式会社 監視システム
WO2022239331A1 (ja) * 2021-05-12 2022-11-17 日立Astemo株式会社 電子制御装置及び異常判定方法
DE112022001480T5 (de) 2021-05-12 2024-01-11 Hitachi Astemo, Ltd. Elektronische steuereinheit und anomaliebestimmungsverfahren
WO2022255247A1 (ja) 2021-05-31 2022-12-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 監視装置、監視システム及び監視方法
WO2023238438A1 (ja) * 2022-06-10 2023-12-14 パナソニックIpマネジメント株式会社 監視装置および監視方法

Similar Documents

Publication Publication Date Title
JP2019144785A (ja) 監視プログラム、監視装置及び監視方法
KR101979363B1 (ko) 애플리케이션 토폴로지 관계의 발견 방법, 장치, 및 시스템
EP3281360B1 (en) Virtualized network function monitoring
TWI544328B (zh) 用於經由背景虛擬機器的探測插入的方法及系統
EP2871553A1 (en) Systems and methods for protecting virtualized assets
US10298469B2 (en) Automatic asynchronous handoff identification
US10452469B2 (en) Server performance correction using remote server actions
WO2017016212A1 (zh) 桌面云系统的测试方法及装置
US20130042000A1 (en) Configuration information management server, configuration information management method and configuration management program
CN113900834B (zh) 基于物联网技术的数据处理方法、装置、设备及存储介质
GB2518739A (en) Custom Correlation of a Distributed Business Transaction
CN110896362B (zh) 一种故障检测方法和装置
US20150067139A1 (en) Agentless monitoring of computer systems
US10191844B2 (en) Automatic garbage collection thrashing monitoring
US20170031740A1 (en) Naming of nodes in net framework
CN114020513A (zh) 一种处理日志信息的方法和装置
JP2009176139A (ja) Os優先度変更装置及びos優先度変更プログラム
JP5623333B2 (ja) 監視サーバ、及び、監視評価方法
CN113849356A (zh) 一种设备测试方法、装置、电子设备和存储介质
US9864650B2 (en) Monitoring and responding to operational conditions of a logical partition from a separate logical partition
JP2020038506A (ja) 情報処理システム、情報処理方法、及び、プログラム
CN114826886B (zh) 一种应用软件容灾方法、装置及电子设备
CN114449040A (zh) 基于云平台的配置下发方法及装置
CN114266037B (zh) 一种样本检测方法、装置、电子设备及存储介质
US9880917B2 (en) Monitoring virtual machines for alert conditions