Nothing Special   »   [go: up one dir, main page]

JP6293683B2 - Computer system and coping method for performance failure of computer system - Google Patents

Computer system and coping method for performance failure of computer system Download PDF

Info

Publication number
JP6293683B2
JP6293683B2 JP2015013183A JP2015013183A JP6293683B2 JP 6293683 B2 JP6293683 B2 JP 6293683B2 JP 2015013183 A JP2015013183 A JP 2015013183A JP 2015013183 A JP2015013183 A JP 2015013183A JP 6293683 B2 JP6293683 B2 JP 6293683B2
Authority
JP
Japan
Prior art keywords
computer
business
management information
countermeasure
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015013183A
Other languages
Japanese (ja)
Other versions
JP2016139237A (en
Inventor
法子 中嶋
法子 中嶋
佑樹 長沼
佑樹 長沼
聡一 高重
聡一 高重
知弘 森村
知弘 森村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2015013183A priority Critical patent/JP6293683B2/en
Publication of JP2016139237A publication Critical patent/JP2016139237A/en
Application granted granted Critical
Publication of JP6293683B2 publication Critical patent/JP6293683B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、クラウドサービスの管理に関する。   The present invention relates to management of cloud services.

インターネットを介して、計算機リソース、及び計算機リソース上で動作するサービスを提供し、利用に応じて利用者に課金する、クラウドと呼ばれるサービスの提供形態が普及している。   A service providing form called a cloud, which provides a computer resource and a service that operates on the computer resource via the Internet and charges a user according to the use, is widely used.

当初、クラウドは、インターネット経由でアクセスするため安定した性能を提供することが難しいことから、例えば、バックアップのような要求される性能が比較的低い用途で利用されていた。しかし、近年、クラウド上でオンラインビジネスを稼動させるケースも多く、クラウドに対して性能の安定性が求められている。   Initially, since the cloud is difficult to provide stable performance because it is accessed via the Internet, the cloud has been used in applications that require relatively low performance such as backup. However, in recent years, there are many cases where online businesses are operated on the cloud, and stability of performance is required for the cloud.

これを実現する技術の一つに、クラウド上の仮想計算機の負荷状況に応じて、当該仮想計算機を自動的にスケーリングする機能が知られている。例えば、クラウドを用いて提供されるWeb三階層システムでは、フロントエンド側のWebサーバに対して前述した技術を適用される。Webサーバに対応する仮想計算機数を増減させることによって、Web三階層システムの負荷バランスを維持している。   As one of the technologies for realizing this, a function of automatically scaling the virtual machine according to the load status of the virtual machine on the cloud is known. For example, in the Web three-tier system provided using the cloud, the above-described technology is applied to the front-end Web server. By increasing or decreasing the number of virtual machines corresponding to the Web server, the load balance of the Web three-tier system is maintained.

システム全体の性能を維持するためには、Webサーバに対するスケーリングに伴って、バックエンド側のDBサーバも増強させる必要がある。DBサーバの性能障害に対する対応方法については、例えば、特許文献1等にDBサーバのボトルネックの原因を分析する技術が存在する。   In order to maintain the performance of the entire system, it is necessary to increase the DB server on the back end side as the Web server is scaled. As a method for dealing with the performance failure of the DB server, for example, there is a technique for analyzing the cause of the bottleneck of the DB server in Patent Document 1 or the like.

特許文献1には、DBサーバの性能を管理してボトルネックの分析を行うこと、分析結果に応じてサーバリソースのリサイズを行うこと等が記載されている。   Patent Document 1 describes managing the performance of a DB server and analyzing a bottleneck, resizing server resources according to the analysis result, and the like.

米国特許第7526508号明細書US Pat. No. 7,526,508

従来のDBサーバの障害対応技術では、管理計算機等が、DBサーバの性能劣化を検知し、性能劣化の原因を分析することによって、CPUのリソース不足、又はI/Oレイテンシの不足等のボトルネック箇所を特定し、不足しているリソース量を算出する。   In conventional DB server failure handling technology, a management computer or the like detects a performance degradation of a DB server and analyzes the cause of the performance degradation, thereby causing a bottleneck such as a shortage of CPU resources or a lack of I / O latency. Identify the location and calculate the amount of the missing resource.

クラウド環境においては、サービスの契約内容に応じて、障害に対する対処時間を優先する対処法、又は、コストを優先する対処法等を選択する必要がある。   In the cloud environment, it is necessary to select a coping method that prioritizes the coping time for a failure or a coping method that prioritizes the cost in accordance with the contract contents of the service.

しかし、従来技術では、サービスの契約内容を考慮してどの対処法を優先的に実行するか、また、クラウドの構成を考慮して各対処法を実行できるか否かを判定することができないため、クラウドにおけるシステムの性能を保証するための適切なDBサーバの障害に対応できないという課題がある。そのため、クラウド環境におけるDBサーバのスケールアップ技術が求められている。   However, in the conventional technology, it is not possible to determine which countermeasure is preferentially executed in consideration of the contract contents of the service and whether each countermeasure can be executed in consideration of the cloud configuration. There is a problem that an appropriate DB server failure for guaranteeing the performance of the system in the cloud cannot be handled. Therefore, there is a need for a DB server scale-up technique in a cloud environment.

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、複数の計算機を備える計算機システムであって、前記複数の計算機は、前記計算機システムを管理する少なくとも一つの第1の計算機、及びユーザの業務に使用する業務システムを構築するための計算機リソースを提供する複数の第2の計算機を含み、前記少なくとも一つの第1の計算機は、第1のプロセッサ、前記第1のプロセッサに接続される第1のメモリ、及び前記第1のプロセッサに接続される第1のインタフェースを有し、前記複数の第2の計算機の各々は、第2のプロセッサ、前記第2のプロセッサに接続される第2のメモリ、前記第2のプロセッサに接続される第2のインタフェース、及び記憶装置を有し、前記業務システムは、スケールアウト処理を実行することによって処理性能を変更できる少なくとも一つの第1の業務計算機、及びスケールアップ処理を実行することによって処理性能を変更できる複数の業務計算機を含み、前記少なくとも一つの第1の計算機は、前記計算機システム上に構築された複数の業務システムの各々のサービス要件を管理するサービス要件管理情報と、前記業務計算機の性能劣化が検知された場合、計算機リソースの種別毎の性能劣化を改善するための制御方法である対処法を管理する対処法管理情報と、を保持し、複数の対処法の集合であり、性能劣化が検知された前記業務計算機に対して前記対処法を実行できるか否かを判定する順番を含む対処手順管理情報を生成する対処手順生成部を有し、前記サービス要件は、前記業務システムに含まれる前記複数の業務計算機の各々の性能保証の条件、前記業務システムに含まれる前記複数の業務計算機の各々の運用の条件、及び、前記業務システムの課金体系の条件に関する情報を含み、前記対処法管理情報に含まれる複数の対処法の各々は、前記対処法に対応する処理におけるコスト情報と対応付けられて管理され、前記対処手順生成部は、前記対処手順管理情報を生成する対象の業務システムを選択し、前記対象の業務システムに含まれる前記複数の業務計算機の中から処理対象の業務計算機を選択し、前記処理対象の業務計算機における対象の計算機リソースを選択し、前記サービス要件管理情報に基づいて、前記対処法管理情報に含まれる前記複数の対処法の中から、前記対象の業務システムの前記サービス要件に合致する複数の対処法を選択し、前記選択された複数の対処法が実行可能か否かを判定する判定順番を決定することによって、前記対処手順管理情報を生成することを特徴とする。   A typical example of the invention disclosed in the present application is as follows. That is, a computer system including a plurality of computers, wherein the plurality of computers includes at least one first computer that manages the computer system and computer resources for constructing a business system used for a user's business. A plurality of second computers provided, wherein the at least one first computer is connected to a first processor, a first memory connected to the first processor, and the first processor; Each of the plurality of second computers includes a second processor, a second memory connected to the second processor, and a second memory connected to the second processor. The business system includes at least one interface and a storage device, and the business system can change processing performance by executing scale-out processing. 1 business computer and a plurality of business computers whose processing performance can be changed by executing a scale-up process, wherein the at least one first computer is a plurality of business systems constructed on the computer system. Service requirement management information for managing the service requirements, and coping management information for managing coping methods that are control methods for improving performance degradation for each type of computer resource when performance degradation of the business computer is detected And a processing procedure management information including an order for determining whether or not the processing method can be executed on the business computer in which performance degradation is detected. A procedure generation unit, and the service requirement includes a condition for guaranteeing performance of each of the plurality of business computers included in the business system, the business system Each of the plurality of countermeasures included in the countermeasure management information corresponds to the countermeasures, including information regarding the operating conditions of each of the plurality of business computers and the accounting system conditions of the business system. The handling procedure generation unit selects a target business system for generating the handling procedure management information, and the plurality of business computers included in the target business system are managed. A processing target business computer is selected, a target computer resource in the processing target business computer is selected, and based on the service requirement management information, among the plurality of processing methods included in the processing method management information From the above, select a plurality of countermeasures that match the service requirements of the target business system, and determine whether or not the selected plurality of countermeasures can be executed. The coping procedure management information is generated by determining the determination order.

本発明によれば、対処手順生成部は、業務計算機(DBサーバ)の性能劣化に対応するための対処手順管理情報を、業務システム(テナント)のサービス要件に基づいて生成することができる。これによって、サービス要件を満たし、かつ、効率的な業務計算機の障害復旧を実現できる。   According to the present invention, the handling procedure generation unit can generate handling procedure management information for dealing with performance degradation of a business computer (DB server) based on service requirements of a business system (tenant). As a result, it is possible to satisfy the service requirements and realize efficient failure recovery of the business computer.

上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。   Problems, configurations, and effects other than those described above will become apparent from the description of the following examples.

実施例1のクラウドサービスを実現するシステムの構成例を示す説明図である。It is explanatory drawing which shows the structural example of the system which implement | achieves the cloud service of Example 1. FIG. 実施例1のクラウドシステムの構成例を示す説明図である。It is explanatory drawing which shows the structural example of the cloud system of Example 1. FIG. 実施例1のクラウド管理計算機のハードウェア構成及びソフトウェア構成の一例を説明するブロック図である。3 is a block diagram illustrating an example of a hardware configuration and a software configuration of a cloud management computer according to the first embodiment. FIG. 実施例1の基盤管理計算機のハードウェア構成及びソフトウェア構成の一例を説明するブロック図である。FIG. 3 is a block diagram illustrating an example of a hardware configuration and a software configuration of the infrastructure management computer according to the first embodiment. 実施例1のクラウドユーザがポリシを入力する場合にポータルを介して表示される入力画面の一例を示す説明図である。It is explanatory drawing which shows an example of the input screen displayed via a portal when the cloud user of Example 1 inputs a policy. 実施例1のサービス要件管理情報の一例を示す説明図である。It is explanatory drawing which shows an example of the service requirement management information of Example 1. 実施例1のポリシ管理情報の一例を示す説明図である。It is explanatory drawing which shows an example of the policy management information of Example 1. FIG. 実施例1のDB障害対処法管理情報の一例を示す説明図である。FIG. 6 is an explanatory diagram illustrating an example of DB failure handling method management information according to the first embodiment. 実施例1のクラウド基盤構成情報の一例を示す説明図である。It is explanatory drawing which shows an example of the cloud infrastructure configuration information of Example 1. 実施例1の計算機リソース割当情報の一例を示す説明図である。FIG. 3 is an explanatory diagram illustrating an example of computer resource allocation information according to the first embodiment. 実施例1のサーバリソース使用状態情報の一例を示す説明図である。It is explanatory drawing which shows an example of the server resource usage status information of Example 1. 実施例1のストレージリソース使用状態情報の一例を示す説明図である。FIG. 3 is an explanatory diagram illustrating an example of storage resource usage state information according to the first embodiment. 実施例1のストレージ構成情報の一例を示す説明図である。FIG. 3 is an explanatory diagram illustrating an example of storage configuration information according to the first embodiment. 実施例1の対処手順管理情報の一例を示す説明図である。It is explanatory drawing which shows an example of the handling procedure management information of Example 1. FIG. 実施例1の対処手順管理情報の一例を示す説明図である。It is explanatory drawing which shows an example of the handling procedure management information of Example 1. FIG. 実施例1のクラウド管理計算機が実行する処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of processing executed by the cloud management computer according to the first embodiment. 実施例1のクラウド管理計算機が実行する対処手順生成処理(A)の一例を説明するフローチャートである。6 is a flowchart illustrating an example of a handling procedure generation process (A) executed by the cloud management computer according to the first embodiment. 実施例1のクラウド管理計算機が実行する対処手順生成処理(B)の一例を説明するフローチャートである。10 is a flowchart illustrating an example of a handling procedure generation process (B) executed by the cloud management computer according to the first embodiment. 実施例1の対処手順生成処理(B)を実行することによって生成された対処手順管理情報の一例を示す説明図である。It is explanatory drawing which shows an example of the handling procedure management information produced | generated by performing the handling procedure production | generation process (B) of Example 1. FIG. 実施例1のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of processing executed by the cloud management computer according to the first embodiment in accordance with handling procedure management information. 実施例1のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of processing executed by the cloud management computer according to the first embodiment in accordance with handling procedure management information. 実施例1のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of processing executed by the cloud management computer according to the first embodiment in accordance with handling procedure management information. 実施例1のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of processing executed by the cloud management computer according to the first embodiment in accordance with handling procedure management information. 実施例1のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of processing executed by the cloud management computer according to the first embodiment in accordance with handling procedure management information. 実施例1のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of processing executed by the cloud management computer according to the first embodiment in accordance with handling procedure management information. 実施例2の対処手順管理情報の一例を示す説明図である。It is explanatory drawing which shows an example of the handling procedure management information of Example 2. 実施例2のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。10 is a flowchart illustrating an example of processing executed by the cloud management computer according to the second embodiment in accordance with handling procedure management information. 実施例2のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。10 is a flowchart illustrating an example of processing executed by the cloud management computer according to the second embodiment in accordance with handling procedure management information. 実施例2のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。10 is a flowchart illustrating an example of processing executed by the cloud management computer according to the second embodiment in accordance with handling procedure management information. 実施例2のクラウド管理計算機が対処手順管理情報にしたがって実行する処理の一例を説明するフローチャートである。10 is a flowchart illustrating an example of processing executed by the cloud management computer according to the second embodiment in accordance with handling procedure management information.

以下に図面を参照しながら本発明の実施例を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、実施例1のクラウドサービスを実現するシステムの構成例を示す説明図である。   FIG. 1 is an explanatory diagram illustrating a configuration example of a system that implements the cloud service according to the first embodiment.

実施例1では、クラウドシステム90及びポータル30からシステムが構成される。クラウドシステム90及びポータル30は、ネットワーク40を介して接続される。なお、ネットワーク40は、インターネット等が考えられるが、ネットワークの種別に限定されない。また、クラウドシステム90及びポータル30の接続方式は、無線又は有線のいずれであってもよい。   In the first embodiment, the system includes the cloud system 90 and the portal 30. The cloud system 90 and the portal 30 are connected via the network 40. The network 40 may be the Internet or the like, but is not limited to the type of network. Further, the connection method between the cloud system 90 and the portal 30 may be either wireless or wired.

クラウドシステム90は、クラウドユーザ10の業務システムであるテナント50が構築されるシステムである。図1では、クラウドユーザ10が使用するテナント50の一例として、ロードバランサ60、Webサーバ70、及びDBサーバ80を含むWeb三階層システムを示す。なお、クラウドサービスでは、一般的に、ロードバランサ60、Webサーバ70、及びDBサーバ80は、後述する仮想計算機600を用いて実現される。   The cloud system 90 is a system in which a tenant 50 that is a business system of the cloud user 10 is constructed. In FIG. 1, a web three-tier system including a load balancer 60, a web server 70, and a DB server 80 is shown as an example of a tenant 50 used by the cloud user 10. In the cloud service, generally, the load balancer 60, the Web server 70, and the DB server 80 are realized using a virtual machine 600 described later.

クラウドシステム90には、各クラウドユーザ10のテナント50が共存するため、各テナント50に対応した運用が求められる。例えば、各テナント50のサービスレベルの異なる場合、サービスレベルに応じたテナント50の運用が求められる。   Since the tenant 50 of each cloud user 10 coexists in the cloud system 90, an operation corresponding to each tenant 50 is required. For example, when the service level of each tenant 50 is different, the operation of the tenant 50 according to the service level is required.

ポータル30は、クラウドユーザ10に提供されるユーザインタフェースである。クラウドユーザ10は、ポータル30を介して、サービスの申し込み、サービス内容の確認、又は、テナント50におけるリソースの監視等を行う。   The portal 30 is a user interface provided to the cloud user 10. The cloud user 10 applies for service, confirms service contents, or monitors resources in the tenant 50 via the portal 30.

実施例1では、クラウドユーザ10が利用料金を支払って、ネットワーク40を経由してクラウドシステム90が提供する計算機リソースを利用するクラウドサービスを想定する。また、実施例1では、DBサーバ80の性能劣化の原因がCPUリソースの不足である場合に実行される処理を説明する。   In the first embodiment, a cloud service in which the cloud user 10 pays a usage fee and uses a computer resource provided by the cloud system 90 via the network 40 is assumed. In the first embodiment, processing executed when the cause of performance degradation of the DB server 80 is a shortage of CPU resources will be described.

図2は、実施例1のクラウドシステム90の構成例を示す説明図である。   FIG. 2 is an explanatory diagram illustrating a configuration example of the cloud system 90 according to the first embodiment.

クラウドシステム90は、クラウド管理計算機100、基盤管理計算機200、ホスト計算機500、ネットワーク接続装置400、ストレージ装置300、及び課金計算機800から構成される。各装置は、管理用ネットワーク700を介してクラウド管理計算機100と接続する。   The cloud system 90 includes a cloud management computer 100, a infrastructure management computer 200, a host computer 500, a network connection device 400, a storage device 300, and a billing computer 800. Each device is connected to the cloud management computer 100 via the management network 700.

クラウド管理計算機100は、クラウドユーザ10に提供するクラウドサービスを管理する。クラウド管理計算機100のハードウェア構成及びソフトウェア構成は、図3を用いて後述する。基盤管理計算機200は、ホスト計算機500、ネットワーク接続装置400及びストレージ装置300から構成されるクラウド基盤の計算機リソースを管理する。例えば、基盤管理計算機200は、クラウドシステム90の監視、計算機リソースの割当、及び障害処理等を行う。課金計算機800は、クラウドユーザ10の利用状況に応じて、利用料金を算出する。   The cloud management computer 100 manages a cloud service provided to the cloud user 10. The hardware configuration and software configuration of the cloud management computer 100 will be described later with reference to FIG. The infrastructure management computer 200 manages cloud-based computer resources including the host computer 500, the network connection device 400, and the storage device 300. For example, the infrastructure management computer 200 performs monitoring of the cloud system 90, allocation of computer resources, failure processing, and the like. The billing computer 800 calculates a usage fee according to the usage status of the cloud user 10.

クラウド管理者20は、クラウド管理計算機100又は基盤管理計算機200を用いてクラウドシステム90を管理する。   The cloud administrator 20 manages the cloud system 90 using the cloud management computer 100 or the infrastructure management computer 200.

ホスト計算機500は、テナント50に割り当てる計算機リソースを提供する。なお、ホスト計算機500は、図示しないCPU、メモリ、I/Oデバイス及び記憶媒体を備える。実施例1では、複数のホスト計算機500を用いてクラスタ900が構成される。   The host computer 500 provides computer resources to be allocated to the tenant 50. The host computer 500 includes a CPU, memory, I / O device, and storage medium (not shown). In the first embodiment, a cluster 900 is configured using a plurality of host computers 500.

ホスト計算機500は、仮想化機能を有する。仮想化機能は例えばハイパバイザ等を用いて実現できる。ホスト計算機500は、仮想化機能を用いて一つ以上の仮想計算機600を生成し、また、管理する。   The host computer 500 has a virtualization function. The virtualization function can be realized using, for example, a hypervisor. The host computer 500 generates and manages one or more virtual computers 600 using a virtualization function.

仮想計算機600では、ゲストOS620が稼働する。また、ゲストOS620上では、アプリケーションとしてDB610が実行される。なお、本実施例は、ゲストOS620上で実行されるアプリケーションの種別に限定されない。   In the virtual machine 600, the guest OS 620 operates. On the guest OS 620, the DB 610 is executed as an application. The present embodiment is not limited to the type of application executed on the guest OS 620.

仮想計算機600は、仮想CPU、仮想メモリ等を有する。ゲストOS620又はDB610がアクセスするデータは、仮想ディスク630に格納される。また、一つのホスト計算機500には、ストレージ装置300によって提供されるボリューム640が割り当てられる。ホスト計算機500は、当該ボリューム640の一部の記憶領域を仮想ディスク630として各仮想計算機600に割り当てる。   The virtual computer 600 has a virtual CPU, a virtual memory, and the like. Data accessed by the guest OS 620 or the DB 610 is stored in the virtual disk 630. Further, a volume 640 provided by the storage apparatus 300 is allocated to one host computer 500. The host computer 500 allocates a part of the storage area of the volume 640 to each virtual computer 600 as a virtual disk 630.

ボリューム640は、ホスト計算機500が備えるHDD(Hard Disk Drive)等の記憶媒体を用いて実現してもよいし、後述するストレージ装置300の論理記憶領域310を用いて実現してもよい。   The volume 640 may be realized using a storage medium such as an HDD (Hard Disk Drive) provided in the host computer 500, or may be realized using a logical storage area 310 of the storage apparatus 300 described later.

ネットワーク接続装置400は、ホスト計算機500及びストレージ装置300を接続する。ホスト計算機500及びストレージ装置300を接続するネットワークは、例えば、SAN又はLAN等が考えられるがこれらに限定されない。   The network connection device 400 connects the host computer 500 and the storage device 300. The network connecting the host computer 500 and the storage apparatus 300 may be, for example, SAN or LAN, but is not limited thereto.

ストレージ装置300は、仮想計算機600が使用する記憶領域を提供する。ストレージ装置300は、図示しない、コントローラ、ディスクインタフェース、及び複数の記憶媒体を備える。   The storage device 300 provides a storage area used by the virtual machine 600. The storage apparatus 300 includes a controller, a disk interface, and a plurality of storage media (not shown).

実施例1のストレージ装置300は、シン・プロビジョニング機能を備え、複数の記憶媒体の各々の記憶領域を仮想的なストレージプール320として管理し、また、ストレージプール320の一部の記憶領域を用いて論理記憶領域310を生成する。また、ストレージ装置300は、論理記憶領域310をボリューム640等を実現する記憶領域としてホスト計算機500に提供する。   The storage apparatus 300 according to the first embodiment has a thin provisioning function, manages each storage area of a plurality of storage media as a virtual storage pool 320, and uses a part of the storage area of the storage pool 320. A logical storage area 310 is generated. The storage apparatus 300 provides the logical storage area 310 to the host computer 500 as a storage area for realizing the volume 640 or the like.

実施例1では、クラスタ900単位でストレージ装置300が提供する記憶領域を共有することによって、クラスタ900内のホスト計算機500間で仮想計算機600の配置を最適化が可能となる。   In the first embodiment, by sharing a storage area provided by the storage apparatus 300 in units of clusters 900, it is possible to optimize the arrangement of the virtual machines 600 among the host computers 500 in the cluster 900.

実施例1では、クラウド管理計算機100及び基盤管理計算機200をそれぞれ別々の計算機として記載しているが、一つの計算機を用いてクラウド管理計算機100及び基盤管理計算機200を実現してもよい。   In the first embodiment, the cloud management computer 100 and the infrastructure management computer 200 are described as separate computers, but the cloud management computer 100 and the infrastructure management computer 200 may be realized using a single computer.

図3は、実施例1のクラウド管理計算機100のハードウェア構成及びソフトウェア構成の一例を説明するブロック図である。   FIG. 3 is a block diagram illustrating an example of a hardware configuration and a software configuration of the cloud management computer 100 according to the first embodiment.

クラウド管理計算機100は、ハードウェア構成として、演算処理装置180、プログラムメモリ1000、データ入出力用キャッシュメモリ160、記憶媒体170、管理用通信インタフェース110、入力用インタフェース120、及び出力用インタフェース125を備える。クラウド管理計算機100の各構成はバス190を介して互いに接続される。   The cloud management computer 100 includes an arithmetic processing unit 180, a program memory 1000, a data input / output cache memory 160, a storage medium 170, a management communication interface 110, an input interface 120, and an output interface 125 as hardware configurations. . Each component of the cloud management computer 100 is connected to each other via a bus 190.

演算処理装置180は、CPU等の各種演算を行う装置である。演算処理装置180が、プログラムメモリ1000に格納されるプログラムを実行することによって、クラウド管理計算機100が備える機能を実現することができる。以下の説明では、プログラムを主体にして処理を説明する場合、演算処理装置180によって当該プログラムが実行されていることを示す。   The arithmetic processing unit 180 is a device that performs various calculations such as a CPU. When the arithmetic processing unit 180 executes a program stored in the program memory 1000, the functions of the cloud management computer 100 can be realized. In the following description, when a process is described mainly with a program, it indicates that the program is being executed by the arithmetic processing unit 180.

プログラムメモリ1000は、演算処理装置180が実行する各種プログラム及び各種プログラムが使用する情報を格納する。プログラムメモリ1000は、磁気記憶装置又は揮発性半導体メモリ等が考えられるがこれに限定されない。プログラムメモリ1000に格納される各種プログラム及び情報については後述する。   The program memory 1000 stores various programs executed by the arithmetic processing unit 180 and information used by the various programs. The program memory 1000 may be a magnetic storage device or a volatile semiconductor memory, but is not limited thereto. Various programs and information stored in the program memory 1000 will be described later.

データ入出力用キャッシュメモリ160は、クラウド管理計算機100に書き込まれるデータ又はクラウド管理計算機100から読み出されるデータを一時的に格納する。   The data input / output cache memory 160 temporarily stores data written to the cloud management computer 100 or data read from the cloud management computer 100.

記憶媒体170は、オペレーティングシステム及びアプリケーション等の各種プログラム及び情報を格納する。プログラムメモリ1000に格納される各種プログラム及び情報は、記憶媒体170に格納されてもよい。この場合、演算処理装置180が、記憶媒体170から各種プログラム及び情報を読み出し、プログラムメモリ1000にロードする。   The storage medium 170 stores various programs and information such as an operating system and applications. Various programs and information stored in the program memory 1000 may be stored in the storage medium 170. In this case, the arithmetic processing unit 180 reads various programs and information from the storage medium 170 and loads them into the program memory 1000.

管理用通信インタフェース110は、管理用ネットワーク700を介してクラウドシステム90内の装置と接続し、管理情報を入出力するためのインタフェースである。入力用インタフェース120は、クラウド管理者20が情報を入力するためのインタフェースである。出力用インタフェース125は、クラウド管理者20に情報を出力するためのインタフェースである。   The management communication interface 110 is an interface for connecting to a device in the cloud system 90 via the management network 700 and inputting / outputting management information. The input interface 120 is an interface for the cloud administrator 20 to input information. The output interface 125 is an interface for outputting information to the cloud administrator 20.

入力用インタフェース120は、例えば、キーボード及びマウス等が考えられる。また、出力用インタフェース125は、例えば、汎用ディスプレイ等が考えられる。   The input interface 120 may be a keyboard and a mouse, for example. The output interface 125 may be a general-purpose display, for example.

ここで、プログラムメモリ1000に格納される各種プログラム及び情報について説明する。   Here, various programs and information stored in the program memory 1000 will be described.

プログラムメモリ1000は、プログラムとして、サービス管理プログラム1010、ポリシ管理プログラム1011、対処法管理プログラム1012、DB対処手順生成プログラム1013、DB障害対策判定プログラム1014、課金管理プログラム1015、及び構成管理プログラム2012を格納する。また、プログラムメモリ1000は、情報として、サービス要件管理情報1001、ポリシ管理情報1002、DB障害対処法管理情報1003、対処手順管理情報1004、クラウド基盤構成情報2001、計算機リソース割当情報2002、サーバリソース使用状態情報2003、及びストレージリソース使用状態情報2004を格納する。   The program memory 1000 stores a service management program 1010, a policy management program 1011, a countermeasure management program 1012, a DB countermeasure procedure generation program 1013, a DB failure countermeasure determination program 1014, a charging management program 1015, and a configuration management program 2012 as programs. To do. The program memory 1000 includes service requirement management information 1001, policy management information 1002, DB failure handling method management information 1003, handling procedure management information 1004, cloud infrastructure configuration information 2001, computer resource allocation information 2002, and server resource usage. Stores status information 2003 and storage resource usage status information 2004.

サービス管理プログラム1010は、各クラウドユーザ10に提供されるサービス内容を管理するためのプログラムである。ポリシ管理プログラム1011は、対処法及び対処手順を選択する場合に使用されるポリシを管理するためのプログラムである。   The service management program 1010 is a program for managing service contents provided to each cloud user 10. The policy management program 1011 is a program for managing a policy used when selecting a countermeasure and a countermeasure procedure.

対処法管理プログラム1012は、DBサーバ80の障害に対する各対処法、及び各対処法の特徴を管理するためのプログラムである。DB対処手順生成プログラム1013は、サービス要件、ポリシ、及び対処法の特徴に基づいて、対処手順を生成するためのプログラムである。DB対処手順生成プログラム1013によって生成された対処手順は、対処手順管理情報1004として管理される。   The countermeasure management program 1012 is a program for managing each countermeasure against a failure of the DB server 80 and the characteristics of each countermeasure. The DB handling procedure generation program 1013 is a program for generating a handling procedure based on the characteristics of service requirements, policies, and handling methods. The coping procedure generated by the DB coping procedure generation program 1013 is managed as coping procedure management information 1004.

ここで、対処法とは、DBサーバ80の性能障害の原因に応じて、当該性能障害を改善するために行われるDBサーバ80の各種設定変更、及び構成変更等の制御方法を示す。また、対処手順とは、複数の対処法の集合であって、各対処法が適用できるか否かを判定する順番(判定順番)が決定されたものを示す。   Here, the coping method indicates a control method such as various setting changes and configuration changes of the DB server 80 which are performed to improve the performance failure according to the cause of the performance failure of the DB server 80. The coping procedure is a set of coping methods, and the order in which it is determined whether each coping method can be applied (determination order) is determined.

DB障害対策判定プログラム1014は、テナント50のリソース確保方法及び計算機リソースの空き状態等に基づいて、DB対処手順生成プログラム1013によって生成された対処手順に含まれる各対処法が実行可能か否か判定するためのプログラムである。課金管理プログラム1015は、クラウドシステム90を用いてクラウドサービスを提供するクラウドプロバイダに対して、クラウドユーザ10が支払う料金を管理するためのプログラムである。構成管理プログラム2012については、図4を用いて説明する。   The DB failure countermeasure determination program 1014 determines whether each countermeasure included in the countermeasure procedure generated by the DB countermeasure procedure generation program 1013 can be executed based on the resource securing method of the tenant 50, the availability of computer resources, and the like. It is a program to do. The billing management program 1015 is a program for managing a fee paid by the cloud user 10 to a cloud provider that provides a cloud service using the cloud system 90. The configuration management program 2012 will be described with reference to FIG.

なお、各種情報の詳細は、各種図面を用いて後述する。具体的には、サービス要件管理情報1001については図6、ポリシ管理情報1002については図7、DB障害対処法管理情報1003については図8、対処手順管理情報1004については図14A及び図14B、クラウド基盤構成情報2001については図9、計算機リソース割当情報2002については図10、サーバリソース使用状態情報2003については図11、ストレージリソース使用状態情報2004については図12を用いて後述する。   Details of the various information will be described later with reference to various drawings. Specifically, FIG. 6 shows the service requirement management information 1001, FIG. 7 shows the policy management information 1002, FIG. 8 shows the DB failure handling management information 1003, and FIGS. 14A and 14B show the handling procedure management information 1004. The infrastructure configuration information 2001 will be described later with reference to FIG. 9, the computer resource allocation information 2002 with reference to FIG. 10, the server resource usage status information 2003 with reference to FIG. 11, and the storage resource usage status information 2004 with reference to FIG.

なお、課金計算機800もクラウド管理計算機100と同一のハードウェア構成であるものとする。課金計算機800のプログラムメモリ1000には、利用料金を算出する課金プログラム、及び利用料金を算出するための情報等が格納される。   It is assumed that the billing computer 800 has the same hardware configuration as the cloud management computer 100. The program memory 1000 of the billing computer 800 stores a billing program for calculating a usage fee, information for calculating the usage fee, and the like.

図4は、実施例1の基盤管理計算機200のハードウェア構成及びソフトウェア構成の一例を説明するブロック図である。基盤管理計算機200はクラウドシステムの監視、リソース割当、障害対応を行うものである。   FIG. 4 is a block diagram illustrating an example of a hardware configuration and a software configuration of the infrastructure management computer 200 according to the first embodiment. The infrastructure management computer 200 performs cloud system monitoring, resource allocation, and failure handling.

基盤管理計算機200は、ハードウェア構成として、演算処理装置280、プログラムメモリ2000、データ入出力用キャッシュメモリ260、記憶媒体270、管理用通信インタフェース210、入力用インタフェース220、及び出力用インタフェース225を備える。基盤管理計算機200の各構成はバス290を介して互いに接続される。   The infrastructure management computer 200 includes an arithmetic processing unit 280, a program memory 2000, a data input / output cache memory 260, a storage medium 270, a management communication interface 210, an input interface 220, and an output interface 225 as hardware configurations. . Each component of the infrastructure management computer 200 is connected to each other via a bus 290.

なお、演算処理装置280、プログラムメモリ2000、データ入出力用キャッシュメモリ260、記憶媒体270、管理用通信インタフェース210、入力用インタフェース220、及び出力用インタフェース225は、それぞれ、演算処理装置180、プログラムメモリ1000、データ入出力用キャッシュメモリ160、記憶媒体170、管理用通信インタフェース110、入力用インタフェース120、及び出力用インタフェース125と同一のものであるため説明を省略する。   The arithmetic processing unit 280, the program memory 2000, the data input / output cache memory 260, the storage medium 270, the management communication interface 210, the input interface 220, and the output interface 225 are respectively the arithmetic processing unit 180 and the program memory. 1000, the data input / output cache memory 160, the storage medium 170, the management communication interface 110, the input interface 120, and the output interface 125 are the same and will not be described.

なお、以下の説明では、プログラムを主体にして処理を説明する場合、演算処理装置280によって当該プログラムが実行されていることを示す。   In the following description, when a process is described mainly with a program, it indicates that the program is being executed by the arithmetic processing unit 280.

プログラムメモリ2000は、プログラムとして、DB障害検知プログラム2010、DBボトルネック分析プログラム2011、構成管理プログラム2012、DB障害復旧プログラム2013、及びリソース監視プログラム2014を格納する。また、プログラムメモリ2000は、情報として、クラウド基盤構成情報2001、計算機リソース割当情報2002、サーバリソース使用状態情報2003、ストレージリソース使用状態情報2004、及びストレージ構成情報2005を格納する。   The program memory 2000 stores a DB failure detection program 2010, a DB bottleneck analysis program 2011, a configuration management program 2012, a DB failure recovery program 2013, and a resource monitoring program 2014 as programs. Further, the program memory 2000 stores, as information, cloud infrastructure configuration information 2001, computer resource allocation information 2002, server resource usage status information 2003, storage resource usage status information 2004, and storage configuration information 2005.

DB障害検知プログラム2010は、DBサーバ80の障害を検知し、クラウド管理者20及びクラウド管理計算機100に障害の発生を通知するためのプログラムである。DBボトルネック分析プログラム2011は、障害が発生したDBサーバ80のボトルネックを分析するためのプログラムである。DBボトルネック分析プログラム2011は、例えば、CPUリソースの不足、又はI/Oレイテンシ不足等の性能劣化の原因(ボトルネック)を特定し、特定された原因をクラウド管理者20及びクラウド管理計算機100に通知する。   The DB failure detection program 2010 is a program for detecting a failure of the DB server 80 and notifying the cloud administrator 20 and the cloud management computer 100 of the occurrence of the failure. The DB bottleneck analysis program 2011 is a program for analyzing the bottleneck of the DB server 80 in which a failure has occurred. The DB bottleneck analysis program 2011 identifies a cause (bottleneck) of performance degradation such as CPU resource shortage or I / O latency shortage, and identifies the identified cause to the cloud administrator 20 and the cloud management computer 100. Notice.

構成管理プログラム2012は、クラウドシステム90の構成に変更があった場合に、クラウドシステム90に関する情報を取得し、取得された情報を管理するためのプログラムである。DB障害復旧プログラム2013は、対処法に基づいて計算機リソースの追加等の構成変更処理を実行するためのプログラムである。リソース監視プログラム2014は、クラウドシステム90における基盤の性能、及び各計算機リソースのリソース量等の稼働情報を取得するためのプログラムである。   The configuration management program 2012 is a program for acquiring information about the cloud system 90 and managing the acquired information when the configuration of the cloud system 90 is changed. The DB failure recovery program 2013 is a program for executing configuration change processing such as addition of computer resources based on a countermeasure. The resource monitoring program 2014 is a program for acquiring operating information such as the performance of the platform in the cloud system 90 and the resource amount of each computer resource.

クラウド基盤構成情報2001、計算機リソース割当情報2002、サーバリソース使用状態情報2003、及びストレージリソース使用状態情報2004は、クラウド管理計算機100が保持する情報と同一のものである。ストレージ構成情報2005の詳細については、図13を用いて後述する。   The cloud infrastructure configuration information 2001, the computer resource allocation information 2002, the server resource usage status information 2003, and the storage resource usage status information 2004 are the same as the information held by the cloud management computer 100. Details of the storage configuration information 2005 will be described later with reference to FIG.

図5は、実施例1のクラウドユーザ10がポリシを入力する場合にポータル30を介して表示される入力画面の一例を示す説明図である。   FIG. 5 is an explanatory diagram illustrating an example of an input screen displayed via the portal 30 when the cloud user 10 according to the first embodiment inputs a policy.

図5に示す入力画面は、性能保証オプションを適用しているクラウドユーザ10に対して提供される。クラウドユーザ10は、当該入力画面を用いて、DB障害に対する対処手順の生成ポリシを設定する。具体的には、クラウドユーザ10は、対象の仮想計算機600を選択し、対象の仮想計算機600の性能障害に対するポリシを指定する。なお、対象の仮想計算機600は、DBサーバ80を実現する仮想計算機600であるものとする。   The input screen illustrated in FIG. 5 is provided to the cloud user 10 to which the performance guarantee option is applied. The cloud user 10 sets a policy for generating a handling procedure for a DB failure using the input screen. Specifically, the cloud user 10 selects the target virtual machine 600 and designates a policy for the performance failure of the target virtual machine 600. The target virtual computer 600 is assumed to be the virtual computer 600 that implements the DB server 80.

クラウドユーザ10は、対象の仮想計算機600として、テナント50内の全仮想計算機600を選択してもよいし、また、個々の仮想計算機600を選択してもよい。また、クラウドユーザ10は、対象の仮想計算機600に対して、「物理サーバの移行なし」、「無停止」、「処理時間重視」等のポリシを指定できる。   The cloud user 10 may select all the virtual machines 600 in the tenant 50 as the target virtual machine 600, or may select individual virtual machines 600. In addition, the cloud user 10 can designate a policy such as “no physical server migration”, “non-stop”, and “emphasis on processing time” for the target virtual machine 600.

なお、当該入力画面を用いたポリシの入力が行われない場合、予めクラウド管理計算機100に設定されたデフォルトのポリシに基づいて、対処手順が生成される。   When no policy is input using the input screen, a handling procedure is generated based on a default policy set in the cloud management computer 100 in advance.

図6は、実施例1のサービス要件管理情報1001の一例を示す説明図である。   FIG. 6 is an explanatory diagram illustrating an example of the service requirement management information 1001 according to the first embodiment.

サービス要件管理情報1001は、テナント50のサービス契約内容、及びDBサーバ80を実現する仮想計算機600上で稼働する業務情報等を含む各テナント50のサービス要件を管理するための情報である。サービス要件管理情報1001は、テナント識別子10011、仮想計算機識別子10012、及びサービス要件10013を含む。   The service requirement management information 1001 is information for managing the service requirements of each tenant 50 including the service contract contents of the tenant 50 and business information operating on the virtual computer 600 that implements the DB server 80. The service requirement management information 1001 includes a tenant identifier 10011, a virtual machine identifier 10012, and a service requirement 10013.

テナント識別子10011は、テナント50の識別情報を格納する。仮想計算機識別子10012は、テナント50に含まれる仮想計算機600のうち、DBサーバ80に対応する仮想計算機600の識別情報を格納する。   The tenant identifier 10011 stores identification information of the tenant 50. The virtual machine identifier 10012 stores identification information of the virtual machine 600 corresponding to the DB server 80 among the virtual machines 600 included in the tenant 50.

サービス要件10013は、テナント50の管理情報及びクラウドサービスの利用開始時に契約されたサービス要件を格納するカラムである。サービス要件10013は、さらに、性能保証オプション10014、割当保証項目10015、無停止運用10016、課金10017を含む。   The service requirement 10013 is a column for storing the management information of the tenant 50 and the service requirement contracted at the start of use of the cloud service. The service requirement 10013 further includes a performance guarantee option 10014, an allocation guarantee item 10015, non-stop operation 10016, and billing 10017.

性能保証オプション10014は、仮想計算機600に対して設定された性能保証に関するオプション情報を格納するカラムであり、適用状態100141及び対象100142を含む。   The performance guarantee option 10014 is a column for storing option information related to the performance guarantee set for the virtual computer 600, and includes an application state 100141 and a target 100142.

適用状態100141が「あり」の場合、性能保証オプションが申し込まれていることを示し、適用状態100141が「なし」の場合、性能保証オプションが申し込まれていないことを示す。対象100142は、性能を保証する対象を示す。対象100142が「VM」の場合、テナント50における性能の劣化が発生時に、仮想計算機600に対して後述する対処手順が適用される。   When the application state 100141 is “present”, it indicates that a performance guarantee option is applied, and when the application state 100141 is “none”, it indicates that a performance guarantee option is not applied. A target 100142 indicates a target whose performance is guaranteed. When the target 100142 is “VM”, a coping procedure described later is applied to the virtual machine 600 when performance degradation in the tenant 50 occurs.

割当保証項目10015は、計算機リソースの割当てにおいて保証が必要な計算機リソースに関する情報を格納するカラムであり、リソース割当100151及びハードウェア指定100152を含む。   The allocation guarantee item 10015 is a column for storing information related to computer resources that need to be guaranteed in the allocation of computer resources, and includes resource allocation 100151 and hardware designation 100152.

リソース割当100151は、保証が必要な計算機リソースを示すリソース割当100151、及び保証すべき計算機リソースの設定値である保証値100154を含む。対象100153が「CPU」かつ保証値100154が「上限値:4GHz」の場合、割り当てられるCPUの周波数の上限値が4GHzであることを示す。対象100153が「CPU」かつ保証値100154が「割当値:1GHz」の場合、必ず、CPUの周波数として1GHz割り当てられることを示す。なお、特に計算機リソースの割当ての保証が設定されていない仮想計算機600については、対象100153に「なし」、保証値100154には「Null」が格納される。   The resource allocation 100151 includes a resource allocation 100151 indicating a computer resource that needs to be guaranteed, and a guaranteed value 100154 that is a setting value of the computer resource to be guaranteed. When the target 100153 is “CPU” and the guaranteed value 100154 is “upper limit value: 4 GHz”, it indicates that the upper limit value of the assigned CPU frequency is 4 GHz. When the target 100153 is “CPU” and the guaranteed value 100154 is “assigned value: 1 GHz”, it means that 1 GHz is always assigned as the CPU frequency. In particular, for the virtual computer 600 for which the guarantee of computer resource allocation is not set, “None” is stored in the target 100153 and “Null” is stored in the guaranteed value 100154.

ハードウェア指定100152は、サーバ占有のように、ハードウェア単位で性能保証が指定されているか否かを示す情報を格納する。なお、特にハードウェア単位の性能保証の指定がされていない場合、ハードウェア指定100152には「なし」が格納される。   The hardware specification 100152 stores information indicating whether performance guarantee is specified in units of hardware, such as server occupation. It should be noted that “None” is stored in the hardware designation 100152 when the performance guarantee is not designated in hardware units.

無停止運用10016は、仮想計算機600について無停止運用の必要があるか否かを示す情報を格納する。無停止運用10016が「要」の場合、無停止運用が必要であることを示し、無停止運用10016が「不要」の場合、無停止運用が必要でないことを示す。   The non-stop operation 10016 stores information indicating whether or not non-stop operation is necessary for the virtual computer 600. When the non-stop operation 10016 is “necessary”, it indicates that the non-stop operation is necessary, and when the non-stop operation 10016 is “unnecessary”, it indicates that the non-stop operation is not necessary.

課金10017は、テナント50の利用料金に関する情報を格納するカラムであり、体系100171及び当月支払予定額100172を含む。課金10017に設定される値は、クラウド管理計算機100が課金計算機800と連携することによって取得される。   The billing 10017 is a column for storing information related to the usage fee of the tenant 50, and includes a system 100171 and a scheduled payment amount 100172 for the current month. The value set in the billing 10017 is acquired when the cloud management computer 100 cooperates with the billing computer 800.

体系100171は、利用料金の体系に関する情報を格納する。例えば、体系100171が「定額」の場合、テナント50を利用するクラウドユーザ10は定額の利用料金を支払う契約をしていることを示す。また、体系100171が「従量課金」の場合、テナント50を利用するクラウドユーザ10は、計算機リソースの割当量に応じて利用料金を支払う契約をしていることを示す。   The system 100171 stores information related to the usage fee system. For example, when the system 100171 is “fixed amount”, it indicates that the cloud user 10 using the tenant 50 has a contract to pay a fixed amount of usage fee. Further, when the system 100171 is “pay-as-you-go”, it indicates that the cloud user 10 using the tenant 50 has contracted to pay a usage fee according to the allocated amount of computer resources.

なお、本実施例では、利用料金の体系が「定額」の場合、全ての対処法が対象となり、利用料金の体系が「従量課金」の場合、原則、追加料金が発生しない対処法のみが対象となるものとする。すなわち、「定額」は利用料金が「従量課金」より高いが、追加料金が発生することなく、テナント50の性能保証に対応できる。一方、「従量課金」は利用料金が低いが、テナント50の性能保証には追加料金が発生する。   In this example, when the usage fee system is “Flat”, all countermeasures are applicable. When the usage fee system is “pay-as-you-go”, in principle, only the countermeasures that do not incur additional charges are applicable. It shall be That is, although the “fixed amount” has a higher usage fee than “pay-as-you-go”, it can cope with the performance guarantee of the tenant 50 without incurring an additional fee. On the other hand, “usage-based billing” has a low usage fee, but an additional fee is incurred to guarantee the performance of the tenant 50.

当月支払予定額100172は、クラウドユーザ10がクラウドサービスを提供するクラウドプロバイダに支払う利用料金を格納する。   The scheduled payment amount 100172 of this month stores the usage fee that the cloud user 10 pays to the cloud provider that provides the cloud service.

図7は、実施例1のポリシ管理情報1002の一例を示す説明図である。   FIG. 7 is an explanatory diagram illustrating an example of the policy management information 1002 according to the first embodiment.

ポリシ管理情報1002は、後述する対処手順を生成する際に使用されるポリシを管理するための情報である。ポリシ管理情報1002は、テナント識別子10021、仮想計算機識別子10022、及びポリシ10023を含む。   The policy management information 1002 is information for managing a policy used when generating a handling procedure described later. The policy management information 1002 includes a tenant identifier 10021, a virtual machine identifier 10022, and a policy 10023.

テナント識別子10021及び仮想計算機識別子10022は、テナント識別子10011及び仮想計算機識別子10012と同一のものである。   The tenant identifier 10021 and the virtual machine identifier 10022 are the same as the tenant identifier 10011 and the virtual machine identifier 10012.

ポリシ10023は、クラウドユーザ10によって各仮想計算機600に対して設定されたポリシを格納する。クラウドユーザ10は、図5に示すような入力画面を用いてポリシを設定する。なお、仮想計算機600に対して特にポリシが設定されていない場合、ポリシ10023には「Null」が格納される。   The policy 10023 stores the policy set for each virtual machine 600 by the cloud user 10. The cloud user 10 sets a policy using an input screen as shown in FIG. If no policy is set for the virtual machine 600, “Null” is stored in the policy 10023.

図8は、実施例1のDB障害対処法管理情報1003の一例を示す説明図である。   FIG. 8 is an explanatory diagram illustrating an example of the DB failure countermeasure management information 1003 according to the first embodiment.

DB障害対処法管理情報1003は、DBサーバ80の障害発生時の対処法及び各対処法の特徴を管理するための情報である。DB障害対処法管理情報1003は、ボトルネック箇所10031、対処法10032、及び特徴10033を含む。   The DB failure handling method management information 1003 is information for managing a handling method when a failure occurs in the DB server 80 and the characteristics of each handling method. The DB failure handling method management information 1003 includes a bottleneck location 10031, a handling method 10032, and a feature 10033.

ボトルネック箇所10031は、ボトルネックとして特定された計算機リソースの種別を格納する。対処法10032は、性能劣化を解消するための具体的な対処法を格納する。実施例1では、DB障害対処法管理情報1003において、ボトルネックの種別、すなわち、計算機リソースの種別毎に複数の対処法が管理される。   The bottleneck location 10031 stores the type of computer resource specified as the bottleneck. The coping method 10032 stores a specific coping method for eliminating the performance degradation. In the first embodiment, in the DB failure handling method management information 1003, a plurality of handling methods are managed for each type of bottleneck, that is, for each type of computer resource.

特徴10033は、対処法の特徴に関する情報を格納するカラムであり、無停止10034、影響10035、平均処理時間10036、物理サーバ移行10037、及び追加料金10038を含む。   A feature 1003 is a column for storing information about the feature of the countermeasure, and includes non-stop 10034, an influence 10033, an average processing time 10030, a physical server migration 10030, and an additional charge 10030.

無停止10034は、対処法に対応する処理が実行された場合に仮想計算機600を再起動することなくサービスを継続できるか否かを示す情報を格納する。実施例1では、無停止10034が「該当」の場合、仮想計算機600を再起動することなくサービスを継続できることを示し、無停止10034が「非該当」の場合、仮想計算機600を再起動する必要があり、サービスが中断することを示す。   The non-stop 10034 stores information indicating whether or not the service can be continued without restarting the virtual computer 600 when the process corresponding to the countermeasure is executed. In the first embodiment, when the non-stop 10034 is “applicable”, it indicates that the service can be continued without restarting the virtual computer 600. When the non-stop 10034 is “non-applicable”, the virtual computer 600 needs to be restarted. Indicates that the service will be interrupted.

影響10035は、対処法に対応する処理が実行された場合、ホスト計算機500又は仮想計算機600に与える影響の大きさを示す情報を格納する。平均処理時間10036は、対処法に対応する処理が完了するまでの平均処理時間を格納する。   The influence 1003 stores information indicating the magnitude of the influence on the host computer 500 or the virtual machine 600 when the processing corresponding to the countermeasure is executed. The average processing time 10036 stores the average processing time until the processing corresponding to the countermeasure is completed.

なお、影響10035及び平均処理時間10036には、各対処法の相対的な重みを格納してもよい。この場合、クラウド管理計算機100は、性能の劣化が検知された仮想計算機600が特定された場合、重み及びデータ量等から値を算出する。   Note that the relative weight of each countermeasure may be stored in the influence 10033 and the average processing time 10033. In this case, the cloud management computer 100 calculates a value from the weight, the data amount, and the like when the virtual computer 600 in which the performance deterioration is detected is specified.

物理サーバ移行10037は、対処法に対応する処理を実行する場合に、仮想計算機600を、現在稼働しているホスト計算機500から他のホスト計算機500に移行させる必要があるか否かを示す情報を格納する。物理サーバ移行10037が「あり」の場合、ホスト計算機500間で仮想計算機600を移行させる必要があることを示し、物理サーバ移行10037が「なし」の場合、ホスト計算機500間で仮想計算機600を移行させる必要がないことを示す。   The physical server migration 1003 indicates information indicating whether or not the virtual computer 600 needs to be migrated from the currently running host computer 500 to another host computer 500 when executing processing corresponding to the countermeasure. Store. When the physical server migration 10037 is “present”, it indicates that the virtual computer 600 needs to be migrated between the host computers 500. When the physical server migration 10037 is “none”, the virtual computer 600 is migrated between the host computers 500. Indicates that there is no need to

追加料金10038は、課金体系毎に、対処法に対応する処理が実行された場合に追加料金が発生するか否かを示す情報を格納する。具体的には、追加料金10038は、定額100381及び従量課金100382を含む。定額100381は、課金体系が定額の場合に追加料金が発生するか否かを示す情報を格納し、従量課金100382は、課金体系が従量課金の場合に追加料金が発生するか否かを示す情報を格納する。   The additional charge 10030 stores information indicating whether or not an additional charge is generated when processing corresponding to the countermeasure is executed for each charging system. Specifically, the additional fee 1000038 includes a fixed amount 1000038 and a pay-per-use 1000038. The fixed amount 10031 stores information indicating whether or not an additional fee is generated when the charging system is a fixed amount, and the pay-per-use 10032 is information indicating whether or not an additional fee is generated when the charging system is a pay-per-use charge. Is stored.

なお、定額100381及び従量課金100382には、料金そのものが格納されてもよい。   Note that the charge itself may be stored in the fixed amount 10000381 and the pay-per-use charge 100322.

特徴10033に含まれるカラムのうち、無停止10034、影響10035、平均処理時間10036、及び物理サーバ移行10037は、対処法に対応する処理に関する処理コストを表し、追加料金10038はテナント50の利用コストを表す。   Among the columns included in the feature 10033, the non-stop 10033, the influence 10033, the average processing time 10033, and the physical server migration 10033 represent the processing cost related to the processing corresponding to the countermeasure, and the additional charge 10030 indicates the usage cost of the tenant 50. Represent.

なお、クラウド管理計算機100は、使用率のトレンドと突き合わせて、対処法が実行された後に、再度、性能劣化が発生する時期を算出し、当該時期を特徴10033として管理してもよい。これによって、例えば、対処法の実行頻度を減らしたい場合、クラウド管理計算機100は、性能劣化の発生時期が遅い対処法を優先的に選択できる。   The cloud management computer 100 may calculate the time when the performance deterioration occurs again after the countermeasure is executed in accordance with the trend of the usage rate, and manage the time as the feature 10033. Accordingly, for example, when it is desired to reduce the execution frequency of the countermeasure, the cloud management computer 100 can preferentially select a countermeasure with a late performance degradation occurrence time.

図9は、実施例1のクラウド基盤構成情報2001の一例を示す説明図である。   FIG. 9 is an explanatory diagram illustrating an example of the cloud infrastructure configuration information 2001 according to the first embodiment.

クラウド基盤構成情報2001は、ホスト計算機500上で稼働する仮想計算機600に割り当てられるCPU、メモリ等の情報、及び仮想計算機600が利用可能な記憶領域に関する情報を管理するための情報である。具体的には、クラウド基盤構成情報2001は、仮想計算機識別子20011、物理計算機識別子20012、サーバリソース20013、及びストレージ20014を含む。   The cloud infrastructure configuration information 2001 is information for managing information related to a storage area that can be used by the virtual machine 600, and information such as CPU and memory allocated to the virtual machine 600 running on the host computer 500. Specifically, the cloud infrastructure configuration information 2001 includes a virtual machine identifier 20011, a physical machine identifier 20012, a server resource 20013, and a storage 201414.

仮想計算機識別子20011は、仮想計算機識別子10012と同一のものである。物理計算機識別子20012は、仮想計算機600が稼働するホスト計算機500の識別情報を格納する。   The virtual machine identifier 20011 is the same as the virtual machine identifier 10012. The physical computer identifier 20012 stores identification information of the host computer 500 on which the virtual computer 600 operates.

サーバリソース20013は、仮想計算機600の計算機リソースと、ホスト計算機500が有する計算機リソースとの対応関係に関する情報を格納するカラムである。サーバリソース20013は、CPU200131及びメモリ200132を含む。   The server resource 20013 is a column that stores information regarding the correspondence between the computer resource of the virtual computer 600 and the computer resource of the host computer 500. The server resource 20013 includes a CPU 200131 and a memory 200132.

CPU200131は、さらに、仮想及び物理の二つのカラムを含む。CPU200131の仮想のカラムは、仮想計算機600が有する仮想CPUの識別情報を格納し、CPU200131の物理のカラムは、仮想CPUにCPUリソースを割り当てる物理CPUの識別情報を格納する。なお、一つの仮想CPUに二つ以上の物理CPUが割り当てられてもよいし、複数の仮想CPUが一つの物理CPUを共有するように割り当てられてもよい。   The CPU 200131 further includes two columns, virtual and physical. The virtual column of the CPU 200131 stores the identification information of the virtual CPU included in the virtual computer 600, and the physical column of the CPU 200131 stores the identification information of the physical CPU that allocates the CPU resource to the virtual CPU. Two or more physical CPUs may be assigned to one virtual CPU, or a plurality of virtual CPUs may be assigned to share one physical CPU.

メモリ200132は、さらに、仮想及び物理の二つのカラムを含む。メモリ200132の仮想のカラムは、仮想計算機600が有する仮想メモリの識別情報を格納し、メモリ200132の物理のカラムは、仮想メモリにリソースを割り当てる物理メモリの識別情報を格納する。   Memory 200132 further includes two columns, virtual and physical. The virtual column of the memory 200132 stores the identification information of the virtual memory included in the virtual computer 600, and the physical column of the memory 200132 stores the identification information of the physical memory that allocates resources to the virtual memory.

ストレージ20014は、ストレージ装置300によって提供され、かつ、ホスト計算機500が利用可能な記憶領域に関する情報を格納するカラムであり、仮想ディスク識別子200141及びボリューム識別子200142を含む。   The storage 20014 is a column that is provided by the storage apparatus 300 and stores information related to a storage area that can be used by the host computer 500, and includes a virtual disk identifier 200141 and a volume identifier 200142.

仮想ディスク識別子200141は、仮想ディスク630の識別情報を格納する。ボリューム識別子200142は、仮想ディスク630に記憶領域を提供するボリューム640の識別情報を格納する。   The virtual disk identifier 200141 stores identification information of the virtual disk 630. The volume identifier 200142 stores identification information of the volume 640 that provides a storage area for the virtual disk 630.

図10は、実施例1の計算機リソース割当情報2002の一例を示す説明図である。   FIG. 10 is an explanatory diagram of an example of the computer resource allocation information 2002 according to the first embodiment.

計算機リソース割当情報2002は、ホスト計算機500上で稼働する仮想計算機600に割り当てられる計算機リソースの確保形態、及び使用量に関する情報、並びに、複数の仮想計算機600を用いたHA構成を管理するための情報である。具体的には、計算機リソース割当情報2002は、物理計算機識別子20021、仮想計算機識別子20022、割当20023、及びHA構成状態20024を含む。   The computer resource allocation information 2002 is information related to the allocation type and usage of computer resources allocated to the virtual computer 600 operating on the host computer 500, and information for managing the HA configuration using the plurality of virtual computers 600. It is. Specifically, the computer resource allocation information 2002 includes a physical computer identifier 20021, a virtual computer identifier 200222, an allocation 20023, and an HA configuration state 20022.

物理計算機識別子20021は、物理計算機識別子20012と同一のものである。また、仮想計算機識別子20022は、仮想計算機識別子10012と同一のものである。なお、仮想計算機識別子20022には、物理計算機識別子20021に対応するホスト計算機500上で稼働する仮想計算機600の識別情報が格納される。   The physical computer identifier 200021 is the same as the physical computer identifier 20012. Further, the virtual machine identifier 20022 is the same as the virtual machine identifier 10012. The virtual computer identifier 20022 stores identification information of the virtual computer 600 operating on the host computer 500 corresponding to the physical computer identifier 200221.

割当20023は、仮想計算機600に割り当てられる計算機リソースに関する情報を格納するカラムであり、計算機リソース種別200231、確保形態200232、及び実使用量200233を含む。   The allocation 20023 is a column for storing information related to the computer resources allocated to the virtual computer 600, and includes a computer resource type 200231, a reservation form 2002022, and an actual usage amount 2000023.

計算機リソース種別200231は、計算機リソースの種別に関する情報を格納する。確保形態200232は、サービスの契約内容又はサービスの運用によって決定される確保形態に関する情報を格納する。実使用量200233は、実際に使用されている計算機リソース量を格納する。   The computer resource type 200201 stores information related to the type of computer resource. The reservation form 200202 stores information related to the reservation form determined by the service contract or service operation. The actual use amount 2002003 stores the computer resource amount actually used.

HA構成状態20024は、HAが構成されているか否かを示す情報を格納する。HA構成状態20024が「あり」の場合、HAが構成されていることを示し、HA構成状態20024が「なし」の場合、HAが構成されていないことを示す。   The HA configuration state 20024 stores information indicating whether the HA is configured. When the HA configuration state 20024 is “present”, it indicates that the HA is configured, and when the HA configuration state 20024 is “not present”, it indicates that the HA is not configured.

図11は、実施例1のサーバリソース使用状態情報2003の一例を示す説明図である。   FIG. 11 is an explanatory diagram illustrating an example of the server resource usage state information 2003 according to the first embodiment.

サーバリソース使用状態情報2003は、ホスト計算機500におけるCPU、メモリ等の計算機リソースの使用状態及び空き容量を管理するための情報である。具体的には、サーバリソース使用状態情報2003は、クラスタ識別子20031、物理計算機識別子20032、及びサーバリソース使用状態20033を含む。   The server resource usage status information 2003 is information for managing the usage status and free capacity of computer resources such as CPU and memory in the host computer 500. Specifically, the server resource usage status information 2003 includes a cluster identifier 20003, a physical computer identifier 20032, and a server resource usage status 20003.

クラスタ識別子20031は、クラスタ900の識別情報を格納する。物理計算機識別子20032は、物理計算機識別子20012と同一のものであり、クラスタ900に含まれるホスト計算機500の識別情報を格納する。   The cluster identifier 20031 stores identification information of the cluster 900. The physical computer identifier 20032 is the same as the physical computer identifier 20012, and stores identification information of the host computer 500 included in the cluster 900.

サーバリソース使用状態20033は、ホスト計算機500が備える計算機リソースに関する情報を格納するカラムであり、計算機リソース200331、使用量200332、及び空き容量200333を含む。   The server resource usage state 20033 is a column for storing information related to the computer resources included in the host computer 500, and includes a computer resource 200031, a usage amount 200032, and a free capacity 2003.3.

計算機リソース200331は、ホスト計算機500が備える計算機リソースの識別情報を格納する。使用量200332は、実際に使用されている計算機リソース量の値を格納する。空き容量200333は、使用されていない計算機リソース量の値を格納する。   The computer resource 200031 stores computer resource identification information included in the host computer 500. The usage amount 20032 stores the value of the computer resource amount actually used. The free capacity 20033 stores the value of the computer resource amount that is not used.

なお、使用量200332及び空き容量200333には、リソース監視プログラム2014によって取得された値が格納される。   It should be noted that values used by the resource monitoring program 2014 are stored in the used amount 20032 and the free space 20033.

図12は、実施例1のストレージリソース使用状態情報2004の一例を示す説明図である。   FIG. 12 is an explanatory diagram of an example of the storage resource usage state information 2004 according to the first embodiment.

ストレージリソース使用状態情報2004は、論理記憶領域310及びストレージプール320の容量及びIOPS等を管理するための情報である。具体的には、ストレージリソース使用状態情報2004は、ボリューム識別子20041、論理記憶領域20042、及びストレージプール20043を含む。   The storage resource usage status information 2004 is information for managing the capacity and IOPS of the logical storage area 310 and the storage pool 320. Specifically, the storage resource usage state information 2004 includes a volume identifier 20041, a logical storage area 20042, and a storage pool 20043.

ボリューム識別子20041は、ボリューム識別子200142と同一のものである。   The volume identifier 20009 is the same as the volume identifier 200142.

論理記憶領域20042は、ボリューム640に対応付けられる論理記憶領域310に関する情報を格納するカラムであり、論理記憶領域識別子200421、容量200422、及びIOPS200423を含む。   The logical storage area 20004 is a column for storing information related to the logical storage area 310 associated with the volume 640, and includes a logical storage area identifier 2000411, a capacity 200042, and an IOPS 200093.

論理記憶領域識別子200421は、論理記憶領域識別子200133と同一のものであり、ボリューム640に対応付けられる論理記憶領域310の識別情報を格納する。   The logical storage area identifier 200041 is the same as the logical storage area identifier 200133 and stores identification information of the logical storage area 310 associated with the volume 640.

容量200422は、論理記憶領域310の記憶容量に関する情報を格納するカラムであり、使用率2004221及び空き容量2004222を含む。使用率2004221は、論理記憶領域310の記憶容量の使用率を示す値を格納する。空き容量2004222は、論理記憶領域310の記憶容量の空き容量を示す値を格納する。   The capacity 200042 is a column for storing information related to the storage capacity of the logical storage area 310, and includes a usage rate 2004221 and a free capacity 2004222. The usage rate 200042 stores a value indicating the usage rate of the storage capacity of the logical storage area 310. The free capacity 200000422 stores a value indicating the free capacity of the storage capacity of the logical storage area 310.

IOPS200423は、論理記憶領域310のIOPSを示す値を格納する。   The IOPS 200093 stores a value indicating the IOPS of the logical storage area 310.

ストレージプール20043は、論理記憶領域310が属するストレージプール320に関する情報を格納するカラムであり、プール識別子200431、容量200432、及びIOPS200433を含む。   The storage pool 20043 is a column for storing information related to the storage pool 320 to which the logical storage area 310 belongs, and includes a pool identifier 2000411, a capacity 20000432, and an IOPS 20000433.

プール識別子200431は、プール識別子200134と同一のものであり、論理記憶領域識別子200421に対応する論理記憶領域310が属するストレージプール320の識別情報を格納する。   The pool identifier 200031 is the same as the pool identifier 200134, and stores identification information of the storage pool 320 to which the logical storage area 310 corresponding to the logical storage area identifier 200041 belongs.

容量200432は、ストレージプール320の記憶容量に関する情報を格納するカラムであり、使用率2004321及び空き容量2004322を含む。使用率2004321は、ストレージプール320の記憶容量の使用率を示す値を格納する。空き容量2004322は、ストレージプール320の記憶容量の空き容量を示す値を格納する。   The capacity 2000043 is a column for storing information related to the storage capacity of the storage pool 320, and includes a usage rate 20003921 and a free capacity 20000432. The usage rate 20003921 stores a value indicating the usage rate of the storage capacity of the storage pool 320. The free capacity 20003922 stores a value indicating the free capacity of the storage capacity of the storage pool 320.

IOPS200433は、ストレージプール320のIOPSを示す値を格納する。   The IOPS 20033 stores a value indicating the IOPS of the storage pool 320.

なお、容量200422、IOPS200423、容量200432及びIOPS200433には、リソース監視プログラム2014によって取得された値が格納される。   It should be noted that values acquired by the resource monitoring program 2014 are stored in the capacity 200042, the IOPS200393, the capacity 20000432 and the IOPS2000043.

図13は、実施例1のストレージ構成情報2005の一例を示す説明図である。   FIG. 13 is an explanatory diagram of an example of the storage configuration information 2005 according to the first embodiment.

ストレージ構成情報2005は、ストレージプール320の構成を管理するための情報である。具体的には、ストレージ構成情報2005は、プール識別子20051、容量20052、RAIDグループ20053、記憶媒体20054、及びスペアディスク20055を含む。   The storage configuration information 2005 is information for managing the configuration of the storage pool 320. Specifically, the storage configuration information 2005 includes a pool identifier 20051, a capacity 20052, a RAID group 20053, a storage medium 20054, and a spare disk 20055.

プール識別子20051は、プール識別子200134と同一のものであり、ストレージプール320の識別情報を格納する。容量20052は、ストレージプール320の全記憶容量を示す値を格納する。   The pool identifier 20051 is the same as the pool identifier 200134, and stores identification information of the storage pool 320. The capacity 20052 stores a value indicating the total storage capacity of the storage pool 320.

RAIDグループ20053は、ストレージプール320を構成するRAIDグループに関する情報を格納するカラムであり、RAIDグループ識別子200531、容量200532、及び限界IOPS200533を含む。   The RAID group 20053 is a column that stores information on the RAID groups that make up the storage pool 320, and includes a RAID group identifier 20000531, a capacity 20000532, and a limit IOPS 200353.

RAIDグループ識別子200531は、RAIDグループの識別情報を格納する。容量200532は、RAIDグループの全記憶容量を示す値を格納する。限界IOPS200533は、RAIDグループが処理できるI/O、すなわち、IOPSの最大値を格納する。   The RAID group identifier 200531 stores RAID group identification information. The capacity 200532 stores a value indicating the total storage capacity of the RAID group. The limit IOPS 201053 stores I / O that can be processed by the RAID group, that is, the maximum value of IOPS.

記憶媒体20054は、RAIDグループを構成する記憶媒体の識別情報を格納する。スペアディスク20055は、ストレージプール320に追加可能な記憶媒体の識別情報を格納する。なお、スペアディスク20055にはRAIDグループの識別情報が格納されてもよい。   The storage medium 20054 stores identification information of the storage medium that constitutes the RAID group. The spare disk 20055 stores identification information of storage media that can be added to the storage pool 320. The spare disk 20055 may store RAID group identification information.

図14A及び図14Bは、実施例1の対処手順管理情報1004の一例を示す説明図である。   14A and 14B are explanatory diagrams illustrating an example of handling procedure management information 1004 according to the first embodiment.

対処手順管理情報1004は、仮想計算機600に適用する対処手順を管理するための情報である。具体的には、対処手順管理情報1004は、メタデータ10041及び対処手順10042から構成される。   The handling procedure management information 1004 is information for managing a handling procedure applied to the virtual machine 600. Specifically, the handling procedure management information 1004 includes metadata 10041 and handling procedure 10042.

メタデータ10041は、対処手順管理情報1004の属性を示す情報を格納する。実施例1では、メタデータ10041には、対象の仮想計算機600の識別情報、及び計算機リソースの種別情報を含む。対処手順10042は、具体的な対処手順が格納される。   The metadata 1000041 stores information indicating the attribute of the handling procedure management information 1004. In the first embodiment, the metadata 10041 includes identification information of the target virtual computer 600 and computer resource type information. The coping procedure 10042 stores a specific coping procedure.

図14A及び図14Bは、課金形態が「定額」及び計算機リソースの種別が「CPU」であり、仮想計算機600の識別情報が「VM05」である仮想計算機600に適用される対処手順を示す。なお、「VM05」に対応する仮想計算機600は、サービス要件管理情報1001のハードウェア指定100152が「サーバ指定」であり、ポリシ管理情報1002が「Null」であるものとする。   FIG. 14A and FIG. 14B show the coping procedure applied to the virtual computer 600 in which the charge form is “fixed amount”, the computer resource type is “CPU”, and the identification information of the virtual computer 600 is “VM05”. For the virtual machine 600 corresponding to “VM05”, it is assumed that the hardware specification 100152 of the service requirement management information 1001 is “server specification” and the policy management information 1002 is “Null”.

図14Aの対処手順管理情報1004の場合、対処手順10042に設定された判定順番にしたがって、仮想計算機600に各対処法が実行できるか否かが判定される。一方、図14Bの対処手順管理情報1004の場合、仮想計算機600にはいずれの対処法も実行されない。   In the case of the handling procedure management information 1004 in FIG. 14A, whether or not each handling method can be executed on the virtual machine 600 is determined according to the determination order set in the handling procedure 10044. On the other hand, in the case of the handling procedure management information 1004 in FIG. 14B, no handling method is executed on the virtual machine 600.

なお、対処手順管理情報1004には、メタデータ10041が含まれなくてもよい。例えば、DBサーバ80の性能劣化を契機に対処手順管理情報1004が生成される場合、適用する対処手順管理情報1004を特定するための情報が必要ない。   Note that the handling procedure management information 1004 may not include the metadata 10041. For example, when the handling procedure management information 1004 is generated when the performance of the DB server 80 deteriorates, information for identifying the handling procedure management information 1004 to be applied is not necessary.

図15は、実施例1のクラウド管理計算機100が実行する処理の一例を説明するフローチャートである。   FIG. 15 is a flowchart illustrating an example of processing executed by the cloud management computer 100 according to the first embodiment.

以下で説明する処理は、クラウド管理計算機100のDB対処手順生成プログラム1013が、DB障害検知プログラム2010からDBサーバ80の障害を検知した旨の通知を受信した場合に開始してもよいし、また、周期的に実行してもよい。   The processing described below may be started when the DB handling procedure generation program 1013 of the cloud management computer 100 receives a notification from the DB failure detection program 2010 that a failure of the DB server 80 has been detected, May be executed periodically.

ここでは、周期的に実行するものとする。この場合、クラウド管理計算機100は、当該仮想計算機600に対してボトルネックの種別毎にステップS103からステップS109までの処理を繰り返し実行する。なお、DB障害検知プログラム2010がDBサーバ80の障害を検知した旨の通知の受信を契機に処理を開始する場合、クラウド管理計算機100は、DBボトルネック分析プログラム2011からボトルネックに関する情報を受信する。   Here, it shall execute periodically. In this case, the cloud management computer 100 repeatedly executes the processing from step S103 to step S109 for each type of bottleneck for the virtual computer 600. When the DB failure detection program 2010 starts processing upon receiving a notification that a failure of the DB server 80 has been detected, the cloud management computer 100 receives information on the bottleneck from the DB bottleneck analysis program 2011. .

サービス管理プログラム1010は、サービス要件管理情報1001を参照する(ステップS101)。なお、サービス要件管理情報1001は定期的に更新されているため、最新の状態となっている。   The service management program 1010 refers to the service requirement management information 1001 (step S101). Since the service requirement management information 1001 is regularly updated, it is in the latest state.

DB対処手順生成プログラム1013は、テナント50のループ処理を開始する(ステップS102)。実施例1では、クラウドシステム90に存在する全てのテナント50についてステップS103からステップS114までの処理を繰り返し実行する。なお、障害が発生したDBサーバ80を含むテナント50のみを対象としてもよい。ここでは、サービス要件管理情報1001のエントリ順にテナント50が選択されるものとする。   The DB handling procedure generation program 1013 starts the loop processing of the tenant 50 (step S102). In the first embodiment, the processing from step S103 to step S114 is repeatedly executed for all tenants 50 existing in the cloud system 90. Only the tenant 50 including the DB server 80 in which a failure has occurred may be targeted. Here, it is assumed that the tenant 50 is selected in the order of entry of the service requirement management information 1001.

DB対処手順生成プログラム1013は、サービス要件管理情報1001を参照して、対象のテナント50に含まれる仮想計算機600の中に、性能保証オプションが設定される仮想計算機600が存在するか否かを判定する(ステップS103)。具体的には、以下のような処理が実行される。   The DB handling procedure generation program 1013 refers to the service requirement management information 1001 and determines whether or not the virtual machine 600 to which the performance guarantee option is set exists in the virtual machines 600 included in the target tenant 50. (Step S103). Specifically, the following processing is executed.

DB対処手順生成プログラム1013は、テナント識別子10011が対象のテナント50の識別情報と一致するエントリを検索する。DB対処手順生成プログラム1013は、検索されたエントリの適用状態100141を参照して、「あり」が格納される仮想計算機600が存在するか否かを判定する。   The DB handling procedure generation program 1013 searches for an entry in which the tenant identifier 10011 matches the identification information of the target tenant 50. The DB handling procedure generation program 1013 refers to the application state 100141 of the searched entry and determines whether or not there is a virtual computer 600 in which “Yes” is stored.

以下の説明では、性能保証オプションが設定される仮想計算機600を対象の仮想計算機600とも記載する。   In the following description, the virtual machine 600 in which the performance guarantee option is set is also referred to as a target virtual machine 600.

対象のテナント50に含まれる仮想計算機600の中に、対象の仮想計算機600が存在しない場合(ステップS103がNo)、DB対処手順生成プログラム1013は、対処手順管理情報1004の生成が不要であると判定し、ステップS114に進む。   If the target virtual machine 600 does not exist among the virtual machines 600 included in the target tenant 50 (No in step S103), the DB handling procedure generation program 1013 does not need to generate handling procedure management information 1004. Determine and proceed to step S114.

対象のテナント50に含まれる仮想計算機600の中に、対象の仮想計算機600が存在する場合(ステップS103がYes)、DB対処手順生成プログラム1013は、対象の仮想計算機600のループ処理を開始する(ステップS104)。具体的には、DB対処手順生成プログラム1013は、対象の仮想計算機600の中から一つの対象の仮想計算機600を選択する。選択された仮想計算機600に対してステップS105からステップS113までの処理が繰り返し実行される。   When the target virtual computer 600 exists in the target tenant 50 (Yes in step S103), the DB handling procedure generation program 1013 starts loop processing of the target virtual computer 600 ( Step S104). Specifically, the DB handling procedure generation program 1013 selects one target virtual machine 600 from the target virtual machines 600. The processing from step S105 to step S113 is repeatedly executed for the selected virtual machine 600.

DB対処手順生成プログラム1013は、選択された対象の仮想計算機600について計算機リソースのループ処理を開始する(ステップS105)。具体的には、DB対処手順生成プログラム1013は、サービス要件管理情報1001の選択された仮想計算機600の行を参照し、対象100153に設定される計算機リソースの中から一つの計算機リソースを選択する。選択された計算機リソースに対してステップS106からステップS112までの処理が繰り返し実行される。   The DB handling procedure generation program 1013 starts loop processing of computer resources for the selected target virtual computer 600 (step S105). Specifically, the DB handling procedure generation program 1013 refers to the row of the selected virtual computer 600 in the service requirement management information 1001 and selects one computer resource from among the computer resources set in the target 100153. The processing from step S106 to step S112 is repeatedly executed for the selected computer resource.

DB対処手順生成プログラム1013は、選択された対象の仮想計算機600の課金体系が従量課金であるか否かを判定する(ステップS106)。   The DB handling procedure generation program 1013 determines whether or not the charging system of the selected target virtual computer 600 is pay-per-use (step S106).

具体的には、DB対処手順生成プログラム1013は、ステップS104において選択された仮想計算機600の行の体系100171が「従量課金」であるか否かを判定する。   Specifically, the DB handling procedure generation program 1013 determines whether or not the row system 100171 of the virtual machine 600 selected in step S104 is “pay-as-you-go”.

対象の仮想計算機600の課金体系が従量課金であると判定された場合(ステップS106がYes)、DB対処手順生成プログラム1013は、対象のテナント50を利用するクラウドユーザ10に対して追加料金の発生を了承するか否かの問合せを行う(ステップS107)。DB対処手順生成プログラム1013は、クラウドユーザ10からの応答を受信するまで、次の処理を待ち続ける。   When it is determined that the charging system of the target virtual computer 600 is pay-per-use (Yes in step S106), the DB handling procedure generation program 1013 generates an additional fee for the cloud user 10 using the target tenant 50. An inquiry is made as to whether or not to accept (step S107). The DB handling procedure generation program 1013 continues to wait for the next process until a response from the cloud user 10 is received.

当該問合せは、ポータル30を介してクラウドユーザ10に通知される。クラウドユーザ10は、ポータル30を介して、当該通知に対する応答をクラウド管理計算機100に送信する。   The inquiry is notified to the cloud user 10 via the portal 30. The cloud user 10 transmits a response to the notification to the cloud management computer 100 via the portal 30.

DB対処手順生成プログラム1013は、クラウドユーザ10からの応答に基づいて、追加料金の発生が了承されたか否かを判定する(ステップS108)。   Based on the response from the cloud user 10, the DB handling procedure generation program 1013 determines whether or not an additional fee has been approved (step S108).

追加料金の発生が了承された場合(ステップS108がYes)、DB対処手順生成プログラム1013は、ステップS108に進む。   When the generation of the additional fee is approved (step S108 is Yes), the DB handling procedure generation program 1013 proceeds to step S108.

追加料金の発生が了承されていない場合(ステップS108がNo)、DB対処手順生成プログラム1013は、対処手順生成処理(A)を実行し(ステップS109)、生成された対処手順管理情報1004を出力する(ステップS111)。対処手順生成処理(A)の詳細は、図16を用いて後述する。   When the generation of the additional fee is not approved (No in step S108), the DB handling procedure generation program 1013 executes the handling procedure generation process (A) (step S109) and outputs the generated handling procedure management information 1004. (Step S111). Details of the handling procedure generation process (A) will be described later with reference to FIG.

対象の仮想計算機600の課金体系が従量課金でないと判定された場合(ステップS106がNo)、又は、追加料金の発生が了承された場合(ステップS108がYes)、DB対処手順生成プログラム1013は、対処手順生成処理(B)を実行し(ステップS110)、生成された対処手順管理情報1004を出力する(ステップS111)。対処手順生成処理(B)の詳細は、図17を用いて後述する。   When it is determined that the charging system of the target virtual computer 600 is not pay-per-use (No in step S106), or when the generation of an additional fee is approved (Yes in step S108), the DB handling procedure generation program 1013 The coping procedure generation process (B) is executed (step S110), and the generated coping procedure management information 1004 is output (step S111). Details of the handling procedure generation process (B) will be described later with reference to FIG.

対象のテナント50に含まれる仮想計算機600の中に、対象の仮想計算機600が存在しない場合(ステップS103がNo)、又はステップS111の処理の後、DB対処手順生成プログラム1013は、選択された対象の仮想計算機600の全ての計算機リソースについて処理が完了したか否かを判定する(ステップS112)。   If the target virtual machine 600 does not exist in the virtual machine 600 included in the target tenant 50 (No in step S103), or after the processing in step S111, the DB handling procedure generation program 1013 selects the selected target It is determined whether or not the processing has been completed for all the computer resources of the virtual computer 600 (step S112).

選択された対象の仮想計算機600の全ての計算機リソースについて処理が完了していないと判定された場合(ステップS112がNo)、DB対処手順生成プログラム1013は、次の計算機リソースを選択し、同様の処理(ステップS106からステップS112)を実行する。   When it is determined that the processing has not been completed for all the computer resources of the selected target virtual computer 600 (No in step S112), the DB handling procedure generation program 1013 selects the next computer resource, and the same Processing (step S106 to step S112) is executed.

選択された対象の仮想計算機600の全ての計算機リソースについて処理が完了したと判定された場合(ステップS112がYes)、DB対処手順生成プログラム1013は、全ての対象の仮想計算機600について処理が完了したか否かを判定する(ステップS113)。   When it is determined that the processing has been completed for all the computer resources of the selected target virtual computer 600 (Yes in step S112), the DB handling procedure generation program 1013 has completed the processing for all the target virtual computers 600. Is determined (step S113).

全ての対象の仮想計算機600について処理が完了していないと判定された場合(ステップS113がNo)、DB対処手順生成プログラム1013は、次の対象の仮想計算機600を選択し、同様の処理(ステップS105からステップS113)を実行する。   When it is determined that the processing has not been completed for all target virtual machines 600 (No in step S113), the DB handling procedure generation program 1013 selects the next target virtual machine 600 and performs the same process (step Steps S105 to S113) are executed.

全ての対象の仮想計算機600について処理が完了したと判定された場合(ステップS113がYes)、DB対処手順生成プログラム1013は、全てのテナント50について処理が完了したか否かを判定する(ステップS114)。   When it is determined that processing has been completed for all target virtual machines 600 (Yes in step S113), the DB handling procedure generation program 1013 determines whether processing has been completed for all tenants 50 (step S114). ).

全てのテナント50について処理が完了していないと判定された場合(ステップS114がNo)、DB対処手順生成プログラム1013は、次にテナント50を選択し、同様の処理(ステップS103からステップS114)を実行する。   When it is determined that the processing has not been completed for all tenants 50 (No in step S114), the DB handling procedure generation program 1013 next selects the tenant 50 and performs similar processing (from step S103 to step S114). Run.

全てのテナント50について処理が完了したと判定された場合(ステップS114がYes)、DB対処手順生成プログラム1013は、基盤管理計算機200に生成された対処手順管理情報1004を通知し(ステップS115)、処理を終了する。   When it is determined that the processing has been completed for all tenants 50 (Yes in step S114), the DB handling procedure generation program 1013 notifies the handling procedure management information 1004 generated to the infrastructure management computer 200 (step S115). The process ends.

なお、DB対処手順生成プログラム1013は、対処手順管理情報1004を基盤管理計算機200に通知しなくてもよい。例えば、クラウド管理計算機100は、DBサーバ80の障害発生時に、メタデータ10041に基づいて複数の対処手順管理情報1004の中から一つの対処手順管理情報1004を選択し、選択された対処手順管理情報1004を基盤管理計算機200に通知する。   Note that the DB handling procedure generation program 1013 does not have to notify the infrastructure management computer 200 of handling procedure management information 1004. For example, when a failure occurs in the DB server 80, the cloud management computer 100 selects one handling procedure management information 1004 from among a plurality of handling procedure management information 1004 based on the metadata 10041, and the selected handling procedure management information. 1004 is notified to the infrastructure management computer 200.

なお、DBサーバ80の障害を検知した旨の通知を受信した場合に処理を開始する場合、テナント50、仮想計算機600及び計算機リソースのループ処理は省略できる。これは、対処手順管理情報1004を生成する対象が特定されているためである。   Note that when processing is started when a notification indicating that a failure of the DB server 80 has been detected is received, loop processing of the tenant 50, virtual computer 600, and computer resources can be omitted. This is because the target for generating the handling procedure management information 1004 is specified.

図16は、実施例1のクラウド管理計算機100が実行する対処手順生成処理(A)の一例を説明するフローチャートである。   FIG. 16 is a flowchart illustrating an example of the handling procedure generation process (A) executed by the cloud management computer 100 according to the first embodiment.

DB対処手順生成プログラム1013は、サービス要件管理情報1001及び計算機リソース割当情報2002から、対象の仮想計算機600に関連する値を取得する(ステップS201)。具体的には、以下のような処理が実行される。   The DB handling procedure generation program 1013 acquires values related to the target virtual computer 600 from the service requirement management information 1001 and the computer resource allocation information 2002 (step S201). Specifically, the following processing is executed.

DB対処手順生成プログラム1013は、少なくとも対象の仮想計算機600の識別情報、及びボトルネックの種別に基づいてサービス要件管理情報1001及び計算機リソース割当情報2002を参照する。   The DB handling procedure generation program 1013 refers to the service requirement management information 1001 and the computer resource allocation information 2002 based on at least the identification information of the target virtual computer 600 and the type of bottleneck.

DB対処手順生成プログラム1013は、サービス要件管理情報1001の仮想計算機識別子10012が対象の仮想計算機600の識別情報と一致し、かつ、対象100153がボトルネックの種別と一致する行を検索する。DB対処手順生成プログラム1013は、検索されたエントリの保証値100154に格納される値を取得する。   The DB handling procedure generation program 1013 searches for a row in which the virtual machine identifier 10012 of the service requirement management information 1001 matches the identification information of the target virtual machine 600 and the target 100153 matches the bottleneck type. The DB handling procedure generation program 1013 acquires the value stored in the guaranteed value 100154 of the searched entry.

DB対処手順生成プログラム1013は、計算機リソース割当情報2002の仮想計算機識別子20022が対象の仮想計算機600の識別情報と一致し、かつ、計算機リソース種別200231がボトルネックの種別と一致する行を検索する。DB対処手順生成プログラム1013は、検索された行の確保形態200232及び実使用量200233の値を取得する。以上がステップS201の処理の説明である。   The DB handling procedure generation program 1013 searches for a row in which the virtual machine identifier 200222 of the computer resource allocation information 2002 matches the identification information of the target virtual machine 600 and the computer resource type 200201 matches the bottleneck type. The DB handling procedure generation program 1013 acquires the values of the searched row reservation mode 200232 and the actual usage amount 2002003. The above is the description of the process in step S201.

次に、DB対処手順生成プログラム1013は、サービス要件管理情報1001及び計算機リソース割当情報2002から取得された値に基づいて、対象の仮想計算機600に保証値分の計算機リソースが割り当てられているか否かを判定する(ステップS202)。   Next, based on the values acquired from the service requirement management information 1001 and the computer resource allocation information 2002, the DB handling procedure generation program 1013 determines whether or not the computer resources for the guaranteed value are allocated to the target virtual computer 600. Is determined (step S202).

例えば、仮想計算機識別子10012が「VM01」、対象100153が「CPU」の場合、保証値100154は「上限値:4GB」である。一方、仮想計算機識別子20022が「VM01」、計算機リソース種別200231が「CPU」の場合、確保形態200232は「1GHz−4GHz」、実使用量200233は「4GHz」である。したがって、この場合、DB対処手順生成プログラム1013は、対象の仮想計算機600に保証値分の計算機リソースが割り当てられていると判定する。   For example, when the virtual machine identifier 10012 is “VM01” and the target 100153 is “CPU”, the guaranteed value 100154 is “upper limit value: 4 GB”. On the other hand, when the virtual computer identifier 20022 is “VM01” and the computer resource type 200201 is “CPU”, the reservation form 200202 is “1 GHz-4 GHz”, and the actual usage amount 2000023 is “4 GHz”. Therefore, in this case, the DB handling procedure generation program 1013 determines that computer resources for the guaranteed value are allocated to the target virtual computer 600.

対象の仮想計算機600に保証値分の計算機リソースが割り当てられていると判定された場合(ステップS202がYes)、DB対処手順生成プログラム1013は、対処手順の生成が不要であると判定し、処理を終了する。これは、対象の仮想計算機600の性能を向上させるためには、保証値以上の計算機リソースを確保する必要があり、追加料金が発生する。そのため、追加料金を発生させない対処法が存在しないためである。   When it is determined that the guaranteed virtual machine 600 has been allocated to the target virtual machine 600 (Yes in step S202), the DB handling procedure generation program 1013 determines that the handling procedure is not required to be generated, and processing Exit. In order to improve the performance of the target virtual computer 600, it is necessary to secure computer resources that are equal to or greater than the guaranteed value, and an additional fee is generated. For this reason, there is no countermeasure that does not generate an additional charge.

対象の仮想計算機600に保証値分の計算機リソースが割り当てられていないと判定された場合(ステップS202がNo)、DB対処手順生成プログラム1013は、DB障害対処法管理情報1003から、追加料金が発生しない対処法を選択する(ステップS203)。具体的には、以下のような処理が実行される。   When it is determined that the guaranteed virtual machine resources are not allocated to the target virtual machine 600 (No in step S202), the DB handling procedure generation program 1013 generates an additional charge from the DB failure handling method management information 1003. The coping method which is not to be selected is selected (step S203). Specifically, the following processing is executed.

DB対処手順生成プログラム1013は、ボトルネック箇所10031がボトルネックの種別と一致するエントリを検索し、検索されたエントリの追加料金10038のカラムを参照する。   The DB handling procedure generation program 1013 searches for an entry in which the bottleneck location 10031 matches the type of the bottleneck, and refers to the column of the additional charge 10030 of the searched entry.

対象の仮想計算機600の体系100171が「定額」の場合、DB対処手順生成プログラム1013は、定額100381に「なし」が設定されている対処法を選択する。また、対象の仮想計算機600の体系100171が「従量課金」の場合、DB対処手順生成プログラム1013は、従量課金100382に「なし」が設定されている対処法を選択する。以上がステップS203の処理の説明である。   When the system 100171 of the target virtual computer 600 is “fixed amount”, the DB handling procedure generation program 1013 selects a handling method in which “none” is set for the fixed amount 100311. Further, when the system 100171 of the target virtual computer 600 is “pay-as-you-go”, the DB handling procedure generation program 1013 selects a handling method in which “none” is set in the metered charging 100322. The above is the description of the process in step S203.

次に、DB対処手順生成プログラム1013は、選択された対処法の中から、対象の仮想計算機600に対する性能保証及び運用の内容に合致する対処法を抽出する(ステップS204)。   Next, the DB coping procedure generation program 1013 extracts a coping method that matches the performance guarantee and operation contents for the target virtual machine 600 from the selected coping methods (step S204).

例えば、DB対処手順生成プログラム1013は、サービス要件管理情報1001の仮想計算機識別子10012が対象の仮想計算機600に一致する行を検索する。検索された行の無停止運用10016が「要」の場合、DB対処手順生成プログラム1013は、DBサーバ80に対応する仮想計算機600の再起動が必要ない対処法を抽出する。なお、前述した処理は一例であって、ハードウェアの占有等の情報に基づいて対処法が抽出されてもよい。   For example, the DB handling procedure generation program 1013 searches for a row in which the virtual machine identifier 10012 of the service requirement management information 1001 matches the target virtual machine 600. When the non-stop operation 10016 of the searched row is “necessary”, the DB handling procedure generation program 1013 extracts a handling method that does not require restart of the virtual computer 600 corresponding to the DB server 80. Note that the above-described processing is an example, and a countermeasure may be extracted based on information such as hardware occupancy.

ステップS203及びステップS204は、サービス要件に合致する対処法を選択するための処理である。対処手順生成処理(A)では、追加料金が発生しないことが条件となっているため、ステップS203の判定処理が実行される。   Steps S203 and S204 are processes for selecting a countermeasure that matches the service requirements. In the handling procedure generation process (A), since it is a condition that no additional fee is generated, the determination process in step S203 is executed.

次に、DB対処手順生成プログラム1013は、ポリシ管理情報1002を参照して、対象の仮想計算機600にポリシが設定されているか否かを判定する(ステップS205)。   Next, the DB handling procedure generation program 1013 refers to the policy management information 1002 and determines whether or not a policy is set for the target virtual computer 600 (step S205).

具体的には、DB対処手順生成プログラム1013は、仮想計算機識別子10022が対象の仮想計算機600の識別情報と一致する行を検索する。該当する行が存在しない場合、DB対処手順生成プログラム1013は、対象の仮想計算機600にポリシが設定されていないと判定する。また、該当する行が存在し、かつ、当該行のポリシ10023が「Null」の場合にも、DB対処手順生成プログラム1013は、対象の仮想計算機600にポリシが設定されていないと判定する。   Specifically, the DB handling procedure generation program 1013 searches for a row in which the virtual machine identifier 10022 matches the identification information of the target virtual machine 600. If there is no corresponding line, the DB handling procedure generation program 1013 determines that no policy is set for the target virtual machine 600. Further, even when the corresponding row exists and the policy 10023 of the row is “Null”, the DB handling procedure generation program 1013 determines that no policy is set for the target virtual machine 600.

対象の仮想計算機600にポリシが設定されていると判定された場合(ステップS205がYes)、DB対処手順生成プログラム1013は、設定されたポリシにしたがって、抽出された対処法を並び替えることによって、対処手順管理情報1004を生成する(ステップS206)。その後、DB対処手順生成プログラム1013は、処理を終了する。   When it is determined that a policy is set in the target virtual machine 600 (Yes in step S205), the DB handling procedure generation program 1013 rearranges the extracted handling methods according to the set policy, Coping procedure management information 1004 is generated (step S206). Thereafter, the DB handling procedure generation program 1013 ends the process.

例えば、ポリシ10023が「処理時間優先」の場合、DB対処手順生成プログラム1013は、平均処理時間10036が小さい順に抽出された対処法を並び替える。これによって、対処手順管理情報1004の対処手順10042が生成される。DB対処手順生成プログラム1013は、さらに、ステップS104及びステップS105において選択された仮想計算機600及び計算機リソースの識別情報からメタデータ10041を生成する。   For example, when the policy 10027 is “processing time priority”, the DB handling procedure generation program 1013 rearranges the handling methods extracted in ascending order of the average processing time 10036. As a result, the handling procedure 10042 of the handling procedure management information 1004 is generated. The DB handling procedure generation program 1013 further generates metadata 10041 from the identification information of the virtual computer 600 and computer resources selected in steps S104 and S105.

対象の仮想計算機600にポリシが設定されていないと判定された場合(ステップS205がNo)、DB対処手順生成プログラム1013は、平均処理時間及びホスト計算機500に対する負荷等に基づいて、抽出された対処法を並び替える(ステップS207)。その後、DB対処手順生成プログラム1013は、ステップS207に進む。例えば、以下のような処理が実行される。   When it is determined that no policy is set for the target virtual computer 600 (No in step S205), the DB handling procedure generation program 1013 extracts the handling that is extracted based on the average processing time, the load on the host computer 500, and the like. The methods are rearranged (step S207). Thereafter, the DB handling procedure generation program 1013 proceeds to step S207. For example, the following processing is executed.

DB対処手順生成プログラム1013は、まず、平均処理時間10036が小さい順に抽出された対処法を並び替える。平均処理時間10036が同一の対処法が存在する場合、DB対処手順生成プログラム1013は、影響10035を参照して、ホスト計算機500に負荷が小さい順に平均処理時間10036が同一の対処法を並び替える。   The DB handling procedure generation program 1013 first sorts the handling methods extracted in ascending order of the average processing time 10036. When a countermeasure with the same average processing time 10036 exists, the DB handling procedure generation program 1013 refers to the influence 10033 and rearranges the countermeasures with the same average processing time 1003 in the order of increasing load on the host computer 500.

DB対処手順生成プログラム1013は、抽出された対処法を並び替えた後、並び替えられた対処法の最後に融通処理を追加することによって対処手順管理情報1004を生成する(ステップS208)。その後、DB対処手順生成プログラム1013は、処理を終了する。対処手順管理情報1004の生成方法はステップS206の処理と同一であるため説明を省略する。   The DB coping procedure generation program 1013 rearranges the extracted coping methods, and generates coping procedure management information 1004 by adding an accommodation process at the end of the sorted coping methods (step S208). Thereafter, the DB handling procedure generation program 1013 ends the process. Since the generation method of the handling procedure management information 1004 is the same as the processing in step S206, the description thereof is omitted.

なお、ステップS208の処理は省略してもよい。この場合、ステップS207において、対処手順管理情報1004が生成される。   Note that the process of step S208 may be omitted. In this case, handling procedure management information 1004 is generated in step S207.

ここで、融通処理とは、対象の仮想計算機600が稼働するホスト計算機500上で稼働する他の仮想計算機600に割り当てられている計算機リソースを流用する処理である。なお、ホスト計算機500上で稼働する他の仮想計算機600は、全ての仮想計算機600が対象となるわけではなく、性能保証オプション10014の適用状態100141が「なし」であるものが対象となる。   Here, the accommodation process is a process of diverting a computer resource allocated to another virtual machine 600 running on the host computer 500 on which the target virtual machine 600 is run. The other virtual machines 600 running on the host computer 500 are not targeted for all virtual machines 600, but are those for which the application state 100141 of the performance guarantee option 10014 is “none”.

図16の処理によって、図14Aに示すような対処手順管理情報1004が生成される。DB対処手順生成プログラム1013は、ステップS204において、ホスト計算機500間の移行がない対処法が抽出され、ステップS205において、平均処理時間が短い順に並び替えることによって、図14Aに示すような対処手順管理情報1004を生成する。   By the processing in FIG. 16, handling procedure management information 1004 as shown in FIG. 14A is generated. In step S204, the DB handling procedure generation program 1013 extracts handling methods that do not migrate between the host computers 500. In step S205, the handling procedure management as shown in FIG. Information 1004 is generated.

図17は、実施例1のクラウド管理計算機100が実行する対処手順生成処理(B)の一例を説明するフローチャートである。   FIG. 17 is a flowchart illustrating an example of the handling procedure generation process (B) executed by the cloud management computer 100 according to the first embodiment.

DB対処手順生成プログラム1013は、DB障害対処法管理情報1003から、対象の仮想計算機600に対する性能保証及び運用の内容に合致する対処法を選択する(ステップS301)。例えば、以下のような処理が実行される。   The DB handling procedure generation program 1013 selects a handling method that matches the performance guarantee and operation contents for the target virtual machine 600 from the DB failure handling method management information 1003 (step S301). For example, the following processing is executed.

DB対処手順生成プログラム1013は、サービス要件管理情報1001の仮想計算機識別子10012が対象の仮想計算機600に一致する行を検索する。検索された行の無停止運用10016が「要」の場合、DB対処手順生成プログラム1013は、DBサーバ80に対応する仮想計算機600の再起動が必要ない対処法を選択する。なお、前述した処理は一例であって、ハードウェアの占有等の情報に基づいて契約内容に合致する対処法が選択されてもよい。   The DB handling procedure generation program 1013 searches for a row in which the virtual machine identifier 10012 of the service requirement management information 1001 matches the target virtual machine 600. When the non-stop operation 10016 of the searched row is “necessary”, the DB handling procedure generation program 1013 selects a handling method that does not require restart of the virtual computer 600 corresponding to the DB server 80. Note that the above-described processing is an example, and a coping method that matches the contract content may be selected based on information such as hardware occupancy.

ステップS301は、サービス要件に合致する対処法を選択するための処理である。対処手順生成処理(B)では、追加料金が発生しないことが条件となっていないため、ステップS203のような判定処理は実行されない。   Step S301 is processing for selecting a countermeasure that matches the service requirements. In the handling procedure generation process (B), since it is not a condition that no additional fee is generated, the determination process as in step S203 is not executed.

次に、DB対処手順生成プログラム1013は、ポリシ管理情報1002を参照して、対象の仮想計算機600にポリシが設定されているか否かを判定する(ステップS302)。ステップS302の処理は、ステップS205の処理と同一である。   Next, the DB handling procedure generation program 1013 refers to the policy management information 1002 and determines whether or not a policy is set for the target virtual computer 600 (step S302). The process in step S302 is the same as the process in step S205.

対象の仮想計算機600にポリシが設定されていると判定された場合(ステップS302がYes)、DB対処手順生成プログラム1013は、DB対処手順生成プログラム1013は、設定されたポリシにしたがって、選択された対処法を並び替えることによって、対処手順管理情報1004を生成する(ステップS303)。その後、DB対処手順生成プログラム1013は、処理を終了する。ステップS303の処理は、ステップS206の処理と同一である。   When it is determined that a policy is set for the target virtual machine 600 (Yes in step S302), the DB handling procedure generation program 1013 is selected according to the set policy. By sorting the handling methods, the handling procedure management information 1004 is generated (step S303). Thereafter, the DB handling procedure generation program 1013 ends the process. The process in step S303 is the same as the process in step S206.

対象の仮想計算機600にポリシが設定されていないと判定された場合(ステップS302がNo)、DB対処手順生成プログラム1013は、平均処理時間及びホスト計算機500に対する負荷等に基づいて、選択された対処法を並び替える(ステップS304)。ステップS304の処理は、ステップS207の処理と同一である。   When it is determined that no policy is set for the target virtual machine 600 (No in step S302), the DB handling procedure generation program 1013 selects the handling that is selected based on the average processing time, the load on the host computer 500, and the like. The methods are rearranged (step S304). The process of step S304 is the same as the process of step S207.

DB対処手順生成プログラム1013は、選択された対処法を並び替えた後、並び替えられた対処法の最後に融通処理を追加することによって対処手順管理情報1004を生成する(ステップS305)。その後、DB対処手順生成プログラム1013は、処理を終了する。ステップS305の処理は、ステップS208の処理と同一である。   The DB coping procedure generation program 1013 rearranges the selected coping methods, and generates coping procedure management information 1004 by adding an accommodation process to the end of the sorted coping methods (step S305). Thereafter, the DB handling procedure generation program 1013 ends the process. The process in step S305 is the same as the process in step S208.

図18は、実施例1の対処手順生成処理(B)を実行することによって生成された対処手順管理情報1004の一例を示す説明図である。   FIG. 18 is an explanatory diagram illustrating an example of handling procedure management information 1004 generated by executing the handling procedure generation process (B) according to the first embodiment.

図18は、課金体系が「従量」及び計算機リソースの種別が「CPU」であり、仮想計算機600の識別情報が「VM02」である仮想計算機600に適用される対処手順を示す。なお、「VM02」に対応する仮想計算機600は、サービス要件管理情報1001の無停止運用10016が「要」であり、ポリシ管理情報1002が「Null」である。また、対処手順10042は、仮想計算機600の再起動が発生しない対処法を平均処理時間が短い順に並べられた対処手順を示す。   FIG. 18 shows a coping procedure applied to the virtual computer 600 in which the accounting system is “usage”, the computer resource type is “CPU”, and the identification information of the virtual computer 600 is “VM02”. In the virtual machine 600 corresponding to “VM02”, the non-stop operation 10016 of the service requirement management information 1001 is “necessary”, and the policy management information 1002 is “Null”. The coping procedure 10042 shows a coping procedure in which coping methods that do not cause restart of the virtual machine 600 are arranged in order of short average processing time.

以下、図19から図23を用いて、対処手順に従った処理について説明する。   Hereinafter, processing according to the coping procedure will be described with reference to FIGS.

図19から図23は、実施例1のクラウド管理計算機100が対処手順管理情報1004にしたがって実行する処理の一例を説明するフローチャートである。   19 to 23 are flowcharts for explaining an example of processing executed by the cloud management computer 100 according to the first embodiment in accordance with the handling procedure management information 1004.

クラウド管理計算機100は、DBボトルネック分析プログラム2011から、性能保証オプションが設定された仮想計算機600のCPUのリソース不足を検知した旨が通知された場合、仮想計算機600の識別情報及び計算機リソースの種別に基づいてメタデータ10041を参照し、対処手順管理情報1004を選択する。クラウド管理計算機100は、選択された対処手順管理情報1004にしたがって、図19から図23を用いて説明する対処法を実行する。   If the cloud management computer 100 is notified from the DB bottleneck analysis program 2011 that the CPU resource shortage of the virtual computer 600 for which the performance guarantee option is set is detected, the identification information of the virtual computer 600 and the type of the computer resource Based on the above, the metadata 10040 is referred to, and the handling procedure management information 1004 is selected. The cloud management computer 100 executes the coping method described with reference to FIGS. 19 to 23 according to the selected coping procedure management information 1004.

なお、DBボトルネック分析プログラム2011は、仮想計算機600の性能劣化を検知した場合、ボトルネックの種別を特定し、また、不足している計算機リソースのリソース量を算出する。DBボトルネック分析プログラム2011は、仮想計算機600の識別情報、ボトルネックの種別、及び不足しているリソース量を含む通知をクラウド管理計算機100に送信する。   Note that when the performance degradation of the virtual computer 600 is detected, the DB bottleneck analysis program 2011 identifies the type of bottleneck and calculates the resource amount of the computer resources that are insufficient. The DB bottleneck analysis program 2011 transmits a notification including the identification information of the virtual computer 600, the type of bottleneck, and the insufficient resource amount to the cloud management computer 100.

なお、以下の説明では、性能が劣化したDBサーバ80に対応する仮想計算機600をターゲット仮想計算機600とも記載する。   In the following description, the virtual computer 600 corresponding to the DB server 80 with degraded performance is also referred to as a target virtual computer 600.

まず、図19に示す処理について説明する。図19は、ボトルネック箇所10031が「CPU」かつ対処法10032が「シェア値変更」である対処法に対応する処理を示す。   First, the process shown in FIG. 19 will be described. FIG. 19 shows processing corresponding to a coping method in which the bottleneck portion 10031 is “CPU” and the coping method 10032 is “change share value”.

クラウド管理計算機100のDB障害対策判定プログラム1014が、対処手順管理情報1004に基づいて、「シェア値の変更ができるか否かの判定」に対応する対処法が呼び出された場合に、以下で説明する処理を開始する。   The DB failure countermeasure determination program 1014 of the cloud management computer 100 will be described below when a countermeasure corresponding to “determination of whether or not the share value can be changed” is called based on the countermeasure procedure management information 1004. The process to start is started.

DB障害対策判定プログラム1014は、基盤管理計算機200から、DBボトルネック分析プログラム2011によって算出された不足しているCPUのリソース量を取得する(ステップS401)。なお、当該対処法を実行する前に、不足しているCPUのリソース量が取得されている場合には、ステップS401の処理を省略することができる。   The DB failure countermeasure determination program 1014 acquires the insufficient CPU resource amount calculated by the DB bottleneck analysis program 2011 from the infrastructure management computer 200 (step S401). Note that the processing in step S401 can be omitted when the CPU resource amount that is lacking is acquired before the countermeasure is executed.

DB障害対策判定プログラム1014は、サービス要件管理情報1001及び計算機リソース割当情報2002を参照して、ターゲット仮想計算機600のシェア値を変更できるか否かを判定する(ステップS402)。具体的には、以下のような処理が実行される。なお、シェア値は、ホスト計算機500のハイパバイザ等が管理する複数の仮想計算機600に対する計算機リソースの配分率を決定するための値である。   The DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and the computer resource allocation information 2002 to determine whether or not the share value of the target virtual computer 600 can be changed (step S402). Specifically, the following processing is executed. The share value is a value for determining the allocation rate of computer resources to a plurality of virtual computers 600 managed by the hypervisor of the host computer 500 or the like.

DB障害対策判定プログラム1014は、サービス要件管理情報1001を参照して、仮想計算機識別子10012がターゲット仮想計算機600の識別情報と一致し、かつ、対象100153が「CPU」である行を検索する。DB障害対策判定プログラム1014は、検索された行の保証値100154に格納される値を取得する。   The DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and searches for a row in which the virtual machine identifier 10012 matches the identification information of the target virtual machine 600 and the target 100153 is “CPU”. The DB failure countermeasure determination program 1014 acquires a value stored in the guaranteed value 100154 of the searched row.

DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、仮想計算機識別子20022がターゲット仮想計算機600の識別情報と一致し、かつ、計算機リソース種別200231が「CPU1」である行を検索する。DB障害対策判定プログラム1014は、検索された行の確保形態200232に格納される値を取得する。   The DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and searches for a row in which the virtual computer identifier 20022 matches the identification information of the target virtual computer 600 and the computer resource type 200201 is “CPU1”. . The DB failure countermeasure determination program 1014 obtains the value stored in the searched row reservation form 2002022.

DB障害対策判定プログラム1014は、保証値100154及び確保形態200232から取得された値に基づいて、ターゲット仮想計算機600のシェア値を変更できるか否かを判定する。   The DB failure countermeasure determination program 1014 determines whether or not the share value of the target virtual machine 600 can be changed based on the guaranteed value 100154 and the value acquired from the reservation form 2002022.

例えば、確保形態200232に、シェア値に基づくリソースの割り当てが設定されている場合、DB障害対策判定プログラム1014はターゲット仮想計算機600のシェア値を変更できると判定する。また、ターゲット仮想計算機600のシェア値を変更した時に、当該ターゲット仮想計算機600と同一の計算機リソースを共有する他の仮想計算機600に割り当てられる計算機リソースが保証値100154より小さくならない場合、DB障害対策判定プログラム1014はターゲット仮想計算機600のシェア値を変更できると判定する。以上がステップS402の処理の説明である。   For example, when resource allocation based on the share value is set in the reservation form 2002022, the DB failure countermeasure determination program 1014 determines that the share value of the target virtual machine 600 can be changed. Further, when the share value of the target virtual machine 600 is changed, if the computer resource allocated to another virtual machine 600 sharing the same computer resource as the target virtual machine 600 is not smaller than the guaranteed value 100154, the DB failure countermeasure determination The program 1014 determines that the share value of the target virtual machine 600 can be changed. The above is the description of the process in step S402.

ターゲット仮想計算機600のシェア値を変更できないと判定された場合(ステップS402がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS403)。   When it is determined that the share value of the target virtual machine 600 cannot be changed (No in step S402), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and determines whether or not the next countermeasure is present. Is determined (step S403).

次の対処法が存在すると判定された場合(ステップS403がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS403がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS412)。その後、DB障害対策判定プログラム1014は、処理を終了する。例えば、適切な対処法が存在しない旨が通知される。なお、処理結果の通知方法は、例えば、ポータル30を介して行うことが考えられる。   When it is determined that the next countermeasure is present (Yes in step S403), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in Step S403), the DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10 (Step S412). Thereafter, the DB failure countermeasure determination program 1014 ends the process. For example, it is notified that there is no appropriate countermeasure. Note that the processing result notification method may be performed via the portal 30, for example.

ステップS402において、ターゲット仮想計算機600のシェア値を変更できると判定された場合(ステップS402がYes)、DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、ターゲット仮想計算機600と同一のホスト計算機500上で稼働する他の仮想計算機600を検索する(ステップS404)。すなわち、ターゲット仮想計算機600と計算機リソースを共有する他の仮想計算機600が検索される。具体的には、以下のような処理が実行される。   If it is determined in step S402 that the share value of the target virtual computer 600 can be changed (Yes in step S402), the DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and is the same as the target virtual computer 600. The other virtual computer 600 running on the host computer 500 is searched (step S404). That is, another virtual machine 600 that shares a computer resource with the target virtual machine 600 is searched. Specifically, the following processing is executed.

DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、仮想計算機識別子20022がターゲット仮想計算機600の識別情報と一致する行を検索する。DB障害対策判定プログラム1014は、検索された行を含むエントリに基づいてターゲット仮想計算機600が稼働するホスト計算機500を特定する。   The DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and searches for a row in which the virtual computer identifier 20022 matches the identification information of the target virtual computer 600. The DB failure countermeasure determination program 1014 identifies the host computer 500 on which the target virtual computer 600 is operating based on the entry including the retrieved row.

DB障害対策判定プログラム1014は、特定されたホスト計算機500のエントリに基づいて、ターゲット仮想計算機600と計算機リソースを共有する他の仮想計算機600を特定する。以上がステップS404の処理の説明である。   The DB failure countermeasure determination program 1014 specifies another virtual computer 600 that shares a computer resource with the target virtual computer 600 based on the specified entry of the host computer 500. The above is the description of the process in step S404.

DB障害対策判定プログラム1014は、検索された他の仮想計算機600に余剰に割り当てられている計算機リソースを算出する(ステップS405)。具体的には、以下のような処理が実行される。   The DB failure countermeasure determination program 1014 calculates a computer resource that is excessively allocated to the searched other virtual computer 600 (step S405). Specifically, the following processing is executed.

DB障害対策判定プログラム1014は、サービス要件管理情報1001を参照して、他の仮想計算機600に対応する行の対象100153が「CPU」である保証値100154の値を取得する。また、DB障害対策判定プログラム1014は、計算機リソース割当情報2002の他の仮想計算機600に対応する計算機リソース種別200231が「CPU1」の実使用量200233の値を取得する。   The DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and acquires the value of the guaranteed value 100154 in which the target 100153 of the row corresponding to the other virtual machine 600 is “CPU”. Further, the DB failure countermeasure determination program 1014 obtains the value of the actual usage amount 20023 when the computer resource type 200231 corresponding to the other virtual computer 600 of the computer resource allocation information 2002 is “CPU1”.

DB障害対策判定プログラム1014は、ターゲット仮想計算機600と計算機リソースを共有する他の仮想計算機600のうち、下式(1)を満たす他の仮想計算機600を検索する。すなわち、余剰に計算機リソースが割り当てられている他の仮想計算機600が検索される。   The DB failure countermeasure determination program 1014 searches for other virtual machines 600 satisfying the following expression (1) among the other virtual machines 600 sharing the computer resources with the target virtual machine 600. That is, another virtual computer 600 to which computer resources are allocated excessively is searched.

Figure 0006293683
Figure 0006293683

さらに、DB障害対策判定プログラム1014は、下式(2)に基づいて、検索された他の仮想計算機600の余剰な計算機リソース量を算出する。   Further, the DB failure countermeasure determination program 1014 calculates the surplus computer resource amount of the searched other virtual computer 600 based on the following equation (2).

Figure 0006293683
Figure 0006293683

以上がステップS405の処理の説明である。   The above is the description of the process in step S405.

DB障害対策判定プログラム1014は、検索された他の仮想計算機600に余剰に割り当てられた計算機リソースを用いて、不足している計算機リソースを確保できるか否かを判定する(ステップS406)。具体的には、DB障害対策判定プログラム1014は、式(2)に基づいて算出された値が不足しているCPUのリソース量以上であるか否かを判定する。   The DB failure countermeasure determination program 1014 determines whether or not a shortage of computer resources can be secured using the computer resources allocated to the other searched virtual computers 600 (step S406). Specifically, the DB failure countermeasure determination program 1014 determines whether or not the value calculated based on Expression (2) is equal to or more than the CPU resource amount that is insufficient.

不足している計算機リソースを確保できないと判定された場合(ステップS406がNo)、DB障害対策判定プログラム1014は、ステップS403に進む。   If it is determined that the insufficient computer resources cannot be secured (No in step S406), the DB failure countermeasure determination program 1014 proceeds to step S403.

不足している計算機リソースを確保できると判定された場合(ステップS406がYes)、DB障害対策判定プログラム1014は、ターゲット仮想計算機600のシェア値を変更する(ステップS407)。   If it is determined that an insufficient computer resource can be secured (Yes in step S406), the DB failure countermeasure determination program 1014 changes the share value of the target virtual computer 600 (step S407).

例えば、DB障害対策判定プログラム1014が、基盤管理計算機200のDB障害復旧プログラム2013にターゲット仮想計算機600及び他の仮想計算機600のシェア値の変更を指示する。DB障害復旧プログラム2013は、当該指示にしたがって、ターゲット仮想計算機600及び他の仮想計算機600のシェア値を変更する。   For example, the DB failure countermeasure determination program 1014 instructs the DB failure recovery program 2013 of the infrastructure management computer 200 to change the share values of the target virtual computer 600 and other virtual computers 600. The DB failure recovery program 2013 changes the share values of the target virtual machine 600 and other virtual machines 600 according to the instruction.

DB障害対策判定プログラム1014は、DB障害対処法管理情報1003に基づいて、シェア値の変更によって追加料金が発生するか否かを判定する(ステップS408)。具体的には、以下のような処理が実行される。   Based on the DB failure countermeasure management information 1003, the DB failure countermeasure determination program 1014 determines whether or not an additional fee is incurred due to the change of the share value (step S408). Specifically, the following processing is executed.

DB障害対策判定プログラム1014は、対処法が「シェア値変更」である対処法に関する課金発生の有無を課金管理プログラム1015に問い合わせる。なお、当該問合せには対処手順管理情報1004のメタデータ10041が含まれる。   The DB failure countermeasure determination program 1014 inquires of the charging management program 1015 whether or not charging has occurred regarding a countermeasure whose countermeasure is “change in share value”. The inquiry includes metadata 10041 of the handling procedure management information 1004.

課金管理プログラム1015は、DB障害対処法管理情報1003を参照して、ボトルネック箇所10031が「CPU」かつ対処法10032が「シェア値変更」である行を検索する。課金管理プログラム1015は、メタデータ10041に基づいて、検索された行の追加料金10038から定額100381又は従量課金100382のいずれかの値を取得する。課金管理プログラム1015は、取得された値をDB障害対策判定プログラム1014に応答する。   The charging management program 1015 refers to the DB failure handling method management information 1003 and searches for a row in which the bottleneck portion 10031 is “CPU” and the handling method 10032 is “change share value”. The charge management program 1015 acquires a value of either a fixed amount 10000381 or a pay-per-use charge 10032 from the additional charge 10030 of the searched row based on the metadata 10029. The accounting management program 1015 responds to the DB failure countermeasure determination program 1014 with the acquired value.

応答に含まれる値が「なし」の場合、DB障害対策判定プログラム1014はシェア値を変更しても追加料金が発生しないと判定する。一方、応答に含まれる値が「あり」の場合、DB障害対策判定プログラム1014は、シェア値を変更することによって追加料金が発生すると判定する。以上がステップS408の処理の説明である。   When the value included in the response is “none”, the DB failure countermeasure determination program 1014 determines that no additional charge is incurred even if the share value is changed. On the other hand, when the value included in the response is “Yes”, the DB failure countermeasure determination program 1014 determines that an additional fee is generated by changing the share value. The above is the description of the process in step S408.

シェア値を変更しても追加料金が発生しないと判定された場合(ステップS408がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS412)。その後、DB障害対策判定プログラム1014は、処理を終了する。例えば、シェア値を変更する対処法が実行された旨が通知される。   When it is determined that no additional fee is generated even if the share value is changed (No in step S408), the DB failure countermeasure determination program 1014 notifies the cloud user 10 of the processing result (step S412). Thereafter, the DB failure countermeasure determination program 1014 ends the process. For example, it is notified that a countermeasure for changing the share value has been executed.

シェア値を変更することによって追加料金が発生すると判定された場合(ステップS408がYes)、DB障害対策判定プログラム1014は、課金計算機800に、追加料金の発生を通知する(ステップS409)。当該通知には、ターゲット仮想計算機600の識別情報、変更されたシェア値等の対処法に関する情報が含まれる。DB障害対策判定プログラム1014は、課金計算機800から応答があるまで待ち続ける。   When it is determined that an additional fee is generated by changing the share value (Yes in step S408), the DB failure countermeasure determination program 1014 notifies the charging computer 800 of the occurrence of the additional fee (step S409). The notification includes information related to the countermeasure such as identification information of the target virtual machine 600 and a changed share value. The DB failure countermeasure determination program 1014 continues to wait until there is a response from the billing computer 800.

なお、課金計算機800は、クラウド管理計算機100からの通知を受信した場合、当該通知に含まれる情報に基づいて追加料金を算出し、算出された追加料金をクラウド管理計算機100に通知する。なお、追加料金を算出する方法は、公知のものであり、また、本実施例とは直接関係しないため説明を省略する。   When the billing computer 800 receives the notification from the cloud management computer 100, the billing computer 800 calculates an additional fee based on the information included in the notification, and notifies the cloud management computer 100 of the calculated additional fee. Note that the method for calculating the additional fee is a publicly known method and is not directly related to the present embodiment, so that the description thereof is omitted.

DB障害対策判定プログラム1014は、課金計算機800から追加料金の通知を受信した場合(ステップS410)、サービス要件管理情報1001を更新する(ステップS411)。   The DB failure countermeasure determination program 1014 updates the service requirement management information 1001 (step S411) when receiving a notification of the additional fee from the billing computer 800 (step S410).

具体的には、DB障害対策判定プログラム1014は、サービス要件管理情報1001を参照し、仮想計算機識別子10012がターゲット仮想計算機600の識別情報と一致する行を検索する。DB障害対策判定プログラム1014は、通知された追加料金に基づいて、検索された行の課金10017を更新する。   Specifically, the DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and searches for a row in which the virtual machine identifier 10012 matches the identification information of the target virtual machine 600. The DB failure countermeasure determination program 1014 updates the billing 10017 of the searched row based on the notified additional fee.

DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS412)。その後、DB障害対策判定プログラム1014は、処理を終了する。例えば、シェア値を変更する対処法が実行された旨、及び追加料金が通知される。   The DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10 (step S412). Thereafter, the DB failure countermeasure determination program 1014 ends the process. For example, the fact that the countermeasure for changing the share value has been executed and the additional fee are notified.

次に、図20に示す処理について説明する。図20は、ボトルネック箇所10031が「CPU」かつ対処法10032が「上限値変更」である対処法に対応する処理を示す。   Next, the process shown in FIG. 20 will be described. FIG. 20 illustrates a process corresponding to a coping method in which the bottleneck portion 10031 is “CPU” and the coping method 10032 is “change upper limit value”.

DB障害対策判定プログラム1014は、基盤管理計算機200から、DBボトルネック分析プログラム2011によって算出された不足しているCPUのリソース量を取得する(ステップS501)。   The DB failure countermeasure determination program 1014 acquires the insufficient CPU resource amount calculated by the DB bottleneck analysis program 2011 from the infrastructure management computer 200 (step S501).

DB障害対策判定プログラム1014は、サービス要件管理情報1001及び計算機リソース割当情報2002を参照して、ターゲット仮想計算機600の上限値を変更できるか否かを判定する(ステップS502)。   The DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and the computer resource allocation information 2002 to determine whether or not the upper limit value of the target virtual computer 600 can be changed (step S502).

ステップS502の処理はステップS402の処理と同様の処理である。すなわち、DB障害対策判定プログラム1014は、保証値100154及び確保形態200232から取得された値に基づいて、ターゲット仮想計算機600の上限値を変更できるか否かを判定する。   The process in step S502 is similar to the process in step S402. In other words, the DB failure countermeasure determination program 1014 determines whether or not the upper limit value of the target virtual machine 600 can be changed based on the guaranteed value 100154 and the value acquired from the reservation form 2002022.

ターゲット仮想計算機600の上限値を変更できないと判定された場合(ステップS502がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS503)。   When it is determined that the upper limit value of the target virtual machine 600 cannot be changed (No in step S502), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and determines whether or not the next countermeasure is present. Is determined (step S503).

次の対処法が存在すると判定された場合(ステップS503がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS503がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS512)。その後、DB障害対策判定プログラム1014は、処理を終了する。ステップS512の処理はステップS412の処理と同一である。   When it is determined that the next countermeasure is present (Yes in step S503), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in step S503), the DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10 (step S512). Thereafter, the DB failure countermeasure determination program 1014 ends the process. The process of step S512 is the same as the process of step S412.

ステップS502において、ターゲット仮想計算機600の上限値を変更できると判定された場合(ステップS502がYes)、DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、ターゲット仮想計算機600と同一のホスト計算機500上で稼働する他の仮想計算機600を検索する(ステップS504)。ステップS504の処理はステップS404の処理と同一である。   When it is determined in step S502 that the upper limit value of the target virtual machine 600 can be changed (Yes in step S502), the DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and is the same as the target virtual machine 600. The other virtual computer 600 running on the host computer 500 is searched (step S504). The process in step S504 is the same as the process in step S404.

DB障害対策判定プログラム1014は、検索された他の仮想計算機600に余剰に割り当てられている計算機リソースを算出する(ステップS505)。ステップS505の処理はステップS405の処理と同一である。   The DB failure countermeasure determination program 1014 calculates a computer resource that is excessively allocated to the other searched virtual computer 600 (step S505). The process of step S505 is the same as the process of step S405.

DB障害対策判定プログラム1014は、検索された他の仮想計算機600に余剰に割り当てられた計算機リソースを用いて、不足している計算機リソースを確保できるか否かを判定する(ステップS506)。ステップS506の処理はステップS406の処理と同一である。   The DB failure countermeasure determination program 1014 determines whether or not the insufficient computer resources can be secured using the computer resources allocated to the other searched virtual computers 600 (step S506). The process in step S506 is the same as the process in step S406.

不足している計算機リソースを確保できないと判定された場合(ステップS506がNo)、DB障害対策判定プログラム1014は、ステップS503に進む。   When it is determined that insufficient computer resources cannot be secured (No in step S506), the DB failure countermeasure determination program 1014 proceeds to step S503.

不足している計算機リソースを確保できると判定された場合(ステップS506がYes)、DB障害対策判定プログラム1014は、ターゲット仮想計算機600の上限値を変更する(ステップS507)。ステップS507の処理はステップS407の処理と同一である。   If it is determined that an insufficient computer resource can be secured (Yes in step S506), the DB failure countermeasure determination program 1014 changes the upper limit value of the target virtual computer 600 (step S507). The process in step S507 is the same as the process in step S407.

DB障害対策判定プログラム1014は、DB障害対処法管理情報1003に基づいて、上限値の変更によって追加料金が発生するか否かを判定する(ステップS508)。ステップS508の処理はステップS408の処理と同一である。   The DB failure countermeasure determination program 1014 determines whether or not an additional fee is generated due to the change of the upper limit value based on the DB failure countermeasure management information 1003 (step S508). The process of step S508 is the same as the process of step S408.

上限値を変更しても追加料金が発生しないと判定された場合(ステップS508がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS512)。その後、DB障害対策判定プログラム1014は、処理を終了する。   If it is determined that no additional fee will be generated even if the upper limit value is changed (No in step S508), the DB failure countermeasure determination program 1014 notifies the cloud user 10 of the processing result (step S512). Thereafter, the DB failure countermeasure determination program 1014 ends the process.

上限値を変更することによって追加料金が発生すると判定された場合(ステップS508がYes)、DB障害対策判定プログラム1014は、課金計算機800に、追加料金の発生を通知する(ステップS509)。ステップS509の処理はステップS409の処理と同一である。   When it is determined that an additional fee is generated by changing the upper limit value (Yes in step S508), the DB failure countermeasure determination program 1014 notifies the charging computer 800 of the occurrence of the additional fee (step S509). The process in step S509 is the same as the process in step S409.

DB障害対策判定プログラム1014は、課金計算機800から追加料金の通知を受信した場合(ステップS510)、サービス要件管理情報1001を更新する(ステップS511)。DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS512)。ステップS510、ステップS511及びステップS512の処理は、ステップS410、ステップS411及びステップS412の処理と同一である。   The DB failure countermeasure determination program 1014 updates the service requirement management information 1001 (step S511) when receiving a notification of the additional charge from the billing computer 800 (step S510). The DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10 (step S512). Steps S510, S511, and S512 are the same as steps S410, S411, and S412.

次に、図21A及び図21Bに示す処理について説明する。図21A及び図21Bは、ボトルネック箇所10031が「CPU」かつ対処法10032が「対象VMとリソースを共有するVMを他のサーバへ移行」である対処法に対応する処理を示す。   Next, the process shown in FIGS. 21A and 21B will be described. FIG. 21A and FIG. 21B show processing corresponding to the coping method in which the bottleneck portion 10031 is “CPU” and the coping method 10032 is “migrate VM that shares resources with the target VM to another server”.

DB障害対策判定プログラム1014は、基盤管理計算機200から、DBボトルネック分析プログラム2011によって算出された不足しているCPUのリソース量を取得する(ステップS601)。   The DB failure countermeasure determination program 1014 acquires the insufficient CPU resource amount calculated by the DB bottleneck analysis program 2011 from the base management computer 200 (step S601).

DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、ターゲット仮想計算機600と同一のホスト計算機500上で稼働する他の仮想計算機600を検索する(ステップS602)。ステップS602の処理はステップS404の処理と同一である。   The DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and searches for another virtual computer 600 operating on the same host computer 500 as the target virtual computer 600 (step S602). The process in step S602 is the same as the process in step S404.

DB障害対策判定プログラム1014は、検索された他の仮想計算機600の中に、他の仮想計算機600が現在稼働しているホスト計算機500から他のホスト計算機500に移行可能な他の仮想計算機600が存在するか否かを判定する(ステップS603)。   The DB failure countermeasure determination program 1014 includes, among other searched virtual machines 600, other virtual machines 600 that can be migrated from the host computer 500 in which the other virtual machine 600 is currently operating to another host machine 500. It is determined whether or not it exists (step S603).

具体的には、DB障害対策判定プログラム1014は、計算機リソースの不足が起因する性能劣化が発生しておらず、かつ、サービス要件管理情報1001のハードウェア指定100152が「なし」である仮想計算機600が存在するか否かを判定する。前述した条件を満たす仮想計算機600が存在する場合、現在稼働しているホスト計算機500から他のホスト計算機500に移行可能な他の仮想計算機600が存在すると判定される。   Specifically, the DB failure countermeasure determination program 1014 does not cause performance degradation due to a shortage of computer resources, and the virtual computer 600 in which the hardware specification 100152 of the service requirement management information 1001 is “none”. It is determined whether or not exists. When the virtual computer 600 that satisfies the above-described condition exists, it is determined that there is another virtual computer 600 that can be migrated from the currently running host computer 500 to another host computer 500.

現在稼働しているホスト計算機500から他のホスト計算機500に移行可能な他の仮想計算機600が存在しないと判定された場合(ステップS603がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS604)。ステップS604の処理はステップS403の処理と同一である。   When it is determined that there is no other virtual computer 600 that can be migrated from the currently running host computer 500 to another host computer 500 (No in step S603), the DB failure countermeasure determination program 1014 executes the countermeasure procedure management information. Referring to 1004, it is determined whether or not the next countermeasure exists (step S604). The process in step S604 is the same as the process in step S403.

次の対処法が存在すると判定された場合(ステップS604がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS604がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS613)。その後、DB障害対策判定プログラム1014は、処理を終了する。ステップS613の処理はステップS412の処理と同一である。   When it is determined that the next countermeasure is present (Yes in step S604), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in step S604), the DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10 (step S613). Thereafter, the DB failure countermeasure determination program 1014 ends the process. The process in step S613 is the same as the process in step S412.

ステップS603において、現在稼働しているホスト計算機500から他のホスト計算機500に移行可能な他の仮想計算機600が存在すると判定された場合(ステップS603がYes)、DB障害対策判定プログラム1014は、移行可能な仮想計算機600に割り当てられている計算機リソースを算出する(ステップS605)。   In step S603, when it is determined that there is another virtual computer 600 that can be migrated from the currently running host computer 500 to another host computer 500 (step S603 is Yes), the DB failure countermeasure determination program 1014 performs migration. The computer resource allocated to the possible virtual computer 600 is calculated (step S605).

例えば、DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照し、仮想計算機識別子20022が移行可能な仮想計算機600の識別情報と一致する行を検索する。DB障害対策判定プログラム1014は、検索された行の確保形態200232の値を、移行可能な仮想計算機600に割り当てられている計算機リソースとして算出する。なお、実使用量200233、保証値100154等を用いて算出された値であってもよい。   For example, the DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and searches for a row in which the virtual computer identifier 20022 matches the identification information of the virtual computer 600 that can be migrated. The DB failure countermeasure determination program 1014 calculates the value of the searched row reservation mode 200202 as a computer resource assigned to the migratable virtual computer 600. It may be a value calculated using the actual usage amount 2002003, the guaranteed value 100154, or the like.

DB障害対策判定プログラム1014は、算出された計算機リソースを用いて、不足している計算機リソースを確保できるか否かを判定する(ステップS606)。ステップS606の処理はステップS406の処理と同一である。   The DB failure countermeasure determination program 1014 determines whether or not an insufficient computer resource can be secured using the calculated computer resource (step S606). The process in step S606 is the same as the process in step S406.

なお、移行可能な仮想計算機600のうち、ステップS606の判定条件を満たす仮想計算機600が複数存在する場合、DB障害対策判定プログラム1014は、算出された計算機リソースが最も小さい仮想計算機600を移行させる仮想計算機600として選択するものとする。   When there are a plurality of virtual computers 600 that satisfy the determination condition in step S606 among the virtual computers 600 that can be migrated, the DB failure countermeasure determination program 1014 transfers a virtual computer 600 to which the calculated virtual computer 600 with the smallest computer resource is migrated. The computer 600 is selected.

不足している計算機リソースを確保できないと判定された場合(ステップS606がNo)、DB障害対策判定プログラム1014は、ステップS604に進む。   When it is determined that the insufficient computer resources cannot be secured (No in step S606), the DB failure countermeasure determination program 1014 proceeds to step S604.

不足している計算機リソースを確保できると判定された場合(ステップS606がYes)、DB障害対策判定プログラム1014は、移行可能な仮想計算機600に必要な計算機リソースを確保できるホスト計算機500が存在するか否かを判定する(ステップS607)。例えば、以下のような処理が実行される。   When it is determined that the insufficient computer resources can be secured (Yes in step S606), the DB failure countermeasure determination program 1014 has the host computer 500 that can secure the computer resources necessary for the migratable virtual computer 600 exist. It is determined whether or not (step S607). For example, the following processing is executed.

DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、仮想計算機識別子20022がステップS607の判定条件を満たす仮想計算機600の識別情報と一致する行を検索する。検索された行を含むエントリが移行させる仮想計算機600が稼働するホスト計算機500である。   The DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and searches for a row in which the virtual computer identifier 20022 matches the identification information of the virtual computer 600 that satisfies the determination condition in step S607. This is the host computer 500 in which the virtual computer 600 to which the entry including the searched row is to be migrated operates.

DB障害対策判定プログラム1014は、サーバリソース使用状態情報2003を参照して、物理計算機識別子20032が前述したホスト計算機500の識別情報と一致する行を検索する。これによって、DB障害対策判定プログラム1014は、前述したホスト計算機500を含むクラスタ900を特定できる。   The DB failure countermeasure determination program 1014 refers to the server resource usage state information 2003 and searches for a row in which the physical computer identifier 20032 matches the identification information of the host computer 500 described above. Thereby, the DB failure countermeasure determination program 1014 can specify the cluster 900 including the host computer 500 described above.

DB障害対策判定プログラム1014は、サービス要件管理情報1001及びサーバリソース使用状態情報2003等を参照して、特定されたホスト計算機500の中から、占有的に使用されているホスト計算機500を除外する。   The DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and the server resource usage state information 2003, and excludes the host computer 500 that is used exclusively from the specified host computer 500.

さらに、DB障害対策判定プログラム1014は、サーバリソース使用状態情報2003の空き容量200333等を参照して、残りのホスト計算機500の中から、移行させる仮想計算機600に割り当てる計算機リソース分の空きリソースを有するホスト計算機500を検索する。以上がステップS607の処理の一例である。   Further, the DB failure countermeasure determination program 1014 has free resources for the computer resources to be allocated to the virtual computer 600 to be migrated from the remaining host computers 500 with reference to the free capacity 200033 of the server resource usage status information 2003 and the like. The host computer 500 is searched. The above is an example of the process of step S607.

移行可能な仮想計算機600に必要な計算機リソースを確保できるホスト計算機500が存在しないと判定された場合(ステップS607がNo)、DB障害対策判定プログラム1014は、ステップS604に進む。   When it is determined that there is no host computer 500 that can secure necessary computer resources in the migratable virtual computer 600 (No in step S607), the DB failure countermeasure determination program 1014 proceeds to step S604.

移行可能な仮想計算機600に必要な計算機リソースを確保できるホスト計算機500が存在すると判定された場合(ステップS607がYes)、DB障害対策判定プログラム1014は、移行先のホスト計算機500を決定し(ステップS608)、決定されたホスト計算機500へステップS606の判定条件を満たす仮想計算機600を移行する(ステップS609)。   If it is determined that there is a host computer 500 that can secure the necessary computer resources in the migratable virtual computer 600 (Yes in step S607), the DB failure countermeasure determination program 1014 determines the host computer 500 that is the migration destination (step In step S608), the virtual computer 600 that satisfies the determination condition in step S606 is transferred to the determined host computer 500 (step S609).

例えば、DB障害対策判定プログラム1014が、基盤管理計算機200のDB障害復旧プログラム2013に仮想計算機600の移行を指示する。DB障害復旧プログラム2013は、当該指示にしたがって、ステップS606の判定条件を満たす仮想計算機600を決定されたホスト計算機500に移行する。なお、ホスト計算機500間の仮想計算機600の移行処理は公知のものであるため説明を省略する。   For example, the DB failure countermeasure determination program 1014 instructs the DB failure recovery program 2013 of the infrastructure management computer 200 to migrate the virtual computer 600. In accordance with the instruction, the DB failure recovery program 2013 migrates the virtual computer 600 that satisfies the determination condition of step S606 to the determined host computer 500. Note that the migration process of the virtual machine 600 between the host machines 500 is a well-known process and will not be described.

なお、ステップS608において、移行先の候補となるホスト計算機500が複数存在する場合、空きリソース量が多いホスト計算機500が優先的に選択されるものとする。   In step S608, if there are a plurality of host computers 500 as migration destination candidates, it is assumed that the host computer 500 with a large amount of free resources is preferentially selected.

ステップS610、ステップS611、ステップS612、ステップS613及びステップS614の処理は、ステップS408、ステップS409、及びステップS410、ステップS411及びステップS412の処理と同一である。   The processing of step S610, step S611, step S612, step S613, and step S614 is the same as the processing of step S408, step S409, and step S410, step S411, and step S412.

次に、図22に示す処理について説明する。図22は、ボトルネック箇所10031が「CPU」かつ対処法10032が「対象VMを他のサーバへ移行」である対処法に対応する処理を示す。   Next, the process shown in FIG. 22 will be described. FIG. 22 shows a process corresponding to a coping method in which the bottleneck portion 10031 is “CPU” and the coping method 10032 is “migrate the target VM to another server”.

DB障害対策判定プログラム1014は、基盤管理計算機200から、DBボトルネック分析プログラム2011によって算出された不足しているCPUのリソース量を取得する(ステップS701)。   The DB failure countermeasure determination program 1014 acquires the insufficient CPU resource amount calculated by the DB bottleneck analysis program 2011 from the infrastructure management computer 200 (step S701).

DB障害対策判定プログラム1014は、ターゲット仮想計算機600に必要な計算機リソースを確保できるホスト計算機500が存在するか否かを判定する(ステップS702)。ステップS702の処理はステップS607の処理と同様の処理である。ステップS702では、移行する仮想計算機600がターゲット仮想計算機600である点がステップS607の処理と異なる。   The DB failure countermeasure determination program 1014 determines whether or not there is a host computer 500 that can secure a computer resource necessary for the target virtual computer 600 (step S702). The process in step S702 is the same as the process in step S607. Step S702 is different from the processing in step S607 in that the virtual computer 600 to be migrated is the target virtual computer 600.

ターゲット仮想計算機600に必要な計算機リソースを確保できるホスト計算機500が存在しないと判定された場合(ステップS702がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS703)。ステップS703の処理はステップS403の処理と同一である。   When it is determined that there is no host computer 500 that can secure the necessary computer resources in the target virtual computer 600 (No in step S702), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and performs the following It is determined whether there is a countermeasure (step S703). The process in step S703 is the same as the process in step S403.

次の対処法が存在すると判定された場合(ステップS703がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS703がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS710)。その後、DB障害対策判定プログラム1014は、処理を終了する。ステップS710の処理はステップS412の処理と同一である。   When it is determined that the next countermeasure is present (Yes in step S703), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in step S703), the DB failure countermeasure determination program 1014 notifies the cloud user 10 of the processing result (step S710). Thereafter, the DB failure countermeasure determination program 1014 ends the process. The process in step S710 is the same as the process in step S412.

ステップS702において、ターゲット仮想計算機600に必要な計算機リソースを確保できるホスト計算機500が存在すると判定された場合(ステップS702がYes)、DB障害対策判定プログラム1014は、移行先のホスト計算機500を決定し(ステップS704)、決定されたホスト計算機500へターゲット仮想計算機600を移行する(ステップS705)。ステップS704の処理はステップS608の処理と同一である。また、ステップS705の処理はステップS609の処理と同様の処理である。ステップS705では、移行する仮想計算機600がターゲット仮想計算機600である点がステップS609の処理と異なる。   If it is determined in step S702 that there is a host computer 500 that can secure the necessary computer resources in the target virtual computer 600 (Yes in step S702), the DB failure countermeasure determination program 1014 determines the migration destination host computer 500. (Step S704), the target virtual computer 600 is migrated to the determined host computer 500 (Step S705). The process in step S704 is the same as the process in step S608. Further, the process in step S705 is the same as the process in step S609. Step S705 is different from step S609 in that the virtual machine 600 to be migrated is the target virtual machine 600.

ステップS706、ステップS707、ステップS708、ステップS709及びステップS710の処理は、ステップS408、ステップS409、ステップS410、ステップS411及びステップS412の処理と同一である。   The processes in steps S706, S707, S708, S709, and S710 are the same as those in steps S408, S409, S410, S411, and S412.

次に、図23に示す処理について説明する。図23は、融通処理を示す。   Next, the process shown in FIG. 23 will be described. FIG. 23 shows the accommodation process.

DB障害対策判定プログラム1014は、基盤管理計算機200から、DBボトルネック分析プログラム2011によって算出された不足しているCPUのリソース量を取得する(ステップS801)。   The DB failure countermeasure determination program 1014 acquires the insufficient CPU resource amount calculated by the DB bottleneck analysis program 2011 from the infrastructure management computer 200 (step S801).

DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、ターゲット仮想計算機600と同一のホスト計算機500上で稼働する他の仮想計算機600を検索する(ステップS802)。すなわち、ターゲット仮想計算機600と計算機リソースを共有する他の仮想計算機600が検索される。ステップS802の処理はステップS404の処理と同一である。   The DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 and searches for another virtual computer 600 operating on the same host computer 500 as the target virtual computer 600 (step S802). That is, another virtual machine 600 that shares a computer resource with the target virtual machine 600 is searched. The process in step S802 is the same as the process in step S404.

DB障害対策判定プログラム1014は、サービス要件管理情報1001に基づいて、ターゲット仮想計算機600と計算機リソースを共有する仮想計算機600の中に、性能保証オプションが設定されていない仮想計算機600が存在するか否かを判定する(ステップS803)。   Based on the service requirement management information 1001, the DB failure countermeasure determination program 1014 determines whether or not there is a virtual computer 600 for which the performance guarantee option is not set in the virtual computer 600 sharing the computer resources with the target virtual computer 600. Is determined (step S803).

具体的には、DB障害対策判定プログラム1014は、ターゲット仮想計算機600と計算機リソースを共有する仮想計算機600の行の適用状態100141を参照し、適用状態100141が「なし」である仮想計算機600が存在するか否かを判定する。   Specifically, the DB failure countermeasure determination program 1014 refers to the application state 100141 of the row of the virtual computer 600 that shares the computer resources with the target virtual computer 600, and there is a virtual computer 600 whose application state 100141 is “None”. It is determined whether or not to do.

性能保証オプションが設定されていない仮想計算機600が存在しないと判定された場合(ステップS803がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS804)。ステップS804の処理はステップS403の処理と同一である。   When it is determined that there is no virtual machine 600 for which the performance guarantee option is not set (No in step S803), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and the following countermeasure is present. It is determined whether or not to perform (step S804). The process in step S804 is the same as the process in step S403.

次の対処法が存在すると判定された場合(ステップS804がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS804がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS811)。その後、DB障害対策判定プログラム1014は、処理を終了する。ステップS811の処理はステップS412の処理と同一である。   When it is determined that the next countermeasure is present (Yes in step S804), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in step S804), the DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10 (step S811). Thereafter, the DB failure countermeasure determination program 1014 ends the process. The process in step S811 is the same as the process in step S412.

性能保証オプションが設定されていない仮想計算機600が存在すると判定された場合(ステップS803がYes)、DB障害対策判定プログラム1014は、性能保証オプションが設定されていない仮想計算機600を用いて不足している計算機リソースを確保できるか否かを判定する(ステップS805)。   When it is determined that there is a virtual machine 600 for which the performance guarantee option is not set (Yes in step S803), the DB failure countermeasure determination program 1014 is insufficient using the virtual machine 600 for which the performance guarantee option is not set. It is determined whether or not a certain computer resource can be secured (step S805).

例えば、DB障害対策判定プログラム1014は、性能保証オプションが設定されていない仮想計算機600に割り当てられているCPUのリソース量が、不足しているCPUのリソース量以上になるか否かを判定する。   For example, the DB failure countermeasure determination program 1014 determines whether or not the CPU resource amount allocated to the virtual machine 600 for which the performance guarantee option is not set is equal to or more than the insufficient CPU resource amount.

性能保証オプションが設定されていない仮想計算機600を用いて不足している計算機リソースを確保できないと判定された場合(ステップS805がNo)、DB障害対策判定プログラム1014は、ステップS804に進む。   When it is determined that the insufficient computer resources cannot be secured using the virtual computer 600 for which the performance guarantee option is not set (No in step S805), the DB failure countermeasure determination program 1014 proceeds to step S804.

性能保証オプションが設定されていない仮想計算機600を用いて、不足している計算機リソースを確保できると判定された場合(ステップS805がYes)、DB障害対策判定プログラム1014は、当該仮想計算機600の計算機リソースをターゲット仮想計算機600の計算機リソースとして流用する(ステップS806)。   When it is determined that the insufficient computer resources can be secured using the virtual computer 600 for which the performance guarantee option is not set (Yes in step S805), the DB failure countermeasure determination program 1014 displays the computer of the virtual computer 600. The resource is used as the computer resource of the target virtual computer 600 (step S806).

例えば、DB障害対策判定プログラム1014は、性能保証オプションが設定されていない仮想計算機600の計算機リソースの流用を基盤管理計算機200のDB障害復旧プログラム2013に指示する。DB障害復旧プログラム2013は、当該指示にしたがって、性能保証オプションが設定されていない仮想計算機600の計算機リソースをターゲット仮想計算機600の計算機リソースとして流用する。   For example, the DB failure countermeasure determination program 1014 instructs the DB failure recovery program 2013 of the infrastructure management computer 200 to divert the computer resources of the virtual computer 600 for which the performance guarantee option is not set. In accordance with the instruction, the DB failure recovery program 2013 diverts the computer resource of the virtual computer 600 for which the performance guarantee option is not set as the computer resource of the target virtual computer 600.

DB障害対策判定プログラム1014は、DB障害対処法管理情報1003に基づいて、性能保証オプションが設定されていない仮想計算機600の計算機リソースを流用することによって料金の変更が発生するか否かを判定する(ステップS807)。   The DB failure countermeasure determination program 1014 determines, based on the DB failure countermeasure management information 1003, whether or not a charge change occurs by diverting the computer resources of the virtual computer 600 for which the performance guarantee option is not set. (Step S807).

ステップS807では、ターゲット仮想計算機600に対する追加料金の発生の有無だけではなく、計算機リソースが流用された仮想計算機600に対する減額料金の発生の有無も対象となる。なお、処理の内容はステップS408と同様であるため説明を省略する。   In step S807, not only whether or not an additional fee is generated for the target virtual computer 600, but also whether or not a reduced fee is generated for the virtual computer 600 to which the computer resource is diverted. Note that the content of the process is the same as that in step S408, and thus the description thereof is omitted.

性能保証オプションが設定されていない仮想計算機600の計算機リソースを流用しても料金の変更が発生しない場合(ステップS807がNo)、DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS811)。その後、DB障害対策判定プログラム1014は、処理を終了する。ステップS811の処理はステップS412の処理と同一である。   If the charge does not change even if the computer resources of the virtual machine 600 for which the performance guarantee option is not set are used (No in step S807), the DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10. (Step S811). Thereafter, the DB failure countermeasure determination program 1014 ends the process. The process in step S811 is the same as the process in step S412.

性能保証オプションが設定されていない仮想計算機600の計算機リソースを流用することによって料金の変更が発生すると判定された場合(ステップS807がYes)、DB障害対策判定プログラム1014は、課金計算機800に、料金の変更の発生を通知する(ステップS812)。当該通知には、ターゲット仮想計算機600の識別情報、性能保証オプションが設定されていない仮想計算機600の識別情報、流用された計算機リソース量等の対処法に関する情報が含まれる。DB障害対策判定プログラム1014は、課金計算機800から応答があるまで待ち続ける。   If it is determined that a charge change occurs by diverting the computer resources of the virtual machine 600 for which the performance guarantee option is not set (Yes in step S807), the DB failure countermeasure determination program 1014 sends the charge to the charging computer 800. The occurrence of the change is notified (step S812). The notification includes information regarding the coping method such as the identification information of the target virtual machine 600, the identification information of the virtual machine 600 for which the performance guarantee option is not set, and the diverted computer resource amount. The DB failure countermeasure determination program 1014 continues to wait until there is a response from the billing computer 800.

このとき、課金計算機800は、ターゲット仮想計算機600に対する追加料金及び計算機リソースが流用された仮想計算機600に対する減額料金を算出する。課金計算機800は、算出された料金を含む課金情報の通知をクラウド管理計算機100に送信する。   At this time, the billing computer 800 calculates an additional fee for the target virtual computer 600 and a reduced fee for the virtual computer 600 to which the computer resource is diverted. The billing computer 800 transmits billing information notification including the calculated fee to the cloud management computer 100.

DB障害対策判定プログラム1014は、課金計算機800から課金情報の通知を受信した場合(ステップS809)、サービス要件管理情報1001を更新する(ステップS810)。ステップS809の処理はステップS410の処理と同一である。また、ステップS810の処理はステップS411の処理と同様である。ステップS810では、ターゲット仮想計算機600に対する追加料金及び計算機リソースが流用された仮想計算機600に対する減額料金がサービス要件管理情報1001に反映される点がステップS411の処理と異なる。   The DB failure countermeasure determination program 1014 updates the service requirement management information 1001 (step S810) when receiving a notification of charging information from the charging computer 800 (step S809). The process in step S809 is the same as the process in step S410. Further, the processing in step S810 is the same as the processing in step S411. Step S810 differs from the processing in step S411 in that the additional fee for the target virtual computer 600 and the reduced fee for the virtual computer 600 for which the computer resources are diverted are reflected in the service requirement management information 1001.

DB障害対策判定プログラム1014は、処理結果をクラウドユーザ10に通知する(ステップS811)。その後、DB障害対策判定プログラム1014は、処理を終了する。例えば、性能保証オプションが設定されていない仮想計算機600の計算機リソースを流用した旨、追加料金及び減額料金が通知される。   The DB failure countermeasure determination program 1014 notifies the processing result to the cloud user 10 (step S811). Thereafter, the DB failure countermeasure determination program 1014 ends the process. For example, an additional charge and a reduced charge are notified that the computer resources of the virtual machine 600 for which the performance guarantee option is not set are used.

実施例2では、DBサーバ80の性能劣化の原因がIO不足である点が実施例1と異なる。以下、実施例1との差異を中心に実施例2について説明する。   The second embodiment is different from the first embodiment in that the cause of performance degradation of the DB server 80 is insufficient IO. Hereinafter, the second embodiment will be described focusing on differences from the first embodiment.

実施例2のシステム構成は実施例1と同一であるため説明を省略する。また、実施例2のクラウド管理計算機100及び基盤管理計算機200のハードウェア構成及びソフトウェア構成は実施例1と同一であるため説明を省略する。また、実施例2のクラウド管理計算機100及び基盤管理計算機200が管理する情報は実施例1と同一であるため説明を省略する。また、実施例2のクラウド管理計算機100のDB対処手順生成プログラム1013が実行する処理は実施例1と同一であるため説明を省略する。   Since the system configuration of the second embodiment is the same as that of the first embodiment, the description thereof is omitted. Further, the hardware configuration and software configuration of the cloud management computer 100 and the infrastructure management computer 200 of the second embodiment are the same as those of the first embodiment, and thus description thereof is omitted. The information managed by the cloud management computer 100 and the infrastructure management computer 200 according to the second embodiment is the same as that according to the first embodiment, and a description thereof will be omitted. The processing executed by the DB handling procedure generation program 1013 of the cloud management computer 100 according to the second embodiment is the same as that according to the first embodiment, and a description thereof will be omitted.

実施例2では、対処手順管理情報1004の内容及び対処法が実施例1と異なる。図24は、実施例2の対処手順管理情報1004の一例を示す説明図である。   In the second embodiment, the contents of the handling procedure management information 1004 and the handling method are different from those in the first embodiment. FIG. 24 is an explanatory diagram illustrating an example of handling procedure management information 1004 according to the second embodiment.

対処手順管理情報1004のデータ構造は実施例1と同一である。実施例2の対処手順管理情報1004は、対処手順管理情報1004の内容が実施例1と異なる。   The data structure of the handling procedure management information 1004 is the same as that of the first embodiment. The coping procedure management information 1004 of the second embodiment is different from the first embodiment in the content of the coping procedure management information 1004.

IOが不足する原因には、HDD等の記憶媒体のIOPS処理能力の不足に起因するケースと、メモリ容量が不足していることによって記憶媒体へのスワップによるIO増加が起因するケースとがある。そのため、IO不足に対応するための一連の対処法は、ホスト計算機500側及びストレージ装置300側にまたがった処理となる。   The cause of the shortage of IO includes a case caused by a shortage of IOPS processing capacity of a storage medium such as an HDD, and a case caused by an increase in IO due to a swap to the storage medium due to a shortage of memory capacity. For this reason, a series of countermeasures for dealing with the shortage of IOs is processing that spans the host computer 500 side and the storage apparatus 300 side.

具体的には、対処法では、ホスト計算機500側の機能で実現可能な処理が優先的に行われ、ホスト計算機500に対する処理だけでは対応できない場合、ストレージ装置300側の処理にて対応する。   Specifically, in the handling method, processing that can be realized by the function on the host computer 500 side is preferentially performed, and when it cannot be handled only by processing on the host computer 500, the processing on the storage device 300 side handles it.

ボトルネックの原因がCPUリソースの不足である場合と同様に、メモリ及び記憶媒体のそれぞれの対処手順については、図15、図16及び図17に示すように追加料金の発生の有無及びクラウドユーザ10が入力したポリシに基づいて決定される。   As in the case where the cause of the bottleneck is a shortage of CPU resources, the coping procedures for the memory and the storage medium are as follows, as shown in FIG. 15, FIG. 16, and FIG. Is determined based on the input policy.

図25A、図25B、図25C及び図25Dは、実施例2のクラウド管理計算機100が対処手順管理情報1004にしたがって実行する処理の一例を説明するフローチャートである。   25A, 25B, 25C, and 25D are flowcharts illustrating an example of processing that the cloud management computer 100 according to the second embodiment executes in accordance with the handling procedure management information 1004.

メモリのリソース量の不足に起因するIO不足については、CPUのリソース量の不足と同様の対処法にて対応することができるため、ここでは、メモリ容量が十分にあり、かつ、性能劣化の原因が記憶媒体のIOPS処理能力の不足であるケースを想定する。すなわち、図24に示すメモリ容量が不足しているか否かの判定結果がNoに分岐した場合の対処法について説明する。   The IO shortage due to the shortage of memory resources can be dealt with in the same way as the shortage of CPU resources, so here the memory capacity is sufficient and the cause of performance degradation Suppose that the storage medium has insufficient IOPS processing capability. That is, a countermeasure when the determination result of whether or not the memory capacity shown in FIG. 24 is insufficient is branched to No will be described.

なお、不足しているIOリソース量はすでに取得されているものとする。さらに、追加料金に関連する処理は実施例1と同一であるため省略している。   It is assumed that the insufficient IO resource amount has already been acquired. Furthermore, the processing related to the additional fee is omitted because it is the same as that in the first embodiment.

図25Aは、対処法10032が「ホスト計算機のディスクIOの優先度更新」である対処法に対応する処理を示す。   FIG. 25A shows processing corresponding to a countermeasure in which the countermeasure 10032 is “priority update of disk IO of host computer”.

DB障害対策判定プログラム1014は、サービス要件管理情報1001を参照して、仮想計算機600の仮想ディスク630に記憶領域を提供するボリューム640のディスクIOの優先度を更新できるか否かを判定する(ステップS901)。すなわち、シェア値が変更できるか否かが判定される。なお、ステップS901の判定方法は、ステップS402と同一の方法である。   The DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and determines whether or not the priority of the disk IO of the volume 640 that provides a storage area to the virtual disk 630 of the virtual machine 600 can be updated (step). S901). That is, it is determined whether or not the share value can be changed. Note that the determination method in step S901 is the same method as in step S402.

ボリューム640のディスクIOの優先度を更新できないと判定された場合(ステップS901がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS902)。ステップS902の処理はステップS403の処理と同一である。   When it is determined that the priority of the disk IO of the volume 640 cannot be updated (No in step S901), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and determines whether the following countermeasure is present. Is determined (step S902). The process in step S902 is the same as the process in step S403.

次の対処法が存在すると判定された場合(ステップS902がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS902がNo)、DB障害対策判定プログラム1014は、処理を終了する。   When it is determined that the next countermeasure is present (Yes in step S902), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in step S902), the DB failure countermeasure determination program 1014 ends the process.

ステップS901において、ボリューム640のディスクIOの優先度を更新できると判定された場合(ステップS901がYes)、DB障害対策判定プログラム1014は、サービス要件管理情報1001、クラウド基盤構成情報2001、計算機リソース割当情報2002、及びストレージリソース使用状態情報2004を参照し、ボリューム640を共有する他の仮想計算機600のIOPSの割当量を保証値まで下げることによって、不足している計算機リソースを確保できるか否かを判定する(ステップS903)。具体的には、以下のような処理が実行される。   When it is determined in step S901 that the priority of the disk IO of the volume 640 can be updated (step S901 is Yes), the DB failure countermeasure determination program 1014 includes service requirement management information 1001, cloud infrastructure configuration information 2001, computer resource allocation. By referring to the information 2002 and the storage resource usage state information 2004, whether or not an insufficient computer resource can be secured by reducing the IOPS allocation amount of another virtual computer 600 sharing the volume 640 to a guaranteed value. Determination is made (step S903). Specifically, the following processing is executed.

DB障害対策判定プログラム1014は、クラウド基盤構成情報2001を参照して、仮想計算機識別子20011がターゲット仮想計算機600の識別情報と一致する行を検索する。DB障害対策判定プログラム1014は、検索された行のボリューム識別子200142に格納される値を取得する。   The DB failure countermeasure determination program 1014 refers to the cloud infrastructure configuration information 2001 and searches for a row in which the virtual machine identifier 20011 matches the identification information of the target virtual machine 600. The DB failure countermeasure determination program 1014 acquires a value stored in the volume identifier 200142 of the searched row.

DB障害対策判定プログラム1014は、ボリューム識別子201423が取得された値と一致する行を検索する。検索された行の仮想計算機識別子20011の値を取得する。ターゲット仮想計算機600以外の識別情報に対応する仮想計算機600が、当該ターゲット仮想計算機600と同一のボリューム640を共有する仮想計算機600となる。   The DB failure countermeasure determination program 1014 searches for a row in which the volume identifier 201423 matches the acquired value. The value of the virtual machine identifier 20011 of the retrieved row is acquired. A virtual machine 600 corresponding to identification information other than the target virtual machine 600 becomes a virtual machine 600 that shares the same volume 640 as the target virtual machine 600.

なお、以下の説明では、ターゲット仮想計算機600と同一のボリューム640を共有する仮想計算機600を共有仮想計算機600とも記載する。   In the following description, a virtual machine 600 that shares the same volume 640 as the target virtual machine 600 is also referred to as a shared virtual machine 600.

DB障害対策判定プログラム1014は、サービス要件管理情報1001を参照して、仮想計算機識別子10012がターゲット仮想計算機600の識別情報と一致し、かつ、対象100153が「ディスク」である行を検索する。また、DB障害対策判定プログラム1014は、仮想計算機識別子10012が共有仮想計算機600の識別情報と一致し、かつ、対象100153が「ディスク」である行を検索する。DB障害対策判定プログラム1014は、検索された行の保証値100154に格納される値を取得する。   The DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 and searches for a row in which the virtual computer identifier 10012 matches the identification information of the target virtual computer 600 and the target 100153 is “disk”. Also, the DB failure countermeasure determination program 1014 searches for a row in which the virtual machine identifier 10012 matches the identification information of the shared virtual machine 600 and the target 100153 is “disk”. The DB failure countermeasure determination program 1014 acquires a value stored in the guaranteed value 100154 of the searched row.

DB障害対策判定プログラム1014は、計算機リソース割当情報2002を参照して、仮想計算機識別子20022がターゲット仮想計算機600の識別情報と一致し、かつ、計算機リソース種別200231が「ディスク」である行を検索する。また、DB障害対策判定プログラム1014は、仮想計算機識別子20022が共有仮想計算機600の識別情報と一致し、かつ、計算機リソース種別200231が「ディスク」である行を検索する。DB障害対策判定プログラム1014は、検索された行の確保形態200232に格納される値を取得する。   The DB failure countermeasure determination program 1014 refers to the computer resource allocation information 2002 to search for a row in which the virtual computer identifier 20022 matches the identification information of the target virtual computer 600 and the computer resource type 200201 is “disk”. . Further, the DB failure countermeasure determination program 1014 searches for a row in which the virtual computer identifier 20022 matches the identification information of the shared virtual computer 600 and the computer resource type 200201 is “disk”. The DB failure countermeasure determination program 1014 obtains the value stored in the searched row reservation form 2002022.

DB障害対策判定プログラム1014は、ターゲット仮想計算機600の保証値100154及び確保形態200232から取得された値、並びに、共有仮想計算機600の保証値100154及び確保形態200232から取得された値に基づいて、共有仮想計算機600のIOPSの割当量を保証値まで下げることによって、不足している計算機リソースを確保できるか否かを判定する。以上がステップS903の処理の説明である。   The DB failure countermeasure determination program 1014 is shared based on the guaranteed value 100154 of the target virtual machine 600 and the value acquired from the secured form 2002022 and the value obtained from the guaranteed value 100154 and secured form 200202 of the shared virtual machine 600. By reducing the IOPS allocation amount of the virtual computer 600 to the guaranteed value, it is determined whether or not the insufficient computer resources can be secured. The above is the description of the process in step S903.

不足している計算機リソースを確保できないと判定された場合(ステップS903がNo)、DB障害対策判定プログラム1014は、ステップS902に進む。   If it is determined that insufficient computer resources cannot be secured (No in step S903), the DB failure countermeasure determination program 1014 proceeds to step S902.

不足している計算機リソースを確保できると判定された場合(ステップS903がYes)、DB障害対策判定プログラム1014は、ターゲット仮想計算機600のシェア値を更新することによって、不足している計算機リソースを確保する(ステップS904)。その後、DB障害対策判定プログラム1014は、処理を終了する。   When it is determined that the insufficient computer resources can be secured (Yes in step S903), the DB failure countermeasure determination program 1014 secures the insufficient computer resources by updating the share value of the target virtual computer 600. (Step S904). Thereafter, the DB failure countermeasure determination program 1014 ends the process.

図25Bは、対処法10032が「他のVMのボリュームを移行」である対処法に対応する処理を示す。   FIG. 25B shows processing corresponding to a countermeasure whose countermeasure 10032 is “migrate another VM volume”.

ここで、「他のVMのボリュームを移行」とは、仮想計算機600のイメージデータが格納されるボリューム640を他のボリューム640にコピーすることを意味する。   Here, “migrate the volume of another VM” means copying the volume 640 storing the image data of the virtual machine 600 to the other volume 640.

DB障害対策判定プログラム1014は、サービス要件管理情報1001のハードウェア指定100152を参照して、ディスクを共有する他の仮想計算機600を他のボリュームに移行できるか否かを判定する(ステップS911)。   The DB failure countermeasure determination program 1014 refers to the hardware specification 100152 of the service requirement management information 1001 and determines whether or not another virtual machine 600 sharing the disk can be migrated to another volume (step S911).

ディスクを共有する他の仮想計算機600を他のボリュームに移行できないと判定された場合(ステップS911がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS912)。ステップS912の処理はステップS403の処理と同一である。   When it is determined that another virtual machine 600 sharing the disk cannot be migrated to another volume (No in step S911), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and takes the following countermeasures. Is determined (step S912). The process of step S912 is the same as the process of step S403.

次の対処法が存在すると判定された場合(ステップS912がYes)、DB障害対策判定プログラム1014は、次の対処法に対する処理を開始する。次の対処法が存在しないと判定された場合(ステップS912がNo)、DB障害対策判定プログラム1014は、処理を終了する。   When it is determined that the next countermeasure is present (Yes in step S912), the DB failure countermeasure determination program 1014 starts processing for the next countermeasure. When it is determined that there is no next countermeasure (No in step S912), the DB failure countermeasure determination program 1014 ends the process.

ディスクを共有する他の仮想計算機600を他のボリュームに移行できると判定された場合(ステップS911がYes)、DB障害対策判定プログラム1014は、計算機リソース割当情報2002、ストレージリソース使用状態情報2004及びストレージ構成情報2005を参照して、ターゲット仮想計算機600とディスクを共有する他の仮想計算機600のうち、ディスク指定のない仮想計算機600に対するIOPSの合計値が不足しているIOリソース量以上であるか否かを判定する(ステップS913)。   When it is determined that the other virtual computer 600 sharing the disk can be migrated to another volume (Yes in step S911), the DB failure countermeasure determination program 1014 includes the computer resource allocation information 2002, the storage resource usage state information 2004, and the storage. With reference to the configuration information 2005, it is determined whether or not the total IOPS value for the virtual computer 600 with no disk designation among the other virtual computers 600 sharing the disk with the target virtual computer 600 is equal to or larger than the IO resource amount that is insufficient. Is determined (step S913).

ディスク指定のない仮想計算機600に対するIOPSの合計値が不足しているIOリソース量より小さい場合(ステップS913がNo)、DB障害対策判定プログラム1014は、ステップS912に進む。   When the total IOPS value for the virtual machine 600 with no disk designation is smaller than the insufficient IO resource amount (No in step S913), the DB failure countermeasure determination program 1014 proceeds to step S912.

ディスク指定のない仮想計算機600に対するIOPSの合計が不足しているIOリソース量以上である場合(ステップS913がYes)、DB障害対策判定プログラム1014は、ストレージリソース使用状態情報2004及びストレージ構成情報2005を参照して、ディスク指定がない仮想計算機600に必要な計算機リソースを有するストレージ装置300を確保できるか否か判定する(ステップS914)。   If the total IOPS for the virtual machine 600 with no disk designation is equal to or greater than the insufficient IO resource amount (Yes in step S913), the DB failure countermeasure determination program 1014 stores the storage resource usage status information 2004 and the storage configuration information 2005. With reference to the table, it is determined whether or not the storage apparatus 300 having the computer resources necessary for the virtual machine 600 with no disk designation can be secured (step S914).

条件を満たすストレージ装置300を確保できないと判定された場合(ステップS914がNo)、DB障害対策判定プログラム1014は、ステップS912に進む。   When it is determined that the storage device 300 that satisfies the condition cannot be secured (No in step S914), the DB failure countermeasure determination program 1014 proceeds to step S912.

条件を満たすストレージ装置300を確保できると判定された場合(ステップS914がYes)、DB障害対策判定プログラム1014は、ステップS913において選択された他の仮想計算機600を、条件を満たすストレージ装置300に移行する(ステップS918)。その後、DB障害対策判定プログラム1014は、処理を終了する。なお、移行先のストレージ装置300が複数存在する場合、DB障害対策判定プログラム1014は、IOPSの空きが多いものを優先的に選択するものとする。   When it is determined that the storage device 300 that satisfies the condition can be secured (Yes in step S914), the DB failure countermeasure determination program 1014 migrates the other virtual machine 600 selected in step S913 to the storage device 300 that satisfies the condition. (Step S918). Thereafter, the DB failure countermeasure determination program 1014 ends the process. When there are a plurality of migration destination storage apparatuses 300, the DB failure countermeasure determination program 1014 preferentially selects a storage device with a large IOPS space.

図25Cは、対処法10032が「論理記憶領域の増強」である対処法に対応する処理を示す。   FIG. 25C shows processing corresponding to a countermeasure whose countermeasure 10032 is “increase in logical storage area”.

DB障害対策判定プログラム1014は、ストレージ構成情報2005を参照して、スペアディスクの有無を確認して、論理記憶領域310を増強できるか否かを判定する(ステップS921)。   The DB failure countermeasure determination program 1014 refers to the storage configuration information 2005, confirms whether there is a spare disk, and determines whether the logical storage area 310 can be increased (step S921).

論理記憶領域の増強ができないと判定された場合(ステップS921がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS922)。ステップS922の処理はステップS403の処理と同一である。   When it is determined that the logical storage area cannot be increased (No in step S921), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and determines whether or not the next countermeasure method exists. (Step S922). The process of step S922 is the same as the process of step S403.

次の対処法が存在すると判定された場合(ステップS922がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS922がNo)、DB障害対策判定プログラム1014は、処理を終了する。   When it is determined that the next countermeasure is present (Yes in step S922), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in step S922), the DB failure countermeasure determination program 1014 ends the process.

ステップS921において、論理記憶領域の増強ができると判定された場合(ステップS921がYes)、DB障害対策判定プログラム1014は、ストレージプール320にディスクを追加する(ステップS923)。その後、DB障害対策判定プログラム1014は、処理を終了する。   If it is determined in step S921 that the logical storage area can be increased (step S921 is Yes), the DB failure countermeasure determination program 1014 adds a disk to the storage pool 320 (step S923). Thereafter, the DB failure countermeasure determination program 1014 ends the process.

図25Dは、対処法10032が「IOPSの融通」である対処法に対応する処理を示す。   FIG. 25D shows a process corresponding to a countermeasure whose countermeasure 10032 is “IOPS interchange”.

DB障害対策判定プログラム1014は、ターゲット仮想計算機600とディスクを共有する他の仮想計算機600を検索する(ステップS931)。さらに、DB障害対策判定プログラム1014は、サービス要件管理情報1001を参照して、検索された仮想計算機600の中に、性能保証オプションが設定されていない仮想計算機600が存在するか否かを判定する(ステップS932)。   The DB failure countermeasure determination program 1014 searches for another virtual machine 600 that shares a disk with the target virtual machine 600 (step S931). Further, the DB failure countermeasure determination program 1014 refers to the service requirement management information 1001 to determine whether or not the searched virtual machine 600 includes a virtual machine 600 for which the performance guarantee option is not set. (Step S932).

条件を満たす他の仮想計算機600が存在しないと判定された場合(ステップS932がNo)、DB障害対策判定プログラム1014は、対処手順管理情報1004を参照して、次の対処法が存在するか否かを判定する(ステップS933)。ステップS933の処理はステップS403の処理と同一である。   When it is determined that there is no other virtual machine 600 that satisfies the condition (No in step S932), the DB failure countermeasure determination program 1014 refers to the countermeasure procedure management information 1004 and determines whether the next countermeasure is present. Is determined (step S933). The process in step S933 is the same as the process in step S403.

次の対処法が存在すると判定された場合(ステップS933がYes)、DB障害対策判定プログラム1014は、次の対処法に対応する処理を開始する。次の対処法が存在しないと判定された場合(ステップS933がNo)、DB障害対策判定プログラム1014は、処理を終了する。   When it is determined that the next countermeasure is present (Yes in step S933), the DB failure countermeasure determination program 1014 starts processing corresponding to the next countermeasure. When it is determined that there is no next countermeasure (No in step S933), the DB failure countermeasure determination program 1014 ends the process.

ステップS932において、条件を満たす他の仮想計算機600が存在すると判定された場合(ステップS932がYes)、DB障害対策判定プログラム1014は、当該仮想計算機600が使用しているディスクのIOPSが不足しているIOリソース量以上であるか否かを判定する(ステップS934)。   If it is determined in step S932 that there is another virtual computer 600 that satisfies the condition (Yes in step S932), the DB failure countermeasure determination program 1014 has insufficient IOPS of the disk used by the virtual computer 600. It is determined whether or not the amount is greater than or equal to the existing IO resource amount (step S934).

他の仮想計算機600が使用しているディスクのIOPSが不足しているIOリソース量より小さいと判定された場合(ステップS934がNo)、DB障害対策判定プログラム1014は、ロードバランサ60に対して、フロントエンド側の流量を制限する旨の要求を送信する(ステップS935)。その後、DB障害対策判定プログラム1014は、処理を終了する。   When it is determined that the IOPS of the disk used by the other virtual machine 600 is smaller than the insufficient IO resource amount (No in step S934), the DB failure countermeasure determination program 1014 gives the load balancer 60 A request for limiting the flow rate on the front end side is transmitted (step S935). Thereafter, the DB failure countermeasure determination program 1014 ends the process.

他の仮想計算機600が使用しているディスクのIOPSが不足しているIOリソース量以上であると判定された場合(ステップS934がYes)、DB障害対策判定プログラム1014は、例えば、ボリューム640のIOPSシェア値の変更機能を用いて、性能保証オプションが設定されていない他の仮想計算機600のIOPSをターゲット仮想計算機600に流用する(ステップS936)。その後、DB障害対策判定プログラム1014は、処理を終了する。   When it is determined that the IOPS of the disk used by the other virtual machine 600 is equal to or greater than the insufficient IO resource amount (Yes in step S934), the DB failure countermeasure determination program 1014, for example, the IOPS of the volume 640 Using the share value changing function, the IOPS of another virtual machine 600 for which the performance guarantee option is not set is diverted to the target virtual machine 600 (step S936). Thereafter, the DB failure countermeasure determination program 1014 ends the process.

なお、ステップS936の処理を実行した後、ターゲット仮想計算機600へのアクセス数が減りディスクに対する負荷が減少した場合、DB障害対策判定プログラム1014は、通常のシェア値に設定を戻す。   If the number of accesses to the target virtual machine 600 decreases and the load on the disk decreases after executing the process of step S936, the DB failure countermeasure determination program 1014 returns the setting to the normal share value.

以上で説明したように、クラウド管理計算機100は、テナント50のサービスの契約内容に基づいて、DBサーバ80の障害に対応するための対処法を選択し、また、ポリシ等に基づいて選択された対処法の判定順番を決定することができる。すなわち、適切な対処手順管理情報1004が生成される。   As described above, the cloud management computer 100 selects a countermeasure to deal with the failure of the DB server 80 based on the contract contents of the service of the tenant 50, and is selected based on the policy or the like. The order of determination of countermeasures can be determined. That is, appropriate handling procedure management information 1004 is generated.

また、クラウド管理計算機100は、対処手順管理情報1004と、サービス要件管理情報1001及び計算機リソース割当情報2002等の他のテナント50の情報とに基づいて対処法を実行することによって、他のテナント50への影響を抑えつつ、障害が発生したDBサーバ80を含むテナント50の性能を保証できる。   In addition, the cloud management computer 100 executes another countermeasure based on the handling procedure management information 1004 and the information on the other tenant 50 such as the service requirement management information 1001 and the computer resource allocation information 2002, thereby providing another tenant 50. It is possible to guarantee the performance of the tenant 50 including the DB server 80 in which a failure has occurred while suppressing the influence on the server.

なお、DBサーバ80とは仮想計算機600を用いて実現していたが、一つのホスト計算機500を用いて実現してもよい。この場合、DB障害対処法管理情報1003には、ホスト計算機500に対する対処法が格納される。   The DB server 80 is realized by using the virtual computer 600, but may be realized by using one host computer 500. In this case, the DB failure handling method management information 1003 stores a handling method for the host computer 500.

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。   In addition, this invention is not limited to an above-described Example, Various modifications are included. Further, for example, the above-described embodiments are described in detail for easy understanding of the present invention, and are not necessarily limited to those provided with all the described configurations. Further, a part of the configuration of each embodiment can be added to, deleted from, or replaced with another configuration.

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるCPUが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。   Each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit. The present invention can also be realized by software program codes that implement the functions of the embodiments. In this case, a storage medium in which the program code is recorded is provided to the computer, and a CPU included in the computer reads the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the program code itself and the storage medium storing it constitute the present invention. As a storage medium for supplying such a program code, for example, a flexible disk, a CD-ROM, a DVD-ROM, a hard disk, an SSD (Solid State Drive), an optical disk, a magneto-optical disk, a CD-R, a magnetic tape, A non-volatile memory card, ROM, or the like is used.

また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。   The program code for realizing the functions described in the present embodiment can be implemented by a wide range of programs or script languages such as assembler, C / C ++, perl, Shell, PHP, Java (registered trademark).

さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるCPUが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。   Furthermore, by distributing the program code of the software that implements the functions of the embodiments via a network, the program code is stored in a storage means such as a hard disk or memory of a computer or a storage medium such as a CD-RW or CD-R The CPU included in the computer may read and execute the program code stored in the storage unit or the storage medium.

上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。   In the above-described embodiments, the control lines and information lines indicate what is considered necessary for the explanation, and not all control lines and information lines on the product are necessarily shown. All the components may be connected to each other.

10 クラウドユーザ
20 クラウド管理者
30 ポータル
40 ネットワーク
50 テナント
60 ロードバランサ
70 Webサーバ
80 DBサーバ
90 クラウドシステム
100 クラウド管理計算機
200 基盤管理計算機
300 ストレージ装置
310 論理記憶領域
320 ストレージプール
400 ネットワーク接続装置
500 ホスト計算機
600 仮想計算機
610 DB
620 ゲストOS
630 ボリューム
700 管理用ネットワーク
800 課金計算機
900 クラスタ
1000 プログラムメモリ
1001 サービス要件管理情報
1002 ポリシ管理情報
1003 DB障害対処法管理情報
1004 対処手順管理情報
1010 サービス管理プログラム
1011 ポリシ管理プログラム
1012 対処法管理プログラム
1013 DB対処手順生成プログラム
1014 DB障害対策判定プログラム
1015 課金管理プログラム
2000 プログラムメモリ
2001 クラウド基盤構成情報
2002 計算機リソース割当情報
2003 サーバリソース使用状態情報
2004 ストレージリソース使用状態情報
2005 ストレージ構成情報
2010 DB障害検知プログラム
2011 DBボトルネック分析プログラム
2012 構成管理プログラム
2013 DB障害復旧プログラム
2014 リソース監視プログラム
10 cloud user 20 cloud administrator 30 portal 40 network 50 tenant 60 load balancer 70 web server 80 DB server 90 cloud system 100 cloud management computer 200 infrastructure management computer 300 storage device 310 logical storage area 320 storage pool 400 network connection device 500 host computer 600 Virtual computer 610 DB
620 guest OS
630 Volume 700 Management network 800 Billing computer 900 Cluster 1000 Program memory 1001 Service requirement management information 1002 Policy management information 1003 DB failure handling method management information 1004 Handling procedure management information 1010 Service management program 1011 Policy management program 1012 Handling management program 1013 DB Handling procedure generation program 1014 DB failure countermeasure determination program 1015 Charge management program 2000 Program memory 2001 Cloud infrastructure configuration information 2002 Computer resource allocation information 2003 Server resource usage status information 2004 Storage resource usage status information 2005 Storage configuration information 2010 DB failure detection program 2011 DB Bottleneck analysis program 2012 configuration management program 2013 DB disaster recovery program 2014 resource monitoring program

Claims (14)

複数の計算機を備える計算機システムであって、
前記複数の計算機は、前記計算機システムを管理する少なくとも一つの第1の計算機、及びユーザの業務に使用する業務システムを構築するための計算機リソースを提供する複数の第2の計算機を含み、
前記少なくとも一つの第1の計算機は、第1のプロセッサ、前記第1のプロセッサに接続される第1のメモリ、及び前記第1のプロセッサに接続される第1のインタフェースを有し、
前記複数の第2の計算機の各々は、第2のプロセッサ、前記第2のプロセッサに接続される第2のメモリ、前記第2のプロセッサに接続される第2のインタフェース、及び記憶装置を有し、
前記業務システムは、複数の業務計算機を含み、
前記少なくとも一つの第1の計算機は、
前記計算機システム上に構築された複数の業務システムの各々のサービス要件を管理するサービス要件管理情報と、前記業務計算機の性能劣化が検知された場合、計算機リソースの種別毎の性能劣化を改善するための制御方法である対処法を管理する対処法管理情報と、を保持し、
複数の対処法の集合であり、性能劣化が検知された前記業務計算機に対して前記対処法を実行できるか否かを判定する順番を含む対処手順管理情報を生成する対処手順生成部を有し、
前記サービス要件は、前記業務システムに含まれる前記複数の業務計算機の各々の性能保証の条件、前記業務システムに含まれる前記複数の業務計算機の各々の運用の条件、及び、前記業務システムの課金体系の条件に関する情報を含み、
前記対処法管理情報に含まれる複数の対処法の各々は、前記対処法に対応する処理におけるコスト情報と対応付けられて管理され、
前記対処手順生成部は、
前記対処手順管理情報を生成する対象の業務システムを選択し、
前記対象の業務システムに含まれる前記複数の業務計算機の中から処理対象の業務計算機を選択し、
前記処理対象の業務計算機における対象の計算機リソースを選択し、
前記サービス要件管理情報に基づいて、前記対処法管理情報に含まれる前記複数の対処法の中から、前記対象の業務システムの前記サービス要件に合致する複数の対処法を選択し、
前記選択された複数の対処法が実行可能か否かを判定する判定順番を決定することによって、前記対処手順管理情報を生成することを特徴とする計算機システム。
A computer system comprising a plurality of computers,
The plurality of computers includes at least one first computer that manages the computer system, and a plurality of second computers that provide computer resources for constructing a business system used for a user's business,
The at least one first computer has a first processor, a first memory connected to the first processor, and a first interface connected to the first processor;
Each of the plurality of second computers has a second processor, a second memory connected to the second processor, a second interface connected to the second processor, and a storage device. ,
The business system includes a plurality of business computers,
The at least one first computer is:
Service requirement management information for managing service requirements of each of a plurality of business systems constructed on the computer system, and when performance degradation of the business computer is detected, to improve performance degradation for each type of computer resource And management method management information for managing the management method that is the control method of
A coping procedure generation unit that generates coping procedure management information including an order for determining whether or not the coping method can be executed on the business computer in which performance degradation has been detected. ,
The service requirements include performance guarantee conditions for each of the plurality of business computers included in the business system, operating conditions for each of the plurality of business computers included in the business system, and a billing system for the business system Including information about the terms of
Each of a plurality of countermeasures included in the countermeasure management information is managed in association with cost information in processing corresponding to the countermeasures,
The coping procedure generator is
Select a target business system for generating the handling procedure management information,
Select a business computer to be processed from among the plurality of business computers included in the target business system,
Select the target computer resource in the processing target business computer,
Based on the service requirement management information, select a plurality of countermeasures that match the service requirements of the target business system from the plurality of countermeasures included in the countermeasure management information,
A computer system that generates the coping procedure management information by determining a determination order for determining whether or not the plurality of selected coping methods can be executed.
請求項1に記載の計算機システムであって、
前記少なくとも一つの第1の計算機は、
前記複数の業務システムの各々に対する計算機リソースの割当状態を管理する計算機リソース割当情報、及び複数の対処手順管理情報を保持し、
前記対処手順管理情報にしたがって、前記対処法に対応する処理を実行する障害対策判定部を有し、
前記障害対策判定部は、
任意の業務計算機の性能劣化が検知された場合、性能劣化が検知された前記業務計算機の識別情報及び性能劣化の原因となる前記計算機リソースの種別に基づいて、前記複数の対処手順管理情報の中から適用する前記対処手順管理情報を選択し、
前記選択された対処手順管理情報の前記判定順番にしたがって前記対処法を一つ選択し、
前記サービス要件管理情報及び前記計算機リソースの割当情報を参照して、前記性能劣化が検知された業務計算機を含む業務システム以外の業務システムの前記サービス要件及び前記計算機リソースの割当状態に基づいて、前記性能劣化が検知された業務計算機に対して前記選択された対処法を実行できるか否かを判定し、
前記性能劣化が検知された業務計算機に前記選択された対処法を実行できると判定した場合、前記選択された対処法を実行することを特徴とする計算機システム。
The computer system according to claim 1,
The at least one first computer is:
Holding computer resource allocation information for managing a computer resource allocation state for each of the plurality of business systems, and a plurality of coping procedure management information;
According to the handling procedure management information, a failure countermeasure determination unit that executes processing corresponding to the handling method,
The failure countermeasure determination unit
When performance degradation of an arbitrary business computer is detected, based on the identification information of the business computer from which performance degradation has been detected and the type of the computer resource that causes the performance degradation, Select the handling procedure management information to be applied from
Select one of the countermeasures according to the determination order of the selected countermeasure procedure management information,
With reference to the service requirement management information and the computer resource allocation information, based on the service requirements of the business system other than the business system including the business computer in which the performance deterioration is detected and the allocation state of the computer resource, It is determined whether or not the selected countermeasure can be executed for the business computer in which the performance deterioration is detected,
When it is determined that the selected countermeasure can be executed on the business computer in which the performance deterioration is detected, the computer system is configured to execute the selected countermeasure.
請求項2に記載の計算機システムであって、
前記複数の第2の計算機の各々は、前記計算機リソースを論理的に分割することによって生成された仮想計算機を管理する仮想化部を有し、
第1の業務計算機及び業務計算機は前記仮想計算機を用いて実現され、
前記計算機リソース割当情報は、前記複数の第2の計算機の各々で稼働する複数の仮想計算機に対する計算機リソースの割り当てに関する情報を含み、
前記対処手順生成部は、
前記対象の業務システムの課金体系が追加料金の発生が許容されていない課金体系であるか否かを判定し、
前記対象の業務システムの課金体系が追加料金の発生が許容されていない課金体系であると判定された場合、前記対処法管理情報を参照して、追加料金が発生しない前記複数の対処法を選択し、さらに、前記選択された複数の対処法の中から前記処理対象の業務計算機の性能保証の条件及び運用の条件を満たす複数の対処法を選択し、
前記対象の業務システムの課金体系が追加料金の発生が許容されている課金体系であると判定された場合、前記対処法管理情報を参照して、前記処理対象の業務計算機の性能保証の条件及び運用の条件を満たす複数の対処法を選択することを特徴とする計算機システム。
The computer system according to claim 2,
Each of the plurality of second computers has a virtualization unit that manages virtual computers generated by logically dividing the computer resources,
The first business computer and the business computer are realized by using the virtual computer,
The computer resource allocation information includes information related to allocation of computer resources to a plurality of virtual computers operating on each of the plurality of second computers,
The coping procedure generator is
Determining whether the charging system of the target business system is a charging system that is not allowed to generate additional charges;
If it is determined that the billing system of the target business system is a billing system that does not allow the generation of additional charges, refer to the countermeasure management information and select the plurality of countermeasures that do not cause additional charges And selecting a plurality of countermeasures satisfying the performance guarantee conditions and the operation conditions of the processing target business computer from the selected plurality of countermeasures,
When it is determined that the charging system of the target business system is a charging system that is allowed to generate an additional charge, with reference to the countermeasure management information, the performance guarantee condition of the processing target business computer and A computer system characterized by selecting a plurality of countermeasures that satisfy the conditions of operation.
請求項3に記載の計算機システムであって、
前記対処手順生成部は、
前記対処法管理情報を参照して、処理負荷が低い順又は処理時間が短い順に前記選択された複数の対処法の前記判定順番を決定し、
性能劣化が許容されている業務計算機に割り当てられた計算機リソースを流用する対処法を前記決定された判定順番の最後に追加することによって、前記対処手順管理情報を生成することを特徴とする計算機システム。
The computer system according to claim 3,
The coping procedure generator is
Referring to the countermeasure management information, determine the determination order of the selected countermeasures in order of decreasing processing load or processing time is short,
A computer system characterized in that the coping procedure management information is generated by adding a coping method that diverts a computer resource allocated to a business computer that is allowed to deteriorate in performance to the end of the determined determination order. .
請求項3に記載の計算機システムであって、
前記少なくとも一つの第1の計算機は、前記複数の業務システムの各々の前記判定順番を決定するためのポリシ管理情報を保持し、
前記対処手順生成部は、
前記ポリシ管理情報を参照して、前記選択された複数の対処法の前記判定順番を決定することを特徴とする計算機システム。
The computer system according to claim 3,
The at least one first computer holds policy management information for determining the determination order of each of the plurality of business systems,
The coping procedure generator is
A computer system, wherein the determination order of the plurality of selected countermeasures is determined with reference to the policy management information.
請求項3に記載の計算機システムであって、
前記仮想化部は、当該仮想化部が管理する複数の仮想計算機に対する前記計算機リソースの配分率を決定するためのシェア値を設定し、
前記複数の対処法は、前記シェア値の変更処理、前記第2の計算機間における前記仮想計算機の移行処理、及び前記計算機リソースの追加を含むことを特徴とする計算機システム。
The computer system according to claim 3,
The virtualization unit sets a share value for determining a distribution rate of the computer resource for a plurality of virtual computers managed by the virtualization unit,
The computer system characterized in that the plurality of coping methods include a change process of the share value, a migration process of the virtual machine between the second computers, and addition of the computer resource.
請求項3に記載の計算機システムであって、
前記計算機システムは、前記業務システムのユーザの利用料金を算出する課金部を有する計算機を備え、
前記障害対策判定部は、
前記選択された対処法を実行することによって利用料金に変更があるか否かを判定し、
前記選択された対処法を実行することによって利用料金に変更があると判定された場合、前記選択された対処法の処理結果を含む通知を前記課金部に送信することを特徴とする計算機システム。
The computer system according to claim 3,
The computer system includes a computer having a charging unit that calculates a usage fee for a user of the business system,
The failure countermeasure determination unit
Determining whether there is a change in the usage fee by executing the selected countermeasure,
When it is determined that there is a change in usage fee by executing the selected countermeasure, a computer system including a notification including a processing result of the selected countermeasure is transmitted to the accounting unit.
複数の計算機を備える計算機システムの性能障害の対処方法であって、
前記複数の計算機は、前記計算機システムを管理する少なくとも一つの第1の計算機、及びユーザの業務に使用する業務システムを構築するための計算機リソースを提供する複数の第2の計算機を含み、
前記少なくとも一つの第1の計算機は、第1のプロセッサ、前記第1のプロセッサに接続される第1のメモリ、及び前記第1のプロセッサに接続される第1のインタフェースを有し、
前記複数の第2の計算機の各々は、第2のプロセッサ、前記第2のプロセッサに接続される第2のメモリ、前記第2のプロセッサに接続される第2のインタフェース、及び記憶装置を有し、
前記業務システムは、複数の業務計算機を含み、
前記少なくとも一つの第1の計算機は、
前記計算機システム上に構築された複数の業務システムの各々のサービス要件を管理するサービス要件管理情報と、前記業務計算機の性能劣化が検知された場合、計算機リソースの種別毎の性能劣化を改善するための制御方法である対処法を管理する対処法管理情報と、を保持し、
複数の対処法の集合であり、性能劣化が検知された前記業務計算機に対して前記対処法を実行できるか否かを判定する順番を含む対処手順管理情報を生成する対処手順生成部を有し、
前記サービス要件は、前記業務システムに含まれる前記複数の業務計算機の各々の性能保証の条件、前記業務システムに含まれる前記複数の業務計算機の各々の運用の条件、及び、前記業務システムの課金体系の条件に関する情報を含み、
前記対処法管理情報に含まれる複数の対処法の各々は、前記対処法に対応する処理におけるコスト情報と対応付けられて管理され、
前記計算機システムの性能障害の対処方法は、
前記対処手順生成部が、前記対処手順管理情報を生成する対象の業務システムを選択する第1のステップと、
前記対処手順生成部が、前記対象の業務システムに含まれる前記複数の業務計算機の中から処理対象の業務計算機を選択する第2のステップと、
前記対処手順生成部が、前記処理対象の業務計算機における対象の計算機リソースを選択する第3のステップと、
前記対処手順生成部が、前記サービス要件管理情報に基づいて、前記対処法管理情報に含まれる前記複数の対処法の中から、前記対象の業務システムの前記サービス要件に合致する複数の対処法を選択する第4のステップと、
前記対処手順生成部が、前記選択された複数の対処法が実行可能か否かを判定する判定順番を決定することによって、前記対処手順管理情報を生成する第5のステップと、を含むことを特徴とする計算機システムの性能障害の対処方法。
A method for dealing with a performance failure in a computer system comprising a plurality of computers,
The plurality of computers includes at least one first computer that manages the computer system, and a plurality of second computers that provide computer resources for constructing a business system used for a user's business,
The at least one first computer has a first processor, a first memory connected to the first processor, and a first interface connected to the first processor;
Each of the plurality of second computers has a second processor, a second memory connected to the second processor, a second interface connected to the second processor, and a storage device. ,
The business system includes a plurality of business computers,
The at least one first computer is:
Service requirement management information for managing service requirements of each of a plurality of business systems constructed on the computer system, and when performance degradation of the business computer is detected, to improve performance degradation for each type of computer resource And management method management information for managing the management method that is the control method of
A coping procedure generation unit that generates coping procedure management information including an order for determining whether or not the coping method can be executed on the business computer in which performance degradation has been detected. ,
The service requirements include performance guarantee conditions for each of the plurality of business computers included in the business system, operating conditions for each of the plurality of business computers included in the business system, and a billing system for the business system Including information about the terms of
Each of a plurality of countermeasures included in the countermeasure management information is managed in association with cost information in processing corresponding to the countermeasures,
The method of dealing with the performance failure of the computer system is
A first step in which the handling procedure generation unit selects a target business system for generating the handling procedure management information;
A second step in which the handling procedure generation unit selects a business computer to be processed from the plurality of business computers included in the target business system;
A third step in which the coping procedure generation unit selects a target computer resource in the processing target business computer;
Based on the service requirement management information, the handling procedure generation unit selects a plurality of handling methods that match the service requirements of the target business system from among the plurality of handling methods included in the handling method management information. A fourth step to select;
The coping procedure generation unit includes a fifth step of generating the coping procedure management information by determining a determination order for determining whether or not the plurality of selected coping methods can be executed. A method for dealing with a characteristic failure of a computer system.
請求項8に記載の計算機システムの性能障害の対処方法であって、
前記少なくとも一つの第1の計算機は、
前記複数の業務システムの各々に対する計算機リソースの割当状態を管理する計算機リソース割当情報、及び複数の対処手順管理情報を保持し、
前記対処手順管理情報にしたがって、前記対処法に対応する処理を実行する障害対策判定部を有し、
前記計算機システムの性能障害の対処方法は、
前記障害対策判定部が、任意の業務計算機の性能劣化が検知された場合、性能劣化が検知された前記業務計算機の識別情報及び性能劣化の原因となる計算機リソースの種別に基づいて、前記複数の対処手順管理情報の中から適用する前記対処手順管理情報を選択するステップと、
前記障害対策判定部が、前記選択された対処手順管理情報の前記判定順番にしたがって前記対処法を一つ選択するステップと、
前記障害対策判定部が、前記サービス要件管理情報及び前記計算機リソースの割当情報を参照して、前記性能劣化が検知された業務計算機を含む業務システム以外の業務システムの前記サービス要件及び前記計算機リソースの割当状態に基づいて、前記性能劣化が検知された業務計算機に対して前記選択された対処法を実行できるか否かを判定するステップと、
前記障害対策判定部が、前記性能劣化が検知された業務計算機に前記選択された対処法を実行できると判定した場合、前記選択された対処法を実行するステップと、を含むことを特徴とする計算機システムの性能障害の対処方法。
A method for dealing with a performance failure of a computer system according to claim 8, comprising:
The at least one first computer is:
Holding computer resource allocation information for managing a computer resource allocation state for each of the plurality of business systems, and a plurality of coping procedure management information;
According to the handling procedure management information, a failure countermeasure determination unit that executes processing corresponding to the handling method,
A method of dealing with the performance failure of the computer system is as follows:
When the failure countermeasure determination unit detects a performance deterioration of any business computer, the plurality of the plurality of faults are determined based on the identification information of the business computer in which the performance deterioration is detected and the type of the computer resource that causes the performance deterioration. Selecting the handling procedure management information to be applied from handling procedure management information;
The failure countermeasure determination unit selecting one of the countermeasures according to the determination order of the selected countermeasure procedure management information;
The failure countermeasure determination unit refers to the service requirement management information and the computer resource allocation information, and the service requirements of the business system other than the business system including the business computer in which the performance degradation is detected and the computer resource Determining whether the selected coping method can be executed on the business computer in which the performance deterioration is detected based on an allocation state;
A step of executing the selected countermeasure when the failure countermeasure determination unit determines that the selected countermeasure can be executed on the business computer in which the performance deterioration is detected. How to deal with computer system performance problems.
請求項9に記載の計算機システムの性能障害の対処方法であって、
前記複数の第2の計算機の各々は、前記計算機リソースを論理的に分割することによって生成された仮想計算機を管理する仮想化部を有し、
第1の業務計算機及び業務計算機は前記仮想計算機を用いて実現され、
前記計算機リソース割当情報は、前記複数の第2の計算機の各々で稼働する複数の仮想計算機に対する計算機リソースの割り当てに関する情報を含み、
前記第4のステップは、
前記対象の業務システムの課金体系が追加料金の発生が許容されていない課金体系であるか否かを判定するステップと、
前記対象の業務システムの課金体系が追加料金の発生が許容されていない課金体系であると判定された場合、前記対処法管理情報を参照して、追加料金が発生しない前記複数の対処法を選択し、さらに、前記選択された複数の対処法の中から前記処理対象の業務計算機の性能保証の条件及び運用の条件を満たす複数の対処法を選択するステップと、
前記対象の業務システムの課金体系が追加料金の発生が許容されている課金体系であると判定された場合、前記対処法管理情報を参照して、前記処理対象の業務計算機の性能保証の条件及び運用の条件を満たす複数の対処法を選択するステップと、を含むことを特徴とする計算機システムの性能障害の対処方法。
A method for dealing with a performance failure of a computer system according to claim 9, comprising:
Each of the plurality of second computers has a virtualization unit that manages virtual computers generated by logically dividing the computer resources,
The first business computer and the business computer are realized by using the virtual computer,
The computer resource allocation information includes information related to allocation of computer resources to a plurality of virtual computers operating on each of the plurality of second computers,
The fourth step includes
Determining whether the charging system of the target business system is a charging system that is not allowed to generate additional charges; and
If it is determined that the billing system of the target business system is a billing system that does not allow the generation of additional charges, refer to the countermeasure management information and select the plurality of countermeasures that do not cause additional charges And selecting a plurality of countermeasures satisfying the performance guarantee condition and the operation condition of the processing target business computer from the selected plurality of countermeasures;
When it is determined that the charging system of the target business system is a charging system that is allowed to generate an additional charge, with reference to the countermeasure management information, the performance guarantee condition of the processing target business computer and Selecting a plurality of countermeasures that satisfy the conditions of operation, and a method for coping with performance faults in a computer system.
請求項10に記載の計算機システムの性能障害の対処方法であって、
前記第5のステップは、
前記対処法管理情報を参照して、処理負荷が低い順又は処理時間が短い順に前記選択された複数の対処法の前記判定順番を決定するステップと、
性能劣化が許容されている業務計算機に割り当てられた計算機リソースを流用する対処法を前記決定された判定順番の最後に追加することによって、前記対処手順管理情報を生成するステップと、を含むことを特徴とする計算機システムの性能障害の対処方法。
A method for dealing with a performance failure of a computer system according to claim 10,
The fifth step includes
Determining the determination order of the selected plurality of countermeasures in the order of low processing load or in short processing time with reference to the countermeasure management information;
Generating the coping procedure management information by adding a coping method that diverts a computer resource allocated to a business computer whose performance degradation is allowed to the end of the determined determination order. A method for dealing with a characteristic failure of a computer system.
請求項10に記載の計算機システムの性能障害の対処方法であって、
前記少なくとも一つの第1の計算機は、前記複数の業務システムの各々の前記判定順番を決定するためのポリシ管理情報を保持し、
前記第5のステップは、前記ポリシ管理情報を参照して、前記選択された複数の対処法の前記判定順番を決定するステップを含むことを特徴とする計算機システムの性能障害の対処方法。
A method for dealing with a performance failure of a computer system according to claim 10,
The at least one first computer holds policy management information for determining the determination order of each of the plurality of business systems,
The fifth step includes a step of determining the determination order of the plurality of selected countermeasures with reference to the policy management information, and a method for coping with a performance fault in a computer system.
請求項10に記載の計算機システムの性能障害の対処方法であって、
前記仮想化部は、当該仮想化部が管理する複数の仮想計算機に対する前記計算機リソースの配分率を決定するためのシェア値を設定し、
前記複数の対処法は、前記シェア値の変更処理、前記第2の計算機間における前記仮想計算機の移行処理、及び前記計算機リソースの追加を含むことを特徴とする計算機システムの性能障害の対処方法。
A method for dealing with a performance failure of a computer system according to claim 10,
The virtualization unit sets a share value for determining a distribution rate of the computer resource for a plurality of virtual computers managed by the virtualization unit,
The method of coping with a performance failure of a computer system, wherein the plurality of coping methods include a change process of the share value, a migration process of the virtual machine between the second computers, and addition of the computer resource.
請求項10に記載の計算機システムの性能障害の対処方法であって、
前記計算機システムは、前記業務システムのユーザの利用料金を算出する課金部を有する計算機を備え、
前記計算機システムの性能障害の対処方法は、
前記障害対策判定部が、前記選択された対処法を実行することによって利用料金に変更があるか否かを判定するステップと、
前記障害対策判定部が、前記選択された対処法を実行することによって利用料金に変更があると判定された場合、前記選択された対処法の処理結果を含む通知を前記課金部に送信するステップと、を含むことを特徴とする計算機システムの性能障害の対処方法。
A method for dealing with a performance failure of a computer system according to claim 10,
The computer system includes a computer having a charging unit that calculates a usage fee for a user of the business system,
A method of dealing with the performance failure of the computer system is as follows:
The failure countermeasure determining unit determining whether or not there is a change in a usage fee by executing the selected countermeasure;
A step of transmitting a notification including a processing result of the selected countermeasure to the charging section when the failure countermeasure determining section determines that there is a change in usage fee by executing the selected countermeasure. And a method for dealing with a performance failure of the computer system.
JP2015013183A 2015-01-27 2015-01-27 Computer system and coping method for performance failure of computer system Expired - Fee Related JP6293683B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015013183A JP6293683B2 (en) 2015-01-27 2015-01-27 Computer system and coping method for performance failure of computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015013183A JP6293683B2 (en) 2015-01-27 2015-01-27 Computer system and coping method for performance failure of computer system

Publications (2)

Publication Number Publication Date
JP2016139237A JP2016139237A (en) 2016-08-04
JP6293683B2 true JP6293683B2 (en) 2018-03-14

Family

ID=56560324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015013183A Expired - Fee Related JP6293683B2 (en) 2015-01-27 2015-01-27 Computer system and coping method for performance failure of computer system

Country Status (1)

Country Link
JP (1) JP6293683B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018020603A1 (en) * 2016-07-27 2018-02-01 株式会社日立製作所 Computer system and accelerator management method
KR101826498B1 (en) * 2017-05-02 2018-02-07 나무기술 주식회사 Cloud platform system
JP7011162B2 (en) * 2018-02-05 2022-01-26 富士通株式会社 Performance adjustment program and performance adjustment method
JP6842447B2 (en) * 2018-09-12 2021-03-17 株式会社日立製作所 Systems and methods to help optimize resource allocation
JP7290997B2 (en) * 2019-05-30 2023-06-14 株式会社日立製作所 Cloud use support device and cloud use support method
JP7332488B2 (en) * 2020-01-16 2023-08-23 株式会社日立製作所 Storage system and storage system control method
JP7332668B2 (en) 2021-10-29 2023-08-23 株式会社日立製作所 System management device and system management method
CN115225608A (en) * 2022-07-22 2022-10-21 济南浪潮数据技术有限公司 Load balancing method, device, equipment and medium for DNS domain name resolution

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7603340B2 (en) * 2003-09-04 2009-10-13 Oracle International Corporation Automatic workload repository battery of performance statistics
JP4982216B2 (en) * 2007-03-14 2012-07-25 株式会社日立製作所 Policy creation support method, policy creation support system, and program
TW201112006A (en) * 2009-05-29 2011-04-01 Ibm Computer system, method and program product
JP2011210134A (en) * 2010-03-30 2011-10-20 Nec Corp Management server, virtual machine management method and virtual machine management program
JP2012133629A (en) * 2010-12-22 2012-07-12 Nomura Research Institute Ltd Storage resource control system, storage resource control program and storage resource control method
JP2014002583A (en) * 2012-06-19 2014-01-09 Nifty Corp Information processing apparatus, information processing system, information processing method, and program
WO2014024251A1 (en) * 2012-08-06 2014-02-13 富士通株式会社 Cloud service selection device, cloud service selection system, cloud service selection method, and cloud service selection program
WO2014073024A1 (en) * 2012-11-09 2014-05-15 Hitachi, Ltd. Management computer, computer system, and instance management method
JP6186817B2 (en) * 2013-04-05 2017-08-30 富士通株式会社 Information processing apparatus, information processing program, and information processing method

Also Published As

Publication number Publication date
JP2016139237A (en) 2016-08-04

Similar Documents

Publication Publication Date Title
JP6293683B2 (en) Computer system and coping method for performance failure of computer system
US10873623B2 (en) Dynamically modifying a cluster of computing nodes used for distributed execution of a program
JP5412599B2 (en) Computer system and method for optimal placement of virtual machines in computer system
JP6051228B2 (en) Computer system, storage management computer, and storage management method
AU2019202695A1 (en) Opportunistic resource migration to optimize resource placement
US10333859B2 (en) Multi-tenant resource coordination method
US9135041B2 (en) Selecting provisioning targets for new virtual machine instances
US20160156568A1 (en) Computer system and computer resource allocation management method
US10248460B2 (en) Storage management computer
US10990433B2 (en) Efficient distributed arrangement of virtual machines on plural host machines
US20170359221A1 (en) Method and management system for calculating billing amount in relation to data volume reduction function
JP2019079334A (en) Information processing apparatus, information processing system, and information processing method
US12067413B2 (en) Apparatus for determining resource migration schedule
JP6374845B2 (en) Computer system and container management method
US20160337445A1 (en) Method and apparatus to deploy applications in cloud environments
WO2013171944A1 (en) Virtual machine management system, virtual machine management method, and program
US20130185531A1 (en) Method and apparatus to improve efficiency in the use of high performance storage resources in data center
JP6960444B2 (en) Computer system and resource management method
JP2017138895A (en) Virtualization environment management system and virtualization environment management method
CN112948279A (en) Method, apparatus and program product for managing access requests in a storage system
JP5988505B2 (en) Virtual resource management apparatus, selection method, and selection program
US11237745B2 (en) Computer system and volume arrangement method in computer system to reduce resource imbalance
JP6963465B2 (en) Computer system and data processing control method
JP6098167B2 (en) Virtual machine management program and method thereof
JP6365027B2 (en) Allocation program, allocation device, allocation system, and allocation method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180214

R150 Certificate of patent or registration of utility model

Ref document number: 6293683

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees