JP7428288B1 - Plant response estimation device, plant response estimation method, and program - Google Patents
Plant response estimation device, plant response estimation method, and program Download PDFInfo
- Publication number
- JP7428288B1 JP7428288B1 JP2023071309A JP2023071309A JP7428288B1 JP 7428288 B1 JP7428288 B1 JP 7428288B1 JP 2023071309 A JP2023071309 A JP 2023071309A JP 2023071309 A JP2023071309 A JP 2023071309A JP 7428288 B1 JP7428288 B1 JP 7428288B1
- Authority
- JP
- Japan
- Prior art keywords
- state vector
- learning data
- state
- value
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims description 73
- 239000013598 vector Substances 0.000 claims abstract description 179
- 230000006870 function Effects 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims description 44
- 238000005070 sampling Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000010187 selection method Methods 0.000 claims 12
- 238000010586 diagram Methods 0.000 abstract description 11
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000000872 buffer Substances 0.000 description 41
- 230000008569 process Effects 0.000 description 25
- 238000012952 Resampling Methods 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005316 response function Methods 0.000 description 3
- 101000802640 Homo sapiens Lactosylceramide 4-alpha-galactosyltransferase Proteins 0.000 description 1
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
【課題】操業中のプラントの運転データから応答モデルを精度良く推定する技術を提供すること。【解決手段】本開示の一態様によるプラント応答推定装置は、制御対象プラントの運転データに基づいて、前記制御対象プラントの状態を表す状態ベクトルを作成する状態ベクトル作成部と、前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別部と、前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新部と、を有する。【選択図】図2[Problem] To provide a technology for accurately estimating a response model from operational data of an operating plant. A plant response estimation device according to an aspect of the present disclosure includes a state vector creation unit that creates a state vector representing a state of a controlled plant based on operation data of the controlled plant; a learning data selection unit that determines whether or not the state vector is to be used as learning data; and a parameter updating unit that updates parameters of a function representing a response model. [Selection diagram] Figure 2
Description
本開示は、プラント応答推定装置、プラント応答推定方法、及びプログラムに関する。 The present disclosure relates to a plant response estimation device, a plant response estimation method, and a program.
制御対象の制御量を目標値に追従させることを目的とする制御方式として、モデル予測制御が知られている。また、モデル予測制御で用いられる線形予測モデルのパラメータを推定する手法として、逐次最小2乗法(RLS法:Recursive Least Squares法)等が知られている。例えば、特許文献1には、操業中のプラントの運転データを用いて、RLS法によりプラント応答モデルのパラメータを推定する技術が記載されている。
Model predictive control is known as a control method that aims to make the controlled variable of a controlled object follow a target value. Furthermore, as a method for estimating parameters of a linear prediction model used in model predictive control, the Recursive Least Squares method (RLS method) and the like are known. For example,
しかしながら、従来技術では、プラント応答モデルのパラメータ更新に用いられる学習データとして、例えば、定常状態における一定値しか含まれない運転データが用いられ、不適切なモデルパラメータが推定されてしまうことがある。一定値や1つの周波数成分しか含まれない運転データ等は、プラントのダイナミクスの情報が欠落しており、学習データとしては不適切だが、操業中に十分生じ得る。このような不適切な運転データでの学習では、プラント応答モデルのパラメータの推定値が真値と乖離してしまう場合がある。 However, in the conventional technology, for example, operating data that includes only constant values in a steady state is used as learning data used to update parameters of a plant response model, and inappropriate model parameters may be estimated. Operation data that includes only a constant value or one frequency component lacks information on plant dynamics and is inappropriate as learning data, but it can easily occur during operation. In learning using such inappropriate operational data, the estimated values of the parameters of the plant response model may deviate from the true values.
本開示は、上記の点に鑑みてなされたもので、操業中のプラントの運転データから応答モデルを精度良く推定する技術を提供する。 The present disclosure has been made in view of the above points, and provides a technique for accurately estimating a response model from operational data of an operating plant.
本開示の一態様によるプラント応答推定装置は、制御対象プラントの運転データに基づいて、前記制御対象プラントの状態を表す状態ベクトルを作成する状態ベクトル作成部と、前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別部と、前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新部と、を有する。 A plant response estimation device according to an aspect of the present disclosure includes a state vector creation unit that creates a state vector representing a state of the controlled plant based on operation data of the controlled plant; a learning data selection unit that determines whether the vector is to be used as learning data; and when it is determined that the state vector is to be used as learning data, the state vector is used as learning data to represent a response model of the controlled plant; and a parameter update unit that updates parameters of the function.
操業中のプラントの運転データから応答モデルを精度良く推定する技術が提供される。 A technique is provided for estimating a response model with high accuracy from operating data of a plant in operation.
以下、本発明の実施形態について説明する。以下の各実施形態では、操業中のプラントの運転データからプラント応答モデルを精度良く推定することができるプラント応答推定装置10について説明する。なお、操業中とはプラントが正常に稼働し、通常の運転を行っている状態のことであり、例えば、オンライン中、運転中、運用中等と呼ばれてもよい。また、プラントとは1以上の機械、機器、装置等で構成される産業設備のことであり、プラント応答モデルを用いたモデル予測制御によって制御される制御対象である。プラントの具体例としては、例えば、石油化学プラント、食品プラント、鉄鋼プラント、発電プラント等といったものが挙げられるが、これらは一例であって、これらに限られるものではない。また、一般に、これらのプラントの制御システムでは、プラントの制御量、操作量、外乱量といった入出力データが運転データとして扱われる。
Embodiments of the present invention will be described below. In each of the following embodiments, a plant
ここで、プラントの運転条件等によっては、例えば、定常状態が継続したり、運転データの値が上限値や下限値に偏ってしまったりすることがある。このため、定常状態における運転データや上限値・下限値に偏った運転データを学習データとして用いてプラント応答モデルのパラメータを更新した場合、それらの運転データによってパラメータが収束し、その結果、パラメータの推定値が真値と乖離してしまうことがある。このように、定常状態における運転データや上限値・下限値に偏った運転データ等は、プラント応答モデルの学習データとしては適切でない運転データであるといえる。なお、学習データとは、プラント応答モデルのパラメータ更新に用いられるデータのことである。 Here, depending on the operating conditions of the plant, for example, a steady state may continue, or the value of the operating data may be biased towards the upper limit value or the lower limit value. Therefore, if the parameters of the plant response model are updated using steady-state operating data or operating data that is biased toward the upper and lower limits as learning data, the parameters will converge based on those operating data, and as a result, the parameters will The estimated value may deviate from the true value. In this way, it can be said that operating data in a steady state, operating data biased towards upper and lower limit values, etc. are not suitable as learning data for a plant response model. Note that the learning data is data used to update parameters of the plant response model.
そこで、以下の各実施形態では、定常状態における運転データや上限値・下限値に偏った運転データ等といった適切でない運転データは学習データとしては用いずに、それ以外の運転データを学習データとして用いてプラント応答モデルのパラメータを更新する場合について説明する。これにより、以下の各実施形態に係るプラント応答推定装置10では、精度の良いプラント応答モデルを推定することが可能となる。
Therefore, in each of the following embodiments, unsuitable operation data such as operation data in a steady state or operation data biased toward upper and lower limit values is not used as learning data, and other operation data is used as learning data. The case where the parameters of the plant response model are updated will be explained. Thereby, the plant response estimating
[第一の実施形態]
まず、第一の実施形態について説明する。
[First embodiment]
First, a first embodiment will be described.
<プラント応答推定装置10のハードウェア構成例>
第一の実施形態に係るプラント応答推定装置10のハードウェア構成例を図1に示す。図1に示すように、第一の実施形態に係るプラント応答推定装置10は、入力装置11と、表示装置12と、外部I/F13と、通信I/F14と、プロセッサ15と、メモリ装置16とを有する。これらの各ハードウェアは、それぞれがバス17を介して通信可能に接続される。
<Example of hardware configuration of plant
FIG. 1 shows an example of the hardware configuration of a plant
入力装置11は、例えば、キーボード、マウス、タッチパネル、各種物理ボタン等である。表示装置12は、例えば、ディスプレイ、表示パネル等である。なお、プラント応答推定装置10は、例えば、入力装置11及び表示装置12のうちの少なくとも一方を有していなくてもよい。
The
外部I/F13は、記録媒体13a等の外部装置とのインタフェースである。記録媒体13aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
The external I/
通信I/F14は、プラント応答推定装置10を通信ネットワークに接続するためのインタフェースである。プロセッサ15は、例えば、CPU(Central Processing Unit)等の各種演算装置である。メモリ装置16は、例えば、SSD(Solid State Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等の各種記憶装置である。
Communication I/
なお、図1に示すハードウェア構成は一例であって、プラント応答推定装置10は、他のハードウェア構成であってもよい。例えば、プラント応答推定装置10は、複数のプロセッサ15や複数のメモリ装置16を有していてもよいし、図示したハードウェア以外の種々のハードウェアを有していてもよい。
Note that the hardware configuration shown in FIG. 1 is an example, and the plant
<プラント応答推定装置10の機能構成例>
第一の実施形態に係るプラント応答推定装置10の機能構成例を図2に示す。図2に示すように、第一の実施形態に係るプラント応答推定装置10は、モデルパラメータ推定部101と、ステップ応答計算部102とを有する。これら各部は、例えば、プラント応答推定装置10にインストールされた1以上のプログラムが、プロセッサ15等に実行させる処理により実現される。
<Example of functional configuration of plant
FIG. 2 shows an example of the functional configuration of the plant
モデルパラメータ推定部101は、サンプリング周期Δ毎に、制御対象のプラント(又はその運転状態を計測するセンサ等の機器)から運転データの観測値(制御量y、操作量u及び外乱v)を受信し、そのサンプリング周期Δに応じて、プラント応答モデルのモデルパラメータを推定する。なお、運転データは、例えば、計測データや観測データ等と呼ばれてもよい。
The model parameter estimating
ここで、時刻をtとすれば制御量y、操作量u及び外乱vはそれぞれy(t)、u(t)及びv(t)と表され、各サンプリング時刻tk(kはサンプリング時刻を表すインデックスであり、定周期でインクリメントされる。)に関してtk+1-tk=Δが成り立つ。なお、kは0以上の整数を取り得るものとし、またサンプリング時刻tkはt1から開始するものとする。以下では、特に断らない限り、各サンプリング時刻tkをそのインデックスkと同一視し、y(k)、u(k)及びv(k)とも表すことにする。 Here, if time is t, the controlled variable y, the manipulated variable u, and the disturbance v are expressed as y(t), u(t), and v(t), respectively, and each sampling time t k (k is the sampling time t k+1 −t k =Δ holds true for t k+1 −t k =Δ. It is assumed that k can take an integer greater than or equal to 0, and that the sampling time tk starts from t1 . In the following, unless otherwise specified, each sampling time t k will be equated with its index k, and will also be expressed as y(k), u(k), and v(k).
また、以下では、プラント応答モデルは、パラメータθを持つプラント応答関数Sθ(t)で表されるものとして、パラメータθをモデルパラメータということにする。プラント応答モデルとしては様々なプラント応答関数Sθで表現されるモデルを採用することが可能であるが、以下では、主に、ARMAXモデルといった多項式モデルを想定する。プラント応答モデルがARMAXモデルである場合、モデルパラメータθはARMAXモデルの係数となる。なお、プラント応答モデルとしてARMAXモデル以外の様々なモデルが採用可能であることは言うまでもない。 Further, in the following, the plant response model is represented by a plant response function S θ (t) having a parameter θ, and the parameter θ is referred to as a model parameter. Although it is possible to employ various models expressed by a plant response function S θ as the plant response model, a polynomial model such as an ARMAX model is mainly assumed below. When the plant response model is an ARMAX model, the model parameter θ becomes a coefficient of the ARMAX model. It goes without saying that various models other than the ARMAX model can be employed as the plant response model.
更に、以下では、ARMAXモデルで表されたプラント応答モデルに対して、制御対象プラントの定常状態を表すオフセット項(定数項)を追加したモデルを拡大プラント応答モデルと呼ぶことにする。 Further, hereinafter, a model obtained by adding an offset term (constant term) representing the steady state of the controlled plant to the plant response model represented by the ARMAX model will be referred to as an expanded plant response model.
ステップ応答計算部102は、モデルパラメータ推定部101によって推定されたモデルパラメータ(以下、モデルパラメータ推定値ともいう。)θを用いて、与えられた時刻tにおけるプラントのステップ応答の推定値(以下、ステップ応答推定値ともいう。)Sθ(t)を計算する。なお、ステップ応答とは、操作量としてステップ信号がプラントに印加されたときの制御量のことである。
The step
ただし、ステップ応答計算部102はモデルパラメータ推定値θの利用方法の1つであって、本実施形態に係るプラント応答推定装置10は、モデルパラメータ推定部101のみを有する構成であってもよい。また、本実施形態に係るプラント応答推定装置10は、ステップ応答以外のプラント応答を計算する機能部を有する構成であってもよい。例えば、インパルス応答を計算する「インパルス応答計算部」を有する構成であってもよいし、ランプ応答を計算する「ランプ応答計算部」を有する構成であってもよい。これら以外にも、その他、本実施形態の主旨を逸脱しない範囲で様々な利用方法に対して適用可能である。
However, the step
ここで、モデルパラメータ推定部101には、バッファ部111と、状態ベクトル変換部112と、学習データ選別部113と、逐次推定計算部114と、パラメータ変換部115とが含まれる。
Here, the model
バッファ部111は、或る所定の期間における制御量y(k)、操作量u(k)及び外乱v(k)をメモリ装置16に蓄積(バッファ)する。状態ベクトル変換部112は、メモリ装置16にバッファされている制御量y(k)、操作量u(k)及び外乱v(k)の再サンプリングを行って、それら再サンプリングされた制御量y(k)、操作量u(k)及び外乱v(k)が含まれる状態ベクトルξ(k)を作成する。学習データ選別部113は、状態ベクトルξ(k)を用いて、再サンプリングされた制御量y(k)、操作量u(k)及び外乱v(k)を学習データとして用いるか否かを判定し、学習データとして用いる場合は更新フラグをON、学習データとして用いない場合は更新フラグをOFFとする。逐次推定計算部114は、更新フラグがONである場合、状態ベクトルξ(k)を用いて、拡大プラント応答モデルのモデルパラメータである拡大モデルパラメータを推定する。パラメータ変換部115は、拡大モデルパラメータの推定値をモデルパラメータ推定値θに変換する。なお、状態ベクトルとは制御の分野で用いられる用語であり、制御対象やそれを含む系(システム)の状態を表すベクトルである。
The
<バッファ部111の動作>
サンプリング時刻tkにおける制御量バッファをY(k)、操作量バッファをU(k)、外乱バッファをV(k)として、これらの各バッファは以下のベクトルで表されるものとする。
<Operation of
Assume that the control amount buffer at sampling time t k is Y(k), the operation amount buffer is U(k), and the disturbance buffer is V(k), and each of these buffers is represented by the following vector.
このとき、バッファ部111は、制御量y(k)、操作量u(k)及び外乱v(k)を受信すると、図3に示すように、制御量y(k)と制御量バッファY(k-1)から制御量バッファY(k)、操作量u(k)と操作量バッファU(k-1)から操作量バッファU(k)、外乱v(k)と外乱バッファV(k-1)から外乱バッファV(k)にそれぞれ更新する。
At this time, when the
具体的には、バッファ部111は、制御量バッファY(k-1)に格納されているy(k-B1-1)を削除した上で、新たに観測された制御量y(k)を格納することで、y(k-B1)からy(k)までの制御量が格納された制御量バッファY(k)に更新する。同様に、バッファ部111は、操作量バッファU(k-1)に格納されている操作量u(k-B2-1)を削除した上で、新たに観測された操作量u(k)を格納することで、u(k-B2)からu(k)までの操作量が格納された操作量バッファU(k)に更新する。同様に、バッファ部111は、外乱バッファV(k-1)に格納されている外乱v(k-B3-1)を削除した上で、新たに観測された外乱v(k)を格納することで、v(k-B3)からv(k)までの外乱が格納された外乱バッファV(k)に更新する。
Specifically, the
なお、制御量バッファY(0)、操作量バッファU(0)、外乱バッファV(0)は適切に初期化(例えば、すべて0等に初期化)されているものとする。また、上記では外乱vがある場合を想定して説明したが、外乱vがない場合は外乱バッファV(k)がなくてもよい。 It is assumed that the control amount buffer Y(0), the operation amount buffer U(0), and the disturbance buffer V(0) have been appropriately initialized (for example, all are initialized to 0, etc.). Furthermore, although the above explanation assumes that there is a disturbance v, the disturbance buffer V(k) may not be provided if there is no disturbance v.
<状態ベクトル変換部112の動作>
再サンプリング周期をDとする。このとき、状態ベクトル変換部112は、制御量バッファY(k)、操作量バッファU(k)及び外乱バッファV(k)が更新されると、これらの各バッファY(k)、U(k)及びV(k)から再サンプリング周期Dで再サンプリングを行って、以下の再サンプリング制御量ベクトルYD(k)、再サンプリング操作量ベクトルUD(k)及び再サンプリング外乱ベクトルVD(k)をそれぞれ作成する。
<Operation of state
Let D be the resampling period. At this time, when the control amount buffer Y(k), the operation amount buffer U(k), and the disturbance buffer V(k) are updated, the state
なお、一般に、N、M及びLの値は大きい方が多様な表現が可能で、プラント応答の高精度な予測が期待できるが、モデルパラメータθの推定のために多くの計算資源やメモリ量が必要となる。 In general, the larger the values of N, M, and L, the more diverse expressions can be made, and more accurate predictions of plant responses can be expected. It becomes necessary.
そして、状態ベクトル変換部112は、再サンプリング制御量ベクトルYD(k)、再サンプリング操作量ベクトルUD(k)及び再サンプリング外乱ベクトルVD(k)から以下により状態ベクトルξ(k)を作成する。
Then, the state
なお、状態ベクトルξ(0)は適切な値に初期化(例えば、零ベクトル等に初期化)されているものとする。また、上記では外乱vがある場合を想定して説明したが、外乱vがない場合は再サンプリング外乱ベクトルVD(k)がなくてもよい。 It is assumed that the state vector ξ(0) has been initialized to an appropriate value (for example, initialized to a zero vector, etc.). Furthermore, although the above description assumes that there is a disturbance v, the resampling disturbance vector V D (k) may not be provided if there is no disturbance v.
<学習データ選別部113の動作>
学習データ選別部113は、状態ベクトルξ(k)が作成されると、この状態ベクトルξ(k)を用いて、再サンプリング制御量ベクトルYD(k)、再サンプリング操作量ベクトルUD(k)及び再サンプリング外乱ベクトルVD(k)を学習データとして用いるか否かを判定した上で、その判定結果に応じて更新フラグをON又はOFFにする。これにより、学習データとして用いる運転データ(の観測値)が選別される。
<Operation of learning
When the state vector ξ(k) is created, the learning
以下、或るkに関して学習データとして用いる運転データを選別する処理(第一の実施形態に係る学習データ選別処理)について、図4を参照しながら説明する。ただし、k=0である場合は更新フラグ=ONとして処理を終了する。 Hereinafter, a process for selecting driving data to be used as learning data for a certain k (learning data selecting process according to the first embodiment) will be described with reference to FIG. 4. However, if k=0, the update flag is set to ON and the process ends.
ステップS101:まず、学習データ選別部113は、状態ベクトルξ(k)と1時刻前の状態ベクトルξ(k-1)との差のノルムd(k)を計算する。すなわち、学習データ選別部113は、d(k)=||ξ(k)-ξ(k-1)||pを計算する。ここで、pは、p=1、p=2又はp=∞のいずれかであり、||・||1はL1ノルム、||・||2はL2ノルム、||・||∞はL∞ノルムをそれぞれ表す。以下、d(k)をベクトル差ノルムともいう。
Step S101: First, the learning
ステップS102:次に、学習データ選別部113は、ベクトル差ノルムd(k)が予め設定された閾値γ以上であるか否かを判定する。
Step S102: Next, the learning
d(k)≧γであると判定した場合(ステップS102でYES)、学習データ選別部113は、ステップS103に進む。一方で、d(k)≧γであると判定しなかった場合(ステップS102でNO)、学習データ選別部113は、ステップS104に進む。
If it is determined that d(k)≧γ (YES in step S102), the learning
ステップS103:学習データ選別部113は、更新フラグをONにする。ここで、更新フラグとは、再サンプリング操作量ベクトルUD(k)及び再サンプリング外乱ベクトルVD(k)を学習データとして用いるか否かを表すフラグのことである。更新フラグがONである場合、再サンプリング操作量ベクトルUD(k)及び再サンプリング外乱ベクトルVD(k)が学習データとして用いられて拡大モデルパラメータの更新が行われる。一方で、更新フラグがOFFである場合、再サンプリング操作量ベクトルUD(k)及び再サンプリング外乱ベクトルVD(k)は学習データとして用いられず、拡大モデルパラメータの更新は行われない。
Step S103: The learning
ステップS104:学習データ選別部113は、更新フラグをOFFにする。
Step S104: The learning
<逐次推定計算部114の動作>
以下では、拡大モデルパラメータをθeと表す。逐次推定計算部114は、学習データ選別部113によって更新フラグがON又はOFFに設定されると、状態ベクトルξ(k)を用いて、拡大モデルパラメータθeの値を推定する。すなわち、逐次推定計算部114は、サンプリング時刻tk毎に、逐次的に拡大モデルパラメータθeの値を推定する。
<Operation of sequential
In the following, the expanded model parameters are expressed as θ e . When the update flag is set to ON or OFF by the learning
以下、或るkに関して拡大モデルパラメータθeの値を推定する処理(第一の実施形態に係る拡大モデルパラメータ推定処理)について、図5を参照しながら説明する。なお、以下では、サンプリング時刻tkにおける拡大モデルパラメータθeの推定値をθe(k)と表す。 Hereinafter, the process of estimating the value of the expanded model parameter θ e for a certain k (extended model parameter estimation process according to the first embodiment) will be described with reference to FIG. 5. Note that hereinafter, the estimated value of the expanded model parameter θ e at the sampling time t k is expressed as θ e (k).
ステップS201:まず、逐次推定計算部114は、更新フラグがONであるか否かを判定する。
Step S201: First, the sequential
更新フラグがONであると判定した場合(ステップS201でYES)、逐次推定計算部114は、ステップS202に進む。一方で、更新フラグがONであると判定しなかった場合(ステップS201でNO)、逐次推定計算部114は、拡大モデルパラメータ推定処理を終了する。すなわち、更新フラグがOFFである場合、逐次推定計算部114は、拡大モデルパラメータθeの値を推定及び更新せずに処理を終了する。
If it is determined that the update flag is ON (YES in step S201), the sequential
ステップS202:逐次推定計算部114は、拡大モデルパラメータθeと共分散行列Pとを初期化するか否かを判定する。ここで、初期化すると判定される場合としては、例えば、初回計算時(つまり、k=1のとき)、ユーザ等により初期化指示が行われたとき等が挙げられる。
Step S202: The sequential
拡大モデルパラメータθeと共分散行列Pとを初期化すると判定した場合(ステップS202でYES)、逐次推定計算部114は、ステップS203に進む。一方で、拡大モデルパラメータθeと共分散行列Pとを初期化すると判定しなかった場合(ステップS202でNO)、逐次推定計算部114は、ステップS204に進む。
If it is determined that the expanded model parameter θ e and the covariance matrix P are to be initialized (YES in step S202), the sequential
ステップS203:逐次推定計算部114は、サンプリング時刻tkのインデックスkをk=1に初期化すると共に、θe(0)=θ0及びP(0)=Iと初期化する。ここで、θ0は予め設定された拡大モデルパラメータの初期値、Iは予め設定された任意の行列(例えば、単位行列等)である。
Step S203: The sequential
ステップS204:逐次推定計算部114は、拡大モデルパラメータ推定値θe(k-1)と状態ベクトルξ(k)と制御量y(k)とを用いて、予測誤差ε(k)を計算する。予測誤差ε(k)は、例えば、ε(k)=y(k)-ξ(k)Τθe(k-1)により計算される。なお、Τは転置を表す。
Step S204: The sequential
ステップS205:逐次推定計算部114は、共分散行列P(k-1)を以下により更新して共分散行列P(k)を得る。
Step S205: The sequential
1つ目は、0<λ≦1とすることにより、過去の運転データを忘却するための忘却係数として用いることができる。λが0に近いほど急激に過去の運転データの影響が減少し、1に近いほど過去の運転データの影響が保持される。 First, by setting 0<λ≦1, it can be used as a forgetting coefficient for forgetting past driving data. The closer λ is to 0, the more rapidly the influence of past driving data is reduced, and the closer λ is to 1, the more the influence of past driving data is retained.
2つ目は、λ>1とすることにより、パラメータ更新を加速させるための係数として用いることができる。λの値が大きいほどパラメータの収束を加速させることができる。 Second, by setting λ>1, it can be used as a coefficient for accelerating parameter updating. The larger the value of λ, the faster the parameter convergence can be accelerated.
ステップS206:そして、逐次推定計算部114は、拡大モデルパラメータ推定値θe(k-1)を以下により更新して拡大モデルパラメータ推定値θe(k)を得る。
Step S206: Then, the sequential
<パラメータ変換部115の動作>
拡大モデルパラメータ推定値θe(k)を以下で表す。
<Operation of
The expanded model parameter estimate θ e (k) is expressed below.
このとき、パラメータ変換部115は、拡大モデルパラメータ推定値θe(k)が得られると、図6に示すように、θC(k)を除いたベクトルに変換することで、モデルパラメータ推定値θ(k)を得る。これにより、以下のモデルパラメータ推定値が得られる。
At this time, when the expanded model parameter estimated value θ e (k) is obtained, the
<ステップ応答計算部102の動作>
以下、ステップ応答の推定に用いられるモデルパラメータ推定値(つまり、プラント応答関数Sθに設定されるモデルパラメータ推定値)θ=θ(k)のことを「モデルパラメータ設定値θ」ともいう。また、以下では、簡単のため、ステップ信号として単位ステップ信号を想定する。
<Operation of step
Hereinafter, the model parameter estimated value θ=θ(k) used for estimating the step response (that is, the model parameter estimated value set to the plant response function S θ ) is also referred to as the “model parameter setting value θ”. Further, in the following, for simplicity, a unit step signal is assumed as the step signal.
ステップ応答計算部102は、図7に示すように、モデルパラメータ設定値θと時刻tとが与えられると、初期時刻0から時間t経過後の時刻tにおける単位ステップ応答Sθ(t)を計算する。なお、単位ステップ応答とは、操作量uとして単位ステップ信号を印加した場合における応答(つまり、制御対象プラントのプラント応答モデルの出力)のことである。
As shown in FIG. 7, the step
或る時刻tと或るモデルパラメータ設定値θとが与えられたときに、ステップ応答Sθ(t)を計算する処理(第一の実施形態に係るステップ応答計算処理)について、図8を参照しながら説明する。なお、以下では、インデックスk'における状態ベクトルφ(k')を以下で表すものとする。 See FIG. 8 for the process of calculating the step response S θ (t) when a certain time t and a certain model parameter setting value θ are given (step response calculation process according to the first embodiment). I will explain while doing so. In addition, below, the state vector φ(k') at index k' shall be expressed as follows.
ステップS301:ステップ応答計算部102は、本処理の中でのみ利用する時刻を表すインデックスをτとして、τ=0、k'=0と初期化すると共に、状態ベクトルφ(0)を以下のように初期化する。
Step S301: The step
ステップS302:ステップ応答計算部102は、y(k')=φ(k')Τθにより制御量予測値y(k')を計算する。
Step S302: The step
ステップS303:ステップ応答計算部102は、制御量予測値y(k')を用いて、状態ベクトルφ(k')を、次のインデックスk'+1における状態ベクトルφ(k'+1)に更新する。このとき、ステップ応答計算部102は、図9に示すように、状態ベクトルφ(k'+1)のy(k')には上記のステップS302で計算した制御量予測値y(k')を設定し、y(k'-N+1)~y(k'-1)には状態ベクトルφ(k')と同じ値を設定する。また、状態ベクトルφ(k'+1)のu(k'+1)には1を設定し、u(k'-M+1)~u(k')には状態ベクトルφ(k')と同じ値を設定する。更に、状態ベクトルφ(k'+1)のv(k'+1)には0を設定し、v(k'-L+1)~v(k')には状態ベクトルφ(k')と同じ値を設定する。
Step S303: The step
ステップS304:ステップ応答計算部102は、時刻τをτ+Δに更新すると共に、インデックスk'をk'+1に更新する。
Step S304: The step
ステップS305:ステップ応答計算部102は、τ≧tであるか否かを判定する。そして、τ≧tであると判定されなかった場合(ステップS305でNO)、ステップ応答計算部102は、ステップS302に戻る。これにより、τ≧tとなるまで、ステップS302~ステップS304が繰り返し実行される。
Step S305: The step
一方で、τ≧tであると判定された場合(ステップS305でYES)、ステップ応答計算部102は、ステップ応答計算処理を終了する。これにより、最終的に計算された制御量予測値y(k')が単位ステップ応答Sθ(t)として得られる(つまり、Sθ(t)=y(k)が、プラント応答モデルの単位ステップ応答として得られる。)。
On the other hand, if it is determined that τ≧t (YES in step S305), the step
[第二の実施形態]
次に、第二の実施形態について説明する。第二の実施形態では、学習データ選別処理が第一の実施形態と異なる。なお、第二の実施形態で特に言及しない事項については、第一の実施形態と同様としてよい。
[Second embodiment]
Next, a second embodiment will be described. In the second embodiment, the learning data selection process is different from the first embodiment. Note that matters not specifically mentioned in the second embodiment may be the same as those in the first embodiment.
そこで、以下、或るkに関して学習データとして用いる運転データを選別する処理(第二の実施形態に係る学習データ選別処理)について、図10を参照しながら説明する。ただし、k=0である場合は更新フラグ=ONとして処理を終了する。 Hereinafter, a process for selecting driving data to be used as learning data for a certain k (learning data selecting process according to the second embodiment) will be described with reference to FIG. 10. However, if k=0, the update flag is set to ON and the process ends.
ステップS401:まず、学習データ選別部113は、図4のステップS101と同様に、状態ベクトルξ(k)と1時刻前の状態ベクトルξ(k-1)との差のノルムd(k)=||ξ(k)-ξ(k-1)||pをベクトル差ノルムとして計算する。
Step S401: First, similarly to step S101 in FIG. 4, the learning
ステップS402:次に、学習データ選別部113は、状態ベクトルξ(k)を用いて、閾値γ(k)を計算する。すなわち、学習データ選別部113は、以下により閾値γ(k)を計算する。
Step S402: Next, the learning
ここで、Eξ(k)は状態ベクトルξ(1),・・・,ξ(k)の平均値、Vξ(k)は状態ベクトルξ(1),・・・,ξ(k)の分散、γ(k)は状態ベクトルξ(1),・・・,ξ(k)の標準偏差のα倍を表す。また、αは調整係数であり、予め設定された値である。
Here, E ξ (k) is the average value of state vectors ξ (1), ..., ξ (k), and V ξ (k) is the average value of state vectors ξ (1), ..., ξ (k). The variance γ(k) represents α times the standard deviation of the state vector ξ(1), . . . , ξ(k). Further, α is an adjustment coefficient and is a preset value.
ステップS403:次に、学習データ選別部113は、ベクトル差ノルムd(k)が閾値γ(k)以上であるか否かを判定する。
Step S403: Next, the learning
d(k)≧γ(k)であると判定した場合(ステップS403でYES)、学習データ選別部113は、ステップS404に進む。一方で、d(k)≧γ(k)であると判定しなかった場合(ステップS403でNO)、学習データ選別部113は、ステップS405に進む。
If it is determined that d(k)≧γ(k) (YES in step S403), the learning
ステップS404:学習データ選別部113は、図4のステップS103と同様に、更新フラグをONにする。
Step S404: The learning
ステップS405:学習データ選別部113は、図4のステップS104と同様に、更新フラグをOFFにする。
Step S405: The learning
[第三の実施形態]
次に、第三の実施形態について説明する。第三の実施形態では、学習データ選別処理が第一の実施形態と異なる。また、閾値γ(k)の計算方法が第二の実施形態と異なる。なお、第三の実施形態で特に言及しない事項については、第一の実施形態と同様としてよい。
[Third embodiment]
Next, a third embodiment will be described. In the third embodiment, the learning data selection process is different from the first embodiment. Furthermore, the method of calculating the threshold value γ(k) is different from the second embodiment. Note that matters not specifically mentioned in the third embodiment may be the same as those in the first embodiment.
そこで、以下、或るkに関して学習データとして用いる運転データを選別する処理(第三の実施形態に係る学習データ選別処理)について、図11を参照しながら説明する。ただし、k=0である場合は更新フラグ=ONとして処理を終了する。 Hereinafter, a process for selecting driving data to be used as learning data for a certain k (learning data selecting process according to the third embodiment) will be described with reference to FIG. 11. However, if k=0, the update flag is set to ON and the process ends.
ステップS501:まず、学習データ選別部113は、k=1であるか否かを判定する。
Step S501: First, the learning
k=1であると判定した場合(ステップS501でYES)、学習データ選別部113は、ステップS502に進む。一方で、k=1であると判定しなかった場合(ステップS501でNO)、学習データ選別部113は、ステップS503に進む。
If it is determined that k=1 (YES in step S501), the learning
ステップS502:学習データ選別部113は、Eξ(0)=0、Sξ(0)=0と初期化する。ここで、Eξ(0)は状態ベクトルのノルムの平均値の初期値、Sξ(0)は状態ベクトルのノルムの2乗の平均値の初期値である。
Step S502: The learning
ステップS503:学習データ選別部113は、図4のステップS101と同様に、状態ベクトルξ(k)と状態ベクトルξ(k-1)との差のノルムd(k)=||ξ(k)-ξ(k-1)||pをベクトル差ノルムとして計算する。
Step S503: Similarly to step S101 in FIG. 4, the learning
ステップS504:次に、学習データ選別部113は、状態ベクトルξ(k)を用いて、閾値γ(k)を計算する。すなわち、学習データ選別部113は、以下により閾値γ(k)を計算する。
Step S504: Next, the learning
ステップS505:次に、学習データ選別部113は、ベクトル差ノルムd(k)が閾値γ(k)以上であるか否かを判定する。
Step S505: Next, the learning
d(k)≧γ(k)であると判定した場合(ステップS505でYES)、学習データ選別部113は、ステップS506に進む。一方で、d(k)≧γ(k)であると判定しなかった場合(ステップS505でNO)、学習データ選別部113は、ステップS507に進む。
If it is determined that d(k)≧γ(k) (YES in step S505), the learning
ステップS506:学習データ選別部113は、図4のステップS103と同様に、更新フラグをONにする。
Step S506: The learning
ステップS507:学習データ選別部113は、図4のステップS104と同様に、更新フラグをOFFにする。
Step S507: The learning
[第四の実施形態]
次に、第四の実施形態について説明する。第四の実施形態では、学習データ選別処理が第一の実施形態~第三の実施形態と異なる。なお、第四の実施形態で特に言及しない事項については、第一の実施形態と同様としてよい。
[Fourth embodiment]
Next, a fourth embodiment will be described. In the fourth embodiment, the learning data selection process is different from the first to third embodiments. Note that matters not specifically mentioned in the fourth embodiment may be the same as those in the first embodiment.
そこで、以下、或るkに関して学習データとして用いる運転データを選別する処理(第四の実施形態に係る学習データ選別処理)について、図12を参照しながら説明する。ただし、k=0である場合は更新フラグ=ONとして処理を終了する。 Hereinafter, a process for selecting driving data to be used as learning data for a certain k (learning data selecting process according to the fourth embodiment) will be described with reference to FIG. 12. However, if k=0, the update flag is set to ON and the process ends.
ステップS601:まず、学習データ選別部113は、k=1であるか否かを判定する。
Step S601: First, the learning
k=1であると判定した場合(ステップS601でYES)、学習データ選別部113は、ステップS602に進む。一方で、k=1であると判定しなかった場合(ステップS601でNO)、学習データ選別部113は、ステップS603に進む。
If it is determined that k=1 (YES in step S601), the learning
ステップS602:学習データ選別部113は、Ey(0)=0、Sy(0)=0と初期化する。ここで、Ey(0)は制御量の平均値の初期値、Sy(0)は制御量の2乗の平均値の初期値である。
Step S602: The learning
ステップS603:学習データ選別部113は、状態ベクトルξ(k)を用いて、予測誤差(の絶対値)d(k)を計算する。予測誤差d(k)は、図5のステップS204と同様に、d(k)=|y(k)-ξ(k)Τθe(k-1)|により計算される。
Step S603: The learning
ステップS604:次に、学習データ選別部113は、制御量y(k)を用いて、閾値γ(k)を計算する。すなわち、学習データ選別部113は、以下により閾値γ(k)を計算する。
Step S604: Next, the learning
ステップS605:次に、学習データ選別部113は、予測誤差d(k)が閾値γ(k)以上であるか否かを判定する。
Step S605: Next, the learning
d(k)≧γ(k)であると判定した場合(ステップS605でYES)、学習データ選別部113は、ステップS606に進む。一方で、d(k)≧γ(k)であると判定しなかった場合(ステップS605でNO)、学習データ選別部113は、ステップS607に進む。
If it is determined that d(k)≧γ(k) (YES in step S605), the learning
ステップS606:学習データ選別部113は、図4のステップS103と同様に、更新フラグをONにする。
Step S606: The learning
ステップS607:学習データ選別部113は、図4のステップS104と同様に、更新フラグをOFFにする。
Step S607: The learning
[実施例]
以下、第一の実施形態に係るプラント応答推定装置10の実施例について説明する。
[Example]
Hereinafter, an example of the plant
本実施例では、制御対象のプラントの拡大プラント応答モデルは次式で表されるものとする。 In this embodiment, it is assumed that the expanded plant response model of the plant to be controlled is expressed by the following equation.
y(k)=a1y(k-1)+a2y(k-2)+b0u(k)+b1u(k-1)+b2u(k-2)+c0
すなわち、制御量yに関しては2次元、操作量uに関しては3次元の要素を有するものとする。なお、本実施例では外乱vがないものとする。
y(k)=a 1 y(k-1)+a 2 y(k-2)+b 0 u(k)+b 1 u(k-1)+b 2 u(k-2)+c 0
That is, it is assumed that the control amount y has a two-dimensional element, and the manipulated variable u has a three-dimensional element. In this example, it is assumed that there is no disturbance v.
このとき、状態ベクトルξ(k)及び拡大モデルパラメータθe(k)は以下で表される。 At this time, the state vector ξ(k) and the expanded model parameter θ e (k) are expressed as follows.
更に、本実施例では、学習データ選別部113がベクトル差ノルムd(k)を計算するときのノルムとしてはL1ノルムを用いると共に閾値はγ=0.1とした。また、本実施例における制御対象プラントのステップ応答としては、図13に示すステップ応答を想定する。
Furthermore, in this embodiment, the learning
以上の設定の下で、学習データ選別部113を用いない場合と学習データ選別部113を用いた場合とを比較した。
Under the above settings, a case where the learning
図14は、学習データ選別部113を用いない場合で調整係数をλ=0.999としたときのモデルパラメータ推定結果及び制御結果である。また、図15は、学習データ選別部113を用いない場合で調整係数をλ=1.1としたときのモデルパラメータ推定結果及び制御結果である。
FIG. 14 shows model parameter estimation results and control results when the learning
図14及び図15はいずれも時刻0から1000までは制御量yと操作量uが一定であるため、モデルパラメータも時刻0付近で初期値から変動した後、時刻1000まで一定となっている。
In both FIGS. 14 and 15, the controlled variable y and the manipulated variable u are constant from
時刻1000以降に関しては、図14では、モデルパラメータは変化し、時刻4000付近まで変化がみられる。一方で、図15では、モデルパラメータは変化していない。これは、調整係数λが大きい場合、共分散行列の更新が早まり、ゼロ付近になるためである。
As for after
制御応答に関しては、図14では、モデルパラメータが変化したことにより、制御量が目標値に追従できている。一方で、図15では、モデルパラメータが初期に推定した値から変化していないため、モデルが正しく推定されておらず、制御量が目標値に追従できずに応答が不安定になっている。 Regarding the control response, in FIG. 14, the control amount is able to follow the target value due to the change in the model parameters. On the other hand, in FIG. 15, the model parameters have not changed from the initially estimated values, so the model is not estimated correctly, the control amount cannot follow the target value, and the response is unstable.
図16は、学習データ選別部113を用いた場合で調整係数をλ=0.999としたときのモデルパラメータ推定結果及び制御結果である。また、図17は、学習データ選別部113を用いた場合で調整係数をλ=1.1としたときのモデルパラメータ推定結果及び制御結果である。
FIG. 16 shows model parameter estimation results and control results when the learning
図16及び図17はいずれも時刻0から1000までは制御量yと操作量uが一定であるため、モデルパラメータも時刻0付近で初期値から変動した後、時刻1000まで一定となっている。
In both FIGS. 16 and 17, the controlled variable y and the manipulated variable u are constant from
時刻1000以降に関しては、図16では、モデルパラメータは変化し、時刻1500付近で収束している。一方で、図17では、図15と異なり、モデルパラメータは変化し、時刻1200付近で収束している。これは、学習データ選別部113の働きによって時刻0~1000までの定常状態の運転データが更新に用いられないため共分散行列が定常状態でもゼロに収束せず、また時刻1000付近で制御量yと操作量uが変化した運転データは更新に用いられるためパラメータ更新が加速され真値に近くなり、収束が早まったためである。
As for after
制御応答に関しては、図16及び図17のいずれもモデルパラメータが比較的正しく推定されているため、制御量が目標値に追従できている。 Regarding the control response, since the model parameters in both FIGS. 16 and 17 are estimated relatively correctly, the control amount is able to follow the target value.
よって、調整係数λを1より大きくしてモデルパラメータの収束を早めた際に、学習データ選別部113の働きにより、定常状態における運転データでパラメータが収束してしまう事態を回避できているといえる。
Therefore, when the adjustment coefficient λ is made larger than 1 to speed up the convergence of the model parameters, it can be said that the operation of the learning
以上のように、学習データ選別部113により、例えば、定常状態が継続するだけ等といった運転データに十分な情報が含まれない場合にはパラメータ更新が停止され、制御量yや操作量uが変化する場合にはパラメータ更新が行われる。これにより、例えば、定常状態で真値とは遠い局所的な値にパラメータが不用意に収束してしまう事態を回避しつつ、学習データを選別しない場合よりも真値に近い値に素早く収束する、という利点が生じている。
As described above, the learning
なお、上記の各実施形態では、主に、プラント応答モデルのパラメータを推定する場合について説明したが、これに限られず、例えば、上記の各実施形態に係るプラント応答推定装置10は、当該パラメータを設定したプラント応答モデルにより制御対象プラントを実際に制御する制御装置として機能してもよい。このとき、上記の各実施形態に係るプラント応答推定装置10は、モデル予測制御等といった既知の制御手法を用いて、当該パラメータを設定したプラント応答モデルにより制御対象プラントを制御すればよい。このように、上記の各実施形態に係るプラント応答推定装置10は、例えば、モデル予測制御等といった既知の制御手法と組み合わせることにより、制御の追従性と応答の安定化にも寄与することができる。
In each of the above embodiments, the case where the parameters of the plant response model are estimated has been mainly described, but the present invention is not limited to this. For example, the plant
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。 The present invention is not limited to the above-described specifically disclosed embodiments, and various modifications and changes, combinations with known techniques, etc. can be made without departing from the scope of the claims. be.
10 プラント応答推定装置
11 入力装置
12 表示装置
13 外部I/F
13a 記録媒体
14 通信I/F
15 プロセッサ
16 メモリ装置
17 バス
101 モデルパラメータ推定部
102 ステップ応答計算部
111 バッファ部
112 状態ベクトル変換部
113 学習データ選別部
114 逐次推定計算部
115 パラメータ変換部
10 Plant
13a Recording medium 14 Communication I/F
15
Claims (6)
前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別部と、
前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新部と、
を有し、
前記学習データ選別部は、
前記状態ベクトルの現在値と前回値との差のノルムを計算し、
前記状態ベクトル作成部によって現在までに作成されたすべての前記状態ベクトルの標準偏差と、0より大きい値を取る所定の係数との積を閾値として計算し、
前記ノルムが前記閾値以上である場合、前記運転データが定常状態、上限値及び下限値のいずれでもないことにより、前記状態ベクトルを学習データとすると判定し、
前記ノルムが前記閾値未満である場合、前記運転データが定常状態、上限値又は下限値のいずれかであることにより、前記状態ベクトルを学習データとしないと判定し、
前記パラメータ更新部は、
前記学習データとすると判定された前記状態ベクトルを用いて、逐次最小2乗法により共分散行列と前記パラメータの推定値とを、前記学習データとすると判定される毎に逐次的に更新し、
前記状態ベクトル作成部による前記状態ベクトルの作成と、前記学習データ選別部による前記閾値の計算及び前記学習データとするか否かの判定と、前記パラメータ更新部による前記パラメータの更新とは、前記運転データのサンプリング周期毎に逐次的に実行される、プラント応答推定装置。 a state vector creation unit that creates a state vector representing the state of the controlled plant based on operation data of the controlled plant;
a learning data selection unit that uses the state vector to determine whether or not the state vector is to be used as learning data;
a parameter updating unit that uses the state vector as learning data to update parameters of a function representing a response model of the controlled plant when it is determined that the state vector is to be used as learning data;
has
The learning data selection unit is
Calculate the norm of the difference between the current value and the previous value of the state vector,
Calculating the product of the standard deviation of all the state vectors created so far by the state vector creation unit and a predetermined coefficient having a value greater than 0 as a threshold;
If the norm is greater than or equal to the threshold, the operating data is neither a steady state nor an upper limit value nor a lower limit value, and the state vector is determined to be learning data;
If the norm is less than the threshold, it is determined that the state vector is not to be used as learning data because the driving data is in a steady state, an upper limit value, or a lower limit value;
The parameter update unit includes:
Using the state vector determined to be the learning data, sequentially update the covariance matrix and the estimated value of the parameter by an iterative least squares method each time it is determined to be the learning data,
Creation of the state vector by the state vector creation unit, calculation of the threshold by the learning data selection unit and determination of whether or not to use the learning data, and updating of the parameters by the parameter update unit are based on the operation. A plant response estimation device that is executed sequentially at each data sampling period .
前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別部と、
前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新部と、
を有し、
前記学習データ選別部は、
前記状態ベクトルの現在値と前記パラメータとを用いて、前記制御対象プラントの制御量の推定値を計算し、
前記制御量の推定値と前記制御量の現在値との誤差を表す予測誤差を計算し、
前記状態ベクトル作成部によって現在までに作成されたすべての前記状態ベクトルの標準偏差と0より大きい値を取る所定の係数との積、又は、現在までのすべての前記制御量の標準偏差と0より大きい値を取る所定の係数との積を、閾値として計算し、
前記予測誤差が前記閾値以上である場合、前記運転データが定常状態、上限値及び下限値のいずれでもないことにより、前記状態ベクトルを学習データとすると判定し、
前記予測誤差が前記閾値未満である場合、前記運転データが定常状態、上限値又は下限値のいずれかであることにより、前記状態ベクトルを学習データとしないと判定し、
前記パラメータ更新部は、
前記学習データとすると判定された前記状態ベクトルを用いて、逐次最小2乗法により共分散行列と前記パラメータの推定値とを、前記学習データとすると判定される毎に逐次的に更新し、
前記状態ベクトル作成部による前記状態ベクトルの作成と、前記学習データ選別部による前記閾値の計算及び前記学習データとするか否かの判定と、前記パラメータ更新部による前記パラメータの更新とは、前記運転データのサンプリング周期毎に逐次的に実行される、プラント応答推定装置。 a state vector creation unit that creates a state vector representing the state of the controlled plant based on operation data of the controlled plant;
a learning data selection unit that uses the state vector to determine whether or not the state vector is to be used as learning data;
a parameter updating unit that uses the state vector as learning data to update parameters of a function representing a response model of the controlled plant when it is determined that the state vector is to be used as learning data;
has
The learning data selection unit is
Using the current value of the state vector and the parameter, calculate an estimated value of the controlled variable of the controlled plant,
calculating a prediction error representing an error between the estimated value of the controlled variable and the current value of the controlled variable;
The product of the standard deviation of all the state vectors created up to now by the state vector creation unit and a predetermined coefficient that takes a value greater than 0 , or the product of the standard deviation of all the control variables up to now and more than 0. Calculate the product with a predetermined coefficient that takes a large value as a threshold ,
If the prediction error is greater than or equal to the threshold, determining that the state vector is to be learning data because the driving data is neither a steady state nor an upper limit value nor a lower limit value ;
If the prediction error is less than the threshold, it is determined that the state vector is not to be used as learning data because the driving data is in a steady state, an upper limit value, or a lower limit value;
The parameter update unit includes:
Using the state vector determined to be the learning data, sequentially update the covariance matrix and the estimated value of the parameter by an iterative least squares method each time it is determined to be the learning data,
Creation of the state vector by the state vector creation unit, calculation of the threshold by the learning data selection unit and determination of whether or not to use the learning data, and updating of the parameters by the parameter update unit are based on the operation. A plant response estimation device that is executed sequentially at each data sampling period .
前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別手順と、
前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新手順と、
をコンピュータが実行し、
前記学習データ選別手順は、
前記状態ベクトルの現在値と前回値との差のノルムを計算し、
前記状態ベクトル作成手順によって現在までに作成されたすべての前記状態ベクトルの標準偏差と、0より大きい値を取る所定の係数との積を閾値として計算し、
前記ノルムが前記閾値以上である場合、前記運転データが定常状態、上限値及び下限値のいずれでもないことにより、前記状態ベクトルを学習データとすると判定し、
前記ノルムが前記閾値未満である場合、前記運転データが定常状態、上限値又は下限値のいずれかであることにより、前記状態ベクトルを学習データとしないと判定し、
前記パラメータ更新手順は、
前記学習データとすると判定された前記状態ベクトルを用いて、逐次最小2乗法により共分散行列と前記パラメータの推定値とを、前記学習データとすると判定される毎に逐次的に更新し、
前記状態ベクトル作成手順による前記状態ベクトルの作成と、前記学習データ選別手順による前記閾値の計算及び前記学習データとするか否かの判定と、前記パラメータ更新手順による前記パラメータの更新とは、前記運転データのサンプリング周期毎に逐次的に実行される、プラント応答推定方法。 a state vector creation procedure for creating a state vector representing the state of the controlled plant based on operational data of the controlled plant;
a learning data selection procedure that uses the state vector to determine whether or not the state vector is to be used as learning data;
If it is determined that the state vector is to be used as learning data, a parameter updating procedure of updating parameters of a function representing a response model of the controlled plant using the state vector as learning data;
The computer executes
The learning data selection procedure is as follows :
Calculate the norm of the difference between the current value and the previous value of the state vector,
Calculating the product of the standard deviation of all the state vectors created so far by the state vector creation procedure and a predetermined coefficient having a value greater than 0 as a threshold;
If the norm is greater than or equal to the threshold, the operating data is neither a steady state nor an upper limit value nor a lower limit value, and the state vector is determined to be learning data;
If the norm is less than the threshold, it is determined that the state vector is not to be used as learning data because the driving data is in a steady state, an upper limit value, or a lower limit value;
The parameter update procedure is as follows:
Using the state vector determined to be the learning data, sequentially update the covariance matrix and the estimated value of the parameter by an iterative least squares method each time it is determined to be the learning data,
Creation of the state vector by the state vector creation procedure, calculation of the threshold value and determination of whether or not to use the learning data by the learning data selection procedure, and updating of the parameters by the parameter update procedure are the same as those for the operation. A plant response estimation method that is executed sequentially at each data sampling period .
前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別手順と、
前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新手順と、
をコンピュータが実行し、
前記学習データ選別手順は、
前記状態ベクトルの現在値と前記パラメータとを用いて、前記制御対象プラントの制御量の推定値を計算し、
前記制御量の推定値と前記制御量の現在値との誤差を表す予測誤差を計算し、
前記状態ベクトル作成手順によって現在までに作成されたすべての前記状態ベクトルの標準偏差と0より大きい値を取る所定の係数との積、又は、現在までのすべての前記制御量の標準偏差と0より大きい値を取る所定の係数との積を、閾値として計算し、
前記予測誤差が前記閾値以上である場合、前記運転データが定常状態、上限値及び下限値のいずれでもないことにより、前記状態ベクトルを学習データとすると判定し、
前記予測誤差が前記閾値未満である場合、前記運転データが定常状態、上限値又は下限値のいずれかであることにより、前記状態ベクトルを学習データとしないと判定し、
前記パラメータ更新手順は、
前記学習データとすると判定された前記状態ベクトルを用いて、逐次最小2乗法により共分散行列と前記パラメータの推定値とを、前記学習データとすると判定される毎に逐次的に更新し、
前記状態ベクトル作成手順による前記状態ベクトルの作成と、前記学習データ選別手順による前記閾値の計算及び前記学習データとするか否かの判定と、前記パラメータ更新手順による前記パラメータの更新とは、前記運転データのサンプリング周期毎に逐次的に実行される、プラント応答推定方法。 a state vector creation procedure for creating a state vector representing the state of the controlled plant based on operational data of the controlled plant;
a learning data selection procedure that uses the state vector to determine whether or not the state vector is to be used as learning data;
If it is determined that the state vector is to be used as learning data, a parameter updating procedure of updating parameters of a function representing a response model of the controlled plant using the state vector as learning data;
The computer executes
The learning data selection procedure is as follows :
Using the current value of the state vector and the parameter, calculate an estimated value of the controlled variable of the controlled plant,
calculating a prediction error representing an error between the estimated value of the controlled variable and the current value of the controlled variable;
The product of the standard deviation of all the state vectors created up to now by the state vector creation procedure and a predetermined coefficient that takes a value greater than 0 , or the product of the standard deviation of all the control variables up to now and more than 0. Calculate the product with a predetermined coefficient that takes a large value as a threshold ,
If the prediction error is greater than or equal to the threshold, determining that the state vector is to be learning data because the driving data is neither a steady state nor an upper limit value nor a lower limit value ;
If the prediction error is less than the threshold, it is determined that the state vector is not to be used as learning data because the driving data is in a steady state, an upper limit value, or a lower limit value;
The parameter update procedure is as follows:
Using the state vector determined to be the learning data, sequentially update the covariance matrix and the estimated value of the parameter by an iterative least squares method each time it is determined to be the learning data,
Creation of the state vector by the state vector creation procedure, calculation of the threshold value and determination of whether or not to use the learning data by the learning data selection procedure, and updating of the parameters by the parameter update procedure are the same as those for the operation. A plant response estimation method that is executed sequentially at each data sampling period .
前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別手順と、
前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新手順と、
をコンピュータに実行させ、
前記学習データ選別手順は、
前記状態ベクトルの現在値と前回値との差のノルムを計算し、
前記状態ベクトル作成手順によって現在までに作成されたすべての前記状態ベクトルの標準偏差と、0より大きい値を取る所定の係数との積を閾値として計算し、
前記ノルムが前記閾値以上である場合、前記運転データが定常状態、上限値及び下限値のいずれでもないことにより、前記状態ベクトルを学習データとすると判定し、
前記ノルムが前記閾値未満である場合、前記運転データが定常状態、上限値又は下限値のいずれかであることにより、前記状態ベクトルを学習データとしないと判定し、
前記パラメータ更新手順は、
前記学習データとすると判定された前記状態ベクトルを用いて、逐次最小2乗法により共分散行列と前記パラメータの推定値とを、前記学習データとすると判定される毎に逐次的に更新し、
前記状態ベクトル作成手順による前記状態ベクトルの作成と、前記学習データ選別手順による前記閾値の計算及び前記学習データとするか否かの判定と、前記パラメータ更新手順による前記パラメータの更新とは、前記運転データのサンプリング周期毎に逐次的に実行される、プログラム。 a state vector creation procedure for creating a state vector representing the state of the controlled plant based on operational data of the controlled plant;
a learning data selection procedure that uses the state vector to determine whether or not the state vector is to be used as learning data;
If it is determined that the state vector is to be used as learning data, a parameter updating procedure of updating parameters of a function representing a response model of the controlled plant using the state vector as learning data;
make the computer run
The learning data selection procedure is as follows :
Calculate the norm of the difference between the current value and the previous value of the state vector,
Calculating the product of the standard deviation of all the state vectors created so far by the state vector creation procedure and a predetermined coefficient having a value greater than 0 as a threshold;
If the norm is greater than or equal to the threshold, the operating data is neither a steady state nor an upper limit value nor a lower limit value, and the state vector is determined to be learning data;
If the norm is less than the threshold, it is determined that the state vector is not to be used as learning data because the driving data is in a steady state, an upper limit value, or a lower limit value;
The parameter update procedure is as follows:
Using the state vector determined to be the learning data, sequentially update the covariance matrix and the estimated value of the parameter by an iterative least squares method each time it is determined to be the learning data,
Creation of the state vector by the state vector creation procedure, calculation of the threshold value and determination of whether or not to use the learning data by the learning data selection procedure, and updating of the parameters by the parameter update procedure are the same as those for the operation. A program that is executed sequentially at each data sampling period .
前記状態ベクトルを用いて、前記状態ベクトルを学習データとするか否かを判定する学習データ選別手順と、
前記状態ベクトルを学習データとすると判定された場合、前記状態ベクトルを学習データとして用いて、前記制御対象プラントの応答モデルを表す関数のパラメータを更新するパラメータ更新手順と、
をコンピュータに実行させ、
前記学習データ選別手順は、
前記状態ベクトルの現在値と前記パラメータとを用いて、前記制御対象プラントの制御量の推定値を計算し、
前記制御量の推定値と前記制御量の現在値との誤差を表す予測誤差を計算し、
前記状態ベクトル作成手順によって現在までに作成されたすべての前記状態ベクトルの標準偏差と0より大きい値を取る所定の係数との積、又は、現在までのすべての前記制御量の標準偏差と0より大きい値を取る所定の係数との積を、閾値として計算し、
前記予測誤差が前記閾値以上である場合、前記運転データが定常状態、上限値及び下限値のいずれでもないことにより、前記状態ベクトルを学習データとすると判定し、
前記予測誤差が前記閾値未満である場合、前記運転データが定常状態、上限値又は下限値のいずれかであることにより、前記状態ベクトルを学習データとしないと判定し、
前記パラメータ更新手順は、
前記学習データとすると判定された前記状態ベクトルを用いて、逐次最小2乗法により共分散行列と前記パラメータの推定値とを、前記学習データとすると判定される毎に逐次的に更新し、
前記状態ベクトル作成手順による前記状態ベクトルの作成と、前記学習データ選別手順による前記閾値の計算及び前記学習データとするか否かの判定と、前記パラメータ更新手順による前記パラメータの更新とは、前記運転データのサンプリング周期毎に逐次的に実行される、プログラム。 a state vector creation procedure for creating a state vector representing the state of the controlled plant based on operational data of the controlled plant;
a learning data selection procedure that uses the state vector to determine whether or not the state vector is to be used as learning data;
If it is determined that the state vector is to be used as learning data, a parameter updating procedure of updating parameters of a function representing a response model of the controlled plant using the state vector as learning data;
make the computer run
The learning data selection procedure is as follows :
Using the current value of the state vector and the parameter, calculate an estimated value of the controlled variable of the controlled plant,
calculating a prediction error representing an error between the estimated value of the controlled variable and the current value of the controlled variable;
The product of the standard deviation of all the state vectors created up to now by the state vector creation procedure and a predetermined coefficient that takes a value greater than 0 , or the product of the standard deviation of all the control variables up to now and more than 0. Calculate the product with a predetermined coefficient that takes a large value as a threshold ,
If the prediction error is greater than or equal to the threshold, determining that the state vector is to be learning data because the driving data is neither a steady state nor an upper limit value nor a lower limit value ;
If the prediction error is less than the threshold, it is determined that the state vector is not to be used as learning data because the driving data is in a steady state, an upper limit value, or a lower limit value;
The parameter update procedure is as follows:
Using the state vector determined to be the learning data, sequentially update the covariance matrix and the estimated value of the parameter by an iterative least squares method each time it is determined to be the learning data,
Creation of the state vector by the state vector creation procedure, calculation of the threshold value and determination of whether or not to use the learning data by the learning data selection procedure, and updating of the parameters by the parameter update procedure are the same as those for the operation. A program that is executed sequentially at each data sampling period .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023071309A JP7428288B1 (en) | 2023-04-25 | 2023-04-25 | Plant response estimation device, plant response estimation method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023071309A JP7428288B1 (en) | 2023-04-25 | 2023-04-25 | Plant response estimation device, plant response estimation method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7428288B1 true JP7428288B1 (en) | 2024-02-06 |
JP2024157147A JP2024157147A (en) | 2024-11-07 |
Family
ID=89771140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023071309A Active JP7428288B1 (en) | 2023-04-25 | 2023-04-25 | Plant response estimation device, plant response estimation method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7428288B1 (en) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010519636A (en) | 2007-02-27 | 2010-06-03 | エクソンモービル リサーチ アンド エンジニアリング カンパニー | Method and system for using inference measurements for abnormal event detection in continuous industrial processes |
WO2018159169A1 (en) | 2017-03-03 | 2018-09-07 | パナソニックIpマネジメント株式会社 | Additional learning method for deterioration diagnosis system |
JP2019028565A (en) | 2017-07-26 | 2019-02-21 | 安川情報システム株式会社 | Failure prediction method, failure prediction apparatus and failure prediction program |
JP7115654B1 (en) | 2022-02-04 | 2022-08-09 | 富士電機株式会社 | Control device, control method and program |
JP2022133615A (en) | 2021-03-02 | 2022-09-14 | ファナック株式会社 | Machine learning device, error occurrence prediction device, and control device |
WO2022210866A1 (en) | 2021-03-31 | 2022-10-06 | 三菱重工業株式会社 | Device, remote monitoring system, method for controlling device, and method for controlling remote monitoring system |
US11536483B1 (en) | 2020-10-28 | 2022-12-27 | Trane International Inc. | Model-based control of zone dampers in an HVAC system |
JP7231102B1 (en) | 2022-09-21 | 2023-03-01 | 富士電機株式会社 | PLANT RESPONSE ESTIMATION DEVICE, PLANT RESPONSE ESTIMATION METHOD, AND PROGRAM |
JP2023053573A (en) | 2021-10-01 | 2023-04-13 | 富士電機株式会社 | Plant response estimation device, plant response estimation method and program |
-
2023
- 2023-04-25 JP JP2023071309A patent/JP7428288B1/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010519636A (en) | 2007-02-27 | 2010-06-03 | エクソンモービル リサーチ アンド エンジニアリング カンパニー | Method and system for using inference measurements for abnormal event detection in continuous industrial processes |
WO2018159169A1 (en) | 2017-03-03 | 2018-09-07 | パナソニックIpマネジメント株式会社 | Additional learning method for deterioration diagnosis system |
JP2019028565A (en) | 2017-07-26 | 2019-02-21 | 安川情報システム株式会社 | Failure prediction method, failure prediction apparatus and failure prediction program |
US11536483B1 (en) | 2020-10-28 | 2022-12-27 | Trane International Inc. | Model-based control of zone dampers in an HVAC system |
JP2022133615A (en) | 2021-03-02 | 2022-09-14 | ファナック株式会社 | Machine learning device, error occurrence prediction device, and control device |
WO2022210866A1 (en) | 2021-03-31 | 2022-10-06 | 三菱重工業株式会社 | Device, remote monitoring system, method for controlling device, and method for controlling remote monitoring system |
JP2023053573A (en) | 2021-10-01 | 2023-04-13 | 富士電機株式会社 | Plant response estimation device, plant response estimation method and program |
JP7115654B1 (en) | 2022-02-04 | 2022-08-09 | 富士電機株式会社 | Control device, control method and program |
JP7231102B1 (en) | 2022-09-21 | 2023-03-01 | 富士電機株式会社 | PLANT RESPONSE ESTIMATION DEVICE, PLANT RESPONSE ESTIMATION METHOD, AND PROGRAM |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7044077B2 (en) | Model estimation system, method and program | |
JP6299759B2 (en) | Prediction function creation device, prediction function creation method, and program | |
JP5320985B2 (en) | Prediction system, prediction method, and prediction program | |
JPH052404A (en) | Optimizing device, device for minimizing cost and observation system/control system device | |
KR101234797B1 (en) | Robot and method for localization of the robot using calculated covariance | |
KR102038703B1 (en) | Method for estimation on online multivariate time series using ensemble dynamic transfer models and system thereof | |
JP7047966B1 (en) | Plant response estimator, plant response estimation method, and program | |
JP7231102B1 (en) | PLANT RESPONSE ESTIMATION DEVICE, PLANT RESPONSE ESTIMATION METHOD, AND PROGRAM | |
JP7428288B1 (en) | Plant response estimation device, plant response estimation method, and program | |
JP2024157147A (en) | PLANT RESPONSE ESTIMATION APPARATUS, PLANT RESPONSE ESTIMATION METHOD, AND PROGRAM | |
JP7036128B2 (en) | Controls, control methods and programs | |
US20230222385A1 (en) | Evaluation method, evaluation apparatus, and non-transitory computer-readable recording medium storing evaluation program | |
JP7115656B1 (en) | Control device, control method and program | |
JP2021012605A (en) | Transfer function prediction method | |
JP6984597B2 (en) | Linear parameter variation model estimation system, method and program | |
JP3987059B2 (en) | Optimal value search support device, optimal value search support method, and recording medium | |
JP2023005735A (en) | Mathematical model acquisition device, estimation device, mathematical model acquisition method, estimation method, and program | |
JP2022167093A (en) | Information processing device, information processing method, and program | |
JP7472998B2 (en) | Parameter estimation device, secret parameter estimation system, secure computing device, methods thereof, and programs | |
JP2017207987A (en) | Objective variable prediction device, method and program | |
JP7552947B1 (en) | CONTROL ASSISTANCE DEVICE, CONTROL ASSISTANCE METHOD, AND PROGRAM | |
JP7529028B2 (en) | Learning device, learning method, and learning program | |
JP7575008B2 (en) | Control method, control device, and program | |
JP7430127B2 (en) | Prediction device, prediction method, and program | |
Raath | Structural dynamic response reconstruction in the time domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230425 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7428288 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |