JP2019512757A - ニューラルネットワークアーキテクチャを用いた分配システムの制御のための方法、制御装置およびシステム - Google Patents
ニューラルネットワークアーキテクチャを用いた分配システムの制御のための方法、制御装置およびシステム Download PDFInfo
- Publication number
- JP2019512757A JP2019512757A JP2018534532A JP2018534532A JP2019512757A JP 2019512757 A JP2019512757 A JP 2019512757A JP 2018534532 A JP2018534532 A JP 2018534532A JP 2018534532 A JP2018534532 A JP 2018534532A JP 2019512757 A JP2019512757 A JP 2019512757A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- neural network
- state
- control
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000013528 artificial neural network Methods 0.000 title claims description 101
- 238000009826 distribution Methods 0.000 title abstract description 40
- 230000004044 response Effects 0.000 claims abstract description 41
- 230000003993 interaction Effects 0.000 claims abstract description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 87
- 230000006870 function Effects 0.000 claims description 83
- 230000009471 action Effects 0.000 claims description 72
- 230000006399 behavior Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 18
- 230000002787 reinforcement Effects 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 18
- 230000004931 aggregating effect Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims description 6
- 230000001537 neural effect Effects 0.000 abstract description 3
- 239000010410 layer Substances 0.000 description 66
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 30
- 230000006854 communication Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 19
- 210000002569 neuron Anatomy 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 14
- 230000001276 controlling effect Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 230000004913 activation Effects 0.000 description 9
- 230000003247 decreasing effect Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 230000002776 aggregation Effects 0.000 description 8
- 238000004220 aggregation Methods 0.000 description 8
- 230000005611 electricity Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 238000005338 heat storage Methods 0.000 description 7
- 238000010438 heat treatment Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000011176 pooling Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000007175 bidirectional communication Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 210000001747 pupil Anatomy 0.000 description 3
- 230000036962 time dependent Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000004883 computer application Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000002483 medication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 1
- WYTGDNHDOZPMIW-RCBQFDQVSA-N alstonine Natural products C1=CC2=C3C=CC=CC3=NC2=C2N1C[C@H]1[C@H](C)OC=C(C(=O)OC)[C@H]1C2 WYTGDNHDOZPMIW-RCBQFDQVSA-N 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000008236 heating water Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000000671 immersion lithography Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000001459 lithography Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Automation & Control Theory (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Feedback Control In General (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
Description
電気自動車、ヒートポンプ、またはHVACシステムなどのエネルギー制約付き柔軟性(ECF)ソースの需要柔軟性を制御することは、モデル予測制御[1]または完全にモデルなしの強化学習[2]に基づいて知られている。
本発明の目的は、例えば、熱または電力分配などのエネルギー分配システムのような生産物分配システムの制御のための方法、制御装置およびシステム、ならびに、処理エンジン上で実行されるときにそのような方法のいずれかを実行することができるソフトウェアを提供することである。特に、システムモデルに基づいてエネルギー分配システムのような生産物分配システムを制御することには、異なる各設備に対して適切なシステムモデルを開発しなければならないという問題がある。システムが変更された場合、モデルはその変更に適合する必要がある。本発明の目標は、システムモデルを開発する必要性を回避することである。
強化学習(RL)の形態の制御技法を使用して次の制御ステップ中に制約付きクラスタ要素に分配されるべき物理生産物の量を決定するステップであって、結果、制御技法が、制御されるべき需要応答システムとの相互作用から学習する、決定するステップを含み、
方法は、畳み込みニューラルネットワークに、需要応答システムの少なくとも1つのクラスタの履歴観測値、または、1つもしくは複数の2D(二次元)グリッド構造に集約された履歴観測値の派生物を入力する、特徴抽出ステップを含み、2Dグリッド構造の1つの次元は複数の時間ステップを表し、他方の次元は複数の時間ステップにおけるクラスタ状態を捕捉し、クラスタ状態は、各時間ステップについて少なくとも1つのクラスタ内のクラスタ要素のローカル状態を集約することによって表され、畳み込みニューラルネットワークは、2D畳み込みを実行し、ローカル時間と、2Dグリッド構造におけるクラスタ要素の集約されたローカル状態変化との組み合わせから、ローカル畳み込み特徴を抽出することを学習し、
方法は、
第1のニューラルネットワークに、少なくとも抽出されているローカル畳み込み特徴を入力するステップであって、第1のニューラルネットワークは、少なくとも1つのクラスタがある状態にあることと、ある行動をとることとの各組み合わせに関連する少なくとも1つのクラスタの値を提供する状態−行動価値関数の少なくとも近似値を出力する、入力するステップと、
制御行動を決定または計算するステップであって、制御行動は、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせであるか、または、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせから導出される、決定または計算するステップと、
制御行動に従って次の制御ステップ中にクラスタ要素によって消費または解放されるべき物理生産物の目標量を分配するステップとをさらに含む。第1のニューラルネットワークは、完全結合ニューラルネットワークとすることができる。
強化学習(RL)の形態の制御技法を使用して次の制御ステップ中に制約付きクラスタ要素に分配されるべき物理生産物の量を決定するための手段であって、結果、制御技法が、制御されるべき需要応答システムとの相互作用から学習する、決定するための手段と、
畳み込みニューラルネットワークに、需要応答システムの少なくとも1つのクラスタの履歴観測値、または、1つもしくは複数の2Dグリッド構造に集約された履歴観測値の派生物を入力するように適合されている、特徴を抽出するための手段であって、2Dグリッド構造の1つの次元は複数の時間ステップを表し、他方の次元は複数の時間ステップにおけるクラスタ状態を捕捉し、クラスタ状態は、各時間ステップについて少なくとも1つのクラスタ内のクラスタ要素のローカル状態を集約することによって表され、畳み込みニューラルネットワークは、2D畳み込みを実行するように適合されており、ローカル時間と、2Dグリッド構造におけるクラスタ要素の集約されたローカル状態変化との組み合わせから、ローカル畳み込み特徴を抽出することを学習し、
畳み込みニューラルネットワークは、
第1のニューラルネットワークに、抽出されているローカル畳み込み特徴を出力するように適合されており、
第1のニューラルネットワークは、少なくとも1つのクラスタがある状態にあることと、ある行動をとることとの各組み合わせに関連する少なくとも1つのクラスタの値を提供する状態−行動価値関数の少なくとも近似値を出力するように適合されている、特徴を抽出するための手段と、
ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせであるか、または、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせから導出される制御行動を決定または計算するための手段と、
制御行動に従って次の制御ステップ中にクラスタ要素によって消費または解放されるべき物理生産物の目標量を分配するための手段とを備える。
分配されるべき生産物は、熱エネルギーまたは電力であり得る。
畳み込みニューラルネットワークは好ましくは、最初に、2Dグリッド構造におけるパターンを捕捉するように適合されており、畳み込みニューラルネットワークならびに第1のニューラルネットワークおよび第2のニューラルネットワークは、集約されたクラスタ状態ならびに外因性データおよび制御行動から目標量へのマッピングを学習するように適合されている。
強化学習(RL)の形態の制御技法を使用して次の制御ステップ中に制約付きクラスタ要素に分配されるべき物理生産物の量を決定するための手段であって、結果、制御技法が、制御されるべき需要応答システムとの相互作用から学習する、決定するための手段と、
畳み込みニューラルネットワークに、需要応答システムの少なくとも1つのクラスタの履歴観測値、または、1つもしくは複数の2Dグリッド構造に集約された履歴観測値の派生物を入力するように適合されている、特徴を抽出するための手段であって、ステップを含み、2Dグリッド構造の1つの次元は複数の時間ステップを表し、他方の次元は前記複数の時間ステップにおけるクラスタ状態を捕捉し、クラスタ状態は、各時間ステップについて少なくとも1つのクラスタ内のクラスタ要素のローカル状態を集約することによって表され、畳み込みニューラルネットワークは、2D畳み込みを実行するように適合されており、ローカル時間と、2Dグリッド構造におけるクラスタ要素の集約されたローカル状態変化との組み合わせから、ローカル畳み込み特徴を抽出することを学習し、
畳み込みニューラルネットワークは、
1のニューラルネットワークに、抽出されているローカル畳み込み特徴を出力するように適合されており、
第1のニューラルネットワークは、少なくとも1つのクラスタがある状態にあることと、ある行動をとることとの各組み合わせに関連する少なくとも1つのクラスタの値を提供する状態−行動価値関数の少なくとも近似値を出力するように適合されている、特徴を抽出するための手段と、
ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせであるか、または、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせから導出される制御行動を決定または計算するための手段と、
制御行動に従って次の制御ステップ中にクラスタ要素によって消費または解放されるべき物理生産物の目標量を分配するための手段とを備える。
本発明の実施形態は、高次元性の状態記述を回避するという問題に対処する。集約されたレベルにおいて、集約された状態次元は減少することができるが、異種成分からなるクラスタについては、例えば10の時間ステップにおいて履歴情報を考慮しながら、依然として、典型的には10の状態次元(例えば10のエネルギー状態)を必要とする。これにより、状態次元は少なくとも100になり、これは、それらがMDP形式に基づいて構築される場合、典型的なRLアルゴリズムの範囲外である。単一のECFシステムであっても、同じ問題が生じる。履歴情報、例えば10の時間ステップを考慮に入れる10個の温度センサを備える温水貯蔵槽は同じ問題を抱えている。
畳み込み層、ReLU層、および完全結合層を使用することができ、結果、外因性データの入力に追加の小さな完全結合層が使用される。これらの層のスタックは、本発明の実施形態において使用される畳み込みニューラルネットワークアーキテクチャを形成する。入力は2Dグリッドデータを保持する。
履歴状態観測値は、1つの次元が固定された時間ステップにおけるシステムまたは装置状態を表し、第2の次元が経時的な変化に対応する2Dグリッド12として表される。すなわち、グリッドの列cは、時点cにおけるシステム状態のすべての観測値を与え、行rは、すべての時間ステップにおけるr番目の状態変数の値を与える。得られる2Dグリッドは、状態情報の履歴を値にマッピングする畳み込みニューラルネットワーク(CNN)14への入力として使用される。時間および状態の次元は同じ方法で扱われ、2D畳み込み演算は時間および空間にわたって適用される。これは、入力状態情報および履歴におけるローカル構造を識別する時空間特徴の識別をもたらす。これにより、複数の時間ステップにわたって発生するイベント(例えば、状態値の変化)を表す特徴を容易に学習することができる。これらの機能は、その後、上位のネットワーク層によって入力として使用できる。本発明の実施形態の特定の態様は、状態および時間の次元が同じように扱われ、ネットワークが状態および時間の次元にわたって畳み込み演算を適用することである。これは、ネットワークが、状態と時間にわたってローカル機能を識別することを学習することを意味する。
本発明で使用される「生産物」または「物理生産物」は、市場の要望または必要性を満足する品目の消費または送達を含むよう広く解釈されるべきである(https://en.wikipedia.org/wiki/Product)。このような生産物は、液体、気体もしくは固体の物質、ならびに光もしくは他の形態の放射、熱もしくは電気エネルギーなどのエネルギー、または電気通信ネットワークにおける通話などの信号のいずれかとすることができる。本文に記載された例は、電力または加熱力の供給を含む。他の例は次のとおりである。
本明細書で使用される場合、単数形「a」、「an」および「the」は、文脈がそうでないことを明確に示さない限り、複数形も含むことが意図される。本明細書において使用される場合、用語「備える(comprises)」および/または「備えている(comprising)」は、記載された特徴、整数、ステップ、動作、要素および/または構成要素の存在を指定するが、1つまたは複数の他の特徴、整数、ステップ、動作、要素、構成要素、および/またはそれらのグループの存在または追加を除外しないことがさらに理解されよう。
本発明の実施形態について、図1〜図8を参照して説明する。図16は、本発明の実施形態によるネットワークの概観を示す。
Q学習、SARSAおよび勾配TDアルゴリズムを含む価値関数のオンライン学習、
これらのうちのいくつかはシステムを制御しながら学習することができるが、学習は低速であり得る。
勾配降下を使用してパラメータ化されたポリシを最適化する。これは、(可能なポリシのセット内で)ローカル最適ポリシを学習する。例:ポリシ勾配、自然ポリシ勾配、PGPE(パラメータベースの探索を有するポリシ勾配)、REINFORCE。
PILCO:学習制御のための確率論的推論−ガウス過程を有するモデルを学習する。非常にサンプル効率的であるが、計算上非常に高価である。
ニューラルネットワークのシーケンスがともに訓練されること、例えば、畳み込みニューラルネットワークおよび完全結合ニューラルネットワークが一単位として訓練されることであり、ネットワークの目標出力はそれ自体、強化学習を使用して学習され、各ニューラルネットワークの目標は以前の反復で訓練された以前のネットワークの出力に依存する。
本発明のこの実施形態は、図1〜図8を参照して以下の詳細な例で説明される。意思決定問題は、例えば、マルコフ決定過程(MDP)として形式化される。高次元状態表現11は、好ましくは、2D集約状態分布12の単一の(図1の参照符号12を参照)または並列系列(図4の参照符号12a〜12d参照)の時間ステップ化された一連の集約状態分布[6]を含む入力として使用することができる。好ましくは需要応答アプリケーションのためにカスタマイズされた畳み込みニューラルネットワークアーキテクチャ20[10]は、FQIにおいて回帰アルゴリズムを実行するために使用される。
例えば、図2を参照すると、例えば電力などの送達すべき生産物と、例えば充電状態などの集約されるべき各観測クラスタ状態入力パラメータ値との間の関係9a〜9dが決定される。図2に示すように、これらの関係を集約、例えば合計して、クラスタ関係3を生成することができる。この関係では、クラスタ状態値がゼロに近いとき、すなわちSoCが非常に低いときに、送達されるべき生産物、例えば、消費されるべき電力は最大である。クラスタ状態値が最大値に近いとき、すなわちSoCが非常に高いとき、クラスタがそれ自体の蓄積された電荷から次の時間ステップにわたって要求を満たすことができるべきであるため、送達されるべき生産物、例えば、消費されるべき電力は最小である。ステップ6では、関係3が34として示されている。ステップ4で決定された最適化された値は、次の期間においてクラスタに送達されるべき電力32である。関係34から、この電力値32は、次の時間ステップの需要を満たすべきである場合、クラスタに対する所望のSoC値36として読み出される。関係9a〜9dは、関係39a〜39dとして引き継がれ、SoC36のクラスタ値は関係39a〜39dへの入力として使用されて、これらの装置のうちのいずれが、クラスタのSoCレベル36にするために充電され(すなわち、送達される生産物を受け取ら)なければならないかが分かる。例えば電力値38a〜38dなどのこれらの送達可能な生産物が、TCL7a〜7dに送達される。
深回帰アーキテクチャの具体例として、ビニングされたクラスタ状態xbは、最後の28個の時間ステップにわたるクラスタメンバのビニングを記述する28×28の2次元グリッドによって表される。この入力は、畳み込みニューラルネットワーク14の2つの2D畳み込み層を用いて処理される。畳み込みニューラルネットワーク14の第1の層は、4つの7×7フィルタからなり、一方、第2の層は、8つの5×5フィルタを使用する。畳み込みニューラルネットワーク14の畳み込み層の後には、特徴マップを32個の隠れノードにマッピングする、完全結合ニューラルネットワーク15の単一の完全結合層が続く。各層の後に、整流された線形(ReLU)活性化層が続いている。プーリング層は使用しなかった。xex,kおよび行動ukを含む外因性データ16が、完全結合ニューラルネットワーク17内の単位の単一の完全結合隠れ層を使用して処理される。畳み込みニューラルネットワーク14とフィードフォワードネットワーク17との結合された出力は、各々が完全結合ニューラルネットワーク15の24単位からなる2つの完全結合層を使用して処理される。すべての層がReLU活性化を使用した。最終的な隠れ表現は、図1および図4に示すように、完全結合線形出力層19を使用して単一の出力18にマッピングされる。ネットワークアーキテクチャ20は、rmspropアルゴリズムを使用して単位として訓練された。本発明によれば、ネットワークアーキテクチャ20全体が同時に訓練されることが好ましい。
そのような方法は、1つまたは複数のマイクロプロセッサ、FPGA、または中央処理装置(CPU)および/またはグラフィックス処理装置(GPU)によって提供されるような処理能力を有し、ソフトウェア、すなわち1つまたは複数のコンピュータプログラムによってプログラムされることによってそれぞれの機能を実行するように適合される制御装置(例えば、中央処理装置46、および/またはクラスタ制御装置49および/またはローカル制御装置47)によって実施することができる。ソフトウェアへの参照は、コンパイラ型または翻訳言語を介して、プロセッサによって直接的または間接的に実行可能な任意の言語の、任意の種類のプログラムを包含することができる。本発明の方法のいずれかの実施態様は、論理回路、電子ハードウェア、プロセッサまたは回路によって実施することができ、これらは、汎用プロセッサ、デジタル信号プロセッサ、ASIC、FPGA、ディスクリートコンポーネントまたはトランジスタ論理ゲートなどに限定されない、任意の度合いまで集積されている、任意の種類の論理またはアナログ回路を含むことができる。
制御行動に従って次の制御ステップ中にクラスタ要素によって消費または解放されるべき物理生産物の目標量を分配すること。
制御技法を、モデルなし制御技法として提供すること。
コンピュータプログラム製品に組み込まれたソフトウェアは、ソフトウェアがそれぞれの1つまたは複数の装置にロードされ、マイクロプロセッサ、ASIC、FPGAなどのような1つまたは複数の処理エンジン上で実行されるとき、以下の機能を実行するように適合される。
隠れ層を、好ましくは完全結合層として提供すること。
学習された特徴を、第1の完全結合ニューラルネットワークおよび随意選択的に第2の完全結合ニューラルネットワークの上位ネットワーク層に入力すること。
Claims (33)
- 需要応答システム内のクラスタにグループ化された制約付きクラスタ要素に分配されるべき物理生産物の需要を制御するコンピュータベースの方法であって、
強化学習(RL)の形態の制御技法を使用して次の制御ステップ中に前記制約付きクラスタ要素に分配されるべき前記物理生産物の量を決定するステップであって、結果、前記制御技法が、制御されるべき前記需要応答システムとの相互作用から学習する、決定するステップを含み、前記方法は、
畳み込みニューラルネットワークに、前記需要応答システムの少なくとも1つのクラスタの履歴観測値、または、1つもしくは複数の2D(二次元)グリッド構造に集約された履歴観測値の派生物を入力する、特徴抽出ステップを含み、2Dグリッド構造の1つの次元は複数の時間ステップを表し、他方の次元は前記複数の時間ステップにおけるクラスタ状態を捕捉し、前記クラスタ状態は、各時間ステップについて前記少なくとも1つのクラスタ内のクラスタ要素のローカル状態を集約することによって表され、前記畳み込みニューラルネットワークは、2D畳み込みを実行し、ローカル時間と、前記2Dグリッド構造における前記クラスタ要素の集約されたローカル状態変化との組み合わせから、ローカル畳み込み特徴を抽出することを学習し、
前記方法は、
第1のニューラルネットワークに、少なくとも抽出されているローカル畳み込み特徴を入力するステップであって、前記第1のニューラルネットワークは、前記少なくとも1つのクラスタがある状態にあることと、ある行動をとることとの各組み合わせに関連する前記少なくとも1つのクラスタの値を提供する状態−行動価値関数の少なくとも近似値を出力する、入力するステップと、
制御行動を決定または計算するステップであって、前記制御行動は、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせであるか、または、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせから導出される、決定または計算するステップと、
前記制御行動に従って次の制御ステップ中に前記クラスタ要素によって消費または解放されるべき前記物理生産物の目標量を分配するステップとをさらに含む、方法。 - 前記制御技法がモデルなしである、請求項1に記載の方法。
- 前記状態−行動価値関数がQ関数(Q(x,u))である、請求項1または2に記載の方法。
- 前記生産物が、熱エネルギーまたは電力またはエネルギーである、請求項1〜3のいずれか一項に記載の方法。
- 前記制御行動および外因性状態情報は、前記第1のニューラルネットワークへの入力として結合された第2のニューラルネットワークに入力される、請求項1〜4のいずれか一項に記載の方法。
- 外因性状態情報および前記制御行動を、前記畳み込みニューラルネットワークの前記抽出された畳み込みローカル特徴とマージするステップをさらに含む、請求項5に記載の方法。
- 外因性状態情報および前記制御行動を前記畳み込みニューラルネットワークの前記抽出された畳み込みローカル特徴とマージする前に、別個の特徴抽出が実行され、前記外因性状態情報および前記制御行動が最初に前記第2のニューラルネットワークに供給され、該第2のニューラルネットワークは、前記外因性状態情報および前記制御行動を、次の隠れ層において前記抽出された畳み込みローカル特徴と組み合わされる学習された内部表現にマッピングする、請求項6に記載の方法。
- ネットワーク不均衡値および/または前記外因性状態情報に含まれる、請求項5〜7のいずれか一項に記載の方法。
- 1つの時間ステムについて決定された前記制御行動が、次の時間ステップの前記外因性情報に含まれる、請求項5〜8のいずれか一項に記載の方法。
- レガシ装置をエミュレートするステップをさらに含む、請求項1〜9のいずれか一項に記載の方法。
- 前記畳み込みニューラルネットワークは、最初に、前記2Dグリッド構造におけるパターンを捕捉し、前記畳み込みニューラルネットワークならびに前記第1のニューラルネットワークおよび前記第2のニューラルネットワークは、前記集約されたクラスタ状態および外因性データならびに前記制御行動から前記目標量へのマッピングを学習する、請求項5〜10のいずれか一項に記載の方法。
- 前記2Dグリッド構造は、固定された時間ステップでのクラスタ状態のすべての観測値を表す1つの次元を有し、第2の次元は、すべての時間ステップにおけるクラスタ要素の複数の状態変数の各々の値の時間変化に対応し、前記2D特徴抽出動作は、時間および空間にわたって適用され、結果として前記状態情報および前記履歴においてローカル構造を識別する時空間特徴が識別される、請求項1〜11のいずれか一項に記載の方法。
- 複数の時間ステップにわたって生じる状態値の変化を表す特徴が学習される、請求項12に記載の方法。
- 前記学習された特徴は、少なくとも前記第1のニューラルネットワークのより上位のネットワーク層によって入力として使用される、請求項13に記載の方法。
- 前記畳み込みネットワークならびに前記第1のニューラルネットワークおよび前記第2のニューラルネットワークはともに訓練される、請求項5〜14のいずれか一項に記載の方法。
- 需要応答システム内のクラスタにグループ化された制約付きクラスタ要素に分配されるべき物理生産物の需要を制御するためのコンピュータベースのネットワークアーキテクチャであって、
強化学習(RL)の形態の制御技法を使用して次の制御ステップ中に前記制約付きクラスタ要素に分配されるべき物理生産物の量を決定するための手段であって、結果、前記制御技法が、制御されるべき前記需要応答システムとの相互作用から学習する、決定するための手段と、
特徴を抽出するための手段であって、
前記需要応答システムの少なくとも1つのクラスタの履歴観測値、または、1つもしくは複数の2Dグリッド構造に集約された前記履歴観測値の派生物を入力するように適合されている、畳み込みニューラルネットワークへの入力であり、2Dグリッド構造の1つの次元は複数の時間ステップを表し、他方の次元は前記複数の時間ステップにおけるクラスタ状態を捕捉し、前記クラスタ状態は、各時間ステップについて前記少なくとも1つのクラスタ内のクラスタ要素のローカル状態を集約することによって表され、前記畳み込みニューラルネットワークは、2D畳み込みを実行するように適合されており、ローカル時間と、前記2Dグリッド構造における前記クラスタ要素の集約されたローカル状態変化との組み合わせから、ローカル畳み込み特徴を抽出することを学習する、入力と、
前記畳み込みニューラルネットワークから第1のニューラルネットワークへの、少なくとも抽出されているローカル畳み込み特徴の入力であって、
前記第1のニューラルネットワークは、少なくとも1つのクラスタがある状態にあることと、ある行動をとることとの各組み合わせに関連する前記少なくとも1つのクラスタの値を提供する状態−行動価値関数の少なくとも近似値を出力するように適合されているローカル畳み込み特徴の入力とを備える、特徴を抽出するための手段と、
ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせであるか、または、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせから導出される制御行動を決定または計算するための手段と、
前記制御行動に従って次の制御ステップ中に前記クラスタ要素によって消費または解放されるべき前記物理生産物の目標量を分配するための手段とを備える、コンピュータベースのネットワークアーキテクチャ。 - 前記制御技法がモデルフリーである、請求項16に記載のコンピュータベースのネットワークアーキテクチャ。
- 前記状態−行動価値関数がQ関数(Q(x,u))である、請求項16または17に記載のコンピュータベースのネットワークアーキテクチャ。
- 前記生産物が、熱エネルギーまたは電力またはエネルギーである、請求項16〜18のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- 前記第1のニューラルネットワークへの入力として結合された第2のニューラルネットワークが提供され、前記第2のニューラルネットワークは、前記制御行動および外因性状態情報を入力として受信するように構成されている、請求項16〜19のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- 外因性状態情報および前記制御行動を、前記畳み込みニューラルネットワークの前記抽出された畳み込みローカル特徴とマージする手段をさらに備える、請求項20に記載のコンピュータベースのネットワークアーキテクチャ。
- 前記外因性状態情報および前記制御行動を前記畳み込みニューラルネットワークの前記抽出された畳み込みローカル特徴とマージする前に実行される、別個の特徴抽出のための手段が提供され、前記外因性状態情報および前記制御行動が最初に前記第2のニューラルネットワークに供給され、該第2のニューラルネットワークは、前記外因性状態情報および前記制御行動を、次の隠れ層において前記抽出された畳み込みローカル特徴と組み合わされる学習された内部表現にマッピングする、請求項21に記載のコンピュータベースのネットワークアーキテクチャ。
- ネットワーク不均衡値および/または前記外因性状態情報に含まれる、請求項20〜22のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- 1つの時間ステムについて決定された前記制御行動が、次の時間ステップの前記外因性情報に含まれる、請求項20〜23のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- レガシ装置をエミュレートするようにさらに適合されている、請求項16〜24のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- 畳み込みニューラルネットワークは、最初に、前記2Dグリッド構造におけるパターンを捕捉するように適合されており、前記畳み込みニューラルネットワークならびに前記第1のニューラルネットワークおよび前記第2のニューラルネットワークは、前記集約されたクラスタ状態ならびに外因性データおよび前記制御行動から前記目標量へのマッピングを学習するように適合されている、請求項20〜25のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- 前記2Dグリッド構造は、固定された時間ステップでのクラスタ状態のすべての観測値を表す1つの次元を有し、第2の次元は、すべての時間ステップにおけるクラスタ要素の複数の状態変数の各々の値の時間変化に対応し、前記2D特徴抽出動作は、時間および空間にわたって適用され、結果として前記状態情報および前記履歴においてローカル構造を識別する時空間特徴が識別される、請求項16〜26のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- 複数の時間ステップにわたって生じる状態値の変化を表す特徴が学習される、請求項27に記載のコンピュータベースのネットワークアーキテクチャ。
- 前記学習された特徴は、少なくとも前記第1のニューラルネットワークのより上位のネットワーク層によって入力として使用される、請求項28に記載のコンピュータベースのネットワークアーキテクチャ。
- 前記畳み込みネットワークならびに前記第1のニューラルネットワークおよび前記第2のニューラルネットワークはともに訓練される、請求項20〜29のいずれか一項に記載のコンピュータベースのネットワークアーキテクチャ。
- 需要応答システム内のクラスタにグループ化された制約付きクラスタ要素に分配されるべき物理生産物の需要を制御するための制御装置であって、
強化学習(RL)の形態の制御技法を使用して次の制御ステップ中に前記制約付きクラスタ要素に分配されるべき前記物理生産物の量を決定するための手段であって、結果、前記制御技法が、制御されるべき前記需要応答システムとの相互作用から学習する、決定するための手段と、
特徴を抽出するための手段であって、
前記需要応答システムの少なくとも1つのクラスタの履歴観測値、または、1つもしくは複数の2Dグリッド構造に集約された前記履歴観測値の派生物を入力するように適合されている、畳み込みニューラルネットワークへの入力であり、2Dグリッド構造の1つの次元は複数の時間ステップを表し、他方の次元は前記複数の時間ステップにおけるクラスタ状態を捕捉し、前記クラスタ状態は、各時間ステップについて前記少なくとも1つのクラスタ内のクラスタ要素のローカル状態を集約することによって表され、前記畳み込みニューラルネットワークは、2D畳み込みを実行するように適合されており、ローカル時間と、前記2Dグリッド構造における前記クラスタ要素の集約されたローカル状態変化との組み合わせから、ローカル畳み込み特徴を抽出することを学習する、入力と、
前記畳み込みニューラルネットワークから第1のニューラルネットワークへの、少なくとも抽出されているローカル畳み込み特徴の入力であって、
前記第1のニューラルネットワークは、少なくとも1つのクラスタがある状態にあることと、ある行動をとることとの各組み合わせに関連する前記少なくとも1つのクラスタの値を提供する状態−行動価値関数の少なくとも近似値を出力するように適合されているローカル畳み込み特徴の入力とを備える、特徴を抽出するための手段と、
ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせであるか、または、ある行動をとることと、クラスタがある状態にあることとの好ましい組み合わせから導出される制御行動を決定または計算するための手段と、
前記制御行動に従って次の制御ステップ中に前記クラスタ要素によって消費または解放されるべき前記物理生産物の目標量を分配するための手段とを備える、制御装置。 - 処理エンジン上で実行されると、請求項1〜15のいずれか一項に記載の方法のいずれかを実行するように適合されているコードを備えるコンピュータプログラム製品。
- 非一時的機械可読信号記憶手段上に記憶されている、請求項31に記載のコンピュータプログラム製品。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15203252 | 2015-12-31 | ||
EP15203252.0 | 2015-12-31 | ||
EP16167240.7 | 2016-04-27 | ||
EP16167240 | 2016-04-27 | ||
PCT/EP2016/082676 WO2017114810A1 (en) | 2015-12-31 | 2016-12-26 | Methods, controllers and systems for the control of distribution systems using a neural network arhcitecture |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019512757A true JP2019512757A (ja) | 2019-05-16 |
JP2019512757A5 JP2019512757A5 (ja) | 2020-02-06 |
JP6895440B2 JP6895440B2 (ja) | 2021-06-30 |
Family
ID=57799686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018534532A Active JP6895440B2 (ja) | 2015-12-31 | 2016-12-26 | ニューラルネットワークアーキテクチャを用いた分配システムの制御のための方法、制御装置およびシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11341396B2 (ja) |
EP (1) | EP3398116A1 (ja) |
JP (1) | JP6895440B2 (ja) |
CN (1) | CN108604310B (ja) |
WO (1) | WO2017114810A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021044899A1 (ja) * | 2019-09-04 | 2021-03-11 | 株式会社荏原製作所 | 機械学習装置、am装置、機械学習方法、および学習モデルの生成方法 |
KR102320659B1 (ko) * | 2020-09-16 | 2021-11-03 | 한국생산기술연구원 | 로봇을 이용한 단위행동 딥러닝 모델 학습방법과 이를 이용한 로봇 제어 방법 |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11238337B2 (en) * | 2016-08-22 | 2022-02-01 | Applied Brain Research Inc. | Methods and systems for implementing dynamic neural networks |
WO2018065045A1 (en) * | 2016-10-05 | 2018-04-12 | Telecom Italia S.P.A. | Method and system for estimating energy generation based on solar irradiance forecasting |
US11182676B2 (en) * | 2017-08-04 | 2021-11-23 | International Business Machines Corporation | Cooperative neural network deep reinforcement learning with partial input assistance |
CN108280516B (zh) * | 2018-03-05 | 2021-05-11 | 山东领能电子科技有限公司 | 一种多组卷积神经网络之间互博智能进化的优化方法 |
NL2020861B1 (en) | 2018-04-12 | 2019-10-22 | Illumina Inc | Variant classifier based on deep neural networks |
CN110766152B (zh) * | 2018-07-27 | 2023-08-04 | 富士通株式会社 | 用于训练深度神经网络的方法和装置 |
US11501157B2 (en) * | 2018-07-30 | 2022-11-15 | International Business Machines Corporation | Action shaping from demonstration for fast reinforcement learning |
EP3637217A1 (en) | 2018-10-08 | 2020-04-15 | E.ON Sverige AB | A method for controlling a thermal energy distribution system |
JP6702390B2 (ja) * | 2018-10-09 | 2020-06-03 | トヨタ自動車株式会社 | 車両用駆動装置の制御装置、車載電子制御ユニット、学習済みモデル、機械学習システム、車両用駆動装置の制御方法、電子制御ユニットの製造方法及び出力パラメータ算出装置 |
US10804702B2 (en) | 2018-10-11 | 2020-10-13 | Centrica Business Solutions Belgium | Self-organizing demand-response system |
EP3668050A1 (de) * | 2018-12-12 | 2020-06-17 | Siemens Aktiengesellschaft | Anpassen einer software-anwendung, die auf einem gateway ausgeführt wird |
CA3115123A1 (en) | 2018-12-13 | 2020-06-18 | Andritz Inc. | Industrial plant controller |
CN109739196B (zh) * | 2019-01-11 | 2021-07-13 | 西安电子科技大学 | 含有不可观与不可控事件的自动制造系统无死锁控制方法 |
EP3884558A4 (en) | 2019-01-31 | 2022-08-17 | General Electric Company | BATTERY CHARGE AND DISCHARGE POWER CONTROL IN AN ELECTRICAL NETWORK |
US11025061B2 (en) * | 2019-03-28 | 2021-06-01 | Accenture Global Solutions Limited | Predictive power usage monitoring |
CN110065855B (zh) * | 2019-04-21 | 2024-01-23 | 苏州科技大学 | 多轿厢电梯控制方法及控制系统 |
CN110232409A (zh) * | 2019-05-30 | 2019-09-13 | 国网上海市电力公司 | 一种配网跳闸故障类型自动识别方法 |
CN110347192B (zh) * | 2019-06-17 | 2020-11-03 | 武汉理工大学 | 基于注意力机制和自编码器的玻璃炉温智能预测控制方法 |
TWI699637B (zh) * | 2019-07-10 | 2020-07-21 | 中華電信股份有限公司 | 利用深度強化學習控制環境舒適度之系統及其方法 |
KR20210012730A (ko) | 2019-07-26 | 2021-02-03 | 삼성전자주식회사 | 인공지능 모델의 학습 방법 및 전자 장치 |
CN114080646A (zh) * | 2019-07-26 | 2022-02-22 | 富士胶片株式会社 | 信息处理装置、程序、学习完毕模型、诊断支援装置、学习装置及预测模型的生成方法 |
CN110542178B (zh) * | 2019-09-02 | 2020-06-02 | 上海德昂科技有限公司 | 具有自学习能力的空调冷冻机房控制方法及系统 |
CN110598300A (zh) * | 2019-09-05 | 2019-12-20 | 东软睿驰汽车技术(沈阳)有限公司 | 一种电池soh预测方法及装置 |
US20210073674A1 (en) * | 2019-09-11 | 2021-03-11 | International Business Machines Corporation | Automated explainer of reinforcement learning actions using occupation measures |
CN112749326B (zh) * | 2019-11-15 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、计算机设备及存储介质 |
CN110941698B (zh) * | 2019-11-18 | 2022-09-27 | 陕西师范大学 | 一种基于bert下卷积神经网络的服务发现方法 |
CN110968458B (zh) * | 2019-11-26 | 2022-03-29 | 山东大学 | 一种面向非易失处理器的基于增强学习的备份系统及方法 |
CN110867903B (zh) * | 2019-11-27 | 2021-05-18 | 浙江工业大学 | 一种基于深度神经网络的智能电网系统实时最优功率分配方法 |
CN110826258B (zh) * | 2019-12-06 | 2023-05-23 | 创新奇智(重庆)科技有限公司 | 基于时空卷积神经网络的数据中心机房仿真环境构建方法 |
CN111062632B (zh) * | 2019-12-24 | 2023-04-18 | 国网黑龙江省电力有限公司 | 一种基于边缘智能的5g能源互联网虚拟电厂经济调度方法 |
CN111242443B (zh) * | 2020-01-06 | 2023-04-18 | 国网黑龙江省电力有限公司 | 基于深度强化学习的能源互联网中虚拟电厂经济调度方法 |
CN113139116B (zh) * | 2020-01-19 | 2024-03-01 | 北京中科闻歌科技股份有限公司 | 基于bert的媒体信息观点抽取方法、装置、设备和存储介质 |
US11733680B2 (en) * | 2020-03-23 | 2023-08-22 | Hamilton Sundstrand Corporation | Control of matrix converters using machine learning |
CN111525548B (zh) * | 2020-04-02 | 2022-11-11 | 中国电力科学研究院有限公司 | 一种对电网静态电压稳定裕度进行评估的方法及系统 |
US20210326699A1 (en) * | 2020-04-21 | 2021-10-21 | Inrix, Inc. | Travel speed prediction |
CN113757922B (zh) * | 2020-06-03 | 2023-04-07 | 中国移动通信集团浙江有限公司 | 一种基于深度学习的空调系统节能控制方法、装置、设备及计算机介质 |
JP7508929B2 (ja) * | 2020-07-31 | 2024-07-02 | セイコーエプソン株式会社 | 機械学習装置 |
CN112202196B (zh) * | 2020-08-18 | 2022-04-29 | 广西大学 | 一种双馈风力发电机的量子深度强化学习控制方法 |
US11360155B2 (en) * | 2020-09-03 | 2022-06-14 | Volkswagen Aktiengesellschaft | Battery state of health estimator |
CN111965981B (zh) * | 2020-09-07 | 2022-02-22 | 厦门大学 | 一种航空发动机强化学习控制方法及系统 |
CN112215406B (zh) * | 2020-09-23 | 2024-04-16 | 国网甘肃省电力公司电力科学研究院 | 一种基于时间卷积神经网络的非侵入式居民用电负荷分解方法 |
US20220129728A1 (en) * | 2020-10-26 | 2022-04-28 | Arizona Board Of Regents On Behalf Of Arizona State University | Reinforcement learning-based recloser control for distribution cables with degraded insulation level |
CN112419084B (zh) * | 2020-11-11 | 2022-11-29 | 广东电网有限责任公司广州供电局 | 一种配电网设备利用率的优化方法及装置 |
CN112488531B (zh) * | 2020-12-02 | 2022-09-06 | 广东电网有限责任公司电力调度控制中心 | 基于深度强化学习的异构柔性负荷实时调控方法和装置 |
US11403090B2 (en) * | 2020-12-08 | 2022-08-02 | Alibaba Group Holding Limited | Method and system for compiler optimization based on artificial intelligence |
CN112866262B (zh) * | 2021-01-25 | 2022-06-14 | 东方电气自动控制工程有限公司 | 一种基于神经网络的电厂安全i区态势感知平台 |
CN112990674A (zh) * | 2021-03-01 | 2021-06-18 | 哈尔滨工程大学 | 一种海上浮式风电场多目标运行调度方法 |
WO2023066497A1 (en) | 2021-10-22 | 2023-04-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Managing energy in a network |
CN114548481B (zh) * | 2021-12-26 | 2022-08-23 | 特斯联科技集团有限公司 | 基于强化学习的电力设备碳中和处理装置 |
CN115442315B (zh) * | 2022-07-25 | 2023-10-24 | 互赢科技(东莞)有限公司 | 一种基于深度学习的多源异构网络接入方法 |
CN116561696B (zh) * | 2023-01-11 | 2024-04-16 | 上海合煌能源科技有限公司 | 基于多维度的用户可调节负荷快速聚合方法及其系统 |
WO2024180368A1 (en) | 2023-03-01 | 2024-09-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Load balancing and control of local batteries for communication system |
CN116449716B (zh) * | 2023-06-13 | 2023-09-29 | 辰极智航(北京)科技有限公司 | 智能伺服稳定控制方法、装置、系统、控制器及存储介质 |
CN118336673B (zh) * | 2024-02-02 | 2024-09-20 | 中科聚(北京)能源科技有限公司 | 一种含分布式光伏和储能电池的园区用电控制方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011022902A (ja) * | 2009-07-17 | 2011-02-03 | Ritsumeikan | 電力取引管理システム、管理装置、電力取引方法、及び電力取引用コンピュータプログラム |
JP2014512052A (ja) * | 2011-04-15 | 2014-05-19 | ブラームス・インステリング・ボール・テクノロジス・オンデルズーク(フェー・イー・ティ・オゥ) | 複数の装置に配給すべきエネルギに関する制約を考慮して、予め定められた期間にわたって複数の装置のクラスタにエネルギ流を分配するための方法、そのような方法を行なうためのコンピュータプログラム、およびそのためのシステム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146371A (ja) | 2006-12-11 | 2008-06-26 | Hitachi Ltd | ボイラプラントの制御装置 |
CN101859102B (zh) | 2006-12-11 | 2013-03-20 | 株式会社日立制作所 | 燃煤锅炉的气体浓度推断方法以及气体浓度推断装置 |
US20090228324A1 (en) | 2008-03-04 | 2009-09-10 | Ronald Ambrosio | Method and System for Efficient Energy Distribution in Electrical Grids Using Sensor and Actuator Networks |
DE102008020379A1 (de) | 2008-04-23 | 2009-10-29 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems |
US9235800B2 (en) | 2010-04-14 | 2016-01-12 | Siemens Aktiengesellschaft | Method for the computer-aided learning of a recurrent neural network for modeling a dynamic system |
ES2711197T3 (es) | 2011-06-03 | 2019-04-30 | Vlaamse Instelling Voor Tech Onderzoek Vito | Controlador para almacenar energía térmica como regulación |
ES2616207T3 (es) | 2011-12-23 | 2017-06-09 | Vlaamse Instelling Voor Technologisch Onderzoek (Vito) | Sistema para distribuir energía eléctrica entre un grupo de dispositivos eléctricos, método para distribuir energía eléctrica entre un grupo de dispositivos eléctricos de dicho sistema, y controlador utilizable en dicho sistema |
EP2618445B1 (en) | 2012-01-17 | 2019-04-10 | Vlaamse Instelling voor Technologisch Onderzoek (VITO) | Demand response adaptor for connecting a device to a demand response system or home automation system, device and such demand response adaptor and use thereof |
US20140032169A1 (en) | 2012-07-24 | 2014-01-30 | General Electric Company | Systems and methods for improving control system reliability |
EP2806520A1 (en) * | 2013-05-22 | 2014-11-26 | Vito NV | Power supply network control system and method |
-
2016
- 2016-12-26 CN CN201680077577.XA patent/CN108604310B/zh active Active
- 2016-12-26 WO PCT/EP2016/082676 patent/WO2017114810A1/en active Application Filing
- 2016-12-26 EP EP16826348.1A patent/EP3398116A1/en active Pending
- 2016-12-26 US US16/066,118 patent/US11341396B2/en active Active
- 2016-12-26 JP JP2018534532A patent/JP6895440B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011022902A (ja) * | 2009-07-17 | 2011-02-03 | Ritsumeikan | 電力取引管理システム、管理装置、電力取引方法、及び電力取引用コンピュータプログラム |
JP2014512052A (ja) * | 2011-04-15 | 2014-05-19 | ブラームス・インステリング・ボール・テクノロジス・オンデルズーク(フェー・イー・ティ・オゥ) | 複数の装置に配給すべきエネルギに関する制約を考慮して、予め定められた期間にわたって複数の装置のクラスタにエネルギ流を分配するための方法、そのような方法を行なうためのコンピュータプログラム、およびそのためのシステム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021044899A1 (ja) * | 2019-09-04 | 2021-03-11 | 株式会社荏原製作所 | 機械学習装置、am装置、機械学習方法、および学習モデルの生成方法 |
JP2021037716A (ja) * | 2019-09-04 | 2021-03-11 | 株式会社荏原製作所 | 機械学習装置、am装置、機械学習方法、および学習モデルの生成方法 |
KR102320659B1 (ko) * | 2020-09-16 | 2021-11-03 | 한국생산기술연구원 | 로봇을 이용한 단위행동 딥러닝 모델 학습방법과 이를 이용한 로봇 제어 방법 |
Also Published As
Publication number | Publication date |
---|---|
WO2017114810A1 (en) | 2017-07-06 |
CN108604310B (zh) | 2022-07-26 |
US20190019080A1 (en) | 2019-01-17 |
CN108604310A (zh) | 2018-09-28 |
US11341396B2 (en) | 2022-05-24 |
EP3398116A1 (en) | 2018-11-07 |
WO2017114810A9 (en) | 2018-10-04 |
JP6895440B2 (ja) | 2021-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6895440B2 (ja) | ニューラルネットワークアーキテクチャを用いた分配システムの制御のための方法、制御装置およびシステム | |
Wei et al. | Deep reinforcement learning for building HVAC control | |
Claessens et al. | Convolutional neural networks for automatic state-time feature extraction in reinforcement learning applied to residential load control | |
Wan et al. | Model-free real-time EV charging scheduling based on deep reinforcement learning | |
Coraci et al. | Online transfer learning strategy for enhancing the scalability and deployment of deep reinforcement learning control in smart buildings | |
Alamaniotis et al. | Genetic optimal regression of relevance vector machines for electricity pricing signal forecasting in smart grids | |
Hernandez et al. | A survey on electric power demand forecasting: future trends in smart grids, microgrids and smart buildings | |
Ruelens et al. | Demand response of a heterogeneous cluster of electric water heaters using batch reinforcement learning | |
Kofinas et al. | Energy management in solar microgrid via reinforcement learning using fuzzy reward | |
Xie et al. | Multi-agent attention-based deep reinforcement learning for demand response in grid-responsive buildings | |
Shah et al. | Dynamic user preference parameters selection and energy consumption optimization for smart homes using deep extreme learning machine and bat algorithm | |
Svetozarevic et al. | Data-driven control of room temperature and bidirectional EV charging using deep reinforcement learning: Simulations and experiments | |
Sülo et al. | Energy efficient smart buildings: LSTM neural networks for time series prediction | |
El Bourakadi et al. | Intelligent energy management for micro-grid based on deep learning LSTM prediction model and fuzzy decision-making | |
Jang et al. | Optimal HVAC system operation using online learning of interconnected neural networks | |
KR102439453B1 (ko) | 상호 연결된 인공 신경망과 온라인 학습을 이용한 열 공조 시스템 및 운영 방법 | |
Shakir et al. | Forecasting and optimisation for microgrid in home energy management systems | |
Ghiasi et al. | A new spinning reserve requirement prediction with hybrid model | |
US20230228446A1 (en) | Scalable control of heat pumps with limited smart-home devices | |
Zhang et al. | Two-stage reinforcement learning policy search for grid-interactive building control | |
Hafeez et al. | Short term load forecasting based on deep learning for smart grid applications | |
Olaru et al. | Electricity production and consumption modeling through fuzzy logic | |
Naug et al. | A data driven method for prediction of energy demand in commercial buildings | |
Li et al. | Residential load forecasting: An online-offline deep kernel learning method | |
EP3352027B1 (en) | Method and system of smart climatization management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6895440 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |