JP7331789B2 - 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 - Google Patents
車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 Download PDFInfo
- Publication number
- JP7331789B2 JP7331789B2 JP2020109677A JP2020109677A JP7331789B2 JP 7331789 B2 JP7331789 B2 JP 7331789B2 JP 2020109677 A JP2020109677 A JP 2020109677A JP 2020109677 A JP2020109677 A JP 2020109677A JP 7331789 B2 JP7331789 B2 JP 7331789B2
- Authority
- JP
- Japan
- Prior art keywords
- amount
- reward
- vehicle
- vehicle control
- control device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H61/02—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used
- F16H61/0202—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric
- F16H61/0204—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric for gearshift control, e.g. control functions for performing shifting or generation of shift signal
- F16H61/0213—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric for gearshift control, e.g. control functions for performing shifting or generation of shift signal characterised by the method for generating shift signals
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H59/00—Control inputs to control units of change-speed-, or reversing-gearings for conveying rotary motion
- F16H59/36—Inputs being a function of speed
- F16H59/38—Inputs being a function of speed of gearing elements
- F16H59/42—Input shaft speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K6/00—Arrangement or mounting of plural diverse prime-movers for mutual or common propulsion, e.g. hybrid propulsion systems comprising electric motors and internal combustion engines ; Control systems therefor, i.e. systems controlling two or more prime movers, or controlling one of these prime movers and any of the transmission, drive or drive units Informative references: mechanical gearings with secondary electric drive F16H3/72; arrangements for handling mechanical energy structurally associated with the dynamo-electric machine H02K7/00; machines comprising structurally interrelated motor and generator parts H02K51/00; dynamo-electric machines not otherwise provided for in H02K see H02K99/00
- B60K6/20—Arrangement or mounting of plural diverse prime-movers for mutual or common propulsion, e.g. hybrid propulsion systems comprising electric motors and internal combustion engines ; Control systems therefor, i.e. systems controlling two or more prime movers, or controlling one of these prime movers and any of the transmission, drive or drive units Informative references: mechanical gearings with secondary electric drive F16H3/72; arrangements for handling mechanical energy structurally associated with the dynamo-electric machine H02K7/00; machines comprising structurally interrelated motor and generator parts H02K51/00; dynamo-electric machines not otherwise provided for in H02K see H02K99/00 the prime-movers consisting of electric motors and internal combustion engines, e.g. HEVs
- B60K6/42—Arrangement or mounting of plural diverse prime-movers for mutual or common propulsion, e.g. hybrid propulsion systems comprising electric motors and internal combustion engines ; Control systems therefor, i.e. systems controlling two or more prime movers, or controlling one of these prime movers and any of the transmission, drive or drive units Informative references: mechanical gearings with secondary electric drive F16H3/72; arrangements for handling mechanical energy structurally associated with the dynamo-electric machine H02K7/00; machines comprising structurally interrelated motor and generator parts H02K51/00; dynamo-electric machines not otherwise provided for in H02K see H02K99/00 the prime-movers consisting of electric motors and internal combustion engines, e.g. HEVs characterised by the architecture of the hybrid electric vehicle
- B60K6/44—Series-parallel type
- B60K6/445—Differential gearing distribution type
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H2061/0075—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by a particular control method
- F16H2061/0087—Adaptive control, e.g. the control parameters adapted by learning
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H2061/0075—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by a particular control method
- F16H2061/009—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by a particular control method using formulas or mathematic relations for calculating parameters
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H2061/0075—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by a particular control method
- F16H2061/0096—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by a particular control method using a parameter map
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H61/02—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used
- F16H61/0202—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric
- F16H61/0204—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric for gearshift control, e.g. control functions for performing shifting or generation of shift signal
- F16H61/0213—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric for gearshift control, e.g. control functions for performing shifting or generation of shift signal characterised by the method for generating shift signals
- F16H2061/022—Calculation or estimation of optimal gear ratio, e.g. best ratio for economy drive or performance according driver preference, or to optimise exhaust emissions
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H61/02—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used
- F16H61/0202—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric
- F16H61/0204—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric for gearshift control, e.g. control functions for performing shifting or generation of shift signal
- F16H61/0213—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing characterised by the signals used the signals being electric for gearshift control, e.g. control functions for performing shifting or generation of shift signal characterised by the method for generating shift signals
- F16H2061/0234—Adapting the ratios to special vehicle conditions
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H61/04—Smoothing ratio shift
- F16H2061/0459—Smoothing ratio shift using map for shift parameters, e.g. shift time, slip or pressure gradient, for performing controlled shift transition and adapting shift parameters by learning
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H59/00—Control inputs to control units of change-speed-, or reversing-gearings for conveying rotary motion
- F16H59/14—Inputs being a function of torque or torque demand
- F16H59/18—Inputs being a function of torque or torque demand dependent on the position of the accelerator pedal
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H59/00—Control inputs to control units of change-speed-, or reversing-gearings for conveying rotary motion
- F16H59/36—Inputs being a function of speed
- F16H59/44—Inputs being a function of speed dependent on machine speed of the machine, e.g. the vehicle
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H61/00—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing
- F16H61/68—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing specially adapted for stepped gearings
- F16H61/684—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing specially adapted for stepped gearings without interruption of drive
- F16H61/686—Control functions within control units of change-speed- or reversing-gearings for conveying rotary motion ; Control of exclusively fluid gearing, friction gearing, gearings with endless flexible members or other particular types of gearing specially adapted for stepped gearings without interruption of drive with orbital gears
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/60—Other road transportation technologies with climate change mitigation effect
- Y02T10/62—Hybrid vehicles
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Transportation (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Control Of Transmission Device (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Description
1.実行装置および記憶装置を備え、前記記憶装置には、車両の状態と前記車両に搭載される変速装置の操作に関する変数である行動変数との関係を規定するための関係規定データが記憶されており、前記実行装置は、センサの検出値に基づく前記車両の状態を取得する取得処理と、前記取得処理によって取得された前記車両の状態と前記関係規定データとによって定まる前記行動変数の値に基づき前記変速装置を操作する操作処理と、前記取得処理によって取得された前記車両の状態に基づき、前記車両の特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える報酬算出処理と、前記取得処理によって取得された前記車両の状態、前記変速装置の操作に用いられた前記行動変数の値、および該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新する更新処理と、前記更新処理による更新回数をカウントするカウント処理と、前記更新回数が大きい場合に小さい場合と比較して、前記関係規定データが示す前記行動変数の値のうちの前記報酬についての期待収益を最大化する値以外の値が前記操作処理によって採用される範囲を縮小する側に制限する制限処理と、を実行し、前記更新写像は、前記関係規定データに従って前記変速装置が操作される場合の前記期待収益を増加させるように更新された前記関係規定データを出力するものである車両用制御装置である。
一度の探索によって得られた報酬に基づく関係規定データの更新量を一定とする場合、関係規定データが示す期待収益を最大化する行動が変動する期間が長くなるおそれがある。そこで上記構成では、更新回数が大きい場合に更新量を小さい側に制限することにより、強化学習が進行した後に一度の探索の結果、関係規定データが大きく更新されることを抑制する。これにより、関係規定データが示す期待収益を最大化する行動を、実際に収益を大きくする行動に早期に近づけることができる。
なお、第2実行装置が車載装置とは別の装置であることは、第2実行装置が車載装置ではないことを意味する。
11.上記9記載の車両用制御システムにおける第2実行装置を備える車両用学習装置である。
図1に示すように、内燃機関10のクランク軸12には、動力分割装置20が機械的に連結されている。動力分割装置20は、内燃機関10、第1モータジェネレータ22、および第2モータジェネレータ24の動力を分割する。動力分割装置20は、遊星歯車機構を備えており、遊星歯車機構のキャリアCにクランク軸12が機械的に連結されており、サンギアSに、第1モータジェネレータ22の回転軸22aが機械的に連結されており、リングギアRに、第2モータジェネレータ24の回転軸24aが機械的に連結されている。なお、第1モータジェネレータ22の端子には、第1インバータ23の出力電圧が印加される。また、第2モータジェネレータ24の端子には、第2インバータ25の出力電圧が印加される。
また、キャリアCには、オイルポンプ32の従動軸32aが機械的に連結されている。オイルポンプ32は、オイルパン34内のオイルを吸入し、作動油として変速装置26に吐出するポンプである。なお、オイルポンプ32から吐出された作動油は、変速装置26内の油圧制御回路28によってその圧力が調整されて作動油として利用される。油圧制御回路28は、複数のソレノイドバルブ28aを備えており、それら各ソレノイドバルブ28aの通電によって、作動油の流動状態や作動油の油圧を制御する回路である。
図3に、S22の処理の詳細を示す。
一方、CPU42は、フェーズ変数Vpaseが「1」または「2」であると判定する場合(S30:NO)、報酬rに「0」を代入する(S46)。
←Q+α・{r+γ・maxQ(s+1,A)-Q(s,a)} …(c1)
ここで、行動価値関数Q(s,a)の更新量「α・{r+γ・maxQ(s+1,A)-Q(s,a)}」には、割引率γおよび学習率αを用いている。なお、割引率γおよび学習率αは、いずれも「0」よりも大きく「1」以下の定数である。また、現在のフェーズがフェーズ1,2の場合において、「maxQ(s+1,a)」は、フェーズ完了時の状態変数、すなわち、図2に示す一連の処理の次回のS12の処理によって取得されるべき状態s+1を独立変数とする行動価値関数Qのうちの最大値を意味する。なお、現在のフェーズがフェーズ3でない限り、図2に示す一連の処理の次回のS12の処理によって取得される状態sは、S48の処理によって用いられる状態s+1とする。また、現在のフェーズがフェーズ3である場合、図2に示す一連の処理の今回のS12の処理によって取得した状態sを状態s+1とする。
なお、CPU42は、S50の処理が完了する場合、図3に示す一連の処理を一旦終了する。ちなみに、車両VCの出荷時における関係規定データDRは、車両VCと同一の仕様の試作車等において図2の処理と同様の処理によって学習がなされたデータとする。すなわち、図2の処理は、車両VCの出荷前に設定された油圧指令値P*を、車両VCが実際に道路を走行する際に適切な値に強化学習によって更新するための処理である。
ここで、本実施形態の作用および効果について説明する。
(1)更新回数Nが大きくなるにつれて学習率αを小さい値へと変更した。これにより、更新回数Nが大きくなるにつれて、関係規定データDRの更新量を小さい側に制限することができる。そしてこれにより、強化学習が進行した後に一度の探索の結果、関係規定データDRが大きく更新されることを抑制することができる。これにより、関係規定データDRが示すグリーディ行動agを、実際に収益を大きくする行動に早期に近づけることができる。
以下、第2の実施形態について、第1の実施形態との相違点を中心に図面を参照しつつ説明する。
第1に、アクセル操作量ACCPおよび変速変数ΔVsftに応じて、変速時間Tsftと強い相関を有するアクセルレスポンスや、吹き量最大値ΔNm2maxと強い相関を有するドライバビリティ、発熱量InCVの3つの要求要素に対する優先度が異なるようにグリーディ行動agを学習させるための設定である。
以下、第3の実施形態について、第1の実施形態との相違点を中心に図面を参照しつつ説明する。
図6に示すように、車両VC(1)の制御装置40は、通信機47を備えており、通信機47によって外部のネットワーク80を介してデータ解析センター90と通信可能となっている。
上記実施形態における事項と、上記「課題を解決するための手段」の欄に記載した事項との対応関係は、次の通りである。以下では、「課題を解決するための手段」の欄に記載した解決手段の番号毎に、対応関係を示している。[1]実行装置は、CPU42およびROM44に対応し、記憶装置は、記憶装置46に対応する。取得処理は、S12,S32、S36,S40の処理に対応し、操作処理は、S16の処理に対応する。報酬算出処理は、図3におけるS34,S38,S42の処理や、図5におけるS34a,S38a,S42aの処理に対応する。更新処理は、S48の処理に対応する。カウント処理は、S50の処理に対応し、制限処理は、S64,S70,S76,S80の処理に対応する。更新写像は、学習プログラムDPLのうちS48の処理を実行する指令によって規定された写像に対応する。換言すれば、更新写像は、上記の式(c1)によって規定される写像に対応する。[2]制限処理は、S62,S68,S74,S78の処理に対応する。[3]S42aの処理に対応する。[4]S34aの処理に対応する。[5]S38aの処理に対応する。[6]S42aの処理に対応する。[7]S34aの処理に対応する。[8]S38aの処理に対応する。[9~11]第1実行装置は、CPU42およびROM44に対応し、第2実行装置は、CPU92およびROM94に対応する。[12]コンピュータは、図1のCPU42や、図6のCPU42,92に対応する。
なお、本実施形態は、以下のように変更して実施することができる。本実施形態および以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
・関係規定データに基づく行動変数の値の選択に用いられる状態としては、上記実施形態において例示したものに限らない。たとえば、フェーズ2、フェーズ3についてそれ以前の行動変数の値に依存した状態変数としては、回転速度Nm2に限らず、たとえば吹き量ΔNm2であってもよい。またたとえば、発熱量としてもよい。もっとも、たとえば「更新写像について」の欄に記載したようにprofit sharingのアルゴリズムを用いる場合などには、フェーズ2、フェーズ3についてそれ以前の行動変数の値に依存した状態変数を、行動変数の値の選択に用いられる状態に含めなくてもよい。
・状態変数に、油温Toilを含めることは必須でない。
・状態変数に、フェーズ変数Vpaseを含めることは必須ではない。たとえば変速開始からの時間や入力軸の回転速度、変速変数ΔVsftを状態変数に含めて、都度の行動を指定する行動価値関数Qを構成し、同行動価値関数を用いて強化学習を行ってもよい。その場合、変速期間を予め3つのフェーズに指定しない。
・上記実施形態では、フェーズ3の行動変数を、圧力上昇速度としたが、これに限らず、たとえばフェーズ3をさらに細分化してそれら各段階における圧力指令値としてもよい。
・上記実施形態では、行動価値関数Qを、テーブル形式の関数としたが、これに限らない。たとえば、関数近似器を用いてもよい。
・「関係規定データについて」の欄に記載したように行動価値関数Qを関数近似器とする場合、上記実施形態におけるテーブル型式の関数の独立変数となる行動についての離散的な値のそれぞれについて状態sとともに行動価値関数Qに入力することによって、行動価値関数Qを最大化する行動aを選択すればよい。
・S48の処理においては、方策オフ型TD法であるいわゆるQ学習を例示したが、これに限らない。たとえば、方策オン型TD法であるいわゆるSARSA法によるものであってもよい。もっとも、TD法によるものに限らず、たとえば、モンテカルロ法を用いたり、適格度トレース法を用いたりしてもよい。
・上記実施形態では、フェーズ1、フェーズ2においては報酬rをゼロとしたがこれに限らない。たとえばフェーズ1において、フェーズ1における発熱量CVが小さい場合に大きい場合よりも大きくなる報酬を与えてもよい。またたとえば、フェーズ2において、フェーズ2における発熱量CVが小さい場合に大きい場合よりも大きくなる報酬を与えてもよい。またたとえば、フェーズ2において、フェーズ2における吹き量ΔNm2が小さい場合に大きい場合よりも大きくなる報酬を与えてもよい。
・図7に示した例では、方策πに基づく行動を決定する処理(S14の処理)を、車両側で実行したが、これに限らない。たとえば、車両VC1からS12の処理によって取得したデータを送信することとし、データ解析センター90にて送信されてデータを用いて行動aを決定し、決定した行動を車両VC1に送信してもよい。
・実行装置としては、CPU42(92)とROM44(94)とを備えて、ソフトウェア処理を実行するものに限らない。たとえば、上記実施形態においてソフトウェア処理されたものの少なくとも一部を、ハードウェア処理するたとえばASIC等の専用のハードウェア回路を備えてもよい。すなわち、実行装置は、以下の(a)~(c)のいずれかの構成であればよい。(a)上記処理の全てを、プログラムに従って実行する処理装置と、プログラムを記憶するROM等のプログラム格納装置とを備える。(b)上記処理の一部をプログラムに従って実行する処理装置およびプログラム格納装置と、残りの処理を実行する専用のハードウェア回路とを備える。(c)上記処理の全てを実行する専用のハードウェア回路を備える。ここで、処理装置およびプログラム格納装置を備えたソフトウェア実行装置や、専用のハードウェア回路は複数であってもよい。
・コンピュータとしては、図1のCPU42や、図6のCPU42,92に限らない。たとえば、車両VC1の出荷前の関係規定データDRを生成するためのコンピュータと、車両VC1に搭載されるCPU42とであってもよい。その場合、出荷後における探索範囲は、関係規定データDRを生成するためのコンピュータによって実行される強化学習における探索と比較して、行動変数の取りうる値の範囲が小さいことが望ましい。ちなみに、車両の出荷前の関係規定データDRの生成処理においては、車両が存在せず、テストベンチにて内燃機関10等を稼働させて車両の走行を模擬することによって、車両の状態を疑似的に生成し、センサの検出値等によって疑似的に生成された車両の状態を把握しつつ強化学習に用いてもよい。その場合、疑似的に生成された車両の状態を、センサの検出値に基づく車両の状態とみなす。
・上記実施形態では、関係規定データDRが記憶される記憶装置と、学習プログラムDPLや学習サブプログラムDPLa、学習メインプログラムDPLbが記憶される記憶装置(ROM44,94)とを別の記憶装置としたが、これに限らない。
・車両としては、シリーズ・パラレルハイブリッド車に限らない。たとえばシリーズハイブリッド車や、パラレルハイブリッド車であってもよい。なお、車載回転機として、内燃機関とモータジェネレータとを備えるものにも限らない。たとえば内燃機関を備えるもののモータジェネレータを備えない車両であってもよく、またたとえばモータジェネレータを備えるものの内燃機関を備えない車両であってもよい。
20…動力分割装置
22…第1モータジェネレータ
24…第2モータジェネレータ
26…変速装置
40…制御装置
90…データ解析センター
92…CPU
94…ROM
96…記憶装置
97…通信機
99…ローカルネットワーク
Claims (12)
- 実行装置および記憶装置を備え、
前記記憶装置には、車両の状態と前記車両に搭載される変速装置の操作に関する変数である行動変数との関係を規定するための関係規定データが記憶されており、
前記実行装置は、
センサの検出値に基づく前記車両の状態を取得する取得処理と、
前記取得処理によって取得された前記車両の状態と前記関係規定データとによって定まる前記行動変数の値に基づき前記変速装置を操作する操作処理と、
前記操作処理によって実現された前記車両の特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える報酬算出処理と、
前記取得処理によって取得された前記車両の状態、前記変速装置の操作に用いられた前記行動変数の値、および該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新する更新処理と、
前記更新処理による更新回数をカウントするカウント処理と、
前記更新回数が大きい場合に小さい場合と比較して、前記関係規定データが示す前記行動変数の値のうちの前記報酬についての期待収益を最大化する値以外の値が前記操作処理によって採用される範囲を縮小する側に制限する制限処理と、
を実行し、
前記更新写像は、前記関係規定データに従って前記変速装置が操作される場合の前記期待収益を増加させるように更新された前記関係規定データを出力するものである車両用制御装置。 - 前記制限処理は、前記更新回数が大きい場合、小さい場合と比較して、前記更新処理による更新量を小さい側に制限する処理を含む請求項1記載の車両用制御装置。
- 前記報酬算出処理は、変速比の切り替え期間における発熱量が小さい場合に大きい場合よりも大きい報酬を与える処理と、同一の発熱量であっても変速の種類に応じて与える報酬の大きさを変更する処理と、を含む請求項1または2記載の車両用制御装置。
- 前記報酬算出処理は、変速比の切り替えに要する時間である変速時間が小さい場合に大きい場合よりも大きい報酬を与える処理と、同一の変速時間であっても変速の種類に応じて与える報酬の大きさを変更する処理と、を含む請求項1~3のいずれか1項に記載の車両用制御装置。
- 前記報酬算出処理は、変速比の切り替え期間における前記変速装置の入力軸の回転速度が基準となる回転速度を上回る量が小さい場合に大きい場合よりも大きい報酬を与える処理と、前記上回る量が同一であっても変速の種類に応じて与える報酬の大きさを変更する処理と、を含む請求項1~4のいずれか1項に記載の車両用制御装置。
- 前記報酬算出処理は、変速比の切り替え期間における発熱量が小さい場合に大きい場合よりも大きい報酬を与える処理と、同一の発熱量であってもアクセル操作量の大きさに応じて与える報酬の大きさを変更する処理と、を含む請求項1~5のいずれか1項に記載の車両用制御装置。
- 前記報酬算出処理は、変速比の切り替えに要する時間である変速時間が小さい場合に大きい場合よりも大きい報酬を与える処理と、同一の変速時間であってもアクセル操作量の大きさに応じて与える報酬の大きさを変更する処理と、を含む請求項1~6のいずれか1項に記載の車両用制御装置。
- 前記報酬算出処理は、変速比の切り替え期間における前記変速装置の入力軸の回転速度が基準となる回転速度を上回る量が小さい場合に大きい場合よりも大きい報酬を与える処理と、前記上回る量が同一であってもアクセル操作量の大きさに応じて与える報酬の大きさを変更する処理と、を含む請求項1~7のいずれか1項に記載の車両用制御装置。
- 請求項1~8のいずれか1項に記載の車両用制御装置における前記実行装置および前記記憶装置を備え、
前記実行装置は、前記車両に搭載される第1実行装置と、車載装置とは別の第2実行装置と、を含み、
前記第1実行装置は、少なくとも前記取得処理および前記操作処理を実行し、
前記第2実行装置は、少なくとも前記更新処理を実行する車両用制御システム。 - 請求項9記載の車両用制御システムにおける第1実行装置を備える車両用制御装置。
- 請求項9記載の車両用制御システムにおける第2実行装置を備える車両用学習装置。
- 請求項1~8のいずれか1項に記載の車両用制御装置における前記取得処理、前記操作処理、前記報酬算出処理、前記更新処理、前記カウント処理および前記制限処理をコンピュータに実行させる車両用学習方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020109677A JP7331789B2 (ja) | 2020-06-25 | 2020-06-25 | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 |
US17/329,644 US11959545B2 (en) | 2020-06-25 | 2021-05-25 | Vehicle control device, vehicle control system, vehicle learning device, and vehicle learning method |
CN202110574795.7A CN113847419B (zh) | 2020-06-25 | 2021-05-26 | 车辆用控制装置、车辆用控制系统、车辆用学习装置及车辆用学习方法 |
DE102021115776.5A DE102021115776A1 (de) | 2020-06-25 | 2021-06-18 | Fahrzeugsteuerungsvorrichtung, fahrzeugsteuerungssystem, fahrzeuglernvorrichtung und fahrzeuglernverfahren |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020109677A JP7331789B2 (ja) | 2020-06-25 | 2020-06-25 | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022007029A JP2022007029A (ja) | 2022-01-13 |
JP7331789B2 true JP7331789B2 (ja) | 2023-08-23 |
Family
ID=78827115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020109677A Active JP7331789B2 (ja) | 2020-06-25 | 2020-06-25 | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11959545B2 (ja) |
JP (1) | JP7331789B2 (ja) |
CN (1) | CN113847419B (ja) |
DE (1) | DE102021115776A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6744597B1 (ja) * | 2019-10-18 | 2020-08-19 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP7331789B2 (ja) | 2020-06-25 | 2023-08-23 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 |
JP7439680B2 (ja) * | 2020-07-28 | 2024-02-28 | トヨタ自動車株式会社 | 変速制御データの生成方法、変速制御装置、変速制御システム、および車両用学習装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6705545B1 (ja) | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6705540B1 (ja) | 2019-08-22 | 2020-06-03 | トヨタ自動車株式会社 | 車両用学習システム、車両用制御装置、および車両用学習装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5029086A (en) * | 1988-01-30 | 1991-07-02 | Mazda Motor Corporation | Apparatus and method for shift control of automatic transmission |
DE4405806A1 (de) | 1994-02-23 | 1995-08-24 | Zahnradfabrik Friedrichshafen | Verfahren zum Steuern eines automatischen Schaltgetriebes |
JP3414054B2 (ja) * | 1995-06-12 | 2003-06-09 | 日産自動車株式会社 | 流体作動式摩擦要素の締結制御装置 |
JP3277837B2 (ja) * | 1996-03-15 | 2002-04-22 | トヨタ自動車株式会社 | 変速機の制御装置 |
JPH10254505A (ja) | 1997-03-14 | 1998-09-25 | Toyota Motor Corp | 自動制御装置 |
JP3385523B2 (ja) | 1997-08-13 | 2003-03-10 | アイシン・エィ・ダブリュ株式会社 | 自動変速機の油圧制御装置 |
JP2000250602A (ja) | 1999-03-02 | 2000-09-14 | Yamaha Motor Co Ltd | 総合特性最適化装置 |
EP1033637A3 (en) | 1999-03-02 | 2001-05-02 | Yamaha Hatsudoki Kabushiki Kaisha | Method and apparatus for optimizing overall characteristic of device, using heuristic method |
JP2000346188A (ja) * | 1999-06-08 | 2000-12-12 | Mazda Motor Corp | 自動変速機の変速制御装置 |
KR100378815B1 (ko) | 2000-11-28 | 2003-04-07 | 엘지전자 주식회사 | 리니어 컴프레샤의 스트로크 떨림 검출장치 및 방법 |
JP2003269590A (ja) * | 2002-03-13 | 2003-09-25 | Daihatsu Motor Co Ltd | 自動変速機の変速制御方法 |
JP2006125434A (ja) * | 2004-10-26 | 2006-05-18 | Mazda Motor Corp | 自動変速機の制御装置 |
JP2006189087A (ja) * | 2005-01-06 | 2006-07-20 | Suzuki Motor Corp | 自動変速機の変速制御装置 |
JP2007064464A (ja) | 2005-09-02 | 2007-03-15 | Toyota Motor Corp | 車両用自動変速機の変速制御装置 |
JP4555219B2 (ja) * | 2005-12-20 | 2010-09-29 | ヤマハ発動機株式会社 | 航走制御装置およびそれを備えた船舶 |
JP4670651B2 (ja) | 2006-01-16 | 2011-04-13 | アイシン・エィ・ダブリュ株式会社 | 自動変速機の変速制御装置 |
JP4735457B2 (ja) | 2006-07-18 | 2011-07-27 | トヨタ自動車株式会社 | 自動変速機の制御装置 |
CN103180191B (zh) | 2010-10-27 | 2015-02-25 | 丰田自动车株式会社 | 车辆用动力传递装置的控制装置 |
JP6196857B2 (ja) * | 2013-09-13 | 2017-09-13 | ジヤトコ株式会社 | 車両の制御装置 |
JP6744597B1 (ja) * | 2019-10-18 | 2020-08-19 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6809587B1 (ja) * | 2019-10-18 | 2021-01-06 | トヨタ自動車株式会社 | 車両用制御装置 |
US11603111B2 (en) * | 2019-10-18 | 2023-03-14 | Toyota Jidosha Kabushiki Kaisha | Vehicle controller, vehicle control system, and learning device for vehicle |
JP6705547B1 (ja) | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、および車両用学習装置 |
JP7136073B2 (ja) * | 2019-12-20 | 2022-09-13 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP7331789B2 (ja) | 2020-06-25 | 2023-08-23 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 |
JP2022007027A (ja) * | 2020-06-25 | 2022-01-13 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、および車両用学習装置 |
JP7251529B2 (ja) * | 2020-07-17 | 2023-04-04 | トヨタ自動車株式会社 | 自動変速機の油圧の学習方法、自動変速機の制御装置、自動変速機の制御システム、車両用制御装置および車両用学習装置 |
JP7439680B2 (ja) * | 2020-07-28 | 2024-02-28 | トヨタ自動車株式会社 | 変速制御データの生成方法、変速制御装置、変速制御システム、および車両用学習装置 |
-
2020
- 2020-06-25 JP JP2020109677A patent/JP7331789B2/ja active Active
-
2021
- 2021-05-25 US US17/329,644 patent/US11959545B2/en active Active
- 2021-05-26 CN CN202110574795.7A patent/CN113847419B/zh active Active
- 2021-06-18 DE DE102021115776.5A patent/DE102021115776A1/de active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6705540B1 (ja) | 2019-08-22 | 2020-06-03 | トヨタ自動車株式会社 | 車両用学習システム、車両用制御装置、および車両用学習装置 |
JP6705545B1 (ja) | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
Also Published As
Publication number | Publication date |
---|---|
US11959545B2 (en) | 2024-04-16 |
US20210403000A1 (en) | 2021-12-30 |
CN113847419A (zh) | 2021-12-28 |
DE102021115776A1 (de) | 2021-12-30 |
CN113847419B (zh) | 2022-12-16 |
JP2022007029A (ja) | 2022-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7331789B2 (ja) | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 | |
JP2022007027A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7439680B2 (ja) | 変速制御データの生成方法、変速制御装置、変速制御システム、および車両用学習装置 | |
CN108216184B (zh) | 混合动力车辆以及控制模式转变的方法 | |
US9324029B2 (en) | Method of determining a driving tendency, and controlling shift according to fuzzy rules | |
JP7136073B2 (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
CN113006951B (zh) | 车辆用控制数据的生成方法、车辆用控制装置、车辆用控制系统以及车辆用学习装置 | |
JP2021067201A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7251529B2 (ja) | 自動変速機の油圧の学習方法、自動変速機の制御装置、自動変速機の制御システム、車両用制御装置および車両用学習装置 | |
JP2010530046A (ja) | 自動段階トランスミッションの制御方法 | |
CN108454609B (zh) | 用于运行车辆的混合动力系统的方法 | |
JP2021154816A (ja) | 異音の発生箇所特定方法、アプリケーションプログラム、および車載装置 | |
JP7310699B2 (ja) | オイル状態推定装置、車両用制御装置、車両用制御システム、およびデータ解析装置 | |
US7158868B2 (en) | Method and device for consistent bidirectional analysis of engine characteristics map data | |
TW202128467A (zh) | 控制車輛的方法、車輛控制器、和伺服器 | |
CN115298529A (zh) | 被测体自动驾驶装置、被测体测试系统、指令车速生成程序及被测体自动驾驶方法 | |
CN114060491B (zh) | 油压计算装置 | |
JP2023030982A (ja) | 車載装置の異常箇所特定システム、および車載装置の異常箇所特定装置 | |
Wright | CISBAS: AN ALTERNATIVE APPROACH TO THE CONTROL OF IVT-EQUIPPED VEHICLES |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230724 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7331789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |