JP5232120B2 - Control device for moving body - Google Patents
Control device for moving body Download PDFInfo
- Publication number
- JP5232120B2 JP5232120B2 JP2009229712A JP2009229712A JP5232120B2 JP 5232120 B2 JP5232120 B2 JP 5232120B2 JP 2009229712 A JP2009229712 A JP 2009229712A JP 2009229712 A JP2009229712 A JP 2009229712A JP 5232120 B2 JP5232120 B2 JP 5232120B2
- Authority
- JP
- Japan
- Prior art keywords
- gait
- target
- posture
- determined
- reaction force
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Manipulator (AREA)
Description
本発明は、脚式移動ロボット等の移動体の制御装置に関する。 The present invention relates to a control device for a moving body such as a legged mobile robot.
基体と、基体を床面上で移動させる移動機構とを備えた移動体としては、例えば脚式移動ロボットが一般に知られている。該脚式移動ロボットでは、その脚体が上記移動機構、上体が上記基体に相当する。 For example, a legged mobile robot is generally known as a moving body including a base and a moving mechanism that moves the base on the floor surface. In the legged mobile robot, the leg corresponds to the moving mechanism, and the upper body corresponds to the base.
そして、例えば、脚式移動ロボットにおいては、該ロボットの姿勢の安定性を高める技術として、特許文献1等に開示されている技術が本願出願人により先に提案されている。この技術では、ロボットの上体の実際の姿勢の目標姿勢に対する状態量偏差を観測し、該状態量偏差を“0”に収束させるために要求されるフィードバック要求操作量(制御入力)として、ロボットに付加的に作用させる操作モーメント(目標ZMPまわりの操作モーメント)が、該状態量偏差の観測値からPD則(比例・微分則)により算出される。さらに、この操作モーメントは、実際のロボットに直接的に作用させる実ロボット側操作モーメントと、ロボットの目標歩容を生成するための動力学モデルにおいてロボットに作用させるモデル側操作モーメントとに分配される。そして、実際のロボットにおいては、目標ZMPまわりに実ロボット側操作モーメントを発生させるように、コンプラインス動作制御によって実際のロボットの両脚の足平の位置・姿勢が目標歩容における足平の位置・姿勢から修正される。また、動力学モデルにおいては、目標ZMPまわりにモデル側操作モーメントを発生させるように、ロボットの目標歩容が生成される。
For example, in a legged mobile robot, a technique disclosed in
これにより、外乱等によって、ロボットの上体の実際の姿勢が、目標姿勢に対してずれが生じた場合に、そのずれを解消する床反力モーメントを、ロボットに作用させるようにしている。 Thus, when the actual posture of the upper body of the robot deviates from the target posture due to disturbance or the like, a floor reaction force moment that cancels the deviation is applied to the robot.
ところで、特許文献1に見られるように前記状態量偏差を“0”に収束させるための要求操作量(操作モーメント)をPD則により決定する技術では、状態量偏差の観測値に掛かるゲイン係数と、該状態量偏差の観測値の時間的変化率(微分値)にかかるゲイン係数とは、通常、あらかじめ定められた固定値に設定される。
By the way, in the technique for determining the required operation amount (operation moment) for converging the state quantity deviation to “0” by the PD rule as seen in
この場合、本願発明者の知見によれば、ロボットの上体の高さ(鉛直方向の位置)がほぼ一定に保たれるような歩容(例えば歩行歩容)でロボットを移動させる場合には、前記の如くPD則により決定される操作モーメントを用いて、ロボットの上体の姿勢を円滑に、目標姿勢に復元させることができる。 In this case, according to the knowledge of the inventor of the present application, when the robot is moved in a gait (for example, a walking gait) that keeps the height of the upper body of the robot (position in the vertical direction) substantially constant. Using the operation moment determined by the PD rule as described above, the posture of the upper body of the robot can be smoothly restored to the target posture.
しかるに、ロボットの走行を行う場合等のように、上体の上下動運動を伴う歩容である場合には、前記の如くゲイン係数を固定値としたPD則により決定される操作モーメントによってロボットの上体の姿勢をフィードバック制御した場合に、上体の上下動運動によって、該上体(ひいてはロボット)に生じる慣性力が変化することの影響で、ロボットの上体の実際の姿勢が目標姿勢に対して、オーバーシュートやアンダーシュートを発生する場合が多々あることが判明した。 However, in the case of a gait accompanied by a vertical motion of the upper body, such as when the robot is running, the robot's operating moment is determined by the operation moment determined by the PD rule with a fixed gain coefficient as described above. When feedback control is performed on the posture of the upper body, the actual posture of the upper body of the robot becomes the target posture due to the influence of the inertial force generated on the upper body (and thus the robot) due to the vertical motion of the upper body. On the other hand, it has been found that there are many cases where overshoot and undershoot occur.
そこで、本願発明は、脚式移動ロボットの如き移動体を、その基体の上下動運動を行いながら移動させる場合に、オーバーシュートやアンダーシュートの発生を抑制しつつ、基体の目標姿勢に対する実際の姿勢のずれを円滑に解消することができるような要求操作量を決定し、該要求操作量に応じて基体の姿勢の上記ずれを円滑に解消することができる移動体の制御装置を提供することを目的とする。 Therefore, the present invention provides an actual posture with respect to the target posture of the base body while suppressing the occurrence of overshoot and undershoot when moving a moving body such as a legged mobile robot while moving the base body up and down. To provide a control device for a moving body that can determine a required operation amount that can smoothly eliminate the deviation of the movement, and can smoothly eliminate the deviation of the posture of the base according to the requested operation amount. Objective.
本発明の移動体の制御装置の第1の態様は、基体と、基体を床面上で移動させる移動機構とを備えた移動体を、該基体の上下動運動を行いながら移動させるように制御する制御装置であって、
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を満足するように、少なくとも上下方向慣性力パラメータを用いて前記移動体の目標運動の時系列を決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“0”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を逐次決定する要求操作量決定手段とを備え、
前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なう手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、該決定する要求操作量が、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻での目標慣性力の瞬時値と前記状態量偏差の観測値とに応じて変化する慣性力依存性操作量成分と、該目標慣性力に依存せずに前記状態量偏差の観測値に応じて変化する慣性力非依存性操作量成分とを合成してなる値となるように、前記上下方向慣性力パラメータと前記状態量偏差の観測値とを用いて前記要求操作量を決定することを特徴とする(第1発明)。
According to a first aspect of the mobile body control device of the present invention, a mobile body including a base and a moving mechanism for moving the base on the floor is controlled so as to move while performing the vertical movement of the base. A control device for
Vertical inertial force parameter determining means for determining a vertical inertial force parameter that is a parameter that defines a time series of the target inertial force in the vertical direction of the movable body or the base;
Target motion determining means for determining the time series of the target motion of the moving body using at least the vertical inertia force parameter so as to satisfy the time series of the target inertia force defined by the determined vertical inertia force parameter. When,
Operation control means for performing operation control of the moving body according to at least the determined target motion;
State quantity deviation observing means for sequentially observing a state quantity deviation representing the degree of deviation of the actual posture of the base body from the target posture of the base body in the determined target motion;
A required operation amount determining means for sequentially determining a required operation amount that defines an additional external force to be additionally applied to the moving body in order to converge the state quantity deviation to “0”;
The operation control means operates the mobile body so that an additional external force defined by the required operation amount is additionally applied to the mobile body while causing the actual motion of the mobile body to follow the target motion. A means of controlling,
The requested operation amount determining means is configured such that, at each time when the requested operation amount is determined, the requested operation amount to be determined is a current time in a time series of target inertia force defined by the vertical inertia force parameter. An inertial force-dependent manipulated variable component that changes according to the instantaneous value of the target inertial force and the observed value of the state quantity deviation, and changes according to the observed value of the state quantity deviation without depending on the target inertial force The requested manipulated variable is determined using the vertical inertial force parameter and the observed value of the state quantity deviation so as to be a value obtained by combining an inertial force-independent manipulated variable component. (First invention).
また、本発明の移動体の制御装置の第2の態様は、基体と、基体を床面上で移動させる移動機構とを備えた移動体を、該基体の上下動運動を行いながら移動させるように制御する制御装置であって、
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
少なくとも、前記移動体の動力学を表現するものとしてあらかじめ設定された動力学モデルと、前記決定された上下方向慣性力パラメータと、前記動力学モデル上での移動体に作用させる目標外力の時系列とを用いて前記移動体の目標運動の時系列を決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“0”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を逐次決定する要求操作量決定手段とを備え、
前記目標運動決定手段は、前記決定された要求操作量に応じて前記動力学モデル上で前記目標外力に付加すべきモデル操作外力を決定し、その決定したモデル操作外力を前記目標外力に付加してなる外力を前記動力学モデル上での移動体に作用させつつ、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を前記動力学モデル上で満足するように前記目標運動を決定する手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、該決定する要求操作量が、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻での目標慣性力の瞬時値と前記状態量偏差の観測値とに応じて変化する慣性力依存性操作量成分と、該目標慣性力に依存せずに前記状態量偏差の観測値に応じて変化する慣性力非依存性操作量成分とを合成してなる値となるように、前記上下方向慣性力パラメータと前記状態量偏差の観測値とを用いて前記要求操作量を決定することを特徴とする(第2発明)。
According to a second aspect of the control device for a moving body of the present invention, a moving body including a base and a moving mechanism for moving the base on the floor is moved while moving the base up and down. A control device for controlling
Vertical inertial force parameter determining means for determining a vertical inertial force parameter that is a parameter that defines a time series of the target inertial force in the vertical direction of the movable body or the base;
A time series of at least a dynamic model preset as representing dynamics of the moving body, the determined vertical inertia force parameter, and a target external force to be applied to the moving body on the dynamic model A target motion determining means for determining a time series of the target motion of the moving body using
Operation control means for performing operation control of the moving body according to at least the determined target motion;
State quantity deviation observing means for sequentially observing a state quantity deviation representing the degree of deviation of the actual posture of the base body from the target posture of the base body in the determined target motion;
A required operation amount determining means for sequentially determining a required operation amount that defines an additional external force to be additionally applied to the moving body in order to converge the state quantity deviation to “0”;
The target motion determining means determines a model operation external force to be added to the target external force on the dynamic model according to the determined required operation amount, and adds the determined model operation external force to the target external force. The target force is applied to the moving body on the dynamic model while satisfying the target inertia force time series defined by the determined vertical inertia force parameter on the dynamic model. A means of determining exercise,
The requested operation amount determining means is configured such that, at each time when the requested operation amount is determined, the requested operation amount to be determined is a current time in a time series of target inertia force defined by the vertical inertia force parameter. An inertial force-dependent manipulated variable component that changes according to the instantaneous value of the target inertial force and the observed value of the state quantity deviation, and changes according to the observed value of the state quantity deviation without depending on the target inertial force The requested manipulated variable is determined using the vertical inertial force parameter and the observed value of the state quantity deviation so as to be a value obtained by combining an inertial force-independent manipulated variable component. (Second invention).
なお、本明細書では、「床」は、通常的な意味での床(屋内の床など)だけを意味するものではなく、屋外の地面もしくは路面をも含むものとして使用する。 In the present specification, “floor” does not mean a floor in a normal sense (such as an indoor floor) but also includes an outdoor ground or road surface.
上記第1発明及び第2発明においては、前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、該決定する要求操作量が、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻での目標慣性力の瞬時値と前記状態量偏差の観測値とに応じて変化する慣性力依存性操作量成分と、該目標慣性力に依存せずに前記状態量偏差の観測値に応じて変化する慣性力非依存性操作量成分とを合成してなる値となるように、前記上下方向慣性力パラメータと前記状態量偏差の観測値とを用いて前記要求操作量を決定する。このため、要求操作量決定手段は、現在時刻での基体の上下動運動に伴う移動体又は基体の上下方向の慣性力の瞬時値が基体の姿勢に及ぼす影響を考慮した態様で、前記要求操作量を決定できる。換言すれば、移動体又は基体の上下方向の将来の実際の慣性力が、目標慣性力に一致すると仮定した場合に、該慣性力によらずに、前記状態量偏差を円滑に“0”に収束させることできるように(収束時のオーバーシュートやアンダーシュートの発生を抑制するように)、前記要求操作量を決定できる。 In the first and second aspects of the invention, the required manipulated variable determining means is a target inertia in which the determined requested manipulated variable is defined by the vertical inertia force parameter at each time when the requested manipulated variable is determined. An inertial force-dependent manipulated variable component that changes according to the instantaneous value of the target inertial force at the current time in the time series of the force and the observed value of the state quantity deviation, and without depending on the target inertial force, The vertical direction inertial force parameter and the observed value of the state quantity deviation are used to obtain a value obtained by synthesizing the inertial force-independent manipulated variable component that changes according to the observed value of the state quantity deviation. Determine the requested operation amount. For this reason, the requested operation amount determining means is configured to take into account the influence of the instantaneous value of the inertial force in the vertical direction of the moving body or the substrate accompanying the vertical movement of the substrate at the current time on the posture of the substrate. The amount can be determined. In other words, when it is assumed that the actual inertial force in the vertical direction of the moving body or the base body matches the target inertial force, the state quantity deviation is smoothly set to “0” regardless of the inertial force. The required operation amount can be determined so as to be converged (so as to suppress the occurrence of overshoot and undershoot during convergence).
従って、第1発明及び第2発明によれば、オーバーシュートやアンダーシュートの発生を抑制しつつ基体の実際の姿勢の目標姿勢に対するずれを円滑に解消することができるような要求操作量を決定できる。 Therefore, according to the first and second inventions, it is possible to determine the required operation amount that can smoothly eliminate the deviation of the actual posture of the base body from the target posture while suppressing the occurrence of overshoot and undershoot. .
そして、第1発明では、このように決定された要求操作量が、前記動作制御手段に与えられる。このとき、該動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なう。すなわち、前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように前記移動体のアクチュエータを駆動する。これにより、実際の移動体に、状態量偏差を“0”に近づけるような外力を付加的に作用させ、基体の目標姿勢に対する実姿勢(実際の姿勢)のずれを円滑に解消することができる。 In the first aspect of the invention, the requested operation amount determined in this way is given to the operation control means. At this time, the movement control means causes the additional external force defined by the required operation amount to act on the moving body in addition to causing the actual movement of the moving body to follow the target movement. Perform body movement control. That is, the motion control means causes the mobile body to additionally act on the mobile body with an additional external force defined by the requested operation amount while causing the actual motion of the mobile body to follow the target motion. Drive the actuator. Thereby, an external force that causes the state quantity deviation to approach “0” is additionally applied to the actual moving body, and the deviation of the actual posture (actual posture) from the target posture of the base body can be smoothly eliminated. .
また、第2発明では、上記のように決定された要求操作量が、前記目標運動決定手段に与えられる。このとき、前記目標運動決定手段は、前記決定された要求操作量に応じて前記動力学モデル上で前記目標外力に付加すべきモデル操作外力を決定し、その決定したモデル操作外力を前記目標外力に付加してなる外力を前記動力学モデル上での移動体に作用させつつ、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を前記動力学モデル上で満足するように前記目標運動を決定する。そして、前記動作制御手段は、少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう。すなわち、前記決定された目標運動に移動体の実際の運動を追従させるように該移動体のアクチュエータを駆動する。これにより、移動体に、状態量偏差を“0”に近づけるような外力を付加的に作用させ、基体の目標姿勢に対する実姿勢(実際の姿勢)のずれを円滑に解消することができる。 In the second invention, the requested operation amount determined as described above is given to the target motion determining means. At this time, the target motion determining means determines a model operation external force to be added to the target external force on the dynamic model according to the determined required operation amount, and uses the determined model operation external force as the target external force. The time series of the target inertia force defined by the determined vertical inertia force parameter is satisfied on the dynamic model while the external force added to is applied to the moving body on the dynamic model. The target motion is determined. The motion control means controls the motion of the moving body according to at least the determined target motion. That is, the actuator of the moving body is driven so that the actual movement of the moving body follows the determined target movement. Thereby, an external force that causes the state quantity deviation to approach “0” is additionally applied to the moving body, and the deviation of the actual posture (actual posture) from the target posture of the base can be smoothly eliminated.
なお、第1発明及び第2発明では、前記状態量偏差としては、例えば、基体の目標姿勢と実姿勢との角度差、あるいは、この角度差に所定値を乗じた値、あるいは、目標運動における基体の重心点の位置と、実際の基体の重心点の位置との水平方向の偏差などが挙げられる。 In the first and second inventions, the state quantity deviation is, for example, an angle difference between the target posture of the base body and the actual posture, a value obtained by multiplying the angle difference by a predetermined value, or a target motion. For example, the horizontal deviation between the position of the center of gravity of the base and the position of the center of gravity of the actual base may be mentioned.
また、第1発明及び第2発明における「上下方向」は、基本的には、鉛直方向(重力方向)でよいが、厳密な意味での鉛直方向でなくてもよい。例えば、床面が水平方向に対して若干傾斜した傾斜面である場合には、その床面に垂直な方向を「上下方向」とみなしてもよい。 In addition, the “vertical direction” in the first and second inventions may be basically the vertical direction (gravity direction), but may not be the vertical direction in a strict sense. For example, when the floor surface is an inclined surface slightly inclined with respect to the horizontal direction, the direction perpendicular to the floor surface may be regarded as the “vertical direction”.
また、第1発明及び第2発明における前記要求操作量としては、例えば移動体に作用させる付加的外力(床反力、床反力モーメント等の並進力や力のモーメント)の目標値、外力の作用点の目標値もしくはその目標値の補正量等を用いることができる。 In addition, as the required operation amount in the first and second inventions, for example, a target value of an external force (translational force or force moment such as floor reaction force or floor reaction force moment) applied to the moving body, the external force The target value of the action point or the correction amount of the target value can be used.
また、第2発明におけるモデル操作外力の一例としては、例えば、前記要求操作量により規定される付加的外力の符号を反転させた外力が用いることができる。 As an example of the model operation external force in the second invention, for example, an external force obtained by inverting the sign of the additional external force defined by the required operation amount can be used.
また、前記要求操作量を前記動作制御手段と目標運動決定手段との両方に分配してもよい。この場合、例えば、前記第2発明において、前記目標運動決定手段は、前記決定された要求操作量を、前記モデル操作外力と、前記移動体に実際に付加的に作用させるべき実移動体操作外力とに分配する分配手段を備え、前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記実移動体操作外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なうようにする(第3発明)。 Further, the requested operation amount may be distributed to both the motion control means and the target motion determination means. In this case, for example, in the second aspect of the invention, the target motion determining means may use the determined requested operation amount to cause the model operating external force and the actual moving body operating external force to actually act on the moving body. The movement control means is configured to cause the actual moving body operating external force to additionally act on the moving body while causing the actual movement of the moving body to follow the target movement. Operation control of the moving body is performed (third invention).
この第3発明によれば、目標運動決定手段と動作制御手段とが協働して、状態量偏差を“0”に収束させるように機能することとなる。 According to the third aspect of the invention, the target motion determination unit and the operation control unit cooperate to function so as to converge the state quantity deviation to “0”.
なお、第3発明では、モデル操作外力と実移動体操作外力との差が、前記要求操作量に対して単調に変化するように、モデル操作外力と実移動体操作外力とを決定することが望ましい。このようにするためには、例えば、実移動体操作外力からモデル操作外力を差し引いたものが、要求操作量により規定される付加的外力に一致するようにすることが一例として挙げられる。 In the third invention, the model operating external force and the actual moving body operating external force may be determined so that the difference between the model operating external force and the actual moving body operating external force changes monotonously with respect to the requested operation amount. desirable. In order to do this, for example, a value obtained by subtracting the model operation external force from the actual moving body operation external force matches the additional external force defined by the required operation amount.
上記第1〜第3発明では、より具体的には、前記要求操作量決定手段が決定する前記要求操作量としては、例えば、前記状態量偏差の観測値にあらかじめ設定された所定値の第1係数を乗じてなる値を少なくとも含む前記慣性力非依存性操作量成分と、現在時刻における前記目標慣性力の瞬時値の関数値である第2係数を前記状態量偏差の観測値に乗じてなる値を少なくとも含む前記慣性力依存性操作量成分とを加え合わせてなる値を採用することができる(第4発明)。 In the first to third aspects of the invention, more specifically, the requested operation amount determined by the requested operation amount determining means is, for example, a first value of a predetermined value set in advance to the observed value of the state quantity deviation. The inertial force-independent manipulated variable component including at least a value obtained by multiplying a coefficient and the second coefficient that is a function value of the instantaneous value of the target inertial force at the current time is multiplied by the observed value of the state quantity deviation. A value obtained by adding the inertial force-dependent manipulated variable component including at least the value can be employed (fourth invention).
かかる第4発明によれば、前記移動体又は前記基体の上下方向の慣性力が前記基体の姿勢に及ぼす影響を適切に補償しつつ、前記状態量偏差を“0”に収束させ得る前記要求操作量を簡易な演算により決定することが可能となる。 According to the fourth aspect of the invention, the required operation capable of converging the state quantity deviation to “0” while appropriately compensating for the influence of the vertical inertial force of the moving body or the base on the posture of the base. The amount can be determined by simple calculation.
この第4発明では、前記慣性力依存性操作量成分は、前記状態量偏差の観測値にあらかじめ設定された所定値の第1係数を乗じてなる値と、前記状態量偏差の観測値の時間的変化率にあらかじめ設定された所定値の第3係数を乗じてなる値とから構成され、前記慣性力非依存性操作量成分は、第2係数を前記状態量偏差の観測値に乗じてなる値から構成されることが好適である(第5発明)。 In the fourth aspect of the invention, the inertial force dependent manipulated variable component includes a value obtained by multiplying the observed value of the state quantity deviation by a first coefficient of a predetermined value set in advance, and a time of the observed value of the state quantity deviation. The inertial force-independent manipulated variable component is obtained by multiplying the observed value of the state quantity deviation by the inertial force-independent manipulated variable component. It is preferable to be composed of values (fifth invention).
この第5発明によれば、前記慣性力非依存性操作量成分は、比例・微分則(PD則)によって状態量偏差を“0”に収束させるように機能する操作量成分となるので、該状態量偏差の制御の応答性を高めることができる。また、前記状態量偏差が“0”に収束した状態では、前記慣性力依存性操作量成分が“0”になるので、該慣性力依存性操作量成分が、状態量偏差を“0”からずらしてしまうように機能してしまうようなことを防止することができる。 According to the fifth aspect of the invention, the inertial force-independent manipulated variable component is an manipulated variable component that functions to converge the state variable deviation to “0” by the proportional / derivative law (PD law). Responsiveness of control of state quantity deviation can be improved. Further, when the state quantity deviation converges to “0”, the inertial force dependent manipulated variable component becomes “0”, so that the inertial force dependent manipulated variable component reduces the state quantity deviation from “0”. It is possible to prevent the function from being shifted.
上記第4発明又は第5発明では、前記要求操作量は、結果的に、前記慣性力非依存性操作量成分と慣性力依存性操作量成分とが加え合わされた値となっていればよく、該要求操作量を決定するための処理で、慣性力非依存性操作量成分と慣性力依存性操作量成分とを分離して扱う必要はない。例えば、前記要求操作量決定手段が前記要求操作量を決定するために実行する処理は、前記第1係数と前記第2係数とを加え合わせてなる合成係数を、前記状態量偏差の観測値に乗じる処理を含むようにしてもよい(第6発明)。 In the fourth invention or the fifth invention, the required operation amount may be a value obtained by adding the inertial force-independent operation amount component and the inertial force-dependent operation amount component as a result, In the process for determining the required manipulated variable, it is not necessary to treat the inertial force-independent manipulated variable component and the inertial force dependent manipulated variable component separately. For example, the process executed by the requested operation amount determination means to determine the requested operation amount is a combination coefficient obtained by adding the first coefficient and the second coefficient to the observed value of the state quantity deviation. You may make it include the process which multiplies (6th invention).
このようにした場合には、前記合成係数を前記状態量偏差の観測値に乗じてなる値は、結果的には、前記状態量偏差の観測値に前記第1係数を乗じてなる値と、該状態量偏差の観測値に前記第2係数を乗じてなる値とを加え合わせたものとなる。 In this case, the value obtained by multiplying the observed value of the state quantity deviation by the composite coefficient results in a value obtained by multiplying the observed value of the state quantity deviation by the first coefficient, A value obtained by multiplying the observed value of the state quantity deviation by the second coefficient is added.
なお、この第6発明を前記第5発明と組み合わせた場合には、前記合成係数を前記状態量偏差の観測値に乗じてなる値と、前記第3係数を前記状態量偏差の観測値の時間的変化率に乗じてなる値とを加え合わせることによって、前記要求操作量が決定されることとなる。 When the sixth aspect of the invention is combined with the fifth aspect of the invention, a value obtained by multiplying the observed value of the state quantity deviation by the composite coefficient, and a time of the observed value of the state quantity deviation by the third coefficient. The required operation amount is determined by adding the value obtained by multiplying the target change rate.
また、前記第4〜第6発明では、現在時刻における前記目標慣性力の瞬時値の関数値である第2係数としては、例えば、該目標慣性力の瞬時値に比例する値(該目標慣性力の瞬時値に所定値の比例定数を乗じてなる値)を採用することができる。 In the fourth to sixth aspects of the invention, the second coefficient that is a function value of the instantaneous value of the target inertial force at the current time is, for example, a value proportional to the instantaneous value of the target inertial force (the target inertial force The value obtained by multiplying the instantaneous value by a proportional constant of a predetermined value) can be employed.
また、前記第1〜6発明では、前記慣性力非依存性操作量成分は、前記目標慣性力が“0”に維持されていると仮定した場合に、前記状態量偏差を“0”に収束させるために必要な前記付加的外力を規定する操作量成分であり、前記慣性力依存性操作量成分は、現在時刻における前記目標慣性力の瞬時値に起因して発生する前記付加的外力を打ち消すために必要な操作量成分であることが好ましい(第7発明)。 In the first to sixth inventions, the inertial force-independent manipulated variable component converges the state quantity deviation to “0” when it is assumed that the target inertial force is maintained at “0”. An operation amount component that defines the additional external force necessary to cause the inertial force-dependent operation amount component to cancel the additional external force generated due to the instantaneous value of the target inertia force at the current time Therefore, it is preferable that the operation amount component is necessary for this purpose (seventh invention).
前記移動体又は前記基体の上下方向の慣性力が前記基体の姿勢に及ぼす影響を適切に補償しつつ、前記状態量偏差を“0”に収束させ得る前記要求操作量として、好適な操作量を決定できる。 As the required operation amount that can converge the state quantity deviation to “0” while appropriately compensating for the influence of the vertical inertial force of the movable body or the substrate on the posture of the substrate, a suitable operation amount is Can be determined.
以下、移動体として2足移動ロボットを例にとって、本発明の一実施形態を説明する。 Hereinafter, an embodiment of the present invention will be described taking a bipedal mobile robot as an example of the moving body.
図1に示す如く、本実施形態の2足移動ロボット1(以下、単にロボット1という)は、基体としての上体24と、この上体24を床面上で移動させる移動機構として該上体24と床との間に介在する左右一対の脚体(脚部リンク)2,2とを備える。
As shown in FIG. 1, a bipedal mobile robot 1 (hereinafter simply referred to as a robot 1) according to the present embodiment includes an
上体24は、両脚体2,2の基端部(上端部)に後述する腰関節(股関節)を介して連結されており、両脚体2,2のうちの接地した脚体によって床面の上方に支持される。
The
両脚体2,2は同一構造であり、それぞれ6個の関節を備える。その6個の関節は上体24側から順に、腰(股)の回旋用(上体24に対するヨー方向の回転用)の関節10R,10Lと、腰(股)のロール方向(X軸まわり)の回転用の関節12R,12Lと、腰(股)のピッチ方向(Y軸まわり)の回転用の関節14R,14Lと、膝部のピッチ方向の回転用の関節16R,16Lと、足首部のピッチ方向の回転用の関節18R,18Lと、足首部のロール方向の回転用の関節20R,20Lとから構成される。
Both
なお、本実施形態の説明では、符号R,Lはそれぞれ右側脚体、左側脚体に対応するものであることを意味する。また、X軸、Y軸、Z軸は、後述する支持脚座標系の3つの座標軸を意味する。この支持脚座標系のX軸方向、Y軸方向は、水平面上で互いに直交する2軸方向であり、X軸方向はロボット1の前後方向(ロール軸方向)、Y軸方向はロボット1の左右方向(ピッチ軸方向)に相当する。また、Z軸方向は鉛直方向(重力方向)であり、ロボット1の上下方向(ヨー軸方向)に相当する。この場合、本実施形態では、Z軸方向である鉛直方向が、本発明における上下方向としての意味を持つ。
In the description of this embodiment, the symbols R and L mean that they correspond to the right leg and the left leg, respectively. Further, the X axis, the Y axis, and the Z axis mean three coordinate axes of a support leg coordinate system to be described later. In this support leg coordinate system, the X-axis direction and the Y-axis direction are two axis directions orthogonal to each other on the horizontal plane, the X-axis direction is the front-rear direction (roll axis direction) of the
各脚体2の関節10R(L),12R(L),14R(L)によって3自由度の腰関節(股関節)が構成され、関節16R(L)によって1自由度の膝関節が構成され、関節18R(L),20R(L)によって2自由度の足首関節が構成されるている。
The
そして、腰関節(股関節)10R(L),12R(L),14R(L)と膝関節16R(L)とは大腿リンク32R(L)で連結され、膝関節16R(L)と足首関節18R(L),20R(L)とは下腿リンク34R(L)で連結されている。また、各脚体2の足首関節18R(L),20R(L)の下部に、各脚体2の先端部(下端部)を構成する足平22R(L)が取着されている。また、各脚体2の上端部(基端部)が、腰関節(股関節)10R(L),12R(L),14R(L)を介して上体24に連結されている。
The waist joints (hip joints) 10R (L), 12R (L), 14R (L) and the knee joint 16R (L) are connected by a
上記した各関節は、例えば本願出願人が特開平3−184782号などにて提案した公知の構造のものでよい。この場合、各関節を回転駆動するアクチュエータは、減速機を備える電動モータ42(図2参照)により構成される。 Each of the joints described above may have a known structure proposed by the applicant of the present invention in Japanese Patent Application Laid-Open No. 3-184787. In this case, the actuator that rotationally drives each joint is configured by an electric motor 42 (see FIG. 2) that includes a speed reducer.
各脚体2の上記構成により、各脚体2の足平22R(L)は、上体24に対して6自由度を有する。そして、ロボット1の移動に際して両脚体2,2を合わせて6*2=12個(この明細書で「*」はスカラに対する演算においては乗算を示し、ベクトルに対する演算においては外積を示す)の関節をそれぞれ適宜な角度に駆動することで、両足平22R,22Lの所望の運動を行なうことができる。これにより、ロボット1は歩行動作や走行動作等、3次元空間を移動する運動を行うことが可能となっている。
With the above-described configuration of each
この場合、両脚体2,2が基体としての上体24を床面上で移動させる移動機構として機能する。また、基体としての上体24は、腰関節(股関節)を介して、脚体2,2に対して相対運動を行い得るように該脚体2,2に支持されることとなる。さらに、両脚体2,2の各関節の駆動制御によって、床面に対する上体24の運動を制御することが可能である。その上体24の運動には、上体24の水平方向(又は床面に平行な方向)の運動に加えて、上下方向(鉛直方向や、床面に垂直な方向等)の運動や、上体24の姿勢を変化させる運動も含まれる。
In this case, both
なお、図示は省略するが、本実施形態では、上体24の上部の両側部には左右一対の腕体が取り付けられると共に、上体24の上端部には頭部が搭載される。そして、各腕体は、それに備える複数の関節(肩関節、肘関節、手首関節など)によって、該腕体を上体24に対して前後に振る等の運動を行なうことが可能となっている。ただし、これらの腕体および頭部は無くてもよい。
Although illustration is omitted, in the present embodiment, a pair of left and right arms are attached to both sides of the upper portion of the
上体24の内部にはロボット1の動作制御を行う制御ユニット26が格納されている。なお、図1では図示の便宜上、制御ユニット26を上体24の外部に記載している。
A
各脚体2の足首関節18R(L),20R(L)と足平22R(L)との間には6軸力センサ36が介装されている。この6軸力センサ36は、床から足平22R(L)を介して各脚体2に伝達される床反力の3軸方向の並進力成分及び3軸まわりのモーメント成分を検出し、その検出信号を制御ユニット26に出力する。
A six-
上体24には、鉛直方向(重力方向)に対する上体24の傾斜角(ロール方向及びピッチ方向の傾斜角)とその変化速度(角速度)とを計測するための傾斜センサ40が搭載されている。この傾斜センサ40は、より詳しくは、加速度センサとジャイロセンサ等のレートセンサ(角速度センサ)とから構成され、これらのセンサの検出信号を制御ユニット26に出力する。そして、制御ユニット26において、傾斜センサ40の出力を基に、公知の手法によって鉛直方向に対する上体24の傾斜角と角速度とが計測される。
The
また、各関節を回転駆動する電動モータ42(図2参照)には、各関節の回転角を検出するためのエンコーダ(ロータリエンコーダ)44(図2参照)が付設され、該エンコーダ44の検出信号が制御ユニット26に出力される。
In addition, an electric motor 42 (see FIG. 2) that rotationally drives each joint is provided with an encoder (rotary encoder) 44 (see FIG. 2) for detecting the rotation angle of each joint. Is output to the
図2を参照して、制御ユニット26はマイクロコンピュータを有する電子回路ユニットにより構成されており、CPUからなる第1演算装置50及び第2演算装置52、A/D変換器54、カウンタ56、D/A変換器58、RAM60、ROM62、並びにこれらの間のデータ授受を行なうバスライン64を備えている。
Referring to FIG. 2, the
この制御ユニット26では、前記6軸力センサ36及び傾斜センサ40の出力はA/D変換器54でデジタル値に変換された後、バスライン64を介してRAM60に入力される。また、ロボット1の各関節のエンコーダ(ロータリエンコーダ)44の出力はカウンタ56を介してRAM60に入力される。
In this
前記第1の演算装置50は、後述する目標歩容を生成すると共に、関節変位指令(各関節の回転角の目標値)を算出し、RAM60に送出する。また、第2の演算装置52はRAM60から関節変位指令と、前記エンコーダ44の出力からカウンタ56を介して計測された実関節変位(各関節の回転角の実測値)とを読み出し、該実関節変位を関節変位指令に追従させるために必要な各関節の電動モータ42の駆動指令(電動モータ42の出力トルクを規定する指令値)を算出する。
The first
そして、第2の演算装置52は、その算出した駆動指令をD/A変換器58を介して電動モータ42の駆動用のサーボアンプ46に出力する。このとき、サーボアンプ46は、入力された駆動指令に応じて電動モータ42を駆動する(電動モータ42に通電する)。これにより、各関節の実関節変位が関節変位指令に追従するように制御される。
Then, the second
次に、図3を参照して、本実施形態におけるロボット1の制御装置の動作の概要を説明する。図3中の「実ロボット」以外の部分が制御ユニット26が実行する処理(主として第1の演算装置60及び第2の演算装置62の処理)によって実現される機能である。
Next, an outline of the operation of the control device for the
なお、図3では、便宜上、ロボット1に搭載された前記の各センサの出力から制御ユニット26が認識する実測値(実関節変位など)が実ロボット1から出力されるものとして示している。また、以下の説明では、脚体2の左右を特に区別する必要がないときは、前記符号R,Lを省略する。
In FIG. 3, for the sake of convenience, actual values (actual joint displacement, etc.) recognized by the
制御ユニット26は、ロボット1の動作(歩容)の目標である目標歩容を生成して出力する歩容生成装置100を備える。この歩容生成装置100が生成して出力する目標歩容は、本実施形態では、上体24の目標位置及び目標姿勢の軌道である目標上体位置姿勢軌道と、各足平22の目標位置及び目標姿勢の軌道である目標足平位置姿勢軌道と、各腕体の目標姿勢の軌道である目標腕姿勢軌道と、ロボット1のZMP(Zero Morment Point)の目標位置の軌道である目標ZMP軌道と、ロボット1に作用する全床反力の目標の軌道である目標全床反力軌道とから構成される。なお、脚体2や腕体以外に、上体24に対して可動な部位を備える場合には、その可動部位の目標位置姿勢軌道が目標歩容に加えられる。
The
ここで、上記目標歩容における「軌道」は時間的変化のパターン(時系列パターン)を意味し、歩容生成装置100の制御周期(演算処理周期)毎に算出される瞬時値の時系列により構成される。以下の説明では、「軌道」の代わりに「パターン」と称することもある。また、以下の説明では、誤解を生じるおそれがない場合には、しばしば「目標」を省略する。
Here, the “trajectory” in the target gait means a temporal change pattern (time series pattern), and is based on a time series of instantaneous values calculated every control cycle (arithmetic processing cycle) of the
上体24の位置及び速度は、上体24のあらかじめ定めた代表点(例えば左右の股関節の間の中央点等)の位置及びその移動速度を意味する。同様に、各足平22の位置及び速度は、各足平22のあらかじめ定めた代表点の位置及びその移動速度を意味する。各足平22の代表点は、本実施形態では、各足平22の底面上の点、例えば、各脚体2の足首関節の中心から各足平22の底面への垂線が該底面と交わる点に設定される。
The position and speed of the
また、「姿勢」は空間的な向きを意味する。例えば上体姿勢は鉛直方向に対するロール方向(X軸まわり)の上体24の傾斜角(姿勢角)とピッチ方向(Y軸まわり)の上体24の傾斜角(姿勢角)とで表され、足平姿勢は各足平22に固定的に設定された2軸の空間的な方位角で表される。本明細書では、上体姿勢は上体姿勢角ということもある。なお、上体姿勢にヨー方向(Z軸まわり)の上体24の回転角を含めてもよい。
“Position” means a spatial orientation. For example, the body posture is represented by the inclination angle (posture angle) of the
また、歩容のうちの、床反力に係わる要素(目標ZMPおよび目標全床反力)以外の構成要素、すなわち足平位置姿勢、上体位置姿勢等、ロボット1の各部の運動に係わる歩容を総称的に「運動」という。
Further, in the gait, the elements other than the elements related to the floor reaction force (target ZMP and target total floor reaction force), that is, the steps related to the motion of each part of the
また、各足平22に作用する床反力(並進力及びモーメントからなる床反力)を「各足平床反力」と呼び、ロボット1の全て(2つ)の足平22R,22Lについての「各足平床反力」の合力を「全床反力」という。ただし、以下の説明においては、各足平床反力はほとんど言及しないので、特にことわらない限り、「床反力」は「全床反力」と同義として扱う。
In addition, the floor reaction force (the floor reaction force consisting of translational force and moment) acting on each
ZMPは、ロボット1の運動によって発生する慣性力とロボット1に作用する重力との合力がその点まわりに作用するモーメントの水平成分(水平軸まわりのモーメント成分)が零になる床面上の点を意味する。動力学的平衡条件を満足する歩容では、ZMPと床反力中心点とは一致する。この場合、目標ZMPを与えるということは、目標床反力中心点を与えるということと同じである。
ZMP is a point on the floor where the horizontal component (moment component around the horizontal axis) of the moment that the resultant force of the inertial force generated by the motion of the
目標床反力は、一般的には、作用点とその点に作用する並進力及びモーメントとにより表現される。作用点はどこに設定してもよいが、本実施形態では、目標ZMPを目標床反力の作用点とする。動力学的平衡条件を満足する歩容では、上記の如くZMPと床反力中心点とは一致するので、目標ZMPを作用点とする目標床反力のモーメント成分は、鉛直成分(Z軸まわりのモーメント成分)を除いて零になる。 The target floor reaction force is generally expressed by an action point and a translational force and a moment acting on the point. Although the action point may be set anywhere, in the present embodiment, the target ZMP is set as the action point of the desired floor reaction force. In a gait that satisfies the dynamic equilibrium condition, the ZMP and the floor reaction force center point coincide with each other as described above. Therefore, the moment component of the target floor reaction force with the target ZMP as the action point is the vertical component (around the Z axis). Except for the moment component).
歩容生成装置100により生成される目標歩容のうち、目標上体位置姿勢軌道と目標腕姿勢軌道とは、ロボット幾何学モデル(キネマティクス演算部)102に入力される。
Of the target gait generated by the
また、目標足平位置姿勢軌道、目標ZMP軌道(目標床反力中心点軌道)、および目標全床反力軌道(詳細には目標並進床反力鉛直成分軌道、目標並進床反力水平成分軌道、目標ZMPまわりの目標床反力モーメント軌道)は、複合コンプライアンス動作決定部104と目標床反力分配器106とに入力される。
Also, the desired foot position / posture trajectory, the desired ZMP trajectory (target floor reaction force center point trajectory), and the desired total floor reaction force trajectory (specifically, the desired translational floor reaction force vertical component trajectory, the desired translational floor reaction force horizontal component trajectory) , The target floor reaction force moment trajectory around the target ZMP) is input to the composite compliance
そして、目標床反力分配器106にて、目標床反力は各足平22R,22Lに分配され、目標各足平床反力中心点(各足平22R,22Lの床反力中心点の目標位置)と、目標各足平床反力(各足平22R,22Lの床反力中心点に作用させる目標床反力)とが決定される。この決定された目標各足平床反力中心点及び目標各足平床反力の軌道は複合コンプライアンス動作決定部104に入力される。なお、歩容生成装置100から出力する目標床反力は、複合コンプライアンス動作決定部104によるコンプライアンス制御に必要な成分だけを出力しても良い。例えば、目標並進床反力水平成分を歩容生成装置100から出力することを省略してもよい。
Then, the desired floor
複合コンプライアンス動作決定部104では、目標足平位置姿勢を修正してなる機構変形補償付き修正目標足平位置姿勢が求められ、この修正目標足平位置姿勢の軌道がロボット幾何学モデル102に入力される。
In the composite compliance
ロボット幾何学モデル102は、入力された目標上体位置姿勢と機構変形補償付き修正目標足平位置姿勢とを満足する両脚体2,2の各関節の関節変位指令を、ロボット1のキネマティクスモデル(剛体リンクモデル)に基づく逆キネマティクス演算によって算出し、その算出した関節変位指令を変位コントローラ108に出力する。さらに、ロボット幾何学モデル102は、目標腕姿勢を満足する各腕体の各関節の関節変位指令を算出し、その算出した関節変位指令を変位コントローラ108に出力する。
The robot
そして、変位コントローラ108は、ロボット幾何学モデル102で算出された関節変位指令を目標値として、ロボット1の両脚体2,2及び両腕体の各関節の回転角(実関節変位)を前記サーボアンプ46を介して追従制御する。より詳しくは、変位コントローラ108は、エンコーダ44の出力から計測される実関節変位(実測値)を関節変位指令に一致させるように、アクチュエータ駆動力としての電動モータ42の出力トルクを調整する。
Then, the
上記のような追従制御によるロボット1の実際の運動によって該ロボット1の各足平22に実際に作用する床反力である実各足平床反力が前記6軸力センサ36の出力から計測され、その実各足平床反力の実測値が前記複合コンプライアンス動作決定部104に入力される。
The actual foot floor reaction force, which is the floor reaction force actually acting on each
また、ロボット1の上体24の実際の姿勢角(鉛直方向に対する傾斜角)である実上体姿勢角が前記傾斜センサ40の出力から計測され、その実上体姿勢角の実測値が姿勢安定化制御演算部112に入力される。さらに、姿勢安定化制御演算部112には、歩容生成装置100が生成する目標上体位置姿勢のうちの目標上体姿勢角(鉛直方向に対する上体24の姿勢角の目標値)や目標全床反力のうちの目標床反力鉛直成分も入力される。目標上体姿勢角は、本実施形態では一定値(固定値)であり、例えば、ロボット1の上体24の体幹軸が鉛直方向を向く姿勢での該上体24の姿勢角(=0)である。このように目標上体姿勢角が一定値(固定値)である場合には、姿勢安定化制御演算部112に目標上体姿勢角を入力することを省略してもよい。
The actual body posture angle, which is the actual posture angle (tilt angle with respect to the vertical direction) of the
そして、姿勢安定化制御演算部112は、入力される実上体姿勢角(実測値)と目標上体姿勢角との偏差である上体姿勢角偏差Δθを、これに所定値を乗じてなる後述の位置偏差ΔXに変換する。本実施形態では、この位置偏差ΔXが本発明における状態量偏差に相当するものである。
The posture stabilization
さらに、姿勢安定化制御演算部112は、この位置偏差ΔXを“0”に収束させるための要求操作量として、目標ZMPまわりでロボット1に付加的に作用させる床反力モーメントの要求値である補償全床反力モーメントMdmdを、算出した位置偏差ΔXや入力された目標床反力鉛直成分等を用いて算出する。この補償全床反力モーメントMdmdは、より詳しくは、ロール方向(X軸まわり)の成分Mdmdxと、ピッチ方向(Y軸まわり)の成分Mdmdyとからなる。Mdmdx,Mdmdyは、それぞれ、上体姿勢角偏差Δθのうちのロール方向(X軸まわり)の成分、ピッチ方向(Y軸まわり)の成分を“0”に収束させるために必要な、目標ZMPまわりの要求モーメント(詳しくは目標ZMPまわりの床反力モーメントの摂動分の要求値)を意味する。なお、この補償全床反力モーメントMdmdのより詳細な算出処理は後述する。
Further, the posture stabilization
本実施形態では、姿勢安定化制御演算部112の上記した処理によって、本発明における状態量偏差観測手段と、要求操作量決定手段とが実現される。この場合、補償全床反力モーメントMdmdが、状態量偏差としての上体姿勢角偏差Δθを“0”に収束させるためにロボット1に付加的に作用させるべき付加的外力(本実施形態では、目標ZMPまわりの床反力モーメントの摂動分)を規定する要求操作量としての意味を持つ。
In the present embodiment, the state quantity deviation observing means and the requested operation amount determining means in the present invention are realized by the above-described processing of the posture stabilization
姿勢安定化制御演算部112で決定された補償全床反力モーメントMdmdは、補償全床反力モーメント分配器110を介してコンプライアンス制御用目標床反力モーメントとモデル操作床反力モーメントとに分配される。
The compensated total floor reaction force moment Mdmd determined by the posture stabilization
コンプライアンス制御用目標床反力モーメントは、前記上体姿勢角偏差Δθを“0”に近づけるために、実ロボット1に付加的に作用させる目標ZMPまわりの摂動床反力モーメントである。モデル操作床反力モーメントは、コンプライアンス制御用目標床反力モーメントと同じ目的のために後述する歩容生成用の動力学モデルに付加的に発生させる目標ZMPまわりの摂動床反力モーメントである。モデル操作床反力モーメントは、言い換えると、歩容生成装置100により最終的に決定された目標歩容(歩容生成装置100が出力する目標歩容)の運動が目標ZMPまわりに発生する摂動床反力モーメントである。
The target floor reaction force moment for compliance control is a perturbed floor reaction force moment around the target ZMP that is additionally applied to the
これらの床反力モーメントは、ロール方向(X軸まわり)及びピッチ方向(Y軸まわり)の各成分毎に以下のように決定される。まず、モデル操作床反力モーメントが次式50により決定される。なお、式50におけるMdmdは、ロール方向(X軸まわり)及びピッチ方向(Y軸まわり)の各成分(Mdmdx又はMdmdy)を意味する。同様に、床反力モーメント許容範囲は、ロール方向(X軸まわり)及びピッチ方向(Y軸まわり)の各成分の床反力モーメントの許容範囲を意味する。この床反力モーメント許容範囲は、歩容生成装置100において後述するごとく決定されるものである。
These floor reaction force moments are determined as follows for each component in the roll direction (around the X axis) and the pitch direction (around the Y axis). First, the model operation floor reaction force moment is determined by the following
Mdmd>床反力モーメント許容範囲上限値である場合
モデル操作床反力モーメント=−(Mdmd−床反力モーメント許容範囲上限値)
Mdmd<床反力モーメント許容範囲下限値である場合
モデル操作床反力モーメント=−(Mdmd−床反力モーメント許容範囲下限値)
床反力モーメント許容範囲下限値≦Mdmd≦床反力モーメント許容範囲上限値である場合
モデル操作床反力モーメント=0
……式50
なお、上記式50では、補償全床反力モーメントMdmd(詳しくはMdmdx又はMdmdy)そのものを床反力モーメント許容範囲と比較しているが、本来は、上記式50で床反力モーメント許容範囲と比較すべき対象は、Mdmdを目標ZMPまわりの床反力モーメントの基準瞬時値に加えてなるモーメントである。該基準瞬時値は、前記上体姿勢角偏差Δθが定常的に“0”に維持されていると仮定した場合に歩容生成装置100が生成する目標全床反力のうちの目標ZMPまわりのモーメントである。
When Mdmd> Floor reaction force moment allowable range upper limit value Model operation floor reaction force moment =-(Mdmd-Floor reaction force moment allowable range upper limit value)
When Mdmd <floor reaction force moment allowable range lower limit value Model operation floor reaction force moment =-(Mdmd-floor reaction force moment allowable range lower limit value)
When floor reaction force moment allowable range lower limit value ≤ Mdmd ≤ floor reaction force moment allowable range upper limit value Model operation floor reaction force moment = 0
......
In the
この場合、本実施形態では、目標ZMPまわりのモーメントの基準瞬時値は、ロール方向(X軸まわり)及びピッチ方向(Y軸まわり)のいずれの成分についても、定常的に“0”である。従って、この基準瞬時値にMdmdを加えたものは、Mdmdに等しい。このため、上記式50では、Mdmd(詳しくはMdmdx又はMdmdy)を直接的に床反力モーメント許容範囲と比較するようにしている。
In this case, in the present embodiment, the reference instantaneous value of the moment around the target ZMP is constantly “0” for both components in the roll direction (around the X axis) and the pitch direction (around the Y axis). Therefore, the value obtained by adding Mdmd to this reference instantaneous value is equal to Mdmd. Therefore, in the
次に、コンプライアンス制御用目標床反力モーメントがロール方向(X軸まわり)及びピッチ方向(Y軸まわり)の各成分毎に次式52により決定される。なお、式50の場合と同様に、式52におけるMdmdは、ロール方向(X軸まわり)及びピッチ方向(Y軸まわり)の各成分(Mdmdx又はMdmdy)を意味する。
Next, the compliance control target floor reaction force moment is determined by the following
コンプライアンス制御用目標床反力モーメント
=Mdmd+モデル操作床反力モーメント ……式52
従って、コンプライアンス制御用目標床反力モーメントとモデル操作床反力モーメントとの差がMdmdに等しくなるようにそれらの床反力モーメントが決定される。
Target floor reaction force moment for compliance control = Mdmd + Model operation floor reaction force moment ......
Accordingly, the floor reaction force moments are determined so that the difference between the target floor reaction force moment for compliance control and the model operation floor reaction force moment becomes equal to Mdmd.
上記のような演算を行なう補償全床反力モーメント分配器110をブロック図で表すと、図4に示すようになる。この演算処理により、ロール方向(X軸まわり)及びピッチ方向(Y軸まわり)の各成分毎に、補償全床反力モーメントMdmd(Mdmdx又はMdmdy)が、床反力モーメント許容範囲内に収まっている場合には、Mdmdがそのままコンプライアンス制御用目標床反力モーメントとして決定されると共に、モデル操作床反力モーメントは“0”に決定される。
A block diagram of the compensating total floor reaction
また、ロール方向(X軸まわり)及びピッチ方向(Y軸まわり)の各成分毎に、補償全床反力モーメントMdmd(Mdmdx又はMdmdy)が、床反力モーメント許容範囲から逸脱している場合には、床反力モーメント許容範囲の上限値及び下限値のうちのMdmdに近い方の境界値が、コンプライアンス制御用目標床反力モーメントとして決定されると共に、床反力モーメント許容範囲からのMdmdの逸脱分(=Mdmd−床反力モーメント許容範囲の境界値)の符号を反転させてなるモーメントがモデル操作床反力モーメントとして決定される。 Also, when the compensation total floor reaction force moment Mdmd (Mdmdx or Mdmdy) deviates from the floor reaction force moment allowable range for each component in the roll direction (around X axis) and pitch direction (around Y axis) The boundary value closer to Mdmd of the upper and lower limits of the floor reaction force moment allowable range is determined as the target floor reaction force moment for compliance control, and Mdmd from the floor reaction force moment allowable range is determined. A moment obtained by inverting the sign of the deviation (= Mdmd−boundary value of the floor reaction force moment allowable range) is determined as the model operation floor reaction force moment.
補足すると、以上説明した補償全床反力モーメント分配器110の処理によって、本発明における分配手段が実現される。この場合、前記コンプライアンス制御用目標床反力モーメントが実ロボット1に付加的に作用させるべき付加的外力としての実移動体操作外力として機能し、モデル操作床反力モーメントが目標歩容を生成するために用いる動力学モデル上でロボット1に作用させるべきモデル操作外力として機能する。
Supplementally, the distribution means in the present invention is realized by the processing of the compensating total floor reaction
図3の説明に戻って、歩容生成装置100には上記の如く決定されたモデル操作床反力モーメントが入力される。そして、詳細は後述するが、歩容生成装置100は、該歩容生成装置100において決定される目標ZMPまわりの床反力モーメントの水平成分がモデル操作床反力モーメントとなるように動力学モデルを用いて目標歩容の運動(目標運動)を生成する。なお、歩容生成装置100から複合コンプライアンス動作決定部104に対して出力される目標全床反力は、目標ZMPまわりの床反力モーメントの水平成分が“0”になることを目標とするものとして出力される。
Returning to the description of FIG. 3, the model operation floor reaction force moment determined as described above is input to the
また、補償全床反力モーメント分配器110で上記の如く決定されたコンプライアンス制御用目標床反力モーメントは、複合コンプライアンス動作決定部104に入力される。そして、複合コンプライアンス動作決定部104は、歩容生成装置100が生成する目標歩容の運動にロボット1の運動を追従させつつ、目標ZMPまわりの実床反力モーメントがコンプライアンス制御用目標床反力モーメントに近づくように、目標足平位置姿勢を修正することにより、機構変形補償付き修正目標足平位置姿勢(軌道)を決定する。
Further, the target floor reaction force moment for compliance control determined as described above by the compensating total floor reaction
この場合、ロボット1の足平位置姿勢及び床反力の全ての状態を目標に一致させることは事実上不可能であるので、これらの間にトレードオフ関係を与えて妥協的になるべく一致させる。すなわち、複合コンプライアンス動作決定部104は、各目標に対する制御偏差に重みを与えて、制御偏差(あるいは制御偏差の2乗)の重み付き平均が最小になるように機構変形補償付き修正目標足平位置姿勢(軌道)を決定する。
In this case, since it is practically impossible to make all the foot position / posture and floor reaction force of the
換言すれば、目標ZMPまわりの実床反力モーメントと、ロボット1の実際の足平位置姿勢とがそれぞれコンプライアンス制御用目標床反力モーメント、目標足平位置姿勢にできるだけ近づくように機構変形補償付き修正目標足平位置姿勢(軌道)が決定される。そして、複合コンプライアンス動作決定部104は、この修正目標足平位置姿勢をロボット幾何学モデル102に足平位置姿勢の最終的な目標値として出力することで、ロボット1の動作を制御する。
In other words, mechanism deformation compensation is provided so that the actual floor reaction force moment around the target ZMP and the actual foot position / posture of the
本実施形態では、上記した複合コンプライアンス動作決定部104の処理によって、本発明における動作制御手段が実現される。すなわち、複合コンプライアンス動作決定部104は、ロボット1の実際の運動を目標歩容の運動に追従させつつ、コンプライアンス制御用目標床反力モーメントを付加的外力としてロボット1に付加的に作用させるように実際のロボット1の動作制御を行なう。
In the present embodiment, the operation control means in the present invention is realized by the processing of the composite compliance
なお、上記した複合コンプライアンス動作決定部104などの構成および動作は、本出願人が先に出願した特開平10−277969号公報などに詳細に記載されている。従って、複合コンプライアンス動作決定部104に関する本明細書での説明は以上に留める。
The configuration and operation of the above-described composite compliance
以上の如く、ロボット1の動作制御を行うことによって、目標歩容の運動は、ロボット1の動力学モデル上でモデル操作外力としてのモデル操作床反力モーメントが目標ZMPまわりに付加的に発生するように生成されつつ、実際のロボッ1の床反力には、モデル操作床反力モーメントが付加されないように制御される。したがって、差し引きモデル操作床反力モーメント分だけ、目標歩容の運動と床反力の不平衡(アンバランス)を生じる。このことは、前記上体姿勢角偏差Δθを0に収束させる効果に関して言えば、モデル操作床反力モーメントの符号を反転した床反力モーメントを実ロボット1に作用させることと等価である。
As described above, by controlling the operation of the
つまり、モデル操作床反力モーメントを適宜決定することにより、実ロボット1の上体24の実際の姿勢を目標姿勢に収束させ、ひいては、実ロボット1の全体の姿勢を安定化させることができる。
That is, by appropriately determining the model operation floor reaction force moment, the actual posture of the
この場合、モデル操作床反力モーメントの符号を反転したモーメントとコンプライアンス制御用目標床反力モーメントとの和が上体姿勢角偏差Δθを0に収束させるトータルの復元力(床反力モーメント)になる。すなわち、コンプライアンス制御用目標床反力モーメントとモデル操作床反力モーメントとの差がトータルの復元力になる。 In this case, the sum of the moment obtained by reversing the sign of the model operation floor reaction force moment and the target floor reaction force moment for compliance control is the total restoring force (floor reaction force moment) that converges the body posture angle deviation Δθ to zero. Become. That is, the difference between the target floor reaction force moment for compliance control and the model operation floor reaction force moment is the total restoring force.
なお、モデル操作床反力モーメントは、ZMP存在可能範囲を無視していかなる値でも取ることが可能であるので、非常に高い姿勢復元力を発生することができる。 Note that the model operation floor reaction force moment can take any value ignoring the ZMP existence possible range, so that a very high posture restoring force can be generated.
次に、図5に示す走行歩容を例にして、歩容生成装置100が生成する目標歩容の概要を説明する。
Next, the outline of the target gait generated by the
なお、以降の説明では、「床反力鉛直成分」、「床反力水平成分」は、それぞれ、特に断らない限り、「並進床反力鉛直成分」、「並進床反力水平成分」を意味するものとする。 In the following explanation, “floor reaction force vertical component” and “floor reaction force horizontal component” mean “translation floor reaction force vertical component” and “translation floor reaction force horizontal component”, respectively, unless otherwise specified. It shall be.
また、歩容における「両脚支持期」とは、ロボット1がその自重を両脚体2,2で支持する期間、「片脚支持期」とはいずれか一方のみの脚体2でロボット1の自重を支持する期間、「空中期」とは両脚体2,2が床から離れている(空中に浮いている)期間を言う。また、片脚支持期においてロボット1の自重を支持する側の脚体2を「支持脚」、自重を支持しない側の脚体2を「遊脚」と呼ぶ。本実施形態で主に説明する走行歩容では、両脚支持期は無く、片脚支持期(着地期)と空中期とが交互に繰り返される。この場合、空中期では両脚2,2とも、ロボット1の自重を支持しないこととなるが、該空中期の直前の片脚支持期において遊脚であった脚体2、支持脚であった脚体2をそれぞれ該空中期においても遊脚、支持脚と呼ぶ。
In addition, the “both leg support period” in the gait is a period in which the
まず、図5に示す走行歩容を説明すると、この走行歩容は、人間の通常的な走行歩容と同様の歩容である。この走行歩容では、ロボット1の左右いずれか一方のみの脚体2(支持脚)の足平22が着地(接地)する片脚支持期と、両脚体2,2が空中に浮く空中期とが交互に繰り返される。
First, the traveling gait shown in FIG. 5 will be described. This traveling gait is the same gait as a normal human traveling gait. In this running gait, there are a single leg support period in which the
図5中の丸付きの数字は、走行歩容の時系列的な順番を示している。この場合、図5の1番目の状態は片脚支持期の開始時(初期)の状態、2番目の状態は片脚支持期の中間時点の状態、3番目の状態は片脚支持期に続く空中期の開始時(片脚支持期の終了時)の状態、4番目の状態は空中期の中間時点の状態、5番目の状態は空中期の終了時(次の片脚支持期の開始時)の状態を示している。また、図5中の白抜き矢印は、ロボット1の進行方向を示している。
The numbers with circles in FIG. 5 indicate the chronological order of the running gaits. In this case, the first state in FIG. 5 is a state at the beginning (initial stage) of the one-leg support period, the second state is an intermediate point in the one-leg support period, and the third state is following the one-leg support period The state at the start of the air phase (at the end of the one-leg support period), the fourth state at the middle of the air period, the fifth state at the end of the air period (at the start of the next one-leg support period) ) State. In addition, a white arrow in FIG. 5 indicates the traveling direction of the
この走行歩容では、ロボット1は、図5の1番目の状態で示すように、片脚支持期の開始時において支持脚(ロボット1の進行方向前側の脚体2)の足平22のかかとで着地する。
In this running gait, as shown in the first state of FIG. 5, the
続いて、図5の2番目の状態で示すように、ロボット1は、着地した足平22(支持脚の足平22)の底面のほぼ全面を着地させた後、図5の3番目の状態で示すように、その支持脚の足平22(図5の3番目の状態におけるロボット1の進行方向後側の脚体2の足平22)のつま先で床を蹴って空中に飛び上がる。これより片脚支持期が終了すると共に空中期が開始する。尚、片脚支持期における遊脚は、図5の1番目の状態で示すように、片脚支持期の開始時では、支持脚の後側に存在する。その後、該遊脚は、図5の2番目及び3番目の状態で示すように次の着地予定位置に向かって支持脚の前側に振り出される。
Subsequently, as shown in the second state of FIG. 5, the
次いで、図5の4番目の状態で示す空中期を経た後、ロボット1は、遊脚(空中期の開始直前の片脚支持期で遊脚となっていた脚体2)の足平22のかかとで着地し、次の片脚支持期が開始される。
Next, after the aerial period shown in the fourth state in FIG. 5, the
図5の走行歩容を想定しつつ、前記歩容生成装置100が生成する目標歩容の基本的な概要を説明する。
A basic outline of the target gait generated by the
歩容生成装置100が目標歩容を生成するとき、ロボット1の運動形態に関する基本的な要求を表す要求パラメータが、ロボット1の外部の図示しない操縦装置やサーバ等から無線通信等により歩容生成装置100に入力される。該要求パラメータは、例えば、ロボット1の運動種別(歩行、走行等)や、遊脚側の足平22の目標とする着地位置姿勢(着地予定位置姿勢)、目標とする着地時刻(着地予定時刻)、あるいは、これらを決定するために必要なパラメータ(例えばロボット1の平均移動速度や移動方向等)により構成される。なお、このような要求パラメータは、ロボット1の図示しない記憶装置に事前に記憶保持しておき、それを歩容生成装置100が所定のスケジュールで読み込むようにしてもよい。
When the
そして、歩容生成装置100は、上記要求パラメータを用いて所定のアルゴリズムにより目標歩容を生成する。より詳しく言えば、本実施形態では、歩容生成装置100は、上記要求パラメータに応じて、目標歩容の目標足平位置姿勢軌道、目標床反力鉛直成分軌道等、目標歩容の一部の構成要素を規定するパラメータとしての歩容パラメータを決定した上で、その歩容パラメータとロボット1の動力学モデルとを用いて目標歩容の瞬時値を逐次決定する。これにより歩容生成装置100は、目標歩容の時系列パターン(軌道)を生成する。
Then, the
この場合、目標足平位置姿勢軌道は、例えば本願出願人が特許第3233450号にて提案した有限時間整定フィルタを用いて各足平22毎に生成される。この有限時間整定フィルタは、可変時定数の1次遅れフィルタ、すなわち、伝達関数が1/(1+τs)の形で表されるフィルタ(τは可変の時定数。以下、このフィルタを単位フィルタという)を複数段(本実施形態では3段以上)、直列に接続したものであり、所望の指定時刻に指定値に到達するような軌道を生成・出力することができるものである。この場合、各段の単位フィルタの時定数τは、いずれも、有限時間整定フィルタの出力生成を開始してから、上記指定時刻までの残時間に応じて逐次可変的に設定される。より詳しくは、該残時間が短くなるに伴いτの値が所定の初期値(>0)から減少されていき、最終的には、該残時間が“0”になる指定時刻にて、τの値が“0”になるように設定される。そして、有限時間整定フィルタには、前記指定値(より詳しくは、有限時間整定フィルタの出力の初期値から前記指定値への変化量)に応じた高さのステップ入力が与えられる。このような有限時間整定フィルタは、指定時刻にて指定値に達するような出力が生成されるだけでなく、指定時刻における有限時間整定フィルタの出力の変化速度を“0”もしくはほぼ“0”にすることができる。特に、単位フィルタを3段以上(3段でよい)、接続した場合には、有限時間整定フィルタの出力の変化加速度(変化速度の微分値)をも“0”もしくはほぼ“0”にすることができる。
In this case, the desired foot position / posture trajectory is generated for each
このような有限時間整定フィルタを用いる足平位置姿勢軌道(足平22が着地してから次に着地するまでの位置姿勢軌道)の生成は、例えば次のように行なわれる。例えばX軸方向(前後方向)の目標足平位置軌道は次のように生成される。すなわち、前記要求パラメータにより規定される各足平22の次の着地予定位置のX軸方向位置(より詳しくは、次の着地予定位置のひとつ前の着地位置に対するX軸方向の変化量(移動量)。これは前記指定値に相当する)に応じて有限時間整定フィルタへのステップ入力の高さが決定されると共に前記時定数τが所定の初期値に初期化された後、その決定されたステップ入力が有限時間整定フィルタに与えられ、足平22のX軸方向位置の軌道生成が開始される。そして、この軌道生成時には、前記時定数τは、足平22の着地予定時刻(これは前記指定時刻に相当する)までに初期値から“0”まで減少していくように、逐次可変設定される。これにより、着地予定時刻で着地予定位置に達するような、足平22のX軸方向の位置の軌道が生成される。
Generation of a foot position / posture trajectory using such a finite time settling filter (a position / posture trajectory from when the
また、Z軸方向(鉛直方向)の目標足平位置軌道は、例えば次のように生成される。すなわち、まず、足平22の次の着地予定位置及び着地予定時刻に応じて、該足平22の高さ(鉛直位置)が最大になるときの該足平22のZ軸方向位置(以下、最高点位置という)とその最高点位置への到達時刻とが決定される。そして、その最高点位置(これは前記指定値に相当する)に応じて有限時間整定フィルタへのステップ入力の高さが決定されると共に時定数τが初期化された後、その決定されたステップ入力が有限時間整定フィルタに与えられ、前記最高点位置までのZ軸方向の足平位置軌道が逐次生成される。この際、時定数τは、最高点位置への到達時刻(前記指定時刻に相当)までに初期値から0まで減少するように逐次可変設定される。さらに、最高点位置までのZ軸方向位置の軌道の生成が終了したら、時定数τを初期化すると共にいままでのステップ入力と逆極性のステップ入力(より詳しくは、最高点位置から次の着地予定位置までのZ軸方向の変化量(これは前記指定値に相当する)に応じた高さの逆極性のステップ入力)が有限時間整定フィルタに入力され、該最高点位置から着地予定位置までのZ軸方向の足平位置の軌道が逐次生成される。この際、時定数τは足平22の着地予定時刻までに初期値から0まで減少するように逐次可変設定される。
The desired foot position trajectory in the Z-axis direction (vertical direction) is generated as follows, for example. That is, first, the position of the
尚、Z軸方向の足平位置軌道の生成においては、時定数τを軌道生成開始時刻から足平22の着地予定時刻まで、初期値から“0”まで継続的に減少するように可変設定すると共に、最高点位置への到達時刻もしくはその近傍時刻で、ステップ入力の極性を逆極性に切り替えることで、Z軸方向の足平位置軌道を生成するようにしてもよい。この場合には、足平22を所望の最高点位置に精度よく到達させることはできないが、着地予定時刻での着地予定位置への到達は問題なく行なうことができる。
In the generation of the foot position trajectory in the Z-axis direction, the time constant τ is variably set so as to continuously decrease from the initial value to “0” from the trajectory generation start time to the scheduled landing time of the
足平姿勢軌道についても、上述した足平位置軌道と同様に有限時間整定フィルタを用いて生成することができる。この場合、足平姿勢の空間的な各成分のうち、その姿勢の角度変化が単調的(単調増加もしくは単調減少)なものとなる成分については、前記したX軸方向の足平位置軌道の生成と同様に足平姿勢軌道を生成すればよい。また、姿勢の角度変化が極大値もしくは極小値をもつような成分については、前記したZ軸方向の足平位置軌道の生成と同様に足平姿勢軌道を生成すればよい。 The foot posture trajectory can also be generated using a finite time settling filter in the same manner as the foot position trajectory described above. In this case, among the spatial components of the foot posture, for the component in which the angle change of the posture is monotonous (monotonically increasing or monotonically decreasing), the above-described generation of the foot position trajectory in the X-axis direction is generated. A foot posture trajectory may be generated in the same manner as described above. In addition, for a component whose posture angle change has a maximum value or a minimum value, a foot posture trajectory may be generated in the same manner as the generation of the foot position trajectory in the Z-axis direction.
尚、上記のように有限時間整定フィルタにより生成される目標足平位置姿勢軌道は、後述の支持脚座標系での各足平22の目標位置姿勢軌道である。
The target foot position / posture trajectory generated by the finite time settling filter as described above is a target position / posture trajectory of each
上述のように生成される目標足平位置姿勢軌道は、各足平22の位置が、その初期接地状態(目標歩容の初期時刻の状態)から着地予定位置に向かって徐々に加速しながら移動を開始するように生成される。そして、該目標足平位置姿勢軌道は、最終的に着地予定時刻までに徐々に位置の変化速度を“0”またはほぼ“0”にまで減速し、着地予定時刻にて着地予定位置に到達して停止するように生成される。このため、各足平22の着地瞬間における対地速度(床に固定された支持脚座標系での各足平22の位置の変化速度)が“0”またはほぼ“0”になる。したがって、走行歩容において同時に全脚体2,2が空中に存在する状態(空中期での状態)から着地しても、着地衝撃が小さくなる。
The desired foot position / posture trajectory generated as described above moves while gradually accelerating the position of each
前記走行歩容においては、ロボット1に作用する重力によって空中期後半から上体24の鉛直速度は下向きになり、着地時でも下向きのままである。したがって、上記のように各足平22の着地瞬間における対地速度が“0”またはほぼ“0”になるように目標足平位置姿勢軌道を生成すると共に、後述する如く動力学的平衡条件を満たすように上体24の目標位置姿勢軌道を生成したとき、着地直前において、上体24に対する遊脚側の足平22の相対速度は、上向きになる。すなわち、走行歩容の着地瞬間では、ロボット1の目標歩容は遊脚側の脚体2を上体24側に引っ込めながら着地するような歩容となる。言い換えれば、本実施形態での目標歩容では、ロボット1は、着地瞬間において、遊脚側の足平22の対地速度が“0”またはほぼ“0”になるように、上体24から見て該足平22を引き上げるようにして着地する。これによって、着地衝撃は小さくなり、着地衝撃が過大になるのを防止するようにしている。
In the running gait, the vertical velocity of the
また、本実施形態では、有限時間整定フィルタは、単位フィルタを3段以上(例えば3段)、直列に接続したものであるため、着地予定時刻までに各足平22の速度(足平位置の変化速度)が“0”またはほぼ“0”になるだけでなく、各足平22は、その加速度も着地予定時刻にて0またはほぼ0になって停止する。つまり、着地瞬間における対地加速度も“0”またはほぼ“0”になる。したがって、着地衝撃がより一層小さくなる。特に、実際のロボット1の着地時刻が目標の着地時刻からずれても、衝撃があまり増大しなくなる。補足すると、着地予定時刻にて各足平22の対地速度を“0”またはほぼ“0”にする上では、有限時間整定フィルタの単位フィルタの段数は2段でもよいが、この場合には、着地予定時刻での各足平22の加速度は一般には“0”にならない。
In this embodiment, since the finite time settling filter is a unit filter having three or more stages (for example, three stages) connected in series, the speed of each foot 22 (the position of the foot position) by the scheduled landing time. (Change speed) becomes “0” or almost “0”, and each
尚、足平姿勢に関しては、各足平22が着地予定時刻にてその踵で着地した後、該足平22の底面のほぼ全面が床に接地するまで動き続ける。このため、該足平22の底面のほぼ全面が床に接地する時刻を前記指定時刻に設定して、前記有限時間整定フィルタにより足平姿勢軌道が生成される。
Regarding the foot posture, after each
また、本実施形態では、有限時間整定フィルタを用いて足平位置軌道を生成したが、着地予定時刻での足平位置の変化速度が“0”またはほぼ“0”になる(足平位置の時間微分値が“0”になる)ように、さらには、該着地予定時刻での足平位置の変化加速度(変化速度の時間微分値)が“0”またはほぼ“0”になるように設定された多項式などの関数を用いて目標足平位置軌道を生成するようにしても良い。このことは、目標足平姿勢軌道の生成に関しても同様である。但し、該目標足平姿勢軌道の生成に関しては、上述の如く、各足平22の底面のほぼ全面が床に接地する時刻にて、各足平22の姿勢の変化速度、さらにはその変化加速度が“0”またはほぼ“0”になるように多項式などの関数が設定される。
In this embodiment, the foot position trajectory is generated using a finite time settling filter. However, the change speed of the foot position at the scheduled landing time is “0” or almost “0” (the foot position is changed). Furthermore, the foot position change acceleration (time differential value of the change speed) at the scheduled landing time is set to “0” or almost “0” so that the time differential value becomes “0”. The desired foot position trajectory may be generated using a function such as a polynomial. The same applies to the generation of the desired foot posture trajectory. However, regarding the generation of the desired foot posture trajectory, as described above, at the time when almost the entire bottom surface of each
歩容生成装置100は目標床反力鉛直成分を明示的に設定する。この目標床反力鉛直成分軌道は、例えば図6のように設定される。本実施形態では、走行歩容における目標床反力鉛直成分軌道の形状(詳しくは片脚支持期での形状)は、台形状(床反力鉛直成分の増加側に凸の形状)に定められている。そして、その台形の高さ、折れ点の時刻が目標床反力鉛直成分軌道を規定する歩容パラメータ(床反力鉛直成分軌道パラメータ)として決定される。
The
尚、走行歩容の空中期では、目標床反力鉛直成分は定常的に“0”に設定される。この例のように、目標床反力鉛直成分軌道は、実質的に連続になるように(値が不連続にならないように)設定するのがよい。これは床反力を制御する際のロボット1の関節の動作を滑らかにするためである。ここで、「実質的に連続」というのは、アナログ的に連続な軌道(真の意味での連続な軌道)を離散時間系でデジタル表現したときに必然的に生じる値の飛びは、該軌道の連続性を失わせるものではないということを意味するものである。
Note that the target floor reaction force vertical component is constantly set to “0” in the air phase of the running gait. As in this example, the desired floor reaction force vertical component trajectory is preferably set so as to be substantially continuous (so that the value does not become discontinuous). This is to smooth the movement of the joint of the
補足すると、本実施形態では、ロボット1に作用する外力の全体として、床反力を想定しているので、目標床反力鉛直成分は、ロボット1全体の(ロボット1の全体重心の)鉛直方向の慣性力を規定するものとなる。すなわち、目標床反力鉛直成分から、ロボット1全体に作用する重力に釣り合う成分を差し引いたものが、ロボット1全体の鉛直方向の慣性力に釣り合うものとなる。従って、目標床反力鉛直成分を決定することによって、結果的には、ロボット1全体の鉛直方向の慣性力が決定されることとなる。
Supplementally, in this embodiment, since the floor reaction force is assumed as the entire external force acting on the
目標ZMP軌道は,例えば図7(a),(b)に示す如く設定される。図5の走行歩容においては、ロボット1は、前記したように支持脚側足平22のかかとで着地し、次にその支持脚側足平22のつま先で蹴って空中に飛び上がり、最後に遊脚側足平22のかかとで着地する。従って、片脚支持期での目標ZMP軌道のX軸方向位置(前後方向位置)は、図7(a)に示すように、支持脚側足平22のかかとを初期位置として、次に支持脚側足平22の底面のほぼ全面が接地する期間において該足平22の前後方向の中央に移動し、その後、離床時までに支持脚側足平22のつまさきに移動するように設定される。尚、片脚支持期における目標ZMP軌道のY軸方向位置(左右方向位置)は、図7(b)に示すように、支持脚側脚体2の足首関節の中心のY軸方向位置と同じ位置に設定される。
The target ZMP trajectory is set as shown in FIGS. 7A and 7B, for example. In the running gait of FIG. 5, the
図7(a)に示すように、空中期における目標ZMP軌道のX軸方向位置は、該空中期が終了するまで(遊脚側脚体2が着地するまで)に支持脚側足平22のつま先から遊脚側足平22のかかとの着地位置まで連続的に移動するように設定される。また、図7(b)に示すように、空中期における目標ZMP軌道のY軸方向位置は、該空中期が終了するまで(遊脚側脚体2が着地するまで)に支持脚側脚体2の足首関節の中心のY軸方向位置から遊脚側脚体2の足首関節の中心のY軸方向位置まで連続的に移動するように設定される。すなわち、目標ZMP軌道は歩容の全期間において連続(実質的に連続)する軌道に設定される。ここで、上記したZMP軌道の「実質的に連続」の意味は、前記床反力鉛直成分軌道の場合と同様である。
As shown in FIG. 7A, the X-axis direction position of the target ZMP trajectory in the aerial phase is such that the support
本実施形態では、図7(a),(b)に示したような目標ZMP軌道の折れ点の位置や時刻が、ZMP軌道パラメータ(目標ZMP軌道を規定するパラメータ)として設定される。 In this embodiment, the position and time of the break point of the target ZMP trajectory as shown in FIGS. 7A and 7B are set as ZMP trajectory parameters (parameters that define the target ZMP trajectory).
ZMP軌道パラメータは、安定余裕が高く、かつ急激な変化をしないように決定される。ここで、ロボット1の接地面を含む最小の凸多角形(いわゆる支持多角形)の中央付近に目標ZMPが存在する状態を安定余裕が高いと言う(詳細は特開平10−86081号公報を参照)。図7(a),(b)の目標ZMP軌道はこのような条件を満たすように設定したものである。
The ZMP trajectory parameter is determined so that it has a high stability margin and does not change suddenly. Here, a state in which the target ZMP exists in the vicinity of the center of the smallest convex polygon (so-called support polygon) including the ground contact surface of the
また、目標腕姿勢は、上体24に対する相対姿勢で表される。
The target arm posture is expressed as a relative posture with respect to the
また、目標上体位置姿勢及び目標足平位置姿勢はグローバル座標系で記述される。グローバル座標系は床に固定された座標系であり、より具体的には、以下に説明する支持脚座標系が用いられる。該支持脚座標系は、支持脚側足平22を床面に平行な姿勢にして該支持脚側足平22の底面のほぼ全面を床面に接触(密着)させた状態において、該支持脚側脚体2の足首中心から床面に延ばした垂線が該床面と交わる点(この点は、本実施形態の例では支持脚側足平22の底面のほぼ全面を床面に接触させた状態では、該足平22の代表点と合致する)を原点とし、その原点を通る水平面をXY平面とする、床に固定された座標系である。この場合、X軸方向、Y軸方向は、それぞれ支持脚側足平22の前後方向、左右方向である。
The target body position / posture and the desired foot position / posture are described in a global coordinate system. The global coordinate system is a coordinate system fixed to the floor, and more specifically, a support leg coordinate system described below is used. The support leg coordinate system is configured such that the support
尚、支持脚座標系の原点は、必ずしも支持脚側足平22の底面のほぼ全面を床面に接触させた状態での該足平22の代表点(足平22の位置を代表する点)に合致する必要はなく、該代表点と異なる床面上の点に設定されてもよい。
The origin of the support leg coordinate system is not necessarily the representative point of the
次に、本実施形態で歩容生成に用いられるロボット1の動力学モデルについて図8を参照して説明する。
Next, a dynamic model of the
本実施形態に用いられるロボット1の動力学モデルは、図8に示す如く、目標ZMPを支点として揺動自在な可変長のロッド24aと、このロッド24aの上端に支持された質点24bとを備える倒立振子により構成されるモデル(以下、倒立振子モデルということがある)である。なお、ロッド24aは、質量を持たないものとする。この動力学モデルでは、倒立振子の質点24bの運動が、ロボット1の上体24の運動に対応しており、上体24の運動とロボット1に作用する床反力との間の関係が、質点24b(以降、上体質点24bという)の運動と、倒立振子に作用する床反力との間の関係として表現される。また、この動力学モデルでは、ロボット1の脚体2,2の質量は、上体24(または上体24と腕体及び頭部を合わせた質量)よりも十分に小さいものとみなし、上体質点24bの質量は、ロボット1の全体の質量に一致するものとされる。なお、上体質点24bの位置は、ロボット1の上体位置姿勢から一義的に定まる位置に設定される。
As shown in FIG. 8, the dynamic model of the
この動力学モデルの挙動は、以下に示すように数式化される。ただし、説明を簡単にするために、サジタルプレーン(支持脚座標系のX軸とZ軸とを含む平面)での運動方程式のみを記述し、ラテラルプレーン(支持脚座標系のY軸とZ軸とを含む平面)での運動方程式を省略した。 The behavior of this dynamic model is expressed as follows: However, in order to simplify the explanation, only the equation of motion in the sagittal plane (plane including the X axis and Z axis of the supporting leg coordinate system) is described, and the lateral plane (Y axis and Z axis of the supporting leg coordinate system) is described. The equation of motion is omitted.
説明の便宜上、動力学モデルに関する変数およびパラメータを以下のように定義する。
Zb:上体質点鉛直位置(Z軸方向位置)
Xb:上体質点水平位置(X軸方向位置)
mb:上体質点質量
Xzmp:目標ZMPの水平位置(X軸方向位置)
Zzmp:目標ZMPの鉛直位置(Z軸方向位置)
Fx:床反力水平成分(詳しくは並進床反力のX軸方向成分)
Fz:床反力鉛直成分(詳しくは並進床反力のZ軸方向成分)
Mzmp_y:目標ZMPまわりの床反力モーメント(詳しくは該床反力モーメントのY軸まわり成分)
Mb_y:支持脚座標系の原点まわりの床反力モーメント(詳しくは該床反力モーメントのY軸まわり成分)
また、任意の変数Aに対して、dA/dtはAの1階微分値を表わし、d2A/dt2はAの2階微分値を表わす。したがって、変数Aが変位(位置)ならば、dA/dtは速度、d2A/dt2は加速度を意味する。gは重力加速度定数を示す。ここでは、gは正の値とする。
For convenience of explanation, variables and parameters related to the dynamic model are defined as follows.
Zb: Upper body mass point vertical position (Z-axis direction position)
Xb: Upper body point horizontal position (X-axis direction position)
mb: Upper mass point mass Xzmp: Horizontal position of target ZMP (X-axis direction position)
Zzmp: Vertical position of target ZMP (Z-axis direction position)
Fx: Floor reaction force horizontal component (specifically, X-axis direction component of translational floor reaction force)
Fz: Floor reaction force vertical component (specifically, the Z-axis direction component of the translational floor reaction force)
Mzmp_y: Floor reaction force moment around the target ZMP (specifically, the component around the Y axis of the floor reaction force moment)
Mb_y: Floor reaction force moment around the origin of the support leg coordinate system (specifically, the component around the Y axis of the floor reaction force moment)
For an arbitrary variable A, dA / dt represents the first derivative of A, and d2A / dt2 represents the second derivative of A. Therefore, if the variable A is displacement (position), dA / dt means velocity and d2A / dt2 means acceleration. g represents a gravitational acceleration constant. Here, g is a positive value.
上記動力学モデルの運動方程式は、式01〜04で表される。 The equation of motion of the dynamic model is expressed by equations 01 to 04.
Fz=mb*(g+d2Zb/dt2) ……式01
Fx=mb*d2Xb/dt2 ……式02
Mb_y=−mb*Xb*(g+d2Zb/dt2)
+mb*Zb*(d2Xb/dt2) ……式03
Mzmp_y=−mb*(Xb−Xzmp)*(g+d2Zb/dt2)
+mb*(Zb−Zzmp)*(d2Xb/dt2) ……式04
この場合、Mb_yとMzmp_yとの間の関係は、次式05により表される。
Fz = mb * (g + d2Zb / dt2) ...... Formula 01
Fx = mb * d2Xb / dt2 ...... Formula 02
Mb_y = -mb * Xb * (g + d2Zb / dt2)
+ Mb * Zb * (d2Xb / dt2) ...... Formula 03
Mzmp_y = -mb * (Xb-Xzmp) * (g + d2Zb / dt2)
+ Mb * (Zb-Zzmp) * (d2Xb / dt2) ...... Formula 04
In this case, the relationship between Mb_y and Mzmp_y is expressed by the following equation 05.
Mb_y=Mzmp_y−mb*Xzmp*(g+d2Zb/dt2)+mb*Zzmp*(d2Xb/dt2)
=Mzmp_y−Xzmp*Fz+Zzmp*Fx
……式05
なお、目標ZMPと支持脚座標系の原点との鉛直方向(Z軸方向)での位置の差は通常、“0”又はほぼ“0”となるので、Zzmp=0と見なしてもよい。
Mb_y = Mzmp_y−mb * Xzmp * (g + d2Zb / dt2) + mb * Zzmp * (d2Xb / dt2)
= Mzmp_y-Xzmp * Fz + Zzmp * Fx
...... Formula 05
Note that the difference in the position in the vertical direction (Z-axis direction) between the target ZMP and the origin of the support leg coordinate system is normally “0” or almost “0”, so it may be considered that Zzmp = 0.
また、ロボット1の移動時の上体24の高さ(鉛直方向位置)の、平均的な高さに対する相対的な変動量(換言すれば上体24の鉛直方向位置の分散)は一般には十分に小さいので、Zb≒h(h:上体24の平均的な高さに対応する上体質点24bの平均的な高さとしての一定値)と見なすことができる。従って、上記式03の右辺第2項と式04の右辺第2項とにおけるZbを定数値hで置き換えてもよい。
In addition, the relative variation of the height (vertical position) of the
本実施形態における歩容生成装置100は、ロボット1の片方の脚体2が着地してから他方の脚体2が着地するまでの1歩分の目標歩容を単位として、その1歩分の目標歩容を順番に生成する。従って、本実施形態で生成する図5の走行歩容では、該目標歩容は片脚支持期の開始時から、これに続く空中期の終了時(次の片脚支持期の開始時)までの目標歩容が順番に生成される。
The
ここで、本明細書では、目標歩容の「1歩」は、ロボット1の片方の脚体2が着地してからもう一方の脚体2が着地するまでの意味で使用する。また、新たに生成しようとしている目標歩容を「今回歩容」、その次の目標歩容を「次回歩容」、さらにその次の目標歩容を「次次回歩容」、というように呼ぶ。また、「今回歩容」の一つ前に生成した目標歩容を「前回歩容」と呼ぶ。
Here, in this specification, “one step” of the target gait is used in the meaning from the time when one
また、歩容生成装置100が今回歩容を生成するとき、該歩容生成装置100には、ロボット1の2歩先までの遊脚側足平22の着地予定位置姿勢、着地予定時刻を規定する要求パラメータが入力される(あるいは歩容生成装置100が記憶装置から要求パラメータを読み込む)。そして、歩容生成装置100は、これらの要求パラメータを用いて、目標上体位置姿勢軌道、目標足平位置姿勢軌道、目標ZMP軌道、目標床反力鉛直成分軌道、目標腕姿勢軌道等を生成する。
When the
このとき、歩容生成装置100は、ロボット1の運動の継続性を確保し得る今回歩容を生成するために、今回歩容に続く仮想的な周期的歩容(同じパターンのロボット1の運動が一定周期で継続的に繰り返される歩容)としての定常旋回歩容を要求パラメータに応じて決定する。そして、歩容生成装置100は、今回歩容を将来的に定常旋回歩容に収束させるようにして、該今回歩容を生成する。
At this time, the
以下に図5の走行歩容を生成することを主要例にして、歩容生成装置100の歩容生成処理の詳細と、姿勢安定化制御演算部112の処理の詳細とを説明する。
The details of the gait generation processing of the
まず、歩容生成装置100の歩容生成処理の詳細を、図9〜図22を参照しつつ説明する。歩容生成装置100は、図9のフローチャート(構造化フローチャート)に示す歩容生成処理(メインルーチン処理)を実行することによって目標歩容を生成する。なお、本実施形態では、歩容生成装置100は、それが実行する処理によって、目標運動決定手段としての機能と、上下方向慣性力パラメータ決定手段としての機能とを含んでいる。
First, details of the gait generation process of the
まずS010において時刻tを“0”に初期化するなど種々の初期化作業が行なわれる。この処理は、歩容生成装置100の起動時等に行なわれる。
First, various initialization operations such as initializing time t to “0” in S010 are performed. This process is performed when the
次いで、S012を経てS014に進み、歩容生成装置100は、制御周期(図9のフローチャートの演算処理周期)毎のタイマ割り込みを待つ。制御周期はΔtである。
Next, the process proceeds to S014 through S012, and the
次いで、S016に進み、歩容生成装置100は、歩容の切り替わり目であるか否かを判断する。このとき、歩容の切り替わり目である場合には、S018に進み、切り替わり目でない場合には、S032に進む。ここで、上記「歩容の切り替わり目」は、前回歩容の生成が完了し、今回歩容の生成を開始するタイミングを意味し、例えば前回歩容の生成を完了した制御周期の次の制御周期が歩容の切り替わり目になる。
Next, in S016, the
S018に進むときは時刻tが“0”に初期化される。次いでS020に進み、歩容生成装置100は、次回歩容支持脚座標系、次次回歩容支持脚座標系、今回歩容周期および次回歩容周期を決定する。なお、支持脚座標系を決定するということはその原点の位置と該支持脚座標系の姿勢(各座標軸の向き)とを決定することを意味する。
When proceeding to S018, the time t is initialized to “0”. Next, proceeding to S020, the
これらの支持脚座標系及び歩容周期は、前記要求パラメータに基づき決定されるものである。すなわち、本実施形態では、歩容生成装置100に入力される要求パラメータは、2歩先までの遊脚側足平22の着地予定位置姿勢(足平22が着地してから足底を床面にほぼ全面的に接触させるように、滑らさずに回転させた状態での足平位置姿勢)と着地予定時刻とを規定する要求値を含んでいる。そして、その1歩目の要求値、2歩目の要求値がそれぞれ、今回歩容、次回歩容に対応するものとして、今回歩容の生成開始時(前記S016の歩容の切り替わり目)以前に歩容生成装置100に与えられる。なお、これらの要求値は今回歩容の生成途中で変更し得るようにすることも可能である。
These supporting leg coordinate systems and gait cycles are determined based on the required parameters. In other words, in the present embodiment, the requested parameter input to the
そして、上記要求パラメータにおける1歩目の遊脚側足平22(今回歩容での遊脚側足平22)の着地予定位置姿勢の要求値に対応して次回歩容支持脚座標系が決定される。
The next time gait supporting leg coordinate system is determined in accordance with the required landing position / posture value of the free
例えば図12を参照して、今回歩容(1歩目)に係わる遊脚側足平22(図では22L)の着地予定位置姿勢の要求値が、今回歩容の支持脚側足平22(図では22R)の着地位置姿勢に対して、今回歩容支持脚座標系のX軸方向(今回歩容の支持脚側足平22Rの前後方向)及びY軸方向(今回歩容の支持脚側足平22Rの左右方向)に、それぞれxnext、ynextだけ移動し、且つZ軸まわり(鉛直軸まわり)にθznextだけ回転させた位置姿勢であるとする。
For example, referring to FIG. 12, the required landing position / posture value of the free leg side foot 22 (22L in the figure) related to the current time's gait (first step) is the support leg side foot 22 ( For the landing position /
このとき、次回歩容支持脚座標系は、図示のように今回歩容の遊脚側足平22Lの着地予定位置姿勢の要求値に従って該足平22Lを着地させた場合(足平22の代表点を着地予定位置の要求値に一致させ、且つ、足平22の姿勢(向き)を着地予定姿勢の要求値に一致させた場合)における該足平22Lの代表点(より詳しくは該代表点に合致する床上の点)を原点とし、該原点を通る水平面内における該足平22Lの前後方向、左右方向をそれぞれX’軸方向、Y’軸方向とする座標系に決定される。
At this time, when the next time's gait supporting leg coordinate system is landed on the free
上記と同様に、2歩目の遊脚側足平22の着地予定位置姿勢の要求値に応じて次々回歩容支持脚座標系(図12のX”Y”座標を参照)が決定される。また、今回歩容周期は、今回歩容の支持脚側足平22の着地予定時刻(要求値)から、1歩目(今回歩容)の遊脚側足平22の着地予定時刻(要求値)までの時間として決定され、次回歩容周期は、1歩目の遊脚側足平22の着地予定時刻(要求値)から2歩目の遊脚側足平22の着地予定時刻(要求値)までの時間として決定される。
Similarly to the above, the gait support leg coordinate system (see the X "Y" coordinate in FIG. 12) is determined one after another according to the required value of the expected landing position / posture of the free
尚、前記要求パラメータは、例えば、ロボット1の外部の操縦装置あるいはサーバ等から歩容生成装置100に入力される。あるいは、要求パラメータは、ロボット1の移動スケジュールとしてロボット1に記憶装置にあらかじめ記憶保持されていてもよい。あるいは、操縦装置からの指令(要求)とそのときまでのロボットの1の移動履歴とを基に前記次回及び次次回歩容支持脚座標系、並びに今回及び次回歩容周期を決定してもよい。また、要求パラメータは、前記次回及び次次回歩容支持脚座標系の位置及び姿勢、並びに今回及び次回歩容周期を直接的に指定するパラメータであってもよい。
The required parameters are input to the
次いでS022に進み、歩容生成装置100は、今回歩容に続く仮想的な周期的歩容(今回歩容の収束目標とする仮想的な周期的歩容)としての定常旋回歩容の歩容パラメータを決定する。該歩容パラメータは、本実施形態では、定常旋回歩容における目標足平位置姿勢軌道を規定する足平軌道パラメータ、目標上体姿勢軌道を規定する上体姿勢軌道パラメータ、目標腕姿勢軌道を規定する腕軌道パラメータ、目標ZMP軌道を規定するZMP軌道パラメータ、目標床反力鉛直成分軌道を規定する床反力鉛直成分軌道パラメータを含む。
Next, proceeding to S022, the
ここで、「定常旋回歩容」は、その歩容を繰り返したときに歩容の境界(1周期毎の歩容の境界)においてロボット1の運動状態(足平位置姿勢、上体位置姿勢等の運動状態)に不連続が生じないような周期的歩容を意味する。また、「定常旋回歩容」は、周期的歩容、すなわち同じパターンの歩容を一定周期で繰り返す歩容であるから、ロボット1の運動を継続的に行い得る歩容である。換言すれば、「定常旋回歩容」は、歩容の軌道の不連続を発生することなく、同じパターンの運動を繰り返すことができる周期的歩容(原理上、無限回繰り返しても後述の「発散」が発生しない歩容)である。
Here, the “steady turning gait” is the motion state (foot position / posture, body position / posture, etc.) of the
周期的歩容である定常旋回歩容は、本実施形態では、ロボット1の2歩分の歩容、すなわち今回歩容に続く第1旋回歩容と該第1旋回歩容に続く第2旋回歩容とからなる歩容を1周期分の歩容として、その1周期分の歩容を一定周期で繰り返す歩容である。ここで「旋回」なる用語を用いたのは、旋回率を零とするときは直進を意味するので、直進も広義の意味で旋回に含ませることができるからである。
In this embodiment, the normal turning gait that is a periodic gait is a gait for two steps of the
また、生成する目標歩容が前記した図5の走行歩容である場合には、定常歩容の第1旋回歩容及び第2旋回歩容は、いずれも目標歩容と同様に片脚支持期と空中期とを有する歩容である。つまり、第1旋回歩容及び第2旋回歩容の基本的な歩容形態は今回歩容と同一である。 When the target gait to be generated is the above-described running gait shown in FIG. 5, the first turning gait and the second turning gait of the normal gait are both supported by one leg in the same manner as the target gait. A gait having a period and an aerial period. That is, the basic gait forms of the first turning gait and the second turning gait are the same as the current time gait.
定常旋回歩容(以降、単に定常歩容ということがある)について補足すると、2足移動ロボットでは、定常歩容の1周期分の歩容には、少なくとも2歩分の歩容が含まれる必要である。この場合、3歩以上の歩容を1周期分の歩容とする複雑な定常歩容を設定することも可能である。但し、定常歩容は、後述の如く、今回歩容の終端(終了時刻)における目標とする(適切な)発散成分の値を決定するためだけに用いられる。このため、3歩以上の歩容を1周期とする定常歩容を用いることは、歩容生成の処理が煩雑となるにもかかわらず、効果は少ない。そこで、本実施形態での定常歩容の1周期分の歩容を2歩分の歩容(第1旋回歩容及び第2旋回歩容の組)により構成するようにしている。尚、3足以上の脚式移動ロボットにあっては、それに応じて定常歩容を定義するに足る歩容数が増加する。 Supplementing the normal turning gait (hereinafter, sometimes simply referred to as a normal gait), in a biped robot, the gait for one cycle of the normal gait needs to include at least two gaits. It is. In this case, it is possible to set a complicated normal gait in which a gait of three or more steps is a gait for one cycle. However, the normal gait is used only to determine a target (appropriate) divergent component value at the end (end time) of the current time gait, as will be described later. For this reason, using a normal gait with a gait of three or more steps as one cycle has little effect, although the gait generation process is complicated. Therefore, the gait for one cycle of the normal gait in this embodiment is composed of gaits for two steps (a set of a first turning gait and a second turning gait). In a legged mobile robot with three or more legs, the number of gaits sufficient to define a normal gait increases accordingly.
ここで、「発散」とは、図10に示すように、ロボット1の上体24の位置が両足平22,22の位置からかけ離れた位置にずれてしまうことを意味する。また、発散成分の値とは、ロボット1の上体24の位置が両足平22,22の位置(より具体的には、支持脚側足平22の接地面に設定された支持脚座標系の原点)からかけ離れていく具合を表す数値である。
Here, “divergence” means that the position of the
定常歩容は、歩容生成装置100で今回歩容の終端におけるロボット1の目標とする運動状態を決定するために作成される仮想的な歩容である。従って、定常旋回歩容は、歩容生成装置100からそのまま出力されるものではない。
The normal gait is a virtual gait created by the
本実施形態では、目標歩容が、上記発散を生じることなく、継続的に生成されるように、発散成分を指標にして歩容を生成するようにした。この場合、継続的な歩容の代表例である定常歩容であっても、定常歩容の歩容パラメータが変われば、該定常歩容の初期発散成分(定常歩容の初期時刻での発散成分)も変わる。すなわち、歩き方、走り方、移動速度等の歩容形態によって、適切な発散成分が変わる。 In this embodiment, the gait is generated using the divergent component as an index so that the desired gait is continuously generated without causing the divergence. In this case, even if the normal gait is a typical example of a continuous gait, if the gait parameter of the normal gait changes, the initial divergence component of the normal gait (the divergence at the initial time of the normal gait). Ingredients) also change. That is, an appropriate divergent component changes depending on the gait form such as how to walk, how to run, and moving speed.
そこで、本実施形態では、歩容生成装置100は、今回歩容を生成しようとするときに、まず、その生成しようとする今回歩容の後に続く歩容(将来的な収束も目標とする歩容)として好適な将来の仮想的な周期的歩容(ロボット1の安定な移動を継続することが可能な将来の仮想的な周期的歩容)としての定常歩容を、今回歩容に係わる要求パラメータに応じて決定した上で、該定常歩容の初期発散成分を求める。そして、歩容生成装置100は、今回歩容の終端発散成分を、その求めた定常歩容の初期発散成分に一致させる(より一般的には、今回歩容を定常歩容に連続させもしくは漸近させる)ように、今回歩容を生成する。このような歩容生成の基本的な指針は本出願人が先に提案した特許第3726081号のものと同様である。
Therefore, in this embodiment, when the
ただし、本実施形態では、歩容の発散成分は、前記した図8の動力学モデル(倒立振子モデル)の状態方程式に基づいて後述するように定義される。該発散成分の定義の詳細については後述する。 However, in the present embodiment, the divergent component of the gait is defined as described later based on the state equation of the dynamic model (inverted pendulum model) in FIG. Details of the definition of the divergent component will be described later.
本題に戻り、S022では、歩容生成装置100は、図11のフローチャートに示すサブルーチン処理を実行する。
Returning to the main subject, in S022, the
まず、S100において、歩容生成装置100は、今回歩容、第1旋回歩容、第2旋回歩容の順に足平位置姿勢軌道がつながるように、定常歩容の歩容パラメータのうちの足平軌道パラメータが決定される。以下に具体的な設定方法を図12を参照して説明する。尚、以降の説明では、支持脚側の脚体2の足平22を支持脚足平22と称し、遊脚側の脚体2の足平22を遊脚足平22と称する。また、歩容の「初期」、「終端」はそれぞれ歩容の開始時刻、終了時刻、あるいは、それらの時刻における瞬時歩容を意味する。
First, in S100, the
足平軌道パラメータは、第1旋回歩容および第2旋回歩容のそれぞれの初期と終端とにおける支持脚足平22及び遊脚足平22のそれぞれの位置姿勢、各旋回歩容の歩容周期(各旋回歩容の初期から終端までの時間)等から構成される。この足平軌道パラメータのうち、第1旋回歩容初期遊脚足平位置姿勢は、次回歩容支持脚座標系から見た今回歩容終端支持脚足平位置姿勢とされる。
The foot trajectory parameters are the respective positions and orientations of the supporting
この場合、走行歩容では、今回歩容終端における支持脚足平22は、空中に移動している。そして、今回歩容終端支持脚足平位置姿勢は、今回歩容初期支持脚足平位置姿勢(=前回歩容終端遊脚足平位置姿勢)から、前記要求パラメータにおける2歩目の遊脚足平22の着地予定位置姿勢の要求値(今回歩容の支持脚足平22の次回歩容における着地予定位置姿勢の要求値)もしくは該要求値に対応する次次回歩容支持脚座標系に応じて定まる次回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道(詳しくは次回歩容支持脚座標系から見た軌道)を、今回歩容終端まで前記有限時間整定フィルタを用いて生成することにより求められる。
In this case, in the running gait, the supporting
尚、次回歩容終端遊脚足平位置姿勢は、その位置姿勢から水平姿勢まで、足平22を接地させたまま、つま先を下げるようにピッチ方向に回転させたときの該足平22の位置姿勢が次次回歩容支持脚座標系の位置姿勢に合致するように決定される。換言すれば、次回歩容終端遊脚足平位置姿勢は、前記要求パラメータにおける2歩目の遊脚足平22の着地予定位置姿勢の要求値から、該足平22をすべらないように接地させたまま、つま先を持ち上げるようにピッチ方向に所定角度回転させた状態(つま先を上げてかかとを着地させた状態)での該足平22の位置姿勢である。
It should be noted that the next gait end free leg foot position / posture is the position of the
また、第1旋回歩容初期支持脚足平位置姿勢は、次回歩容支持脚座標系から見た今回歩容終端遊脚足平位置姿勢とされる。この場合、今回歩容終端遊脚足平位置姿勢は、前記次回歩容終端遊脚足平位置姿勢の場合と同様、前記次回歩容支持脚座標系もしくはこれに対応する前記要求パラメータの1歩目(今回歩容)の遊脚着地予定位置姿勢の要求値に応じて決定されるものである。すなわち、今回歩容終端遊脚足平位置姿勢は、その位置姿勢から、足平22を接地させたまま、つま先を下げるように該足平22を回転させて該足平22の底面のほぼ全面を床面に接地させたときの該足平22の代表点が次回歩容支持脚座標系の原点に合致するように決定される。
Further, the initial support leg foot position / posture of the first turning gait is the free leg foot position / posture of the current time gait viewed from the next time's gait support leg coordinate system. In this case, the current leg gait end free leg foot position / posture is the next time gait end free leg foot position / posture of the next time gait supporting leg coordinate system or one step of the required parameter corresponding thereto. This is determined according to the required value of the planned landing position / posture of the eye (current gait). That is, the free leg foot position / posture at the end of the gait this time is that the
第1旋回歩容終端遊脚足平位置姿勢は、今回歩容終端遊脚足平位置姿勢や次回歩容終端遊脚足平位置姿勢の決定手法と同様に、次回歩容支持脚座標系から見た次次回歩容支持脚座標系の位置姿勢に基づいて決定される。より具体的には、第1旋回歩容終端遊脚足平位置姿勢は、その位置姿勢から水平姿勢まで、足平22を接地させたまま、すべらないように該足平22をピッチ方向に回転させたときの該足平22の位置姿勢が、次回歩容支持脚座標系から見た次次回歩容支持脚座標系の位置姿勢に合致するように決定される。
The free leg foot position / posture at the end of the first turning gait is determined from the next time's gait supporting leg coordinate system in the same manner as the method for determining the free leg foot position / posture at the end of the current gait and the free leg foot position / posture at the end of the next gait. It is determined based on the position / posture of the next gait supporting leg coordinate system. More specifically, the free leg foot position / posture at the end of the first turning gait is rotated in the pitch direction from the position / posture to the horizontal posture so that the
第1旋回歩容終端では、支持脚足平22は離床して空中にある。支持脚足平22が離床してから後の軌道を決定するために、第1旋回歩容支持脚足平着地予定位置姿勢が設定される。第1旋回歩容支持脚足平着地予定位置姿勢は、次回歩容支持脚座標系から見た次次次回歩容支持脚座標系の位置姿勢に基づいて決定される。より具体的には、第1旋回歩容支持脚足平着地予定位置姿勢は、次回歩容支持脚座標系から見た次次次回歩容支持脚座標系の位置姿勢である。なお、次次次回歩容支持脚座標系は、次次回歩容支持脚座標系と次次次回歩容支持脚座標系との相対的位置姿勢関係が、今回歩容支持脚座標系と次回歩容支持脚座標系との相対的位置姿勢関係と一致するように決定される。
At the end of the first turning gait, the supporting
第1旋回歩容終端支持脚足平位置姿勢は、第1旋回歩容初期支持脚足平位置姿勢を求めた場合と同様に、第1旋回歩容初期支持脚足平位置姿勢から、前記第1旋回歩容支持脚足平着地予定位置姿勢に至る足平位置姿勢軌道(より詳しくは次回歩容支持脚座標系から見た軌道)を、第1旋回歩容終端まで前記有限時間整定フィルタを用いて生成することにより求められる。 As in the case of obtaining the initial supporting leg foot position / posture of the first turning gait, the supporting leg foot position / posture at the end of the first turning gait is determined from the initial supporting leg foot position / posture of the first turning gait. The foot position / posture trajectory (more specifically, the trajectory as seen from the next time's gait support leg coordinate system) to the end of the first turning gait It is calculated | required by producing | generating.
第2旋回歩容初期遊脚足平位置姿勢は、次次回歩容支持脚座標系から見た第1旋回歩容終端支持脚足平位置姿勢とされる。第2旋回歩容初期支持脚足平位置姿勢は、次次回歩容支持脚座標系から見た第1旋回歩容終端遊脚足平位置姿勢とされる。 The initial free leg foot position / posture of the second turning gait is the supporting leg foot position / posture at the end of the first turning gait as seen from the next time's gait supporting leg coordinate system. The initial supporting leg foot position / posture of the second turning gait is the free leg foot position / posture at the end of the first turning gait as seen from the next time gait supporting leg coordinate system.
第2旋回歩容終端遊脚足平位置姿勢は、今回歩容支持脚座標系から見た今回歩容終端遊脚足平位置姿勢とされる。第2旋回歩容終端支持脚足平位置姿勢は、今回歩容支持脚座標系から見た今回歩容終端支持脚足平位置姿勢とされる。 The free leg foot position / posture at the end of the second turning gait is the free leg foot position / posture at the end of the current time gait viewed from the current time's gait supporting leg coordinate system. The second turning gait end support leg foot position / posture is the current time gait end support leg foot position / posture viewed from the current time gait support leg coordinate system.
第1旋回歩容および第2旋回歩容の歩容周期は、次回歩容周期と同一に設定される。これらの第1旋回歩容及び第2旋回歩容の歩容周期は、互いに同一にすることは必ずしも必要ではないが、いずれの周期も、少なくとも次回歩容周期に応じて決定するのが好ましい。 The gait cycles of the first turning gait and the second turning gait are set to be the same as the next time gait cycle. The gait cycles of the first turning gait and the second turning gait do not necessarily need to be the same, but it is preferable to determine either cycle according to at least the next gait cycle.
次に、S102に進み、歩容生成装置100は、定常歩容における目標上体姿勢軌道を規定する上体姿勢軌道パラメータを決定する。
Next, proceeding to S102, the
この場合、本実施形態では、定常歩容の上体姿勢軌道パラメータは、それより規定される目標上体姿勢軌道があらかじめ定められた所定パターンの基準上体姿勢の軌道に一致するように決定される。この基準上体姿勢は、本実施形態では、経時的な変化の無い一定姿勢(固定的な姿勢)に設定されている。その基準上体姿勢は、例えば上体24の体幹軸が定常的に鉛直方向を向く姿勢(ロボット1の直立姿勢で起立した状態での上体姿勢)、すなわち、鉛直方向に対する上体姿勢角が定常的に“0”に保たれる姿勢である。そして、このような基準上体姿勢の軌道を規定するパラメータ(基準上体姿勢の一定の上体姿勢角の値等)が上体姿勢軌道パラメータとして決定される。なお、このように上体姿勢を一定姿勢とした場合には、必然的に上体姿勢角の角速度及び角加速度も定常的に“0”に保たれる。
In this case, in this embodiment, the body posture trajectory parameters of the normal gait are determined so that the target body posture trajectory defined thereby matches the reference body posture trajectory of a predetermined pattern. The In this embodiment, the reference body posture is set to a fixed posture (fixed posture) that does not change with time. The reference body posture is, for example, a posture in which the trunk axis of the
補足すると、定常歩容の上体姿勢は、定常歩容の初期(第1旋回歩容の初期)と終端(第2旋回歩容の終端)とでつながるように(上体姿勢角及びその角速度がそれぞれ、定常歩容の初期と終端とで一致するように)に設定されている限り、一定姿勢である必要はない。本実施形態では、本実施形態の理解を容易にするために基準上体姿勢を上記の如く一定姿勢とした。 Supplementally, the body posture of the normal gait is connected at the initial stage of the normal gait (initial stage of the first turning gait) and the end (end of the second turning gait) (body posture angle and its angular velocity). As long as they match each other at the beginning and end of the normal gait. In the present embodiment, the reference body posture is set to a constant posture as described above in order to facilitate understanding of the present embodiment.
次に、S104に進み、歩容生成装置100は、腕姿勢軌道パラメータ、より詳しくは鉛直軸(あるいは上体24の体幹軸)まわりの両腕体の角運動量変化に関すること以外の腕姿勢軌道パラメータが決定される。たとえば、上体24に対する腕体の手先の相対高さや腕体全体の相対重心位置などを規定するパラメータが腕姿勢軌道パラメータとして決定される。この場合、本実施形態では、腕体全体の相対重心位置は、上体24に対して一定に維持されるように設定される。
Next, proceeding to S104, the
次に、S106に進み、歩容生成装置100は、床反力鉛直成分軌道パラメータを決定する。この場合、該パラメータにより規定される床反力鉛直成分軌道が、第1旋回歩容および第2旋回歩容のいずれにおいても、実質的に連続なものとなるように床反力鉛直成分軌道パラメータが決定される。
Next, proceeding to S106, the
具体的には、定常歩容の目標床反力鉛直成分軌道は、例えば図13に示すようなパターンで設定される。そのパターンでは、第1旋回歩容及び第2旋回歩容のいずれにおいても、片脚支持期では床反力鉛直成分が台形状に変化し、空中期では床反力鉛直成分が零に維持される。そして、このパターンの折れ点の時刻や、台形部分の高さ(ピーク値)が床反力鉛直成分軌道パラメータとして決定される。 Specifically, the desired floor reaction force vertical component trajectory of the normal gait is set in a pattern as shown in FIG. 13, for example. In that pattern, in both the first turning gait and the second turning gait, the floor reaction force vertical component changes to a trapezoid during the one-leg support period, and the floor reaction force vertical component is maintained at zero in the aerial period. The Then, the break point time of the pattern and the height (peak value) of the trapezoidal portion are determined as the floor reaction force vertical component trajectory parameters.
この床反力鉛直成分軌道パラメータは、定常歩容の1周期分の期間(第1旋回歩容の期間と第2旋回歩容の期間とを合わせた期間)における床反力鉛直成分の平均値をロボット1の自重と一致させるように決定される。すなわち、定常歩容の1周期分の期間における床反力鉛直成分の平均値がロボット1の全体に作用する重力と同じ大きさで反対向きになるようにする。
This floor reaction force vertical component trajectory parameter is the average value of the floor reaction force vertical component during a period of one cycle of the normal gait (a period combining the period of the first turning gait and the period of the second turning gait). Is made to coincide with the own weight of the
上記のごとく床反力鉛直成分軌道パラメータ(ひいては床反力鉛直成分軌道)を決定することは、定常歩容の条件を満たすために必要である。定常歩容の条件とは、該定常歩容のあらゆる状態量(ロボット1の各部の位置、姿勢、速度等の運動状態量)についての初期状態(定常歩容の第1旋回歩容の支持脚座標系から見た該第1旋回歩容の初期状態)と終端状態(定常歩容の第2旋回歩容に続く第1旋回歩容の支持脚座標系から見た該第2旋回歩容の終端状態)とが一致していることである(以下、この条件を定常歩容の境界条件ということがある)。 As described above, it is necessary to determine the floor reaction force vertical component trajectory parameter (and hence the floor reaction force vertical component trajectory) in order to satisfy the condition of the normal gait. The condition of the normal gait is the initial state (support leg of the first turning gait of the normal gait) for all the state variables of the normal gait (motion state quantities such as the position, posture, speed, etc. of each part of the robot 1). The initial state of the first turning gait viewed from the coordinate system) and the terminal state (the second turning gait viewed from the supporting leg coordinate system of the first turning gait following the second turning gait of the normal gait). Terminal condition) (hereinafter, this condition may be referred to as a boundary condition of a normal gait).
したがって、定常歩容終端におけるロボット1の全体重心鉛直速度と定常歩容初期における全体重心鉛直速度との差(詳細には、第2旋回歩容終端の全体重心鉛直速度と第1旋回歩容初期の全体重心鉛直速度との差)も零でなければならない。上記差は、床反力鉛直成分と重力との差の積分値(定常歩容の初期から終端までの1周期分の期間での1階積分値)であるから、上記差を零にするためには、上記のごとく、定常歩容の1周期分の期間における床反力鉛直成分の平均値がロボット1の自重に一致するように床反力鉛直成分軌道を決定する必要がある。
Therefore, the difference between the total center of gravity vertical velocity of the
尚、本実施形態では、第1旋回歩容、第2旋回歩容それぞれの期間における床反力鉛直成分の平均値をロボット1の自重と一致させるようにした。より具体的には、例えば第1旋回歩容及び第2旋回歩容の歩容周期に応じて各旋回歩容における床反力鉛直成分軌道の台形部分の折れ点の時刻を設定した上で、その台形部分の高さ(床反力鉛直成分のピーク値)を、床反力鉛直成分の第1旋回歩容、第2旋回歩容それぞれの期間における平均値がロボット1の自重に一致するように決定した。この場合、該台形部分の高さは、その高さを未知数として、上記平均値及び自重の一致条件を表す方程式を解くことによって、求めることができる。
In the present embodiment, the average value of the floor reaction force vertical component in each period of the first turning gait and the second turning gait is made to coincide with the own weight of the
こうすることにより、第1旋回歩容終端の全体重心鉛直速度と第1旋回歩容初期の全体重心鉛直速度との差が“0”になると共に、第2旋回歩容終端の全体重心鉛直速度と第2旋回歩容初期の全体重心鉛直速度との差も“0”になる。ただし、このようにする必然性はない。例えば、第1旋回歩容と第2旋回歩容との境界付近で上体鉛直位置が高くなり過ぎたり低くなり過ぎたりする恐れがある場合には、各旋回歩容で上記平均値及び自重を一致させた状態から、各旋回歩容の床反力鉛直成分軌道の台形の高さ等を修正するようにしてもよい。 By doing this, the difference between the overall center-of-gravity vertical velocity at the end of the first turning gait and the overall center-of-gravity vertical velocity at the beginning of the first turning gait becomes “0”, and the overall center-of-gravity vertical velocity at the end of the second turning gait. And the difference between the overall center-of-gravity vertical velocity at the beginning of the second turning gait is also “0”. However, there is no necessity to do this. For example, when there is a possibility that the vertical position of the body is too high or too low near the boundary between the first turning gait and the second turning gait, the average value and the weight are calculated for each turning gait. The height of the trapezoid of the floor reaction force vertical component trajectory of each turning gait may be corrected from the matched state.
次いで、S108に進み、歩容生成装置100は、第1旋回歩容および第2旋回歩容を合わせた定常歩容の目標ZMP軌道を規定するZMP軌道パラメータを決定する。この場合、目標ZMP軌道は、前述したように安定余裕が高くかつ急激な変化をしないように決定される。
Next, proceeding to S108, the
さらに詳細には、図5の走行歩容においては、支持脚足平22(空中期での遊脚足平22)のかかとが着地した後、しばらくして該支持脚足平22の底面のほぼ全面が接地し、さらにしばらくして、該支持脚足平22のつま先だけが接地する。そして、次に、ロボット1が支持脚足平22のつま先で蹴って空中に飛び上がり、最後に遊脚足平22のかかとで着地する。また、目標ZMPは接地面内に存在しなければならない。
More specifically, in the running gait of FIG. 5, after the heel of the supporting leg foot 22 (the
そこで、本実施形態では、定常歩容の第1旋回歩容及び第2旋回歩容のそれぞれの目標ZMPのX軸方向位置は、図7(a)に示したように、支持脚足平22のかかとを初期位置として、該足平22の底面のほぼ全体が接地するまでその位置に留まるように決定される。
Therefore, in the present embodiment, the X-axis direction position of each target ZMP of the first turning gait and the second turning gait of the normal gait is as shown in FIG. With the heel as the initial position, it is determined so that almost the entire bottom surface of the
続いて、目標ZMPは、支持脚足平22の中央に移動し、該足平22がつま先接地状態になるまでにつま先に移動し、その後、離床時まで支持脚足平22のつま先に留まるように決定される。さらにその後は、目標ZMPは、前述のごとく、次の遊脚足平22の着地までに目標ZMPが、支持脚足平22のつま先から遊脚足平22のかかとの着地位置まで連続的に移動するように決定される。
Subsequently, the target ZMP moves to the center of the
したがって、第1旋回歩容と第2旋回歩容とから成る定常歩容の目標ZMP軌道(X軸方向位置の軌道)は、図14に示す如く決定される。そして、この目標ZMP軌道の折れ点の時刻及び位置が定常歩容のZMP軌道パラメータとして決定される。この場合、折れ点の時刻は、前記要求パラメータに応じて定めた第1旋回歩容及び第2旋回歩容の歩容周期に応じて決定される。また、該折れ点の位置は、次回歩容支持脚座標系及び次次回歩容支持脚座標系の位置姿勢、あるいはこれらの座標系の位置姿勢を規定する、1歩目及び2歩目の遊脚側足平着地予定位置姿勢の要求値に応じて決定される。 Therefore, the target ZMP trajectory (the trajectory in the X-axis direction) of the normal gait composed of the first turning gait and the second turning gait is determined as shown in FIG. Then, the break time and position of the target ZMP trajectory are determined as the ZMP trajectory parameters of the normal gait. In this case, the breakpoint time is determined according to the gait cycle of the first turning gait and the second turning gait determined according to the required parameter. In addition, the position of the break point is the position of the next gait support leg coordinate system and the next time gait support leg coordinate system, or the positions of the first and second steps that define the position and orientation of these coordinate systems. It is determined according to a required value of the leg-side foot landing planned position / posture.
尚、目標ZMP軌道のY軸方向位置は、図7(b)に示したものと同様に決定される。より詳しくは、第1旋回歩容における目標ZMPのY軸方向位置の軌道は、図7(b)のものと同一パターンで決定される。さらに、第2旋回歩容における目標ZMPのY軸方向位置の軌道は、第1旋回歩容のものと同じ形の軌道で、該軌道の終端につながるものに決定される。 Note that the position of the target ZMP trajectory in the Y-axis direction is determined in the same manner as that shown in FIG. More specifically, the trajectory of the position of the target ZMP in the Y-axis direction in the first turning gait is determined in the same pattern as that in FIG. Furthermore, the trajectory of the position of the target ZMP in the Y-axis direction in the second turning gait is determined to be the same shape as that of the first turning gait and connected to the end of the trajectory.
以上が、図9のS022の処理の詳細である。 The above is the details of the processing in S022 of FIG.
図9に戻って、歩容生成装置100は、上記の如くS022の処理を実行した後、S024に進み、定常歩容の初期状態を算出する。ここで算出する初期状態は、具体的には、定常歩容の初期上体位置速度(初期上体位置及び初期上体速度)及び初期発散成分である。この初期状態の算出は、図15のフローチャートに示す処理によって、探索的に行なわれる。
Returning to FIG. 9, the
以下説明すると、まず、S200において、歩容生成装置100は、定常歩容パラメータ(図9のS022で決定された歩容パラメータ)に基づいて、定常歩容の目標足平位置姿勢、目標腕姿勢、および目標上体姿勢角の初期状態(定常歩容の初期時刻(=今回歩容の終端時刻)での状態)を決定する。ここで「状態」とは、位置又は姿勢とその時間的変化率(位置又は姿勢の変化速度)との組を意味する。例えば目標足平位置姿勢の初期状態は、定常歩容の初期時刻での足平位置姿勢と、その時間的変化率(すなわち、足平22の移動速度及び姿勢の変化速度)との組を意味する。目標腕姿勢の初期状態、目標上体姿勢角の初期状態についても同様である。
To describe below, first, in S200, the
この場合、支持脚側の足平位置姿勢の初期状態と、遊脚側の足平位置姿勢の初期状態とは、図11のS100で決定した足平軌道パラメータに基づいて決定される。 In this case, the initial state of the foot position / posture on the supporting leg side and the initial state of the foot position / posture on the free leg side are determined based on the foot trajectory parameters determined in S100 of FIG.
具体的には、足平軌道パラメータにうちの、前記第1旋回歩容初期支持脚足平位置姿勢と、第1旋回歩容初期遊脚足平位置姿勢とが、それぞれ、定常歩容の初期時刻での支持脚側の足平位置姿勢、遊脚側の足平位置姿勢として決定される。 Specifically, among the foot trajectory parameters, the initial foot position / posture of the first turning gait initial supporting gait and the foot position / posture of the initial swing gait initial free leg are the initial values of the normal gait. The foot position / posture on the supporting leg side at the time and the foot position / posture on the free leg side are determined.
また、定常歩容の初期時刻での支持脚側の足平位置姿勢の時間的変化率は、第1旋回歩容初期支持脚足平位置姿勢から第2旋回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道(次回歩容支持脚座標系から見た軌道)を有限時間整定フィルタにより生成した場合における該軌道の初期時刻(定常歩容の初期時刻)での足平位置姿勢の時間的変化率として算出される。この場合、第1旋回歩容初期支持脚足平位置姿勢から第2旋回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道のうち、定常歩容の初期時刻からその直後の時刻までの軌道から定常歩容の初期時刻での支持脚側の足平位置姿勢の時間的変化率を算出することができる。 Further, the temporal change rate of the foot position / posture on the supporting leg side at the initial time of the normal gait is the first leg position / posture position / posture leg position / posture at the end of the second turning gait. Foot position / posture trajectory (trajectory viewed from the next time's gait supporting leg coordinate system) using the finite time settling filter, the foot position / posture at the initial time of the trajectory (initial time of the normal gait) Calculated as the rate of change over time. In this case, from the initial position of the normal gait to the time immediately after it in the foot position / posture trajectory from the initial supporting leg foot position / posture at the first turning gait to the free leg foot position / posture at the end of the second turning gait. The temporal change rate of the foot position / posture on the supporting leg side at the initial time of the normal gait can be calculated from the trajectory.
また、定常歩容の初期時刻での遊脚側の足平位置姿勢の時間的変化率は、今回歩容初期支持脚足平位置姿勢から第1旋回歩容終端終端遊脚足平位置姿勢に至る足平位置姿勢軌道(次回歩容支持脚座標系から見た軌道)を有限時間整定フィルタにより生成した場合における該軌道の初期時刻(定常歩容の初期時刻)での足平位置姿勢の時間的変化率として算出される。この場合、今回歩容初期支持脚足平位置姿勢から第1旋回歩容終端終端遊脚足平位置姿勢に至る足平位置姿勢軌道のうち、今回歩容の初期時刻から定常歩容の初期時刻(又はその直後の時刻)までの軌道を生成すれば、該軌道(定常歩容の初期時刻の近辺の軌道)から定常歩容の初期時刻での遊脚側の足平位置姿勢の時間的変化率を算出することができる。 In addition, the temporal change rate of the foot position / posture on the free leg side at the initial time of the normal gait is changed from the initial supporting leg foot position / posture of the current time's gait to the free leg foot position / posture at the end of the first turning gait. Foot position / posture trajectory (trajectory viewed from the next time's gait supporting leg coordinate system) using a finite time settling filter, foot position / posture time at the initial time of the trajectory (initial time of the normal gait) Calculated as the rate of change. In this case, of the foot position / posture trajectory from the current foot gait initial supporting leg foot position / posture to the first swing gait end free leg foot position / posture, the initial time of the current time gait to the initial time of the normal gait. If the trajectory up to (or the time immediately after) is generated, the temporal change in the foot position and posture on the free leg side from the trajectory (the trajectory near the initial time of the normal gait) to the initial time of the normal gait The rate can be calculated.
また、腕姿勢の初期状態は、図11のS104で決定した腕姿勢軌道パラメータに基づいて、定常歩容の初期時刻における腕姿勢(上体24に対する両腕体の全体重心位置等)と該初期時刻の直後の期間の腕姿勢の変化量とを求めることで決定される。 Further, the initial state of the arm posture is based on the arm posture trajectory parameter determined in S104 of FIG. 11 and the arm posture at the initial time of the normal gait (the position of the center of gravity of both arms relative to the upper body 24) and the initial state. It is determined by obtaining the change amount of the arm posture in the period immediately after the time.
また、上体姿勢角の初期状態は、図11のS102で決定した上体姿勢軌道パラメータ基づいて、定常歩容の初期時刻における上体姿勢角と該初期時刻の直後の期間の上体姿勢角の変化量とを求めることで決定される。なお、本実施形態では、上体姿勢軌道パラメータにより規定される上体姿勢は、定常的に上体24の体幹軸が鉛直方向に向く姿勢であるので、定常歩容の初期時刻での上体姿勢角およびその角速度は、いずれも“0”である。
Further, the initial state of the body posture angle is based on the body posture trajectory parameter determined in S102 of FIG. 11 and the body posture angle at the initial time of the normal gait and the body posture angle in the period immediately after the initial time. It is determined by calculating the amount of change. In the present embodiment, the body posture defined by the body posture trajectory parameter is a posture in which the trunk axis of the
次いで歩容生成装置100は、S202において初期上体水平位置速度の候補(定常歩容の初期時刻での上体24の水平位置及び水平速度の候補)である(Xs,Vxs)(Xs:水平位置、Vxs:水平速度)を仮決めする。ここで仮決めする候補(Xs,Vxs)は、任意でよいが、例えば前回歩容の生成時に求めた定常歩容の初期状態における上体水平位置速度の候補(Xs,Vxs)として仮決めすればよい。
Next, in S202, the
尚、説明を簡略にするため、サジタルプレーン上でX軸方向(ロール軸方向)での定常歩容の初期状態(初期上体水平位置速度)を探索する場合を例にとって説明する。ただし、実際には位置・速度のいずれについても、X軸方向(ロール軸方向)と、Y軸方向(ピッチ軸方向)とで別々に、あるいは同時に定常歩容の初期状態(定常歩容の前記境界条件を満たす初期状態)を探索する必要がある。 In order to simplify the description, a case where an initial state (initial body horizontal position speed) of a normal gait in the X-axis direction (roll axis direction) is searched on the sagittal plane will be described as an example. However, in actuality, in any of the position and speed, the initial state of the normal gait (the normal gait described above) is separately or simultaneously in the X-axis direction (roll axis direction) and the Y-axis direction (pitch axis direction). It is necessary to search for an initial state satisfying the boundary condition.
探索的な決定手法としては、擬似ヤコビアン(感度マトリックス)を求め、最急降下法などにより次候補を決定する方法や、シンプレックス法などを用いればよい。本実施形態では、例えば最急降下法を用いる。 As an exploratory determination method, a pseudo Jacobian (sensitivity matrix) is obtained, and the next candidate is determined by the steepest descent method or the simplex method. In the present embodiment, for example, the steepest descent method is used.
次いで、S204を経てS206に進み、定常歩容の初期時刻での上体24の鉛直位置(Z軸方向位置)Zs及び鉛直速度(Z軸方向速度)Vzsの組である初期上体鉛直位置速度(Zs,Vzs)が決定される。
Next, the process proceeds to S206 via S204, and the initial body vertical position velocity which is a set of the vertical position (Z-axis direction position) Zs and the vertical velocity (Z-axis direction velocity) Vzs of the
初期上体鉛直速度Vzsは、本実施形態では例えば以下のように決定される。 The initial body vertical velocity Vzs is determined in the present embodiment as follows, for example.
ロボット1には、動力学的関係として、次式が成立する。
The following formula is established for the
終端全体重心鉛直位置−初期全体重心鉛直位置
=(床反力鉛直成分/ロボットの全体質量)の2階積分
+重力加速度の2階積分
+初期全体重心鉛直速度*1歩の時間
…式13
(ただし、重力加速度は負の値とする。)
また、定常歩容では、終端全体重心鉛直位置と初期全体重心鉛直位置は一致するので、上式13の右辺は零にならなければならない。したがって、これらの関係から初期全体重心鉛直速度を求めることができる。具体的には、まず、前記図11のS104で決定した床反力鉛直成分軌道パラメータによって算出される床反力鉛直成分をロボット1の全体質量で割った値を、定常歩容の初期から終端までの期間において2階積分することにより、床反力鉛直成分による全体重心移動量(式13の右辺第1項)が求められる。
Terminal total center-of-gravity vertical position-initial total center-of-gravity vertical position = (floor reaction force vertical component / total mass of robot) second-order integration + second-order integration of gravity acceleration + initial total center-of-gravity vertical speed * time of one step
... Formula 13
(However, gravity acceleration is a negative value.)
Further, in the normal gait, the terminal overall center-of-gravity vertical position matches the initial overall center-of-gravity vertical position, so the right side of the above equation 13 must be zero. Accordingly, the initial overall center-of-gravity vertical velocity can be obtained from these relationships. Specifically, first, a value obtained by dividing the floor reaction force vertical component calculated by the floor reaction force vertical component trajectory parameter determined in S104 of FIG. 11 by the total mass of the
さらに、重力加速度を定常歩容の初期から終端までの期間において2階積分することにより、重力による全体重心移動量(式13の右辺第2項)が求められる。そして、上記の如く求めた、床反力鉛直成分による全体重心移動量と重力による全体重心移動量との和の符号を反転させたものを、定常歩容の1周期Tcycの時間で割ることにより、初期全体重心鉛直速度が求められる。 Furthermore, the total center-of-gravity movement amount (the second term on the right side of Equation 13) due to gravity is obtained by second-order integration of the gravitational acceleration during the period from the beginning to the end of the normal gait. Then, the result obtained by inverting the sign of the sum of the total center of gravity movement due to the floor reaction force vertical component and the total center of gravity movement due to gravity, obtained as described above, is divided by the time of one cycle Tcyc of the normal gait. The initial overall center-of-gravity vertical velocity is determined.
そして、本実施形態では、例えば、上体24と他の部位(脚体2,2や腕体)とに質点を有する多質点モデル(幾何学モデル)を用い、該多質点モデルの重心点の鉛直速度が上記初期全体重心鉛直速度に一致するような上体24の鉛直速度を、S200で決定した足平位置姿勢、腕姿勢等の初期状態と、S202(又は後述のS218)で決定された初期上体水平位置速度(Xs,Vxs)とを基に求め、その求めた鉛直速度を初期上体鉛直速度Vzsとして決定する。
In the present embodiment, for example, a multi-mass point model (geometric model) having mass points on the
上記多質点モデルとしては、例えば、上体24の質量(又は上体24と腕体とを合わせた質量)を有する1つの上体質点と、両脚体2,2のそれぞれの質量を有する2つの脚質点とから構成される3質点モデルが挙げられる。この場合、例えば、上体質点の位置は、上体24の位置姿勢に応じて規定され、各脚質点の位置は、各脚体2の足平位置姿勢に応じて規定されるものとする。このような3質点モデルを用いた場合には、上記の如く求めた初期全体重心鉛直速度と、足平位置姿勢の初期状態とを基に、上体質点の鉛直速度を算出できる。そして、その上体質点の鉛直速度と、S200で決定された上体姿勢角の初期状態とを基に、初期上体鉛直速度Vzsを決定することが可能である。
As the multi-mass point model, for example, one upper mass point having the mass of the upper body 24 (or the total mass of the
なお、より多くの質点を有する多質点モデル(例えばロボット1の各リンクに質点を有する幾何学モデル)を用いることによってより正確に、初期上体鉛直速度Vzsを決定するようにしてもよい。また、ロボット1の上体24以外の部位の質量が上体24に比して十分に小さいような場合には、例えばロボット1の全体重心の鉛直速度が上体24の鉛直速度にほぼ一致すると見なし、上記初期全体重心鉛直速度を、そのまま初期上体鉛直速度Vzsとして決定するようにしてもよい。
Note that the initial body vertical velocity Vzs may be determined more accurately by using a multi-mass point model having more mass points (for example, a geometric model having a mass point at each link of the robot 1). Further, when the mass of the part other than the
一方、定常歩容の初期上体鉛直位置Zsは、例えば本出願人が先に特開平10−86080号公報で提案した上体高さ決定手法を用いて決定される。このとき、初期時刻における足平位置姿勢(前記図11のS100で決定した第1旋回歩容初期支持脚足平位置姿勢及び第1旋回歩容初期遊脚足平位置姿勢)と、各脚体2の膝部の曲げ角に関する所定の幾何学的条件とに基づいて、初期時刻での各脚体2,2の膝部が伸び切らないような初期上体鉛直位置Zsが決定される。例えば、支持脚側脚体2の膝曲げ角をθsup、遊脚側脚体2の膝曲げ角をθswgとしたとき、それらの膝曲げ角θsup,θswgの正弦関数値の逆数の和がある所定値(有限値)になるように、初期上体鉛直位置が決定される。ここで、膝曲げ角θsup,θswgは、各脚体2の大腿部の軸心に対する下腿部の軸心の角度であり、各脚体2が伸びきった状態から膝部を曲げていくに伴い、“0”から増加していく角度である。なお、このような上体24の鉛直位置の決定手法は、上記特開平10−86080号公報に詳細に説明されているので、ここでは以上の説明に留める。
On the other hand, the initial body vertical position Zs of the normal gait is determined using, for example, the body height determination method previously proposed by the present applicant in Japanese Patent Laid-Open No. 10-86080. At this time, the foot position / posture at the initial time (the first foot position / posture of the first support gait initially determined in S100 of FIG. 11 and the foot position / posture of the first swing gait initial free leg) and each leg The initial body vertical position Zs at which the knees of the
補足すると、ロボット1は、片脚当たり6自由度であることから、足平位置姿勢軌道および上体位置姿勢軌道の初期状態(位置姿勢とその時間的変化率)が与えられれば、ロボット1の上体24及び脚体2,2の運動の初期状態は一義的にすべて決定されることになる。したがって、例えば、上体24及び脚体2,2の全体の質量がロボット1の全体の質量にほぼ一致するような場合には、上体24及び脚体2,2の運動の初期状態が与えられれば、初期全体重心鉛直速度も一義的に決定される。逆に、片脚当たり6自由度であることから、足平位置姿勢軌道および上体位置姿勢軌道の初期状態の内で速度に関する状態のひとつ(例えば初期上体鉛直速度)が未定であっても、初期全体重心鉛直速度が与えられれば、未定の初期状態は一義的に決定される。
Supplementally, since the
S206の処理の後、次いでS208に進み、定常歩容の候補としての歩容(定常歩容の1歩分(1周期分)の歩容)が仮に生成される。より具体的には、図9のS022で決定した定常歩容パラメータを基に、初期時刻から終端時刻までの各瞬間における目標ZMP、目標床反力鉛直成分、目標足平位置姿勢、目標上体姿勢および目標腕姿勢の瞬時値が逐次求められる。そして、求めた目標ZMPと目標床反力鉛直成分とを満足するように、図10に示した動力学モデル(倒立振子モデル)を用いて上体位置を逐次決定することによって、定常歩容の初期時刻から終端時刻までの歩容を生成する。この場合、前記初期上体水平位置速度(Xs,Vxs)、初期上体鉛直位置速度(Zs,Vzs)が上体24の位置及び速度の初期状態として設定される。
After the process of S206, the process then proceeds to S208, and a gait as a normal gait candidate (a gait for one normal gait (one cycle)) is temporarily generated. More specifically, based on the normal gait parameters determined in S022 of FIG. 9, the desired ZMP, the desired floor reaction force vertical component, the desired foot position / posture, the desired body at each moment from the initial time to the end time. Instantaneous values of posture and target arm posture are obtained sequentially. Then, by sequentially determining the body position using the dynamic model (inverted pendulum model) shown in FIG. 10 so as to satisfy the obtained target ZMP and the desired floor reaction force vertical component, A gait from the initial time to the end time is generated. In this case, the initial body horizontal position speed (Xs, Vxs) and the initial body vertical position speed (Zs, Vzs) are set as the initial state of the position and speed of the
尚、この歩容生成は歩容生成装置100の内部で行われるだけであって、実際のロボット1を駆動するための目標値として、歩容生成装置100から出力されることはない。
The gait generation is only performed inside the
S208の処理は、具体的には、図16のフローチャートに示す如く実行される。 Specifically, the process of S208 is executed as shown in the flowchart of FIG.
以下説明すると、歩容生成装置100は、まず、S300において、諸々の初期化を行なう。具体的には、歩容生成用時刻Tkが定常歩容の初期時刻Tsに初期化される。さらに、上体水平位置速度に、初期上体水平位置速度(Xs,Vxs)の最新の候補値(図15のS202もしくは後述のS216もしくはS218で決定された最新の候補値)が代入され、上体鉛直位置速度に、初期上体鉛直位置速度(Zs,Vzs)の最新値(図15のS206で決定された最新値)が代入される。また、上体姿勢角には、基準上体姿勢角の初期値、上体姿勢角速度には、基準上体姿勢角速度の初期値が代入される。
In the following, the
次いで、S302を経てS304において、歩容生成装置100は、歩容生成用時刻Tk(現在値)が終端時刻Te(=Ts+Tcyc)以前の時刻であるか否か(Tk≦Teであるか否か)を判断する。この判断結果が肯定的である場合には、歩容生成装置100は、S306〜S316の処理(詳細は後述する)を実行することによって、時刻Tkでの歩容の瞬時値を決定する。
Next, in S304 via S302, the
次いでS318に進み、歩容生成装置100は、歩容生成用時刻Tkを所定の刻み時間ΔTkだけ増加させた後、S304の判断を再び行なう。ここで、刻み時間ΔTkは、例えば制御周期Δtと一致させておけばよい。ただし、演算量を低減するために、ΔTkをΔtよりも長い時間に設定してもよい。
Next, in S318, the
S304の判断結果が肯定的である場合には、S306からS318までの処理が繰り返され、S304の判断結果が否定的になった場合には、図16の処理、すなわち、図15のS208の処理は終了する。これにより、定常歩容の初期時刻から終端時刻までの1周期分の定常歩容(仮の定常歩容)の生成が完了する。 If the determination result in S304 is affirmative, the processes from S306 to S318 are repeated. If the determination result in S304 is negative, the process in FIG. 16, that is, the process in S208 in FIG. Ends. Thereby, generation of a normal gait for one cycle from the initial time to the end time of the normal gait (temporary normal gait) is completed.
歩容生成装置100は、上記S306〜S316で仮の定常歩容の瞬時値を決定する処理を次のように実行する。まずS306において、歩容生成装置100は、定常歩容パラメータ(より詳しくは床反力鉛直成分軌道パラメータ)を基に、図13に示した目標床反力鉛直成分軌道の時刻Tkでの瞬時値を求める。
The
さらに、S308において、歩容生成装置100は、定常歩容パラメータ(より詳しくはZMP軌道パラメータ)を基に、図14に示した目標ZMP軌道の時刻Tkでの瞬時値を求める。
Further, in S308, the
次いでS308に進み、歩容生成装置100は、定常歩容パラメータ(より詳しくは足平軌道パラメータ、上体姿勢軌道パラメータ、及び腕姿勢軌道パラメータ)を基に、目標足平位置姿勢(支持脚側及び遊脚側の両方の目標足平位置姿勢)、目標上体姿勢および目標腕姿勢の時刻Tkでの瞬時値をそれぞれ求める。ただし、目標腕姿勢に関しては、より詳しくは両腕体の全体重心位置が決定されるが、鉛直軸(または上体24の体幹軸)まわりの角運動量を変化させる腕体の運動(腕振り運動)は、未だ決定されない。
Next, in S308, the
次いでS310に進み、歩容生成装置100は、S306で求めた目標床反力鉛直成分を満足する(ロボット1の全体重心の鉛直方向の慣性力と重力との和を目標床反力鉛直成分に釣り合わせる)ように、時刻Tkでの上体鉛直位置を算出する。
Next, in S310, the
具体的には、次式15および式16で表される動力学関係式(鉛直方向でのニュートンの運動方程式を離散化した式)を用いてロボット1の全体重心鉛直速度と全体重心鉛直位置とが算出される。 Specifically, using the dynamic relational expression expressed by the following expressions 15 and 16 (an expression obtained by discretizing Newton's equation of motion in the vertical direction), the total center-of-gravity vertical velocity and the total center-of-gravity vertical position Is calculated.
時刻Tkにおける全体重心鉛直速度
=時刻(Tk−ΔTk)における全体重心鉛直速度
+((時刻Tkにおける床反力鉛直成分/ロボットの全体質量)+重力加速度)*ΔTk
(ただし、重力加速度は負の値とする。)
…式15
時刻Tkにおける全体重心鉛直位置
=時刻(Tk−ΔTk)における全体重心鉛直位置
+時刻Tkにおける全体重心鉛直速度*ΔTk
…式16
そして、本実施形態では、歩容生成装置100は、上記の如く算出した時刻Tkでの全体重心鉛直位置と、目標足平位置姿勢と、基準上体姿勢(目標上体姿勢)とを基に、例えば、前記した3質点モデル(S206の処理に関して説明した3質点モデル)を用いて上体鉛直位置を求める。この場合、目標足平位置姿勢に基づき、3質点モデルにおける2つの脚質点の位置が決定される。さらに、この3質点モデルにおける全体重心の鉛直位置が、上記の如く求めた時刻Tkでの全体重心鉛直位置に一致するような上体質点の鉛直位置が決定される。そして、この上体質点の鉛直位置と目標上体姿勢(基準上体姿勢)とから上体鉛直位置が決定される。
Total center-of-gravity vertical velocity at time Tk = total center-of-gravity vertical velocity at time (Tk−ΔTk) + ((floor reaction force vertical component at time Tk / total mass of robot) + gravity acceleration) * ΔTk
(However, gravity acceleration is a negative value.)
... Formula 15
Overall center of gravity vertical position at time Tk = Overall center of gravity vertical position at time (Tk−ΔTk) + Overall center of gravity vertical speed at time Tk * ΔTk
... Formula 16
In this embodiment, the
なお、より多くの質点を有する多質点モデル(例えばロボット1の各リンクに質点を有するモデル)を用いることによって、より正確に上体鉛直位置を求めるようにしてもよい。また、上体24以外の部位の質量が上体24に比して十分に小さいような場合には、簡略的に、全体重心鉛直位置が、上体24の重心の鉛直位置に一致するものとみなし、該全体重心鉛直位置と、目標上体姿勢(基準上体姿勢)とから上体鉛直位置を決定するようにしてもよい。
Note that the body vertical position may be obtained more accurately by using a multi-mass point model having more mass points (for example, a model having a mass point at each link of the robot 1). In addition, when the mass of a part other than the
次いでS314に進み、歩容生成装置100は、目標ZMPを満足するように(ロボット1の慣性力と重力との合力が目標ZMPまわりに発生するモーメントの水平成分が“0”であるという動力学的平衡条件を満足するように)、時刻Tkでの上体水平加速度(上体24の水平方向の加速度)を決定する。
Next, the process proceeds to S314, where the
この時点において、定常歩容(仮の定常歩容)の足平位置姿勢、腕姿勢、上体姿勢および上体鉛直位置の瞬時値(現在時刻Tkでの値)が決定されているので、残りの上体水平位置を決定すれば、鉛直軸まわりの角運動量を変化させる腕体の運動自由度を除いて、ロボット1の全体の目標運動が決定されることとなる。したがって、上体水平位置を決定すれば、床反力の鉛直軸まわりのモーメントを除き、すべての床反力も一義的に決定される。
At this time, the instantaneous values (values at the current time Tk) of the foot position / posture, arm posture, body posture, and body vertical position of the normal gait (provisional normal gait) have been determined. If the upper body horizontal position is determined, the overall target motion of the
なお、本実施形態では、定常歩容(仮の定常歩容)の目標床反力鉛直成分及び目標ZMPは、それぞれ前記図9のS022で決定した定常歩容パラメータの床反力鉛直成分軌道パラメータ、目標ZMP軌道パラメータによって規定される。したがって、上体水平位置の決定に応じて従属的に決定される床反力は、床反力水平成分のみである。 In the present embodiment, the target floor reaction force vertical component and the target ZMP of the normal gait (temporary normal gait) are the floor reaction force vertical component trajectory parameters of the normal gait parameters determined in S022 of FIG. , Defined by the target ZMP trajectory parameters. Therefore, the floor reaction force that is subordinately determined according to the determination of the horizontal body position is only the floor reaction force horizontal component.
補足すると、本実施形態のロボット1は、各脚体2の自由度が6自由度であることから、目標足平位置姿勢と目標上体位置姿勢とを決定すれば、各脚体2の各部の位置姿勢も一義的に決定されることとなる。なお、鉛直軸まわりの角運動量を変化させる腕の運動自由度は、後述するように、スピン力を打ち消すために用いられる。
Supplementally, since the
S314では、例えば図8の動力学モデル(倒立振子モデル)に係わる前記式04を用いて上体水平加速度が求められる。より具体的には、現在時刻Tkの上体鉛直位置と、時刻(Tk−ΔTk)の上体水平位置と、現在時刻Tkの目標上体姿勢とから、現在時刻Tkでの上体質点24bの鉛直位置及び水平位置が決定される。なお、時刻(Tk−ΔTk)までの上体水平位置の時系列又は時刻(Tk−ΔTk)での歩容状態を基に時刻Tkでの上体水平位置を補間的に推定し、その推定した上体水平位置を時刻(Tk−ΔTk)の上体水平位置の代わりに用いてもよい。
In S314, for example, the body horizontal acceleration is obtained using the above-described equation 04 related to the dynamic model (inverted pendulum model) of FIG. More specifically, the
また、現在時刻Tkでの床反力鉛直成分から、上体質点24bに作用する重力(=mb*g)を差し引いた値を、上体質点24bの質量mbにより除算することによって、現在時刻Tkでの上体質点24bの鉛直加速度が求められる。
Further, the value obtained by subtracting the gravity (= mb * g) acting on the
そして、上記の如く求めた上体質点24bの鉛直位置、水平位置、鉛直加速度をそれぞれ、前記式04のZb、Xb、d2Zb/dt2に代入すると共に、現在時刻Tkでの目標ZMPの水平位置および鉛直位置を式04のXzmp,Zzmpに代入し、さらに、同式04のMzmp_yを“0”にしてなる式を、d2Xb/dt2について解くことにより、現在時刻Tkでの上体質点水平加速度d2Xb/dt2が算出される。そして、この上体質点水平加速度d2Xb/dt2が現在時刻kでの上体水平加速度として求められる。
Then, the vertical position, the horizontal position, and the vertical acceleration of the
尚、より厳密な動力学モデルを用いて、目標ZMPまわりの床反力モーメントの水平成分を“0”にするような上体水平加速度を探索的に求めるようにしてもよい。 It should be noted that the body horizontal acceleration may be obtained in an exploratory manner so that the horizontal component of the floor reaction force moment around the target ZMP is set to “0” using a stricter dynamic model.
次いでS316に進み、歩容生成装置100は、S314で求めた上体水平加速度を2階積分することにより現在時刻Tkでの上体水平位置を算出する。より詳しくは、上体水平加速度に刻み時間ΔTkを乗じてなる値を時刻Tk−ΔTkでの上体水平速度に加算することによって、現在時刻Tkでの上体水平速度が求められる。さらにその上体水平速度に刻み時間ΔTkを乗じてなる値を時刻Tk−ΔTkでの上体水平位置に加算することによって現在時刻Tkでの上体水平位置が求められる。
Next, proceeding to S316, the
以上がS306〜S316で実行される歩容の生成処理の詳細である。 The above is the details of the gait generation process executed in S306 to S316.
図15のS208の処理を完了した後、S210に進み、歩容生成装置100は、生成した歩容(仮定常歩容)の終端上体水平位置・速度を、その瞬間の支持脚に対応する支持脚座標系(図12のX'''軸及びY'''軸を水平方向の2軸とする支持脚座標系)から見た値に変換し、その値を(Xe,Vxe)とする(Xe:終端上体水平位置、Vxe:終端上体水平速度)。
After completing the process of S208 in FIG. 15, the process proceeds to S210, in which the
次いでS212に進み、図示の如く、歩容生成装置100は、初期上体水平位置速度(Xs,Vxs)と終端上体水平位置速度(Xe,Vxe)との差を算出する。この差(Xs−Xe,Vxs−Vxe)を上体水平位置速度境界条件誤差(errx,errv)と呼ぶ。定常歩容は、前記境界条件を満たす歩容であるので、(Xs,Vxs)と(Xe,Vxe)とが一致している必要がある。従って、上体水平位置速度境界条件誤差(errx,errv)が零またはほぼ零である必要がある。本実施形態では、以下のように、上体水平位置速度境界条件誤差(errx,errv)がほぼ零となる(Xs,Vxs)が探索的に求められる。
Next, in S212, the
次いでS214に進み、歩容生成装置100は、上体水平位置速度境界条件誤差(errx,errv)が、あらかじめ適宜設定された許容範囲内にあるか否か(errx,errvのいずれもが、許容範囲内にあるか否か)を判断する。
Next, in S214, the
S214の判断結果が否定的であるときにはS216に進む。このS216では、(Xs,Vxs)の近辺に複数(本実施形態では2つ)の初期値候補(Xs+ΔXs,Vxs),(Xs,Vxs+ΔVxs)が決定される。ここで、ΔXs,ΔVxsは、それぞれXs,Vxsに対する所定の微小変化量を意味している。そして、これらの初期値候補のそれぞれを上体水平位置速度の初期状態として、前記S208と同様の処理によって定常歩容(仮定常歩容)が歩容パラメータを用いて生成される。さらに、その生成された定常歩容の終端上体位置速度を、その瞬間の支持脚に対応する支持脚座標系(図12のX'''軸及びY'''軸を水平方向の2軸とする支持脚座標系)から見た値に変換した値(Xe+ΔXe1,Vxe+ΔVxe1),(Xe+ΔXe2,Vxe+ΔVxe2)が求められる。ここで、(Xe+ΔXe1,Vxe+ΔVxe1)は(Xs+ΔXs,Vxs)に対応する終端上体位置速度を意味し、(Xe+ΔXe2,Vxe+ΔVxe2)は(Xs,Vxs+ΔVxs)に対応する終端上体位置速度を意味している。なお、この場合の定常歩容(仮定常歩容)の生成処理では、上体水平位置速度以外の状態量の初期状態は、例えば上体水平位置速度の初期値候補を(Xs,Vxs)とした場合と同一に設定すればよい。S216ではさらに、前記S210と同様の処理によって、各初期値候補とこれに対応する終端上体位置速度との差、すなわち、各初期値候補(Xs+ΔXs,Vxs),(Xs,Vxs+ΔVxs)のそれぞれに対応する上体水平位置速度境界条件誤差が求められる。 If the determination result in S214 is negative, the process proceeds to S216. In S216, a plurality (two in the present embodiment) of initial value candidates (Xs + ΔXs, Vxs) and (Xs, Vxs + ΔVxs) are determined in the vicinity of (Xs, Vxs). Here, ΔXs and ΔVxs mean predetermined minute change amounts with respect to Xs and Vxs, respectively. Then, with each of these initial value candidates as the initial state of the body horizontal position speed, a normal gait (assumed normal gait) is generated using the gait parameters by the same process as in S208. Furthermore, the terminal body position speed of the generated normal gait is represented by the support leg coordinate system corresponding to the instantaneous support leg (the X ′ ″ axis and the Y ′ ″ axis in FIG. 12 are two horizontal axes). (Xe + ΔXe1, Vxe + ΔVxe1) and (Xe + ΔXe2, Vxe + ΔVxe2) converted to values viewed from the support leg coordinate system (1). Here, (Xe + ΔXe1, Vxe + ΔVxe1) means the terminal body position velocity corresponding to (Xs + ΔXs, Vxs), and (Xe + ΔXe2, Vxe + ΔVxe2) means the terminal body position velocity corresponding to (Xs, Vxs + ΔVxs). . In the normal gait (assumed normal gait) generation process in this case, the initial state of the state quantity other than the body horizontal position speed is, for example, the initial value candidate of the body horizontal position speed is (Xs, Vxs). What is necessary is just to set to the same case. Further, in S216, by the same process as in S210, the difference between each initial value candidate and the corresponding terminal body position velocity, that is, each of the initial value candidates (Xs + ΔXs, Vxs) and (Xs, Vxs + ΔVxs) is determined. The corresponding body horizontal position velocity boundary condition error is determined.
次いでS218に進み、歩容生成装置100は、(Xs,Vxs)およびその付近の初期値候補(Xs+ΔXs,Vxs),(Xs,Vxs+ΔVxs)のそれぞれに対する上体水平位置速度境界条件誤差を基に、(Xs,Vxs)の次の初期値候補を探索法により決定する。該探索法としては、擬似ヤコビアン(感度マトリックス)を求め、最急降下法などにより次候補を決定する方法や、シンプレックス法などを用いることができる。例えば、(Xs,Vxs)およびその付近の初期値候補(Xs+ΔXs,Vxs),(Xs,Vxs+ΔVxs)のそれぞれに対する上体水平位置速度境界条件誤差によって、上体水平位置及び上体水平速度をそれぞれ初期値候補(Xs,Vxs)から微小変化させたときの、上体水平位置速度境界条件誤差の変化度合いを示す感度マトリックスが求められる。そして、その感度マトリックスに基づいて、上体水平位置速度境界条件誤差をより小さくするような初期値候補(Xs,Vxs)が新たに決定される。このように上体水平位置速度の新たな初期値候補(Xs,Vxs)が決定された後、S206に戻る。
Next, the process proceeds to S218, where the
S214の判断結果が否定的となる限りは歩容生成装置100は、S206〜S218の処理を繰り返す。そして、S214の判断結果が肯定的になると、繰り返しループ(S204)を抜けてS220に進む。この場合、S204の繰り返しループを抜けたときの直前に生成された仮定常歩容が、境界条件を満たす定常歩容として得られることとなる。
As long as the determination result in S214 is negative, the
S220では、S204の繰り返しループのS208で最終的に生成した仮定常歩容における初期上体水平位置速度の初期値候補(Xs,Vxs)と、初期上体鉛直位置速度(Zs,Vzs)とを、それぞれ求めるべき定常歩容の初期上体水平位置速度(X0,Vx0)、初期上体鉛直位置速度(Z0,Vz0)として決定する。 In S220, initial initial body horizontal position velocity initial value candidates (Xs, Vxs) and initial body vertical position velocity (Zs, Vzs) in the assumed normal gait finally generated in S208 of the iteration loop of S204 are obtained. The initial body horizontal position speed (X0, Vx0) and the initial body vertical position speed (Z0, Vz0) of the normal gait to be obtained are determined.
次いでS222に進み、歩容生成装置100は、定常歩容初期発散成分(定常歩容の初期時刻Tsでの発散成分の値)q0を算出する。
Next, in S222, the
ここで、本実施形態では、歩容の発散成分の値は、以下に説明するように定義される。そして、S222では、この定義に従って、定常歩容初期発散成分q0が算出される。 Here, in this embodiment, the value of the gait divergent component is defined as described below. In S222, the normal gait initial divergent component q0 is calculated according to this definition.
まず、図8の倒立振子モデルにおける上体質点24bの運動と、床反力モーメント(支持脚座標系の原点まわりの床反力モーメント)との間の関係を表す前記式03を、状態方程式により表現すると次式100となる。なお、ここでは、ロボット1の移動時の上体24の高さ(鉛直位置)の、平均的な高さに対する相対的な変動量(上体24の高さの分散)は十分に小さいものとして、式03の右辺の第2項のZbが、上体質点24bの平均的な高さとしてあらかじめ設定された一定値hに一致するものとしている。また、ここでは、前記式03の床反力モーメントMb_yを、倒立振子に対する入力モーメントとして、Minと表記している。
First, the equation 03 representing the relationship between the motion of the upper
この式100を離散時間系での表現に書き直すことによって、次式102の状態方程式が得られる。
By rewriting the
XVb(k+1)=A(k)*XVb(k)+B(k)*Min(k) ……式102
なお、添え字(k)、(k+1)を付した変数は、それぞれ、離散時間系のk番目の時刻での値、k+1番目の時刻での値を意味する。以降の説明では、k番目の時刻、k+1番目の時刻をそれぞれ、単に時刻k、時刻k+1、というように表現する場合がある。
XVb (k + 1) = A (k) * XVb (k) + B (k) * Min (k) (Formula 102)
The variables with suffixes (k) and (k + 1) mean the value at the kth time and the value at the (k + 1) time in the discrete time system, respectively. In the following description, the kth time and the (k + 1) th time may be expressed simply as “time k” and “time k + 1”, respectively.
式102におけるXVbは、式100に関するただし書きで定義した通り、上体質点24bの水平位置Xbと、その時間的変化率である水平速度Vxbとをそれぞれ状態変数とする状態変数ベクトル(縦ベクトル)である。
XVb in
また、式102におけるA(k)、B(k)は、それぞれ、2次の正方行列(状態遷移行列)、2次の縦ベクトルであり、それぞれの各成分値が以下の式104a〜104c,106a〜106cの如く決定されるものである。なお、ΔTは離散時間系の刻み時間であり、ω0は下記のただし書きの式108によって定義される角周波数値である。また、exp( )は、自然対数の底の指数関数である。
In addition, A (k) and B (k) in
この場合、式104a〜104c,106a〜106cと式108とから明らかなように、A(k),B(k)の各成分値は、上体質点24bの鉛直加速度d2Zb/dt2(鉛直方向の運動加速度d2Zb/dt2)の値に依存して定まる。従って、A(k),B(k)の各成分値は、上体質点24bの鉛直方向の慣性力(=−mb*d2Zb/dt2)に依存する値、すなわち該慣性力の関数値となる。なお、上体質点24aに作用する重力は一定値であるから、A(k),B(k)の各成分値は、別の言い方をすれば、上体質点24bの鉛直方向の慣性力と上体質点24bに作用する重力との合力、または、該合力に釣り合う床反力鉛直成分の関数値でもある。
In this case, as is clear from the equations 104a to 104c, 106a to 106c and the
補足すると、本実施形態の如く倒立振子の上体質点24bの質量mbがロボット1の全体質量に一致するものとした場合には、上体質点24bの鉛直方向の慣性力と上体質点24bに作用する重力との合力に釣り合う床反力鉛直成分は、ロボット1に作用する床反力鉛直成分(全床反力の並進床反力鉛直成分)に一致する。
Supplementally, when the mass mb of the upper
また、図5の走行歩容では、片脚支持期においてはg+d2Zb/dt2>0、空中期においてはg+d2Zb/dt2=0となる。 In the running gait of FIG. 5, g + d2Zb / dt2> 0 in the one-leg support period, and g + d2Zb / dt2 = 0 in the aerial period.
上記式102の状態方程式により表される系では、状態変数ベクトルXVbの初期値XVb(0)(k=0の時刻(時刻0)でのXVbの値)と、時刻0から時刻k−1までの入力モーメントMin(床反力モーメントの水平成分Mb_y)の時系列とが与えられたとき、任意の時刻k(>0)での状態変数ベクトルXVbの値XVb(k)は、次式110により与えられることとなる。
In the system represented by the state equation of the
なお、式110中のただし書きで定義したφ(k,j)に関しては、j=kの場合はφ(k,j)≡単位行列とする。
Note that φ (k, j) defined in the proviso in
次に、前記した定常歩容での倒立振子モデルの挙動に着目し、定常歩容の初期時刻Tsをk=0の時刻、定常歩容の終端時刻Te(=Ts+Tcyc)をk=kcyc(ただし、kcyc≡Tcyc/ΔT)の時刻とし、初期時刻Tsでの定常歩容の運動により規定される状態変数ベクトルXVbがXVb(0)であるとする。そして、定常歩容の終端時刻Te(k=kcycの時刻)における状態変数ベクトルXVbのうち、定常歩容の初期時刻Tsでの状態変数ベクトルの値XVb(0)に依存する成分をXVb(kcyc)とおく。このとき、XVb(kcyc)と、XVb(0)との間の関係は、上記式110に基づいて、次式112により表されることとなる。
Next, paying attention to the behavior of the inverted pendulum model in the normal gait described above, the initial time Ts of the normal gait is k = 0, the end time Te (= Ts + Tcyc) of the normal gait is k = kcyc (however, , Kcyc≡Tcyc / ΔT), and the state variable vector XVb defined by the motion of the normal gait at the initial time Ts is XVb (0). Then, among the state variable vector XVb at the normal gait termination time Te (time of k = kcyc), the component depending on the value XVb (0) of the state variable vector at the initial time Ts of the normal gait is XVb (kcyc )far. At this time, the relationship between XVb (kcyc) and XVb (0) is expressed by the following
XVb(kcyc)=φ(kcyc,0)*XVb(0) ……式112
ただし、φ(kcyc,0)=A(kcyc-1)*……*A(1)*A(0)
さらに、この式112の右辺の行列φ(kcyc,0)の2つの固有値をλ1,λ2、それぞれの固有値に対応する固有ベクトル(縦ベクトル)を(a11,a21)T、(a12,a22)T、これらの固有ベクトルをそれぞれ第1列、第2列とする2次の正方行列をΓcycとおき、この行列Γcycを用いてφ(kcyc,0)を対角化してなる行列をΛとおく。すなわち、Λを次式114により定義する。以降、行列Γcycを対角化用行列という。
XVb (kcyc) = φ (kcyc, 0) * XVb (0) ......
However, φ (kcyc, 0) = A (kcyc-1) * …… * A (1) * A (0)
Further, two eigenvalues of the matrix φ (kcyc, 0) on the right side of the
この式114と前記式112とから次式116が得られる。
From this expression 114 and the
Γcyc-1*XVb(kcyc)=Λ*Γcyc-1*XVb(0) ……式116
なお、上記対角化用行列Γcycによる対角化の対象とする行列φ(kcyc,0)は、前記式112のただし書きに示したように、定常歩容の1周期の初期時刻(時刻0)から、終端時刻(時刻kcyc)のまでの期間内の各時刻(詳しくは時刻0から時刻kcyc−1までの刻み時間ΔT毎の各時刻)での状態遷移行列A(0)、A(1)、……、A(kcyc-1)の積であるから、定常歩容の1周期の期間内での上体質点24bの慣性力の時系列に依存して定まるものとなる。従って、対角化用行列Γcycも、結果的に、その各成分値が定常歩容の1周期の期間内での上体質点24bの慣性力の時系列に依存して定まるものとなる。
Γcyc −1 * XVb (kcyc) = Λ * Γcyc −1 * XVb (0) (Formula 116)
Note that the matrix φ (kcyc, 0) to be diagonalized by the diagonalization matrix Γcyc is the initial time (time 0) of one cycle of the normal gait, as shown in the proviso of the
ここで、任意の時刻kでの状態変数ベクトルXVb(k)を、対角化用行列Γcycの逆行列Γcyc-1によって線形変換してなるベクトル(以降、変換状態変数ベクトルという)を(p(k),q(k))Tとおく。すなわち、変換状態変数ベクトル(p(k),q(k))Tを次式118により定義する。 Here, a vector obtained by linearly transforming the state variable vector XVb (k) at an arbitrary time k by the inverse matrix Γcyc −1 of the diagonalization matrix Γcyc (hereinafter referred to as a transformed state variable vector) (p ( k), q (k)) T. That is, the conversion state variable vector (p (k), q (k)) T is defined by the following equation 118.
(p(k),q(k))T≡Γcyc-1*XVb(k) ……式118
この式118と前記式116とから、次式120が得られる。
(p (k), q (k)) T ≡Γcyc −1 * XVb (k) ...... Formula 118
From the equation 118 and the equation 116, the following equation 120 is obtained.
(p(kcyc),q(kcyc))T=Λ*(p(0),q(0))T ……式120
この式120において、λ1>1であれば、p(kcyc)の絶対値>初期値p(0)の絶対値となり、λ1≦1であれば、p(kcyc)の絶対値≦初期値p(0)の絶対値となる。同様に、λ2>1であれば、q(kcyc)の絶対値>初期値q(0)の絶対値となり、λ2≦1であれば、q(kcyc)の絶対値≦初期値q(0)となる。
(p (kcyc), q (kcyc)) T = Λ * (p (0), q (0)) T ...... Equation 120
In Equation 120, if λ1> 1, the absolute value of p (kcyc)> the absolute value of initial value p (0). If λ1 ≦ 1, the absolute value of p (kcyc) ≦ initial value p ( The absolute value of 0). Similarly, if λ2> 1, the absolute value of q (kcyc)> the absolute value of initial value q (0). If λ2 ≦ 1, the absolute value of q (kcyc) ≦ initial value q (0). It becomes.
一方、本実施形態における定常歩容は、片脚支持期と空中期とを交互に繰り返す歩容(図5の走行歩容)であるから、g+d2Zb/dt2≦0となる状態に常に保持されるということはなく、g+d2Zb/dt2≦0となる状態と、g+d2Zb/dt2>0となる状態とが交互に生じると考えてよい。このような定常歩容では、一般にφ(kcyc,0)の2つの固有値λ1,λ2の一方が、“1”よりも大きい値となり、他方が“1”よりも小さい値となる。 On the other hand, the normal gait in the present embodiment is a gait that alternately repeats the one-leg support period and the aerial period (running gait in FIG. 5), and thus is always maintained in a state where g + d2Zb / dt2 ≦ 0. In other words, a state where g + d2Zb / dt2 ≦ 0 and a state where g + d2Zb / dt2> 0 occur alternately may be considered. In such a normal gait, one of the two eigenvalues λ1 and λ2 of φ (kcyc, 0) is generally a value greater than “1” and the other is a value smaller than “1”.
そこで、以降、λ1<1、λ2>1であるとする。すなわち、変換状態変数ベクトル(p(k),q(k))Tのうちの、第1成分p(k)が、“1”よりも小さい固有値λ1に対応する成分、第2成分q(k)が、“1”よりも大きい固有値λ2に対応する成分であるとする。このとき、p(k)は、無限に繰り返される定常歩容において収束性を有する運動成分の状態量としての意味を持ち、q(k)は、無限に繰り返される定常歩容において発散性を有する運動成分の状態量としての意味を持つ。 Therefore, hereinafter, it is assumed that λ1 <1 and λ2> 1. That is, in the conversion state variable vector (p (k), q (k)) T , the first component p (k) corresponding to the eigenvalue λ1 smaller than “1”, the second component q (k ) Is a component corresponding to an eigenvalue λ2 larger than “1”. At this time, p (k) has a meaning as a state quantity of a motion component having convergence in a normal gait repeated infinitely, and q (k) has a divergent property in a normal gait repeated infinitely. It has a meaning as a state quantity of the movement component.
そこで、本実施形態では、式118により定義した変換状態変数ベクトル(p(k),q(k))Tのうちの第2成分q(k)を前記発散成分として定義する。このようにして定義される発散成分q(k)は、状態変数Xb(k),Vxb(k)の線形結合値となる。この場合、その線形結合において、Xb(k),Vxb(k)にそれぞれ掛かる重み係数は、定常歩容の1周期の期間内での上体質点24bの慣性力の時系列に依存して定まるものとなる。なお、式118により定義した変換状態変数ベクトル(p(k),q(k))Tのうちの第1成分p(k)を収束成分と言う。
Therefore, in the present embodiment, the second component q (k) of the conversion state variable vector (p (k), q (k)) T defined by Expression 118 is defined as the divergent component. The divergent component q (k) defined in this way is a linear combination value of the state variables Xb (k) and Vxb (k). In this case, in the linear combination, the weighting coefficients respectively applied to Xb (k) and Vxb (k) are determined depending on the time series of the inertial force of the upper
なお、前記式118で定義される収束成分p(k)及び発散成分q(k)は、詳しくはサジタルプレーン上での収束成分q(k)及び発散成分q(k)(X軸方向での上体質点24bの水平位置Xbと水平速度Vxbとを成分とする状態変数ベクトルXVbに対応する収束成分及び発散成分)であるが、これと同様に、ラテラルプレーン上での収束成分及び発散成分も定義される。具体的には、式118の右辺の状態変数ベクトルXVb(k)の各成分Xb、Vxbをそれぞれ、Y軸方向での上体質点24bの水平位置と水平速度とに置き換えた式によって、ラテラルプレーン上での収束成分及び発散成分が定義される。この場合、式118の行列Γcyc-1はX軸方向及びY軸方向のいずれの軸方向に関しても同一である。
It should be noted that the convergence component p (k) and the divergence component q (k) defined by the equation 118 are more specifically expressed as the convergence component q (k) and the divergence component q (k) on the sagittal plane (in the X-axis direction). The convergence component and the divergence component corresponding to the state variable vector XVb having the horizontal position Xb and the horizontal velocity Vxb of the
以上説明した発散成分qの定義に従って、S222では、定常歩容初期発散成分q0は次のように算出される。 According to the definition of the divergent component q described above, in S222, the normal gait initial divergent component q0 is calculated as follows.
すなわち、歩容生成装置100は、定常歩容の初期時刻Tsから終端時刻Tsまでの1周期の期間内の刻み時間ΔT毎の各時刻Tk(離散時間系で言えばk=0の時刻からk=kcyc−1の時刻までの各時刻k)における上体質点24bの慣性力の瞬時値を、定常歩容パラメータを基に算出する。この場合、倒立振子の上体質点24bの質量mbがロボット1の全体の質量に一致するものとした場合には、定常歩容での上体質点24bの鉛直方向の慣性力と該上体質点24bに作用する重力との合力が、定常歩容における床反力鉛直成分に釣り合うものとなる。そこで、本実施形態では、歩容生成装置100は、定常歩容パラメータのうちの前記床反力鉛直成分軌道パラメータを基に、定常歩容の1周期の期間内の各時刻における床反力鉛直成分の瞬時値を算出する。該瞬時値は、図16のS306で算出される値と同じである。そして、歩容生成装置100は、その算出した床反力鉛直成分の各瞬時値を上体質点24bの質量mb(=ロボット1の全体質量)で除算してなる値を前記式100の(g+d2Zb/dt2)の値として、前記式104a〜104cによって、状態遷移行列A(k)(k=0,1,……,kcyc−1)を算出する。
In other words, the
なお、図5の走行歩容では、床反力鉛直成分は負の値となることはない。従って、実際上は、A(k)は式104a,104bのいずれかの式によって算出されることとなる。 In the running gait of FIG. 5, the floor reaction force vertical component does not take a negative value. Therefore, in practice, A (k) is calculated by one of the expressions 104a and 104b.
補足すると、前記した3質点モデルなどの多質点モデル(幾何学モデル)を用いて、定常歩容におけるロボット1の上体24の鉛直方向の慣性力(又は鉛直加速度)を算出し、その算出した慣性力(又は鉛直加速度)を、上体質点24bの慣性力(又は鉛直加速度)として用いることによって、各時刻での状態遷移行列A(k)(k=0,1,……,kcyc−1)を算出するようにしてもよい。例えば、前記3質点モデルを用いて、次のようにして、定常歩容における上体質点24bの慣性力の瞬時値を算出するようにしてもよい。すなわち、定常歩容の足平軌道パラメータを基に、前記3質点モデルにおける2つの脚質点の鉛直方向の慣性力の瞬時値を算出すると共に、床反力鉛直成分軌道を基に、ロボット1の全体重心の鉛直方向の慣性力の瞬時値を算出する。そして、全体重心の鉛直方向の慣性力の瞬時値から、2つの脚質点の鉛直方向の慣性力の瞬時値を差し引いたものを、上体質点24bの鉛直方向の慣性力の瞬時値として算出する。この場合には、上体質点24bの鉛直方向の慣性力と該上体質点24bに作用する重力との合力(あるいはg+d2Zb/dt2)が負の値となり得る。
Supplementally, the vertical inertia force (or vertical acceleration) of the
歩容生成装置100は、上記の如く定常歩容の初期時刻Tsから終端時刻Tsまでの1周期の期間におけるkcyc個のA(k)(k=0,1,…,kcyc−1)を算出した後、これらのA(k)を掛け合わせることによって、式112の右辺の行列φ(kcyc,0)(=A(kcyc-1)*…*A(1)*A(0))を算出する。
The
さらに歩容生成装置100は、この行列φ(kcyc,0)の固有値λ1,λ2と、これらに対応する固有ベクトル(a11,a21)T、(a12,a22)Tとを算出し、それらの固有ベクトルから、前記式114のただし書きに従って、前記対角化用行列Γcycを決定する。そして、歩容生成装置100は、この対角化用行列Γcycの逆行列Γcyc-1を算出する。
Furthermore, the
また、歩容生成装置100は、S220で決定した定常歩容の初期上体水平位置速度(X0,Vx0)と、定常歩容の上体姿勢角の初期状態とから、定常歩容の初期時刻Tsでの倒立振子の上体質点24bの水平位置及び水平速度の組である初期上体質点位置速度を決定する。
Also, the
そして、歩容生成装置100は、上記の如く求めた逆行列Γcyc-1と、初期上体質点水平位置速度とから、前記式118に基づいて定常歩容初期発散成分q0を算出する。より詳しくは、初期上体質点水平位置速度のX軸方向成分(X軸方向での状態量ベクトル)及びY軸方向成分(Y軸方向での状態量ベクトル)に、それぞれΓ-1を乗じることによって、X軸方向及びY軸方向の各軸方向での初期発散成分q0が算出される。
The
以上の如く定常歩容の初期発散成分q0を算出した後、S224に進み、歩容生成装置100は、定常歩容の初期発散成分q0を今回歩容支持脚座標系から見た値に変換し、これをq0”として求める。また、歩容生成装置100は、初期上体鉛直位置速度(Z0,Vz0)を今回歩容支持脚座標系から見た値に変換し、これを(Z0”,Vz0”)として求める。
After calculating the initial divergent component q0 of the normal gait as described above, the process proceeds to S224, and the
補足すると、(Z0”,Vz0”)は、第2旋回歩容の支持脚座標系(図12のX”軸、Y”軸を水平面の2軸とする支持脚座標系)から見た第2旋回歩容終端上体鉛直位置速度に一致する。また、q0”も第2旋回歩容の支持脚座標系から見た第2旋回歩容終端発散成分に一致している。したがって、これらの性質を用いて、(Z0”,Vz0”)およびq0”を算出するようにしても良い。 Supplementally, (Z0 ″, Vz0 ″) is the second view from the support leg coordinate system of the second turning gait (the support leg coordinate system having the X ″ axis and the Y ″ axis in FIG. 12 as two horizontal axes). It matches the body vertical position velocity at the end of the turning gait. Further, q0 ″ also coincides with the end divergent component of the second turning gait seen from the supporting leg coordinate system of the second turning gait. Therefore, using these properties, (Z0 ″, Vz0 ″) and q0 "May be calculated.
以上により、図9のS024の処理、すなわち定常歩容の初期状態を求めるサブルーチン処理が終了する。 Thus, the process of S024 in FIG. 9, that is, the subroutine process for obtaining the initial state of the normal gait is completed.
次いで、図9のS026に進み、歩容生成装置100は、今回歩容の歩容パラメータを決定(一部は仮決定)する。S026では、より具体的には、図17のフローチャートに示す処理が実行される。
Next, the process proceeds to S026 in FIG. 9, and the
まず、S600において、歩容生成装置100は、今回歩容の足平位置姿勢軌道が定常歩容の足平位置姿勢軌道につながるように、今回歩容の足平軌道パラメータを決定する。
First, in S600, the
具体的には、今回歩容初期遊脚足平位置姿勢(今回歩容の初期の遊脚足平位置姿勢)は、今回歩容支持脚座標系から見た前回歩容終端支持脚足平位置姿勢(現在の遊脚足平位置姿勢)に設定される。 Specifically, the initial free leg foot position / posture of the current time's gait (the initial free leg foot position / posture of the current time's gait) is the last leg support position of the last gait as viewed from the current time's gait support leg coordinate system. It is set to the posture (current free leg foot position / posture).
今回歩容初期支持脚足平位置姿勢(今回歩容の初期の支持脚足平位置姿勢)は、今回歩容支持脚座標系から見た前回歩容終端遊脚足平位置姿勢(現在の支持脚足平位置姿勢)に設定される。 This time's initial gait supporting leg foot position / posture (the initial supporting leg foot position / posture of the current time's gait). Leg foot position / posture).
また、今回歩容終端遊脚足平位置姿勢は、今回歩容支持脚座標系から見た次回歩容支持脚座標系(今回歩容に係わる1歩目の遊脚足平22の着地予定位置姿勢の要求値)に対応して決定される。すなわち、今回歩容終端遊脚足平位置姿勢から遊脚足平22を床に接触させたまま、すべらないように該足平22をその底面のほぼ全面が接地するまでピッチ方向に所定角度だけ回転させたときの、該足平22の代表点が今回歩容支持脚座標系から見た次回歩容支持脚座標系の原点に合致するように今回歩容終端遊脚足平位置姿勢が決定される。
Also, the free leg foot position / posture at the end of the current time's gait is the next gait supporting leg coordinate system viewed from the current time's gait supporting leg coordinate system (Required attitude value). That is, the
今回歩容終端では、支持脚足平22は離床して空中にある。支持脚足平22が離床してから後の軌道を決定するために、まず、次回歩容終端での今回歩容の支持脚足平22の位置姿勢、すなわち次回歩容終端遊脚足平位置姿勢が決定される。次回歩容終端遊脚足平位置姿勢は、今回歩容支持脚座標から見た次次回歩容支持脚座標(今回歩容に係わる2歩目の遊脚足平22の着地予定位置姿勢の要求値)に対応して決定される。より具体的には、次回歩容終端遊脚足平位置姿勢は、その位置姿勢から、足平22を床に接触させたまま、すべらないように該足平22をその底面のほぼ全面が床に接地するまでピッチ方向に所定角度だけ回転させたときの該足平22の代表点が今回歩容支持脚座標から見た次次回歩容支持脚座標の原点に合致するように決定される。
At this time, at the end of the gait, the supporting
そして、今回歩容終端支持脚足平位置姿勢は、上記の如く決定した今回歩容初期支持脚足平位置姿勢から、次回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道を、今回歩容終端まで前記有限時間整定フィルタにより生成することにより求められる。 And the current time gait support leg foot position / posture is the foot position / posture trajectory from the current time gait initial support leg foot position / posture determined as described above to the next time gait end free leg foot position / posture, This time is obtained by generating the gait end using the finite time settling filter.
次いで、S602に進み、歩容生成装置100は、今回歩容の上体姿勢軌道パラメータを決定する。この上体姿勢軌道パラメータは、それにより規定される上体姿勢軌道が、定常歩容の上体姿勢軌道に連続してつながる(今回歩容終端での上体姿勢角及び角速度がそれぞれ定常歩容初期の上体姿勢角及び角速度に一致する)ように決定される。この場合、本実施形態では、今回歩容の上体姿勢軌道パラメータにより規定される上体姿勢は、定常歩容の上体姿勢と同様に、定常的に一定姿勢である前記基準上体姿勢(上体24の体幹軸が鉛直方向を向く姿勢)に設定される。
Next, in step S602, the
なお、今回歩容の上体姿勢軌道は、定常歩容の上体姿勢軌道に連続的につながるように設定されておれば、今回歩容の初期から終端まで経時的に変化するように設定してもよい。 If the body posture trajectory of the current time's gait is set so as to be continuously connected to the body posture trajectory of the normal gait, the body posture trajectory of the current time's gait is set to change over time from the initial stage of the current time's gait. May be.
次いで、S604に進み、歩容生成装置100は、今回歩容の腕姿勢軌道パラメータを決定する。この腕姿勢軌道パラメータは、今回歩容の腕姿勢軌道が前記定常歩容の腕姿勢軌道に連続してつながるようにして、定常歩容の腕姿勢軌道パラメータと同様に決定される。
Next, in step S604, the
なお、ここで決定される今回歩容の腕姿勢軌道パラメータは、定常歩容の腕姿勢軌道パラメータと同様に、鉛直軸(あるいは上体24の体幹軸)まわりの両腕体の角運動量変化に関すること以外のパラメータ(例えば上体24に対する腕体の手先の相対高さや腕体全体の相対重心位置などを規定するパラメータ)である。
The arm posture trajectory parameter of the current time gait determined here is the change in angular momentum of both arms around the vertical axis (or the trunk axis of the upper body 24), similarly to the arm posture trajectory parameter of the normal gait. (For example, parameters defining the relative height of the hand of the arm body with respect to the
次いで、S606に進み、歩容生成装置100は、今回歩容の床反力鉛直成分軌道パラメータを、それにより規定される床反力鉛直成分軌道が前記図6に示した如く実質的に連続な軌道になるように決定する。ただし、今回歩容の床反力鉛直成分軌道パラメータは、今回歩容のロボット1の全体重心鉛直位置速度と床反力鉛直成分軌道とのいずれもが、前記定常歩容に連続してつながるように決定される。
Next, proceeding to S606, the
具体的には、まず、図9のS024の処理(定常歩容初期状態の決定処理)で最終的に求めた定常歩容の初期上体鉛直位置速度を今回歩容支持脚座標系から見た値に変換した値(Z0”,Vz0”)、すなわち、図15のS224で求めた(Z0”,Vz0”)等を基に、今回歩容支持脚座標系から見た定常歩容の初期全体重心鉛直位置速度が求められる。 Specifically, first, the initial body vertical position velocity of the normal gait finally obtained in the process of S024 in FIG. 9 (processing to determine the initial state of the normal gait) was viewed from the current time's gait support leg coordinate system. Based on the converted values (Z0 ″, Vz0 ″), that is, (Z0 ″, Vz0 ″) obtained in S224 of FIG. 15, etc., the entire initial gait as viewed from the current time's gait supporting leg coordinate system The center of gravity vertical position speed is obtained.
例えば、前記した3質点モデル(S206の処理に関して説明した3質点モデル)を用いて定常歩容の初期全体重心鉛直位置速度が求められる。この場合、今回歩容支持脚座標系から見た定常歩容初期の目標足平位置姿勢とその時間的変化率(変化速度)とに基づき、3質点モデルにおける2つの脚質点の位置・速度が求められる。さらに、上記(Z0”,Vz0”)と、定常歩容初期の上体姿勢角(=基準上体姿勢角)及びその時間的変化率とから、3質点モデルにおける上体質点の位置・速度が求められる。そして、これらの3つの質点の位置・速度から、その3質点の重心位置及び速度が、定常歩容の初期全体重心鉛直位置速度として算出される。 For example, the initial overall center-of-gravity vertical position velocity of the normal gait is obtained using the above-described three-mass model (the three-mass model described with respect to the processing of S206). In this case, based on the desired foot position / posture in the initial stage of the normal gait and its temporal change rate (change speed) as seen from the current time's gait supporting leg coordinate system, the position / speed of the two leg mass points in the three-mass model is Desired. Further, from the above (Z0 ″, Vz0 ″), the body posture angle (= reference body posture angle) at the beginning of the normal gait and its temporal change rate, the position / velocity of the body mass point in the 3-mass model is Desired. Then, from the positions and velocities of these three mass points, the centroid position and velocity of the three mass points are calculated as the initial overall centroid vertical position velocity of the normal gait.
なお、より多くの質点を有する多質点モデル(例えばロボット1の各リンクに質点を有する幾何学モデル)を用いることによってより正確に、定常歩容の初期全体重心鉛直位置速度を求めるようにしてもよい。また、上体24以外の部位の質量が上体24に比して十分に小さいような場合には、上記(Z0”,Vz0”)と、定常歩容初期の上体姿勢角(=基準上体姿勢角)及びその時間的変化率とから、定常歩容の初期全体重心鉛直位置速度を求めるようにしてもよい。
Note that the initial overall center-of-gravity vertical position velocity of the normal gait may be obtained more accurately by using a multi-mass point model having more mass points (for example, a geometric model having a mass point at each link of the robot 1). Good. When the mass of the part other than the
このようにして求めた定常歩容の初期全体重心鉛直位置速度を、前記式13と下記式41の終端全体重心鉛直位置速度に代入すると共に、前回歩容の瞬時値(より詳しくは、前回歩容の終端状態を今回歩容支持脚座標系から見た値)の全体重心鉛直位置および速度を、前記式13と下記式41の初期全体重心鉛直位置および速度に代入し、式13と式41の関係を満足するように、今回歩容の床反力鉛直成分軌道パラメータが決定される。ただし、式13と式41における積分値は今回歩容の初期から終端までの期間の積分値とする。 The initial total center-of-gravity vertical position speed of the normal gait thus determined is substituted into the terminal total center-of-gravity vertical position speed of Equation 13 and Equation 41 below, and the instantaneous value of the previous gait (more specifically, the previous step The total center-of-gravity vertical position and speed of the terminal end state of the gait supporting leg coordinate system) are substituted into the initial total center-of-gravity vertical position and speed of Expression 13 and Expression 41 below, and Expression 13 and Expression 41 The floor reaction force vertical component trajectory parameter of the current time's gait is determined so as to satisfy the above relationship. However, the integral values in Equation 13 and Equation 41 are the integral values during the period from the beginning to the end of the current time's gait.
終端全体重心鉛直速度−初期全体重心鉛直速度
=(床反力鉛直成分/ロボットの質量)の1階積分
+重力加速度の1階積分
…式41
(ただし、重力加速度は負の値とする。)
より具体的には、まず、図6に示したような床反力鉛直成分軌道を規定する床反力鉛直成分軌道パラメータ(折れ点の時刻等)のうちの、少なくとも2つのパラメータを独立な未知変数として、その未知変数の値を、式13と式41とからなる連立方程式を解くことによって決定する。
Final total center-of-gravity vertical velocity-initial total center-of-gravity vertical velocity = first-floor integral of (floor reaction force vertical component / robot mass) + first-floor integral of gravity acceleration
... Formula 41
(However, gravity acceleration is a negative value.)
More specifically, first, at least two parameters out of floor reaction force vertical component trajectory parameters (such as break point time) that define the floor reaction force vertical component trajectory as shown in FIG. As a variable, the value of the unknown variable is determined by solving simultaneous equations consisting of Equation 13 and Equation 41.
未知変数とする床反力鉛直成分軌道パラメータには、例えば、図6に示した床反力鉛直成分軌道における台形の高さ(床反力鉛直成分のピーク値)と幅(片脚支持期時間)とを選択すればよい。この場合、図6の台形の両側部分の傾きは今回歩容周期等に応じて決定した値とし、あるいは、片脚支持期から空中期に移行する時刻を除く床反力鉛直成分軌道の折れ点の時刻を今回歩容周期等に応じて決定した値とする。補足すると、未知変数を1つとすると、一般的には式13と式41の連立方程式を満足する解が存在しない。 The floor reaction force vertical component trajectory parameters as unknown variables include, for example, trapezoidal height (peak value of floor reaction force vertical component) and width (single leg support period time) in the floor reaction force vertical component trajectory shown in FIG. ) Can be selected. In this case, the slope of both sides of the trapezoid in FIG. 6 is a value determined according to the current time's gait cycle or the like, or the break point of the floor reaction force vertical component trajectory excluding the time of transition from the one-leg support period to the air period Is a value determined according to the current time's gait cycle or the like. Supplementally, if there is one unknown variable, there is generally no solution that satisfies the simultaneous equations of Equation 13 and Equation 41.
補足すると、本実施形態では、上記の如く決定される今回歩容の床反力鉛直成分軌道パラメータが、本発明における上下方向慣性力パラメータに相当する。従って、S606の処理によって、本発明における上下方向慣性力パラメータ決定手段が実現されることとなる。 Supplementally, in this embodiment, the floor reaction force vertical component trajectory parameter of the current time's gait determined as described above corresponds to the vertical inertia force parameter in the present invention. Therefore, the vertical inertia force parameter determining means in the present invention is realized by the processing of S606.
次いで、S608に進み、歩容生成装置100は、今回歩容のZMP軌道が、安定余裕が高くかつ急激な変化をしないように、該ZMP軌道を規定するZMP軌道パラメータ(ZMP軌道の折れ点の時刻や位置等)を決定する。例えば、ZMP軌道が、図7に示したようなパターンになるようにZMP軌道パラメータが仮決定される。ただし、今回歩容のZMP軌道が前記定常歩容のZMP軌道に連続してつながるように(今回歩容終端におけるZMPの位置が定常歩容初期のZMPの位置に一致するように)、今回歩容のZMP軌道パラメータが仮決定される。この場合、走行歩容では、片脚支持期におけるZMP軌道の折れ点の時刻や位置の設定の仕方は、前述した定常歩容のZMP軌道パラメータの設定の仕方と同様でよい。そして、空中期における目標ZMP軌道が、空中期開始時から、定常歩容初期のZMPの位置まで、直線的に連続して変化するようにZMP軌道パラメータを設定すればよい。
Next, in S608, the
なお、S608で決定される今回歩容のZMP軌道パラメータは、仮決定されたものであり、後述するように修正される。以降、その修正が終了するまでの仮決定されたZMP軌道パラメータにより規定される今回歩容の目標ZMPを、以降、仮目標ZMPと呼ぶ。その仮決定されたZMP軌道パラーメータを含む今回歩容の歩容パラメータを仮今回歩容パラメータという。 Note that the ZMP trajectory parameter of the current time gait determined in S608 is provisionally determined and is corrected as described later. Hereinafter, the target ZMP of the current time gait defined by the temporarily determined ZMP trajectory parameters until the correction is completed is hereinafter referred to as a temporary target ZMP. The gait parameters of the current time gait including the provisionally determined ZMP trajectory parameters are referred to as provisional current time gait parameters.
図9の説明に戻って、歩容生成装置100は、上記のごとくS026の処理を行った後、次いでS028において、今回歩容の歩容パラメータ(詳しくはZMP軌道パラメータ)を修正する処理を実行する。この処理では、今回歩容の上体位置姿勢軌道を定常歩容に連続させ、もしくは近づけるべく歩容パラメータのうちのZMP軌道パラメータが修正される。
Returning to the description of FIG. 9, the
この処理は、図18のフローチャートに示す如く実行される。 This process is executed as shown in the flowchart of FIG.
まずS700を経てS702に進み、歩容生成装置100は、仮決定されたZMP軌道パラメータを含む仮今回歩容パラメータを基に、今回歩容の終端時刻までの仮今回歩容を生成する。
First, the process proceeds to S702 via S700, and the
S702では、図19のフローチャートに示す処理が実行される。 In S702, the process shown in the flowchart of FIG. 19 is executed.
以下説明すると、歩容生成装置100は、まず、S800において、諸々の初期化を行なう。具体的には、仮今回歩容の生成用時刻Tkが“0”に初期化される。また、前回歩容の終端状態(より具体的には、前回歩容の終端時刻での目標上体位置及び目標上体速度、目標上体姿勢角及びその角速度、目標足平位置姿勢、目標腕姿勢など)を今回歩容支持脚座標系に変換したものが、仮今回歩容の初期状態として設定される。
As will be described below, the
次いで、S802を経てS804において、歩容生成装置100は、仮今回歩容の生成用時刻k(現在値)が今回歩容の終端時刻Tcurr以前の時刻であるか否か(Tk≦Tcurrであるか否か)を判断する。この判断結果が肯定的である場合には、歩容生成装置100は、S806〜S816の処理(詳細は後述する)を実行することによって、時刻Tkでの歩容の瞬時値を決定する。
Next, in step S804 through step S802, the
次いでS818に進み、歩容生成装置100は、仮今回歩容の生成用時刻Tkを、所定の刻み時間ΔTkだけ増加させた後、S804の判断を再び行なう。ここで、刻み時間ΔTkは、例えば制御周期Δtと一致させておけばよい。ただし、演算量を低減するために、ΔTkをΔtよりも長い時間に設定してもよい。
Next, in S818, the
S804の判断結果が肯定的である場合には、S806からS818までの処理が繰り返され、S804の判断結果が否定的になった場合には、図19の処理、すなわち、図18のS702の処理は終了する。これにより、今回歩容の初期時刻から終端時刻までの仮今回歩容の生成が完了する。 If the determination result in S804 is affirmative, the processing from S806 to S818 is repeated, and if the determination result in S804 is negative, the processing in FIG. 19, that is, the processing in S702 in FIG. Ends. Thereby, generation of the provisional current time gait from the initial time to the end time of the current time gait is completed.
歩容生成装置100は、上記S806〜S816で仮今回歩容の瞬時値を決定する処理を次のように実行する。この仮今回歩容の瞬時値の決定の仕方は、図16のS306〜S316で定常歩容(仮の定常歩容)の瞬時値を決定する仕方と同様である。
The
まずS806において、歩容生成装置100は、仮今回歩容パラメータ(より詳しくは床反力鉛直成分軌道パラメータ)を基に、図6に示した目標床反力鉛直成分軌道の時刻Tkでの瞬時値を求める。
First, in step S806, the
次いで、S808において、歩容生成装置100は、仮今回歩容パラメータ(より詳しくは仮決定のZMP軌道パラメータ)を基に、図7に示した目標ZMP軌道(仮目標ZMP軌道)の時刻Tkでの瞬時値を求める。
Next, in S808, the
次いでS810に進み、歩容生成装置100は、仮今回歩容パラメータ(より詳しくは足平軌道パラメータ、上体姿勢軌道パラメータ、及び腕姿勢軌道パラメータ)を基に、目標足平位置姿勢、目標上体姿勢および目標腕姿勢の時刻Tkでの瞬時値をそれぞれ求める。ただし、目標腕姿勢に関しては、より詳しくは両腕体の全体重心位置が決定されるが、鉛直軸(または上体24の体幹軸)まわりの角運動量を変化させる腕体の運動(腕振り運動)は、未だ決定されない。
Next, in step S810, the
次いでS812に進み、歩容生成装置100は、S806で求めた目標床反力鉛直成分を満足する(ロボット1の全体重心の鉛直方向の慣性力と重力との和を目標床反力鉛直成分に釣り合わせる)ように、時刻Tkでの上体鉛直位置を算出する。その算出の仕方は、図16のS312(定常歩容の上体鉛直位置の瞬時値を算出する処理)と同じでよい。ただし、S812で使用する多質点モデルは、S312で使用するものと異ならせてもよい。
Next, in S812, the
次いでS814に進み、歩容生成装置100は、目標ZMPを満足するように(ロボット1の慣性力と重力との合力が目標ZMPまわりに発生するモーメントの水平成分が“0”であるという動力学的平衡条件を満足するように)、時刻Tkでの上体水平加速度を決定する。この上体水平加速度の算出の仕方は、図16のS314と同じであり、例えば図8の動力学モデル(倒立振子モデル)を用いて上体水平加速度が算出される。
Next, the process proceeds to S814, where the
尚、より厳密な動力学モデルを用いて、目標ZMPまわりの床反力モーメントの水平成分を“0”にするような上体水平加速度を探索的に求めるようにしてもよい。 It should be noted that the body horizontal acceleration may be obtained in an exploratory manner so that the horizontal component of the floor reaction force moment around the target ZMP is set to “0” using a stricter dynamic model.
次いでS816に進み、歩容生成装置100は、S814で求めた上体水平加速度を2階積分することにより現在時刻Tkでの上体水平位置を算出する。この算出の仕方は、図16のS314と同じである。
Next, in S816, the
以上が図18のS702で歩容生成装置100が実行する処理(仮今回歩容の生成処理)の詳細である。
The above is the details of the process (provisional current time gait generation process) executed by the
歩容生成装置100は、以上のごとくS702の処理を実行した後、次にS704の処理を実行する。
The
S704では、歩容生成装置100は、S702で生成した仮今回歩容の終端での上体水平位置速度(Xe,Vxe)を基に、終端発散成分qe1(仮今回歩容の終端での発散成分qe1)を算出する。
In S704, the
具体的には、歩容生成装置100は、まず、(Xe,Vxe)と仮今回歩容の終端での上体姿勢(本実施形態では基準上体姿勢)とから、図8の倒立振子モデルの上体質点24bの水平位置速度(水平位置及び水平速度)を決定する。そして、この上体質点水平位置速度から、前記した図15のS222と同様に、前記式118に基づいて、仮今回歩容の終端発散成分qe1を算出する。この場合に、qe1を算出するために用いるΓ-1は、S222の処理で算出したものと同じである。
Specifically, the
次いでS706に進み、歩容生成装置100は、上記の如く求めた仮今回歩容の終端発散成分qe1と、図15のS224で求めた定常歩容の初期発散成分q0”との差である終端発散成分誤差errq(=qe1−q0'')を算出する。
Next, the processing proceeds to S706, where the
さらに、S708に進んで、歩容生成装置100は、上記の如く求めた終端発散成分誤差errqが許容範囲内(“0”近傍の範囲内)にあるか否か、すなわち、errqが“0”もしくはほぼ“0”であるか否かを判断する。なお、S708の判断は、詳しくは、X軸方向及びY軸方向の各軸方向の終端発散成分誤差errqに対して行なわれる。そして、X軸方向及びY軸方向の両軸方向の終端発散成分誤差errqが許容範囲内にある場合にS708の判断結果が肯定的になり、いずれかの軸方向の終端発散成分誤差errqが許容範囲内に無い場合には、がS708の判断結果が否定的になる。
Further, proceeding to S708, the
このS708の判断結果が否定的である場合には、S710に進み、歩容生成装置100は、a=Δa(Δa:所定の微小量)として、現在の仮目標ZMP軌道を台形パターンの修正量によって図20に示す如く修正してなる目標ZMP軌道を用いて、前記S702と同様に、終端時刻までの仮今回歩容を生成する。すなわち、歩容生成装置100は、S702での仮今回歩容の生成に用いた仮目標ZMP軌道の代わりに、それを修正してなる目標ZMP軌道を用いて、改めて仮今回歩容を生成する。この場合、目標ZMP以外の今回歩容パラメータは、S702で使用したものと同じである。
If the determination result in S708 is negative, the process proceeds to S710, where the
ここで、図20を参照して、上記「a」は、仮今回歩容の終端発散成分を定常歩容の初期発散成分にできるだけ一致させる(ひいては今回歩容の上体水平位置姿勢軌道を定常歩容の上体水平位置姿勢軌道に収束させる)ために、仮目標ZMP軌道を修正する(仮目標ZMP軌道に加える)台形パターンの修正量(以下、ZMP修正量ということがある)の高さである。 Referring to FIG. 20, “a” matches the terminal divergent component of the provisional current time gait with the initial divergent component of the normal gait as much as possible (and consequently the body horizontal position / posture trajectory of the current time gait is steady). Height of the trapezoidal pattern correction amount (hereinafter also referred to as ZMP correction amount) for correcting the temporary target ZMP trajectory (adding to the temporary target ZMP trajectory) in order to converge to the body horizontal position / posture trajectory of the gait) It is.
この場合、本実施形態では、仮目標ZMP軌道の修正は、支持脚足平22の底面のほぼ全面が接地する期間(足底全面接地期間)において行なうようにしている。このため、ZMP修正量は、足底全面接地期間内において、ZMP修正量≠0となり、足底全面接地期間以外の期間では、ZMP修正量=0となるように設定されている。また、上記台形パターンのZMP修正量の折れ点の時刻は、足底全面接地期間における仮目標ZMP軌道の折れ点の時刻に合わせて設定されている。なお、S710でa=Δa(Δa:所定の微小量)とするのは、現在の仮目標ZMP軌道を上記台形パターンのZMP修正量によって微小量だけ、修正したときの前記終端発散成分誤差errqの変化を観測するためである。
In this case, in the present embodiment, the temporary target ZMP trajectory is corrected during a period in which substantially the entire bottom surface of the supporting
補足すると、S710の上記の処理では、目標ZMPのX軸方向位置を修正することを例に採って説明したが、実際には目標ZMPのY軸方向位置の修正も併せて行なわれる。そのY軸方向位置の修正は、X軸方向位置の修正と同様に、足底全面接地期間における目標ZMP軌道を仮目標ZMP軌道から台形パターンで変化させるように行なわれる。この場合、上記Δaは各軸方向で同じ値でよいが、互いに異なる値に設定してもよい。 Supplementally, in the above-described processing of S710, the description has been made by taking the example of correcting the position of the target ZMP in the X-axis direction, but actually the correction of the position of the target ZMP in the Y-axis direction is also performed. The correction of the position in the Y-axis direction is performed so that the target ZMP trajectory during the sole full surface contact period is changed in a trapezoidal pattern from the temporary target ZMP trajectory, as in the correction of the position in the X-axis direction. In this case, Δa may be the same value in each axial direction, but may be set to different values.
なお、X軸方向及びY軸方向の一方の軸方向での目標ZMP軌道の修正が、他方の軸方向での終端発散成分に影響を及ぼさないか、もしくはその影響が十分に小さい場合には、S710から、後述のS716までの処理をX軸方向とY軸方向とで各別に行なうようにしてもよい。 If the correction of the target ZMP trajectory in one of the X-axis direction and the Y-axis direction does not affect the terminal divergence component in the other axial direction, or if the effect is sufficiently small, Processing from S710 to S716, which will be described later, may be performed separately in the X-axis direction and the Y-axis direction.
上記のようにS710にて仮今回歩容を生成した後、次にS712に進み、歩容生成装置100は、S710で求めた仮今回歩容の終端での上体水平位置速度(Xe2,Vxe2)を基に、この仮今回歩容における終端発散成分qe2をS704と同様に算出する。
After generating the temporary current time gait in S710 as described above, the process then proceeds to S712, where the
尚、本実施形態では、S710においてΔaを所定値の微小量としたが、以下に説明する繰り返し演算によって終端発散成分誤差errqが小さくなるにつれてΔaを“0”に近づけるように、該Δaを可変的に設定するようにしてもよい。ただし、一般には、Δaを定数にしておいても、数回の繰り返し演算で終端発散成分誤差errqを許容範囲内に収めることができる。 In this embodiment, Δa is set to a predetermined small amount in S710. However, Δa can be varied so that Δa approaches “0” as the terminal divergence component error errq decreases by the repetitive calculation described below. It may be set automatically. However, generally, even if Δa is set to a constant, the terminal divergence component error errq can be kept within an allowable range by several iterations.
次いでS714に進み、歩容生成装置100は、パラメータ感度r(Δaに対する終端発散成分誤差の変化の割合)を図中の式によって算出する。すなわち、歩容生成装置100は、S712で算出した終端発散成分qe2とS704で算出した終端発散成分qe1との差(=qe2−qe1)をΔaにより除算することによって、パラメータ感度rを算出する。この場合、より詳しくは、例えば(qe2−qe1)のX軸方向成分を、X軸方向のZMP修正量に係わるΔaにより除算することによって、X軸方向でのパラメータ感度rが算出される。また、(qe2−qe1)のY軸方向成分を、Y軸方向のZMP修正量に係わるΔaにより除算することによって、Y軸方向でのパラメータ感度rが算出される。
Next, proceeding to S714, the
次いでS716に進み、歩容生成装置100は、a=−errq/r、すなわちS706で求めた終端発散成分誤差errqを、S714で求めたパラメータ感度rで割った値の符号を反転させてなる値を台形パターンのZMP修正量の高さaとして、このZMP修正量によって図20に示す如く仮目標ZMPパターンを修正してなる目標ZMPを、改めて仮目標ZMPとして決定する。この場合、ZMP修正量の高さaは、X軸方向とY軸方向とで各別に算出される。
Next, in S716, the
なお、X軸方向及びY軸方向の一方の軸方向での目標ZMP軌道の修正が、他方の軸方向での終端発散成分に影響を及ぼす場合には、その影響分を考慮して各軸方向でのZMP修正量の高さaを決定することが好ましい。 In addition, when the correction of the target ZMP trajectory in one of the X-axis direction and the Y-axis direction affects the terminal divergence component in the other axial direction, each axial direction is considered in consideration of the influence. It is preferable to determine the height a of the ZMP correction amount at.
次いで歩容生成装置100は、S702からの処理を再び実行する。このとき、S708の判断結果が否定的である限りは、上記したS702〜S716の処理が繰り返され、S708の判断結果が肯定的となった場合に、その繰り返しループ(S700)を抜けてS718に進む。
Next, the
以上のS702〜S716のループ処理によって、終端発散成分qe1を、定常歩容の初期発散成分q0''に一致もしくはほぼ一致させることができるZMP修正量が(ひいては今回歩容の目標ZMP軌道が)探索的に求められる。 By the loop processing of S702 to S716 described above, the ZMP correction amount that can make the terminal divergence component qe1 coincide with or substantially coincide with the initial divergence component q0 ″ of the normal gait (and thus the target ZMP trajectory of the current time gait). Exploratory search is required.
かかるループ処理の次のS718では、歩容生成装置100は、現在の仮目標ZMP軌道(S700の繰り返しループを抜ける直前で設定された仮目標ZMP軌道)を最終的に今回歩容の目標ZMP軌道として、これに対応するZMP軌道パラメータを決定する。これにより、図9のS028の処理(今回歩容パラメータの修正処理)が終了する。
In S718 next to the loop processing, the
なお、本実施形態では、ZMP修正量を台形パターンに設定したが、例えば、三角形状のパターンや、曲率が連続的に変化するようなパターン等に決定してもよい。 In the present embodiment, the ZMP correction amount is set to a trapezoidal pattern, but may be determined to be, for example, a triangular pattern or a pattern in which the curvature changes continuously.
図9に戻って、上記のごとくS028において今回歩容パラメータを修正した後、S030に進み、歩容生成装置100は、今回歩容の初期から終端までの各時刻での目標ZMPまわりの床反力モーメント(より詳しくは床反力モーメントの水平成分)の許容範囲を規定する床反力モーメント許容範囲パラメータを決定する。
Returning to FIG. 9, after correcting the current time's gait parameter in S028 as described above, the process proceeds to S030, where the
なお、床反力モーメントを、床反力鉛直成分で割ったものが、ZMP(床反力中心点)の目標ZMPからのずれ量に相当するものとなる。従って、床反力モーメント許容範囲を、ZMPの位置の許容範囲としてのZMP許容範囲(床反力中心点許容範囲)に変換し、このZMP許容範囲を規定するパラメータを決定するようにしてもよい。 Note that the floor reaction force moment divided by the floor reaction force vertical component corresponds to the amount of deviation of the ZMP (floor reaction force center point) from the target ZMP. Accordingly, the floor reaction force moment allowable range may be converted into a ZMP allowable range (floor reaction force center point allowable range) as a ZMP position allowable range, and a parameter defining the ZMP allowable range may be determined. .
S030で決定する床反力モーメント許容範囲は、前記複合コンプライアンス動作決定部104の制御処理(コンプライアンス制御)によって制御される目標ZMPまわりの実床反力モーメントの許容範囲である。この床反力モーメント許容範囲について以下に説明する。
The floor reaction force moment allowable range determined in S030 is the allowable range of the actual floor reaction force moment around the target ZMP controlled by the control processing (compliance control) of the composite compliance
複合コンプライアンス動作決定部104の処理によるコンプライアンス制御は、目標ZMPまわりに発生する床反力モーメントがコンプライアンス制御用目標床反力モーメントになるように足平22の位置姿勢を制御する。コンプライアンス制御が目標通りに忠実に作動すると、実床反力中心点は、目標床反力モーメントを床反力鉛直成分で割った値だけ、目標ZMPから水平方向に位置をずらした点になる。実床反力中心点は、いわゆる支持多角形で表されるZMP存在可能範囲(厳密な表現では、実床反力中心点の存在可能範囲)を逸脱することはできない。そして、実床反力中心点がZMP存在可能範囲の境界に近づき過ぎると、足平22の本来の接地感を低下させたり、足平22の底面が浮いてしまうような不具合が発生する。
The compliance control by the processing of the composite compliance
床反力モーメント許容範囲は、このような不具合を防止するために、コンプライアンス制御用床反力モーメントに制限を加えるものである。したがって、床反力モーメント許容範囲は、これを床反力鉛直成分で割ることによって求められる床反力中心点許容範囲が、ZMP存在可能範囲に含まれるように決定されることが望ましい。 The floor reaction force moment allowable range limits the floor reaction force moment for compliance control in order to prevent such problems. Therefore, it is desirable that the floor reaction force moment allowable range is determined so that the floor reaction force center point allowable range obtained by dividing this by the floor reaction force vertical component is included in the ZMP possible range.
より具体的には、床反力中心点許容範囲(ZMP許容範囲)は、支持多角形に応じて決定されるべきである。この場合、床反力中心点許容範囲は、一般的には、複雑な形状に設定することができる。ただし、本実施形態では、演算を簡素化するために、床反力中心点許容範囲を、例えば床面上の長方形(X軸方向およびY軸方向に平行な辺を有する長方形)の領域とする。この場合、床反力中心点許容範囲を床反力モーメントに変換してなる床反力モーメント許容範囲は、X軸方向成分とY軸方向成分とでそれぞれ独立に範囲が設定される。 More specifically, the floor reaction force center point allowable range (ZMP allowable range) should be determined according to the support polygon. In this case, the floor reaction force center point allowable range can generally be set to a complicated shape. However, in this embodiment, in order to simplify the calculation, the floor reaction force center point allowable range is, for example, a rectangular region (a rectangle having sides parallel to the X axis direction and the Y axis direction) on the floor surface. . In this case, the floor reaction force moment allowable range obtained by converting the floor reaction force center point allowable range into the floor reaction force moment is set independently for the X-axis direction component and the Y-axis direction component.
例えば、支持多角形と目標ZMPとが図21に示すような状況にある場合には、図示のごとく、床反力中心点許容範囲(ZMP許容範囲)は支持多角形に内包されるように設定される。また同時に、床反力中心点許容範囲(ZMP許容範囲)は目標ZMPを内包するように設定される。 For example, when the support polygon and the target ZMP are in the situation shown in FIG. 21, the floor reaction force center point allowable range (ZMP allowable range) is set to be included in the support polygon as shown in the figure. Is done. At the same time, the floor reaction force center point allowable range (ZMP allowable range) is set so as to include the target ZMP.
なお、図21に点描領域として示す支持多角形は、歩行歩容(歩行歩容に関する歩容生成については後に補足説明を行なう)の両脚支持期での支持多角形を例示している。この例では、右足平22Rのつま先が接地し、左足平22Lのかかとが接地している状態を模式的に示している。
In addition, the support polygon shown as a stippled region in FIG. 21 illustrates the support polygon in the both-leg support period of the walking gait (the gait generation related to the walking gait will be described later). In this example, a state where the toe of the
歩行歩容あるいは図5の走行歩容における片脚支持期では、支持多角形は、支持脚足平22の接地面(床面との接触面)である。この場合においては、ZMP許容範囲は、目標ZMPを内包しつつ、該支持多角形に内包され、もしくは、その支持多角形とほぼ一致するように設定すればよい。また、図5の走行歩容の空中期では、ZMP許容範囲は、例えば目標ZMPを中心として、X軸、Y軸両方向に幅が0の領域、すなわち、目標ZMPそのものの点(これは面積が“0”の領域を意味する)に設定される。
In the one-leg support period in the walking gait or the running gait in FIG. 5, the support polygon is the ground contact surface (contact surface with the floor surface) of the
図9に戻って、上記のごとくS030において床反力モーメント許容範囲を決定した後、あるいはS016の判断結果が否定的である場合には、次にS032において、歩容生成装置100は、今回歩容瞬時値(現在の制御周期での今回歩容の目標足平位置姿勢等の瞬時値)を決定する。このS032では、前記姿勢安定化制御演算部112で前述の如く決定されるモデル操作床反力モーメントが目標ZMPまわりに発生するように今回歩容瞬時値が決定される。
Returning to FIG. 9, after the floor reaction force moment allowable range is determined in S030 as described above, or when the determination result in S016 is negative, the
具体的には、図22のフローチャートに示す如く、歩容瞬時値が決定される。以下説明すると、歩容生成装置100は、まず、S1000からS1006まで、図19のS806からS812まで(または図16のS306からS312まで)と同様に処理を実行することによって、今回歩容の現在時刻t(現在の制御周期)での目標床反力鉛直成分、目標ZMP、目標足平位置姿勢、目標上体姿勢、目標腕姿勢、目標上体鉛直位置の瞬時値を算出する。
Specifically, the gait instantaneous value is determined as shown in the flowchart of FIG. To explain below, the
これらの各瞬時値の算出の仕方は、歩容パラメータとして、図9のS028で最終的に修正した今回歩容パラメータを使用する点を除いて、図19のS806からS812まで(または図16のS306からS312まで)の処理と同じである。 These instantaneous values are calculated from S806 to S812 in FIG. 19 (or in FIG. 16) except that the current time gait parameter finally corrected in S028 in FIG. 9 is used as the gait parameter. This is the same as the processing from S306 to S312).
次いで、S1008に進み、歩容生成装置100は、図9のS030で決定した床反力モーメント許容範囲パラメータを基に、今回歩容の現在時刻tでの床反力モーメント許容範囲の瞬時値を求める。この床反力モーメント許容範囲の瞬時値は、歩容生成装置100から、前記補償全床反力モーメント分配器110(図3参照)に出力される。そして、この分配器110で前記式50により算出されたモデル操作床反力モーメント(現在時刻tの値)が歩容生成装置100に与えられる。
Next, proceeding to S1008, the
次いで、S1010に進み、歩容生成装置100は、補償全床反力モーメント分配器110から与えられたモデル操作床反力モーメントが目標ZMPまわりに発生するように(ロボット1の慣性力と重力との合力が目標ZMPまわりに発生するモーメントの水平成分がモデル操作床反力モーメントに釣り合うように)、今回歩容の現在時刻tでの上体水平加速度を決定する。
Next, in S1010, the
言い換えると、ロボット1の慣性力と重力との合力が目標ZMPまわりに発生するモーメントがモデル操作床反力モーメントの符号を反転したモーメントに一致するように、今回歩容の現在時刻tでの上体水平加速度が決定される。
In other words, the moment of the current time's gait is increased so that the moment generated by the resultant inertial force and gravity of the
この場合、例えば図8の動力学モデル(倒立振子モデル)を用いて今回歩容の上体水平加速度が算出される。 In this case, the body horizontal acceleration of the current time's gait is calculated using, for example, the dynamic model (inverted pendulum model) of FIG.
具体的には、今回歩容の現在時刻tで上体鉛直位置と、時刻(t−Δt)の上体水平位置と、現在時刻tの目標上体姿勢とから、現在時刻tでの上体質点24bの鉛直位置及び水平位置が決定される。なお、時刻(t−Δt)までの上体水平位置の時系列又は時刻(t−Δt)での歩容状態を基に時刻tでの上体水平位置を補間的に推定し、その推定した上体水平位置を時刻(t−Δt)の上体水平位置の代わりに用いてもよい。
Specifically, the body constitution at the current time t from the body vertical position at the current time t of the current time gait, the body horizontal position at the time (t−Δt), and the target body posture at the current time t. The vertical position and horizontal position of the
また、今回歩容の現在時刻tでの床反力鉛直成分から、上体質点24bに作用する重力(=mb*g)を差し引いた値を、上体質点24bの質量mbにより除算することによって、現在時刻tでの上体質点24bの鉛直加速度が求められる。
Further, by dividing the value obtained by subtracting the gravity (= mb * g) acting on the
そして、上記の如く求めた上体質点24bの鉛直位置、水平位置、鉛直加速度をそれぞれ、前記式04のZb、Xb、d2Zb/dt2に代入すると共に、現在時刻tでの目標ZMPの水平位置および鉛直位置を式04のXzmp,Zzmpに代入し、さらに、同式04のMzmp_yを、モデル操作床反力モーメントに一致させてなる式を、d2Xb/dt2について解くことにより、現在時刻tでの上体質点水平加速度d2Xb/dt2が算出される。そして、この上体質点水平加速度d2Xb/dt2が現在時刻tでの上体水平加速度として求められる。
Then, the vertical position, horizontal position, and vertical acceleration of the
尚、より厳密な動力学モデルを用いて、目標ZMPまわりの床反力モーメントの水平成分をモデル操作床反力モーメントに一致させるような上体水平加速度を探索的に求めるようにしてもよい。 It should be noted that a more rigorous dynamic model may be used to search for a body horizontal acceleration that matches the horizontal component of the floor reaction force moment around the target ZMP with the model operation floor reaction force moment.
次いで、S1012に進み、S1010で上記の如く求めた上体水平加速度を2階積分することにより現在時刻tでの上体水平位置を算出する。この算出の仕方は、図16のS314(又は図19のS816)と同じである。これにより、図9のS032の処理が完了する。 Next, in S1012, the horizontal body position at the current time t is calculated by performing second-order integration of the horizontal body acceleration obtained as described above in S1010. This calculation method is the same as S314 in FIG. 16 (or S816 in FIG. 19). Thereby, the process of S032 of FIG. 9 is completed.
次いでS034に進み、スピン力をキャンセルする(ロボット1の腕体以外の運動によって目標ZMP回りに発生する床反力モーメント鉛直成分を“0”もしくはほぼ“0”にする)ための腕体の動作が決定される。具体的には、腕体を振らなかった場合の目標ZMPにおける床反力モーメント鉛直成分軌道(厳密には、腕体を振らずに歩容を生成した場合において、ロボットの重力と慣性力の合力が目標ZMPに作用するモーメント鉛直成分軌道の各瞬時値の符号を反転したもの)が求められる。すなわち、S032の処理によって生成された今回歩容の運動(これには腕振りの運動は含まれていない)の瞬時値に釣り合う目標ZMP回りの床反力モーメント鉛直成分の瞬時値が求められる。そして、この床反力モーメント鉛直成分の瞬時値を、腕振り運動の等価慣性モーメントで割ることにより、スピン力キャンセルに必要な腕振り動作の角加速度が求められる。なお、腕の振りが大き過ぎる場合には、等価慣性モーメントよりも大きな値で床反力モーメント鉛直成分の瞬時値を除算するようにしてもよい。
Next, the process proceeds to S034, and the arm body motion for canceling the spin force (the floor reaction force moment vertical component generated around the target ZMP by the motion other than the arm body of the
次に、歩容生成装置100は、この角加速度を2階積分し、これを積分値が過大になるのを防ぐためのローカットフィルタに通して得た角度を腕振り動作角とする。ただし、腕振り動作では、左右の腕体を前後逆方向に振り、両腕体の重心位置を変化させないようにする。なお、スピン力をキャンセルするための腕振り運動を定常歩容でも生成しておき、これにつながるように、今回歩容における腕振り運動を決定するようにしてもよい。
Next, the
次いでS036に進み、歩容生成装置100は、時刻tに制御周期Δtを加え、S014からの処理を再び実行する。
Next, in S036, the
以上により、今回歩容の瞬時値が時系列的に生成されることとなる。 As a result, the instantaneous value of the current time's gait is generated in time series.
本実施形態では、以上説明した歩容生成装置100の処理(図9のフローチャートに示す処理)によって、本発明における目標運動決定手段が実現される。この場合、ロボット1の今回歩容の目標運動(目標足平位置姿勢、目標上体位置姿勢、及び目標腕姿勢)の軌道(時系列)は、本発明における上下方向慣性力パラメータとしての、目標床反力鉛直成分軌道パラメータ(図17のS606で決定されたパラメータ)により規定される目標床反力鉛直成分軌道を満足することを1つの要件として決定される。
In the present embodiment, the target motion determination means in the present invention is realized by the processing of the
また、今回歩容の目標運動の軌道は、将来において、定常歩容の運動軌道に収束させる(漸近させる)ことを他の1つの要件として決定される。 In addition, the target motion trajectory of the current time's gait is determined as another requirement to converge (asymptotically) to the motion trajectory of the normal gait in the future.
さらに、前記モデル操作床反力モーメントが“0”でない場合(本実施形態では、補償全床反力モーメントが床反力モーメント許容範囲内に収まっている場合)には、今回歩容の目標運動は、ロボット1の運動と床反力との関係を表す動力学モデル(本実施形態では倒立振子モデル)において、目標ZMPまわりに前記モデル操作床反力モーメントを付加的に発生させることを他の1つの要件として決定される。この場合、今回歩容の目標運動通りにロボット1の実際の運動を行なったと仮定した場合に、実ロボット1においては、目標ZMPまわりにモデル操作床反力モーメントと逆向きのモーメントが付加的に作用することとなる。従って、実ロボット1の実際の上体姿勢が、目標姿勢からずれるのを抑制する床反力モーメントが付加的に作用するように、目標運動が決定されることとなる。
Further, when the model operation floor reaction force moment is not “0” (in this embodiment, the compensated total floor reaction force moment is within the floor reaction force moment allowable range), the target motion of the current time gait In the dynamic model (inverted pendulum model in this embodiment) representing the relationship between the motion of the
次に、説明を後回しにした姿勢安定化制御演算部112の演算処理をさらに詳細に説明する。
Next, the calculation processing of the posture stabilization
姿勢安定化制御演算部112が算出する前記補償全床反力モーメントMdmdは、前記したように、実上体姿勢角(上体姿勢角の実測値)と目標上体姿勢角との偏差である上体姿勢角偏差Δθを“0”に収束させるための要求操作量である。
The compensated total floor reaction force moment Mdmd calculated by the posture stabilization
この場合、本実施形態では、上体姿勢角偏差Δθは、ロボット1の動力学(上体24の運動と床反力との間の関係)を近似的に表現する図8の倒立振子モデルの上体質点24bの水平位置の、基準位置(上体姿勢角偏差Δθが“0”である場合の目標上体位置姿勢に対応する上体質点24bの水平位置)に対する位置偏差ΔXに変換される。すなわち、上体姿勢角偏差Δθは、上体質点24bの水平位置の摂動量としての位置偏差ΔXに変換される。
In this case, in this embodiment, the body posture angle deviation Δθ is an approximation of the dynamics of the robot 1 (relation between the motion of the
この変換は、次式150により行なわれる。なお、式150におけるhは、前記した如く、上体質点24bの平均的な高さ(定数値)である。
This conversion is performed by the following equation 150. Note that h in the expression 150 is the average height (constant value) of the upper
ΔX=h*Δθ ……式150
この式150について補足すると、上体姿勢角偏差Δθは、一般には“0”に近い角度となる。この場合、上体姿勢角偏差Δθに対応する上記位置偏差ΔXは、近似的に、式150により与えられる。
ΔX = h * Δθ ...... Formula 150
Supplementing this formula 150, the body posture angle deviation Δθ is generally an angle close to “0”. In this case, the position deviation ΔX corresponding to the body posture angle deviation Δθ is approximately given by Expression 150.
さらに、姿勢安定化制御演算部112は、上記の如く上体姿勢角偏差Δθから式150により算出した位置偏差ΔXの時間的変化率(微分値)である速度偏差ΔVxを算出する。なお、速度偏差ΔVxは、実際のロボット1の上体姿勢角の角速度の実測値(又は上体姿勢角の実測値の時間的変化率)と目標上体姿勢角の角速度(本実施形態では“0”)との偏差に、倒立振子の上体質点24bの平均的な高さhを乗じることによって求めてもよい。
Further, the posture stabilization
補足すると、本実施形態では、前記したように、位置偏差ΔXが本発明における状態量偏差に相当する。従って、姿勢安定化制御演算部112が、実上体姿勢角(前記傾斜センサ40の検出信号に基づく実測値)と目標上体姿勢角の偏差である上体姿勢角偏差Δθから、式150により位置偏差ΔXを算出する処理によって、本発明における状態量偏差観測手段が実現される。
Supplementally, in this embodiment, as described above, the position deviation ΔX corresponds to the state quantity deviation in the present invention. Accordingly, the posture stabilization
また、姿勢安定化制御演算部112には、歩容生成装置100が決定する今回歩容パラメータのうちの床反力鉛直成分軌道パラメータ(図17のS606で決定される床反力鉛直成分軌道パラメータ)が入力される。
The posture stabilization
そして、姿勢安定化制御演算部112は、今回歩容の現在時刻kでの上体質点24bの鉛直方向の慣性力の瞬時値を床反力鉛直成分軌道パラメータを基に算出する。その算出の手法は、定常歩容に関する上体質点24bの鉛直方向の慣性力の算出手法と同様である。
Then, the posture stabilization
具体的には、本実施形態では、姿勢安定化制御演算部112は、倒立振子の上体質点24bの質量mbがロボット1の全体の質量に一致するものとして、今回歩容パラメータのうちの床反力鉛直成分軌道パラメータを基に、現在時刻kでの床反力鉛直成分の瞬時値(これは現在時刻kでの上体質点24bの慣性力と該上体質点24bに作用する重力との合力の鉛直成分に釣り合う)を算出する。該瞬時値は、図19のS806で算出される値と同じである。そして、姿勢安定化制御演算部112は、その算出した床反力鉛直成分の瞬時値から、上体質点24bの質量mb(=ロボット1の全体質量)と重力加速度定数gとの積、すなわち、上体質点24bに作用する重力(=mb*g)を差し引いてなる値を、現在時刻kでの上体質点24bの鉛直方向の慣性力(=−mb*d2Zb/dt2)の値として算出する。
Specifically, in this embodiment, the posture stabilization
補足すると、定常歩容に係わる上体質点24bの鉛直方向の慣性力に算出に関して補足した如く、今回歩容パラメータを基に、3質点モデルなどの多質点モデル(幾何学モデル)を用いて、今回歩容の現在時刻における上体質点24bの鉛直方向の慣性力を算出するようにしてもよい。
Supplementally, as supplemented for the calculation of the vertical inertia force of the upper
そして、姿勢安定化制御演算部112は、上記の如く算出した位置偏差ΔX及び速度偏差ΔVxと、現在時刻kでの上体質点24bの鉛直方向の慣性力とを用いて、次式152a,152bの演算によって、補償全床反力モーメントMdmdを決定する。
Then, the posture stabilization
Mdmd=(Kx*ΔX+Kv*ΔVx)+Mdmd_ff ……式152a
ただし、Mdmd_ff=(mb*d2Zb/dt2)*ΔX ……式152b
なお、Mdmdは、前記したように、ロール方向(X軸まわり)の成分Mdmdxと、ピッチ方向(Y軸まわり)の成分Mdmdyとからなるベクトルである。従って、式152a,152bにおけるΔX、ΔVxは、Mdmdxを算出に関しては、それぞれY軸方向の位置偏差、速度偏差を意味し、Mdmdyの算出に関しては、それぞれX軸方向の位置偏差、速度偏差を意味する。
Mdmd = (Kx * ΔX + Kv * ΔVx) + Mdmd_ff Equation 152a
However, Mdmd_ff = (mb * d2Zb / dt2) * ΔX (Formula 152b)
As described above, Mdmd is a vector composed of the component Mdmdx in the roll direction (around the X axis) and the component Mdmdy in the pitch direction (around the Y axis). Therefore, ΔX and ΔVx in the formulas 152a and 152b mean the position deviation and speed deviation in the Y-axis direction for calculating Mdmdx, respectively, and the position deviation and speed deviation in the X-axis direction for calculating Mdmdy, respectively. To do.
ここで、この式152a,152bの演算によってMdmdを算出する処理は、上体24の鉛直方向の慣性力(又は運動加速度)が“0”である(ひいては、上体質点24bの鉛直方向の慣性力が“0”である)との仮定の基で位置偏差ΔXを“0”に収束させるように構築されたフィードバック制御則としてのPD則(比例・微分則)と、上体24の鉛直方向の慣性力(ひいては、上体質点24bの鉛直方向の慣性力)の影響を補償するためのフィードフォワード則とを組み合わせた制御則により補償全床反力モーメントMdmdを決定する処理を意味している。
Here, in the process of calculating Mdmd by the calculation of the equations 152a and 152b, the vertical inertia force (or motion acceleration) of the
この場合、式152aの右辺の括弧内の項(第1項及び第2項)が、PD則によるフィードバック操作量成分に相当している。そして、Kx、Kvは、それぞれ、上体質点24bの鉛直方向の慣性力が“0”であるという仮定の基で、ΔXを円滑に“0”に収束させ得るように、極配置や、最適レギュレータ等の手法を用いてあらかじめ設定された所定値(固定値)の比例ゲイン、微分ゲインである。
In this case, the terms (first term and second term) in parentheses on the right side of the expression 152a correspond to the feedback manipulated variable component according to the PD rule. Kx and Kv are pole placement and optimum so that ΔX can smoothly converge to “0” under the assumption that the vertical inertial force of the
また、式152aの右辺の第3項のMdmd_ffが、上体24の鉛直方向の慣性力の影響を補償するためのフィードフォワード則によるフィードフォワード操作量成分に相当している。このフィードフォワード操作量成分Mdmd_ffは、上体質点24bの鉛直方向の慣性力と位置偏差ΔXの関数値であり、本実施形態では、式152bにより算出される。すなわち、Mdmd_ffは、現在時刻での上体質点24bの鉛直方向の慣性力の符号を反転させた値(=mb*d2Zb/dt2)と、位置偏差ΔXとの積として算出される。このようにして算出されるMdmd_ffは、上体質点24bの鉛直方向の慣性力によって前記倒立振子モデルの支点(目標ZMP)周りに発生するモーメントを打ち消すために該支点周りに作用させるべきモーメント成分を意味している。
Further, the third term Mdmd_ff on the right side of the expression 152a corresponds to a feedforward manipulated variable component according to the feedforward rule for compensating for the influence of the vertical inertial force of the
従って、式152a,152bにより補償全床反力モーメントMdmdを決定する処理は、上記フィードバック操作量成分(=Kx*ΔX+Kv*ΔVx)と、上記フィードフォワード操作量成分Mdmd_ff(=(mb*d2Zb/dt2)*ΔX)とを加え合わせる合成演算によって、Mdmdを決定する処理を表している。 Therefore, the processing for determining the compensated total floor reaction force moment Mdmd using the equations 152a and 152b is performed by the feedback manipulated variable component (= Kx * ΔX + Kv * ΔVx) and the feedforward manipulated variable component Mdmd_ff (= (mb * d2Zb / dt2). ) * ΔX) and Mdmd is determined by a combination operation.
補足すると、前記したように、本実施形態では補償全床反力モーメントMdmdが本発明における要求操作量に相当する。従って、式152a,152bによりMdmdを算出する処理によって、本発明における要求操作量決定手段が実現される。この場合、上記フィードバック操作量成分(=Kx*ΔX+Kv*ΔVx)と、フィードフォワード操作量成分Mdmd_ff(=(mb*d2Zb/dt2)*ΔX)とがそれぞれ、本発明における慣性力非依存性操作量成分、慣性力依存性操作量成分に相当する。また、前記比例ゲインKx、微分ゲインKvがそれぞれ、本発明における第1係数、第3係数に相当すると共に、上体質点24bの鉛直方向の慣性力の符号を反転させてなる(mb*d2Zb/dt2)が本発明における第2係数に相当する。
Supplementally, as described above, in this embodiment, the compensated total floor reaction force moment Mdmd corresponds to the required operation amount in the present invention. Therefore, the required operation amount determining means in the present invention is realized by the process of calculating Mdmd using the equations 152a and 152b. In this case, the feedback manipulated variable component (= Kx * ΔX + Kv * ΔVx) and the feedforward manipulated variable component Mdmd_ff (= (mb * d2Zb / dt2) * ΔX) are respectively the inertial force-independent manipulated variables in the present invention. It corresponds to a component and an inertial force dependent manipulated variable component. The proportional gain Kx and the differential gain Kv correspond to the first coefficient and the third coefficient in the present invention, respectively, and the sign of the inertial force in the vertical direction of the
また、前記式152a,152bは、それらをまとめて整理すると、次式153に置き換えることができる。従って、この式153の演算によって、補償全床反力モーメントMdmdを算出するようにしてもよい。 Further, the above formulas 152a and 152b can be replaced by the following formula 153 when they are arranged together. Therefore, the compensated total floor reaction force moment Mdmd may be calculated by the calculation of Expression 153.
Mdmd=(Kx+(mb*d2Zb/dt2))*ΔX+Kv*ΔVx ……式153
この場合、式153における右辺の第1項において、ΔXに掛かる係数(Kx+(mb*d2Zb/dt2))は、比例ゲインKx(第1係数)と、上体質点24bの鉛直方向の慣性力の関数値としての第2係数(=mb*d2Zb/dt2)との合成係数としての意味を持つこととなる。
Mdmd = (Kx + (mb * d2Zb / dt2)) * ΔX + Kv * ΔVx (Formula 153)
In this case, in the first term on the right side of the equation 153, the coefficient (Kx + (mb * d2Zb / dt2)) applied to ΔX is the proportional gain Kx (first coefficient) and the vertical inertial force of the
このようにして式153によりMdmdを算出する処理は、換言すれば、上体質点24bの鉛直方向の慣性力に応じて可変的に決定される比例ゲイン(上記合成係数)を使用するPD則によって、Mdmdを決定する処理となる。この場合、上記合成係数をKx’と置くと、式153の演算におけるKx’(=Kx+(mb*d2Zb/dt2))は、床反力鉛直成分の変化に同期するようにして、例えば図23のグラフで示す如く変化するように決定される。なお、図23には、一定値であるKvのグラフも併記している。
In other words, the process of calculating Mdmd by the expression 153 in this way is based on the PD law using a proportional gain (the above-mentioned synthesis coefficient) that is variably determined according to the vertical inertia force of the upper
本実施形態では、姿勢安定化制御演算部112は、以上説明した如く位置偏差ΔX及び速度偏差ΔVxと、現在時刻kでの上体質点24bの鉛直方向の慣性力とを用いて位置偏差ΔXを“0”に収束させる(ひいては上体姿勢角偏差Δθを“0”に収束させる)ための要求操作量としての補償全床反力モーメントMdmdを決定する。
In the present embodiment, the posture stabilization
以上が姿勢安定化制御演算部112の演算処理の詳細である。
The above is the details of the calculation processing of the posture stabilization
以上説明した姿勢安定化制御演算部位112に処理によって、Mdmdは、上体質点24bの鉛直方向の慣性力が“0”であるという仮定の基で、ΔXを円滑に“0”に収束させ得る前記フィードバック操作量成分(=Kx*ΔX+Kv*ΔVx)と、上体質点24bの現在時刻での慣性力に応じたフィードバック操作量成分Mdmd_ff(=(mb*d2Zb/dt2)*ΔX)とを合成した値(加え合わせた値)として決定される。この結果、上体24の鉛直方向の慣性力が変化するような歩容(本実施形態では走行歩容)でロボット1の運動を行なう場合であっても、外乱等の影響で実上体姿勢が目標姿勢からずれを生じた場合に、該慣性力の影響を適切に補償しつつ、実状態姿勢を円滑に(オーバーシュートやアンダ−シュートが発生しないように)、目標姿勢に復元させることができる。
By processing the posture stabilization
なお、以上説明した実施形態では、上体24の鉛直方向の慣性力が変化する目標歩容として、前記図5の走行歩容を例にとって説明したが、ロボット1の鉛直方向の慣性力が変化するような歩行歩容を目標歩容として、ロボット1の運動を行なうようにしてもよい。この場合には、床反力鉛直成分軌道(1歩分の軌道)を、例えば図24に示すような折れ線状のパターンで設定することによって、ロボット1の歩行動作を行ないながら、上体24の鉛直方向の慣性力を変化させることができる。この図24の例では、床反力鉛直成分軌道は、両脚支持期では、床反力鉛直成分の増加側に凸(上に凸)の台形状に設定され、片脚支持期では床反力鉛直成分の減少側に凸(下に凸)の台形状に設定される。
In the embodiment described above, the traveling gait in FIG. 5 is described as an example of the target gait in which the vertical inertia force of the
このように床反力鉛直成分軌道を変化させる歩行歩容でロボット1の動作を行なわせる場合であっても、前記した実施形態と同じように目標歩容を生成しつつ、ロボット1の動作を制御することによって、実上体姿勢が目標上体姿勢からずれた場合に、実上体姿勢を円滑に目標姿勢に復元させることができる。
Thus, even when the
また、前記実施形態では、状態量偏差として、前記式150により算出される位置偏差ΔXを用いたが、上体姿勢角偏差Δθを状態量偏差として用いてもよい。 In the embodiment, the position deviation ΔX calculated by the expression 150 is used as the state quantity deviation. However, the body posture angle deviation Δθ may be used as the state quantity deviation.
この場合には、例えば、次式154a,154bの演算処理、又は次式155の演算処理によって、補償全床反力モーメントMdmdを算出するようにすればよい。 In this case, for example, the compensated total floor reaction force moment Mdmd may be calculated by the arithmetic processing of the following equations 154a and 154b or the arithmetic processing of the following equation 155.
Mdmd=(Kθ*Δθ+Kω*Δω)+Mdmd_ff ……式154a
ただし、Mdmd_ff=(mb*d2Zb/dt2)*h*Δθ ……式154b
Mdmd=(Kθ+(mb*d2Zb/dt2)*h)*Δθ+Kω*Δω ……式155
なお、Δωは、上体姿勢角偏差Δθの時間的変化率、Kθ、Kωは、それぞれ、上体質点24bの鉛直方向の慣性力が“0”であるという仮定の基であらかじめ設定された所定値(固定値)の比例ゲイン、微分ゲインである。
Mdmd = (Kθ * Δθ + Kω * Δω) + Mdmd_ff Equation 154a
However, Mdmd_ff = (mb * d2Zb / dt2) * h * Δθ (Formula 154b)
Mdmd = (Kθ + (mb * d2Zb / dt2) * h) * Δθ + Kω * Δω (Formula 155)
Δω is a temporal change rate of the body posture angle deviation Δθ, and Kθ and Kω are predetermined values that are set in advance based on the assumption that the vertical inertial force of the
さらに、状態量偏差として、例えば目標歩容における上体24の重心の位置と、実際の上体24の重心の位置との差を用いるようにしてもよい。
Further, as the state quantity deviation, for example, the difference between the position of the center of gravity of the
また、前記実施形態では、鉛直方向(重力方向)を上下方向として、上体24(上体質点24b)の上下方向の慣性力の影響を補償するようにMdmdを決定するようにしたが、例えば床面が傾斜しているような場合には、床面に垂直な方向を上下方向として、この上下方向における上体24(上体質点24b)の慣性力の目標値(現在時刻での目標値)を用いて、該慣性力の影響を補償するようにMdmdを決定するようにしてもよい。
In the above embodiment, the vertical direction (gravity direction) is set as the vertical direction, and Mdmd is determined so as to compensate for the influence of the vertical inertia force of the upper body 24 (upper
また、前記実施形態では、移動体として、2足移動ロボット1を例にとって説明したが、本発明を適用できる移動体は、2足移動ロボットに限られるものではない。例えば、3つ以上の脚体を有する脚式移動ロボットについても本発明を適用できる。
In the above-described embodiment, the biped
あるいは、例えば図25(a),(b)に模式的に示す構造の移動体についても本発明を適用できる。図25(a)に例示する移動体200は、移動機構としての車輪202を有する。そして、この車輪202の回転軸に揺動可能に軸支されたリンク機構204を介して基体206が車輪202に支持されている。この場合、リンク機構204は、車輪202の回転軸と基体206との間に直動型の関節208を有し、該直動関節208の動作によって、基体206の上下動運動が可能となっている。
Alternatively, for example, the present invention can be applied to a moving body having a structure schematically shown in FIGS. A moving
また、図25(b)に例示する移動体210は、図25(a)に示す移動体200と、リンク機構212の構造だけが相違するものである。この例では、リンク機構212は、車輪202の回転軸に揺動可能に軸支されると共に、該回転軸と基体206との間に、回転型の関節214,216を有する。そして、関節214,216の動作によって、基体206の上下動運動が可能となっている。
Moreover, the moving
なお、図25(a),(b)中のΔθは、基体206の実際の姿勢の、目標姿勢に対するずれ量(角度差)を示している。この例では、基体206が鉛直方向に起立する姿勢を基体206の目標姿勢として示している。
Note that Δθ in FIGS. 25A and 25B indicates a deviation amount (angle difference) of the actual posture of the
また、前記実施形態では、補償全床反力モーメントMdmdをモデル操作床反力モーメントとコンプライアンス制御用床反力モーメントとに分配したが、モデル操作床反力モーメントとコンプライアンス制御用床反力モーメントとのいずれか一方だけを使用するようにしてもよい。例えば補償全床反力モーメントMdmdの符号を反転させたもの(あるいは比例ゲインKx及び微分ゲインKvの符号を反転させた比例・微分則の演算により算出した要求操作モーメント)を、前記モデル操作床反力モーメントとして使用し、コンプライアンス制御用床反力モーメントを常時“0”に設定するようにしてもよい。 In the above embodiment, the compensation total floor reaction force moment Mdmd is distributed to the model operation floor reaction force moment and the compliance control floor reaction force moment. However, the model operation floor reaction force moment and the compliance control floor reaction force moment Only one of these may be used. For example, a value obtained by reversing the sign of the compensation total floor reaction force moment Mdmd (or a required operation moment calculated by a proportional / differential law calculation in which the signs of the proportional gain Kx and the differential gain Kv are reversed) is used. It may be used as a force moment, and the floor reaction force moment for compliance control may be always set to “0”.
また、例えば、床反力モーメント許容範囲を十分に広い範囲に保つことができる場合には、補償全床反力モーメントMdmdをそのままコンプアライアンス制御用モーメントとして使用し、モデル操作床反力モーメントを常時“0”に設定するようにしてもよい。このようにすることにより、前記第1発明の一実施形態が構築されることとなる。 Also, for example, when the floor reaction force moment allowable range can be kept sufficiently wide, the compensated total floor reaction force moment Mdmd is used as it is as a compliance control moment, so that the model operation floor reaction force moment is always It may be set to “0”. By doing in this way, one Embodiment of the said 1st invention will be constructed | assembled.
また、前記実施形態では、目標歩容を生成するために用いるロボット1の動力学モデルとして、例えば1質点、あるいは3質点のモデルを例示したが、例えば上体24の姿勢を適宜変化させるような目標歩容を生成する場合には、上体24の姿勢変化と、床反力モーメントと関係を表現するフライホイール等を備える動力学モデルを用いてもよい。
In the above embodiment, the dynamic model of the
また、前記実施形態では、補償全床反力モーメントMdmdを本発明における要求操作量として用いたが、例えば目標ZMPの修正量等、前記位置偏差ΔXや上体姿勢角偏差Δθを操作し得る他の種類の要求操作量を用いてもよい。 In the above embodiment, the compensated total floor reaction force moment Mdmd is used as the required operation amount in the present invention. For example, the position deviation ΔX and the body posture angle deviation Δθ such as the correction amount of the target ZMP can be manipulated. The requested operation amount of the type may be used.
1…2足移動ロボット(移動体)、2…脚体(移動機構)、24…上体(基体)、100…歩容生成装置(上下方向慣性力パラメータ決定手段、目標運動決定手段)、104…複合コンプラインス動作決定部(動作制御手段)、110…補償全床反力モーメント分配器(分配手段)、112…姿勢安定化制御演算部(状態量偏差観測手段、要求操作量決定手段)、S606…上下方向慣性力パラメータ決定手段、200,210…移動体、202…車輪(移動機構)、206…基体。
DESCRIPTION OF
Claims (7)
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を満足するように、少なくとも上下方向慣性力パラメータを用いて前記移動体の目標運動の時系列を決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“0”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を逐次決定する要求操作量決定手段とを備え、
前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なう手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、該決定する要求操作量が、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻での目標慣性力の瞬時値と前記状態量偏差の観測値とに応じて変化する慣性力依存性操作量成分と、該目標慣性力に依存せずに前記状態量偏差の観測値に応じて変化する慣性力非依存性操作量成分とを合成してなる値となるように、前記上下方向慣性力パラメータと前記状態量偏差の観測値とを用いて前記要求操作量を決定することを特徴とする移動体の制御装置。 A control device that controls a moving body including a base and a moving mechanism that moves the base on the floor surface to move the base while moving the base up and down.
Vertical inertial force parameter determining means for determining a vertical inertial force parameter that is a parameter that defines a time series of the target inertial force in the vertical direction of the movable body or the base;
Target motion determining means for determining the time series of the target motion of the moving body using at least the vertical inertia force parameter so as to satisfy the time series of the target inertia force defined by the determined vertical inertia force parameter. When,
Operation control means for performing operation control of the moving body according to at least the determined target motion;
State quantity deviation observing means for sequentially observing a state quantity deviation representing the degree of deviation of the actual posture of the base body from the target posture of the base body in the determined target motion;
A required operation amount determining means for sequentially determining a required operation amount that defines an additional external force to be additionally applied to the moving body in order to converge the state quantity deviation to “0”;
The operation control means operates the mobile body so that an additional external force defined by the required operation amount is additionally applied to the mobile body while causing the actual motion of the mobile body to follow the target motion. A means of controlling,
The requested operation amount determining means is configured such that, at each time when the requested operation amount is determined, the requested operation amount to be determined is a current time in a time series of target inertia force defined by the vertical inertia force parameter. An inertial force-dependent manipulated variable component that changes according to the instantaneous value of the target inertial force and the observed value of the state quantity deviation, and changes according to the observed value of the state quantity deviation without depending on the target inertial force The requested manipulated variable is determined using the vertical inertial force parameter and the observed value of the state quantity deviation so as to be a value obtained by combining an inertial force-independent manipulated variable component. Control device for moving objects.
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
少なくとも、前記移動体の動力学を表現するものとしてあらかじめ設定された動力学モデルと、前記決定された上下方向慣性力パラメータと、前記動力学モデル上での移動体に作用させる目標外力の時系列とを用いて前記移動体の目標運動の時系列を決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“0”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を逐次決定する要求操作量決定手段とを備え、
前記目標運動決定手段は、前記決定された要求操作量に応じて前記動力学モデル上で前記目標外力に付加すべきモデル操作外力を決定し、その決定したモデル操作外力を前記目標外力に付加してなる外力を前記動力学モデル上での移動体に作用させつつ、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を前記動力学モデル上で満足するように前記目標運動を決定する手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、該決定する要求操作量が、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻での目標慣性力の瞬時値と前記状態量偏差の観測値とに応じて変化する慣性力依存性操作量成分と、該目標慣性力に依存せずに前記状態量偏差の観測値に応じて変化する慣性力非依存性操作量成分とを合成してなる値となるように、前記上下方向慣性力パラメータと前記状態量偏差の観測値とを用いて前記要求操作量を決定することを特徴とする移動体の制御装置。 A control device that controls a moving body including a base and a moving mechanism that moves the base on the floor surface to move the base while moving the base up and down.
Vertical inertial force parameter determining means for determining a vertical inertial force parameter that is a parameter that defines a time series of the target inertial force in the vertical direction of the movable body or the base;
A time series of at least a dynamic model preset as representing dynamics of the moving body, the determined vertical inertia force parameter, and a target external force to be applied to the moving body on the dynamic model A target motion determining means for determining a time series of the target motion of the moving body using
Operation control means for performing operation control of the moving body according to at least the determined target motion;
State quantity deviation observing means for sequentially observing a state quantity deviation representing the degree of deviation of the actual posture of the base body from the target posture of the base body in the determined target motion;
A required operation amount determining means for sequentially determining a required operation amount that defines an additional external force to be additionally applied to the moving body in order to converge the state quantity deviation to “0”;
The target motion determining means determines a model operation external force to be added to the target external force on the dynamic model according to the determined required operation amount, and adds the determined model operation external force to the target external force. The target force is applied to the moving body on the dynamic model while satisfying the target inertia force time series defined by the determined vertical inertia force parameter on the dynamic model. A means of determining exercise,
The requested operation amount determining means is configured such that, at each time when the requested operation amount is determined, the requested operation amount to be determined is a current time in a time series of target inertia force defined by the vertical inertia force parameter. An inertial force-dependent manipulated variable component that changes according to the instantaneous value of the target inertial force and the observed value of the state quantity deviation, and changes according to the observed value of the state quantity deviation without depending on the target inertial force The requested manipulated variable is determined using the vertical inertial force parameter and the observed value of the state quantity deviation so as to be a value obtained by combining an inertial force-independent manipulated variable component. Control device for moving objects.
前記目標運動決定手段は、前記決定された要求操作量を、前記モデル操作外力と、前記移動体に実際に付加的に作用させるべき実移動体操作外力とに分配する分配手段を備え、
前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記実移動体操作外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なうことを特徴とする移動体の制御装置。 In the control apparatus of the moving body of Claim 2,
The target motion determining means includes a distributing means for distributing the determined required operation amount to the model operating external force and an actual moving body operating external force that should actually act on the moving body.
The operation control means performs the operation control of the moving body so that the actual moving body operating external force is additionally applied to the moving body while causing the actual movement of the moving body to follow the target movement. A control device for a moving object.
前記要求操作量決定手段が決定する前記要求操作量は、前記状態量偏差の観測値にあらかじめ設定された所定値の第1係数を乗じてなる値を少なくとも含む前記慣性力非依存性操作量成分と、現在時刻における前記目標慣性力の瞬時値の関数値である第2係数を前記状態量偏差の観測値に乗じてなる値を少なくとも含む前記慣性力依存性操作量成分とを加え合わせてなる値であることを特徴とする移動体の制御装置。 In the control apparatus of the moving body of any one of Claims 1-3,
The requested operation amount determined by the requested operation amount determining means includes at least an inertial force-independent operation amount component including at least a value obtained by multiplying the observed value of the state quantity deviation by a predetermined first coefficient. And the inertial force-dependent manipulated variable component including at least a value obtained by multiplying the observed value of the state quantity deviation by a second coefficient that is a function value of the instantaneous value of the target inertial force at the current time. A control device for a moving body, characterized in that it is a value.
前記慣性力依存性操作量成分は、前記状態量偏差の観測値にあらかじめ設定された所定値の第1係数を乗じてなる値と、前記状態量偏差の観測値の時間的変化率にあらかじめ設定された所定値の第3係数を乗じてなる値とから構成され、前記慣性力非依存性操作量成分は、第2係数を前記状態量偏差の観測値に乗じてなる値から構成されることを特徴とする移動体の制御装置。 In the control apparatus of the moving body of Claim 4,
The inertial force dependent manipulated variable component is set in advance to a value obtained by multiplying the observed value of the state quantity deviation by a first coefficient of a predetermined value set in advance, and a temporal change rate of the observed value of the state quantity deviation. The inertial force-independent manipulated variable component is composed of a value obtained by multiplying the observed value of the state quantity deviation by the second coefficient. A control device for a moving body.
前記要求操作量決定手段が前記要求操作量を決定するために実行する処理は、前記第1係数と前記第2係数とを加え合わせてなる合成係数を、前記状態量偏差の観測値に乗じる処理を含むことを特徴とする移動体の制御装置。 In the control apparatus of the moving body of Claim 4 or 5,
The process executed by the requested operation amount determining means to determine the requested operation quantity is a process of multiplying the observed value of the state quantity deviation by a composite coefficient obtained by adding the first coefficient and the second coefficient. The control apparatus of the moving body characterized by including.
前記慣性力非依存性操作量成分は、前記目標慣性力が“0”に維持されていると仮定した場合に、前記状態量偏差を“0”に収束させるために必要な前記付加的外力を規定する操作量成分であり、前記慣性力依存性操作量成分は、現在時刻における前記目標慣性力の瞬時値に起因して発生する前記付加的外力を打ち消すために必要な操作量成分であることを特徴とする移動体の制御装置。 In the control apparatus of the moving body of any one of Claims 1-6,
The inertial force-independent manipulated variable component includes the additional external force necessary to converge the state quantity deviation to “0”, assuming that the target inertial force is maintained at “0”. The inertial force dependent manipulated variable component is a manipulated variable component necessary for canceling the additional external force generated due to the instantaneous value of the target inertial force at the current time. A control device for a moving body.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009229712A JP5232120B2 (en) | 2009-10-01 | 2009-10-01 | Control device for moving body |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009229712A JP5232120B2 (en) | 2009-10-01 | 2009-10-01 | Control device for moving body |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011073119A JP2011073119A (en) | 2011-04-14 |
JP5232120B2 true JP5232120B2 (en) | 2013-07-10 |
Family
ID=44017661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009229712A Active JP5232120B2 (en) | 2009-10-01 | 2009-10-01 | Control device for moving body |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5232120B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9682474B2 (en) | 2014-09-29 | 2017-06-20 | Honda Motor Co., Ltd. | Control device for mobile body |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6682341B2 (en) * | 2016-05-10 | 2020-04-15 | パナソニック株式会社 | Walking control method, walking control program, and bipedal walking robot |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1508408B1 (en) * | 2002-04-26 | 2010-04-21 | Honda Giken Kogyo Kabushiki Kaisha | System for estimating attitude of leg type moving robot itself |
US7603234B2 (en) * | 2003-06-27 | 2009-10-13 | Honda Motor Co., Ltd. | Controller of legged mobile robot |
JP3726097B2 (en) * | 2005-04-11 | 2005-12-14 | 本田技研工業株式会社 | Posture control device for legged mobile robot |
JP4844416B2 (en) * | 2007-02-01 | 2011-12-28 | トヨタ自動車株式会社 | Biped robot |
-
2009
- 2009-10-01 JP JP2009229712A patent/JP5232120B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9682474B2 (en) | 2014-09-29 | 2017-06-20 | Honda Motor Co., Ltd. | Control device for mobile body |
Also Published As
Publication number | Publication date |
---|---|
JP2011073119A (en) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5219956B2 (en) | Control device for moving body | |
JP5483997B2 (en) | Control device for legged mobile robot | |
JP5284923B2 (en) | Control device for legged mobile robot | |
JP5456588B2 (en) | Control device for legged mobile robot | |
JP5232124B2 (en) | Control device for legged mobile robot | |
JP5221688B2 (en) | Gait generator for legged mobile robot | |
JP3640255B2 (en) | Gait generator for legged mobile robot | |
JP4800037B2 (en) | Gait generator for mobile robot | |
JP4199236B2 (en) | Gait generator for legged mobile robot | |
JPWO2005000536A1 (en) | Control device for legged mobile robot | |
WO2005082582A1 (en) | Gait generating device for moving robot | |
JP5232120B2 (en) | Control device for moving body | |
JP5404543B2 (en) | Control device for legged mobile robot | |
JP5404544B2 (en) | Control device for legged mobile robot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120518 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130322 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5232120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |