Nothing Special   »   [go: up one dir, main page]

CN113966264A - 用于基于接触定位在通过机器人操纵时可移动的对象的方法、计算机程序产品和机器人控制装置以及机器人 - Google Patents

用于基于接触定位在通过机器人操纵时可移动的对象的方法、计算机程序产品和机器人控制装置以及机器人 Download PDF

Info

Publication number
CN113966264A
CN113966264A CN202080036852.XA CN202080036852A CN113966264A CN 113966264 A CN113966264 A CN 113966264A CN 202080036852 A CN202080036852 A CN 202080036852A CN 113966264 A CN113966264 A CN 113966264A
Authority
CN
China
Prior art keywords
robot
measurement
simulation
model
probability distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080036852.XA
Other languages
English (en)
Other versions
CN113966264B (zh
Inventor
F·温斯霍夫尔
P·S·施密特
B·卡斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN113966264A publication Critical patent/CN113966264A/zh
Application granted granted Critical
Publication of CN113966264B publication Critical patent/CN113966264B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/1633Programme controls characterised by the control loop compliant, force, torque control, e.g. combined with position control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/08Controls for manipulators by means of sensing devices, e.g. viewing or touching devices
    • B25J13/088Controls for manipulators by means of sensing devices, e.g. viewing or touching devices with position, velocity or acceleration sensors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/161Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/4155Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by programme execution, i.e. part programme or machine function execution, e.g. selection of a programme
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39013Locate movable manipulator relative to object, compare to stored gridpoints
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39018Inverse calibration, find exact joint angles for given location in world space
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/50Machine tool, machine tool null till machine tool work handling
    • G05B2219/50391Robot

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Manufacturing & Machinery (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)
  • Numerical Control (AREA)

Abstract

为了能够针对对象(OBJ)在通过至少一个机器人(ROB)操纵时在考虑开头提及的要求目录的情况下基于概率方法在没有通过视觉传感器的对象检测的情况下进行对象定位,提出了,对象与机器人在机器人‑对象环境(ROU)形成用于系统状态估计的系统(SYS),根据随着对象定位出现的估计来定位定位所述对象的概率分布,所述概率分布借助贝叶斯滤波器算法(BFA)的迭代递归应用来确定,其中为此将在用于系统仿真的非确定性的运动模型(BWM)中从系统的状态的所建模的转移中获得的状态转移概率与在用于系统仿真的测量模型(MSM)中从运动模型中建模的系统状态转移的所建模的合理性检查中获得的测量概率用乘法关联,和在开始时使用初始概率分布。为此,在运动模型中包括完整地包括所述系统关于力和动力学的物理以及由此得到的物理系统关系的用于系统状态仿真的物理仿真器(PHS)和在所反馈的仿真系统状态的情况下控制物理仿真器并且基于调节变量(SGR)影响机器人相对于所述机器人‑对象环境的顺应性的控制器(RGL,IPR),并且在测量模型中针对合理性检查考虑轴特定的测量的测量结果(MSE)。

Description

用于基于接触定位在通过机器人操纵时可移动的对象的方 法、计算机程序产品和机器人控制装置以及机器人
技术领域
本发明涉及根据专利权利要求1的前序部分的用于基于接触定位在通过机器人操纵时可移动的对象的方法、根据专利权利要求6的前序部分的用于基于接触定位在通过机器人操纵时可移动的对象的计算机程序产品和根据专利权利要求11的前序部分的用于基于接触定位在通过机器人操纵时可移动的对象的机器人控制装置。
背景技术
定位在通过机器人操纵时可移动的对象、例如工件或任意的其他物品是对于安全操纵而言必不可少的过程,在该过程中要操纵的可移动的对象被检测和跟踪,尤其如果该对象未按照定义处于用于操作的地点处或可以被运输和交付到那里,即该对象对于机器人而言不可抓取,则因此例如利用机器人自己的传感器来检测和跟踪。
被用于对象操纵的机器人(因此经常也称为操纵器)要么是配备有抓臂的自动机,该自动机受远程控制地、以传感器和编程辅助的方式作为人类替代品在工业环境中实现机械活动,要么是在不同技术领域执行人的功能的机器人或可移动的自动机。
在此情况下的中心问题是,在对象识别/对象跟踪的精度最重要的时刻,例如通过相机的常用的定位方法失败。尤其如果机器与对象相互作用(例如抓取、存放等)或对象彼此接触(例如在安装时),则需要精确的对象姿态。
一种已知的方法是,在不存在遮蔽期间基于相机定位对象一次,并以“开环”方式执行剩余的操纵过程。如果在剩下的过程中干扰影响对象姿态,则该方法失败。
在科学文献中存在用于基于接触定位对象的多种方法。参见[1]、[2]、[3]。
然而,现有方法中的任何一个都不满足对用于对象识别/对象跟踪的算法的所有要求。这些要求是:
- 必须能够处理任意的机器人动力学和任意的机器人和对象几何形状。
- 必须确定包括速度在内的完整的对象姿态、即对象状态,必要时也针对多个对象同时确定所述对象姿态。对象的姿态尤其被理解为该对象的位置和/或定向。这意味着不做出减少维度数量的假设。
- 必须能够反映多模态对象分布。这意味着不能以精确的初始估计为基础。
- 该方法必须实时地工作。
- 必须在接触情况下定位可移动的对象。
在此情况下,基于相机的方法是有问题的,因为机器人和对象相互遮蔽。
出于该原因,非常有帮助的将是具有基于接触的识别系统,该识别系统基于机器人配置的测量(例如轴向位置/轴向速度)和所测量的相互作用力来确定对象姿态。
发明内容
本发明所基于的任务在于说明用于基于接触定位在通过机器人操纵时可移动的对象的方法、计算机程序产品和机器人控制装置,其中考虑上述要求目录基于概率方法在不通过视觉传感器、诸如相机进行对象检测的情况下进行对象定位。
该任务基于在专利权利要求1的前序部分中所定义的方法通过在专利权利要求1的特征部分中所说明的方法特征来解决。
此外,该任务基于在专利权利要求6的前序部分中所定义的计算机程序产品通过在专利权利要求6的特征部分中所说明的计算机程序产品特征来解决。
此外,该任务基于在专利权利要求11的前序部分中所定义的机器人控制装置通过在专利权利要求11的特征部分中所说明的机器人特征来解决。
本发明所基于的、根据在权利要求1、6和11中分别说明的技术教导的构思在于,定位在由至少一个受调节变量控制的机器人操纵时可移动的对象,该对象与机器人一起在机器人-对象环境中形成用于系统状态估计的系统,其中针对随着对象定位而出现的系统状态估计借助贝叶斯滤波器算法的迭代递归应用近似地确定定位对象的概率分布,并且在此,在用于系统仿真的非确定性运动模型中,将从系统的状态的所建模的转移获得的状态转移概率与在用于系统仿真的测量模型中从在运动模型中建模的系统状态转移的所建模的合理性检查(Plausibilitätsprüfungen)中获得的测量概率用乘法关联,以及在迭代递归应用的开始时使用初始概率分布。为此,在运动模型中包括用于系统状态仿真的物理仿真器以及控制器,所述物理仿真器完整地包括系统关于力和动力学的物理以及系统组件的由此得到的物理关系,所述控制器在反馈的仿真系统状态的情况下控制物理仿真器并且基于调节变量完成或实现机器人相对于机器人-对象环境的顺应性,并且在测量模型中针对合理性检查考虑轴特定的测量的测量结果。
在此,概率方法的基本方面是概率分布的变量、运动模型和测量模型,其中关于系统状态(粒子)的每个假设包含对象姿态和对象速度以及机器人姿态和机器人速度。
在此尤其有利的是,在任意几何形状的情况下利用任意机器人/自动机和从任意初始情况实时地定位一个或多个对象、例如工件。
在此,对于根据权利要求2和7的本发明的改进方案有利的是,针对贝叶斯滤波器算法的近似在概率分布的迭代递归确定中使用粒子滤波器算法。
为了能够完成、实现或提供机器人相对于机器人-对象环境的顺应性,根据权利要求3和8,调节变量有利地由额定位置、额定速度和/或额定加速度形成。
为了实现这种顺应性,但是也可能的是,根据权利要求4和9,控制器有利地作为阻抗控制器来运行,其中阻抗控制被用于控制器的顺从调节。
针对合理性检查在测量模型中在机器人上进行的轴特定的测量优选地涉及轴向动力学,据此根据权利要求5和10优选地测量来自轴向位置、轴向速度、轴向加速度和轴向转矩中的至少一个轴向动力学变量,并且使用由此分别获得的测量结果。
本发明的其他优点从本发明的实施例借助唯一的图和对在后公开的F.Wirnshofer等人的非专利文献“State Estimation in Contact-Rich Manipulation";IEEE International Conference on Robotics and Automation (ICRA), 2019年5月20-24日,蒙特利尔(在下文中称为“Wirnshofer等人”)的参考(“由参考所引用”)的以下描述中得出。
该图示出用于基于接触定位在通过受调节变量控制的机器人ROB操纵时可移动的对象OBJ的机器人控制装置RST。该图仅示出一个机器人。
但是在另一实施例的范围内可设想的是,多个机器人想要操纵该可移动的对象或多个可移动的对象[参看Wirnshofer 等人;(图1)、(图2)、(图6-立方体2)]。
通过机器人ROB操纵对象OBJ发生在机器人-对象环境ROU中。根据在Wirnshofer等人中的实施方案,该机器人-对象环境ROU是例如具有盒子的桌面,对象、例如立方体处于该盒子上[参看Wirnshofer等人;(图4),(图6-立方体-盒子)]。
例如根据Wirnshofer等人,机器人ROB是配备有抓臂的自动机,该自动机受远程控制地、以传感器和编程辅助的方式作为人类替代品在工业环境中实现机械活动。
不言而喻的是,任何其他任意的机器人-对象环境ROU也可以适合于基于接触定位在通过机器人操纵时可移动的对象。
根据该图,机器人ROB、可移动的对象OBJ和机器人-对象环境ROU形成系统SYS,其中机器人ROB、可移动的对象OBJ和机器人-对象环境ROU是系统组件。该系统SYS是一个“真实系统”,其可以例如以在工业自动化中所描绘的机器人表现形式(Ausprägung)这样存在或出现在各种技术领域中。与此不同或相反地,在机器人控制装置RST中模仿该系统SYS的仿真并且基于该仿真利用已知算法进行系统SYS的基于概率方法的状态估计。在该仿真中,要估计的系统状态随着真实系统SYS中的对象定位而出现,并且因此可以做出关于对象的可能停留地点的陈述。
机器人控制装置RST包含用于基于接触定位在通过机器人ROB操纵时可移动的对象OBJ的计算机程序产品CPP,并且可以例如如在该图中利用点划线的“套索”所示出的那样作为独立构成的并且在市场上单独销售的单元是机器人ROB的组成部分。在此,机器人控制装置和机器人可以、但是它们不必来自同一制造商。
计算机程序产品CPP包含非易失性可读存储器SP,在该非易失性可读存储器中存储有执行对象定位的程序模块PGM的处理器可读的控制程序指令,以及包含与存储器SP连接的处理器PZ,所述处理器执行用于对象定位的程序模块PGM 的控制程序指令。
类似于上述的机器人-机器人控制装置考虑,现在在机器人控制装置-“计算机程序产品”考虑中,分别优选地设计、提供或构成为APP、要不然是用于机器人控制装置的编程环境或“应用编程接口 <API>”的组成部分的计算机程序产品CPP或更准确地说执行对象定位的程序模块PGM同样可以独立地并且与机器人控制装置无关地作为制造商A的单独的产品在市场上销售并且然后被使用在制造商B的任意机器人控制装置中。
程序模块PGM由三个子模块组成,所述子模块为了系统状态估计或在目标定位期间在功能上共同起作用。
在第一子模块TM1中包含以及以编程和软件技术实施贝叶斯滤波器算法BFA和近似算法APA,其中就所绘出的箭头方向而言,两种算法相应地在功能上共同起作用。
第二子模块TM2包括测量模型MSM,就所绘出的箭头方向而言,该测量模型与第一子模块TM1以所示出的方式再次相应地在功能上共同起作用。
关于与第一子模块TM1在功能上共同起作用,同样适用于第三子模块TM3。所述第三子模块TM3包括运动模型BWM,就所绘出的箭头方向而言,该运动模型也一起以所示出的方式相应地在功能上共同起作用。在该运动模型BWM中,以编程和软件技术实现或实施用于系统状态仿真的物理仿真器PHS和在反馈的仿真系统状态的情况下控制物理仿真器的控制器RGL,所述物理仿真器完整地包括系统SYS关于力和动力学的物理和由此得到的系统组件的物理关系。两个组件、即物理仿真器和控制器RGL形成确定性仿真系统SSY。因此,运动模型BWM也是确定性的。然而,如果仿真系统SSY的物理仿真器PHS被施加随机力和/或动力,则所述物理仿真器在其行为方面有噪声(verrauscht)。由于该噪声,不仅仿真系统SSY而且运动模型BWM都变得不确定。为此稍后在本发明的进一步技术考虑的过程中更详细地对此加以探讨。
针对物理仿真器PHS的功能控制,控制器RGL被施加调节变量,所述调节变量为了能够以阻抗被控制的方式、作为阻抗控制器IPR运行所述控制器RGL可以要么是额定位置、额定速度,要么是额定加速度。通过给控制器RGL施加调节变量和与之相联系地作为阻抗控制器运行控制器的方式,机器人的行为在系统状态仿真中顺从机器人-对象环境ROU。稍后在本发明的进一步技术考虑的过程中也对这方面更详细地加以探讨。
计算机程序产品CPP中的处理器PZ现在利用用于对象定位的程序模块PGM的控制程序指令的执行在已经提及的系统状态估计的过程中针对通过所提到的系统组件形成的系统SYS的随着对象定位出现的状态确定定位对象OBJ的概率分布。该确定借助在程序模块PGM中所包含和所实施的贝叶斯滤波器算法BFA的迭代递归应用来进行。所述算法原则上是贝叶斯滤波器,所述贝叶斯滤波器在迭代递归应用中提供前述的概率分布。
在用于确定概率分布的算法的该迭代递归应用期间,用乘法关联状态转移概率和测量概率,该状态转移概率根据用于系统仿真的运动模型BWM在所述运动模型是非确定性的前提下从系统的状态的所建模的转移中获得,并且该测量概率根据用于系统仿真的测量模型MSM从根据运动模型BWM所建模的系统状态转移的所建模的合理性检查获得。
根据测量模型MSM,针对在用于确定概率分布的算法的迭代递归应用期间的合理性检查,在机器人ROB处进行轴特定的、例如涉及轴向动力学的测量,并且在测量模型MSM中考虑由此产生的测量结果MSE。用于合理性检查的测量结果MSE优选地是来自机器人ROB的轴向位置、轴向速度、轴向加速度和/或轴向转矩的测量的结果。测量结果的测量和考虑原则上在该图中通过从机器人ROB经由处理器PZ直到测量模型MSM的虚线作用箭头示出。但是,实际考虑在处理器PZ中在执行程序模块PGM的控制程序指令期间、更确切地说在确定概率分布的过程中进行。
此外,在用于确定概率分布的算法的迭代递归应用期间,在开始时使用初始概率分布,并且由于系统状态估计的复杂性[对此参看在本发明的进一步技术考虑的过程中和在Wirnshofer等人中的阐述]使用近似算法APA。作为近似算法APA,优选地使用已知的粒子滤波器算法PFA,所述粒子滤波器算法在其实施中是粒子滤波器[4]。
如何详细地实现上面概述的概率分布的确定和哪些技术方面在此应予以考虑利用在本发明的进一步技术考虑的过程中的阐述和在Wirnshofer等人中的阐述予以解释。
在上面所描述的实施例的范围中本发明的更广泛的技术考虑基于F.Wirnshofer等人的在后公开的非专利文献“State Estimation in Contact-Rich Manipulation”;IEEE International Conference on Robotics and Automation(ICRA),2019年5月20-24日,蒙特利尔,所述非专利文献基于以下与该考虑相关联的参考并且在本专利申请中所公开的技术教导的上下文中应明确地被视为附加的与本发明相关的公开内容。
为了能够基于接触定位在通过机器人操纵时可移动的对象,根据实施例遵循概率方法。
为了能够估计可移动的对象的位置、速度或完全一般地状态以及对象通过机器人的操纵,原则上为了估计可以利用两件事。这不仅仅适用于当前的估计复合体(Schätzungskomplex),而是完全一般地适用于任何类型的估计。
对于涉及本发明的估计复合体,一方面具有关于由至少一个机器人或操纵器(用于对象操纵的机器人)和至少一个在空间中可移动的对象组成的系统在物理上如何表现的模型,并且另一方面具有与系统相关的测量。
如果对象位于桌面等上,则知道该对象是静态的。现在假设具有允许估计的空间并且具有系统相关的测量,所述测量例如通过相机或通过传感器在机器人的轴向位置处发生。
根据该实施例,仅考虑在操纵器或机器人的轴上的位置传感器,并且当然考虑关于该系统的模型知识。对象的基于相机的定位如开头已经提及的那样不是当前考虑的主题。
所具有的典型的模型知识是:
知道机器人的几何形状。知道系统的单个部分(至少一个机器人、至少一个对象和桌面)的几何形状,并且知道这些部分不相互穿透。这是可以使用的模型知识。然而,这种类型的模型知识这里不直接被使用。因此并不假设:这些部分不彼此穿透。替代于此,执行物理仿真,该物理仿真是系统的非常详细的物理模型。并且在物理仿真器中自动地不发生穿透,因为物理仿真器阻止系统部分相互穿透。
在Wirnshofer等人中在第三章;A)“Rigid Body Motion and Contact Dynamics”中解释了物理仿真器背后的物理/数学。那里所解释的物理原理被封装在该物理仿真器中,或者是该物理仿真器和物理系统模型的相应的组成部分。
为了估计对象的状态,现在不像在现有技术中那样考虑整个状态的子集(subset)(因此并不是说,对象被钉牢在桌面上并且然后只具有Z分量或做具有类似效果的其他事情或忽略速度),不,对象的所有位置和旋转的完整系统状态加上其速度、加上机器人或操纵器的所有状态都一起被并入到一个大的复杂的估计问题中。也就是说,首先假设:完全不知道机器人的轴向位置。这不是合理的假设,因为针对机器人知道:该机器人处于哪里并且知道:机器人多快地移动。因此,所有这些变量都一起被并入到大的复杂的估计问题中,这乍一看不是一个好主意,因为其极大地扩大状态空间并且乍一看使估计问题无法解决。
此外还有第二步骤,该第二步骤又乍一看再一次地看上去不是一个好主意。即,考虑系统的完整动力学。也就是说,注意:从轴到整个系统的总加速度的轴向转矩(包括重力、接触力和摩擦力)如何表现,由此物理系统模型进一步在其复杂度方面升高。
如果现在出现该非常复杂的系统模型,则进行进一步的附加假设,更确切地说假设,机器人或操纵器在完整的时间内都在稳定的控制中运行。因此在物理仿真中考虑控制器(Controller)。
换言之,给物理仿真器施加稳定的控制。具有物理仿真器的物理系统模型被扩展了具有控制器的控制器模型。
在Wirnshofer等人中在第三章;B)“Compliant Interaction and ControllerModel”中解释了控制器。所述控制器引起稳定的控制并且有关的控制器模型如物理系统模型那样作为估计问题的基础。
估计问题所基于的、由物理系统模型和控制器模型组成的系统模型具有如下优点:至少就机器人而言,该系统模型自稳定,也就是说,如果恰好没有接触力出现,则机器人将总是移动到其额定位置中,并且如果于是然后将整体解释为概率模型,则就机器人而言,整个概率质量过渡到该稳定点。机器人不漂移通过该区域。换言之,尽管所有状态已被机器人一起考虑,不仅位置而且速度(其根据Wirnshofer等人在插图(图1和图2)中的教导可以变得非常多,因此例如在所示出的考虑具有14个轴的两个机器人的情况下,总共有具有 14个位置和14个速度的28个状态),这些状态都在估计问题之后消失,因为所述状态都过渡(einschwingen)并且事实上并不存在,因为它们都处于相同的值。
除了机器人之外,当然,在稳定的控制的该考虑中还附加地存在每个对象六个自由度,即三个位置和三个定向以及同样多的速度。所述自由度最终被压缩为每个对象三个剩下的自由度。对象简单地跌倒,它保持躺着且速度消失。这是物理模型的结果:对象通常倒向一侧。在六个自由度中,失去两个旋转自由度和一个平移自由度,并且最终仅还剩余对象的三个自由度。
结论:虽然所有变量都已一起被包括到大的复杂的估计问题中,但所述估计问题然后将所有变量共同地浓缩为对象的三个剩余变量。
因此,现在在系统模型中存在物理系统模型和控制器模型的组合,如上面关于Wirnshofer等人在第三章;A)中和在第三章;B)中所概述的那样。这两个模型现在形成用于估计问题的输入变量。作为另外的准第四输入变量(因为作为第三输入变量,如下面将进一步解释的那样,设置测量或测量模型),已知机器人的额定位置[参看在Wirnshofer等人中在插图(图3)中的qd r]和额定速度[参看在Wirnshofer等人中在插图(图 3)中的
Figure DEST_PATH_IMAGE002AAA
],因为知道:机器人应驶往哪里。两个变量可以要么被解释为控制器的一部分,要不然也可以被明确地认为是输入变量。这现在如何被考虑是无所谓的,其可以被选择。由此,现在原则上表征用于估计问题的系统模型。
在Wirnshofer等人中在插图(图3)中,物理模型包含在块“正向动力学(ForwardDynamics)”中,并且控制器模型包含在块“控制器(Controller)”中。块“正向动力学”因此被称为“Forward Dynamics”,因为它是并且描述系统的当前运动状态,即所有涉及的组件(不仅操纵器而且对象)的位置和速度,加上应用于操纵器的轴上的转矩。这三件事组合地确定操纵器和对象如何加速。表达“正向动力学”因此被选择,因为由此描述系统向前的发展。该块“正向动力学”将作为物理仿真器实施,并且可以在Wirnshofer等人中在前述的插图(图 3)中在一定程度上整块地看到所述模型,这些模型被用作用于估计问题的输入变量。
这首先是物理仿真器或物理系统模型以及控制器或控制器模型,或者具有所包括的额定位置和额定速度,要不然没有所包括的额定位置和额定速度。作为第三输入变量,对于估计问题而言于是还需要已经谈及的测量。在测量模型的范围内所使用的测量是关于机器人上的轴向位置的测量,这些轴向位置典型地是可测量的,因为已知:轴被旋转了多远。
利用系统模型(物理系统模型和控制器模型)和测量模型,现在存在被用于估计问题的输入变量。利用这些输入变量现在遵循概率方法并对状态估计问题建模,在所述状态估计问题的情况下系统的状态被估计并被称为“可信度(belief)”。这种方法导致运动模型,所述运动模型在Wirnshofer等人中在第三章;C)“Sequential Bayesian Estimation”中被概述,以及导致已经提及的测量模型。
在这种方法的过程中的另一点是,使用贝叶斯滤波器,或者更确切地说,使用贝叶斯滤波器算法,以便计算“可信度”。该算法是递归的(关于用“t”作为索引的时间点)并由以下变量得出:初始(旧)“可信度”,调节变量(在Wirnshofer 等人中在第三章;C)中用“ut”表示)和当前测量。
对于贝叶斯滤波器算法的具体实施,除了初始“可信度”之外,需要两个附加的概率分布:
1. 状态转移概率,其说明从当前状态到后续状态的转移概率,以及
2. 从确定状态得到确定测量的概率,该测量模型提供所述测量。
为了能够实施贝叶斯滤波器算法,此外假设系统的有噪声的动力学(来自未知的状态)并且附加地还假设:从该状态得到有噪声的测量。利用这两个组件(假设),于是可以在使用合适的近似的情况下将贝叶斯滤波器用于状态估计。
现在该状态估计模型看起来如何。首先具有运动模型,所述运动模型提供状态转移概率,并且具有测量模型,所述测量模型提供状态和测量变量之间的概率分布。
测量模型包括什么
Figure 678662DEST_PATH_IMAGE004
假设:如果机器人轴处于确定的当前位置处,因此例如相对于之前的位置旋转了100°的角测度,则在测量时简单地获得测量值的高斯分布,其中平均值具有该100°角位置。
运动模型描述从在给定调节变量的情况下的当前状态(控制器的输入;参看在Wirnshofer等人中的图3)到后续状态{参看在Wirnshofer等人中在第三章;C)中}的转移概率。关于当前状态,系统中所有涉及的组件(机器人和对象)的位置和速度是已知的,并且作为调节变量(这是控制器的输入;在下文中称为控制输入),额定位置[参看在Wirnshofer等人中在插图(图3)中的qd r]和额定速度[参看在Wirnshofer等人中在插图(图3)中的
Figure DEST_PATH_IMAGE006
]是已知的,所述额定位置和额定速度是用于控制器的额定变量。
这些控制输入(这是非常重要的)原则上仅代表通过系统模型表征的实际物理系统;因此也谈及代理输入。实际的直接输入将是转矩,因为机器人确实经由这些转矩来控制。
由于确实不能简单地告诉物理系统,朝着任意地点远距离传送自身,而是替代于此可以只影响作为调节变量的加速度,所提到的额定变量(额定位置和额定速度)是(可以说作为抽象)实际输入。这具有以下优点:控制器可以一起被包括到系统模型中,由此机器人最终如上面已经提及的那样变为稳定。
如果替代于此转矩将被认为是系统的输入,则原则上将具有双积分器。但是,可以控制的加速度是有效的。通过双积分器的功能,误差被积分并且机器人在任何地方漂移通过该区域。也就是说,如果想要估计七轴机器人,其恰好处于哪里,并且只具有作为输入的转矩,那么该机器人漂移通过七维状态空间并且不存在利用任何外部计算机来估计机器人恰好停留在哪里的现实机会。
如果但是(与此不同地)间接控制输入进入模型中,那么知道:控制器使机器人稳定并且,只要不出现接触,七维空间就有效地叠合到零维点,因为机器人简单地保持稳定。机器人因此向其应驶往的地方移动。
在作为调节变量的转矩以及作为调节变量的额定位置和额定速度之间的差异可以非常好地以“轴向水平上的阻抗控制器”为例来考虑和呈现。涉及思想模型。根据该思想模型,阻抗控制器将仿真人工弹簧。假设机器人具有额定位置值,该机器人应朝着该额定位置值移动。该额定位置通过桌面给定。机器人经由其手臂朝着桌面的方向移动操纵器(抓取器)。如果发生与桌面的接触,机器人感觉到反作用力。基于阻抗控制器,机器人将保持手臂稳定并保持在接触位置处。如果桌面现在想要进一步尝试主动地超出反作用力将机器人的抓取器推开(这从物理上来看是不现实的),则机器人将像旋转弹簧一样抵抗偏转工作并允许尝试将其推开。由于在阻抗控制器中不存在整体部分,所以机器人的确不会强迫其又返回 到接触位置。这种机器人行为是典型地在操纵对象期间喜欢的机器人行为。的确不想要机器人强迫其位置,因为这导致对象被损坏或甚至被毁坏。
这种具有阻抗控制器的思想模型实际上相当清楚地和令人印象深刻地阐明:如果机器人基于作为调节变量的代理输入、额定位置和额定速度移动到与此对应的位置,发生什么:然后在定位可移动的对象的过程中与对象接触,然后在那里在接触中建立力,更确切地说,直至弹簧张紧并且然后,以将恒定的力施加到对象和其周围环境的方式停留在那里。这是阻抗控制器的作用原理。这种阻抗控制器是控制器的一种可能性,该控制器在出现接触力并且提供代理输入或间接输入(该控制器的额定位置和额定速度)的前提下使系统或机器人稳定。
为什么测量模型对于估计问题而言是需要的
Figure DEST_PATH_IMAGE008
如果尝试基于以某种方式测量的机器人位置和接触力来估计对象的位置,则乍一看完全不清楚什么是实际测量以及什么是机械操作或操控意义上的驱动(Aktuierung)。
的确例如可以说,告诉机器人移动到那里,并且然后机器人测量力,或者我可以说,我命令所述轴,并且然后机器人移动到一个位置。因此这从逻辑顺序来看不一定清楚的是,什么是驱动和什么是测量。并且实际上相关的是,例如考虑来自该文献的已经尝试事先解决该问题的方法。
在这些已知方法中所做的如下:最终将机器人位置假设为驱动和测量并且忽略所述力。并且然后表明:机器人应驶往任何地方并且它驶往了那里,并且知道:对象和机器人不彼此穿透,也就是说,测量模型仅经由假设的穿透或不穿透得出。如果机器人将插入在物体中(即存在穿透),则进一步知道,这不是合理的状态。如果附加地还考虑力,还知道,于是例如可以说,如果感觉到力,则处于接触中。也就是说,如果具有在哪里对象不处于接触中的假设,则知道该假设是不合理的,因为的确测量接触。
这种方法具有明确的缺点。
第一缺点是,如果这样做,如果在一定程度上基于位置作为驱动,则没有合理的运动模型,因为不存在如何使机器人和对象的这种可能跳跃的准位置与动力学协调的有意义的模型。
第二缺点是不能有意义地从中导出对象应如何移动。
然后根据已知的方法典型地所做的是假设:对象简单地扩散通过空间,可能也在所有六个自由度中,以此对象因此开始悬停。并且于是尝试然后再次对此进行纠正,并且这有两个缺点。
首先,诸如对象被机器人推动之类的效果并未以物理上合理的方式反映,并且其次,实际上具有状态空间的全维度,必须分析所述全维度。对象开始悬停并且必须在所有六个自由度中估计对象,其中这是实际上的确完全不想要的。
在这种类型的方法的情况下,问题不仅是运动模型的一部分,而且是测量模型的一部分。
为了对此进行回避,在该实施例中表明:控制输入是控制器的额定位置,但是直接的从外部未调制的调节变量是转矩,所述转矩从物理仿真器中的控制器中得出。这导致在物理仿真中所有的都以物理上合理的方式移动,并且于是然后在测量模型中比较,所仿真的轴向位置是否与测量到的轴向位置一致。在这种方法中排除了,对象可以在任何地方,而是对象总是被保证处于物理上合理的状态中。不存在悬停的对象,不存在穿透另一对象、例如桌面或被机器人穿透的对象。也就是说,测量模型是需要的,因为如同从方法上被考虑的测量模型在物理上是不合理的,因为知道机器人处于哪里。精确到小数点后许多位地知道机器人处于哪里。也就是说,那儿将存在偏差的假设实际上在物理上是不合理的。但是,其解决一大堆其他问题,如果遵循其他方法,则那儿围绕此出现或可能出现所述其他问题。
现在如上面所解释和所描述的那样存在运动模型和系统模型。如果现在通过在物理仿真器中仿真运动模型来组合这两个模型,则将获得确定性系统。该确定性系统简单地由一个积分器加上一个控制器组成,这是确定性的。由于各种原因有帮助的是,进行概率状态估计,使得要考虑的系统是非确定性的,实际上想要该系统有噪声。
根据本发明的该实施例,力被简单地人工地且纯粹地随机地施加到对象上,所述力然后这样稍微推动对象通过该区域。但是,可以在通过系统模型描述的系统中的十分多的不同位置处安置“噪声”。这样例如在系统模型中进行任何噪声输入。重要的是,最后系统是非确定性的,在哪里以及如何产生“噪声”实际上并不重要。仅仅重要的是具有有噪声的系统。
运动模型中的正向动力学在Wirnshofer等人中在插图(图3)中从块“正向动力学”中得出,其方式是:在第三章A)中调整方程(1),并且然后根据加速度求解。这里描述为“
Figure DEST_PATH_IMAGE009
”的加速度是机器人和对象的加速度,并它们取决于转矩,或者广义上在一定程度上取决于在系统处安置的力τ[参看在Wirnshofer等人中的方程(1)]。
这些广义力由在机器人处施加的分力组成,例如在旋转轴的情况下是转矩以及在对象处起作用的其他分力。由于对象被假设为未被驱动,所有如果在物理上可信地考虑到这一点,则在对象处起作用的分力等于零。在那里不存在力,因为重力已经在方程(1)的左侧明确地调制。否则没有力作用在对象上。但是,如果现在在对象处安置力、例如随机力τ 0,那么这里产生有噪声的模型。这正是这样做的[参看在Wirnshofer等人中在插图(图3)中]。
经由对象处的力使运动模型有噪声的事实是在Wirnshofer等人中在(图3)中示出的系统模型或集成模型的一个重要特性。该系统本身是确定性的,并且必须针对滤波器估计使该系统有噪声,并且这经由对象处的力进行的事实具有非常好的特性:虽然系统然后人工地有噪声,但是这样仅产生在物理上合理的状态。如果在对象处添加附加的力,那么这样被施加的对象尽管并非本身被推动穿过任何其他对象、诸如桌面等。如果对象被向左拉,则对象在桌面上向左滑动,如果对象被向下拉,那么对象仍然保持躺在桌面上,并且如果对象被向上拉一点,那么重力将很可能仍然足以让对象保持躺在桌面上。也就是说,通过附加的力,虽然可以使状态有噪声,但是仅如典型地在过程中的不准确性也看上去的那样使状态有噪声,即对象不振荡,对象也不一下子跳到另一侧,而是它可能在平面中稍微移动,但是这于是也将是这样(aber das war es dann auch)。这一切通过以下方式发生:物体上的广义力变得有噪声。这是非常通用的,并且在滤波器估计中具有非常好的数值特性。
该模型基于机器人和对象的共同动力学,但机器人和对象具有单独的状态,也可以单独地使机器人和对象有噪声,如果想要这样的话。
在模型组合的情况下获得反映系统的动力学、运动模型的概率分布,并且存在反映测量模型、即轴向位置的测量的概率分布。
基于这两个概率分布,现在实施贝叶斯滤波器中的贝叶斯滤波器算法,该贝叶斯滤波器算法估计关于对象位置的概率分布以及关于机器人位置的概率分布,其中与对象位置不同,机器人位置并不是这样真正令人感兴趣的。
贝叶斯滤波器以其纯粹形式具有如下特性:其不能在计算机或计算器上实施,因为在那里估计连续的概率分布。也就是说,需要合适的近似,即近似滤波器,或者更准确地说,近似算法。
在对此的可能的选项中,现在优选地使用粒子滤波器表示[4]。在此,概率分布或者通过假设或通过来自概率分布的样本来反映,并且逐步地更新(updated)在此分别获得的粒子的集合或云。
粒子滤波器算法是一种相当简单的算法,该算法动用两个组件。这在Wirnshofer等人中在第四章中描述。
近似算法和优选地粒子滤波器算法必须能够从运动模型中采样,并且其必须能够评估测量模型。一旦这两个组件准备好了,就具有通用状态估计器,这也总是针对系统正好被考虑。
利用通过贝叶斯滤波器算法的滤波器估计和通过粒子滤波器算法的近似,应逐步地(通过迭代)分别反映概率分布,以便能够估计该系统正好处于哪里。
如果运动模型为此没有足够噪声,则出现被称为“粒子耗尽(particledepletion)”的效应,根据该效应,所有粒子都在同一点处结束,并且因此滤波器估计崩溃。
通常针对所有近似滤波器可以观察到的这种效应尤其在利用粒子滤波器近似期间出现。从滤波器的角度来看:滤波器百分百确定系统现在处于确定状态中,但该系统并不在那里,并且滤波器不再离开这种困境。滤波器于是将总是停留在这一点。因此,滤波器恰好需要这种噪声,以便各个分布再次扩散并且可以再次找出系统的可能状态的空间。
利用贝叶斯滤波器和粒子近似,当前具有系统正好处于哪个状态中的概率分布。这被称为关于当前状态的“可信度”,所述“可信度”用“xt”表示 (关于再次用“t”作为索引的时间点)。当前概率分布是“xt”的“可信度”,并所述“可信度”描述系统当前正好处于哪里。有两个知道的变量。知道当前控制输入,已给系统施加该当前控制输入,这是已经提及的“ut”,然后那儿是已经由系统得到的并用“zt”表示的当前测量。
此外,一方面具有运动模型,并且另一方面具有测量模型。
运动模型说明在当前状态“xt”中给定哪个概率:实际上知道之前在哪里,即在状态“xt-1”中和控制输入。运动模型提供陈述:如果曾在那里并且接受控制输入,那么该系统在概率质量的任何地方从那儿向那里扩散。
测量模型提供陈述,假设曾在那儿,将以哪个概率得到哪个测量。
如果例如假设:轴曾处于具有100°的角测度的轴向位置上,则例如关于已经提及的关于轴向位置的高斯分布的测量,得到轴向位置,该轴向位置以该100°角测度为中心。
贝叶斯滤波器根据非常简单的方案起作用。首先,利用测量模型,以便能够预测概率分布如何发展,并且于是然后能够再次使用测量模型修正估计。
假设具有来自最后的迭代步骤的“可信度”,该“可信度”是“可信度”“xt-1”,并且具有测量模型。那儿现在提出如下问题:究竟之后在哪里,并且之后处于另一状态的概率是从另一状态去那里的概率乘以之前处于该另一状态的概率。针对整个状态空间进行相应的积分。
换言之:处于任何地方,然后先前曾在别的地方并且但是去了那里。
这反映在Wirnshofer等人中在第三章C)的方程(4)和(5)中。
利用测量和在已得到该点(状态)的测量之后处于任何地方的概率,将实际上也在那里的概率乘以从那里来看得到该测量的概率并且整体于是还通过归一化常数η归一化,因为然后必须将该概率分布积分为 1,因此更新(upgedatet)“可信度”。这已经是贝叶斯滤波器算法或贝叶斯滤波器所基于的完整原理。
结论:可能曾在任何地方,并且可能去任何地方,这是状态转移概率,该状态转移概率由运动更新(运动模型的更新)得出并且然后还进行测量更新(测量模型的更新),现在可能在任何地方,但是然后也必须已对这进行了测量,这已被测量,并且然后知道正好在某个地方的可能性有多大,这是测量的概率。
贝叶斯滤波器算法或贝叶斯滤波器当然不是如何估计状态或确定概率分布的唯一方法,但是其对于当前的大的复杂的估计问题而言可能是唯一的有意义的方法,并且其原则上构成接近这个问题的出发点。为了对付这个大的复杂的估计问题,这已经在多维状态空间的情况下在低的两位数范围内由于在正常的计算机和计算器中可用的计算能力而失败,如优选地通过粒子滤波器算法或粒子滤波器的合适的近似总归是必要的,如已经提及的。
关于可能的其他选项,涉及到关于贝叶斯滤波器算法的近似而存在所述选项。贝叶斯滤波器算法是最通用的算法,该算法因此典型地在上面所描述的大的复杂的估计问题的背景下不能利用传统计算机/计算器实施。
从所述贝叶斯滤波器算法出发,于是存在各种近似。上面提到了例如粒子滤波器,其中概率分布通过样本来近似。
然而,如果关于所获得的概率分布做出一些假设,例如这些概率分布都是高斯分布的并且系统动力学是线性的,那么获得卡尔曼滤波器。
如果使状态空间离散化并假设离散系统,那么获得直方图滤波器等。因此存在这里对此进行近似的各种变型方案并且也存在混合形式。因此例如存在粒子滤波器和卡尔曼滤波器之间的混合形式。
针对当前的大的复杂的估计问题,也许也还可以设想,卡尔曼滤波器和粒子滤波器的组合也还将运行,并且可能还有扩展的卡尔曼滤波器。然而直方图滤波器实际上并不真的产生意义。尽管存在各种近似,但是粒子滤波器是具有最少假设和最少限制、但是也具有最高计算耗费的近似。并且必须将粒子滤波器迭代地应用于测量和动作,以便于是获得状态估计或更准确地说获得对象究竟正好可能处于哪里、即对象被定位的概率分布。
为了在获得概率分布之后最终从该分布中得到对象的估计的状态和/或对象的被定位的地点,现在可以做各种事情。可以简单地例如形成概率分布的平均值并将该值用于状态估计。替代地也可以形成概率分布的众数(Modus)。
因此,这通常是所有基于贝叶斯滤波器算法的估计方法的问题。如果最终想要实际上具有具体的假设,则必须考虑以已获得的概率分布做什么。获得关于对象位置的概率分布,而不是恰好获得对象位置,因为如果系统地正确地考虑该对象,则将从不知道对象在哪里。
根据该概率分布于是可以考虑:具体的假设可能看起来如何,所述假设于是被使用,或者也总是以所获得的概率分布做什么。
现在假设是什么呢
Figure 349464DEST_PATH_IMAGE004
为此,基于在Wirnshofer等人中在第四章中的阐述,更详细地考虑在那里包含的(图 4)和(图 5)。这样,在Wirnshofer等人中的(图4)利用所示出的步骤I...IV示出当贝叶斯滤波器算法被迭代地应用并且与粒子滤波器算法一起被迭代地应用于近似时的时间序列。在那里用橙色示出的“小盒子”是关于对象(如例如在Wirnshofer等人中在(图1)和(图6)中所示出的)究竟正好可能处于环境(如例如在Wirnshofer等人中在(图6)中以具有灰色盒子的灰色桌面的形式示出的)中的哪里的假设。
在(图 4)中,在环境(其在(图4)中以灰色绘制)中示出具有作为对象的立方体的机器人(绿色)。初始已知,也仅非常粗略地已知,立方体或对象处于哪里。在(图4中在步骤I中)和在(图5中在左侧图中)中,分别采样假设或“小盒子”、即粒子的这种云,所述粒子并非全部在物理上是合理的。“小盒子”中的有些位于桌面和盒子上,另一些悬停在空中,两者都不一定必须在物理上是合理的。最初它们可能完全不合理。
这是初始状态、初始分布或关于系统的任意起始状态的初始“可信度”。必须以初始分布开始。必须具有系统最初可能看起来如何的一些构思。
总是基于状态分布。在(图4)中在步骤I...IV中看到的不是具有用于近似的粒子滤波器算法的贝叶斯滤波器算法的四个步骤,而是优选地通常以200赫兹在循环中评估具有粒子滤波器的贝叶斯滤波器。这将持续几秒钟,并在该时间中已应用滤波器数百次以达到此结果。
初始状态不必总是看起来像其现在在Wirnshofer等人中在(图4)的步骤I中这里看起来的那样。这只是初始状态可能看起来如何的一个示例。替代地,想要实施如在Wirnshofer等人中那样的配置布置的人(例如用户)可以表明,机器人处于桌面上的任何地方,并且在这一点现在可以产生大约 1000个假设的云,并且从那时起滤波器然后接管并进行更新。但是,必须以某种方式指定初始状态。该初始状态必须在那儿。
更准确地说:不是初始状态,而是关于状态的初始分布必须存在。
关于状态的初始分布可以由任何人如其想要的那样简单地指定。为此根本还不需要滤波器。因此,在Wirnshofer等人中在(图4)的步骤I中选择的初始分布在物理上并不合理,对象并不简单地在空中,这没有任何意义,但是可以指定完全不合理的状态,并且只要其大致在可能的范围内,整体于是就摆动到物理上合理的假设。
必须以某事开始。以初始分布开始,并且应用滤波器的结果又是一个分布。也就是说,之后配置布置进一步根据其自己的结果工作。
如果现在第一次应用具有用于近似的粒子滤波器算法的贝叶斯滤波器算法,那么在物理仿真使所有“小盒子”再次跌倒时,发生在(图5中在右侧图中)所示出的。“小盒子”以某种方式降落在桌面上或盒子上,更确切地说以物理上合理的任何定向。因此,与(图 5左侧图)相比,没有“小盒子”并且也没有立方体保持在边缘上,而是盒子/立方体落在一侧上。在(图5中在右侧图中)也还十分好地看到的是以下:只还存在少量准离散的Z位置,对象可以处于所述Z位置中,因为对象保持躺在一侧,并且相同的内容也针对所述定向得出。该图示在这方面不太透明,但是获得立方体的角侧(Eckseiten)之一。
发生了什么
Figure 535726DEST_PATH_IMAGE008
该系统在首次应用具有粒子滤波器算法的贝叶斯滤波器算法期间已基于物理仿真来稳定。这样如例如在(图4中在步骤I中)所示出的。
现在根据(图4在步骤II中),在根据本发明的技术教导的实施期间,利用机器人基于(由在Wirnshofer等人中在插图(图3)中的“qd r”给定的)额定位置首先沿着额定轨迹(在(图4中在步骤II中)的紫色轨迹)移动,并且机器人当然跟随该轨迹并且在此,如果机器人碰到对象,则机器人将对象向下扔或推到一边,并且如果机器人没有碰到对象,则对象保持原位。
对于实施来说,已知:存在大量“小盒子”或假设,根据在Wirnshofer等人中执行的实施方案,例如大约1000个,该系统正好可能处于那里。在这些假设或“小盒子”中的每个假设或“小盒子”中,机器人尝试跟随该轨迹的物理仿真器并如上所述做出反应。也就是说,这些“小盒子”中的每个小盒子都位于其自己的物理仿真器中,该物理仿真器有噪声,并相应地对机器人在那儿做什么做出反应。
在第三步骤中,(图4在步骤III中),利用机器人再次基于(通过在Wirnshofer等人中在插图(图3)中的“qd r”给定的)额定位置沿着额定轨迹(在(图4中在步骤III中)的紫色轨迹)在桌面上的边缘的方向上移动并且机器人当然再次跟随该轨迹。因此,利用机器人朝所述边缘移动。现在可能发生两件事。如果物理仿真器中的对象仍然位于盒子的上面,机器人将朝边缘移动,但是如果对象已经位于桌面的下面--如所示的,则机器人朝对象移动并且停留在对象上。在这一点是测量模型这样正确地起作用的第一次,因为这里存在在关于机器人正好可能处于哪里的各种假设或“小盒子”之间的大的实际偏差,并且与此相应地测量模型提供关于正好当前得到的测量的概率多大的不同的概率值。并且,机器人实际上停留在这里。也就是说,基于比较,仅还有关于机器人也停留在哪里的假设或“小盒子”剩余。这是关于对象在底板上保持躺在哪里的这种假设或“小盒子”。根据(图4在步骤IV中),显然只有一个假设或一个“小盒子”“幸存”,而所有其他仍然位于盒子上面的假设或“小盒子”消失,因为所述假设或“小盒子”基于测量模型在物理上是不合理的。
在第四(最后的)步骤中,(图4在步骤IV中),利用机器人又基于(通过在Wirnshofer等人中在插图(图3)中的“qd r”给定的)额定位置沿着额定轨迹(在(图4中在步骤IV中)的紫色轨迹)朝着桌面上的盒子的方向移动,并且机器人自然重新跟随该轨迹。这里,关于对象正好可以处于哪里的假设在一定程度上已过渡,更确切而言在一定程度上过渡到减去对称性的最后的假设。这样,无法区分对象现在是否旋转了180°。在应用根据本发明的教导的情况下没有查明这一点,但是至少已经很好地估计位置并且旋转已经被限制为少量的可能性。以此方式和方法,本发明的技术教导的实施也将在现实中起作用。
在该实施中考虑的额定位置是外部给定的,即从外部预给定,所述额定位置总是相同地发展,并且对于所有粒子、假设、“小盒子”而言总是相同的。这是从外部预给定的。这是施加给集成模型或系统模型的动作[参看Wirnshofer等人(图 3)]。这种集成模型或系统模型是运动模型的一部分,并且运动模型变为Wirnshofer等人中的方程(4)的一部分,即贝叶斯滤波器算法或贝叶斯滤波器的预测。这在Wirnshofer等人中在(图 4)的步骤II中可以相当好地看到。在那儿机器人在仿真中移动并且对象和机器人如运动模型所预测的那样移动。如果机器人在任何地方朝对象移动,则对象从盒子上掉到桌面上或机器人将对象推到一边,如果机器人没有朝对象移动,则对象保持在原地。在任何情况下,机器人都遵循额定变量或机器人至少尝试遵循额定变量,更确切而言基于集成模型或系统模型中的控制器。
同样内容适用于Wirnshofer等人中的(图 4)的步骤III。这里,运动模型也再次发挥作用,也就是说,所有“小盒子”都压在桌面上的边缘,并且如果没有“小盒子”在那里(假设性地假设),则机器人本身将朝边缘移动并且这然后又在测量模型中被使用。这基于Wirnshofer等人中的方程(5)发生,在那里将实际轴向位置的测量与所仿真的轴向位置的测量进行比较。并且基于该测量比较,十分多的假设或“小盒子”于是消失,因为它们在物理上不再合理。
为什么机器人和对象之间的接触是必要的
Figure 117886DEST_PATH_IMAGE008
如果假设机器人将简单地停止并且从不与对象接触,那么贝叶斯滤波器算法的所实施的粒子滤波器近似仍然会将可能的对象位置的集合减少到物理上合理的假设。然后所述对象位置被大大分散,然后对象在整个桌面上展开,但它总是在桌面上。这尽管还不是实际上想要的,因为对象位置还没有被定位,但是具有一大堆配置,在所述配置中肯定知道对象不在那里。并且,这首先是有帮助的,但还不是实际上想要具有的。因此,如果真想知道对象在哪里,那么然后也必须利用机器人触摸对象[参看在Wirnshofer等人中插图(图1、4和5)]。
所考虑的估计复合体的输入变量的重要性以及为什么
Figure 728996DEST_PATH_IMAGE008
基于上述的解释,存在一个系统,该系统的几何形状和动力学本质上已知。并且在估计中,希望状态空间不完全爆炸,在必须考虑过多维度的意义上。
如果在一定程度上只考虑对象的运动而忽略机器人的运动并且替代于此将运动简单地假设为给定的,因为在一定程度上可测量,则有如下问题,得到机器人与对象之间的物理上不合理的接触。于是必须考虑对象姿态的完整的六个自由度空间,其于是然后必须根据接触情况被再次拒绝。考虑用于利用贝叶斯滤波器(包括粒子滤波器近似在内)的估计的六个维度太多了。
也就是说,如果只依赖位置,则整体不起作用。替代方案是,将机器人动力学包括到整体中,并且然后利用转矩进行计算。由于转矩是系统的输入,因此系统物理上行动。这具有如下优点:对象的动力学惊人地在物理上变得合理,对象不再具有Z分量,在状态空间中向下下落,所述对象被机器人推动,于是由于摩擦力而再次停止。对象的状态空间最终折叠(kollabiert)到三种状态,即XY位置和绕Z轴的旋转。最终,在一定程度上是三个维度,系统折叠到所述三个维度。
缺点是,如果这样做,机器人的状态空间完全爆炸。这样,于是必须考虑机器人的位置和速度。在七轴机器人的情况下,于是具有附加地必须被考虑的14个自由度。并且这也是太多了。
为了对付所有这一切,进行以下操作。机器人尽管在位置级别上被命令,但控制器连接在其间,所述控制器从这些位置变量中产生转矩,更确切说基于由物理仿真器提供的所假设的机器人位置。并且因此出现如下情况,在所述情况中不仅机器人而且对象在物理上合理地移动,因为尽管使用物理仿真,但机器人不失控地漂移通过该区域,因为控制器在仿真中也相对于额定变量是稳定的。并且这导致得到两种方法、即基于位置和转矩的考虑的优点,而没有两种方法之一的缺点。
为了实施本发明的实施例,原则上需要五件事(点)。第一是机器人或操纵器和对象的模型。第二是物理仿真器。第三是稳定的控制器的实际实施。第四是初始分配。并且第五是应用于对象的噪声的模型。
根据Wirnshofer等人的文献,在第V章中,针对实施作为第一件事(第一点)假设一个模型,如在Wirnshofer等人中在(图5)和在(图6)中所示出的。这些图示都关联,这样绿色立方体(盒子)代表实际对象位置,该系统当然不知道所述实际对象位置,并且橙色立方体(盒子)是所有假设的对象位置。所有东西、如机器人、立方体、和当然环境、诸如桌面的几何形状、质量和动力学属于该模型。
作为第二件事(第二点),MuJoCo仿真器被用作物理仿真器。
作为第三件事(第三点),使用在Wirnshofer等人中在(图5)中在左侧图中使用的系统状态的初始分布。在所述初始分布中假设定向的任意均匀分布和围绕对象上的中心点的平移的高斯分布。这在(图 5)中在左侧看到。这是简单地高斯分布的位置和完全均匀分布的旋转。
作为第四件事(第四点),使用Kuka机器人作为稳定的控制器,其中本质上已经存在轴向水平上的阻抗控制器。
作为第五件事(第五点),针对噪声,动用在 Wirnshofer等人中在第四 章B)中描述的“Motion(运动)”。在此,假设随机安置在对象的重心处的正态分布力。
因此在本发明的实施例的范围中解释了用于概率状态估计或确定概率分布的方法。参考文献:
[1] D. J. Duff, J. Wyatt和R. Stolkin,"Motion estimation usingphysical simulation," in 2010 IEEE International Conference on Robotics andAutomation,2010年5月,第1511-1517页。
[2] K. Lowrey, J. Dao和E. Todorov,"Real-time state estimation withwhole-body multi contact dynamics:A modified ukf approach," in 2016 IEEE-RAS16th International Conference on Humanoid Robots,2016年11月,第1225-1232页。
[3] K. Nottensteiner,M. Sagardia,A. Stemmer和C. Borst,"Narrow passagesampling in the observation of robotic assembly tasks," in 2016 IEEEInternational Conference on Robotics and Automation (ICRA),2016年5月,第130-137页。
[4] https: //en. wikipedia. org/wiki/Particle_filter,2019年5月10日的版本。

Claims (12)

1.一种用于基于接触定位在通过机器人操纵时可移动的对象的方法,其中针对随着对象定位而出现的通过至少一个调节变量控制的机器人(ROB)的状态,对于所述机器人(ROB)在对象操纵期间可移动的对象(OBJ)和实现所述对象操纵的机器人-对象环境(ROU)作为系统组件形成的系统(SYS)和在系统状态估计的过程中借助贝叶斯滤波器算法(BFA)的迭代递归应用确定定位所述对象(OBJ)的概率分布,其中针对所述算法的迭代递归应用,
- 将在用于系统仿真的非确定性的运动模型(BWM)中从所述系统的状态的所建模的转移中获得的状态转移概率和
在用于系统仿真的测量模型(MSM)中从所述运动模型(BWM)中所建模的系统状态转移的所建模的合理性检查中获得的测量概率
用乘法关联,并且
在开始时使用初始概率分布,
其特征在于,
a)在所述概率分布的迭代递归确定中使用近似算法(APA),
b)将用于系统状态仿真的物理仿真器(PHS)和控制器(RGL)作为确定性仿真系统(SSY)包括到所述运动模型(BWM)中,所述物理仿真器完整地包括所述系统(SYS)关于力和动力学的物理以及由此得到的系统组件的物理关系,所述控制器在所反馈的仿真系统状态的情况下控制所述物理仿真器,所述控制器基于输送给所述控制器的调节变量(SGR)控制所述物理仿真器(PHS),使得在所述系统状态仿真中所述机器人(ROB)相对于所述机器人-对象环境(ROU)顺应地行动,
c)所述物理仿真器(PHS)通过施加随机力和/或动力学变得有噪声,使得由此不仅仿真系统(SSY)而且对于所述系统状态转移的建模,所述运动模型(BWM)变得不确定,
d)对于所述测量模型(MSM)中的合理性检查,在所述机器人(ROB)处进行轴特定的、尤其涉及轴向动力学的测量,并使用所述测量的测量结果(MSE)。
2.根据权利要求1所述的方法,其特征在于,在所述概率分布的迭代递归确定中,使用用于近似所述贝叶斯滤波器算法(BFA)的粒子滤波器算法(PFA)。
3.根据权利要求1或2所述的方法,其特征在于,所述调节变量(SGR)由额定位置、额定速度和/或额定加速度形成。
4.根据权利要求1至3中任一项所述的方法,其特征在于,阻抗控制(IPR)被用于所述控制器(RGL)的顺应控制。
5.根据权利要求1至4中任一项所述的方法,其特征在于,针对所述合理性检查测量所述机器人(ROB)的轴向位置、轴向速度、轴向加速度和/或轴向转矩。
6.一种用于基于接触定位在通过机器人操纵时可移动的对象的计算机程序产品(CPP),其具有:非易失性可读存储器(SP),在所述非易失性可读存储器中存储有执行所述对象定位的程序模块(PGM)的处理器可读的控制程序指令;和与所述存储器(SP)连接的处理器(PZ),所述处理器执行用于对象定位的程序模块(PGM)的控制程序指令并且在此,针对随着对象定位而出现的通过至少一个调节变量控制的机器人(ROB)的状态,针对所述机器人(ROB)在对象操纵期间可移动的对象(OBJ)和实现所述对象操纵的机器人-对象环境(ROU)作为系统组件形成的系统(SYS)和在系统状态估计的过程中借助在所述程序模块(PGM)中包含和实施的贝叶斯滤波器算法(BFA)的迭代递归应用确定定位所述对象(OBJ)的概率分布,其中针对所述算法的迭代递归应用,
- 将根据用于系统仿真的非确定性的运动模型(BWM)从系统的状态的所建模的转移中获得的状态转移概率和
根据用于系统仿真的测量模型(MSM)从根据所述运动模型(BHM)所建模的系统状态转移的所建模的合理性检查中获得的测量概率
用乘法关联,并且
在开始时使用初始概率分布,
其特征在于,
a)在所述程序模块(PGM)中包含和实施近似算法(APA),如果处理器(PZ)为此执行所述程序模块(PGM)的控制程序指令,则在所述概率分布的迭代递归确定中使用所述近似算法,
b)所述程序模块(PGM)为了对象定位被提供,使得
b1)将用于系统状态仿真的物理仿真器(PHS)和控制器(RGL)作为确定性仿真系统(SSY)包括到所述运动模型(BWM)中,所述物理仿真器完整地包括所述系统(SYS)关于力和动力学的物理以及由此得到的系统组件的物理关系,所述控制器在所反馈的仿真系统状态的情况下控制所述物理仿真器,所述控制器基于输送给所述控制器的调节变量(SGR)控制所述物理仿真器(PHS),使得在所述系统状态仿真中所述机器人(ROB)相对于所述机器人-对象环境(ROU)顺应地行动,
b2)所述物理仿真器(PHS)通过施加随机力和/或动力学变得有噪声,使得由此不仅仿真系统(SSY)而且对于所述系统状态转移的建模,所述运动模型(BWM)变得不确定,
c)所述处理器(PZ)构成用于执行所述程序模块(PGM)的控制程序指令,使得在所述机器人(ROB)处根据所述测量模型(MSM)进行的轴特定、尤其涉及轴向动力学的测量的测量结果(MSE)针对所述合理性检查在贝叶斯滤波器算法(BFA)的迭代递归应用中被考虑。
7.根据权利要求6所述的计算机程序产品(CPP),
其特征在于,
所述程序模块(PGM)为了对象定位被提供,使得在概率分布的迭代递归确定中使用用于近似所述贝叶斯滤波器算法(BFA)的粒子滤波器算法(PFA)。
8.根据权利要求6或7所述的计算机程序产品(CPP),
其特征在于,
所述调节变量(SGR)由额定位置、额定速度和/或额定加速度形成。
9.根据权利要求6至8中任一项所述的计算机程序产品(CPP),其特征在于,所述程序模块(PGM)为了对象定位被提供,使得阻抗控制(IPR)被用于所述控制器(RGL)的顺应控制。
10.根据权利要求6至9中任一项所述的计算机程序产品(CPP),其特征在于,用于合理性检查的测量结果(MSE)是来自机器人(ROB)的轴向位置、轴向速度、轴向加速度和/或轴向转矩的测量的结果。
11.一种机器人控制装置(RST),用于基于接触定位在通过机器人操纵时可移动的对象,其特征在于根据权利要求6至10中任一项所述的计算机程序产品(CPP),用于执行根据权利要求1至5中任一项所述的方法。
12.一种机器人(ROB),具有根据权利要求11所述的机器人控制装置(RST)。
CN202080036852.XA 2019-05-17 2020-05-11 用于基于接触定位在通过机器人操纵时可移动的对象的方法、计算机程序产品和机器人控制装置以及机器人 Active CN113966264B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19175195 2019-05-17
EP19175195.7 2019-05-17
EP19178454.5 2019-06-05
EP19178454.5A EP3738723A1 (de) 2019-05-17 2019-06-05 Verfahren, computer-programm-produkt und robotersteuerung zum kontaktbasierten lokalisieren von bei der manipulation durch roboter bewegbaren objekten sowie roboter
PCT/EP2020/063067 WO2020234027A2 (de) 2019-05-17 2020-05-11 Verfahren, computer-programm-produkt und robotersteuerung zum kontaktbasierten lokalisieren von bei der manipulation durch roboter bewegbaren objekten sowie roboter

Publications (2)

Publication Number Publication Date
CN113966264A true CN113966264A (zh) 2022-01-21
CN113966264B CN113966264B (zh) 2024-09-20

Family

ID=66625768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080036852.XA Active CN113966264B (zh) 2019-05-17 2020-05-11 用于基于接触定位在通过机器人操纵时可移动的对象的方法、计算机程序产品和机器人控制装置以及机器人

Country Status (4)

Country Link
US (1) US12076865B2 (zh)
EP (2) EP3738723A1 (zh)
CN (1) CN113966264B (zh)
WO (1) WO2020234027A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114619446B (zh) * 2022-03-11 2023-11-03 广东工业大学 基于双观测器的轨迹跟踪控制方法及系统

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073442A1 (en) * 2005-09-28 2007-03-29 Canadian Space Agency Robust impedance-matching of manipulators interacting with unknown environments
US20100306159A1 (en) * 2009-05-28 2010-12-02 Gm Global Technology Operations, Inc. Contact state estimation for multi-finger robot hands using particle filters
US20110129119A1 (en) * 2009-12-01 2011-06-02 Honda Research Institute Europe Gmbh Multi-object tracking with a knowledge-based, autonomous adaptation of the tracking modeling level
KR20120008211A (ko) * 2010-07-16 2012-01-30 성균관대학교산학협력단 로봇의 물체 인식 및 자세 추정 방법
CN102596085A (zh) * 2009-11-13 2012-07-18 直观外科手术操作公司 用于遥控操作的微创从手术器械的手控制的方法和系统
CN103926847A (zh) * 2014-05-04 2014-07-16 威海正棋机电技术有限公司 一种机器人仿真系统
US8831778B2 (en) * 2009-04-24 2014-09-09 Robert Bosch Gmbh Method of accurate mapping with mobile robots
US20150052092A1 (en) * 2013-08-16 2015-02-19 Transoft (Shanghai), Inc. Methods and systems of brain-like computing virtualization
CN104382595A (zh) * 2014-10-27 2015-03-04 燕山大学 基于肌电信号与虚拟现实交互技术的上肢康复系统及方法
US20150279031A1 (en) * 2014-04-01 2015-10-01 Case Western Reserve University Imaging control to facilitate tracking objects and/or perform real-time intervention
CN105143909A (zh) * 2012-06-26 2015-12-09 多伦多大学理事会 用于无线电地图的动态生成的系统、方法和计算机程序
US20160025615A1 (en) * 2014-07-22 2016-01-28 SynTouch, LLC Method and applications for measurement of object tactile properties based on how they likely feel to humans
WO2016014774A1 (en) * 2014-07-24 2016-01-28 Google Inc. Methods and systems for generating instructions for a robotic system to carry out a task
CN106325284A (zh) * 2016-11-04 2017-01-11 北京理工大学 面向人机协作搜索识别多目标任务的机器人运动规划方法
US20170161946A1 (en) * 2015-12-03 2017-06-08 Qualcomm Incorporated Stochastic map generation and bayesian update based on stereo vision
KR101784500B1 (ko) * 2016-06-14 2017-10-12 인하대학교 산학협력단 확률론적 환경에서 이동로봇의 장애물 회피를 위한 거리 결정 방법
CN107671857A (zh) * 2017-10-11 2018-02-09 上海交通大学 用于服务机器人操作演示与算法验证的三维仿真平台
CN108153153A (zh) * 2017-12-19 2018-06-12 哈尔滨工程大学 一种学习变阻抗控制系统及控制方法
US20180161986A1 (en) * 2016-12-12 2018-06-14 The Charles Stark Draper Laboratory, Inc. System and method for semantic simultaneous localization and mapping of static and dynamic objects
US20180311819A1 (en) * 2017-04-28 2018-11-01 Technion Research & Development Foundation Ltd. Data Association Aware Belief Space Planning And Perception
CN109492256A (zh) * 2018-10-15 2019-03-19 华南理工大学 一种动态系统状态概率映射矩阵多向搜索方法

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073442A1 (en) * 2005-09-28 2007-03-29 Canadian Space Agency Robust impedance-matching of manipulators interacting with unknown environments
US8831778B2 (en) * 2009-04-24 2014-09-09 Robert Bosch Gmbh Method of accurate mapping with mobile robots
US20100306159A1 (en) * 2009-05-28 2010-12-02 Gm Global Technology Operations, Inc. Contact state estimation for multi-finger robot hands using particle filters
CN102596085A (zh) * 2009-11-13 2012-07-18 直观外科手术操作公司 用于遥控操作的微创从手术器械的手控制的方法和系统
US20110129119A1 (en) * 2009-12-01 2011-06-02 Honda Research Institute Europe Gmbh Multi-object tracking with a knowledge-based, autonomous adaptation of the tracking modeling level
KR20120008211A (ko) * 2010-07-16 2012-01-30 성균관대학교산학협력단 로봇의 물체 인식 및 자세 추정 방법
CN105143909A (zh) * 2012-06-26 2015-12-09 多伦多大学理事会 用于无线电地图的动态生成的系统、方法和计算机程序
US20150052092A1 (en) * 2013-08-16 2015-02-19 Transoft (Shanghai), Inc. Methods and systems of brain-like computing virtualization
US20150279031A1 (en) * 2014-04-01 2015-10-01 Case Western Reserve University Imaging control to facilitate tracking objects and/or perform real-time intervention
CN103926847A (zh) * 2014-05-04 2014-07-16 威海正棋机电技术有限公司 一种机器人仿真系统
US20160025615A1 (en) * 2014-07-22 2016-01-28 SynTouch, LLC Method and applications for measurement of object tactile properties based on how they likely feel to humans
WO2016014774A1 (en) * 2014-07-24 2016-01-28 Google Inc. Methods and systems for generating instructions for a robotic system to carry out a task
CN104382595A (zh) * 2014-10-27 2015-03-04 燕山大学 基于肌电信号与虚拟现实交互技术的上肢康复系统及方法
US20170161946A1 (en) * 2015-12-03 2017-06-08 Qualcomm Incorporated Stochastic map generation and bayesian update based on stereo vision
KR101784500B1 (ko) * 2016-06-14 2017-10-12 인하대학교 산학협력단 확률론적 환경에서 이동로봇의 장애물 회피를 위한 거리 결정 방법
CN106325284A (zh) * 2016-11-04 2017-01-11 北京理工大学 面向人机协作搜索识别多目标任务的机器人运动规划方法
US20180161986A1 (en) * 2016-12-12 2018-06-14 The Charles Stark Draper Laboratory, Inc. System and method for semantic simultaneous localization and mapping of static and dynamic objects
US20180311819A1 (en) * 2017-04-28 2018-11-01 Technion Research & Development Foundation Ltd. Data Association Aware Belief Space Planning And Perception
CN107671857A (zh) * 2017-10-11 2018-02-09 上海交通大学 用于服务机器人操作演示与算法验证的三维仿真平台
CN108153153A (zh) * 2017-12-19 2018-06-12 哈尔滨工程大学 一种学习变阻抗控制系统及控制方法
CN109492256A (zh) * 2018-10-15 2019-03-19 华南理工大学 一种动态系统状态概率映射矩阵多向搜索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
F.WIRNSHOFER等: "State Estimation in Contact-Rich Manipulation", IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION(ICRA), pages 3790 - 3796 *

Also Published As

Publication number Publication date
CN113966264B (zh) 2024-09-20
US20220226991A1 (en) 2022-07-21
EP3946837A2 (de) 2022-02-09
WO2020234027A9 (de) 2021-01-28
EP3738723A1 (de) 2020-11-18
WO2020234027A2 (de) 2020-11-26
US12076865B2 (en) 2024-09-03

Similar Documents

Publication Publication Date Title
EP3924884B1 (en) System and method for robust optimization for trajectory-centric model-based reinforcement learning
Hsiao et al. Grasping pomdps
Diankov Automated construction of robotic manipulation programs
CN114450131B (zh) 机器人系统的无导数模型学习系统及设计
JP2022176917A (ja) ロボットデバイスを制御するための方法
Hudson et al. Model-based autonomous system for performing dexterous, human-level manipulation tasks
Álvarez et al. Tactile-based in-hand object pose estimation
Wirnshofer et al. State estimation in contact-rich manipulation
CN113966264A (zh) 用于基于接触定位在通过机器人操纵时可移动的对象的方法、计算机程序产品和机器人控制装置以及机器人
Singh et al. Mc-Mujoco: simulating articulated robots with FSM controllers in MuJoCo
Andre et al. Reliable robot assembly using haptic rendering models in combination with particle filters
Amadio et al. Learning control from raw position measurements
Pankert et al. Learning Contact-Based State Estimation for Assembly Tasks
Morales et al. Sensors and methods for the evaluation of grasping
Jorge et al. Efficient learning of inverse dynamics models for adaptive computed torque control
Bratt et al. Minimum jerk based prediction of user actions for a ball catching task
Conradt et al. On-line learning for humanoid robot systems
Peters et al. Using reward-weighted regression for reinforcement learning of task space control
Perumal et al. Physical interaction and control of robotic systems using hardware-in-the-loop simulation
Zhang Physics-empowered perception for robot grasping and dexterous manipulation
Fält et al. System identification for hybrid systems using neural networks
Daniali et al. Fast Nonlinear Model Predictive Control of Quadrotors: Design and Experiments
CN118605135B (zh) 一种用于螺母上料套件的机器人位姿控制方法
Vladareanu et al. Robot control intelligent interfaces using the DSmT and the neutrosophic logic
Hovland et al. Hidden Markov models as a process monitor in robotic assembly

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant