Nothing Special   »   [go: up one dir, main page]

CN112116653A - 一种多张rgb图片的物体姿态估计方法 - Google Patents

一种多张rgb图片的物体姿态估计方法 Download PDF

Info

Publication number
CN112116653A
CN112116653A CN202011316344.5A CN202011316344A CN112116653A CN 112116653 A CN112116653 A CN 112116653A CN 202011316344 A CN202011316344 A CN 202011316344A CN 112116653 A CN112116653 A CN 112116653A
Authority
CN
China
Prior art keywords
rgb
dimensional
objects
pictures
rgb pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011316344.5A
Other languages
English (en)
Other versions
CN112116653B (zh
Inventor
张键驰
贾奎
郭清达
陈轲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cross Dimension Shenzhen Intelligent Digital Technology Co ltd
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202011316344.5A priority Critical patent/CN112116653B/zh
Publication of CN112116653A publication Critical patent/CN112116653A/zh
Application granted granted Critical
Publication of CN112116653B publication Critical patent/CN112116653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

本发明属于三维计算机视觉技术,为多张RGB图片的物体姿态估计方法,包括步骤:对每张RGB图片分别进行目标检测,得到目标物体的二维边界框;对检测结果进行插值和滤波处理,去除误检的二维边界框,增加漏检的二维边界框;将所有目标物体分别输入基于单目RGB图片的物体姿态估计网络,估计出每张RGB图片中包含的物体类别、每个物体的三维坐标及朝向;计算每两张RGB图片中物体之间的对应关系、相机旋转矩阵;构建物体姿态图并对其进行优化;利用每个物体对应的三维坐标、朝向和三维模型从三维投影到二维,得到新的二维边界框。与现有方法相比,本发明更好地解决了遮挡问题,提高估计的准确率。

Description

一种多张RGB图片的物体姿态估计方法
技术领域
本发明属于三维计算机视觉技术领域,具体涉及一种多张RGB图片的物体姿态估计方法。
背景技术
智能制造业逐渐成为重点关注的领域。相比于传统制造行业,智能制造业中广泛地采用了人工智能技术,期望机器人能够学会感知、规划、决策,进而代替人类进行重复性的劳动。而这其中的关键技术之一就是物体姿态估计。物体姿态估计技术是从机器人导航、操纵到增强现实的几种实际应用的重要组成部分,具有十分重要的理论研究价值和应用价值。
随着深度学习技术和三维计算机视觉技术的发展,物体姿态估计技术在理论和应用上都有了较大的进展,例如模板匹配方法、边缘匹配方法和基于3D模型的匹配方法,但现有方法依然存在局限性。在堆叠或严重遮挡的情况下如何准确地进行物体姿态估计,仍然是个有待解决的问题;而利用多张RGB图片从多个视角对目标物体的姿态进行估计,是一种解决该问题的技术方案。
发明内容
针对现有方法在堆叠或严重遮挡情况下难以准确估计物体姿态的技术问题,本发明利用在多个不同视角下的多张RGB图片之间的联系,提出一种多张RGB图片的物体姿态估计方法,提高了物体姿态估计技术在堆叠和严重遮挡情况下的准确率。
本发明提出的技术方案如下:一种多张RGB图片的物体姿态估计方法,包括以下步骤:
S1、选取来自同一视频帧的多张RGB图片,对每张RGB图片分别进行目标检测,得到每张RGB图片中包含的目标物体的二维边界框,作为每张RGB图片的目标检测结果;
S2、对每张RGB图片的目标检测结果,进行插值和滤波处理,去除误检的二维边界框,增加漏检的二维边界框;
S3、将每张RGB图片中的所有目标物体分别输入基于单目RGB图片的物体姿态估计网络,估计出每张RGB图片中包含的物体类别、每个物体的三维坐标及每个物体的三维朝向;
S4、根据步骤S3的估计结果计算每两张RGB图片中物体之间的对应关系以及每两张RGB图片之间的相机旋转矩阵;
S5、利用多张RGB图片中物体之间的对应关系、相机旋转矩阵,以及每个物体的三维坐标和三维朝向,构建物体姿态图并对其进行优化;
S6、在得到每张RGB图片中所有物体的位姿后,利用每个物体对应的三维坐标、三维朝向和三维模型,从三维投影到二维,得到新的二维边界框;
S7、用每张RGB图片的新的二维边界框代替步骤S1中获取的二维边界框,重复步骤S2-S6,直到重复次数达到设定阈值。
与现有技术相比,本发明取得的有益效果包括:
本发明基于多张RGB图片的物体姿态估计方法,利用在多个不同视角下的多张RGB图片之间的联系,很好地解决了遮挡问题,提高了物体姿态估计技术在堆叠和严重遮挡情况下的准确率。
附图说明
图1为本发明实施例中多张RGB图片的物体姿态估计方法的流程图;
图2为随机采样一致性算法在计算两张RGB图片的相对相机旋转矩阵中的应用流程图;
图3为物体姿态图优化算法的优化效果示意图。
具体实施方式
以下结合实施例及附图1-3具体描述本发明的技术方案,但本发明的实施方式并不限于此。
实施例
如图1所示,本发明基于多张RGB图片和三维模型进行物体姿态估计的方法,其步骤包括:
S1、目标检测:选取来自同一视频帧的多张RGB图片,对每张RGB图片分别进行目标检测,得到每张RGB图片中包含的目标物体的二维边界框,作为每张RGB图片的目标检测结果。
具体来说,将每张RGB图片输入到目标检测算法中,可以是现有技术中任意的目标检测算法,本实施例采用的是faster RCNN目标检测方法;获得的目标检测结果,即目标物体的二维边界框采用[x,y,w,h]来表示,其中(x,y)表示物体中心点所在像素位置,w和h分别表示物体在RGB图片中的宽度和高度。
进一步的,可以利用已有的训练数据集或已有的目标检测网络,对上述目标检测算法进行迁移学习,从而提高目标检测的准确率。
S2、对每张RGB图片的目标检测结果,利用投票机制进行插值和滤波处理,去除误检的二维边界框,增加漏检的二维边界框。
根据场景内容一致性原理,所有RGB图片中包含的物体类别和数量应该是基本一致的;本步骤根据这一特性,对RGB图片的目标检测结果进行插值和滤波,去除误检的二维边界框,恢复漏检的二维边界框。
进一步的,本步骤对目标检测结果进行插值和滤波处理的策略为:若不少于半数的RGB图片的目标检测结果都含有某类物体时,可以认为所有RGB图片中都有该类物体,因此将在没有检测出该类物体的RGB图片的相应位置添加二维边界框,相应位置可以表示为[(x1+x2)/2,(y1+y2)/2, (w1+w2)/2, (h1+h2)/2];若不少于半数的RGB图片的目标检测结果中都没有检测出某类物体,就认为所有的RGB图片中都不含有该类物体,因此可以在已经检测出该类物体的RGB图形中的相应位置删除二维边界框。
S3、基于单目RGB图片的物体姿态估计:将每张RGB图片中的所有目标物体分别输入基于单目RGB图片的物体姿态估计网络,从而估计出每张RGB图片中包含的物体类别c、每个物体的三维坐标(x,y,z)及每个物体的三维朝向(qw,qx,qy,qz)。
其中,单目RGB图片的物体姿态估计网络可以是任意基于单张RGB图片的物体姿态估计方法,在本实施例中采用的是基于关键点回顾的方法,在典型的PVNet网络上进行改进而来,只利用PVNet网络的RGB通道而不需要用到深度图像,只以RGB图片为输入,包括12个卷积层和两个连接层。
S4、相机旋转矩阵估计:对任意两张RGB图片,利用随机采样一致性算法,根据步骤S3的估计结果计算每两张RGB图片中物体之间的对应关系以及每两张RGB图片之间的相机旋转矩阵,其流程如图2所示。
随机采样一致性算法采用的策略如下:对于任意两张RGB图片,根据步骤S3获得的物体位姿估计结果,随机从这两张RGB图片中各选取两个物体,假设各选取的两个物体是对应的,具有相同的物体类别c,从两张RGB图片中所分别选取的两个物体构成两对具有成对一致类别的物体;利用两对具有成对一致类别的物体计算这两张RGB图片之间的相对相机变换,并以相对相机变换下这两张RGB图片中所有物体的姿态偏差和的倒数作为置信度,并采用置信度最高的相对相机变换和物体对应关系作为最终这两张RGB图片之间的相机旋转矩阵以及这两张RGB图片之间的对应关系。
其中,由于从任意两张RGB图片中估计出来的物体姿态均存有偏差,即在三维坐标和三维朝向上均存在偏差,因而本发明分别进行三维坐标偏差求和、三维朝向偏差求和,然后将两个偏差求和后的数值叠加起来,得到最终的偏差和,取最终的偏差和的倒数作为置信度。在本发明中,“具有成对一致类别的物体”指的是:在相机的两个不同视角下拍出的同一物体图像构成的具有成对一致类别的物体。
具体来说,对于每两张RGB图片,本方法从两张RGB图片中选取两对具有成对一致类别的物体
Figure 520642DEST_PATH_IMAGE001
Figure 359153DEST_PATH_IMAGE002
,假设从一张图片中选择了类别为c1和c2的物体,从另一张也选择了类别为c1和c2的物体,类别为c1的一对物体构成具有成对一致性的物体,类别为c2的另一对物体也构成具有成对一致性的物体;采用其中一对具有成对一致类别的物体来建立相对变换矩阵
Figure 76574DEST_PATH_IMAGE003
,也称相机旋转矩阵或相机变换矩阵。为了解决物体对称性造成的位姿歧义问题,
Figure 664593DEST_PATH_IMAGE003
的计算方式如下:
Figure 151069DEST_PATH_IMAGE004
上述计算方式的等号右边为矩阵乘法运算;其中,S*为物体对阵性矩阵集合中使目标物体对齐得最好的对称变换矩阵,
Figure 770269DEST_PATH_IMAGE005
表示相机视角
Figure 958674DEST_PATH_IMAGE006
Figure 95257DEST_PATH_IMAGE007
表示相机视角
Figure 685507DEST_PATH_IMAGE006
下目标物体
Figure 350975DEST_PATH_IMAGE008
Figure 292255DEST_PATH_IMAGE009
表示相机视角
Figure 826005DEST_PATH_IMAGE006
下目标物体
Figure 287073DEST_PATH_IMAGE008
的姿态,
Figure 638289DEST_PATH_IMAGE010
表示相机视角
Figure 817597DEST_PATH_IMAGE011
Figure 14092DEST_PATH_IMAGE012
表示相机视角
Figure 595246DEST_PATH_IMAGE011
下目标物体
Figure 851784DEST_PATH_IMAGE013
Figure 377444DEST_PATH_IMAGE014
表示相机视角
Figure 393941DEST_PATH_IMAGE011
下目标物体
Figure 813290DEST_PATH_IMAGE013
的姿态,
Figure 522620DEST_PATH_IMAGE015
表示
Figure 388771DEST_PATH_IMAGE014
的矩阵求逆,并且假定
Figure 943380DEST_PATH_IMAGE007
Figure 92601DEST_PATH_IMAGE016
对应的是同一物体,即为一对具有成对一致类别的物体。
计算出
Figure 956521DEST_PATH_IMAGE003
后,本方法采用另一对具有成对一致类别的物体
Figure 332139DEST_PATH_IMAGE017
的相对变换矩阵进行验证:
Figure 674127DEST_PATH_IMAGE018
其中,
Figure 818801DEST_PATH_IMAGE019
表示相机视角
Figure 119201DEST_PATH_IMAGE006
下目标物体
Figure 841169DEST_PATH_IMAGE020
Figure 737581DEST_PATH_IMAGE021
表示相机视角
Figure 986029DEST_PATH_IMAGE006
下目标物体
Figure 208063DEST_PATH_IMAGE022
的姿态,
Figure 541961DEST_PATH_IMAGE023
表示相机视角
Figure 773222DEST_PATH_IMAGE011
下目标物体
Figure 876176DEST_PATH_IMAGE024
Figure 737953DEST_PATH_IMAGE025
表示相机视角
Figure 90306DEST_PATH_IMAGE011
下目标物体
Figure 328520DEST_PATH_IMAGE024
的姿态,
Figure 426926DEST_PATH_IMAGE026
表示
Figure 980311DEST_PATH_IMAGE025
的矩阵求逆;当
Figure 39533DEST_PATH_IMAGE027
的误差小于预设的范围时,即认为计算出来的相对变换矩阵
Figure 330706DEST_PATH_IMAGE003
是正确的。
S5、位姿图构建与优化:利用多张RGB图片中物体之间的对应关系、相机旋转矩阵,以及估计出来的每个物体的三维坐标和三维朝向,构建物体姿态图,并采用光束法平差对所构建的物体姿态图进行优化。
对于多张RGB图片来说,在相机的两个不同视角下拍出的同一物体图像,由于只有相机移动而物体没有移动,即RGB图片中同一物体的相对世界坐标系没有发生变化,则所述物体的三维坐标和三维朝向在消除相机旋转变换的影响后,应当具有不变性。在之前的步骤中,已知各个图片中的物体之间的对应关系,并且已删除了非相干的物体。因此可以通过对物体和相机进行相对旋转变换后做全局联合优化来恢复唯一且一致的场景模型。
具体的,本方法所构建的物体姿态图以每张RGB图片中估计出来的同一物体类别的三维坐标和三维朝向为顶点,以每两张RGB图片的相机旋转矩阵为边,以最小全局位姿一致性偏差为优化目标,采用光束法平差优化每两张RGB图片之间的相机旋转矩阵和每张RGB中每个物体的三维坐标和三维朝向。
如图3所示,采用光束法平差优化后,相机的拍摄视角变化时,物体位置和朝向不变,即物体的三维坐标和三维朝向不变。图3中,image 1、image 2、image 3分别代表相机的三个拍摄视角,用R表示三维旋转矩阵,t表示三维平移向量,R1和t1、R2和t2、R3和t3分别构成了相机的三个位置和朝向,每个拍摄视角上的中间矩形框表示物体被拍摄到的图片;物体的顶点X1在三幅图片中对应的点分别为p 1,1 p 1,2 、p 1,3
S6、二维边界框更新:在得到每张RGB图片中所有物体的位姿后,可以利用每个物体对应的三维坐标、三维朝向和三维模型,从三维投影到二维,得到新的紧致的二维边界框。三维模型可采用通用的。
S7、位姿估计迭代:用每张RGB图片的新的二维边界框代替步骤S1中获取的原先的二维边界框,重复步骤S2-S6,直到重复次数达到设定的一定阈值。
进一步的,本发明对迭代次数的阈值没有做严格限制,可以适用于任意的重复迭代次数,也可以使用于任意多于两张RGB图片。
本发明公开了一种多张RGB图片的物体姿态估计方法。该方法通过目标检测、二维边界框滤波和插值、基于单目RGB图片的物体姿态估计、相机旋转矩阵估计、位姿图构建与优化、二维边界框更新、位姿估计迭代等步骤,提高了位姿估计方法在堆叠或严重遮挡的情况的精准度和鲁棒性,有效地解决了现有方法存在的问题,可广泛应用于三维计算机视觉技术领域内。

Claims (10)

1.一种多张RGB图片的物体姿态估计方法,其特征在于,包括以下步骤:
S1、选取来自同一视频帧的多张RGB图片,对每张RGB图片分别进行目标检测,得到每张RGB图片中包含的目标物体的二维边界框,作为每张RGB图片的目标检测结果;
S2、对每张RGB图片的目标检测结果,进行插值和滤波处理,去除误检的二维边界框,增加漏检的二维边界框;
S3、将每张RGB图片中的所有目标物体分别输入基于单目RGB图片的物体姿态估计网络,估计出每张RGB图片中包含的物体类别、每个物体的三维坐标及每个物体的三维朝向;
S4、根据步骤S3的估计结果计算每两张RGB图片中物体之间的对应关系以及每两张RGB图片之间的相机旋转矩阵;
S5、利用多张RGB图片中物体之间的对应关系、相机旋转矩阵,以及每个物体的三维坐标和三维朝向,构建物体姿态图并对其进行优化;
S6、在得到每张RGB图片中所有物体的位姿后,利用每个物体对应的三维坐标、三维朝向和三维模型,从三维投影到二维,得到新的二维边界框;
S7、用每张RGB图片的新的二维边界框代替步骤S1中获取的二维边界框,重复步骤S2-S6,直到重复次数达到设定阈值。
2.根据权利要求1所述的物体姿态估计方法,其特征在于,步骤S2对目标检测结果进行插值和滤波处理的策略为:若不少于半数的RGB图片的目标检测结果都含有某类物体时,认为所有RGB图片中都有该类物体,在没有检测出该类物体的RGB图片的相应位置添加二维边界框;若不少于半数的RGB图片的目标检测结果中都没有检测出某类物体,认为所有的RGB图片中都不含有该类物体,在已经检测出该类物体的RGB图形中的相应位置删除二维边界框。
3.根据权利要求1所述的物体姿态估计方法,其特征在于,步骤S3中单目RGB图片的物体姿态估计网络为基于关键点回顾的方法,在PVNet网络上进行改进而来,只利用PVNet网络的RGB通道而不用到深度图像。
4.根据权利要求1所述的物体姿态估计方法,其特征在于,步骤S4利用随机采样一致性算法实现,其策略为:
对于任意两张RGB图片,根据步骤S3获得的物体位姿估计结果,随机从这两张RGB图片中选取两对具有成对一致类别的物体;利用两对具有成对一致类别的物体计算这两张RGB图片之间的相对相机变换,并以相对相机变换下这两张RGB图片中所有物体的姿态偏差和的倒数作为置信度,并采用置信度最高的相对相机变换和物体对应关系作为最终这两张RGB图片之间的相机旋转矩阵以及这两张RGB图片之间的对应关系。
5.根据权利要求4所述的物体姿态估计方法,其特征在于,步骤S4的随机采样一致性算法中,分别对从任意两张RGB图片中估计出来的物体姿态进行三维坐标偏差求和、三维朝向偏差求和,然后将两个偏差求和后的数值叠加起来,得到最终的偏差和,取最终的偏差和的倒数作为置信度。
6.根据权利要求4所述的物体姿态估计方法,其特征在于,步骤S4的随机采样一致性算法中,采用其中一对具有成对一致类别的物体来建立相机旋转矩阵,采用另一对具有成对一致类别的物体的相机旋转矩阵进行验证。
7.根据权利要求6所述的物体姿态估计方法,其特征在于,采用其中一对具有成对一致类别的物体来建立的相对变换矩阵
Figure 633823DEST_PATH_IMAGE001
为:
Figure 227616DEST_PATH_IMAGE002
上述计算方式的等号右边为矩阵乘法运算;其中,S*为物体对阵性矩阵集合中使目标物体对齐得最好的对称变换矩阵,
Figure 774135DEST_PATH_IMAGE003
表示相机视角
Figure 868999DEST_PATH_IMAGE004
Figure 551784DEST_PATH_IMAGE005
表示相机视角
Figure 441111DEST_PATH_IMAGE004
下目标物体
Figure 474926DEST_PATH_IMAGE006
Figure 373481DEST_PATH_IMAGE007
表示相机视角
Figure 35407DEST_PATH_IMAGE004
下目标物体
Figure 111947DEST_PATH_IMAGE006
的姿态,
Figure 616746DEST_PATH_IMAGE008
表示相机视角
Figure 804145DEST_PATH_IMAGE009
Figure 710790DEST_PATH_IMAGE010
表示相机视角
Figure 958232DEST_PATH_IMAGE009
下目标物体
Figure 950328DEST_PATH_IMAGE011
Figure 941417DEST_PATH_IMAGE012
表示相机视角
Figure 968148DEST_PATH_IMAGE009
下目标物体
Figure 245546DEST_PATH_IMAGE011
的姿态,
Figure 475670DEST_PATH_IMAGE005
Figure 920383DEST_PATH_IMAGE013
为一对具有成对一致类别的物体。
8.根据权利要求1所述的物体姿态估计方法,其特征在于,步骤S5采用光束法平差对所构建的物体姿态图进行优化。
9.根据权利要求1所述的物体姿态估计方法,其特征在于,步骤S5所构建的物体姿态图以每张RGB图片中估计出来的同一物体类别的三维坐标和三维朝向为顶点,以每两张RGB图片的相机旋转矩阵为边,以最小全局位姿一致性偏差为优化目标,优化每两张RGB图片之间的相机旋转矩阵和每张RGB中每个物体的三维坐标和三维朝向。
10.根据权利要求1所述的物体姿态估计方法,其特征在于,步骤S1采用faster RCNN目标检测方法。
CN202011316344.5A 2020-11-23 2020-11-23 一种多张rgb图片的物体姿态估计方法 Active CN112116653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011316344.5A CN112116653B (zh) 2020-11-23 2020-11-23 一种多张rgb图片的物体姿态估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011316344.5A CN112116653B (zh) 2020-11-23 2020-11-23 一种多张rgb图片的物体姿态估计方法

Publications (2)

Publication Number Publication Date
CN112116653A true CN112116653A (zh) 2020-12-22
CN112116653B CN112116653B (zh) 2021-03-30

Family

ID=73794490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011316344.5A Active CN112116653B (zh) 2020-11-23 2020-11-23 一种多张rgb图片的物体姿态估计方法

Country Status (1)

Country Link
CN (1) CN112116653B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023015409A1 (zh) * 2021-08-09 2023-02-16 百果园技术(新加坡)有限公司 物体姿态的检测方法、装置、计算机设备和存储介质
CN118134925A (zh) * 2024-05-07 2024-06-04 亿芯微半导体科技(深圳)有限公司 半导体芯片倒装方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180322623A1 (en) * 2017-05-08 2018-11-08 Aquifi, Inc. Systems and methods for inspection and defect detection using 3-d scanning
CN108830150A (zh) * 2018-05-07 2018-11-16 山东师范大学 一种基于三维人体姿态估计方法及装置
CN110020611A (zh) * 2019-03-17 2019-07-16 浙江大学 一种基于三维假设空间聚类的多人动作捕捉方法
CN110119148A (zh) * 2019-05-14 2019-08-13 深圳大学 一种六自由度姿态估计方法、装置及计算机可读存储介质
CN110533721A (zh) * 2019-08-27 2019-12-03 杭州师范大学 一种基于增强自编码器的室内目标物体6d姿态估计方法
CN111340867A (zh) * 2020-02-26 2020-06-26 清华大学 图像帧的深度估计方法、装置、电子设备及存储介质
CN111932678A (zh) * 2020-08-13 2020-11-13 北京未澜科技有限公司 多视点实时人体运动、手势、表情、纹理重建系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180322623A1 (en) * 2017-05-08 2018-11-08 Aquifi, Inc. Systems and methods for inspection and defect detection using 3-d scanning
CN108830150A (zh) * 2018-05-07 2018-11-16 山东师范大学 一种基于三维人体姿态估计方法及装置
CN110020611A (zh) * 2019-03-17 2019-07-16 浙江大学 一种基于三维假设空间聚类的多人动作捕捉方法
CN110119148A (zh) * 2019-05-14 2019-08-13 深圳大学 一种六自由度姿态估计方法、装置及计算机可读存储介质
CN110533721A (zh) * 2019-08-27 2019-12-03 杭州师范大学 一种基于增强自编码器的室内目标物体6d姿态估计方法
CN111340867A (zh) * 2020-02-26 2020-06-26 清华大学 图像帧的深度估计方法、装置、电子设备及存储介质
CN111932678A (zh) * 2020-08-13 2020-11-13 北京未澜科技有限公司 多视点实时人体运动、手势、表情、纹理重建系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUNYI PAN ET AL: ""Deep Mesh Reconstruction from Single RGB Images via Topology Modification Networks"", 《2019 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)》 *
郭清达等: ""应用摄像机位姿估计的点云初始配准"", 《光学精密工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023015409A1 (zh) * 2021-08-09 2023-02-16 百果园技术(新加坡)有限公司 物体姿态的检测方法、装置、计算机设备和存储介质
CN118134925A (zh) * 2024-05-07 2024-06-04 亿芯微半导体科技(深圳)有限公司 半导体芯片倒装方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112116653B (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN108509848B (zh) 三维物体的实时检测方法及系统
CN109461180B (zh) 一种基于深度学习的三维场景重建方法
Melekhov et al. Dgc-net: Dense geometric correspondence network
CN104376552B (zh) 一种3d模型与二维图像的虚实配准方法
KR102206108B1 (ko) 체적형 객체 촬영을 위한 다중 rgb-d 카메라 기반의 포인트 클라우드 정합 방법
CN110853075A (zh) 一种基于稠密点云与合成视图的视觉跟踪定位方法
CN109887030A (zh) 基于cad稀疏模板的无纹理金属零件图像位姿检测方法
CN112015275A (zh) 基于数字孪生ar交互方法和系统
CN111489394B (zh) 物体姿态估计模型训练方法、系统、装置及介质
CN110853151A (zh) 一种基于视频的三维立体点集恢复方法
CN111998862B (zh) 一种基于bnn的稠密双目slam方法
CN107767339B (zh) 一种双目立体图像拼接方法
CN109325995B (zh) 基于人手参数模型的低分辨率多视角手部重建方法
da Silveira et al. Dense 3d scene reconstruction from multiple spherical images for 3-dof+ vr applications
CN109544621A (zh) 基于卷积神经网络的光场深度估计方法、系统及介质
CN112116653B (zh) 一种多张rgb图片的物体姿态估计方法
Feng et al. Deep depth estimation on 360 images with a double quaternion loss
CN116681839B (zh) 一种基于改进NeRF的实景三维目标重建与单体化方法
CN106595602B (zh) 基于同名直线特征的相对定向方法
Wang et al. Perspective 3-D Euclidean reconstruction with varying camera parameters
CN117315138A (zh) 基于多目视觉的三维重建方法及系统
CN116797640A (zh) 一种面向智能伴行巡视器的深度及3d关键点估计方法
KR102375135B1 (ko) 구형 물체를 이용한 다시점 카메라 위치 보정 장치 및 방법
CN114608558A (zh) 基于特征匹配网络的slam方法、系统、设备及存储介质
Yang et al. Structure from Motion on XSlit Cameras

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240221

Address after: 510641 Industrial Building, Wushan South China University of Technology, Tianhe District, Guangzhou City, Guangdong Province

Patentee after: Guangzhou South China University of Technology Asset Management Co.,Ltd.

Country or region after: China

Address before: 510640 No. five, 381 mountain road, Guangzhou, Guangdong, Tianhe District

Patentee before: SOUTH CHINA University OF TECHNOLOGY

Country or region before: China

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240410

Address after: 518057, Building 4, 512, Software Industry Base, No. 19, 17, and 18 Haitian Road, Binhai Community, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Cross dimension (Shenzhen) Intelligent Digital Technology Co.,Ltd.

Country or region after: China

Address before: 510641 Industrial Building, Wushan South China University of Technology, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: Guangzhou South China University of Technology Asset Management Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right