CN108596193B - 一种搭建针对人耳识别的深度学习网络结构的方法及系统 - Google Patents
一种搭建针对人耳识别的深度学习网络结构的方法及系统 Download PDFInfo
- Publication number
- CN108596193B CN108596193B CN201810392301.1A CN201810392301A CN108596193B CN 108596193 B CN108596193 B CN 108596193B CN 201810392301 A CN201810392301 A CN 201810392301A CN 108596193 B CN108596193 B CN 108596193B
- Authority
- CN
- China
- Prior art keywords
- human ear
- human
- points
- heat map
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 12
- 210000005069 ears Anatomy 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种搭建针对人耳识别的深度学习网络结构的方法及系统,方法包括:对现有的人耳图像数据集进行扩充,针对扩充后的数据集计算以热图形式呈现的人耳特征点标签;针对扩充后的数据集及所得到的热图标签搭建卷积神经网络;利用该网络结构进行训练、得到模型。系统包括:数据扩充单元,热图标签单元,回归热图单元。本发明能够通过对现有的数据集进行扩充,解决了深度学习对大量训练数据的需求,深度学习网络能够提取人耳特征点,输出人耳特征点的热图结果。本发明通过对现有的数据集进行扩充,解决了深度学习对大量训练数据的需求;基于搭建针对人耳识别的深度学习网络结构,能够提取人耳特征点,输出人耳特征点的热图结果。
Description
技术领域
本发明属于计算机视觉及图形学技术领域,具体涉及一种搭建针对人耳识别的深度学习网络结构的方法及系统。
背景技术
在生物识别领域,由耳朵图像出发的自动身份识别代表了一个积极的研究领域,其可以作为自动识别系统中其他生物识别方式的补充,并在其他信息不可靠甚至不可用时提供身份提示。这项技术具有能够从远距离、以隐蔽的方式捕捉耳朵图像的能力,因此在监视和安全应用程序以及其他应用领域中成了一个有吸引力的选择。例如,在脸部识别技术可能与脸部侧面相矛盾的情况下,耳朵可以作为监视镜头中人的身份信息的来源。
近年来,这个领域已经做出了有意义的贡献,但仍然存在一些公开的研究问题,阻碍这项技术更广泛的(商业)部署,且现有的人耳识别技术并未达到良好的识别效果。另外,虽然基于神经网络的技术在计算机视觉和机器学习的其他领域正变得越来越流行,但是由于缺乏大规模的数据集,人耳识别尚未从这一领域的最新进展中受益。
发明内容
为解决上述问题,本发明公开了一种搭建针对人耳识别的深度学习网络结构的方法及系统,输出人耳特征点的热图结果,将网络的“思考过程”可视化。
为了达到上述目的,本发明提供如下技术方案:
一种搭建针对人耳识别的深度学习网络结构的方法,包括如下步骤:
步骤1,对现有的人耳图像数据集进行扩充;
步骤2,针对扩充后的人耳图像数据集计算以热图形式呈现的人耳特征点标签;
步骤3,针对扩充后的数据集搭建级联卷积神经网络,级联卷积神经网络学习步骤2得到的以热图形式呈现的人耳特征点标签;
步骤4,利用该网络结构进行训练、得到模型,从而实现通过深度学习网络提取人耳特征点,输出人耳特征点。
进一步的,所述步骤1中从人耳角度和人耳形状两方面对数据集进行扩充。
具体的,从人耳角度对数据集进行扩充具体包括以下过程:首先提取人耳特征点,然后将这些特征点和3D人耳模型建立对应关系,以此可以得到相机外参数,接着可以得到相机矩阵,从中提取出旋转矩阵,通过改变旋转矩阵,能够得到新的角度旋转矩阵,给定一副图像,可以合成不同角度的人耳图像。
具体的,从人耳形状对数据集进行扩充具体包括如下过程:首先通过3D人耳模型数据集获取多种高质量3D人耳扫描数据,接着将图像数据与不同3D人耳形状数据结合,生成同一个人不同耳朵形状的图像。
进一步的,所述步骤2中的人耳特征点标签是分别针对人耳图像中的每个特征点位置的热图。
进一步的,所述步骤3中级联卷积神经网络包括如下几层:
(1)输入层:用于接受图片输入;
(2)人耳轮廓框估计层:利用CNN检测出一个能够包含6个人耳轮廓点的矩形框,将框出的图片传入下一级CNN中;
(3)人耳轮廓点检测层:与人耳轮廓框估计层相连,根据矩形框检测其中6个轮廓点并将结果输出;
(4)人耳内部点边界框估计层:利用CNN检测出一个可以包含7个人耳内部关键点的矩形框,将框出的图片传入下一级CNN中;
(5)人耳内部关键点检测层:与人耳内部点边界框层相连,根据矩形框检测其中7个人耳内部关键点并将结果输出;
(6)人耳关键点合并层:将人耳轮廓点和人耳内部点关键点检测层结果合并;
(7)人耳关键点热图输出层:基于人耳关键点合并得到13个人耳关键点的热图并输出。
本发明还提供了一种搭建针对人耳识别的深度学习网络结构的系统,包括:
数据扩充单元,用于增加现有的人耳图像数据集中的图像数量;
热图标签单元,用于对扩充后的人耳图像数据集计算以热图形式呈现的人耳特征点标签;
回归热图单元,用于搭建一个回归人耳图像中的每个特征点位置的热图的级联卷积神经网络,级联卷积神经网络学习热图标签单元得到的人耳特征点标签,并对数据扩充单元扩充后的人耳图像数据集中数据进行训练输出人耳特征点的热图结果。
与现有技术相比,本发明具有如下优点和有益效果:
本发明通过对现有的数据集进行扩充,解决了深度学习对大量训练数据的需求;基于搭建针对人耳识别的深度学习网络结构,能够提取人耳特征点,输出人耳特征点的热图结果;由于回归人耳特征点的热图,相较于回归坐标点有更好的效果。
附图说明
图1为本发明提供的搭建针对人耳识别的深度学习网络结构的方法流程图。
图2为本发明中针对人耳识别的深度学习网络结构的示意图。
图3为本发明中提出的人耳13个特征点示意图。
图4为本发明中提出的热图高斯点示意图。
图5为本发明提供的搭建针对人耳识别的深度学习网络结构的系统架构图。
具体实施方式
以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明如图2所示的搭建针对人耳识别的深度学习网络结构方法,其流程如图1所示,包括如下步骤:
步骤S110,对现有的人耳图像数据集进行扩充。对现有公共数据库人耳图像,从人耳角度和耳朵形状2个方面合成新的人耳图像,极大的扩增数据量。
从人耳角度方面扩充数据集即通过3D人耳模型数据集合成图像看不见的角度,生成新的角度的人耳。需进行如下操作:首先通过人耳特征点检测获取人耳特征点,接着根据人耳特征点和开放的3D人耳模型数据集的人耳模板合成3D人耳。具体而言是,首先提取人耳特征点,然后将这些特征点和3D人耳模型建立对应关系。以此可以得到相机外参数,接着可以得到相机矩阵M,从中提取出旋转矩阵R,通过改变R,我们可以得到新的角度旋转矩阵R’,给定一副图像,可以合成角度θ={0°,±40°,±75°}的人耳图像。其中,3D人耳模型可从3D人耳数据集中获得。
从耳朵形状方面扩充数据集需进行如下操作:首先通过3D人耳模型数据集获取多种高质量3D人耳扫描数据,接着将图像数据与不同3D人耳形状数据结合,生成同一个人不同耳朵形状的图像。
步骤S120,针对扩充后的人耳图像数据集计算以热图形式呈现的人耳特征点标签。
该热图是一个固定尺寸的i×j×k维立方体(对于k=13个特征点,可以为64×64×13)。在训练时间,真实标签是通过在真实人耳特征点位置放置具有固定方差的合成高斯圆分别为每个特征点合成的热图,如图4所示。
步骤S130,针对扩充后的数据集搭建级联卷积神经网络。
对于单张人耳图像,网络的目标是输出13个关键点的热图。其中包括6个人耳轮廓点(即附图3中的1-6特征点)和7个耳朵内部关键点(即附图3中的7-13特征点).
一个关键点对应一个热图,即生成一个高斯目标。耳朵关键点位置由热图表示,每个热图通过二维高斯分布对关键点位置进行编码。特别的,如果部分关键点缺失(例如,关键点被遮挡),则将相应的热图被设置为零。当目标点为x0,y0,我们使用来得到目标值,可见当x=x0,y=y0时,数值为1,周围距离越远数值越接近0。
该卷积神经网络的学习目标是(针对13个人耳特征点中的每一个)S120步骤得到的人耳特征点的热图。其输出是一个固定尺寸的i×j×k维立方体(对于k=13个特征点,可以为64×64×13)。
我们将训练样例表示为(X,y),其中y代表图像X中13个特征点的坐标。给定训练数据N={X,y}和回归器φ(conv8的输出),训练目标成为估计网络权重λ:
整个级联卷积神经网络结构如图2所示,分为如下几层:
(1)输入层:负责接受图片输入;
(2)人耳轮廓框估计:利用CNN检测出一个可以包含6个人耳轮廓点的矩形框,将框出的图片传入下一级CNN中;
(3)人耳轮廓点检测:与人耳轮廓估计层相连,根据矩形框检测其中6个轮廓点并将结果输出;
(4)人耳内部点边界框估计:利用CNN检测出一个可以包含7个人耳内部关键点的矩形框,将框出的图片传入下一级CNN中;
(5)人耳内部关键点检测:与人耳内部点边界框层相连,根据矩形框检测其中7个人耳内部关键点并将结果输出;
(6)合并人耳关键点:将人耳轮廓点和人耳内部点关键点检测层结果合并;
(7)人耳关键点热图输出层:计算13个人耳关键点的热图并输出。
步骤S140,利用该网络结构对步骤S110扩充后的数据进行训练、得到模型,从而实现通过深度学习网络提取人耳特征点,输出人耳特征点的热图结果。
直接回归坐标是一个高度非线性和更难学习的映射,而回归热图的好处是双重的:首先,回归热图可以将网络的“思考过程”可视化。其次,通过设计,网络的输出可以是多模态的,即允许在多个空间位置处具有置信度,学习变得更容易。
利用该网络结构进行训练,可以提取人耳特征点,输出人耳特征点的热图结果,且能取得良好的效果。
基于上述步骤,本发明还提供了搭建针对手势检测的深度学习网络结构的系统,如图5所示,包括:
数据扩充单元,用于从耳朵角度和耳朵形状两方面增加现有的人耳图像数据集中的图像数量;
热图标签单元,用于对扩充后的人耳图像数据集计算以热图形式呈现的人耳特征点标签;
回归热图单元,用于搭建一个回归人耳图像中的每个特征点位置的热图的级联卷积神经网络,级联卷积神经网络学习热图标签单元得到的人耳特征点标签,并对数据扩充单元扩充后的人耳图像数据集中数据进行训练输出人耳特征点的热图结果。
本领域的技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (6)
1.一种搭建针对人耳识别的深度学习网络结构的方法,其特征在于,包括如下步骤:
步骤1,对现有的人耳图像数据集进行扩充;
步骤2,针对扩充后的人耳图像数据集计算以热图形式呈现的人耳特征点标签;
步骤3,针对扩充后的数据集搭建级联卷积神经网络,级联卷积神经网络学习步骤2得到的以热图形式呈现的人耳特征点标签;
所述级联卷积神经网络包括如下几层:
(1)输入层:用于接受图片输入;
(2)人耳轮廓框估计层:利用CNN检测出一个能够包含6个人耳轮廓点的矩形框,将框出的图片传入下一级CNN中;
(3)人耳轮廓点检测层:与人耳轮廓框估计层相连,根据矩形框检测其中6个轮廓点并将结果输出;
(4)人耳内部点边界框估计层:利用CNN检测出一个可以包含7个人耳内部关键点的矩形框,将框出的图片传入下一级CNN中;
(5)人耳内部关键点检测层:与人耳内部点边界框层相连,根据矩形框检测其中7个人耳内部关键点并将结果输出;
(6)人耳关键点合并层:将人耳轮廓点和人耳内部点关键点检测层结果合并;
(7)人耳关键点热图输出层:基于人耳关键点合并得到13个人耳关键点的热图并输出;
步骤4,利用该网络结构进行训练、得到模型,从而实现通过深度学习网络提取人耳特征点,输出人耳特征点。
2.根据权利要求1所述的搭建针对人耳识别的深度学习网络结构的方法,其特征在于,所述步骤1中从人耳角度和人耳形状两方面对数据集进行扩充。
3.根据权利要求2所述的搭建针对人耳识别的深度学习网络结构的方法,其特征在于,从人耳角度对数据集进行扩充具体包括以下过程:首先提取人耳特征点,然后将这些特征点和3D人耳模型建立对应关系,以此可以得到相机外参数,接着可以得到相机矩阵,从中提取出旋转矩阵,通过改变旋转矩阵,能够得到新的角度旋转矩阵,给定一副图像,可以合成不同角度的人耳图像。
4.根据权利要求2所述的搭建针对人耳识别的深度学习网络结构的方法,其特征在于,从人耳形状对数据集进行扩充具体包括如下过程:首先通过3D人耳模型数据集获取多种高质量3D人耳扫描数据,接着将图像数据与不同3D人耳形状数据结合,生成同一个人不同耳朵形状的图像。
5.根据权利要求1所述的搭建针对人耳识别的深度学习网络结构的方法,其特征在于,所述步骤2中的人耳特征点标签是分别针对人耳图像中的每个特征点位置的热图。
6.一种搭建针对人耳识别的深度学习网络结构的系统,其特征在于,包括:
数据扩充单元,用于增加现有的人耳图像数据集中的图像数量;
热图标签单元,用于对扩充后的人耳图像数据集计算以热图形式呈现的人耳特征点标签;回归热图单元,用于搭建一个回归人耳图像中的每个特征点位置的热图的级联卷积神经网络,级联卷积神经网络学习热图标签单元得到的人耳特征点标签,并对数据扩充单元扩充后的人耳图像数据集中数据进行训练输出人耳特征点的热图结果;
所述级联卷积神经网络包括如下几层:
(1)输入层:用于接受图片输入;
(2)人耳轮廓框估计层:利用CNN检测出一个能够包含6个人耳轮廓点的矩形框,将框出的图片传入下一级CNN中;
(3)人耳轮廓点检测层:与人耳轮廓框估计层相连,根据矩形框检测其中6个轮廓点并将结果输出;
(4)人耳内部点边界框估计层:利用CNN检测出一个可以包含7个人耳内部关键点的矩形框,将框出的图片传入下一级CNN中;
(5)人耳内部关键点检测层:与人耳内部点边界框层相连,根据矩形框检测其中7个人耳内部关键点并将结果输出;
(6)人耳关键点合并层:将人耳轮廓点和人耳内部点关键点检测层结果合并;
(7)人耳关键点热图输出层:基于人耳关键点合并得到13个人耳关键点的热图并输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810392301.1A CN108596193B (zh) | 2018-04-27 | 2018-04-27 | 一种搭建针对人耳识别的深度学习网络结构的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810392301.1A CN108596193B (zh) | 2018-04-27 | 2018-04-27 | 一种搭建针对人耳识别的深度学习网络结构的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108596193A CN108596193A (zh) | 2018-09-28 |
CN108596193B true CN108596193B (zh) | 2021-11-02 |
Family
ID=63610746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810392301.1A Active CN108596193B (zh) | 2018-04-27 | 2018-04-27 | 一种搭建针对人耳识别的深度学习网络结构的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108596193B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861228B2 (en) * | 2018-12-28 | 2020-12-08 | X Development Llc | Optical otoscope device |
CN110032952B (zh) * | 2019-03-26 | 2020-11-10 | 西安交通大学 | 一种基于深度学习的道路边界点检测方法 |
CN110175544B (zh) * | 2019-05-14 | 2021-06-29 | 广州虎牙信息科技有限公司 | 目标模型的构建方法、装置、电子设备及存储介质 |
CN110197149B (zh) * | 2019-05-23 | 2021-05-18 | 北京达佳互联信息技术有限公司 | 耳部关键点检测方法、装置、存储介质及电子设备 |
CN111062248A (zh) * | 2019-11-08 | 2020-04-24 | 宇龙计算机通信科技(深圳)有限公司 | 图像检测的方法、装置、电子设备及介质 |
CN110956098B (zh) * | 2019-11-13 | 2023-05-12 | 深圳数联天下智能科技有限公司 | 图像处理方法及相关设备 |
CN111144240B (zh) * | 2019-12-12 | 2023-02-07 | 深圳数联天下智能科技有限公司 | 图像处理方法及相关设备 |
CN112837336B (zh) * | 2021-02-23 | 2022-02-22 | 浙大宁波理工学院 | 一种基于关键点热图修正的房间布局估计获取方法与系统 |
CN113112475B (zh) * | 2021-04-13 | 2023-04-18 | 五邑大学 | 一种基于机器学习的中医耳部五脏区域分割方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295502A (zh) * | 2016-07-25 | 2017-01-04 | 厦门中控生物识别信息技术有限公司 | 一种人脸检测方法及装置 |
CN106845487A (zh) * | 2016-12-30 | 2017-06-13 | 佳都新太科技股份有限公司 | 一种端到端的车牌识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345984B2 (en) * | 2010-01-28 | 2013-01-01 | Nec Laboratories America, Inc. | 3D convolutional neural networks for automatic human action recognition |
-
2018
- 2018-04-27 CN CN201810392301.1A patent/CN108596193B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295502A (zh) * | 2016-07-25 | 2017-01-04 | 厦门中控生物识别信息技术有限公司 | 一种人脸检测方法及装置 |
CN106845487A (zh) * | 2016-12-30 | 2017-06-13 | 佳都新太科技股份有限公司 | 一种端到端的车牌识别方法 |
Non-Patent Citations (1)
Title |
---|
《基于卷积神经网络的人耳识别研究》;胡颖;《中北大学学报(自然科学版)》;20151231;第36卷(第5期);第597-601页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108596193A (zh) | 2018-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108596193B (zh) | 一种搭建针对人耳识别的深度学习网络结构的方法及系统 | |
US11928800B2 (en) | Image coordinate system transformation method and apparatus, device, and storage medium | |
US10198623B2 (en) | Three-dimensional facial recognition method and system | |
US10949649B2 (en) | Real-time tracking of facial features in unconstrained video | |
WO2022165809A1 (zh) | 一种训练深度学习模型的方法和装置 | |
JP4677046B2 (ja) | 多次元ブースト回帰を経た外観及び動作を使用する高速人間姿勢推定 | |
CN103839277B (zh) | 一种户外大范围自然场景的移动增强现实注册方法 | |
Lee et al. | Accurate and robust face recognition from RGB-D images with a deep learning approach. | |
Yang et al. | A multi-task Faster R-CNN method for 3D vehicle detection based on a single image | |
US20140043329A1 (en) | Method of augmented makeover with 3d face modeling and landmark alignment | |
CN107203745B (zh) | 一种基于跨域学习的跨视角动作识别方法 | |
US11810311B2 (en) | Two-stage depth estimation machine learning algorithm and spherical warping layer for equi-rectangular projection stereo matching | |
CN113283525A (zh) | 一种基于深度学习的图像匹配方法 | |
CN106599806A (zh) | 一种基于局部曲面几何特征的人体动作识别方法 | |
CN111209811A (zh) | 一种实时检测眼球注意力位置的方法及系统 | |
CN105469042A (zh) | 一种改进型的人像比对方法 | |
Roth et al. | Deep end-to-end 3d person detection from camera and lidar | |
US11430146B2 (en) | Two-stage depth estimation machine learning algorithm and spherical warping layer for EQUI-rectangular projection stereo matching | |
Liu et al. | Stereo video object segmentation using stereoscopic foreground trajectories | |
Li et al. | Real-time tracking algorithm for aerial vehicles using improved convolutional neural network and transfer learning | |
CN104463962B (zh) | 基于gps信息视频的三维场景重建方法 | |
Celestino et al. | 2D Image head pose estimation via latent space regression under occlusion settings | |
Ahmad et al. | Embedded deep vision in smart cameras for multi-view objects representation and retrieval | |
CN112749644B (zh) | 一种基于改进可变形卷积的Faster RCNN火灾烟雾检测方法 | |
Li et al. | Monocular 3-D Object Detection Based on Depth-Guided Local Convolution for Smart Payment in D2D Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |