CN109165680A - 基于视觉slam的室内场景下单一目标物体字典模型改进方法 - Google Patents
基于视觉slam的室内场景下单一目标物体字典模型改进方法 Download PDFInfo
- Publication number
- CN109165680A CN109165680A CN201810860165.4A CN201810860165A CN109165680A CN 109165680 A CN109165680 A CN 109165680A CN 201810860165 A CN201810860165 A CN 201810860165A CN 109165680 A CN109165680 A CN 109165680A
- Authority
- CN
- China
- Prior art keywords
- target object
- camera
- dictionary
- word
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000005457 optimization Methods 0.000 claims abstract description 22
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 230000001360 synchronised effect Effects 0.000 claims abstract description 6
- 230000004927 fusion Effects 0.000 claims abstract 2
- 238000012216 screening Methods 0.000 claims description 15
- 238000013480 data collection Methods 0.000 claims description 13
- 230000000875 corresponding effect Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000000844 transformation Methods 0.000 claims description 6
- 239000012141 concentrate Substances 0.000 claims description 5
- 238000003384 imaging method Methods 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims 1
- 238000006073 displacement reaction Methods 0.000 claims 1
- 238000007689 inspection Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 2
- 230000000007 visual effect Effects 0.000 abstract 2
- 238000013507 mapping Methods 0.000 abstract 1
- 238000004804 winding Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/80—Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法:对于进行视觉SLAM的单目或双目相机进行基础标定,获得内参信息后对环境进行检测和前端同步定位与建图,得到点云地图;根据周边环境与单一目标物体相关特征制作图片数据集,利用DBoW2库k‑means++算法生成数据集对应的单词;进行TF‑IDF相似度计算划分单词权值,设定阈值,进行归零化处理,得到单一目标物体字典改进模型;将该改进模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差。本发明优化了在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,为一些类别环境下特定单一目标物体的同步定位与建图提供了较大的便利。
Description
技术领域
本发明涉及图像处理方法,尤其涉及一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法。
背景技术
随着我国经济的快速发展与工业水平的提升,对于进一步提升生产力水平的需求愈为迫切,因此一系列自动化程度较高的机器人在诸多行业的应用都取得了长足进步。由于视觉SLAM技术对于设备的要求不高、成本较低并且在室内定位与建图精度良好,能够帮助机器人快速识别周边环境与特定物体,因此例如在室内家务机器人、快递自动分拣机器人、工业装配机器人等等领域均有广泛的应用。
与此同时,当前的视觉SLAM技术受限于对室内家务、快递分拣等场景的细化研究不足,导致对物体的处理仍较多关注于点、边等局部特征,对于物体类别、结构等信息的关注不足。对于物体语义类别划分与相互联系的视觉SLAM系统的研究目前正处于初步阶段,由于各类工业应用场景的不同,导致指定类别划分的方法也不尽相同,还未能有可产业化的算法。因此研究在室内场景下结合目标物体信息的兼顾效率与准确度的视觉SLAM算法的需求日益凸显。
发明内容
发明目的:针对现有技术存在的问题,本发明的目的在于提供一种能够解决室内场景下现有开源视觉SLAM算法存在跟踪目标时易丢失、复杂场景下的实时性不足、工作效率不高并且易受环境因素影响而精度不高等问题的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,为一些类别环境下的特定单一目标物体的同步定位与建图提供了较大的便利。
技术方案:一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,包括如下步骤:
(1)对于进行视觉SLAM的单目或双目相机进行基础标定,获得内参信息后利用该相机对环境进行检测并进行前端同步定位与建图,通过三维特征点得到未经过后端优化的点云地图;
(2)根据周边环境与单一目标物体相关特征制作图片数据集,并利用DBoW2库k-means++算法生成数据集对应的单词,为室内场景下视觉SLAM对单一目标物体建立的点云地图进行回环检测做准备;
(3)针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理,得到单一目标物体字典改进模型;
(4)将改进后的字典模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差,优化在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,提高定位与建图精度。
所述步骤(1)中,对一台单目相机进行标定,获得内参信息,同时通过视觉SLAM前端进行同步定位与建图,具体步骤为:
(1.1)以环境内的一张黑白棋盘格作为标定物,通过调整标定物与各个相机的方向,为标定物拍摄一些不同方向的照片,并从照片中提取棋盘格角点;
(1.2)设周边环境中某空间点P的相机坐标为[X,Y,Z]T,其中,X,Y,Z分别为相机在三维空间立体坐标系中的坐标,则在相机模型中根据三角形相似关系得到成像平面内对应成像点P′坐标为f为相机焦距;
将该点转换到像素坐标[U,V],有K即为相机内参矩阵;
根据实际情况,合理选择校正参数k1、k2、p1、p2、p3,对相机基础标定的计算中的径向畸变与切向畸变进行纠正;
(1.3)获得标定相机的内参后,使用相机并利用视觉SLAM软件前端对周边环境进行同时定位与建图。首先由相机拍摄得到关键帧序列设为{Fkey},根据关键帧提取得到图像的特征点;其次通过前后两帧关键帧图像构建对极约束;最后根据相机位姿的变化,通过对极几何约束与特征点投影对周边环境进行定位与建图。
所述步骤(2)具体包括:
(2.1)使用相机拍摄包含单一目标物体的环境视频,并将视频转化为视频图像帧,构建初步的图片数据集;
(2.2)提取每幅图像帧的ORB特征点,筛选生成关键帧,通过筛选具有代表性的图像帧即关键帧,降低数据集的容量,提升后续步骤中生成单词与进行回环检测的效率。所述筛选生成关键帧需满足如下任一条件:
1)若继上一次筛选得到关键帧后,又过了N1帧;
2)当前无筛选得到的关键帧,或已有N2帧的图像帧被丢弃;
3)当前图像帧帧处理得到大于M个ORB特征点;
4)当前图像帧特征点与前一关键帧的相似度不超过S;
N1、N2、M、S为常数变量,可根据不同的单一目标物体场景提前设定成不同数值,其中S优选设置为0.85。
(2.3)通过图片数据集利用DBoW2库k-means++算法生成数据集对应的单词,具体为在每张关键帧图片中随机选取一个特征为初始聚类中心,通过计算图片中每一个特征点与当前已有聚类中心的最短距离D(x)来进一步得到每个特征点被选为下一个聚类中心的概率P(x);按照轮盘法则选择下一个聚类中心,若聚类中心数量达到设定的阈值k则完成字典词袋的生成,若未达到则继续聚类;每一个聚类中心即为字典中的一个单词。
所述步骤(3)具体包括:
(3.1)对于图片数据集中图片经过筛选得到的单词通过TF-IDF相似度计算划分权值:
其中,IDFi表示字典中某聚类中心叶子节点即单词ωi中特征数量ni相对于所有特征数量n的比值,表示某单词在字典中出现的频率;
TFi表示某特征在一张图片中出现的频率,n为该图片中出现单词的总个数,ni为单词ωi在该图片中呈现的次数;进而可得ωi在字典中的权重为:
ηi=TFi×IDFi
(3.2)在图片数据集中对任意一张图片I,通过对应的单词以及单词的权重构建向量描述该图像I,表达式如下:
通过对比数据集中任两张图片的向量来比较两者的相似性:
若s(v1,v2)<ps,其中ps为相似度阈值,则在这两张图片中比较图片权重向量模值将其中权重模值较小的图片剔除;之后重新计算剔除相似图片后的图片数据集的单词以及单词权重;通过该步骤选取图片数据集中更具代表性的图片,可以进一步降低改进字典模型所选取字典的复杂度。
(3.3)生成的字典中,对于单一目标物体,考虑其在周边环境中出现频率较高,对于检测到周边环境闭环的贡献较低,进行如下运算:
若有:ηi=TFi×IDFi≤P
则:ηi=0
其中,P为可调整的单词权重阈值;通过对权值较低的单词进行归零化处理来提升字典对于闭环检测相似度计算的准确性。
所述步骤(4)具体包括:
(4.1)在应用改进字典模型的后端优化中,对于图像中的三维点P点,在单目的视觉SLAM系统中通过拥有7个自由度,即1个尺度因子、3个旋转角度和3个位移的三维点坐标以及位姿变化Sim3相似变换群,在检测到闭环条件进行优化时,对其相似变换群进行优化;在应用改进字典模型的后端优化中相机检测到闭环并进行尺度相似变换后,进行闭环融合,融合重复的点云,在CovisibilityGraph图优化中插入新的边以连接闭环;
(4.2)在应用改进字典模型的后端优化中发现闭环并进行后端优化后,对于相机的相对位姿与特征点空间位置进行基于局部集束调整(LocalBundleAdjustment)的最优调整;
设相机在运动中对于周边环境的观测方程为zk,j=h(yj,xk,vk,j),其中,zk,j表示传感器于xk位置观测到路标yj时产生的观测数据,vk,j为噪声;由于噪声的存在并不完全成立,将观测误差写成:
ekj=z-h(yj,xk,vk,j)
将其他时刻的误差一并考虑进来,考虑最小二乘模型,则整体误差即代价函数为:
求解上式,对相机姿态和特征点空间位置做出最优调整。
有益效果:本发明提供了一种基于视觉SLAM拓展的室内场景下单一目标物体字典模型改进方案,为一些类别环境下的特定单一目标物体的同步定位与建图提供了较大的便利。以单一目标物体为例,对特定目标物体的特征创建字典,结合目标物体信息改进DBoW2算法调整字典权重计算方式,将其应用到SLAM系统的回环检测中。首先对于相机进行基础标定,获得内参等信息后进行局部定位与建图工作,通过三维特征点得到未经过后端优化的点云地图;之后通过相机采集周边环境与单一目标物体相关的图片数据集,并利用DBoW2库k-means++算法生成数据集对应的单词;针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理;最后将改进后的字典模型结合到SLAM系统的后端优化中,优化在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,提高定位与建图精度。
附图说明
图1为本发明的方法流程示意图;
图2为相机相对位姿对极约束示意图;
图3为k-means++算法流程图:
图4为改进字典示意图。
具体实施方式
以下结合附图和具体实施例对本发明中的关键技术和具体实现方法进行详细说明。
如图所示为本发明的方法流程示意图。
步骤S1:对一台单目进行基础标定,获得内参等信息,同时通过视觉SLAM前端进行同步定位与建图。具体包括:
S1.1、以环境内的一张黑白棋盘格作为标定物,通过调整标定物与各个相机的方向,为标定物拍摄一些不同方向的照片,并从照片中提取棋盘格角点;
S1.2、设周边环境中某空间点P的相机坐标为[X,Y,Z]T,X,Y,Z分别为相机在三维空间立体坐标系中的坐标。那么在相机模型中根据三角形相似关系得到成像平面内对应成像点P′坐标为f为相机焦距。之后将该点转换到像素坐标[U,V],有K即为相机内参矩阵。根据实际情况,合理选择校正参数k1、k2、p1、p2、p3,对相机基础标定的计算中的径向畸变与切向畸变进行纠正;
S1.3、获得标定相机的内参后,使用相机并利用视觉SLAM软件前端对周边环境进行同时定位与建图。首先由相机拍摄得到关键帧序列设为{Fkey},根据关键帧提取得到图像的特征点;其次通过前后两帧关键帧图像构建对极约束,如图2所示;其中,O1,O2是相机的光心,I1,I2是相机前后两帧拍摄到的图片,P是周围环境中相机在前后两帧共同观测到的一个特征点,分别投影在I1的p1点上和I2的p2点上,根据对极几何约束可以求解相机的位姿,具体过程如下:
设空间点P在相机O1下的坐标:
P=[X,Y,Z]
根相机模型,可以获得p1,p2的像素坐标:
其中,Z1、Z2为特征点P与相机的深度距离;K为相机的内参矩阵;R为相机在两帧间相对运动的3x3旋转矩阵;t为两帧间相对运动的3x1平移矩阵。通过矩阵间运算的求解,可以得到:
最后根据相机位姿的变化,通过对极几何约束与特征点投影对周边环境进行定位与建图。
步骤S2:根据单一目标物体的相关特征制作图片数据集,之后通过图片数据集利用DBoW2库k-means++算法生成数据集对应的单词,为室内场景下视觉SLAM对单一目标物体建立的点云地图进行回环检测做准备。具体包括:
S2.1、使用相机拍摄包含单一目标物体的环境视频,并将视频转化为视频图像帧,构建初步的图片数据集。;
S2.2、在初步处理得到的图片数据集中,提取每幅图像帧的ORB特征点,通过筛选具有代表性的图像帧即关键帧,降低数据集的容量,提升后续步骤中生成单词与进行回环检测的效率。筛选生成关键帧所满足的具体条件如下:
(1)若继上一次帅选得到关键帧后,又过了N1帧;
(2)当前无筛选得到的关键帧,或已有N2帧的图像帧被丢弃;
(3)当前图像帧帧处理得到大于M个ORB特征点;
(4)当前图像帧特征点与前一关键帧的相似度不超过S;
S2.3、通过图片数据集利用DBoW2库k-means++算法生成数据集对应的单词。其方法为在每张关键帧图片中随机选取一个特征为初始聚类中心,通过计算图片中每一个特征点与当前已有聚类中心的最短距离D(x)来进一步得到每个特征点被选为下一个聚类中心的概率P(x)。之后按照轮盘法则选择下一个聚类中心,若聚类中心数量达到设定的阈值k则完成字典词袋的生成,若未达到则继续聚类。每一个聚类中心即为字典中的一个单词。
步骤S3:针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理。具体包括:
S3.1、对于图片数据集中图片经过筛选得到的单词通过TF-IDF相似度计算划分权值。
其中,IDFi表示字典中某聚类中心叶子节点即单词ωi中特征数量ni相对于所有特征数量n的比值,简而言之即为某单词在字典中出现的频率;
TFi表示某特征在一张图片中出现的频率,n为该图片中出现单词的总个数,ni为单词ωi在该图片中呈现的次数。
进而可得ωi在字典中的权重为
ηi=TFi×IDFi
S3.2、在图片数据集中对任意一张图片I,通过对应的单词以及单词的权重构建向量描述该图像I,表达式如下:
通过对比数据集中任两张图片的向量来比较两者的相似性:
若s(v1,v2)<ps,其中ps为相似度阈值,则在这两张图片中比较图片权重向量模值将其中权重模值较小的图片剔除。之后重新计算剔除相似图片后的图片数据集的单词以及单词权重。通过该步骤选取图片数据集中更具代表性的图片,可以进一步降低改进字典模型所选取字典的复杂度。
S3.3、生成的字典中,对于单一目标物体,考虑其在周边环境中出现频率较高,对于检测到周边环境闭环的贡献较低,故可以进行如下运算:
若有:ηi=TFi×IDFi≤P
则:ηi=0
其中P为可调整的单词权重阈值。通过对权值较低的单词进行归零化处理来提升字典对于闭环检测相似度计算的准确性。如图4所示为改进后生成的字典,
图中每一行起始数字为节点的编号;中间数字为ORB特征向量,TXT文件中为十进制显示,格式为CV_8U;每一行最后一个单精度浮点数即表示该节点单词的权重。
步骤S4:将改进后的字典模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差,优化在室内场景下对于单一目标物体的回环检测的发现与点云地图的闭环融合,提高定位与建图精度。具体包括:
S4.1、在应用改进字典模型的后端优化中,对于图像中的三维点P点,在单目的视觉SLAM系统中通过拥有7个自由度,即1个尺度因子、3个旋转角度和3个位移的三维点坐标以及位姿变化Sim3相似变换群,在检测到闭环条件进行优化时,对其相似变换群进行优化。在应用改进字典模型的后端优化中相机检测到闭环并进行尺度相似变换后,进行闭环融合,融合重复的点云,在Covisibility Graph图优化中插入新的边以连接闭环。
S4.2、在应用改进字典模型的后端优化中发现闭环并进行后端优化后,对于相机的相对位姿与特征点空间位置进行基于局部集束调整(Local Bundle Adjustment)的最优调整。
设相机在运动中对于周边环境的观测方程为zk,j=h(yj,xk,vk,j),其中zk,j表示传感器于xk位置观测到路标yj时产生的观测数据,vk,j为噪声。由于噪声的存在并不完全成立,观测误差可写成:
ekj=z-h(yj,xk,vk,j)
将其他时刻的误差一并考虑进来,考虑最小二乘模型,则整体误差即代价函数为:
通过对该式的求解,即可对相机姿态和特征点空间位置做出最优调整。
如表1所示为改进字典模型的ORB-SLAM2算法与未改进字典模型ORB-SLAM2算法在针对单一目标物体电脑的自制数据集中各项数据的对比:
表1
Claims (6)
1.一种基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,包括如下步骤:
(1)对于进行视觉SLAM的单目或双目相机进行基础标定,获得内参信息后利用该相机对环境进行检测并进行前端同步定位与建图,通过三维特征点得到未经过后端优化的点云地图;
(2)根据周边环境与单一目标物体相关特征制作图片数据集,并利用DBoW2库k-means++算法生成数据集对应的单词;
(3)针对单一目标物体生成的单词进行TF-IDF相似度计算划分单词权值,根据对检测周边环境闭环贡献程度的高低设定阈值,对于与单一目标物体有关的部分单词进行归零化处理,得到单一目标物体字典改进模型;
(4)将改进后的字典模型结合到SLAM系统的后端优化中,通过对点云地图点在图像帧上的投影与实际像素坐标进行最小化投影误差。
2.根据权利要求1所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,所述步骤(1)中,对一台单目相机进行标定,获得内参信息,同时通过视觉SLAM前端进行同步定位与建图,具体步骤为:
(1.1)以环境内的一张黑白棋盘格作为标定物,通过调整标定物与各个相机的方向,为标定物拍摄一些不同方向的照片,并从照片中提取棋盘格角点;
(1.2)设周边环境中某空间点P的相机坐标为[X,Y,Z]T,其中,X,Y,Z分别为相机在三维空间立体坐标系中的坐标,则在相机模型中根据三角形相似关系得到成像平面内对应成像点P′坐标为f为相机焦距;
将该点转换到像素坐标[U,V],有K即为相机内参矩阵;
根据实际情况,合理选择校正参数k1、k2、p1、p2、p3,对相机基础标定的计算中的径向畸变与切向畸变进行纠正;
(1.3)由相机拍摄得到关键帧序列设为{Fkey},根据关键帧提取得到图像的特征点;其次通过前后两帧关键帧图像构建对极约束;最后根据相机位姿的变化,通过对极几何约束与特征点投影对周边环境进行定位与建图。
3.根据权利要求1所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,所述步骤(2)具体包括:
(2.1)使用相机拍摄包含单一目标物体的环境视频,并将视频转化为视频图像帧,构建初步的图片数据集;
(2.2)提取每幅图像帧的ORB特征点,筛选生成关键帧;所述筛选生成关键帧需满足如下任一条件:
1)若继上一次筛选得到关键帧后,又过了N1帧;
2)当前无筛选得到的关键帧,或已有N2帧的图像帧被丢弃;
3)当前图像帧帧处理得到大于M个ORB特征点;
4)当前图像帧特征点与前一关键帧的相似度不超过S;
N1、N2、M、S为常数变量,根据不同的单一目标物体场景提前设定;
(2.3)在每张关键帧图片中随机选取一个特征为初始聚类中心,通过计算图片中每一个特征点与当前已有聚类中心的最短距离D(x)来进一步得到每个特征点被选为下一个聚类中心的概率P(x);按照轮盘法则选择下一个聚类中心,若聚类中心数量达到设定的阈值k则完成字典词袋的生成,若未达到则继续聚类;每一个聚类中心即为字典中的一个单词。
4.根据权利要求3所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于:所述步骤(2.2)中,S设置为0.85。
5.根据权利要求1所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,所述步骤(3)具体包括:
(3.1)对于图片数据集中图片经过筛选得到的单词通过TF-IDF相似度计算划分权值:
其中,IDFi表示字典中某聚类中心叶子节点即单词ωi中特征数量ni相对于所有特征数量n的比值,表示某单词在字典中出现的频率;
TFi表示某特征在一张图片中出现的频率,n为该图片中出现单词的总个数,ni为单词ωi在该图片中呈现的次数;进而可得ωi在字典中的权重为:
ηi=TFi×IDFi
(3.2)在图片数据集中对任意一张图片I,通过对应的单词以及单词的权重构建向量描述该图像I,表达式如下:
通过对比数据集中任两张图片的向量来比较两者的相似性:
若s(v1,v2)<ps,其中ps为相似度阈值,则在这两张图片中比较图片权重向量模值将其中权重模值较小的图片剔除;之后重新计算剔除相似图片后的图片数据集的单词以及单词权重;
(3.3)生成的字典中,对于单一目标物体,考虑其在周边环境中出现频率较高,对于检测到周边环境闭环的贡献较低,进行如下运算:
若有:ηi=TFi×IDFi≤P
则:ηi=0
其中,P为可调整的单词权重阈值。
6.根据权利要求1所述的基于视觉SLAM的室内场景下单一目标物体字典模型改进方法,其特征在于,所述步骤(4)具体包括:
(4.1)在应用改进字典模型的后端优化中,对于图像中的三维点P点,在单目的视觉SLAM系统中通过拥有7个自由度,即1个尺度因子、3个旋转角度和3个位移的三维点坐标以及位姿变化Sim3相似变换群,在检测到闭环条件进行优化时,对其相似变换群进行优化;在应用改进字典模型的后端优化中相机检测到闭环并进行尺度相似变换后,进行闭环融合,融合重复的点云,在Covisibility Graph图优化中插入新的边以连接闭环;
(4.2)在应用改进字典模型的后端优化中发现闭环并进行后端优化后,对于相机的相对位姿与特征点空间位置进行基于局部集束调整的最优调整;
设相机在运动中对于周边环境的观测方程为zk,j=h(yj,xk,vk,j),其中,zk,j表示传感器于xk位置观测到路标yj时产生的观测数据,vk,j为噪声;由于噪声的存在并不完全成立,将观测误差写成:
ekj=z-h(yj,xk,vk,j)
将其他时刻的误差一并考虑进来,考虑最小二乘模型,则整体误差即代价函数为:
求解上式,对相机姿态和特征点空间位置做出最优调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810860165.4A CN109165680B (zh) | 2018-08-01 | 2018-08-01 | 基于视觉slam的室内场景下单一目标物体字典模型改进方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810860165.4A CN109165680B (zh) | 2018-08-01 | 2018-08-01 | 基于视觉slam的室内场景下单一目标物体字典模型改进方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109165680A true CN109165680A (zh) | 2019-01-08 |
CN109165680B CN109165680B (zh) | 2022-07-26 |
Family
ID=64898502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810860165.4A Active CN109165680B (zh) | 2018-08-01 | 2018-08-01 | 基于视觉slam的室内场景下单一目标物体字典模型改进方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109165680B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109855645A (zh) * | 2019-03-27 | 2019-06-07 | 小驴机器人(武汉)有限公司 | 一种agv小车混合视觉导航方法 |
CN110068824A (zh) * | 2019-04-17 | 2019-07-30 | 北京地平线机器人技术研发有限公司 | 一种传感器位姿确定方法和装置 |
CN110514198A (zh) * | 2019-08-28 | 2019-11-29 | 电子科技大学 | 一种基于计算机视觉技术的前后端架构地图定位方法 |
CN110853100A (zh) * | 2019-10-24 | 2020-02-28 | 东南大学 | 一种基于改进点线特征的结构化场景视觉slam方法 |
CN111024078A (zh) * | 2019-11-05 | 2020-04-17 | 广东工业大学 | 基于gpu加速的无人机视觉slam方法 |
CN111368759A (zh) * | 2020-03-09 | 2020-07-03 | 河海大学常州校区 | 基于单目视觉的移动机器人语义地图构建系统 |
CN111402331A (zh) * | 2020-02-25 | 2020-07-10 | 华南理工大学 | 基于视觉词袋和激光匹配的机器人重定位方法 |
CN111435086A (zh) * | 2019-01-13 | 2020-07-21 | 北京初速度科技有限公司 | 基于拼接图的导航方法和装置 |
CN112149471A (zh) * | 2019-06-28 | 2020-12-29 | 北京初速度科技有限公司 | 一种基于语义点云的回环检测方法及装置 |
CN112767546A (zh) * | 2021-01-22 | 2021-05-07 | 湖南大学 | 移动机器人基于双目图像的视觉地图生成方法 |
CN114202587A (zh) * | 2021-11-12 | 2022-03-18 | 天津大学 | 基于船载单目相机的视觉特征提取方法 |
CN114689035A (zh) * | 2022-03-25 | 2022-07-01 | 中国科学院计算技术研究所 | 基于多传感器融合的长航程农田地图构建方法及系统 |
WO2022188094A1 (zh) * | 2021-03-11 | 2022-09-15 | 华为技术有限公司 | 一种点云匹配方法及装置、导航方法及设备、定位方法、激光雷达 |
CN117906617A (zh) * | 2024-03-19 | 2024-04-19 | 深圳森磊弘泰消防科技有限公司 | 一种基于bim数据的室内融合定位的移动设备及定位方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843925A (zh) * | 2016-03-23 | 2016-08-10 | 中国科学技术大学 | 一种基于改进bow算法的相似图片搜索方法 |
CN106570884A (zh) * | 2016-09-30 | 2017-04-19 | 天津大学 | 基于在线更新字典模型的目标跟踪方法 |
CN106909877A (zh) * | 2016-12-13 | 2017-06-30 | 浙江大学 | 一种基于点线综合特征的视觉同时建图与定位方法 |
CN108230337A (zh) * | 2017-12-31 | 2018-06-29 | 厦门大学 | 一种基于移动端的语义slam系统实现的方法 |
-
2018
- 2018-08-01 CN CN201810860165.4A patent/CN109165680B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843925A (zh) * | 2016-03-23 | 2016-08-10 | 中国科学技术大学 | 一种基于改进bow算法的相似图片搜索方法 |
CN106570884A (zh) * | 2016-09-30 | 2017-04-19 | 天津大学 | 基于在线更新字典模型的目标跟踪方法 |
CN106909877A (zh) * | 2016-12-13 | 2017-06-30 | 浙江大学 | 一种基于点线综合特征的视觉同时建图与定位方法 |
CN108230337A (zh) * | 2017-12-31 | 2018-06-29 | 厦门大学 | 一种基于移动端的语义slam系统实现的方法 |
Non-Patent Citations (1)
Title |
---|
王远配等: "基于改进ORB的视觉SLAM闭环检测", 《中国科技论文》 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111435086B (zh) * | 2019-01-13 | 2022-03-25 | 北京魔门塔科技有限公司 | 基于拼接图的导航方法和装置 |
CN111435086A (zh) * | 2019-01-13 | 2020-07-21 | 北京初速度科技有限公司 | 基于拼接图的导航方法和装置 |
CN109855645A (zh) * | 2019-03-27 | 2019-06-07 | 小驴机器人(武汉)有限公司 | 一种agv小车混合视觉导航方法 |
CN110068824A (zh) * | 2019-04-17 | 2019-07-30 | 北京地平线机器人技术研发有限公司 | 一种传感器位姿确定方法和装置 |
CN112149471B (zh) * | 2019-06-28 | 2024-04-16 | 北京初速度科技有限公司 | 一种基于语义点云的回环检测方法及装置 |
CN112149471A (zh) * | 2019-06-28 | 2020-12-29 | 北京初速度科技有限公司 | 一种基于语义点云的回环检测方法及装置 |
CN110514198A (zh) * | 2019-08-28 | 2019-11-29 | 电子科技大学 | 一种基于计算机视觉技术的前后端架构地图定位方法 |
CN110853100A (zh) * | 2019-10-24 | 2020-02-28 | 东南大学 | 一种基于改进点线特征的结构化场景视觉slam方法 |
CN110853100B (zh) * | 2019-10-24 | 2022-11-18 | 东南大学 | 一种基于改进点线特征的结构化场景视觉slam方法 |
CN111024078B (zh) * | 2019-11-05 | 2021-03-16 | 广东工业大学 | 基于gpu加速的无人机视觉slam方法 |
CN111024078A (zh) * | 2019-11-05 | 2020-04-17 | 广东工业大学 | 基于gpu加速的无人机视觉slam方法 |
CN111402331B (zh) * | 2020-02-25 | 2023-03-28 | 华南理工大学 | 基于视觉词袋和激光匹配的机器人重定位方法 |
CN111402331A (zh) * | 2020-02-25 | 2020-07-10 | 华南理工大学 | 基于视觉词袋和激光匹配的机器人重定位方法 |
CN111368759B (zh) * | 2020-03-09 | 2022-08-30 | 河海大学常州校区 | 基于单目视觉的移动机器人语义地图构建系统 |
CN111368759A (zh) * | 2020-03-09 | 2020-07-03 | 河海大学常州校区 | 基于单目视觉的移动机器人语义地图构建系统 |
CN112767546B (zh) * | 2021-01-22 | 2022-08-02 | 湖南大学 | 移动机器人基于双目图像的视觉地图生成方法 |
CN112767546A (zh) * | 2021-01-22 | 2021-05-07 | 湖南大学 | 移动机器人基于双目图像的视觉地图生成方法 |
WO2022188094A1 (zh) * | 2021-03-11 | 2022-09-15 | 华为技术有限公司 | 一种点云匹配方法及装置、导航方法及设备、定位方法、激光雷达 |
CN114202587A (zh) * | 2021-11-12 | 2022-03-18 | 天津大学 | 基于船载单目相机的视觉特征提取方法 |
CN114689035A (zh) * | 2022-03-25 | 2022-07-01 | 中国科学院计算技术研究所 | 基于多传感器融合的长航程农田地图构建方法及系统 |
CN117906617A (zh) * | 2024-03-19 | 2024-04-19 | 深圳森磊弘泰消防科技有限公司 | 一种基于bim数据的室内融合定位的移动设备及定位方法 |
CN117906617B (zh) * | 2024-03-19 | 2024-05-24 | 深圳森磊弘泰消防科技有限公司 | 一种基于bim数据的室内融合定位的移动设备及定位方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109165680B (zh) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165680A (zh) | 基于视觉slam的室内场景下单一目标物体字典模型改进方法 | |
CN110568447B (zh) | 视觉定位的方法、装置及计算机可读介质 | |
JP2024128138A (ja) | 画像処理装置、画像処理方法 | |
CN102834845B (zh) | 用于多摄像装置校准的方法与装置 | |
CN109509230A (zh) | 一种应用于多镜头组合式全景相机的slam方法 | |
TWI745818B (zh) | 視覺定位方法、電子設備及電腦可讀儲存介質 | |
CN111553939B (zh) | 一种多目摄像机的图像配准算法 | |
CN105654476B (zh) | 基于混沌粒子群优化算法的双目标定方法 | |
CN115082815B (zh) | 基于机器视觉的茶芽采摘点定位方法、装置及采摘系统 | |
CN113393439A (zh) | 一种基于深度学习的锻件缺陷检测方法 | |
CN110555408B (zh) | 一种基于自适应映射关系的单摄像头实时三维人体姿态检测方法 | |
WO2023116430A1 (zh) | 视频与城市信息模型三维场景融合方法、系统及存储介质 | |
EP3836085B1 (en) | Multi-view three-dimensional positioning | |
CN110009732A (zh) | 基于gms特征匹配的面向复杂大尺度场景三维重建方法 | |
CN113132717A (zh) | 数据处理方法、终端和服务器 | |
CN112419497A (zh) | 基于单目视觉的特征法与直接法相融合的slam方法 | |
CN112163588A (zh) | 基于智能进化的异源图像目标检测方法、存储介质及设备 | |
CN112418288A (zh) | 一种基于gms和运动检测的动态视觉slam方法 | |
CN116740539A (zh) | 基于轻量化目标检测网络的视觉slam方法及系统 | |
JP7336653B2 (ja) | ディープラーニングを利用した屋内位置測位方法 | |
CN110505398A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN112767546A (zh) | 移动机器人基于双目图像的视觉地图生成方法 | |
WO2022174603A1 (zh) | 一种位姿预测方法、位姿预测装置及机器人 | |
CN114419259A (zh) | 一种基于物理模型成像仿真的视觉定位方法及系统 | |
CN118799503A (zh) | 一种基于视觉的化工巡检机器人三维场景建图方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |