CN103345496B - 多媒体信息检索方法和系统 - Google Patents
多媒体信息检索方法和系统 Download PDFInfo
- Publication number
- CN103345496B CN103345496B CN201310264225.3A CN201310264225A CN103345496B CN 103345496 B CN103345496 B CN 103345496B CN 201310264225 A CN201310264225 A CN 201310264225A CN 103345496 B CN103345496 B CN 103345496B
- Authority
- CN
- China
- Prior art keywords
- vector
- multimedia information
- ith
- characteristic
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000013598 vector Substances 0.000 claims abstract description 481
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种多媒体信息检索方法及系统,所述方法包括:提取当前多媒体信息的特征数据,根据提取的特征数据得到所述当前多媒体信息的特征比特向量;对当前多媒体信息的特征比特向量进行分割,得到所述当前多媒体信息的k个子向量;针对所述当前多媒体信息的每个子向量,分别确定对应该子向量的候选集合;对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量;并计算所述当前多媒体信息的特征比特向量与查找到的特征比特向量之间的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出。利用上述方法通过建立分段索引结构对特征比特向量进行索引,能够大大提高多媒体信息检索速度和检索效率。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种多媒体信息检索方法和系统。
背景技术
近年来,随着多媒体技术和计算机技术的飞速发展、大规模的多媒体信息越来越多地出现在众多的研究和应用领域。为了使这些庞杂的数据中所包含的信息能够得到有效地访问和利用,传统的基于文本的检索技术已经无法满足用户日益增长的需求,基于内容的检索技术便应运而生。
基于内容的检索方法需要先提取出多媒体的特征数据建立特征数据库,然后将对多媒体信息的检索转换为对特征数据的近邻检索。对于大规模多媒体信息而言,其特征数据也是大规模的。这就需要有与特征数据相对应的合适的索引方法来组织特征数据,加快检索的速度。
然而,多媒体信息的特征数据往往是高维的向量数据(简称高维向量),传统的适应于低维数据的索引机制难以适应于基于内容检索的要求,这也就是通常所说的高维数据的索引维数灾难现象。为了降低索引维数灾难的影响,更好的实现高维数据索引,从而提高多媒体信息的检索性能,目前在研究领域,通常采用哈希方法将高维向量映射成离散的比特向量,这可以大大节约高维向量的存储消耗和提高相似查找速度。
在利用比特向量进行多媒体信息检索时,首先需要建立多媒体特征数据库,具体包括:针对资料库中的每个多媒体,提取出该多媒体的特征数据,采用哈希方法将该多媒体的特征数据转换成离散的n维比特向量,作为该多媒体的特征比特向量存储于多媒体特征数据库中。
现有技术在对多媒体信息进行检索时,首先需要对已有的多媒体特征数据库中的特征比特向量进行集合划分和排序,建立有序表,其具体流程图如图1所示,具体包括如下步骤:
S101:对已有的多媒体特征数据库中的特征比特向量按照前p(p<n)个元素进行集合划分。
具体地,将多媒体特征数据库中前p个元素相同的特征比特向量划分到同一集合中。
S102:针对每个集合,确定该集合的有序表。
具体地,针对每个集合,将该集合内的特征比特向量按照前一特征比特向量的二进制数值不大于后一特征比特向量的二进制数值大小进行排序,将排序后的各特征比特向量构成该集合的有序表。
根据已有的多媒体特征数据库和有序表,现有技术基于比特向量的多媒体检索方法,其具体流程图如图2所示,具体包括如下步骤:
S201:提取出当前多媒体信息的特征数据,采用哈希方法将其转换成离散的n维比特向量,得到当前多媒体信息的特征比特向量。
S202:根据当前多媒体信息的特征比特向量的前p个元素确定其所在的集合,在该集合内利用有序表查找与当前多媒体信息的特征比特向量的汉明距离小于等于q的特征比特向量。
具体地,将当前多媒体信息的特征比特向量划分到与其前p个元素相同的特征比特向量所属的集合中,在该集合内利用有序表查找与当前多媒体信息的特征比特向量不同元素个数小于等于q的比特向量。事实上,如果比特向量各元素独立,比特向量间的相似性一般可以用汉明距离度量,比特向量间的汉明距离可以表示为两个相比较的等长比特向量间对应位置比特值不同的元素个数。
S203:将上述查找到的特征比特向量所对应的多媒体,作为最终检索结果输出。
然而,本发明的发明人发现,上述的多媒体信息检索方法进行检索的速度仍然不能满足系统面临大量检索需求时对检索速度的要求;因此,有必要提供一种速度更快、效率更高的多媒体信息检索方法。
发明内容
针对上述现有技术存在的缺陷,本发明提供了一种多媒体信息检索方法及系统,用以提高对多媒体信息检索的速度和效率。
根据本发明的一个方面,提供了一种多媒体信息检索方法,包括:
提取当前多媒体信息的特征数据,将提取的特征数据转换为特征比特向量后,对其进行均匀分割,得到k个子向量,其中第i个子向量由所述特征比特向量均匀分割后的第i组元素组成;i为1~k的自然数;
分别确定对应所述当前多媒体信息的各子向量的候选集合,其中,针对第i个子向量,具体过程包括:在预先确定的第i个索引结构的索引集中查找出与该第i个子向量相同的索引,并将查找出的索引所对应的向量标识集合作为对应该第i个子向量的候选集合;其中,第i个索引结构中,第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识存储于同一向量标识集合中,且该向量标识集合的索引为该第i个子向量;
对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量;并计算所述当前多媒体信息的特征比特向量与查找到的特征比特向量之间的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出。
较佳地,第i个索引结构的确定方法,包括:
针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行均匀分割,得到该待检索多媒体信息的k个子向量;其中,该待检索多媒体信息的第i个子向量由所述特征比特向量分割后的第i组元素组成;i为1~k的自然数;
将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;并将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为该向量标识集合的索引,并存储到第i个索引结构的索引集中。
较佳地,所述对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量,具体包括:
将得到的候选集合进行并集操作后,得到候选合并集合;
对于所述候选合并集合中的每个向量标识,在所述多媒体特征数据库中查找出对应该向量标识的特征比特向量。
较佳地,所述汉明距离符合设定条件的特征比特向量具体为:与所述当前多媒体信息的特征比特向量的汉明距离小于等于q的特征比特向量,其中,所述q小于等于k。
较佳地,第i个索引结构具体为键/值Key/Value形式结构;其中,所述相同的第i个子向量作为Key,对应所述相同的第i个子向量的向量标识集合作为对应该Key的Value。
根据本发明的另一个方面,还提供了一种多媒体信息检索系统,包括:
特征比特向量确定模块,用于提取当前多媒体信息的特征数据,根据提取的特征数据得到所述当前多媒体信息的特征比特向量;
特征比特向量分割模块,用于对所述特征比特向量确定模块得到的特征比特向量进行均匀分割,得到所述当前多媒体信息的k个子向量,其中第i个子向量由所述特征比特向量分割后的第i组元素组成;i为1~k的自然数;
候选集合确定模块,用于针对所述特征比特向量分割模块得到的当前多媒体信息的每个子向量,分别确定对应该子向量的候选集合;其中,针对第i个子向量确定其对应的候选集合具体过程包括:在预先确定的第i个索引结构的索引集中查找出与该第i个子向量相同的索引,并将查找出的索引所对应的向量标识集合作为对应该第i个子向量的候选集合;其中,第i个索引结构中,第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识存储于同一向量标识集合中,且该向量标识集合的索引为该第i个子向量;
特征比特向量查找模块,用于对于所述候选集合确定模块得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量;
汉明距离计算模块,用于计算所述当前多媒体信息的特征比特向量与所述特征比特向量查找模块查找到的特征比特向量之间的汉明距离;
检索结果输出模块,用于根据所述汉明距离计算模块计算的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出。
较佳地,所述多媒体信息检索系统还包括:
索引结构构建模块,用于构建k个索引结构,其中第i个索引结构是采用如下方法构建:针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行均匀分割,得到该待检索多媒体信息的k个子向量;其中,该待检索多媒体信息的第i个子向量由该待检索多媒体信息的特征比特向量中的第i组元素组成;i为1~k的自然数;将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;并将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为该向量标识集合的索引,并存储到第i个索引结构的索引集中。
较佳地,所述索引结构构建模块具体包括:
特征比特向量分割单元,用于针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行分割,得到该待检索多媒体信息的k个子向量;
向量标识集合划分单元,用于在构建第i个索引结构时,将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;
索引建立单元,用于在构建第i个索引结构时,对于所述向量标识集合划分单元划分出的向量标识集合,将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为对应该向量标识集合的子向量,并作为第i个索引结构中的索引进行存储。
较佳地,所述特征比特向量查找模块具体包括:
候选集合合并单元,将所述候选集合确定模块得到的候选集合进行并集操作后,得到候选合并集合;
向量查找单元,用于对于所述候选合并集合中的每个向量标识,在所述多媒体特征数据库中查找出对应该向量标识的特征比特向量。
较佳地,所述汉明距离符合设定条件的特征比特向量具体为:
与所述当前多媒体信息的特征比特向量的汉明距离小于等于q的特征比特向量,其中,所述q小于等于k。
本发明的技术方案中,通过对待检索多媒体信息建立k个分段索引结构,查找与当前多媒体信息的特征比特向量中m(每个子向量中的向量元素个数)个元素相同的特征比特向量参与汉明距离计算,相比于现有技术中采用分块有序表查找与当前多媒体信息的特征比特向量中前p个元素相同的特征比特向量参与汉明距离计算,本发明方案可以大大减少参与汉明距离计算的特征比特向量个数,从而大大减少了一次检索过程中的计算量,达到提高检索速度和效率的目的。
进一步,本发明的检索方法中,为了检索的可持续性,只需要根据当前多媒体信息的各子向量,将当前多媒体信息的特征比特向量的向量标识划分到k个索引结构中的相对应的向量标识集合中,此计算量远小于现有技术的将特征比特向量与有序表中海量的特征比特向量进行比较、排序的计算量,从而大大提高检索速度、检索效率。
附图说明
图1为现有技术构建有序表的方法流程图;
图2为现有技术的多媒体信息检索的方法流程图;
图3为本发明实施例的构建分段索引的方法流程图;
图4为本发明实施例的多媒体信息检索的方法流程图;
图5为本发明实施例的多媒体信息检索系统的示意图;
图6为本发明实施例的特征比特向量查找模块的内部结构框图;
图7为本发明实施例的索引结构构建模块的内部结构框图。
具体实施方式
以下将结合附图对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
本发明的思路为,预先建立k个分段索引结构,在对当前多媒体信息进行检索时,利用k个分段索引结构查找与当前多媒体信息的特征比特向量中m(比如32)个元素相同的特征比特向量参与汉明距离计算,相比于现有技术中,参与汉明距离计算的前p(比如3)个元素相同的特征比特向量,大大缩小了参与汉明距离计算的特征比特向量数,从而大大减少了一次检索过程中的计算量,达到提高检索速度和效率的目的。
下面结合附图详细说明本发明的技术方案。本发明具体实施方式以在待检索的多媒体n维特征比特向量中,查找与当前多媒体信息特征比特向量汉明距离小于等于k的特征为例,介绍基于分段索引思想设计的多媒体信息检索的方法,首先需要建立多媒体特征数据库和分段索引,具体流程图如图3所示,具体包括如下步骤:
S301:针对资料库中的每个待检索多媒体信息,提取出该待检索多媒体信息的特征数据,采用哈希方法将该特征数据转换成离散的n维比特向量,得到每个待检索多媒体信息的特征比特向量。
S302:将每个待检索多媒体信息的特征比特向量及其向量标识存储于多媒体特征数据库中。
具体地,为每个待检索多媒体信息的特征比特向量分配一个唯一的向量标识,然后以该向量标识作为Key(键),以与该向量标识对应的特征比特向量作为Value(值),以Key/Value(键/值)的形式存储于多媒体特征数据库中,以便后面查询和匹配。
S303:针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行均匀分割,建立分段索引,得到k个索引结构。
具体地,将每个待检索多媒体信息的特征比特向量进行均匀分割,得到该待检索多媒体信息的k个子向量;其中,该待检索多媒体信息的第i个子向量由该待检索多媒体信息的特征比特向量分割后的第i组元素组成;该待检索多媒体信息的特征比特向量分割后的第i组元素具体包括特征比特向量中第(i-1)×m+1~i×m个元素;其中,i为1~k中的任意一个自然数,m为每个子向量(或每组元素)中的向量元素个数;
在建立分段索引过程中,k个索引结构中的第i个索引结构是根据如下方法得到的:在第i个索引结构中,第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识存储于同一向量标识集合中,且该向量标识集合的索引为该第i个子向量;并将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为该向量标识集合的索引,并存储到第i个索引结构的索引集中。具体地,将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;并将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量作为Key,对应上述相同的第i个子向量的向量标识集合作为对应该Key的Value,从而构建出Key/Value结构的分段索引中的第i个索引结构。其中,i可以是1~k中的任意一个自然数。
在构建了上述的分段索引的k个索引结构后,基于该分段索引,本发明实施例所提供的多媒体信息检索方法,具体流程图如图4所示,具体包括如下步骤:
S401:提取出当前多媒体信息的特征数据,采用哈希方法将当前多媒体信息的特征数据转换成离散的n维比特向量,得到当前多媒体信息的特征比特向量。
S402:将所述当前多媒体信息的特征比特向量进行均匀分割,得到所述当前多媒体信息的k个子向量。
具体地,所述当前多媒体信息的第i个子向量由所述当前多媒体信息的特征比特向量均匀分割后的第i组元素组成,其中第i组元素具体包括当前多媒体信息的特征比特向量中的第(i-1)×m+1个元素~第i×m个元素;其中i为1~k的自然数,m为每个子向量(或每组元素)中的向量元素个数;
S403:针对所述当前多媒体信息的每个子向量,分别确定对应该子向量的候选集合。
具体地,针对当前多媒体信息的各子向量,分别确定出对应的候选集合,从而确定出k个候选集合;其中,在确定对应当前多媒体信息的第i个子向量的候选集合的过程中,对于所述当前多媒体信息的第i个子向量,其对应的候选集合根据如下方法确定:在第i个索引结构的索引集中查找出与该待检索多媒体信息的第i个子向量相同的索引,并将查找出的索引所对应的向量标识集合作为对应所述当前多媒体信息的第i个子向量的候选集合。
S404:对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量。
具体地,对于上述步骤S403中得到的对应当前多媒体信息的各子向量的候选集合,即k个候选集合,在多媒体特征数据库中查找出对应候选集合中的各向量标识的特征比特向量。
作为一种更优的实施方式,考虑到上述步骤S403中得到的各候选集合中可能存在一些重复的向量标识;因此,可以先将得到的k个候选集合进行并集操作后,得到候选合并集合;对于所述候选合并集合中的每个向量标识,在所述多媒体特征数据库中查找出对应该向量标识的特征比特向量。具体地,以候选合并集合中的每个向量标识作为Key,去多媒体特征库中查找对应该Key的Value,即为与所述每个候选向量标识对应的特征比特向量。
S405:计算所述当前多媒体信息的特征比特向量与查找到的特征比特向量之间的汉明距离。
S406:将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出。
具体地,符合设定条件的特征比特向量具体可以是:与所述当前多媒体信息的特征比特向量的汉明距离小于等于q的特征比特向量;较优地,上述的k大于q,即q小于等于k,这样可以保证不会出现漏检,即符合设定条件的特征比特向量的向量标识都包括在候选集合中。
以在128维的待检索多媒体信息的特征比特向量中,查找与当前多媒体信息特征比特向量汉明距离小于等于3(q)为例,本发明通过对待检索多媒体信息建立4(k=q+1)个键值Key/Value结构的分段索引,查找到与当前多媒体信息的特征比特向量中32(m)个元素相同的特征比特向量,再计算上述查找到的特征比特向量与当前多媒体信息的特征比特向量间的汉明距离,此时参与汉明距离计算的特征比特向量有2128-32+2=298个,而现有技术中采用分块有序表查找与当前多媒体信息的特征比特向量中前p个元素相同的特征比特向量,再计算上述查找到的特征比特向量与当前多媒体信息的特征比特向量间的汉明距离,由于p不能是一个较大的数——若p值较大将导致漏检数量较大;因此,p通常为一个较小的数,例如小于等于3,此时参与汉明距离计算的特征比特向量至少有2128-3-1=2124个;虽然利用有序表可以在一定程度上便于汉明距离计算中的比特位的比较,但是由于现有技术中参与汉明距离计算的特征比特向量的倍数是本发明技术中参与汉明距离计算的特征比特向量的226倍,数量差距巨大;
事实上,上述的m是由k决定的:m=n/k,其中,n为特征比特向量的维数,对于高维特征比特向量,n通常为100以上的值;而k则是比q稍大的一个数;通常,为满足检索要求,本领域技术人员通常将汉明距离q值设置为一个较小的数,比如小于3或4的数;因此,通常m至少为两位数,甚至更大。而现有技术中为了避免出现过多漏检的情况,p值设定不能过大,通常要小于或等于q值;
因此,由于本发明中参与汉明距离计算的32(m)个元素相同的特征比特向量的个数,要远小于现有技术中的参与汉明距离计算的3(p)个元素相同的特征比特向量的个数,从而大大减小了参与汉明距离计算的特征比特向量的数量,以减小运算量,提高检索速度和效率。
此外,为了检索的可持续性,现有技术的检索方法中,在检索出多媒体后,还需将当前多媒体信息的特征比特向量插入到有序表中,作为待检索的多媒体的特征比特向量以备下次检索。而将特征比特向量插入到有序表中的计算过程,也是计算量非常大;
而本发明的检索方法中,为了检索的可持续性,只需要根据当前多媒体信息的各子向量,将当前多媒体信息的特征比特向量的向量标识划分到k个索引结构中的相对应的向量标识集合中,并将当前多媒体信息的特征比特向量及其向量标识插入到多媒体特征数据库中,此计算量远小于现有技术的将特征比特向量与有序表中海量的特征比特向量进行比较、排序的计算量,从而大大提高检索速度、检索效率。
上述将当前多媒体信息的特征比特向量的向量标识划分到k个索引结构中的相对应的向量标识集合的具体过程可以是:将当前多媒体信息的特征比特向量的向量标识划分(插入)到上述得到的k个候选集合中。
对于在检索过程中,若k个索引结构中的第i个索引结构,其索引中不存在当前多媒体信息的第i子向量,则将当前多媒体信息的第i子向量作为第i个索引结构的索引进行存储,并创建包含当前多媒体信息的特征比特向量的向量标识的向量标识集合,将创建的向量标识集合对应该索引存储到第i个索引结构中。
若所述当前多媒体信息的数据被删除,则将当前多媒体信息的特征比特向量及其向量标识从多媒体特征数据库中删除,并将k个索引结构中的k个候选集合中的当前多媒体信息的特征比特向量的向量标识删除。
基于上述的检索方法,本发明实施例提供的一种多媒体信息检索系统,如图5所示,包括:检索装置501和数据库索引结构构建装置502;
其中,检索装置501包括:特征比特向量确定模块511、特征比特向量分割模块512、候选集合确定模块513、特征比特向量查找模块514、汉明距离计算模块515以及检索结果输出模块516。
特征比特向量确定模块511用于提取当前多媒体信息的特征数据,根据提取的特征数据得到所述当前多媒体信息的特征比特向量。
特征比特向量分割模块512用于对特征比特向量确定模块511得到的特征比特向量进行均匀分割,得到所述当前多媒体信息的k个子向量,其中第i个子向量由所述特征比特向量分割后的第i组元素组成;i为1~k的自然数;
候选集合确定模块513用于针对所述特征比特向量分割模块得到的当前多媒体信息的每个子向量,分别确定对应该子向量的候选集合;其中,针对第i个子向量确定其对应的候选集合具体过程包括:在预先确定的第i个索引结构的索引集中查找出与该第i个子向量相同的索引,并将查找出的索引所对应的向量标识集合作为对应该第i个子向量的候选集合;其中,第i个索引结构中,第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识存储于同一向量标识集合中,且该向量标识集合的索引为该第i个子向量。
特征比特向量查找模块514用于对于候选集合确定模块513得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量。
汉明距离计算模块515用于计算所述当前多媒体信息的特征比特向量与特征比特向量查找模块514查找到的特征比特向量之间的汉明距离。
检索结果输出模块516用于根据汉明距离计算模块515计算的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体作为检索结果输出。
其中,数据库索引结构构建装置502包括:多媒体特征数据库建立模块521和索引结构构建模块522。
多媒体特征数据库建立模块521用于存储待检索多媒体信息的特征比特向量及其向量标识。
索引结构构建模块522用于构建k个索引结构,其中第i个索引结构是采用如下方法构建:针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行均匀分割,得到该待检索多媒体信息的k个子向量;其中,该待检索多媒体信息的第i个子向量由该待检索多媒体信息的特征比特向量中的第i组元素组成;i为1~k的自然数;将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;并将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为该向量标识集合的索引,并存储到第i个索引结构的索引集中。
上述的特征比特向量查找模块514中的内部结构框图如图6所示,具体包括:候选集合合并单元601和向量查找单元602。
候选集合合并单元601用于将候选集合确定模块513得到的候选集合进行并集操作后,得到候选合并集合;
向量查找单元602用于对于所述候选合并集合中的每个向量标识,在所述多媒体特征数据库中查找出对应该向量标识的特征比特向量。
上述的索引结构构建模块522中的内部结构框图如图7所示,具体包括:特征比特向量分割单元701、向量标识集合划分单元702、索引建立单元703。
特征比特向量分割单元701针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行均匀分割,得到该待检索多媒体信息的k个子向量;
向量标识集合划分单元702在构建第i个索引结构时,对于特征比特向量分割单元701得到的每个待检索多媒体信息的k个子向量,将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;
索引建立单元703在构建第i个索引结构时,对于向量标识集合划分单元702划分出的向量标识集合,将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为对应该向量标识集合的子向量,并作为第i个索引结构中的索引进行存储。
本发明的技术方案中,通过对待检索多媒体信息建立k个分段索引结构,查找与当前多媒体信息的特征比特向量中m个元素相同的特征比特向量参与汉明距离计算,相比于现有技术中采用分块有序表查找与当前多媒体信息的特征比特向量中前p个元素相同的特征比特向量参与汉明距离计算,本发明方案可以大大减少参与汉明距离计算的特征比特向量个数,从而大大减少了一次检索过程中的计算量,达到提高检索速度和效率的目的。
进一步,本发明的检索方法中,为了检索的可持续性,只需要根据当前多媒体信息的各子向量,将当前多媒体信息的特征比特向量的向量标识划分到k个索引结构中的相对应的向量标识集合中,此计算量远小于现有技术的将特征比特向量与有序表中海量的特征比特向量进行比较、排序的计算量,从而大大提高检索速度、检索效率。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种多媒体信息检索方法,其特征在于,包括:
提取当前多媒体信息的特征数据,将提取的特征数据转换为特征比特向量后,对其进行均匀分割,得到k个子向量,其中第i个子向量由所述特征比特向量均匀分割后的第i组元素组成;i为1~k的自然数;
分别确定对应所述当前多媒体信息的各子向量的候选集合,其中,针对第i个子向量,具体过程包括:在预先确定的第i个索引结构的索引集中查找出与该第i个子向量相同的索引,并将查找出的索引所对应的向量标识集合作为对应该第i个子向量的候选集合;其中,第i个索引结构中,第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识存储于同一向量标识集合中,且该向量标识集合的索引为该第i个子向量;
对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量;并计算所述当前多媒体信息的特征比特向量与查找到的特征比特向量之间的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出;其中,
第i个索引结构的确定方法,包括:
针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行均匀分割,得到该待检索多媒体信息的k个子向量;其中,该待检索多媒体信息的第i个子向量由所述特征比特向量分割后的第i组元素组成;i为1~k的自然数;
将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;并将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为该向量标识集合的索引,并存储到第i个索引结构的索引集中。
2.如权利要求1所述的方法,其特征在于,所述对于得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量,具体包括:
将得到的候选集合进行并集操作后,得到候选合并集合;
对于所述候选合并集合中的每个向量标识,在所述多媒体特征数据库中查找出对应该向量标识的特征比特向量。
3.如权利要求1或2所述的方法,其特征在于,所述汉明距离符合设定条件的特征比特向量具体为:与所述当前多媒体信息的特征比特向量的汉明距离小于等于q的特征比特向量,其中,所述q小于等于k。
4.如权利要求3所述的方法,其特征在于,第i个索引结构具体为键/值Key/Value形式结构;其中,所述相同的第i个子向量作为Key,对应所述相同的第i个子向量的向量标识集合作为对应该Key的Value。
5.一种多媒体信息检索系统,其特征在于,包括:
特征比特向量确定模块,用于提取当前多媒体信息的特征数据,根据提取的特征数据得到所述当前多媒体信息的特征比特向量;
特征比特向量分割模块,用于对所述特征比特向量确定模块得到的特征比特向量进行均匀分割,得到所述当前多媒体信息的k个子向量,其中第i个子向量由所述特征比特向量分割后的第i组元素组成;i为1~k的自然数;
候选集合确定模块,用于针对所述特征比特向量分割模块得到的当前多媒体信息的每个子向量,分别确定对应该子向量的候选集合;其中,针对第i个子向量确定其对应的候选集合具体过程包括:在预先确定的第i个索引结构的索引集中查找出与该第i个子向量相同的索引,并将查找出的索引所对应的向量标识集合作为对应该第i个子向量的候选集合;其中,第i个索引结构中,第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识存储于同一向量标识集合中,且该向量标识集合的索引为该第i个子向量;
特征比特向量查找模块,用于对于所述候选集合确定模块得到的候选集合中的各向量标识,分别在多媒体特征数据库中查找出对应的特征比特向量;
汉明距离计算模块,用于计算所述当前多媒体信息的特征比特向量与所述特征比特向量查找模块查找到的特征比特向量之间的汉明距离;
检索结果输出模块,用于根据所述汉明距离计算模块计算的汉明距离,将汉明距离符合设定条件的特征比特向量所对应的多媒体信息作为检索结果输出;
索引结构构建模块,用于构建k个索引结构,其中第i个索引结构是采用如下方法构建:针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行均匀分割,得到该待检索多媒体信息的k个子向量;其中,该待检索多媒体信息的第i个子向量由该待检索多媒体信息的特征比特向量中的第i组元素组成;i为1~k的自然数;将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;并将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为该向量标识集合的索引,并存储到第i个索引结构的索引集中。
6.如权利要求5所述的系统,其特征在于,所述索引结构构建模块具体包括:
特征比特向量分割单元,用于针对每个待检索多媒体信息,将该待检索多媒体信息的特征比特向量进行分割,得到该待检索多媒体信息的k个子向量;
向量标识集合划分单元,用于在构建第i个索引结构时,将第i个子向量相同的待检索多媒体信息的特征比特向量的向量标识划分到同一向量标识集合中;
索引建立单元,用于在构建第i个索引结构时,对于所述向量标识集合划分单元划分出的向量标识集合,将该向量标识集合中的向量标识所对应的特征比特向量中的相同的第i个子向量,作为对应该向量标识集合的子向量,并作为第i个索引结构中的索引进行存储。
7.如权利要求5所述的系统,其特征在于,所述特征比特向量查找模块具体包括:
候选集合合并单元,将所述候选集合确定模块得到的候选集合进行并集操作后,得到候选合并集合;
向量查找单元,用于对于所述候选合并集合中的每个向量标识,在所述多媒体特征数据库中查找出对应该向量标识的特征比特向量。
8.如权利要求5-7任一所述的系统,其特征在于,所述汉明距离符合设定条件的特征比特向量具体为:
与所述当前多媒体信息的特征比特向量的汉明距离小于等于q的特征比特向量,其中,所述q小于等于k。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310264225.3A CN103345496B (zh) | 2013-06-28 | 2013-06-28 | 多媒体信息检索方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310264225.3A CN103345496B (zh) | 2013-06-28 | 2013-06-28 | 多媒体信息检索方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103345496A CN103345496A (zh) | 2013-10-09 |
CN103345496B true CN103345496B (zh) | 2016-12-28 |
Family
ID=49280291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310264225.3A Active CN103345496B (zh) | 2013-06-28 | 2013-06-28 | 多媒体信息检索方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103345496B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015165037A1 (zh) * | 2014-04-29 | 2015-11-05 | 中国科学院自动化研究所 | 一种基于级联二值编码的图像匹配方法 |
CN104991959B (zh) * | 2015-07-21 | 2019-11-05 | 北京京东尚科信息技术有限公司 | 一种基于内容检索相同或相似图像的方法与系统 |
CN105095435A (zh) | 2015-07-23 | 2015-11-25 | 北京京东尚科信息技术有限公司 | 一种图像高维特征的相似比较方法及装置 |
CN105959224B (zh) * | 2016-06-24 | 2019-01-15 | 西安电子科技大学 | 基于比特向量的高速路由查找装置及方法 |
CN106980656B (zh) * | 2017-03-10 | 2018-07-10 | 北京大学 | 一种基于二值码字典树的搜索方法 |
CN108628892B (zh) * | 2017-03-21 | 2020-11-20 | 北京京东尚科信息技术有限公司 | 有序数据存储的方法、装置、电子设备和可读存储介质 |
CN110149529B (zh) * | 2018-11-01 | 2021-05-28 | 腾讯科技(深圳)有限公司 | 媒体信息的处理方法、服务器及存储介质 |
CN109753576A (zh) * | 2018-12-25 | 2019-05-14 | 上海七印信息科技有限公司 | 一种相似图像检索方法 |
TWI703459B (zh) * | 2019-07-25 | 2020-09-01 | 中華電信股份有限公司 | 用於可定址索引之搜尋系統及搜尋方法 |
CN112464011A (zh) * | 2019-09-06 | 2021-03-09 | 华为技术有限公司 | 数据检索方法及装置 |
CN111738194B (zh) * | 2020-06-29 | 2024-02-02 | 深圳力维智联技术有限公司 | 一种用于人脸图像相似性的评价方法和装置 |
CN112445934B (zh) * | 2021-02-01 | 2021-04-20 | 北京远鉴信息技术有限公司 | 语音检索方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987456A (en) * | 1997-10-28 | 1999-11-16 | University Of Masschusetts | Image retrieval by syntactic characterization of appearance |
CN1477563A (zh) * | 2003-07-03 | 2004-02-25 | 复旦大学 | 一种高维矢量数据快速相似检索方法 |
CN102486800A (zh) * | 2010-12-01 | 2012-06-06 | 财团法人工业技术研究院 | 视频搜索方法、系统及建立视频数据库的方法 |
-
2013
- 2013-06-28 CN CN201310264225.3A patent/CN103345496B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987456A (en) * | 1997-10-28 | 1999-11-16 | University Of Masschusetts | Image retrieval by syntactic characterization of appearance |
CN1477563A (zh) * | 2003-07-03 | 2004-02-25 | 复旦大学 | 一种高维矢量数据快速相似检索方法 |
CN102486800A (zh) * | 2010-12-01 | 2012-06-06 | 财团法人工业技术研究院 | 视频搜索方法、系统及建立视频数据库的方法 |
Non-Patent Citations (1)
Title |
---|
基于子向量距离索引的高维图像特征匹配算法;赵嵩 等;《计算机工程与应用》;20130131;第49卷(第2期);第237-241页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103345496A (zh) | 2013-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103345496B (zh) | 多媒体信息检索方法和系统 | |
US11048966B2 (en) | Method and device for comparing similarities of high dimensional features of images | |
Almodaresi et al. | A space and time-efficient index for the compacted colored de Bruijn graph | |
CN108038183B (zh) | 结构化实体收录方法、装置、服务器和存储介质 | |
Yang et al. | Scalable mobile image retrieval by exploring contextual saliency | |
CN109947904B (zh) | 一种基于Spark环境的偏好空间Skyline查询处理方法 | |
KR101266358B1 (ko) | 다중 길이 시그니처 파일 기반 분산 색인 시스템 및 방법 | |
CN109710792B (zh) | 一种基于索引的快速人脸检索系统应用 | |
CN106033416A (zh) | 一种字符串处理方法及装置 | |
CN105653700A (zh) | 视频检索方法及系统 | |
CN104573130A (zh) | 基于群体计算的实体解析方法及装置 | |
KR20090065130A (ko) | 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템 | |
CN105808709A (zh) | 人脸识别快速检索方法及装置 | |
CN105574212A (zh) | 一种多索引磁盘哈希结构的图像检索方法 | |
CN108549696B (zh) | 一种基于内存计算的时间序列数据相似性查询方法 | |
Liu et al. | An image-based near-duplicate video retrieval and localization using improved edit distance | |
CN102902826A (zh) | 一种基于基准图像索引的图像快速检索方法 | |
CN106570166B (zh) | 一种基于多个局部敏感哈希表的视频检索方法及装置 | |
CN103631769A (zh) | 一种判断文件内容与标题间一致性的方法及装置 | |
CN114817651B (zh) | 数据存储方法、数据查询方法、装置和设备 | |
CN110598122B (zh) | 社交群体挖掘方法、装置、设备及存储介质 | |
CN104778234A (zh) | 基于局部敏感哈希技术的多标记文件近邻查询方法 | |
CN115563058A (zh) | 基于要素提取的相似案件检索方法 | |
Werner | BACR: Set similarities with lower bounds and application to spatial trajectories | |
CN111737461A (zh) | 文本的处理方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230418 Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193 Patentee after: Sina Technology (China) Co.,Ltd. Address before: 100080, International Building, No. 58 West Fourth Ring Road, Haidian District, Beijing, 20 floor Patentee before: Sina.com Technology (China) Co.,Ltd. |
|
TR01 | Transfer of patent right |