CN107145816A - 对象识别跟踪方法及装置 - Google Patents
对象识别跟踪方法及装置 Download PDFInfo
- Publication number
- CN107145816A CN107145816A CN201710103294.4A CN201710103294A CN107145816A CN 107145816 A CN107145816 A CN 107145816A CN 201710103294 A CN201710103294 A CN 201710103294A CN 107145816 A CN107145816 A CN 107145816A
- Authority
- CN
- China
- Prior art keywords
- detection block
- identification
- identity
- information
- object identity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/30—Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种对象识别跟踪方法及装置,所述方法包括:在视频流中获取待识别的当前帧图像;检测所述当前帧图像中的识别对象,得到检测框列表;针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围;如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。本发明无需识别第一检测框和第二检测框中识别对象的图像,即可确定第一检测框中的识别对象的对象标识,并且节省用户等待图像识别结果的时间,提高对视频流中各个帧图像中识别对象进行识别的效率。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种对象识别跟踪方法及装置。
背景技术
基于视频流的对象识别系统用于识别视频流中出现的对象并在对象的周围标注出对象信息。为了实现对象识别和信息标注,对象识别系统首先检测出每一帧画面中所有待检对象出现的位置,通过特定的对象识别的算法识别每一帧画面中的所有对象,再在对象特征数据库中检索每一个对象相关的信息,最后将对象相关的信息标注在对应的对象周围。
当视频流中出现的对象数目较多的时候,视频流中的每一帧画面相对于前一帧画面,对象的数量可能会发生变化,同一个对象的位置也可能会发生变化,为了准确地标注对象信息,对象识别系统会针对每一帧都执行上述检测、识别和检索的操作,计算量非常大,又由于目前视频的帧率都很高,导致运行对象识别和检索过程的本地设备或远程服务器的计算压力和存储压力非常大。
发明内容
为克服相关技术中存在的问题,本发明提供一种对象识别跟踪方法及装置。
根据本发明实施例的第一方面,提供一种对象识别跟踪方法,包括:
在视频流中获取待识别的当前帧图像;
检测所述当前帧图像中的识别对象,得到检测框列表,所述检测框列表用于存储包围每个所述识别对象的第一检测框的第一检测框信息;
针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围,所述对象识别信息表包括:第二检测框的第二检测框信息与对象标识之间的对应关系,所述第二检测框用于包围所述已识别帧图像中的识别对象;
如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
可选地,所述方法还包括:
如果存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值,为该第一检测框中的识别对象确定新的对象标识,所述新的对象标识与已识别帧图像中的对象标识不同;
获取与该第一检测框包围的识别对象对应的标注信息;
建立新的对象标识与所述标注信息之间的对应关系;
将该第一检测框的第一检测框信息与所述新的对象标识之间的对应关系,以及,新的对象标识和标注信息之间的对应关系添加到所述对象识别信息表中。
可选地,所述获取与该第一检测框包围的识别对象对应的标注信息包括:
向对象识别服务器发送对象识别请求,所述对象识别请求中携带所述第一检测框中识别对象的图像,以使所述对象识别服务器根据所述图像进行对象识别;
接收所述对象识别服务器返回的对象识别结果,所述对象识别结果中携带标注信息。
可选地,所述对象识别信息表中还包括:与对象标识对应的时间戳,所述时间戳在每次为识别对象确定对象标识后创建或更新,所述方法还包括:
每隔预设时间间隔,将系统的当前时间与所述对象识别信息表中的每个所述时间戳比较;
如果所述系统的当前时间与任一所述时间戳之间的差值大于第二预设阈值,在所述对象识别信息表中删除所述时间戳与对象标识之间的对应关系、对象标识与第二检测框的第二检测框信息之间的对应关系和对象标识与标注信息之间的对应关系。
可选地,所述对象识别信息表中还包括:每个识别对象在已识别帧图像中的连续出现次数,所述方法还包括:
如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,在所述对象识别信息表中查询与所述对象标识对应的标注信息;
在所述当前帧图像中所述第一检测框的预设位置处显示所述标注信息。
根据本发明实施例的第二方面,提供一种对象识别跟踪装置,包括:
第一获取模块,用于在视频流中获取待识别的当前帧图像;
检测模块,用于检测所述当前帧图像中的识别对象,得到检测框列表,所述检测框列表用于存储包围每个所述识别对象的第一检测框的第一检测框信息;
第一确定模块,用于针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围,所述对象识别信息表包括:第二检测框的第二检测框信息与对象标识之间的对应关系,所述第二检测框用于包围所述已识别帧图像中的识别对象;
第二确定模块,用于如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
可选地,所述装置还包括:
第三确定模块,用于如果存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值,为该第一检测框中的识别对象确定新的对象标识,所述新的对象标识与已识别帧图像中的对象标识不同;
第二获取模块,用于获取与该第一检测框包围的识别对象对应的标注信息;
建立模块,用于建立新的对象标识与所述标注信息之间的对应关系;
添加模块,用于将该第一检测框的第一检测框信息与所述新的对象标识之间的对应关系,以及,新的对象标识和标注信息之间的对应关系添加到所述对象识别信息表中。
可选地,所述第二获取模块,包括:
发送单元,用于向对象识别服务器发送对象识别请求,所述对象识别请求中携带所述第一检测框中识别对象的图像,以使所述对象识别服务器根据所述图像进行对象识别;
接收单元,用于接收所述对象识别服务器返回的对象识别结果,所述对象识别结果中携带标注信息。
可选地,所述对象识别信息表中还包括:与对象标识对应的时间戳,所述时间戳在每次为识别对象确定对象标识后创建或更新,所述装置还包括:
比较模块,用于每隔预设时间间隔,将系统的当前时间与所述对象识别信息表中的每个所述时间戳比较;
删除模块,用于如果所述系统的当前时间与任一所述时间戳之间的差值大于第二预设阈值,在所述对象识别信息表中删除所述时间戳与对象标识之间的对应关系、对象标识与第二检测框的第二检测框信息之间的对应关系和对象标识与标注信息之间的对应关系。
可选地,所述对象识别信息表中还包括:每个识别对象在已识别帧图像中的连续出现次数,所述装置还包括:
查询模块,用于如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,在所述对象识别信息表中查询与所述对象标识对应的标注信息;
显示模块,用于在所述当前帧图像中所述第一检测框的预设位置处显示所述标注信息。
本发明实施例提供的该方法,本发明实施例通过首先在视频流中获取待识别的当前帧图像,然后检测所述当前帧图像中的识别对象,得到检测框列表,再针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围,最后如果存在任一所述重合范围大于第一预设阈值,可以确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
本发明实施例提供的该方法,能够通过将当前帧图像中包围识别对象的第一检测框,与对象识别信息表中存储的已识别帧图像中包围识别对象的第二检测框比较重合范围,无需识别第一检测框和第二检测框中识别对象的图像,即可确定第一检测框中的识别对象的对象标识,无需针对每一个帧图像中的每一个识别对象逐一进行图像识别,即可实现识别对象的标识的确定,进而实现对视频图像中识别对象的快速跟踪,降低系统的运算压力和存储压力,并且节省用户等待图像识别结果的时间,提高对视频流中各个帧图像中识别对象进行识别和跟踪的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种对象识别跟踪方法的一种流程图;
图2是根据一示例性实施例示出的一种对象识别跟踪方法的另一种流程图;
图3是根据一示例性实施例示出的一种对象识别跟踪方法的另一种流程图;
图4是根据一示例性实施例示出的一种对象识别跟踪方法的另一种流程图;
图5是根据一示例性实施例示出的一种对象识别跟踪方法的结构示意图;
图6是本申请又一实施例提供的执行对象识别跟踪方法的电子设备的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
为了能够在视频流内跟踪每个帧图像中的识别对象时,不必每一帧均进行对象识别操作,如图1所示,在本发明的一个实施例中,提供一种对象识别跟踪方法,该对象识别跟踪方法可以应用在计算机中,所述方法可以包括以下步骤。
在步骤S101中,在视频流中获取待识别的当前帧图像。
在本发明实施例中,视频流可以指视频数据的传输,它能够被作为一个稳定的和连续的流通过网络处理,视频流中可以包括多个帧图像,待识别的当前帧图像可以指视频流中的任一帧图像,当前帧图像中可以包含至少一个识别对象,如:1个识别对象、3个识别对象或者10个识别对象等等,也可以不包含识别对象,如果当前帧图像中不包含识别对象,则可以继续进行下一帧图像的处理,无需继续识别当前帧图像中的识别对象,所以本发明实施例主要应用于当前帧图像中包含至少一个识别对象的场景。
在步骤S102中,检测所述当前帧图像中的识别对象,得到检测框列表。
在本发明实施例中,识别对象可以指人脸或者头部等,也可以指飞机或者汽车等,具体可以根据实际情况确定,本发明不做限定,所述检测框列表用于存储包围每个所述识别对象的第一检测框的第一检测框信息,识别对象的第一检测框可以指标识识别对象所在的显示区域的矩形框,例如:人脸的识别框(后文简称人脸框)等,第一检测框信息可以指第一检测框的大小和坐标等,在实际应用中第一检测框的大小可以通过第一检测框的长度、宽度或者面积等来体现,例如:人脸框的大小和坐标可以通过人脸检测算法检测当前帧图像中能包含一张人脸的矩形框的坐标位置和大小,第一检测框信息的表现形式包括但不限于以下两种方式:人脸框左上角坐标+人脸框右下角坐标,或者,人脸框左上角坐标+人脸框长度+人脸框宽度。
在该步骤中,可以使用人脸识别算法检测当前帧图像中的识别对象,可以在识别到识别对象后,生成至少一个包围识别对象的第一检测框,并记录每个第一检测框的第一检测框信息,然后将之少一个第一检测框信息存入检测框列表。
在步骤S103中,针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围。
在本发明实施例中,所述对象识别信息表包括:第二检测框的第二检测框信息与对象标识之间的对应关系,所述第二检测框用于包围所述已识别帧图像中的识别对象,在实际应用中,对象识别信息表用于存储已识别帧图像中不同的识别对象对应的第二检测框信息等,已识别帧图像可以指视频流中当前帧图像之前的帧图像,对象识别信息表可以在系统初始化时创建,随着识别的帧图像的数量的增加,其中写入的信息也随之增多,例如,在识别第一帧图像时,对象识别信息表中可以包含0个第二检测框信息与对象标识之间的对应关系,随着不断的识别帧图像,第二检测框信息与对象标识之间的对应关系的数量也随之增加,对象标识可以指唯一标识识别对象的标识,例如:人脸编号等。
在该步骤中,例如:可以首先针对当前帧图像中的标识为001的第一检测框,计算该第一检测框与根据对象识别信息表确定的每个第二检测框之间的重合范围,也就是说,可以首先计算第一检测框001与第二检测框01之间的重合范围,然后计算第一检测框001与第二检测框02之间的重合范围,再计算第一检测框001与第二检测框03之间的重合范围,……,在第一检测框001的重合范围全部确定完毕后,再计算标识为002的第一检测框与对象识别信息表中各个第二信息框计算重合范围,也就是说,可以首先计算第一检测框002与第二检测框01之间的重合范围,然后计算第一检测框002与第二检测框02之间的重合范围,再计算第一检测框002与第二检测框03之间的重合范围,……,直至每个第一检测框的重合范围全部计算完毕,第二信息框是由对象识别信息表中当前包含的对应关系内的第二检测框信息确定的,假设当前对象识别信息表中包含0个第二检测框信息,则每个第一检测框与所有第二检测框的重合面积将均为0。
在步骤S104中,如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
在本发明实施例中,第一预设阈值可以为50%或者70%等等。
在该步骤中,可以将在步骤S103中确定的每个重合范围逐个分别与第一预设阈值比较,在每出现一个大于第一预设阈值的重合范围时,可以将与计算该重合范围的第一检测框信息对应的对象标识确定为计算该重合范围的第二检测框信息对应的对象标识,例如:假设需要确定第一检测框信息对应的对象标识,第二检测框信息对应的对象标识为a,第一检测框001与第二检测框01之间的重合范围大于预设阈值,则可以确定第一检测框信息对应的对象标识也为a。
本发明实施例通过首先在视频流中获取待识别的当前帧图像,然后检测所述当前帧图像中的识别对象,得到检测框列表,再针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围,最后如果存在任一所述重合范围大于第一预设阈值,可以确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
本发明实施例提供的该方法,能够通过将当前帧图像中包围识别对象的第一检测框,与对象识别信息表中存储的已识别帧图像中包围识别对象的第二检测框比较重合范围,无需识别第一检测框和第二检测框中识别对象的图像,即可确定第一检测框中的识别对象的对象标识,无需针对每一个帧图像中的每一个识别对象逐一进行图像识别,即可实现识别对象的标识的确定,降低系统的运算压力和存储压力,并且节省用户等待图像识别结果的时间,提高对视频流中各个帧图像中识别对象进行识别的效率。
如图2所示,在本发明的又一实施例中,所述方法还包括以下步骤。
在步骤S201中,如果存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值,为该第一检测框中的识别对象确定新的对象标识。
在本发明实施例中,所述新的对象标识与已识别帧图像中的对象标识不同。
在该步骤中,假设第一检测框005与对象识别信息表中的每个第二检测框之间的重合范围均小于第一预设阈值,则可以确定该第一检测框005中的识别对象为视频流中新出现的识别对象,这时可以为该新出现的识别对象生成一个与对象识别信息表中存储的各个对象标识均不同的、新的对象标识。
在步骤S202中,获取与该第一检测框包围的识别对象对应的标注信息。
在该步骤中,如果图像识别过程在本地设备中实现,则可以在本地设备中对新的识别对象进行图像识别,然后根据图像识别结果确定该识别对象的标注信息;如果图像识别过程在服务器中实现,则可以向对象识别服务器发送对象识别请求,所述对象识别请求中携带所述第一检测框中识别对象的图像,以使所述对象识别服务器根据所述图像进行对象识别;然后接收所述对象识别服务器返回的对象识别结果,所述对象识别结果中携带标注信息。
在步骤S203中,建立新的对象标识与所述标注信息之间的对应关系。
在步骤S204中,将该第一检测框的第一检测框信息与所述新的对象标识之间的对应关系,以及,新的对象标识和标注信息之间的对应关系添加到所述对象识别信息表中。
本发明实施例通过在存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值时,为该第一检测框中的识别对象确定新的对象标识,然后获取与该第一检测框包围的识别对象对应的标注信息,再建立新的对象标识与所述标注信息之间的对应关系,最后将该第一检测框的第一检测框信息与所述新的对象标识之间的对应关系,以及,新的对象标识和标注信息之间的对应关系添加到所述对象识别信息表中。
本发明实施例提供的该方法,能够对视频流中新的识别对象生成对象标识,获取新的识别对象的标注信息,然后将新的识别对象的对象标识和标注信息分别对应的存储到对象识别信息表中,以便于识别当前帧图像之后的下一帧图像中的识别对象时使用。
在实际应用中,假设在第n帧中,检测出了一个对象,但是第n+1帧中,尽管这个对象还在画面中,但是因为种种原因检测算法并没有检测出这个对象,所以这个对象对应的检测框会在画面中消失;然而,在第n+2帧中,算法再次成功地检测出了这个对象。为了过滤掉这种偶发的算法失败的检测,并且便于正确地处理对象真正消失的情况,如图3所示,在本发明的又一实施例中,增加了超时检测的机制,所述对象识别信息表中还包括:与对象标识对应的时间戳,所述时间戳在每次为识别对象确定对象标识后创建或更新,在实际应用中,可以在步骤S104:如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同之后,更新该对象标识的时间戳;或者,在步骤S201:如果存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值,为该第一检测框中的识别对象确定新的对象标识之后,创建时间戳,所述方法还包括:
在步骤S301中,每隔预设时间间隔,将系统的当前时间与所述对象识别信息表中的每个所述时间戳比较。
在步骤S302中,如果所述系统的当前时间与任一所述时间戳之间的差值大于第二预设阈值,在所述对象识别信息表中删除所述时间戳与对象标识之间的对应关系、对象标识与第二检测框的第二检测框信息之间的对应关系和对象标识与标注信息之间的对应关系。
在本发明实施例中,设置第二预设阈值可以用于筛选时间过期的识别对象,在本发明的一个实施例中,由于摄像头的图像帧率一般是30帧每秒,每帧33毫秒,假定连续10帧没有检测出对象,超时时间就是333毫秒,因此,在这种应用场景下,第二预设阈值应大于333毫秒,例如,第二预设阈值可以取值为500毫秒等,以上举例仅用于解释本发明,不对本发明的保护范围做出限定。
在该步骤中,可以在计算得到的任一时间差大于第二预设阈值时,在对象识别信息表中删除计算与该时间差的时间戳对应的对象标识相关联的多个对应关系,例如,在正常情况下,超过500毫秒还没有检测出对象,可以认为识别对象已经在画面中消失,可以删除该识别对象的对象标识以及对象标识相关联的多个对应关系。
本发明实施例通过将系统的当前时间与所述对象识别信息表中的每个所述时间戳比较,如果所述系统的当前时间与任一所述时间戳之间的差值大于第二预设阈值,在所述对象识别信息表中删除所述时间戳与对象标识之间的对应关系、对象标识与第二检测框的第二检测框信息之间的对应关系和对象标识与标注信息之间的对应关系。
本发明实施例提供的该方法,能够将超过第二预设阈值的时间戳对应的对象标识,以及包含对象标识的各种对应关系删除,也就是说,每一个识别对象的相关信息的存在时间在超过第二预设阈值之后才会被判定为该识别对象在画面中消失,降低人脸检测操作误判 (例如算法检测失误导致的有任一帧检测失败,没有检测出对象)的影响,降低人脸识别的次数,提升了检测框在画面中显示的稳定性。
如图4所示,在本发明的又一实施例中,所述对象识别信息表中还包括:每个识别对象在已识别帧图像中的连续出现次数,所述方法还包括:
在步骤S401中,如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,在所述对象识别信息表中查询与所述对象标识对应的标注信息。
在本发明实施例中,识别对象在已识别帧图像中的连续出现次数,可以在识别每个帧图像时,识别对象每连续出现一次,连续出现次数加1,例如:假设识别对象a在第200帧中第一次出现,并且在之后的第201帧、第202帧……第209帧均出现,则可以确定识别对象a的连续出现次数为10帧,在例如:假设识别对象b在第5帧第一次出现,在之后的所有帧中不再出现,则可以确定识别对象b的连续出现次数为1次;第三预设阈值可以设置为较小的数值,以筛选掉连续出现次数过小的识别对象。
在该步骤中,如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,可以根据对象标识在对象识别信息表中查询对应的标注信息。
在步骤S402中,在所述当前帧图像中所述第一检测框的预设位置处显示所述标注信息。
在该步骤中,可以在当前帧图像中与对象标识对应的第一检测框周围预设位置处显示标注信息,预设位置处可以为第一检测框的右上角等。
本发明实施例通过如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,在所述对象识别信息表中查询与所述对象标识对应的标注信息,在所述当前帧图像中所述第一检测框的预设位置处显示所述标注信息。
本发明实施例提供的该方法,能够在识别对象连续出现次数超过第三预设阈值、并且系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,才发判定识别对象的有效性,降低人脸检测操作误判的影响,降低人脸识别的次数,提升画面显示的稳定性。
如图5所示,在本发明的又一实施例中,提供一种对象识别跟踪装置,包括:第一获取模块11、检测模块12、第一确定模块13和第二确定模块14;
第一获取模块11,用于在视频流中获取待识别的当前帧图像;
检测模块12,用于检测所述当前帧图像中的识别对象,得到检测框列表,所述检测框列表用于存储包围每个所述识别对象的第一检测框的第一检测框信息;
第一确定模块13,用于针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围,所述对象识别信息表包括:第二检测框的第二检测框信息与对象标识之间的对应关系,所述第二检测框用于包围所述已识别帧图像中的识别对象;
第二确定模块14,用于如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
在本发明的又一实施例中,所述装置还包括:
第三确定模块,用于如果存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值,为该第一检测框中的识别对象确定新的对象标识,所述新的对象标识与已识别帧图像中的对象标识不同;
第二获取模块,用于获取与该第一检测框包围的识别对象对应的标注信息;
建立模块,用于建立新的对象标识与所述标注信息之间的对应关系;
添加模块,用于将该第一检测框的第一检测框信息与所述新的对象标识之间的对应关系,以及,新的对象标识和标注信息之间的对应关系添加到所述对象识别信息表中。
在本发明的又一实施例中,所述第二获取模块,包括:
发送单元,用于向对象识别服务器发送对象识别请求,所述对象识别请求中携带所述第一检测框中识别对象的图像,以使所述对象识别服务器根据所述图像进行对象识别;
接收单元,用于接收所述对象识别服务器返回的对象识别结果,所述对象识别结果中携带标注信息。
在本发明的又一实施例中,所述对象识别信息表中还包括:与对象标识对应的时间戳,所述时间戳在每次为识别对象确定对象标识后创建或更新,所述装置还包括:
比较模块,用于每隔预设时间间隔,将系统的当前时间与所述对象识别信息表中的每个所述时间戳比较;
删除模块,用于如果所述系统的当前时间与任一所述时间戳之间的差值大于第二预设阈值,在所述对象识别信息表中删除所述时间戳与对象标识之间的对应关系、对象标识与第二检测框的第二检测框信息之间的对应关系和对象标识与标注信息之间的对应关系。
在本发明的又一实施例中,所述对象识别信息表中还包括:每个识别对象在已识别帧图像中的连续出现次数,所述装置还包括:
查询模块,用于如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,在所述对象识别信息表中查询与所述对象标识对应的标注信息;
显示模块,用于在所述当前帧图像中所述第一检测框的预设位置处显示所述标注信息。
图6是本申请又一实施例提供的执行对象识别跟踪方法的电子设备的硬件结构示意图,如图6所示,该设备包括:
一个或多个处理器610以及存储器620,图6中以一个处理器610为例。
执行对象识别跟踪方法的设备还可以包括:输入装置630和输出装置640。
处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。
存储器620作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的对象识别跟踪方法对应的程序指令/模块(例如,附图5所示的第一获取模块11、检测模块12、第一确定模块 13和第二确定模块14)。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例对象识别跟踪方法。
存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据对象识别跟踪装置的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至对象识别跟踪装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置630可接收输入的数字或字符信息,以及产生与对象识别跟踪装置的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器620中,当被所述一个或者多个处理器610执行时,执行上述任意方法实施例中的对象识别跟踪方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种对象识别跟踪方法,其特征在于,包括:
在视频流中获取待识别的当前帧图像;
检测所述当前帧图像中的识别对象,得到检测框列表,所述检测框列表用于存储包围每个所述识别对象的第一检测框的第一检测框信息;
针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围,所述对象识别信息表包括:第二检测框的第二检测框信息与对象标识之间的对应关系,所述第二检测框用于包围所述已识别帧图像中的识别对象;
如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
2.根据权利要求1所述的对象识别跟踪方法,其特征在于,所述方法还包括:
如果存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值,为该第一检测框中的识别对象确定新的对象标识,所述新的对象标识与已识别帧图像中的对象标识不同;
获取与该第一检测框包围的识别对象对应的标注信息;
建立新的对象标识与所述标注信息之间的对应关系;
将该第一检测框的第一检测框信息与所述新的对象标识之间的对应关系,以及,新的对象标识和标注信息之间的对应关系添加到所述对象识别信息表中。
3.根据权利要求2所述的对象识别跟踪方法,其特征在于,所述获取与该第一检测框包围的识别对象对应的标注信息包括:
向对象识别服务器发送对象识别请求,所述对象识别请求中携带所述第一检测框中识别对象的图像,以使所述对象识别服务器根据所述图像进行对象识别;
接收所述对象识别服务器返回的对象识别结果,所述对象识别结果中携带标注信息。
4.根据权利要求3所述的对象识别跟踪方法,其特征在于,所述对象识别信息表中还包括:与对象标识对应的时间戳,所述时间戳在每次为识别对象确定对象标识后创建或更新,所述方法还包括:
每隔预设时间间隔,将系统的当前时间与所述对象识别信息表中的每个所述时间戳比较;
如果所述系统的当前时间与任一所述时间戳之间的差值大于第二预设阈值,在所述对象识别信息表中删除所述时间戳与对象标识之间的对应关系、对象标识与第二检测框的第二检测框信息之间的对应关系和对象标识与标注信息之间的对应关系。
5.根据权利要求4所述的对象识别跟踪方法,其特征在于,所述对象识别信息表中还包括:每个识别对象在已识别帧图像中的连续出现次数,所述方法还包括:
如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,在所述对象识别信息表中查询与所述对象标识对应的标注信息;
在所述当前帧图像中所述第一检测框的预设位置处显示所述标注信息。
6.一种对象识别跟踪装置,其特征在于,包括:
第一获取模块,用于在视频流中获取待识别的当前帧图像;
检测模块,用于检测所述当前帧图像中的识别对象,得到检测框列表,所述检测框列表用于存储包围每个所述识别对象的第一检测框的第一检测框信息;
第一确定模块,用于针对所述当前帧图像中的每个第一检测框,确定所述第一检测框与预设的对象识别信息表中存储的每个第二检测框之间的重合范围,所述对象识别信息表包括:第二检测框的第二检测框信息与对象标识之间的对应关系,所述第二检测框用于包围所述已识别帧图像中的识别对象;
第二确定模块,用于如果存在任一所述重合范围大于第一预设阈值,确定该第一检测框信息对应的对象标识与所述第二检测框信息对应的对象标识相同。
7.根据权利要求6所述的对象识别跟踪装置,其特征在于,所述装置还包括:
第三确定模块,用于如果存在任一第一检测框,该第一检测框与每个第二检测框之间的重合范围均小于所述第一预设阈值,为该第一检测框中的识别对象确定新的对象标识,所述新的对象标识与已识别帧图像中的对象标识不同;
第二获取模块,用于获取与该第一检测框包围的识别对象对应的标注信息;
建立模块,用于建立新的对象标识与所述标注信息之间的对应关系;
添加模块,用于将该第一检测框的第一检测框信息与所述新的对象标识之间的对应关系,以及,新的对象标识和标注信息之间的对应关系添加到所述对象识别信息表中。
8.根据权利要求7所述的对象识别跟踪装置,其特征在于,所述第二获取模块,包括:
发送单元,用于向对象识别服务器发送对象识别请求,所述对象识别请求中携带所述第一检测框中识别对象的图像,以使所述对象识别服务器根据所述图像进行对象识别;
接收单元,用于接收所述对象识别服务器返回的对象识别结果,所述对象识别结果中携带标注信息。
9.根据权利要求8所述的对象识别跟踪装置,其特征在于,所述对象识别信息表中还包括:与对象标识对应的时间戳,所述时间戳在每次为识别对象确定对象标识后创建或更新,所述装置还包括:
比较模块,用于每隔预设时间间隔,将系统的当前时间与所述对象识别信息表中的每个所述时间戳比较;
删除模块,用于如果所述系统的当前时间与任一所述时间戳之间的差值大于第二预设阈值,在所述对象识别信息表中删除所述时间戳与对象标识之间的对应关系、对象标识与第二检测框的第二检测框信息之间的对应关系和对象标识与标注信息之间的对应关系。
10.根据权利要求9所述的对象识别跟踪装置,其特征在于,所述对象识别信息表中还包括:每个识别对象在已识别帧图像中的连续出现次数,所述装置还包括:
查询模块,用于如果所述连续出现次数大于第三预设阈值,且所述系统的当前时间与任一所述时间戳之间的差值小于或者等于第二预设阈值,在所述对象识别信息表中查询与所述对象标识对应的标注信息;
显示模块,用于在所述当前帧图像中所述第一检测框的预设位置处显示所述标注信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710103294.4A CN107145816A (zh) | 2017-02-24 | 2017-02-24 | 对象识别跟踪方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710103294.4A CN107145816A (zh) | 2017-02-24 | 2017-02-24 | 对象识别跟踪方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107145816A true CN107145816A (zh) | 2017-09-08 |
Family
ID=59783740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710103294.4A Pending CN107145816A (zh) | 2017-02-24 | 2017-02-24 | 对象识别跟踪方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107145816A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052949A (zh) * | 2017-12-08 | 2018-05-18 | 广东美的智能机器人有限公司 | 物品类别统计方法、系统、计算机设备和可读存储介质 |
CN109191839A (zh) * | 2018-09-13 | 2019-01-11 | 江南大学 | 基于深度学习的车辆分类与计数方法 |
CN109714623A (zh) * | 2019-03-12 | 2019-05-03 | 北京旷视科技有限公司 | 图像展示方法、装置、电子设备及计算机可读存储介质 |
CN109726652A (zh) * | 2018-12-19 | 2019-05-07 | 杭州叙简科技股份有限公司 | 一种基于卷积神经网络检测值班人员睡觉行为的方法 |
CN109740518A (zh) * | 2018-12-29 | 2019-05-10 | 上海依图网络科技有限公司 | 一种视频中对象的确定方法及装置 |
CN109800680A (zh) * | 2018-12-29 | 2019-05-24 | 上海依图网络科技有限公司 | 一种确定视频中的对象的方法及装置 |
CN109856800A (zh) * | 2019-04-09 | 2019-06-07 | 北京悉见科技有限公司 | 分体式ar眼镜的显示控制方法、装置及分体式ar眼镜 |
CN110427908A (zh) * | 2019-08-08 | 2019-11-08 | 北京百度网讯科技有限公司 | 一种人物检测的方法、装置及计算机可读存储介质 |
CN111274889A (zh) * | 2020-01-14 | 2020-06-12 | 随锐科技集团股份有限公司 | 视频人物识别方法及装置、计算机可存储介质 |
CN112291480A (zh) * | 2020-12-03 | 2021-01-29 | 维沃移动通信有限公司 | 跟踪对焦方法、跟踪对焦装置、电子设备和可读存储介质 |
WO2021169964A1 (zh) * | 2020-02-24 | 2021-09-02 | 华为技术有限公司 | 一种目标检测方法及相关装置 |
CN113762315A (zh) * | 2021-02-04 | 2021-12-07 | 北京京东振世信息技术有限公司 | 图像检测方法、装置、电子设备和计算机可读介质 |
CN114154018A (zh) * | 2022-02-08 | 2022-03-08 | 中国电子科技集团公司第二十八研究所 | 一种面向无人系统的云边协同视频流处理方法及系统 |
CN114440903A (zh) * | 2022-01-21 | 2022-05-06 | 北京三快在线科技有限公司 | 一种高精地图构建方法、装置、存储介质及电子设备 |
CN114972490A (zh) * | 2022-07-29 | 2022-08-30 | 苏州魔视智能科技有限公司 | 一种数据自动标注方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101764923A (zh) * | 2008-12-23 | 2010-06-30 | 北京中星微电子有限公司 | 消除运动检测中的噪声的方法及装置 |
CN102339391A (zh) * | 2010-07-27 | 2012-02-01 | 株式会社理光 | 多对象识别方法和装置 |
CN105094760A (zh) * | 2014-04-28 | 2015-11-25 | 小米科技有限责任公司 | 一种图片标记方法及装置 |
CN105095919A (zh) * | 2015-09-08 | 2015-11-25 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
CN106339691A (zh) * | 2016-09-07 | 2017-01-18 | 四川天辰智创科技有限公司 | 对物体进行标注的方法及装置 |
-
2017
- 2017-02-24 CN CN201710103294.4A patent/CN107145816A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101764923A (zh) * | 2008-12-23 | 2010-06-30 | 北京中星微电子有限公司 | 消除运动检测中的噪声的方法及装置 |
CN102339391A (zh) * | 2010-07-27 | 2012-02-01 | 株式会社理光 | 多对象识别方法和装置 |
CN105094760A (zh) * | 2014-04-28 | 2015-11-25 | 小米科技有限责任公司 | 一种图片标记方法及装置 |
CN105095919A (zh) * | 2015-09-08 | 2015-11-25 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
CN106339691A (zh) * | 2016-09-07 | 2017-01-18 | 四川天辰智创科技有限公司 | 对物体进行标注的方法及装置 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052949A (zh) * | 2017-12-08 | 2018-05-18 | 广东美的智能机器人有限公司 | 物品类别统计方法、系统、计算机设备和可读存储介质 |
CN108052949B (zh) * | 2017-12-08 | 2021-08-27 | 广东美的智能机器人有限公司 | 物品类别统计方法、系统、计算机设备和可读存储介质 |
CN109191839A (zh) * | 2018-09-13 | 2019-01-11 | 江南大学 | 基于深度学习的车辆分类与计数方法 |
CN109726652A (zh) * | 2018-12-19 | 2019-05-07 | 杭州叙简科技股份有限公司 | 一种基于卷积神经网络检测值班人员睡觉行为的方法 |
CN109800680A (zh) * | 2018-12-29 | 2019-05-24 | 上海依图网络科技有限公司 | 一种确定视频中的对象的方法及装置 |
CN109740518A (zh) * | 2018-12-29 | 2019-05-10 | 上海依图网络科技有限公司 | 一种视频中对象的确定方法及装置 |
CN109714623B (zh) * | 2019-03-12 | 2021-11-16 | 北京旷视科技有限公司 | 图像展示方法、装置、电子设备及计算机可读存储介质 |
CN109714623A (zh) * | 2019-03-12 | 2019-05-03 | 北京旷视科技有限公司 | 图像展示方法、装置、电子设备及计算机可读存储介质 |
CN109856800A (zh) * | 2019-04-09 | 2019-06-07 | 北京悉见科技有限公司 | 分体式ar眼镜的显示控制方法、装置及分体式ar眼镜 |
CN110427908A (zh) * | 2019-08-08 | 2019-11-08 | 北京百度网讯科技有限公司 | 一种人物检测的方法、装置及计算机可读存储介质 |
CN111274889A (zh) * | 2020-01-14 | 2020-06-12 | 随锐科技集团股份有限公司 | 视频人物识别方法及装置、计算机可存储介质 |
WO2021169964A1 (zh) * | 2020-02-24 | 2021-09-02 | 华为技术有限公司 | 一种目标检测方法及相关装置 |
CN112291480A (zh) * | 2020-12-03 | 2021-01-29 | 维沃移动通信有限公司 | 跟踪对焦方法、跟踪对焦装置、电子设备和可读存储介质 |
CN112291480B (zh) * | 2020-12-03 | 2022-06-21 | 维沃移动通信有限公司 | 跟踪对焦方法、跟踪对焦装置、电子设备和可读存储介质 |
CN113762315A (zh) * | 2021-02-04 | 2021-12-07 | 北京京东振世信息技术有限公司 | 图像检测方法、装置、电子设备和计算机可读介质 |
CN114440903A (zh) * | 2022-01-21 | 2022-05-06 | 北京三快在线科技有限公司 | 一种高精地图构建方法、装置、存储介质及电子设备 |
CN114154018A (zh) * | 2022-02-08 | 2022-03-08 | 中国电子科技集团公司第二十八研究所 | 一种面向无人系统的云边协同视频流处理方法及系统 |
CN114154018B (zh) * | 2022-02-08 | 2022-05-10 | 中国电子科技集团公司第二十八研究所 | 一种面向无人系统的云边协同视频流处理方法及系统 |
CN114972490A (zh) * | 2022-07-29 | 2022-08-30 | 苏州魔视智能科技有限公司 | 一种数据自动标注方法、装置、设备及存储介质 |
CN114972490B (zh) * | 2022-07-29 | 2022-12-20 | 苏州魔视智能科技有限公司 | 一种数据自动标注方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107145816A (zh) | 对象识别跟踪方法及装置 | |
CN109067541B (zh) | 基于区块链的数据验证方法及装置、电子设备 | |
US20180032828A1 (en) | Face liveness detection method, terminal, server and storage medium | |
CN102870123B (zh) | 对象检测元数据 | |
CA3160731A1 (en) | Interactive behavior recognizing method, device, computer equipment and storage medium | |
CN104794050A (zh) | 应用程序的测试方法、装置及系统 | |
CN108229456A (zh) | 目标跟踪方法和装置、电子设备、计算机存储介质 | |
GB2516172A (en) | A tracking assistance device, a tracking assistance system and a tracking assistance method | |
CN111325128A (zh) | 违规操作检测方法、装置、计算机设备和存储介质 | |
CN110648363A (zh) | 相机姿态确定方法、装置、存储介质及电子设备 | |
CN112926083B (zh) | 基于建筑信息模型的交互处理方法及相关装置 | |
CN110806913A (zh) | 网页截图方法、装置及设备 | |
CN111212246B (zh) | 视频生成方法、装置、计算机设备及存储介质 | |
US20200293760A1 (en) | Multi-modal identity recognition | |
CN111881740A (zh) | 人脸识别方法、装置、电子设备及介质 | |
CN112258369A (zh) | 统一数据平台和基于统一数据平台的数据处理方法 | |
CN114113165B (zh) | 一种用于安检设备的行包判读方法 | |
US20220300774A1 (en) | Methods, apparatuses, devices and storage media for detecting correlated objects involved in image | |
US20180336243A1 (en) | Image Search Method, Apparatus and Storage Medium | |
KR20230036179A (ko) | Bim 및 ar 기반 철도인프라 시공관리 방법 | |
CN110248235A (zh) | 软件教学方法、装置、终端设备及介质 | |
CN111310595B (zh) | 用于生成信息的方法和装置 | |
CN106919260B (zh) | 网页操作方法和装置 | |
JP2017118319A (ja) | 映像検索システム | |
CN112445514B (zh) | 一种代码评审方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170908 |