CN114944015A - 图像的处理方法、装置、电子设备及存储介质 - Google Patents
图像的处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114944015A CN114944015A CN202210700759.5A CN202210700759A CN114944015A CN 114944015 A CN114944015 A CN 114944015A CN 202210700759 A CN202210700759 A CN 202210700759A CN 114944015 A CN114944015 A CN 114944015A
- Authority
- CN
- China
- Prior art keywords
- model
- tracked
- image
- current
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims description 38
- 238000012216 screening Methods 0.000 claims description 18
- 239000007787 solid Substances 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000036544 posture Effects 0.000 description 20
- 238000001514 detection method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 5
- 230000010365 information processing Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Psychiatry (AREA)
- Human Computer Interaction (AREA)
- Social Psychology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及一种图像的处理方法、装置、电子设备及存储介质,所述处理方法包括:获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型;针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象;根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型;确定所述当前模型与历史模型的匹配结果;根据所述匹配结果,生成图像处理结果。本公开实施例使得当前模型在出现图像丢帧的情况下仍然能够实现跟踪匹配,有利于提高人体姿态重建的实际应用价值。
Description
技术领域
本公开涉及信息处理技术领域,尤其涉及一种图像的处理方法、装置、电子设备及存储介质。
背景技术
随着图像处理领域的发展,人体姿态重建技术逐渐受到人们的关注。人体姿态重建技术可基于带有目标对象的图像建立目标对象的三维模型,可应用于电影特效、目标定位、人机交互等场景。故如何更好地进行人体姿态重建,是开发人员亟需解决的技术问题。
发明内容
本公开提出了一种图像的处理技术方案。
根据本公开的一方面,提供了一种图像的处理方法,所述处理方法包括:获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型;针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象;根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型;确定所述当前模型与历史模型的匹配结果;其中,所述历史模型为当前时刻之前、预设时长内的待跟踪模型;根据所述匹配结果,生成图像处理结果。
在一种可能的实施方式中,所述针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象,包括:针对任一待跟踪模型,将不同待处理图像中的目标对象进行组合,得到所述任一待跟踪模型对应的第一对象组;筛选所述第一对象组,并生成每个筛选后的第一对象组对应的三维模型;在所述筛选后的第一对象组对应的三维模型中,确定与所述任一待跟踪模型匹配成功的第一模型;将所述第一模型对应的目标对象作为与所述任一待跟踪模型匹配成功的目标对象。
在一种可能的实施方式中,所述根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型,包括:确定所述待处理图像中的基准图像、非基准图像;将所述基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,作为待匹配对象,将非基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象作为第一对象;针对任一待匹配对象,将不同非基准图像中的第一对象进行组合,得到所述任一待匹配对象对应的第二对象组;筛选所述第二对象组,并根据所述任一待匹配对象、所述第二对象组,生成每个筛选后的第二对象组对应的三维模型;在筛选后的第二对象组对应的三维模型中,确定与所述任一待匹配对象匹配成功的当前模型。
在一种可能的实施方式中,所述将不同待处理图像中的目标对象进行组合,得到所述任一待跟踪模型对应的第一对象组,包括:针对任一待处理图像,将所述任一待处理图像中未与待跟踪模型匹配成功的目标对象、确定为第一未匹配对象,并根据所述第一未匹配对象与所述任一待跟踪模型之间的距离,确定所述第一未匹配对象是否为第二对象;将不同待处理图像中的第二对象进行组合,得到所述任一待跟踪模型对应的第一对象组。
在一种可能的实施方式中,所述第二对象为实体对象或非实体对象;其中,所述非实体对象用以表示待处理图像中未拍摄到的对象,所述实体对象用以表示待处理图像中实际拍摄到的目标对象;所述筛选所述第一对象组,包括:筛选存在至少两个实体对象的第一对象组,作为筛选后的第一对象组。
在一种可能的实施方式中,所述将不同非基准图像中的第一对象进行组合,得到所述任一待匹配对象对应的第二对象组,包括:针对任一非基准图像,将所述任一非基准图像中未与待匹配对象匹配成功的第一对象,确定为第二未匹配对象,并根据所述第二未匹配对象与所述任一待匹配对象之间的距离,确定所述第二未匹配对象是否为第三对象;将不同非基准图像中的第三对象进行组合,得到所述任一待匹配对象对应的第二对象组。
在一种可能的实施方式中,所述第三对象为实体对象或非实体对象;所述筛选所述第二对象组,包括:筛选存在至少两个实体对象的第二对象组,作为筛选后的第二对象组。
在一种可能的实施方式中,所述根据所述匹配结果,生成图像处理结果包括:将所述当前模型中与历史模型匹配成功的模型以及第一模型作为当前时刻对应的待跟踪模型;其中,所述当前时刻对应的待跟踪模型用以与所述当前时刻的下一时刻对应的目标对象进行匹配。
在一种可能的实施方式中,所述根据所述匹配结果,生成图像处理结果,包括:在确定所述当前模型与历史模型均匹配失败、且满足预设条件的情况下,确定当前时刻对应的待跟踪模型包括所述当前模型,并生成图像处理结果;其中,所述预设条件包括以下至少一项:所述当前模型符合预设比例、当前时刻对应的待跟踪模型的数量小于或等于预设数量、所述当前模型与任一当前时刻对应的待跟踪模型的距离大于预设距离。
在一种可能的实施方式中,所述根据所述匹配结果,生成图像处理结果,还包括:针对任一当前时刻对应的待跟踪模型,根据与所述任一当前时刻对应的待跟踪模型匹配成功的前一时刻对应的待跟踪模型或历史模型,优化所述任一当前时刻对应的待跟踪模型;根据不同时刻对应的待跟踪模型之间的匹配情况、优化后的当前时刻对应的每个待跟踪模型,生成图像处理结果。
在一种可能的实施方式中,所述获取当前时刻对应的至少两张带有目标对象的待处理图像,包括:获取当前时刻对应的至少两张初始图像;针对任一初始图像,确定所述初始图像中的所有初始对象;根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象;将带有目标对象的初始图像作为所述待处理图像。
在一种可能的实施方式中,所述初始图像包括运动场的部分区域;所述初始对象包括场上运动员对象、候补运动员对象、观众对象中的至少一个;所述目标对象为场上运动员对象;所述根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象,包括:根据所述任一初始图像中任一初始对象的脚部关键点投影于所述运动场的位置,确定所述任一初始对象是否为场上运动员对象。
根据本公开的一方面,提供了一种图像的处理装置,所述处理装置包括:数据获取模块,用以获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型;目标对象确定模块,用以针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象;当前模型生成模块,用以根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型;匹配结果确定模块,用以确定所述当前模型与历史模型的匹配结果;其中,所述历史模型为当前时刻之前、预设时长内的待跟踪模型;图像处理结果生成模块,用以根据所述匹配结果,生成图像处理结果。
根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述处理方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述处理方法。
在本公开实施例中,可获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型,而后针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象,再根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型,确定所述当前模型与历史模型的匹配结果,最终根据所述匹配结果,生成图像处理结果。本公开实施例可基于多个待处理图像,重建目标对象对应的当前模型,并将当前模型与时间序列中当前时刻之前、预设时长内的历史模型进行跟踪匹配,使得当前模型在出现图像丢帧的情况下仍然能够实现跟踪匹配,有利于提高人体姿态重建的实际应用价值。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出了根据本公开实施例提供的图像的处理方法的流程图。
图2示出了根据本公开实施例提供的图像的处理方法的流程图。
图3示出了根据本公开实施例提供的图像的处理方法的流程图。
图4示出了本公开实施例提供的图像的处理方法的参考示意图。
图5示出了根据本公开实施例提供的图像的处理装置的框图。
图6示出了根据本公开实施例提供的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
相关技术中,通常通过如下方式进行人体姿态重建:1、直接将多视角下的目标对象映射到三维空间中,并通过机器学习模型拟合出目标对象的骨骼关键点坐标。此类方法依赖于大量已标注的三维数据,人工成本较高。此外,机器学习模型需要处理三维空间下的目标对象特征,故此类方法存在人体姿态重建流程的处理速度较慢的问题,尤其是在存在多个目标对象的情况下,该问题尤为严重。2、聚焦于单帧图像的人体姿态重建,再对整个拍摄时间序列中出现的目标对象进行跟踪。但是此类方法在存在多个目标对象的情况下,计算量过大,同样存在人体姿态重建流程的处理速度较慢的问题。此外,时间序列中出现的目标对象在丢帧的情况下,跟踪便会断开,不利于适配人体姿态重建的实际应用场景。
有鉴于此,本公开实施例提供了一种图像的处理方法,可获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型,而后针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象,再根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型,确定所述当前模型与历史模型的匹配结果,最终根据所述匹配结果,生成图像处理结果。本公开实施例可基于多个待处理图像,重建目标对象对应的当前模型,并将当前模型与时间序列中当前时刻之前、预设时长内的历史模型进行跟踪匹配,使得当前模型在出现图像丢帧的情况下仍然能够实现跟踪匹配,有利于提高人体姿态重建的实际应用价值。
在一种可能的实现方式中,本公开实施例提供的处理方法可以由终端设备或服务器等电子设备执行。其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等固定或移动终端。服务器可以为单独的服务器或者多个服务器组成的服务器集群。对于任意电子设备,可以通过处理器调用存储器中存储的计算机可读指令的方式来实现该处理方法。
参阅图1所示,图1示出了根据本公开实施例提供的图像的处理方法的流程图,如图1所示,所述处理方法可包括:
步骤S100,获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型。示例性地,上述目标对象可为人体对象,上述待处理图像可通过与上述电子设备有线或无线连接的、处于不同视角下的多个摄像机进行采集。上述摄像机的设置位置本公开实施例在此不作限制,可由用户进行设定,能够拍摄到用户期望的检测区域即可。在一个示例中,可在摄像机安装完成后,调节每个摄像机的内参、外参,以使不同摄像机可共享同一个世界坐标系。换言之,不同摄像机拍摄的同一个目标对象所处于上述世界坐标系中的坐标位置相同或相近,以提高后续当前模型的生成准确性,进而提高图像处理结果的准确性。摄像机外参的调节方法可参考相关技术,本公开实施例在此不作赘述。示例性地,上述待处理图像可由上述摄像机实时进行采集,换言之,本公开实施例提供的处理方法可应用于实时视频流,即每个摄像机均可采集一个实时视频流,每个摄像机采集到的待处理图像可通过对应的时刻信息(例如:上述当前时刻、前一时刻),以确定该待处理图像在该摄像机采集到的实时视频流中的位置。示例性地,上述前一时刻对应的待跟踪模型可为将前一时刻对应的至少两张待处理图像(可用至少两个摄像机采集)中同一目标对象所在的区域图像进行融合后的三维模型,后文将予以详述。
在一种可能的实施方式中,上述获取当前时刻对应的至少两张带有目标对象的待处理图像,可包括:获取当前时刻对应的至少两张初始图像,上述初始图像可为由不同摄像机采集的、包括人体对象的原始图像。而后针对任一初始图像,确定所述初始图像中的所有初始对象。示例性地,上述初始对象可为上述初始图像中的所有人体对象,可由相关技术中的人体检测算法所得,而后根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象。示例性地,电子设备可通过相关技术中的单应性矩阵(也即Homography matrix),建立实际区域平面(例如:地面)与摄像机的拍摄平面的映射关系,以使初始对象在初始图像中的位置可映射于实际区域平面,进而得到初始对象在实际区域平面的位置,例如可表现为一坐标信息。而后电子设备可将该坐标信息与预设的检测区域平面(例如:各类由人为限定的检测区域,如各类球场的场地线围成的运动区域)之间进行比较,以确定初始对象是否位于检测区域平面中。若初始对象位于检测区域平面中,则可确定该初始对象为目标对象,并将带有目标对象的初始图像作为所述待处理图像。
在一种可能的实施方式中,所述初始图像包括运动场的部分区域;所述初始对象包括场上运动员对象、候补运动员对象、观众对象中的至少一个;所述目标对象为场上运动员对象;所述根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象,包括:根据所述任一初始图像中任一初始对象的脚部关键点投影于所述运动场的位置,确定所述任一初始对象是否为场上运动员对象。结合实际场景,上述初始对象的位置可表现为初始对象脚部关键点在实际区域平面中的坐标,通常情况下,运动员的脚部关键点不会距离实际区域平面过远,故可通过计算脚部关键点的方式提高初始对象位置的代表性,有利于提高后续图像处理结果的精度。本公开实施例可筛选初始对象,以使筛选后的目标对象更加符合用户的人体姿态重建需求,结合实际场景,此处以智慧篮球场举例,在该示例中检测区域平面为运动区域(即篮球场中运动员在比赛过程中的可活动区域,也即篮球场地线围出的区域),实际区域平面可包括运动区域、候补队员区域、部分观众区域。则初始对象可包括正在比赛的运动员、候补队员、观众,电子设备即可将正在比赛的运动员作为目标对象,以进行人体姿态重建。结合实际情景,用户通常关注正在比赛的运动员,故人体姿态重建可仅针对正在比赛的运动员,以降低电子设备的运算压力。在一些示例中,也可将观众区域或候补队员区域作为检测区域平面的一部分,即不仅可针对正在比赛的运动员进行人体姿态重建,也可针对观众或候补队员进行人体姿态重建,以渲染比赛氛围,开发人员可根据电子设备的算力水平进行灵活设定,本公开实施例在此不作限定。
继续参阅图1,步骤S200,针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象。示例性地,上述匹配成功可以通过计算不同待处理图像中基于同一目标对象生成的三维模型与待跟踪模型之间的相似度而定,本公开实施例在此不作限制。
参阅图2所示,图2示出了根据本公开实施例提供的图像的处理方法的流程图,如图2所示,在一种可能的实施方式中,步骤S200可包括:
步骤S210,针对任一待跟踪模型,将不同待处理图像中的目标对象进行组合,得到所述任一待跟踪模型对应的第一对象组。示例性地,同一个目标对象在不同的待处理图像中可对应不同的二维跟踪编号、检测框坐标、骨骼关键点坐标等(可由相关技术中的对象检测算法得到,本公开实施例在此不作赘述),而后将二维跟踪编号不同的目标对象进行组合,即可得到上述第一对象组。示例性地,上述第一对象组用以实现当前时刻的目标对象的融合、以及当前时刻融合后的三维模型与前一时刻的待跟踪模型之间的跟踪匹配。结合实际应用场景,以智慧篮球场为例,在电子设备获取到当前时刻对应的待处理图像后,电子设备可生成当前时刻的运动员模型,并与前一时刻的运动员模型进行跟踪匹配,若跟踪匹配成功,则电子设备可认为两个模型为同一个运动员在不同时刻下的人体姿态重建结果。在一个示例中,电子设备也可将上述两个模型用同一个标识进行标记,以方便观众识别,本公开实施例在此不作限制。
在一种可能的实施方式中,步骤S210可包括:针对任一待处理图像,将所述任一待处理图像中未与待跟踪模型匹配成功的目标对象,确定为第一未匹配对象,并根据所述第一未匹配对象与所述任一待跟踪模型之间的距离,确定所述第一未匹配对象是否为第二对象。示例性地,可根据上述单应性矩阵确定目标对象、待跟踪模型在检测区域中的坐标,而后计算二者坐标的偏移量,在该目标对象与该待跟踪模型之间的偏移量小于预设偏移量的情况下,可确定该目标对象为第二对象。最终将不同待处理图像中的第二对象进行组合,得到所述任一待跟踪模型对应的第一对象组。结合实际场景,在摄像机内参、外参标定误差较小的情况下,将同一个运动员在不同待处理图像中的图像位置映射于上述检测区域平面后,不同待处理图像对应的检测区域坐标应当相近,故本公开实施例可允许不同视角下、较为接近的目标对象之间进行组合,以提高每个第一对象组为同一个运动员的几率。本公开实施例通过筛选出第二对象的方式,可以提高第二对象与待跟踪模型之间的相关性,有利于提高基于第二对象所生成的当前模型的精度。此外,由于筛选出了第二对象,故本公开实施例可降低电子设备的算力损耗,有利于提高电子设备在处理实时视频流时的实时响应能力。
在一种可能的实施方式中,所述第二对象可为实体对象或非实体对象。其中,所述非实体对象用以表示待处理图像中未拍摄到的对象,所述实体对象用以表示待处理图像中实际拍摄到的目标对象。本公开实施例通过组合不同图像中的实体对象或非实体对象的方式,使得电子设备可适配于实际拍摄场景。例如:在实际拍摄场景中,可能出现摄像机无法拍摄到每个目标对象的情况,如:篮球比赛录制场景,由于该场景中检测区域较大,故可能存在单个摄像机采集运动员不全面的情况(例如:出于提高拍摄清晰度的考虑,用户可能设置每个摄像机采集检测区域中的部分区域)。例如:摄像机1实际采集到运动员A、B、C(也即摄像机1采集的待处理图像中的实体对象),摄像机2实际采集到运动员D、E,摄像机3实际采集到运动员F、G,每个摄像机均可对应一个非实体对象K,该非实体对象K与待检测模型之间的距离可设定为预定值,如0,以使非实体对象不会在上文的距离比对中被筛除。而在将不同待处理图像中的第二对象进行组合时,本公开实施例允许出现以下组合:A、K、F,K、D、F,A、D、K等组合。即本公开实施例生成的第一对象组考虑到了摄像机未拍摄到实体对象的情况,进而提高了后续第一对象组对应的三维模型的生成精度,有利于提高三维模型与待跟踪模型的跟踪匹配精度。承接上例,若A、F实际上为同一运动员,且A与D、E均不为同一运动员,则基于A、K、F所生成的三维模型精度相较于基于A、D、F或A、E、F所生成的三维模型精度更高。换言之,本公开实施例可不必强行将实际上不同的运动员进行组合。
继续参阅图2,步骤S220,筛选所述第一对象组,并生成每个筛选后的第一对象组对应的三维模型。示例性地,可基于每个第一对象组中对应的至少两个第二对象,通过相关技术中的三维重建算法(如三角化算法),生成每个第一对象组对应的三维模型,本公开实施例在此不作赘述。在一个示例中,若第二对象为实体对象或非实体对象,则电子设备可筛选存在至少两个实体对象的第一对象组,作为筛选后的第一对象组,以使三维重建算法可以被正确执行。此外,可节约电子设备的算力。
步骤S230,在所述筛选后的第一对象组对应的三维模型中,确定与所述任一待跟踪模型匹配成功的第一模型。示例性地,可基于每个三维模型、上述任一待跟踪模型、每个三维模型对应的目标对象的区域图像,确定每个三维模型对应的各类相关技术中的误差和,上述误差和与上述相似度负相关,如:重投影误差、三维欧式距离误差、二维跟踪编号误差、韦尔奇误差等,本公开实施例在此不作限制。而后可在最小的误差和小于预设误差阈值的情况下,将其对应的三维模型作为上述第一模型。示例性地,上述第一模型是基于前一时刻的待跟踪模型所得到的,故该第一模型可视为与该第一模型匹配成功的待跟踪模型的跟踪匹配结果,例如:本公开实施例可使该第一模型与该待跟踪模型共用一个三维模型编号(即电子设备认为两个模型在实际场景中所属于不同时刻下的同一个目标对象),以表现两个模型之间的关联。
步骤S240,将所述第一模型对应的目标对象作为与所述任一待跟踪模型匹配成功的目标对象。结合实际场景,上述与所述任一待跟踪模型匹配成功的目标对象即为被拍摄于不同待处理图像中的场上运动员。
继续参阅图1,步骤S300,根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型。当前模型可基于目标对象,根据相关技术中的三维重建算法所得,本公开实施例在此不作赘述。
参阅图3所示,图3示出了根据本公开实施例提供的图像的处理方法的流程图,如图3所示,在一种可能的实施方式中,步骤S300可包括:
步骤S310,确定所述待处理图像中的基准图像、非基准图像。示例性地,开发人员可在摄像机中任意选取一个基准摄像机,而后将该基准摄像机拍摄到的待处理图像作为上述基准图像,将非基准摄像机拍摄到的待处理图像作为上述非基准图像。
步骤S320,将所述基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,作为待匹配对象,将非基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象作为第一对象。
步骤S330,针对任一待匹配对象,将不同非基准图像中的第一对象进行组合,得到所述任一待匹配对象对应的第二对象组。
在一种可能的实施方式中,步骤S330可包括:针对任一非基准图像,将所述任一非基准图像中未与待匹配对象匹配成功的第一对象,确定为第二未匹配对象,并根据所述第二未匹配对象与所述任一待匹配对象之间的距离,确定所述第二未匹配对象是否为第三对象。示例性地,可根据上述单应性矩阵确定第一对象、待匹配对象在检测区域中的坐标,而后计算二者坐标的偏移量,在该第一对象与该待匹配对象之间的偏移量小于预设偏移量的情况下,可确定该第一对象为第三对象。最终将不同非基准图像中的第三对象进行组合,得到所述任一待匹配对象对应的第二对象组。本公开实施例通过筛选出第三对象的方式,可以提高第三对象与待匹配对象之间的相关性,有利于提高基于第三对象所生成的三维模型的精度。此外,由于筛选出了第三对象,故本公开实施例可降低电子设备的算力损耗,有利于提高电子设备在处理实时视频流时的实时响应能力。
在一种可能的实施方式中,所述第三对象可为实体对象或非实体对象。本公开实施例可通过组合不同非基准图像中的实体对象或非实体对象的方式,使得电子设备可适配于实际拍摄场景。即本公开实施例生成的第二对象组考虑到了摄像机未拍摄到实体对象的情况,进而提高了后续第二对象组对应的三维模型的生成精度,有利于提高后续得到的当前模型的生成精度。
步骤S340,筛选所述第二对象组,并根据所述任一待匹配对象、所述第二对象组,生成每个筛选后的第二对象组对应的三维模型。示例性地,可基于每个第二对象组中对应的至少两个第三对象,通过相关技术中的三维重建算法(如三角化算法),生成每个第二对象组对应的三维模型,本公开实施例在此不作赘述。在一个示例中,若第三对象为实体对象或非实体对象,则电子设备可筛选存在至少两个实体对象的第二对象组,作为筛选后的第二对象组,以使三维重建算法可以被正确执行,同时可节约电子设备的算力。
步骤S350,在筛选后的第二对象组对应的三维模型中,确定与所述任一待匹配对象匹配成功的当前模型。
示例性地,可基于每个三维模型、上述任一待匹配对象的区域图像、每个三维模型对应的目标对象的区域图像,确定每个三维模型对应的各类相关技术中的误差和,如:重投影误差、韦尔奇误差等,本公开实施例在此不作限制。而后可在最小的误差和小于预设误差阈值的情况下,将其对应的三维模型作为上述当前模型。示例性地,上述当前模型是基于当前时刻的待匹配对象所得到的,故该当前模型可视为该待匹配对象的多视角融合结果。结合实际应用场景,体育比赛中通常存在运动员更换的情况,即该当前模型由于未与前一时刻对应的待跟踪模型匹配成功,故电子设备可认为该当前模型为新上场的运动员或出现丢帧情况下的运动员。
继续参阅图1,步骤S400,确定所述当前模型与历史模型的匹配结果。其中,所述历史模型为当前时刻之前、预设时长内的待跟踪模型。示例性地,上述匹配结果可通过比较历史模型与当前模型的相似度进行比较。示例性地,二者可通过相关算法或模型计算二者的几何特征、外观特征,并进行比较,在二者相似度高于预设相似度的情况下,确定所述当前模型与历史模型匹配成功。本公开实施例可以处理连续丢帧情况下的目标对象跟踪,以提高目标对象在实时视频流中的跟踪精度。
步骤S500,根据所述匹配结果,生成图像处理结果。结合实际应用场景,若匹配失败,则电子设备认为当前模型为新上场的运动员,可使用新的标识对其进行标记。若匹配成功,则电子设备认为当前模型为丢帧情况下的已上场运动员,可使用该已上场运动员原有的标识(如匹配成功的历史模型对应的标识)对其进行标记。上述图像处理结果可表现为标记,如某一时刻下有10个运动员,则可生成每个运动员的标注框,并在标注框附近生成运动员的个人信息(如:姓名)等,而在下一时刻,同一个运动员的标注框位置可有所变动,但是个人信息可保持相同,即可完成多个运动员的人体姿态重建、跟踪。
在一种可能的实施方式中,步骤S500包括:将所述当前模型中与历史模型匹配成功的模型以及所述第一模型作为当前时刻对应的待跟踪模型;其中,所述当前时刻对应的待跟踪模型用以与所述当前时刻的下一时刻对应的目标对象进行匹配。结合实际场景,若摄像机正在拍摄实时视频流,则当前时刻对应的待跟踪模型可视为正在进行比赛的运动员,而在摄像机拍摄到新的图像时,摄像机的当前时刻将会更新,即上述当前时刻对应的待跟踪模型会被视为前一时刻对应的待跟踪模型,下一时刻对应的待处理图像将视为当前时刻对应的待处理图像,而持续进行实时图像的处理流程。
在一种可能的实施方式中,步骤S500可包括如下步骤:在确定所述当前模型与历史模型均匹配失败、且满足预设条件的情况下,确定当前时刻对应的待跟踪模型包括所述当前模型,并生成图像处理结果。其中,所述预设条件包括以下至少一项:所述当前模型符合预设比例、当前时刻对应的待跟踪模型的数量小于或等于预设数量、所述当前模型与任一当前时刻对应的待跟踪模型的距离大于预设距离。结合实际应用场景,上述预设比例可为人体骨骼比例,上述预设数量可为各类比赛中通常规定下可上场运动员的总数,上述预设距离用以确定当前模型是否为拍摄时出现的重影,如摄像机的内参、外参标定误差过大,进而导致当前时刻的同一个运动员重建了多个当前模型。在上述当前模型与历史模型均匹配失败、且满足上述预设条件的情况下,电子设备可认为上述当前模型为新入场的运动员,可为其分配新的标识。
在一种可能的实施方式中,步骤S500还可包括如下步骤:针对任一当前时刻对应的待跟踪模型,根据与所述任一当前时刻对应的待跟踪模型匹配成功的前一时刻对应的待跟踪模型或历史模型,优化所述任一当前时刻对应的待跟踪模型。示例性地,可通过相关技术中的时序插值算法、骨骼定长优化算法等优化所述任一当前时刻对应的待跟踪模型。其中,时序插值算法可用于丢帧情况下的补帧,以使三维模型在不同时刻下的动作更加连贯。骨骼定长优化可用于维持不同时刻下同一目标对象的三维模型之间的身体比例,以使不同时刻下的同一目标对象的身体比例变动幅度更加合理。而后根据不同时刻对应的待跟踪模型之间的匹配情况、优化后的当前时刻对应的每个待跟踪模型,生成图像处理结果。
参照图4所示,图4示出了本公开实施例提供的图像的处理方法的参考示意图,如图4所示,结合实际应用场景,电子设备可通过不同的摄像头拍摄到不同视角的待处理图像,而后在待处理图像中提取目标对象(也即图4中的多视角球员),而后将目标对象对应的三维模型(也即图4中当前帧球员)与前一时刻对应的待跟踪模型(也即图4中场上球员)进行匹配,若匹配成功,则该三维模型的人体姿态重建成功、与前一时刻对应的待跟踪模型跟踪成功,若匹配失败,则基于未匹配成功的目标对象生成当前模型,并在历史模型(也即图4中暂时片段历史)中进行再次匹配。若匹配成功,则当前模型的人体姿态重建成功、与历史模型跟踪成功,若匹配失败,则将当前模型作为匹配失败的模型。若历史模型最后出现的时刻与当前时刻之间的间隔大于阈值,则将其从历史模型中筛除(也即图4中永久历史)。由此,电子设备即可完成当前帧球员的跨帧跟踪匹配、人体姿态重建。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了图像的处理装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种图像的处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
图5示出了根据本公开实施例提供的图像的处理装置的框图,如图5所示,所述处理装置100包括:数据获取模块110,用以获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型。目标对象确定模块120,用以针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象。当前模型生成模块130,用以根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型。匹配结果确定模块140,用以确定所述当前模型与历史模型的匹配结果。其中,所述历史模型为当前时刻之前、预设时长内的待跟踪模型。图像处理结果生成模块150,用以根据所述匹配结果,生成图像处理结果。
在一种可能的实施方式中,所述针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象,包括:针对任一待跟踪模型,将不同待处理图像中的目标对象进行组合,得到所述任一待跟踪模型对应的第一对象组;筛选所述第一对象组,并生成每个筛选后的第一对象组对应的三维模型;在所述筛选后的第一对象组对应的三维模型中,确定与所述任一待跟踪模型匹配成功的第一模型;将所述第一模型对应的目标对象作为与所述任一待跟踪模型匹配成功的目标对象。
在一种可能的实施方式中,所述根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型,包括:确定所述待处理图像中的基准图像、非基准图像;将所述基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,作为待匹配对象,将非基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象作为第一对象;针对任一待匹配对象,将不同非基准图像中的第一对象进行组合,得到所述任一待匹配对象对应的第二对象组;筛选所述第二对象组,并根据所述任一待匹配对象、所述第二对象组,生成每个筛选后的第二对象组对应的三维模型;在筛选后的第二对象组对应的三维模型中,确定与所述任一待匹配对象匹配成功的当前模型。
在一种可能的实施方式中,所述将不同待处理图像中的目标对象进行组合,得到所述任一待跟踪模型对应的第一对象组,包括:针对任一待处理图像,将所述任一待处理图像中未与待跟踪模型匹配成功的目标对象、确定为第一未匹配对象,并根据所述第一未匹配对象与所述任一待跟踪模型之间的距离,确定所述第一未匹配对象是否为第二对象;将不同待处理图像中的第二对象进行组合,得到所述任一待跟踪模型对应的第一对象组。
在一种可能的实施方式中,所述第二对象为实体对象或非实体对象;其中,所述非实体对象用以表示待处理图像中未拍摄到的对象,所述实体对象用以表示待处理图像中实际拍摄到的目标对象;所述筛选所述第一对象组,包括:筛选存在至少两个实体对象的第一对象组,作为筛选后的第一对象组。
在一种可能的实施方式中,所述将不同非基准图像中的第一对象进行组合,得到所述任一待匹配对象对应的第二对象组,包括:针对任一非基准图像,将所述任一非基准图像中未与待匹配对象匹配成功的第一对象,确定为第二未匹配对象,并根据所述第二未匹配对象与所述任一待匹配对象之间的距离,确定所述第二未匹配对象是否为第三对象;将不同非基准图像中的第三对象进行组合,得到所述任一待匹配对象对应的第二对象组。
在一种可能的实施方式中,所述第三对象为实体对象或非实体对象;所述筛选所述第二对象组,包括:筛选存在至少两个实体对象的第二对象组,作为筛选后的第二对象组。
在一种可能的实施方式中,所述根据所述匹配结果,生成图像处理结果包括:将所述当前模型中与历史模型匹配成功的模型以及第一模型作为当前时刻对应的待跟踪模型;其中,所述当前时刻对应的待跟踪模型用以与所述当前时刻的下一时刻对应的目标对象进行匹配。
在一种可能的实施方式中,所述根据所述匹配结果,生成图像处理结果,包括:在确定所述当前模型与历史模型均匹配失败、且满足预设条件的情况下,确定当前时刻对应的待跟踪模型包括所述当前模型,并生成图像处理结果;其中,所述预设条件包括以下至少一项:所述当前模型符合预设比例、当前时刻对应的待跟踪模型的数量小于或等于预设数量、所述当前模型与任一当前时刻对应的待跟踪模型的距离大于预设距离。
在一种可能的实施方式中,所述根据所述匹配结果,生成图像处理结果,还包括:针对任一当前时刻对应的待跟踪模型,根据与所述任一当前时刻对应的待跟踪模型匹配成功的前一时刻对应的待跟踪模型或历史模型,优化所述任一当前时刻对应的待跟踪模型;根据不同时刻对应的待跟踪模型之间的匹配情况、优化后的当前时刻对应的每个待跟踪模型,生成图像处理结果。
在一种可能的实施方式中,所述获取当前时刻对应的至少两张带有目标对象的待处理图像,包括:获取当前时刻对应的至少两张初始图像;针对任一初始图像,确定所述初始图像中的所有初始对象;根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象;将带有目标对象的初始图像作为所述待处理图像。
在一种可能的实施方式中,所述初始图像包括运动场的部分区域;所述初始对象包括场上运动员对象、候补运动员对象、观众对象中的至少一个;所述目标对象为场上运动员对象;所述根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象,包括:根据所述任一初始图像中任一初始对象的脚部关键点投影于所述运动场的位置,确定所述任一初始对象是否为场上运动员对象。
该方法与计算机系统的内部结构存在特定技术关联,且能够解决如何提升硬件运算效率或执行效果的技术问题(包括减少数据存储量、减少数据传输量、提高硬件处理速度等),从而获得符合自然规律的计算机系统内部性能改进的技术效果。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。
电子设备可以被提供为服务器或其它形态的设备。
图6示出根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器或终端设备。参照图6,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(Mac OSXTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像机等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (15)
1.一种图像的处理方法,其特征在于,所述处理方法包括:
获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型;
针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象;
根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型;
确定所述当前模型与历史模型的匹配结果;其中,所述历史模型为当前时刻之前、预设时长内的待跟踪模型;
根据所述匹配结果,生成图像处理结果。
2.如权利要求1所述的处理方法,其特征在于,所述针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象,包括:
针对任一待跟踪模型,将不同待处理图像中的目标对象进行组合,得到所述任一待跟踪模型对应的第一对象组;
筛选所述第一对象组,并生成每个筛选后的第一对象组对应的三维模型;
在所述筛选后的第一对象组对应的三维模型中,确定与所述任一待跟踪模型匹配成功的第一模型;
将所述第一模型对应的目标对象作为与所述任一待跟踪模型匹配成功的目标对象。
3.如权利要求1或2所述的处理方法,其特征在于,所述根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型,包括:
确定所述待处理图像中的基准图像、非基准图像;
将所述基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,作为待匹配对象,将非基准图像中与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象作为第一对象;
针对任一待匹配对象,将不同非基准图像中的第一对象进行组合,得到所述任一待匹配对象对应的第二对象组;
筛选所述第二对象组,并根据所述任一待匹配对象、所述第二对象组,生成每个筛选后的第二对象组对应的三维模型;
在筛选后的第二对象组对应的三维模型中,确定与所述任一待匹配对象匹配成功的当前模型。
4.如权利要求2所述的处理方法,其特征在于,所述将不同待处理图像中的目标对象进行组合,得到所述任一待跟踪模型对应的第一对象组,包括:
针对任一待处理图像,将所述任一待处理图像中未与待跟踪模型匹配成功的目标对象、确定为第一未匹配对象,并根据所述第一未匹配对象与所述任一待跟踪模型之间的距离,确定所述第一未匹配对象是否为第二对象;
将不同待处理图像中的第二对象进行组合,得到所述任一待跟踪模型对应的第一对象组。
5.如权利要求4所述的处理方法,其特征在于,所述第二对象为实体对象或非实体对象;其中,所述非实体对象用以表示待处理图像中未拍摄到的对象,所述实体对象用以表示待处理图像中实际拍摄到的目标对象;所述筛选所述第一对象组,包括:筛选存在至少两个实体对象的第一对象组,作为筛选后的第一对象组。
6.如权利要求3所述的处理方法,其特征在于,所述将不同非基准图像中的第一对象进行组合,得到所述任一待匹配对象对应的第二对象组,包括:
针对任一非基准图像,将所述任一非基准图像中未与待匹配对象匹配成功的第一对象,确定为第二未匹配对象,并根据所述第二未匹配对象与所述任一待匹配对象之间的距离,确定所述第二未匹配对象是否为第三对象;
将不同非基准图像中的第三对象进行组合,得到所述任一待匹配对象对应的第二对象组。
7.如权利要求6所述的处理方法,其特征在于,所述第三对象为实体对象或非实体对象;
所述筛选所述第二对象组,包括:筛选存在至少两个实体对象的第二对象组,作为筛选后的第二对象组。
8.如权利要求1至7中任意一项所述的处理方法,其特征在于,所述根据所述匹配结果,生成图像处理结果包括:
将所述当前模型中与历史模型匹配成功的模型以及第一模型作为当前时刻对应的待跟踪模型;其中,所述当前时刻对应的待跟踪模型用以与所述当前时刻的下一时刻对应的目标对象进行匹配。
9.如权利要求8所述的处理方法,其特征在于,所述根据所述匹配结果,生成图像处理结果,包括:
在确定所述当前模型与历史模型均匹配失败、且满足预设条件的情况下,确定当前时刻对应的待跟踪模型包括所述当前模型,并生成图像处理结果;其中,所述预设条件包括以下至少一项:所述当前模型符合预设比例、当前时刻对应的待跟踪模型的数量小于或等于预设数量、所述当前模型与任一当前时刻对应的待跟踪模型的距离大于预设距离。
10.如权利要求8或9所述的处理方法,其特征在于,所述根据所述匹配结果,生成图像处理结果,还包括:
针对任一当前时刻对应的待跟踪模型,根据与所述任一当前时刻对应的待跟踪模型匹配成功的前一时刻对应的待跟踪模型或历史模型,优化所述任一当前时刻对应的待跟踪模型;
根据不同时刻对应的待跟踪模型之间的匹配情况、优化后的当前时刻对应的每个待跟踪模型,生成图像处理结果。
11.如权利要求1至10中任意一项所述的处理方法,其特征在于,所述获取当前时刻对应的至少两张带有目标对象的待处理图像,包括:
获取当前时刻对应的至少两张初始图像;
针对任一初始图像,确定所述初始图像中的所有初始对象;
根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象;
将带有目标对象的初始图像作为所述待处理图像。
12.如权利要求11所述的处理方法,其特征在于,所述初始图像包括运动场的部分区域;所述初始对象包括场上运动员对象、候补运动员对象、观众对象中的至少一个;所述目标对象为场上运动员对象;
所述根据所述任一初始图像中任一初始对象的位置,确定所述任一初始对象是否为目标对象,包括:根据所述任一初始图像中任一初始对象的脚部关键点投影于所述运动场的位置,确定所述任一初始对象是否为场上运动员对象。
13.一种图像的处理装置,其特征在于,所述处理装置包括:
数据获取模块,用以获取当前时刻对应的至少两张带有目标对象的待处理图像、所述当前时刻的前一时刻对应的每个待跟踪模型;
目标对象确定模块,用以针对任一待跟踪模型,在所述待处理图像中的目标对象中,确定与所述任一待跟踪模型匹配成功的目标对象;
当前模型生成模块,用以根据与每个前一时刻对应的待跟踪模型均未匹配成功的目标对象,生成当前模型;
匹配结果确定模块,用以确定所述当前模型与历史模型的匹配结果;其中,所述历史模型为当前时刻之前、预设时长内的待跟踪模型;
图像处理结果生成模块,用以根据所述匹配结果,生成图像处理结果。
14.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至12中任意一项所述的处理方法。
15.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至12中任意一项所述的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210700759.5A CN114944015A (zh) | 2022-06-20 | 2022-06-20 | 图像的处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210700759.5A CN114944015A (zh) | 2022-06-20 | 2022-06-20 | 图像的处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114944015A true CN114944015A (zh) | 2022-08-26 |
Family
ID=82910507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210700759.5A Pending CN114944015A (zh) | 2022-06-20 | 2022-06-20 | 图像的处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114944015A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115311573A (zh) * | 2022-10-08 | 2022-11-08 | 浙江壹体科技有限公司 | 一种场地线检测和目标定位方法、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070122001A1 (en) * | 2005-11-30 | 2007-05-31 | Microsoft Corporation | Real-time Bayesian 3D pose tracking |
CN101561928A (zh) * | 2009-05-27 | 2009-10-21 | 湖南大学 | 基于属性关系图外观模型的多人体跟踪方法 |
CN112950710A (zh) * | 2021-02-24 | 2021-06-11 | 广州极飞科技股份有限公司 | 位姿确定方法、装置、电子设备和计算机可读存储介质 |
CN113297963A (zh) * | 2021-05-24 | 2021-08-24 | 网易(杭州)网络有限公司 | 多人姿态的估计方法、装置、电子设备以及可读存储介质 |
CN114219828A (zh) * | 2021-11-03 | 2022-03-22 | 浙江大华技术股份有限公司 | 一种基于视频的目标关联方法、装置和可读存储介质 |
CN114549765A (zh) * | 2022-02-28 | 2022-05-27 | 北京京东尚科信息技术有限公司 | 三维重建方法及装置、计算机可存储介质 |
-
2022
- 2022-06-20 CN CN202210700759.5A patent/CN114944015A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070122001A1 (en) * | 2005-11-30 | 2007-05-31 | Microsoft Corporation | Real-time Bayesian 3D pose tracking |
CN101561928A (zh) * | 2009-05-27 | 2009-10-21 | 湖南大学 | 基于属性关系图外观模型的多人体跟踪方法 |
CN112950710A (zh) * | 2021-02-24 | 2021-06-11 | 广州极飞科技股份有限公司 | 位姿确定方法、装置、电子设备和计算机可读存储介质 |
CN113297963A (zh) * | 2021-05-24 | 2021-08-24 | 网易(杭州)网络有限公司 | 多人姿态的估计方法、装置、电子设备以及可读存储介质 |
CN114219828A (zh) * | 2021-11-03 | 2022-03-22 | 浙江大华技术股份有限公司 | 一种基于视频的目标关联方法、装置和可读存储介质 |
CN114549765A (zh) * | 2022-02-28 | 2022-05-27 | 北京京东尚科信息技术有限公司 | 三维重建方法及装置、计算机可存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115311573A (zh) * | 2022-10-08 | 2022-11-08 | 浙江壹体科技有限公司 | 一种场地线检测和目标定位方法、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11605214B2 (en) | Method, device and storage medium for determining camera posture information | |
CN110264509B (zh) | 确定图像捕捉设备的位姿的方法、装置及其存储介质 | |
CN112819944B (zh) | 三维人体模型重建方法、装置、电子设备及存储介质 | |
CN113706699B (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN107808111B (zh) | 用于行人检测和姿态估计的方法和装置 | |
WO2021136386A1 (zh) | 数据处理方法、终端和服务器 | |
CN112802033B (zh) | 图像处理方法及装置、计算机可读存储介质和电子设备 | |
CN113436338A (zh) | 火灾现场的三维重建方法、装置、服务器及可读存储介质 | |
CN113327319A (zh) | 一种复杂场景建模方法、装置、服务器及可读存储介质 | |
CN111402412A (zh) | 数据采集方法及装置、设备、存储介质 | |
CN109902675B (zh) | 物体的位姿获取方法、场景重构的方法和装置 | |
CN114694136A (zh) | 一种物品展示方法、装置、设备及介质 | |
US20240261677A1 (en) | Determination method, determination apparatus of calibration information and electronic device | |
CN114944015A (zh) | 图像的处理方法、装置、电子设备及存储介质 | |
CN114882106A (zh) | 位姿确定方法和装置、设备、介质 | |
CN114399610A (zh) | 基于引导先验的纹理映射系统和方法 | |
Liu et al. | Two-stream refinement network for RGB-D saliency detection | |
CN112907657A (zh) | 一种机器人重定位方法、装置、设备及存储介质 | |
KR20190055632A (ko) | 모션 정보를 이용한 객체 복원 장치 및 이를 이용한 객체 복원 방법 | |
CN112270748A (zh) | 基于图像的三维重建方法及装置 | |
CN118570379A (zh) | 设施三维重建的方法、装置、设备、介质及产品 | |
CN118555352B (zh) | 一种视频生成方法、装置、计算机设备和存储介质 | |
CN114401446B (zh) | 人体姿态迁移方法、装置、系统、电子设备以及存储介质 | |
CN115984348A (zh) | 一种全景图像的处理方法、装置、电子设备及存储介质 | |
CN112288817B (zh) | 基于图像的三维重建处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |