CN111125388B - 多媒体资源的检测方法、装置及设备和存储介质 - Google Patents
多媒体资源的检测方法、装置及设备和存储介质 Download PDFInfo
- Publication number
- CN111125388B CN111125388B CN201911403935.3A CN201911403935A CN111125388B CN 111125388 B CN111125388 B CN 111125388B CN 201911403935 A CN201911403935 A CN 201911403935A CN 111125388 B CN111125388 B CN 111125388B
- Authority
- CN
- China
- Prior art keywords
- multimedia resource
- classification
- data
- module
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013145 classification model Methods 0.000 claims abstract description 136
- 238000001514 detection method Methods 0.000 claims abstract description 120
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本公开关于一种多媒体资源的检测方法、装置及设备和存储介质。该检测方法用于从待检测的多媒体资源集合中检测出目标多媒体资源,该方法包括:获取当前多媒体资源检测期望的召回率;根据预存的召回率与阈值组合的映射关系,确定与该召回率对应的多个分类模型使用的阈值组合,该阈值组合是在召回率下获得最高检测准确率的组合;对于多媒体资源集合中的任一多媒体资源,分别通过多个分类模型对多媒体资源进行分类处理,得到多个分类模型分别输出的分类信息;若多个分类模型中的至少一个分类模型满足:分类模型输出的分类信息大于或等于分类模型对应使用的分类阈值,则确定多媒体资源是目标多媒体资源。上述实施例,提高了多媒体资源的检测准确率。
Description
技术领域
本公开涉及通信领域,尤其涉及一种多媒体资源的检测方法、装置及设备和存储介质。
背景技术
随着短视频上传量的不断增加,针对短视频内容的监管变得越发重要。每天短视频平台有近上亿的视频被用户上传,如果全部通过人工进行审核,将消耗巨大的人力成本。目前采用的是人机协同的审核方式,机器利用深度学习算法抽样出可能存在问题的视频,然后交给专业的审核人员进行审核,以减少巨大的人力成本。
但是,采用单个分类模型很难从上亿的视频样本中抽样出所有存在问题的视频,相关技术中,采用多个分类模型对视频样本进行抽样,但是,如何高性能地从海量视频中检测出存在问题的视频是需要解决的一个技术问题。
发明内容
本公开提供一种多媒体资源的检测方法、装置及设备和存储介质,以提高多媒体资源的检测准确率。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种多媒体资源的检测方法,所述方法用于从待检测的多媒体资源集合中检测出目标多媒体资源;所述方法包括:
获取当前多媒体资源检测期望的召回率,所述召回率是所述目标多媒体资源的检测数据量在实际数据量的占比,所述实际数据量是所述多媒体资源集合中实际包括的所述目标多媒体资源的数据量;
根据预存的召回率与阈值组合的映射关系,确定与所述召回率对应的多个分类模型使用的阈值组合;其中,所述阈值组合包括所述多个分类模型分别对应使用的分类阈值,并且所述阈值组合是在所述召回率下获得最高检测准确率的组合;
对于所述多媒体资源集合中的任一多媒体资源,分别通过所述多个分类模型对所述多媒体资源进行分类处理,得到所述多个分类模型分别输出的分类信息,所述分类信息用于表示所述多媒体资源是所述目标多媒体资源的概率;
若所述多个分类模型中的至少一个分类模型满足:所述分类模型输出的所述分类信息大于或等于所述分类模型对应使用的分类阈值,则确定所述多媒体资源是所述目标多媒体资源。
在一实施例中,在所述根据预存的召回率与阈值组合的映射关系,确定与所述召回率对应的多个分类模型使用的阈值组合之前,所述多媒体资源的检测方法还包括:
获得多媒体资源样本数据;
在预设区间内,按照预设遍历规律获得所述多个分类模型的所有阈值组合;
利用每个阈值组合更新所述多个分类模型,并利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率;
记录并保存每个所述召回率下的最高检测准确率及其对应的阈值组合。
在一实施例中,所述利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率,包括:
针对每个阈值组合,获取利用更新后的每个分类模型需要检测出的目标多媒体资源数据;
对获取的所有需要检测出的目标多媒体资源数据进行合并,得到第一数据集合;
利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到多个目标多媒体资源样本数据;
对所述多个目标多媒体资源样本数据进行合并,得到第二数据集合;
计算所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述多媒体资源样本数据中目标多媒体资源样本数据量的第一比值,并将所述第一比值作为当前阈值组合对应的所述召回率;
计算所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述第一数据集合中的数据量的第二比值,并将所述第二比值作为当前阈值组合对应的所述检测准确率。
在一实施例中,所述对获取的所有需要检测出的目标多媒体资源数据进行合并,包括:
从获取的所有需要检测出的目标多媒体资源数据中去除重复数据;或者
所述对所述多个目标多媒体资源样本数据进行合并,包括:
从所述多个目标多媒体资源样本数据中去除重复数据。
在一实施例中,所述多媒体资源的检测方法还包括:
若所有分类模型输出的分类信息均小于对应的分类阈值,则确定所述多媒体资源不是所述目标多媒体资源。
根据本公开实施例的第二方面,提供一种多媒体资源检测装置,所述装置用于从待检测的多媒体资源集合中检测出目标多媒体资源;所述装置包括:
获取模块,被配置为获取当前多媒体资源检测期望的召回率,所述召回率是所述目标多媒体资源的检测数据量在实际数据量的占比,所述实际数据量是所述多媒体资源集合中实际包括的所述目标多媒体资源的数据量;
确定模块,被配置为根据预存的召回率与阈值组合的映射关系,确定与所述获取模块获取的所述召回率对应的多个分类模型使用的阈值组合;其中,所述阈值组合包括所述多个分类模型分别对应使用的分类阈值,并且所述阈值组合是在所述召回率下获得最高检测准确率的组合;
处理模块,被配置为对于所述多媒体资源集合中的任一多媒体资源,分别通过使用所述确定模块确定的所述阈值组合的所述多个分类模型对所述多媒体资源进行分类处理,得到所述多个分类模型分别输出的分类信息,所述分类信息用于表示所述多媒体资源是所述目标多媒体资源的概率;
第一检测模块,被配置为若所述多个分类模型中的至少一个分类模型满足:所述处理模块得到的所述分类模型输出的所述分类信息大于或等于所述分类模型对应使用的分类阈值,则确定所述多媒体资源是所述目标多媒体资源。
在一实施例中,所述多媒体资源的检测装置还包括:
第一获得模块,被配置为在所述确定模块根据预存的召回率与阈值组合的映射关系,确定与所述召回率对应的多个分类模型使用的阈值组合之前,获得多媒体资源样本数据;
第二获得模块,被配置为在预设区间内,按照预设遍历规律获得所述多个分类模型的所有阈值组合;
更新检测模块,被配置为利用所述第二获得模块获得的每个阈值组合更新所述多个分类模型,并利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率;
记录保存模块,被配置为记录并保存所述更新检测模块得到的每个所述召回率下的最高检测准确率及其对应的阈值组合。
在一实施例中,所述更新检测模块包括:
第一获取子模块,被配置为针对每个阈值组合,获取利用更新后的每个分类模型需要检测出的目标多媒体资源数据;
第一合并子模块,被配置为对所述第一获取模块获取的所有需要检测出的目标多媒体资源数据进行合并,得到第一数据集合;
检测子模块,被配置为利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到多个目标多媒体资源样本数据;
第二合并子模块,被配置为对所述检测子模块得到的所述多个目标多媒体资源样本数据进行合并,得到第二数据集合;
第一计算子模块,计算所述第二合并子模块得到的所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述多媒体资源样本数据中目标多媒体资源样本数据量的第一比值,并将所述第一比值作为当前阈值组合对应的所述召回率;
第二计算子模块,计算所述第二合并子模块得到的所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述第一合并子模块得到的所述第一数据集合中的数据量的第二比值,并将所述第二比值作为当前阈值组合对应的所述检测准确率。
在一实施例中,所述第一合并子模块,被配置为:
从获取的所有需要检测出的目标多媒体资源数据中去除重复数据;或者
所述第二合并子模块,被配置为:
从所述多个目标多媒体资源样本数据中去除重复数据。
在一实施例中,所述多媒体资源的检测装置还包括:
第二检测模块,被配置为若所述处理模块得到的所有分类模型输出的分类信息均小于对应的分类阈值,则确定所述多媒体资源不是所述目标多媒体资源。
根据本公开实施例的第三方面,提供一种多媒体资源检测设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述多媒体资源的检测方法。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由多媒体资源检测设备的处理器执行时,使得多媒体资源检测设备能够执行上述多媒体资源的检测方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过获取当前多媒体资源检测期望的召回率,并根据预存的召回率与阈值组合的映射关系,确定与召回率对应的多个分类模型使用的阈值组合,由于该阈值组合是在召回率下获得最高检测准确率的组合,即使用采用该阈值组合的多个分类模型检测多媒体资源得到的检测准确率最高,也即使用采用该阈值组合的多个分类模型检测多媒体资源,可以提高多媒体资源的检测准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是本公开一示例性实施例示出的一种多媒体资源的检测方法的流程图。
图2是本公开一示例性实施例示出的一种记录并保存每个召回率下的最高检测准确率及其对应的阈值组合的流程图。
图3是本公开一示例性实施例示出的一种多媒体资源检测装置的框图。
图4是本公开一示例性实施例示出的另一种多媒体资源检测装置的框图。
图5是本公开一示例性实施例示出的另一种多媒体资源检测装置的框图。
图6是本公开一示例性实施例示出的另一种多媒体资源检测装置的框图。
图7是本公开一示例性实施例示出的一种多媒体资源检测设备的框图。
图8是本公开一示例性实施例示出的一种适用于多媒体资源检测装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是本公开一示例性实施例示出的一种多媒体资源的检测方法的流程图,如图1所示,该多媒体资源的检测方法可应用于多媒体资源检测设备,该方法用于从待检测的多媒体资源集合中检测出目标多媒体资源,该多媒体资源的检测方法包括以下步骤:
在步骤S101中,获取当前多媒体资源检测期望的召回率,该召回率是目标多媒体资源的检测数据量在实际数据量的占比,实际数据量是多媒体资源集合中实际包括的目标多媒体资源的数据量。
在该实施例中,多媒体资源检测设备可以获取当前业务需求,当前业务需求可以为目标多媒体资源期望的检测数据量。
其中,目标多媒体资源是指存在问题的多媒体资源,当前待检测的多媒体资源可以包括但不局限于视频或图像等。
多媒体资源检测设备在获得目标多媒体资源期望的检测数据量之后,可以计算目标多媒体资源期望的检测数据量在当前多媒体资源集合中实际包括的目标多媒体资源的数据量的占比,该占比即为当前多媒体资源检测期望的召回率。
在步骤S102中,根据预存的召回率与阈值组合的映射关系,确定与该召回率对应的多个分类模型使用的阈值组合;其中,上述阈值组合包括多个分类模型分别对应使用的分类阈值,并且阈值组合是在召回率下获得最高检测准确率的组合。
为了确定与该召回率对应的多个分类模型使用的阈值组合,在该实施例中,可以预先保存有每个召回率下的最高检测准确率及其对应的阈值组合。
例如,分类模型为n个,则预存的对应关系可以为(C1,P1,R11、R12……R1n),(C2,P2,R21、R12……R2n)……(Cm,Pm,Rm1、Rm2……Rmn),其中,Pi为Ci下最高检测准确率,Ri1、Ri2……Rin分别为这n个分类模型对应的分类阈值,即Ri1、Ri2……Rin为这n个分类模型对应的分类阈值组合,其中,i为大于等于1小于等于m的整数。
在该实施例中,在获取检测期望的召回率之后,可以根据预存的召回率与阈值组合的映射关系,确定与该召回率对应的多个分类模型使用的阈值组合。
由于该阈值组合是在召回率下获得最高检测准确率的组合,因此,使用采用该阈值组合的多个分类模型检测多媒体资源得到的检测准确率最高,即使用该阈值组合的多个分类模型检测多媒体资源可以提高检测准确率。
在步骤S103中,对于多媒体资源集合中的任一多媒体资源,分别通过多个分类模型对多媒体资源进行分类处理,得到多个分类模型分别输出的分类信息,该分类信息用于表示多媒体资源是目标多媒体资源的概率。
在步骤S104中,若多个分类模型中的至少一个分类模型满足:分类模型输出的分类信息大于或等于分类模型对应使用的分类阈值,则确定多媒体资源是目标多媒体资源。
可选地,该多媒体资源的检测方法还可以包括:若所有分类模型输出的分类信息均小于对应的分类阈值,则确定多媒体资源不是目标多媒体资源。
例如,多个分类模型为模型1、模型2……模型n,模型1、模型2……模型n对应的分类阈值分别为R1、R2……Rn,待检测视频1输入这多个分类模型后得到的多个分类信息分别为T1、T2……Tn,如果T1<R1,T2<R2,……Tn<Rn,则该待检测视频1不是目标视频,即待检测视频1不存在问题,若T1>R1,则该待检测视频1是目标视频,即待检测视频1存在问题。
上述实施例,通过获取当前多媒体资源检测期望的召回率,并根据预存的召回率与阈值组合的映射关系,确定与召回率对应的多个分类模型使用的阈值组合,由于该阈值组合是在召回率下获得最高检测准确率的组合,即使用采用该阈值组合的多个分类模型检测多媒体资源得到的检测准确率最高,也即使用采用该阈值组合的多个分类模型检测多媒体资源,可以提高多媒体资源的检测准确率。
图2是本公开一示例性实施例示出的一种记录并保存每个召回率下的最高检测准确率及其对应的阈值组合的流程图,如图2所示,在上述步骤S102之前,该多媒体资源的检测方法还可以包括:
在步骤S201中,获得多媒体资源样本数据。
其中,多媒体资源样本数据包括存在问题的多媒体资源样本数据和不存在问题的多媒体资源样本数据,且可以通过标签(label)对多媒体资源样本数据进行标记,例如,对于存在问题的多媒体资源样本数据,即目标多媒体资源样本数据,可以将label置为1。
在步骤S202中,在预设区间内,按照预设遍历规律获得多个分类模型的所有阈值组合。
其中,按照预设遍历规律获得多个分类模型的所有阈值组合可以为:针对每个分类模型,按顺序依次增加一个预设阈值变化量,预设区间为[0,1],该阈值变化量可以为x(x∈[0,1],且mx∈[0,1],m∈N,N为正整数),换句话说,多个x的整数倍也在[0,1]中。
例如,对于n个分类模型,第i个分类模型的分类阈值记为ti,假设阈值变化量x为0.1,则tn为0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1中的任一个,t(n-1)为0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1中的任一个,以此类推,每个分类模型的阈值遍历所有的取值,可以得到这n个分类模型的所有阈值组合。
需要说明的是,本实施例中阈值变化量x为0.1仅用于举例说明,x的值可以是[0,1]中,且多个x的整数倍也在[0,1]中的任一数值,例如x还可以是0.15、0.2、0.23等。
在步骤S203中,利用每个阈值组合更新多个分类模型,并利用更新后的多个分类模型对多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率。
其中,针对每个阈值组合,获取利用更新后的每个分类模型需要检测出的目标多媒体资源数据,对获取的所有需要检测出的目标多媒体资源数据进行合并,得到第一数据集合;利用更新后的多个分类模型对多媒体资源样本数据进行检测,得到多个目标多媒体资源样本数据,对多个目标多媒体资源样本数据进行合并,得到第二数据集合;基于第一数据集合、第二数据集合和多媒体资源样本数据中的目标多媒体资源样本数据,计算每个阈值组合对应的召回率和检测准确率。
其中,对获取的所有需要检测出的目标多媒体资源数据进行合并的方式可以为:从获取的所有需要检测出的目标多媒体资源数据中去除重复数据。对多个目标多媒体资源样本数据进行合并的方式为:从多个目标多媒体资源样本数据中去除重复数据。
在该实施例中,利用每个阈值组合更新识别模型,并利用更新后的识别模型对多媒体资源样本数据进行检测,若检测到多媒体资源样本数据为目标多媒体资源样本数据,则可以将其label置为1。
在该实施例中,可以将第二数据集合中预先被标记为目标多媒体资源的样本数据量与多媒体资源样本数据中目标多媒体资源样本数据量的第一比值作为召回率,将第二数据集合中预先被标记为目标多媒体资源的样本数据量与第一数据集合中的数据量的第二比值作为检测准确率。
在步骤S204中,记录并保存每个召回率下的最高检测准确率及其对应的阈值组合。
对于同一召回率,若当前获得的检测准确率大于已存在的检测准确率,则记录当前获得的检测准确率,否则,维持之前记录的检测准确率。
在记录并保存每个召回率下的最高检测准确率时,记录并保存最高准确率对应的阈值组合。
可选地,可以根据每个召回率下的最高检测准确率生成变化曲线,例如,以召回率为横轴,以检测准确为纵轴,根据每个召回率及其对应的最高检测准确率确定多个点,将这些点连接起来,生成变化曲线,以方便根据该业务曲线和召回率确定对应的检测准确率。
其中,每个召回率下的最高检测准确率及其对应的阈值组合可以保存在数据库中。
上述实施例,通过在预设区间内,按照预设遍历规律获得多个分类模型的所有阈值组合,利用每个阈值组合更新多个分类模型,并利用更新后的多个分类模型对多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率,记录并保存每个召回率下的最高检测准确率及其对应的阈值组合,为后续根据召回率确定与该召回率对应的多个分类模型使用的阈值组合提供条件。
图3是本公开一示例性实施例示出的一种多媒体资源检测装置的框图,该装置用于从待检测的多媒体资源集合中检测出目标多媒体资源。参照图3,该装置包括:
获取模块31被配置为获取当前多媒体资源检测期望的召回率,召回率是目标多媒体资源的检测数据量在实际数据量的占比,实际数据量是多媒体资源集合中实际包括的目标多媒体资源的数据量。
确定模块32被配置为根据预存的召回率与阈值组合的映射关系,确定与获取模块31获取的召回率对应的多个分类模型使用的阈值组合;其中,阈值组合包括多个分类模型分别对应使用的分类阈值,并且阈值组合是在召回率下获得最高检测准确率的组合。
处理模块33被配置为对于多媒体资源集合中的任一多媒体资源,分别通过使用确定模块32确定的阈值组合的多个分类模型对多媒体资源进行分类处理,得到多个分类模型分别输出的分类信息,分类信息用于表示多媒体资源是目标多媒体资源的概率。
第一检测模块34被配置为若多个分类模型中的至少一个分类模型满足:处理模块33得到的分类模型输出的分类信息大于或等于分类模型对应使用的分类阈值,则确定多媒体资源是目标多媒体资源。
上述实施例,通过获取当前多媒体资源检测期望的召回率,并根据预存的召回率与阈值组合的映射关系,确定与召回率对应的多个分类模型使用的阈值组合,由于该阈值组合是在召回率下获得最高检测准确率的组合,即使用采用该阈值组合的多个分类模型检测多媒体资源得到的检测准确率最高,也即使用采用该阈值组合的多个分类模型检测多媒体资源,可以提高多媒体资源的检测准确率。
图4是本公开一示例性实施例示出的另一种多媒体资源检测装置的框图,如图4所示,在图3所示实施例的基础上,该多媒体资源检测装置还可以包括:
第一获得模块35被配置为在确定模块32根据预存的召回率与阈值组合的映射关系,确定与召回率对应的多个分类模型使用的阈值组合之前,获得多媒体资源样本数据。
第二获得模块36被配置为在预设区间内,按照预设遍历规律获得多个分类模型的所有阈值组合。
更新检测模块37被配置为利用第二获得模块36获得的每个阈值组合更新多个分类模型,并利用更新后的多个分类模型对多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率。
记录保存模块38被配置为记录并保存更新检测模块37得到的每个召回率下的最高检测准确率及其对应的阈值组合。
图5是本公开一示例性实施例示出的另一种多媒体资源检测装置的框图,如图5所示,在图3所示实施例的基础上,更新检测模块37可以包括:
第一获取子模块371被配置为针对每个阈值组合,获取利用更新后的每个分类模型需要检测出的目标多媒体资源数据。
第一合并子模块372被配置为对第一获取模块371获取的所有需要检测出的目标多媒体资源数据进行合并,得到第一数据集合。
检测子模块373被配置为利用更新后的多个分类模型对多媒体资源样本数据进行检测,得到多个目标多媒体资源样本数据。
第二合并子模块374被配置为对检测子模块373得到的多个目标多媒体资源样本数据进行合并,得到第二数据集合。
第一计算子模块375计算第二合并子模块374得到的第二数据集合中预先被标记为目标多媒体资源的样本数据量与多媒体资源样本数据中目标多媒体资源样本数据量的第一比值,并将第一比值作为当前阈值组合对应的召回率。
第二计算子模块376计算第二合并子模块374得到的第二数据集合中预先被标记为目标多媒体资源的样本数据量与第一合并子模块372得到的第一数据集合中的数据量的第二比值,并将第二比值作为当前阈值组合对应的检测准确率。
图6是本公开一示例性实施例示出的另一种多媒体资源检测装置的框图,如图6所示,在图3所示实施例的基础上,该装置还可以包括:
第二检测模块35被配置为若处理模块33得到的所有分类模型输出的分类信息均小于对应的分类阈值,则确定多媒体资源不是目标多媒体资源。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是本公开一示例性实施例示出的一种多媒体资源检测设备的框图。如图7所示,该业务多媒体资源检测设备包括处理器710、用于存储处理器710可执行指令的存储器720;其中,处理器被配置为执行上述指令,以实现上述多媒体资源的检测方法。除了图7所示的处理器710及存储器720之外,该业务多媒体资源检测设备通常根据信息发送的实际功能,还可以包括其他硬件,对此不再赘述。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器720,上述指令可由处理器710执行以完成上述多媒体资源的检测方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图8是根据一示例性实施例示出的一种适用于多媒体资源检测装置的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端设备。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
处理组件802中的其中一个处理器820可以被配置为:
获取当前多媒体资源检测期望的召回率,召回率是目标多媒体资源的检测数据量在实际数据量的占比,实际数据量是多媒体资源集合中实际包括的目标多媒体资源的数据量;
根据预存的召回率与阈值组合的映射关系,确定与召回率对应的多个分类模型使用的阈值组合;其中,阈值组合包括多个分类模型分别对应使用的分类阈值,并且阈值组合是在召回率下获得最高检测准确率的组合;
对于多媒体资源集合中的任一多媒体资源,分别通过多个分类模型对多媒体资源进行分类处理,得到多个分类模型分别输出的分类信息,分类信息用于表示多媒体资源是目标多媒体资源的概率;
若多个分类模型中的至少一个分类模型满足:分类模型输出的分类信息大于或等于分类模型对应使用的分类阈值,则确定多媒体资源是目标多媒体资源。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述多媒体资源的检测方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (8)
1.一种多媒体资源的检测方法,所述方法用于从待检测的多媒体资源集合中检测出目标多媒体资源,其特征在于,所述方法包括:
获取当前多媒体资源检测期望的召回率,所述召回率是所述目标多媒体资源的检测数据量在实际数据量的占比,所述实际数据量是所述多媒体资源集合中实际包括的所述目标多媒体资源的数据量;
根据预存的召回率与阈值组合的映射关系,确定与所述召回率对应的多个分类模型使用的阈值组合;其中,所述阈值组合包括所述多个分类模型分别对应使用的分类阈值,并且所述阈值组合是在所述召回率下获得最高检测准确率的组合;
对于所述多媒体资源集合中的任一多媒体资源,分别通过所述多个分类模型对所述多媒体资源进行分类处理,得到所述多个分类模型分别输出的分类信息,所述分类信息用于表示所述多媒体资源是所述目标多媒体资源的概率;
若所述多个分类模型中的至少一个分类模型满足:所述分类模型输出的所述分类信息大于或等于所述分类模型对应使用的分类阈值,则确定所述多媒体资源是所述目标多媒体资源;
其中,在所述根据预存的召回率与阈值组合的映射关系,确定与所述召回率对应的多个分类模型使用的阈值组合之前,所述多媒体资源的检测方法还包括:
获得多媒体资源样本数据;
在预设区间内,按照预设遍历规律获得所述多个分类模型的所有阈值组合;
利用每个阈值组合更新所述多个分类模型,并利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率;
记录并保存每个所述召回率下的最高检测准确率及其对应的阈值组合;
其中,所述利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率,包括:
针对每个阈值组合,获取利用更新后的每个分类模型需要检测出的目标多媒体资源数据;
对获取的所有需要检测出的目标多媒体资源数据进行合并,得到第一数据集合;
利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到多个目标多媒体资源样本数据;
对所述多个目标多媒体资源样本数据进行合并,得到第二数据集合;
计算所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述多媒体资源样本数据中目标多媒体资源样本数据量的第一比值,并将所述第一比值作为当前阈值组合对应的所述召回率;
计算所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述第一数据集合中的数据量的第二比值,并将所述第二比值作为当前阈值组合对应的所述检测准确率。
2.根据权利要求1所述的多媒体资源的检测方法,其特征在于,所述对获取的所有需要检测出的目标多媒体资源数据进行合并,包括:
从获取的所有需要检测出的目标多媒体资源数据中去除重复数据;或者
所述对所述多个目标多媒体资源样本数据进行合并,包括:
从所述多个目标多媒体资源样本数据中去除重复数据。
3.根据权利要求1所述的多媒体资源的检测方法,其特征在于,所述多媒体资源的检测方法还包括:
若所有分类模型输出的分类信息均小于对应的分类阈值,则确定所述多媒体资源不是所述目标多媒体资源。
4.一种多媒体资源的检测装置,所述装置用于从待检测的多媒体资源集合中检测出目标多媒体资源,其特征在于,所述装置包括:
获取模块,被配置为获取当前多媒体资源检测期望的召回率,所述召回率是所述目标多媒体资源的检测数据量在实际数据量的占比,所述实际数据量是所述多媒体资源集合中实际包括的所述目标多媒体资源的数据量;
确定模块,被配置为根据预存的召回率与阈值组合的映射关系,确定与所述获取模块获取的所述召回率对应的多个分类模型使用的阈值组合;其中,所述阈值组合包括所述多个分类模型分别对应使用的分类阈值,并且所述阈值组合是在所述召回率下获得最高检测准确率的组合;
处理模块,被配置为对于所述多媒体资源集合中的任一多媒体资源,分别通过使用所述确定模块确定的所述阈值组合的所述多个分类模型对所述多媒体资源进行分类处理,得到所述多个分类模型分别输出的分类信息,所述分类信息用于表示所述多媒体资源是所述目标多媒体资源的概率;
第一检测模块,被配置为若所述多个分类模型中的至少一个分类模型满足:所述处理模块得到的所述分类模型输出的所述分类信息大于或等于所述分类模型对应使用的分类阈值,则确定所述多媒体资源是所述目标多媒体资源;
其中,所述多媒体资源的检测装置还包括:
第一获得模块,被配置为在所述确定模块根据预存的召回率与阈值组合的映射关系,确定与所述召回率对应的多个分类模型使用的阈值组合之前,获得多媒体资源样本数据;
第二获得模块,被配置为在预设区间内,按照预设遍历规律获得所述多个分类模型的所有阈值组合;
更新检测模块,被配置为利用所述第二获得模块获得的每个阈值组合更新所述多个分类模型,并利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到每个阈值组合对应的召回率和检测准确率;
记录保存模块,被配置为记录并保存所述更新检测模块得到的每个所述召回率下的最高检测准确率及其对应的阈值组合;
其中,所述更新检测模块包括:
第一获取子模块,被配置为针对每个阈值组合,获取利用更新后的每个分类模型需要检测出的目标多媒体资源数据;
第一合并子模块,被配置为对所述第一获取子模块获取的所有需要检测出的目标多媒体资源数据进行合并,得到第一数据集合;
检测子模块,被配置为利用更新后的多个分类模型对所述多媒体资源样本数据进行检测,得到多个目标多媒体资源样本数据;
第二合并子模块,被配置为对所述检测子模块得到的所述多个目标多媒体资源样本数据进行合并,得到第二数据集合;
第一计算子模块,计算所述第二合并子模块得到的所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述多媒体资源样本数据中目标多媒体资源样本数据量的第一比值,并将所述第一比值作为当前阈值组合对应的所述召回率;
第二计算子模块,计算所述第二合并子模块得到的所述第二数据集合中预先被标记为所述目标多媒体资源的样本数据量与所述第一合并子模块得到的所述第一数据集合中的数据量的第二比值,并将所述第二比值作为当前阈值组合对应的所述检测准确率。
5.根据权利要求4所述的多媒体资源的检测装置,其特征在于,所述第一合并子模块,被配置为:
从获取的所有需要检测出的目标多媒体资源数据中去除重复数据;或者
所述第二合并子模块,被配置为:
从所述多个目标多媒体资源样本数据中去除重复数据。
6.根据权利要求4所述的多媒体资源的检测装置,其特征在于,所述多媒体资源的检测装置还包括:
第二检测模块,被配置为若所述处理模块得到的所有分类模型输出的分类信息均小于对应的分类阈值,则确定所述多媒体资源不是所述目标多媒体资源。
7.一种多媒体资源检测设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至3中任一项所述的多媒体资源的检测方法。
8.一种存储介质,其特征在于,当所述存储介质中的指令由多媒体资源检测设备的处理器执行时,使得多媒体资源检测设备能够执行如权利要求1至3中任一项所述的多媒体资源的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911403935.3A CN111125388B (zh) | 2019-12-30 | 2019-12-30 | 多媒体资源的检测方法、装置及设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911403935.3A CN111125388B (zh) | 2019-12-30 | 2019-12-30 | 多媒体资源的检测方法、装置及设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111125388A CN111125388A (zh) | 2020-05-08 |
CN111125388B true CN111125388B (zh) | 2023-12-15 |
Family
ID=70505886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911403935.3A Active CN111125388B (zh) | 2019-12-30 | 2019-12-30 | 多媒体资源的检测方法、装置及设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111125388B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984899A (zh) * | 2020-08-19 | 2020-11-24 | 北京达佳互联信息技术有限公司 | 多媒体数据的处理方法、装置、设备及存储介质 |
CN114722970B (zh) * | 2022-05-12 | 2022-08-26 | 北京瑞莱智慧科技有限公司 | 一种多媒体检测方法、装置及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776842A (zh) * | 2016-11-28 | 2017-05-31 | 腾讯科技(上海)有限公司 | 多媒体数据检测方法及装置 |
WO2017117234A1 (en) * | 2016-01-03 | 2017-07-06 | Gracenote, Inc. | Responding to remote media classification queries using classifier models and context parameters |
CN108921206A (zh) * | 2018-06-15 | 2018-11-30 | 北京金山云网络技术有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
CN109189950A (zh) * | 2018-09-03 | 2019-01-11 | 腾讯科技(深圳)有限公司 | 多媒体资源分类方法、装置、计算机设备及存储介质 |
CN109614987A (zh) * | 2018-11-08 | 2019-04-12 | 北京字节跳动网络技术有限公司 | 多分类模型优化方法、装置、存储介质及电子设备 |
CN110135505A (zh) * | 2019-05-20 | 2019-08-16 | 北京达佳互联信息技术有限公司 | 图像分类方法、装置、计算机设备及计算机可读存储介质 |
US10462026B1 (en) * | 2016-08-23 | 2019-10-29 | Vce Company, Llc | Probabilistic classifying system and method for a distributed computing environment |
CN110585726A (zh) * | 2019-09-16 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 用户召回方法、装置、服务器及计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10289949B2 (en) * | 2015-09-29 | 2019-05-14 | International Business Machines Corporation | Incident prediction and response using deep learning techniques and multimodal data |
-
2019
- 2019-12-30 CN CN201911403935.3A patent/CN111125388B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017117234A1 (en) * | 2016-01-03 | 2017-07-06 | Gracenote, Inc. | Responding to remote media classification queries using classifier models and context parameters |
US10462026B1 (en) * | 2016-08-23 | 2019-10-29 | Vce Company, Llc | Probabilistic classifying system and method for a distributed computing environment |
CN106776842A (zh) * | 2016-11-28 | 2017-05-31 | 腾讯科技(上海)有限公司 | 多媒体数据检测方法及装置 |
CN108921206A (zh) * | 2018-06-15 | 2018-11-30 | 北京金山云网络技术有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
CN109189950A (zh) * | 2018-09-03 | 2019-01-11 | 腾讯科技(深圳)有限公司 | 多媒体资源分类方法、装置、计算机设备及存储介质 |
CN109614987A (zh) * | 2018-11-08 | 2019-04-12 | 北京字节跳动网络技术有限公司 | 多分类模型优化方法、装置、存储介质及电子设备 |
CN110135505A (zh) * | 2019-05-20 | 2019-08-16 | 北京达佳互联信息技术有限公司 | 图像分类方法、装置、计算机设备及计算机可读存储介质 |
CN110585726A (zh) * | 2019-09-16 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 用户召回方法、装置、服务器及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111125388A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108496317B (zh) | 剩余关键系统信息的公共资源集合的查找方法及装置 | |
CN111539443A (zh) | 一种图像识别模型训练方法及装置、存储介质 | |
CN106919629B (zh) | 在群聊中实现信息筛选的方法及装置 | |
CN106372204A (zh) | 推送消息处理方法及装置 | |
CN109447125B (zh) | 分类模型的处理方法、装置、电子设备及存储介质 | |
CN111125388B (zh) | 多媒体资源的检测方法、装置及设备和存储介质 | |
CN109214175B (zh) | 基于样本特征训练分类器的方法、装置及存储介质 | |
CN112445832A (zh) | 数据异常检测方法、装置、电子设备及存储介质 | |
CN110738267B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
CN107316207B (zh) | 一种获取展示效果信息的方法和装置 | |
CN105657690A (zh) | 移动终端设置信息的处理方法和装置 | |
CN112948704A (zh) | 用于信息推荐的模型训练方法、装置、电子设备以及介质 | |
CN112486770B (zh) | 客户端打点上报方法、装置、电子设备和存储介质 | |
CN114124866A (zh) | 会话处理方法、装置、电子设备及存储介质 | |
CN113609380A (zh) | 标签体系更新方法、搜索方法、装置以及电子设备 | |
CN105101076B (zh) | 信息提醒方法及装置 | |
CN111382161A (zh) | 状态数据处理方法、装置、电子设备及存储介质 | |
CN108012258B (zh) | 虚拟sim卡的数据流量管理方法、装置、终端及服务器 | |
CN112784151A (zh) | 一种确定推荐信息的方法及相关装置 | |
CN106851418B (zh) | 视频推荐方法及装置 | |
CN112333233B (zh) | 事件信息的上报方法、装置、电子设备及存储介质 | |
CN104461536A (zh) | 运算处理方法及装置 | |
CN112017640A (zh) | 唤醒决策方法、装置、电子设备及存储介质 | |
CN111680248A (zh) | 一种生成消息的推送批次号的方法及装置 | |
CN111401048B (zh) | 一种意图识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |