Nothing Special   »   [go: up one dir, main page]

CN108170845B - 多媒体数据处理方法、装置及存储介质 - Google Patents

多媒体数据处理方法、装置及存储介质 Download PDF

Info

Publication number
CN108170845B
CN108170845B CN201810044934.3A CN201810044934A CN108170845B CN 108170845 B CN108170845 B CN 108170845B CN 201810044934 A CN201810044934 A CN 201810044934A CN 108170845 B CN108170845 B CN 108170845B
Authority
CN
China
Prior art keywords
multimedia data
processed
multimedia
preset
novelty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810044934.3A
Other languages
English (en)
Other versions
CN108170845A (zh
Inventor
张龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN201810044934.3A priority Critical patent/CN108170845B/zh
Publication of CN108170845A publication Critical patent/CN108170845A/zh
Application granted granted Critical
Publication of CN108170845B publication Critical patent/CN108170845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/436Filtering based on additional data, e.g. user or group profiles using biological or physiological data of a human being, e.g. blood pressure, facial expression, gestures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种多媒体数据处理方法、装置及存储介质,该方法包括:接收待处理多媒体数据,并获取待处理多媒体数据的属性信息,其中属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;在多个标签列表一致时,根据多媒体数目和多媒体播放量生成待处理多媒体数据的热门度,并根据多媒体标识生成待处理多媒体数据的新颖度;在热门度小于预设热门阈值,且新颖度大于预设新颖阈值时,获取待处理多媒体数据的用户信息;根据用户信息对应的历史多媒体数据信息,待处理多媒体数据的多个标签列表、热门度和新颖度,处理待处理多媒体数据。本发明提高了处理多媒体数据的准确性。

Description

多媒体数据处理方法、装置及存储介质
技术领域
本发明涉及多媒体技术领域,尤其涉及一种多媒体数据处理方法、装置及存储介质。
背景技术
随着终端的不断普及,用户可以通过终端获取越来越多的信息。以音乐为例,音乐是人们生活中一项重要的消费元素,尤其是终端的普及使得用户可以方便的通过终端获取音乐信息。
为了使用户快速获取到想要的音乐数据,越来越多的音乐应用提供了音乐数据推送服务。比如,请参阅图1,图1是现有技术中的音乐播放界面,在该界面中,音乐应用服务商设置了歌单推送按钮a,用户可以通过点击歌单推送按钮a,将自己编辑的歌单推送至音乐应用服务商。
音乐应用服务商在接收到这些歌单后,有两种处理方式,一种是由后台工作人员对歌单进行审核处理,然后推送给其它用户;另一种是机器审核,即对歌单标题内容、歌单图片等单一变量进行检测。
上述两种处理方式中,如果由后台工作人员审核处理,容易产生歌单积压,部分优质歌单被误审为普通歌单的问题。如果采用机器审核,则存在只对单一变量进行较浅层次检测的问题,导致歌单处理的准确率过低。
发明内容
本发明实施例提供一种多媒体数据处理方法、装置及存储介质,可以提高多媒体数据处理的准确率。
本发明实施例提供一种多媒体数据处理方法,包括:
接收待处理多媒体数据,并获取所述待处理多媒体数据的属性信息,其中所述属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;
判断所述多个标签列表是否一致,若一致,则根据所述多媒体数目和所述多媒体播放量生成所述待处理多媒体数据的热门度,并根据所述多媒体标识生成所述待处理多媒体数据的新颖度;
对所述热门度和所述新颖度进行分析处理,若所述热门度小于预设热门阈值,且所述新颖度大于预设新颖阈值,则获取所述待处理多媒体数据的用户信息;以及
根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据。
本发明实施例还提供一种多媒体数据处理装置,包括:
接收模块,用于接收待处理多媒体数据,并获取所述待处理多媒体数据的属性信息,其中所述属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;
判断模块,用于判断所述多个标签列表是否一致,若一致,则根据所述多媒体数目和所述多媒体播放量生成所述待处理多媒体数据的热门度,并根据所述多媒体标识生成所述待处理多媒体数据的新颖度;
分析模块,用于对所述热门度和所述新颖度进行分析处理,若所述热门度小于预设热门阈值,且所述新颖度大于预设新颖阈值,则获取所述待处理多媒体数据的用户信息;以及
处理模块,用于根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据。
本发明实施例还提供一种存储介质,其内存储有处理器可执行指令,该处理器通过执行所述指令提供如上述的多媒体数据处理方法。
本发明实施例的多媒体数据处理方法、装置及存储介质,通过先获取待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识。再对标签列表的一致性进行分析,在一致时,根据多媒体数目和多媒体播放量生成热门度,并根据多媒体标识生成新颖度。在热门度小于预设热门阈值,且新颖度大于预设新颖阈值时,获取待处理多媒体数据的用户信息对应的历史多媒体数据信息。最后根据该历史多媒体数据信息、标签列表、热门度和新颖度来处理该待处理多媒体数据。该方案不仅对待处理多媒体数据的多个检测变量进行了一致性分析,还从深层次对待处理多媒体数据进行了分析,有效的提高了待处理多媒体数据处理的准确率。
附图说明
下面结合附图,通过对本发明的具体实施方式详细描述,将使本发明的技术方案及其它有益效果显而易见。
图1为本发明实施例提供的现有音乐播放界面示意图。
图2为本发明实施例提供的多媒体数据处理方法的场景示意图。
图3为本发明实施例提供的多媒体数据处理方法的流程示意图。
图4为本发明实施例提供的标签列表的形成示意图。
图5为本发明实施例提供的标签与主词的映射关系示意图。
图6为本发明实施例提供的标签列表的另一形成示意图。
图7为本发明实施例提供的多媒体数据处理方法的另一流程示意图。
图8为本发明实施例提供的处理待处理图片的场景示意图。
图9为本发明实施例提供的标签列表的又一形成示意图。
图10为本发明实施例提供的多媒体数据处理装置的结构示意图。
图11为本发明实施例提供的接收模块的结构示意图。
图12为本发明实施例提供的判断模块的结构示意图。
图13为本发明实施例提供的处理模块的结构示意图。
图14为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图2,该图为本发明实施例提供的多媒体数据处理方法的场景示意图,该场景中,多媒体数据处理装置可以作为实体来实现,也可以集成在终端或服务器等电子设备来实现,该电子设备可以包括智能手机、平板电脑和个人计算机等。
如图2所示,该场景中可以包括终端a、服务器b和终端c,其中终端a、终端c可以为智能手机、个人计算机等。待处理多媒体数据的作者可以利用终端a向服务器b上传该待处理多媒体数据。服务器b先接收该待处理多媒体数据,并获取该待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,该多个标签列表用于一类待处理多媒体数据。然后判断该多个标签列表是否一致,在多个标签列表一致时根据多媒体数目和多媒体播放量生成该待处理多媒体数据的热门度,并根据多媒体标识生成该待处理多媒体数据的新颖度。再对热门度和新颖度进行分析处理,在热门度小于预设热门阈值,且新颖度大于预设新颖阈值时,获取该待处理多媒体数据的用户信息。最后根据该用户信息对应的历史多媒体数据信息,该待处理多媒体数据的多个标签列表、热门度和新颖度,处理该待处理多媒体数据,比如删除该待处理多媒体数据或保留该待处理多媒体数据。进一步的,服务器b可以将保留的待处理多媒体数据发送给终端c,由专业人员利用终端c对该保留的待处理多媒体数据进行进一步处理。
本发明实施例提供一种多媒体数据处理方法、装置及存储介质,以下将分别进行详细说明。
在本发明实施例中,将从多媒体数据处理装置的角度进行描述,该多媒体数据处理装置具体可以集成在电子设备中。
一种多媒体数据处理方法,包括:接收待处理多媒体数据,并获取该待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;判断该多个标签列表是否一致,若一致,则根据该多媒体数目和该多媒体播放量生成该待处理多媒体数据的热门度,并根据该多媒体标识生成该待处理多媒体数据的新颖度;对该热门度和该新颖度进行分析处理,若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,则获取该待处理多媒体数据的用户信息;以及根据该用户信息对应的历史多媒体数据信息,该待处理多媒体数据的该多个标签列表、该热门度和该新颖度,处理该待处理多媒体数据。
请参照图3,图3为本发明实施例提供的多媒体数据处理方法的流程图,该方法可以包括:
步骤S101,接收待处理多媒体数据,并获取该待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识。
从文件类型角度,可以将多媒体数据划分为音频、视频、图片及文本等不同种类的多媒体数据。如图4所示,多媒体数据以歌单形式展现,其中歌单内有若干首歌曲。该歌单不仅包括音频、视频、图片,还包括歌单标题、歌单描述等文本。多媒体数据的属性信息用于标注各种多媒体数据的本质特征或特性,比如用标签标注音频的风格,又如音频的大小。在本优选实施例中,获取到的待处理多媒体数据的属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识等。
在本发明实施例中,每一类待处理多媒体数据均对应一标签列表,即一标签列表用于标注一类待处理多媒体数据。其中该标签列表中包括一个或多个标签。比如,对于图4中的歌单,从歌单标题“重温粤语经典好歌”中可以提取出标签“粤语”、“经典”,从歌单描述中可以提取出标签“忧郁”、“沧桑”和“经典”,上述标签组成标签列表{粤语,经典,忧郁,沧桑,经典},用于标注歌单中的文本。同理的,对音频“朋友”分析得到标签“粤语”和“流行”,对音频“月半小夜曲”分析得到标签“粤语”和“流行”,依次对该歌单中的所有音频进行分析,得到全部标签,进而组成标签列表{粤语,流行},用于标注歌单中的音频。
步骤S102,判断该多个标签列表是否一致,若一致,则根据该多媒体数目和该多媒体播放量生成该待处理多媒体数据的热门度,并根据该多媒体标识生成该待处理多媒体数据的新颖度。
在具体实施过程中,判断该多个标签列表是否一致的步骤如下:
基于预设映射关系,将标签列表中的标签映射至预设主词库中对应的主词上,以使每一标签列表形成一对应的主词列表。
判断任意两个主词列表是否都具有相同主词。
若任意两个主词列表都具有相同主词,则确定该多个标签列表一致。
假设预设主词库为{治愈,ACG(Animation Comic Game),兴奋},标签与预设主词库中主词的映射关系如图5所示,不同的标签围绕在对应的主词周围,比如主词“治愈”,其与标签“温暖”、“纯音”、“孤独”等存在映射关系。如图6所示,待处理多媒体数据包括待处理文本、待处理图片、待处理音频和待处理视频四种文件类型的多媒体数据。其中,若待处理文本对应的标签列表a1为{清新,情歌,史诗},则对应的主词列表为b1{治愈,兴奋}。若待处理图片对应的标签列表a2为{动画,温暖},则对应的主词列表b2为{ACG,治愈},若待处理音频对应的标签列表a3为{纯音,抒情,激情},则对应的主词列表b3为{治愈,兴奋},待处理视频对应的标签列表a4为{纯音,情歌},则对应的主词列表b4为{治愈}。
将上述主词列表b1、b2、b3和b4两两进行对比,如果任意两个主词列表均具有相同主词,则确定上述标签列表a1、a2、a3和a4一致,如果存在两个主词列表不具有相同主词,则确定上述标签列表a1、a2、a3和a4不一致。由于主词列表b1、b2、b3和b4都具有主词“治愈”,因此可以确定上述标签列表a1、a2、a3和a4一致,也说明待处理多媒体数据中各类多媒体数据的风格是统一的。
若该多个标签不一致,说明待处理多媒体数据中不同文件类型的多媒体数据风格不统一,因此可以将该待处理多媒体数据转移到其他存储设备中存储,也可以直接删除。如果该多个标签一致,则可以进一步对待处理多媒体数据的热门度和新颖度进行检测。
其中,可以根据多媒体数目和多媒体播放量生成该待处理多媒体数据的热门度,具体步骤如下:
根据多媒体数目和多媒体播放量,生成多媒体平均播放量。
根据多媒体平均播放量确定待处理多媒体数据的热门度。
具体的,可以根据如下公式进行计算多媒体平均播放量h:
Figure GDA0002571099360000071
其中,Pi表示第i个多媒体的多媒体播放量,N表示多媒体数量,N为正整数。热门度可以根据多媒体平均播放量所处的播放量等级来确定。比如多媒体数据中包含多首歌曲,则可将歌曲平均播放量超过100万次/月的多媒体数据设置为第一播放量等级,对应第一热门等级;将歌曲平均播放量处于50-100万次/月之间的多媒体数据设置为第二播放量等级,对应第二热门等级。
假设待处理多媒体数据中包括三首歌曲,歌曲播放量分别为100万次/月、50万次/月和30万次/月,则根据上述公式可以计算出待处理多媒体数据的歌曲平均播放量为60万次/月,进而可以得到该待处理多媒体数据的歌曲平均播放量为第二播放量等级,即该待处理多媒体数据为第二热门等级。
在一些实施例中,还可以根据如下公式直接计算热门度hot_score:
Figure GDA0002571099360000081
其中,通过对现有多媒体数据的多媒体平均播放量进行统计,当使Pi以百万次/月为单位时,可以使热门度hot_score的取值处于[0,10]之间。
经过对大量多媒体数据进行统计分析可知,当待处理多媒体数据的热门度hot_score小于0.69时,该待处理多媒体数据对应的多媒体平均播放量P小于5次/月。由于此类待处理多媒体数据使多媒体数据处理装置缺乏足够多的先验知识来进行判定,因此可以将该类待处理多媒体数据保留,以进行下一步检测。而对于热门度hot_score大于6的待处理多媒体数据来说,其内多媒体平均播放量P在百万次/月以上,经统计发现,这类待处理多媒体数据趋向于简单的将热门视频、热门音频汇集,往往其主题不明确,风格不统一,因此可以将其删除。
综上,可以将热门上限值6设置为预设热门阈值,需要说明的是,在此不对预设热门阈值做具体限定。当热门度不小于该热门阈值时,可以将该待处理多媒体数据删除,或者将该待处理多媒体数据转存至其他存储设备。
在具体实施过程中,还可以根据多媒体标识生成待处理多媒体数据的新颖度,具体步骤如下:
获取已保留多媒体数据的多媒体标识。
根据已保留多媒体数据的多媒体标识以及待处理多媒体数据的多媒体标识,确定待处理多媒体数据的新颖度。
具体的,可以根据如下公式计算新颖度N:
Figure GDA0002571099360000082
S为待处理多媒体数据,Si为待处理多媒体数据中第i个多媒体的多媒体标识,其中,n>=i>0,i为正整数,n为待处理多媒体数据中的多媒体数量。K为已保留多媒体数据,Kj为已保留多媒体数据中第j个多媒体的多媒体标识。其中,m>=j>0,j为正整数,m为已保留多媒体数据中的多媒体数量。
优选的,可以设置一预设新颖阈值,当大于该预设新颖阈值时,说明该待处理多媒体数据与已保留多媒体数据的相似度较小。当不大于该预设新颖时,说明该待处理多媒体数据与已保留多媒体数据的相似度较高,为了提高多媒体数据的丰富程度,可以删除该待处理多媒体数据,或者将该待处理多媒体数据转存至其他存储设备。
步骤S103,对该热门度和该新颖度进行分析处理,若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,则获取该待处理多媒体数据的用户信息。
其中,若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,说明待处理多媒体数据不是过热数据,且与已保留多媒体数据相似度不高,因此可以进一步获取该待处理多媒体数据的用户信息进行分析。其中,用户信息包括该待处理多媒体数据的作者。如图4所示的歌单,作者为金鱼姬,即该歌单对应的用户信息。
步骤S104,根据该用户信息对应的历史多媒体数据信息,该待处理多媒体数据的该多个标签列表、该热门度和该新颖度,处理该待处理多媒体数据。
其中,历史多媒体数据信息包括历史多媒体数据评分、历史多媒体数据数量等信息。具体的,可以将已保留的多媒体数据作为训练集,把上述历史多媒体数据信息,该待处理多媒体数据的多个标签列表、热门度和新颖度作为特征值,输入逻辑回归模型(LogisticRegression)进行训练,来判断该待处理多媒体数据是否为符合要求的多媒体数据。
由上述可知,本发明实施例提供的多媒体数据处理方法,通过先获取待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识。再对标签列表的一致性进行分析,在一致时,根据多媒体数目和多媒体播放量生成热门度,并根据多媒体标识生成新颖度。在热门度小于预设热门阈值,且新颖度大于预设新颖阈值时,获取待处理多媒体数据的用户信息对应的历史多媒体数据信息。最后根据该历史多媒体数据信息、标签列表、热门度和新颖度来处理该待处理多媒体数据。该方案不仅对待处理多媒体数据的多个检测变量进行了一致性分析,还从深层次对待处理多媒体数据进行了分析,有效的提高了待处理多媒体数据处理的准确率。
根据上述实施例描述的多媒体数据处理方法,以下将举例作进一步说明。在本发明实施例中,将从多媒体数据处理装置的角度进行描述,该多媒体数据处理装置具体可以集成在电子设备中。
请参照图7,图7为本发明实施例提供的多媒体数据处理方法的另一流程图,该方法可以包括:
步骤S201,接收待处理多媒体数据,并获取该待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识。
如图8所示,当待处理多媒体数据包括待处理图片时,步骤S201中获取待处理多媒体数据的属性信息包括:提取待处理图片的噪声值、模糊度及曝光度,按照预设公式对待处理图片进行计算,生成打分结果。判断打分结果是否小于预设分数阈值。若该打分结果不小于预设分数阈值,则提取待处理图片的标签,以形成该标签列表。
具体的,可以采用如下预设公式进行计算:
score=1-0.8*blur-0.1*noise-0.1*abs(exposure)
其中,score为打分结果,blur为模糊度,noise为噪声值,exposure为曝光度,abs()为绝对值函数。若打分结果score小于预设分数阈值,说明待处理图片质量不达标,因此可以删除待处理多媒体数据,或者将该待处理多媒体数据转存至其他存储设备中。若打分结果score不小于预设分数阈值,则可以进一步对待处理图片进行分析,以得到其对应的标签,形成标签列表。
具体的,可以采用CNN(Convolutional Neural Network,卷积神经网络)、DBN(Deep Belief Network,深度信念网络)、RNN(Recurrent Neural Network,循环神经网络)、递归神经张量网络等网络模型,进行图像识别、人脸检测,以提取出待处理图片的标签。比如,对图8中的图片进行分析,得到图片中人物的情绪参数值--消极度(negative)为0.012,积极度(positive)为0.988,则可以使用标签“欢乐”标注该图片。
在一些实施例中,还可以通过对待处理图片提取出的标签进行分析,过滤掉包含不良信息的待处理多媒体数据。比如说,设置一包含“暴力”、“血腥”等不良标签的预设标签列表,当待处理图片的标签列表与该预设标签列表具有相同标签时,将该待处理多媒体数据视为包含不良信息的多媒体数据,因此可以将该待处理多媒体数据删除。需要说明的是,在本实施例中,还可以先提取待处理图片的标签进行分析,再提取噪声值、模糊度及曝光度对图片质量进行检测。
如图9所示,当待处理多媒体数据包括待处理音频时,步骤S201中获取待处理多媒体数据的属性信息包括:获取待处理音频对应的多个预设标签;对该多个预设标签进行聚类,得到聚类标签,以形成该标签列表。
具体的,可以采用K-means方法对多个预设标签进行聚类,得到K个聚类标签,以形成标签列表,其中K为正整数。如图9所示,待处理多媒体数据“我的歌单”中,每一个待处理音频都有一个或多个预设标签,先获取这些预设标签,然后对这些标签进行聚类,得到2个聚类标签“动画”和“治愈”,这2个聚类标签即构成待处理音频对应的标签列表{动画,治愈}。
当待处理多媒体数据包括待处理文本时,步骤S201中获取待处理多媒体数据的属性信息包括:基于预设短语模板,从处于预设字数范围内的待处理文本中提取名词性短语作为标签,以形成该标签列表;和/或基于TextRank算法,从超出预设字数范围的待处理文本中提取标签,以形成该标签列表。
其中,TextRank算法用于为文本生成关键字和摘要。具体的,假设预设字数范围为0-10,则如图4所示的歌单中,由于歌单标题“重温粤语经典好歌”处于该预设字数范围,因此可以基于预设短语模板从该歌单标题中提取出关键字“粤语”,作为标签。又如歌单中的描述文本超出了预设字数范围,因此可以基于TextRank算法,从中提出“经典”关键字。然后将这些标签组成标签列表{粤语,经典}。
步骤S202,基于预设映射关系,将该标签列表中的标签,映射至预设主词库中对应的主词上,以使每一标签列表形成一对应的主词列表。
假设预设主词库为{治愈,ACG(Animation Comic Game),兴奋},标签与预设主词库中主词的映射关系如图5所示,不同的标签围绕在对应的主词周围,比如主词“治愈”,其与标签“温暖”、“纯音”、“孤独”等存在映射关系。如图6所示,待处理多媒体数据包括待处理文本、待处理图片、待处理音频和待处理视频四种文件类型的多媒体数据。其中,若待处理文本对应的标签列表a1为{清新,情歌,史诗},则对应的主词列表为b1{治愈,兴奋}。若待处理图片对应的标签列表a2为{动画,温暖},则对应的主词列表b2为{ACG,治愈},若待处理音频对应的标签列表a3为{纯音,抒情,激情},则对应的主词列表b3为{治愈,兴奋},待处理视频对应的标签列表a4为{纯音,情歌},则对应的主词列表b4为{治愈}。
步骤S203,判断任意两个该主词列表是否都具有相同主词。
将上述主词列表b1、b2、b3和b4两两进行对比,如果任意两个主词列表均具有相同主词,则确定上述标签列表a1、a2、a3和a4一致,转入步骤S204;如果存在两个主词列表不具有相同主词,则确定上述标签列表a1、a2、a3和a4不一致,转入步骤S211。
步骤S204,若任意两个该主词列表都具有相同主词,则根据该多媒体数目和该多媒体播放量生成该待处理多媒体数据的热门度,并根据该多媒体标识生成该待处理多媒体数据的新颖度。
由于主词列表b1、b2、b3和b4都具有主词“治愈”,因此可以确定上述标签列表a1、a2、a3和a4一致,也说明待处理多媒体数据中各类多媒体数据的风格是统一的,因此进一步对对待处理多媒体数据的热门度和新颖度进行检测。
在具体实施过程中,可以根据多媒体数目和多媒体播放量生成该待处理多媒体数据的热门度,具体步骤如下:
根据多媒体数目和多媒体播放量,生成多媒体平均播放量。
根据多媒体平均播放量确定待处理多媒体数据的热门度。
具体的,可以根据如下公式进行计算多媒体平均播放量h:
Figure GDA0002571099360000131
其中,Pi表示第i个多媒体的多媒体播放量,N表示多媒体数量,N为正整数。热门度可以根据多媒体平均播放量所处的播放量等级来确定。比如多媒体数据中包含多首歌曲,则可将歌曲平均播放量超过100万次/月的多媒体数据设置为第一播放量等级,对应第一热门等级;将歌曲平均播放量处于50-100万次/月之间的多媒体数据设置为第二播放量等级,对应第二热门等级。
假设待处理多媒体数据中包括三首歌曲,歌曲播放量分别为100万次/月、50万次/月和30万次/月,则根据上述公式可以计算出待处理多媒体数据的歌曲平均播放量为60万次/月,进而可以得到该待处理多媒体数据的歌曲平均播放量为第二播放量等级,即该待处理多媒体数据为第二热门等级。
在一些实施例中,还可以根据如下公式直接计算热门度hot_score:
Figure GDA0002571099360000132
其中,通过对现有多媒体数据的多媒体平均播放量进行统计,当使Pi以百万次/月为单位时,可以使热门度hot_score的取值处于[0,10]之间。
经过对大量多媒体数据进行统计分析可知,当待处理多媒体数据的热门度hot_score小于0.69时,该待处理多媒体数据对应的多媒体平均播放量P小于5次/月。由于此类待处理多媒体数据使多媒体数据处理装置缺乏足够多的先验知识来进行判定,因此可以将该类待处理多媒体数据保留,以进行下一步检测。而对于热门度hot_score大于6的待处理多媒体数据来说,其内多媒体平均播放量P在百万次/月以上,经统计发现,这类待处理多媒体数据趋向于简单的将热门视频、热门音频汇集,往往其主题不明确,风格不统一,因此可以将其删除。
在具体实施过程中,还可以根据多媒体标识生成待处理多媒体数据的新颖度,具体步骤如下:
获取已保留多媒体数据的多媒体标识。
根据已保留多媒体数据的多媒体标识以及待处理多媒体数据的多媒体标识,确定待处理多媒体数据的新颖度。
具体的,可以根据如下公式计算新颖度N:
Figure GDA0002571099360000141
S为待处理多媒体数据,Si为待处理多媒体数据中第i个多媒体的多媒体标识,其中,n>=i>0,i为正整数,n为待处理多媒体数据中的多媒体数量。K为已保留多媒体数据,Kj为已保留多媒体数据中第j个多媒体的多媒体标识。其中,m>=j>0,j为正整数,m为已保留多媒体数据中的多媒体数量。
步骤S205,判断该热门度是否小于预设热门阈值,且该新颖度是否大于预设新颖阈值。
综上,可以将热门上限值6设置为预设热门阈值,需要说明的是,在本实施例中不对预设热门阈值作具体限定。当热门度大于等于该热门阈值时,可以转入步骤S211将该待处理多媒体数据删除,或者将该待处理多媒体数据转存至其他存储设备。
还可以设置一预设新颖阈值,当大于该预设新颖阈值时,说明该待处理多媒体数据与已保留多媒体数据的相似度较小。当小于等于该预设新颖时,说明该待处理多媒体数据与已保留多媒体数据的相似度较高,为了提高多媒体数据的丰富程度,可以转入步骤S211删除该待处理多媒体数据。
若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,说明待处理多媒体数据不是过热数据,且与已保留多媒体数据相似度不高,因此可以转入步骤S206获取该待处理多媒体数据的用户信息进行分析。
步骤S206,若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,则获取该待处理多媒体数据的用户信息。
其中,用户信息包括该待处理多媒体数据的作者。如图4所示的歌单,作者为金鱼姬,即该歌单对应的用户信息。
步骤S207,获取该用户信息对应的历史多媒体数据信息。
可以统计用户信息对应的历史多媒体数据信息,对待处理多媒体数据的质量进行预测。具体的,可以获取用户信息对应的历史多媒体数据评分和历史多媒体数据数量进行分析。若历史多媒体数据评分小于预设多媒体数据评分,且该历史多媒体数据数量大于预设多媒体数据数量,说明该待处理多媒体数据可能质量太差,因此可以删除或转存该待处理多媒体数据。
以用户编辑歌单投稿为例,如果该用户的月平均投稿量是其他用户的两倍,但是已投歌单都未被保留,则可以预测该用户的待处理歌单是质量较差的歌单,因此可以删除该用户投稿的歌单,或者将该歌单转存至其他存储设备。
步骤S208,将已保留多媒体数据作为训练集,把该历史多媒体数据信息、该多个标签列表、该热门度和该新颖度作为特征值输入逻辑回归模型进行训练,得到训练结果。
由于上述步骤S201-S207的检测步骤中,对一些检测数据无法做出准确估量。比如步骤S204中,当待处理多媒体数据的热门度hot_score小于0.69时,此类待处理多媒体数据使多媒体数据处理装置缺乏足够多的先验知识来进行判定。因此针对这些不可控检测数据,可以进一步使用逻辑回归模型进行学习训练,以提高待处理多媒体数据处理的准确性。
具体的,可以将已保留的多媒体数据作为训练集,把上述历史多媒体数据信息,该待处理多媒体数据的多个标签列表、热门度和新颖度作为特征值,输入逻辑回归模型(Logistic Regression)进行训练,来判断该待处理多媒体数据是否满足预设条。
步骤S209,判断该训练结果是否满足预设条件。
如果该训练结果满足预设条件,则转入步骤S210;如果该训练结果不满足预设条件,则转入步骤S211。
步骤S210,若该训练结果满足预设条件,则保留该待处理多媒体数据。
如果该训练结果满足预设条件,说明该待处理多媒体数据符合预设质量要求,因此可以将该待处理多媒体数据保留,以发送给专业人员作进一步处理。
步骤S211,若存在两个主词列表不具有相同主词,或该热门度大于等于预设热门阈值,或该新颖度小于等于预设新颖阈值,或若该训练结果不满足预设条件,则删除该待处理多媒体数据。
若步骤S203中判断该多个标签不一致,说明待处理多媒体数据中不同文件类型的多媒体数据风格不统一,因此可以将该待处理多媒体数据删除,或转存至其他存储设备中。
同理的,若该热门度大于等于预设热门阈值,或该新颖度小于等于预设新颖阈值,说明该待处理多媒体数据为过热多媒体数据,或与其他多媒体数据相似度过高,若该训练结果不满足预设条件,说明该待处理多媒体数据不符合预设质量要求,因此都可以将该待处理多媒体数据删除,或转存至其他存储设备中。
由上述可知,本发明实施例的多媒体数据处理方法,对不同文件类型的待处理多媒体数据采取相应的标签提取方法,可以获取到更准确的标签列表。进一步的,根据用户信息对应的历史多媒体数据信息,对待处理多媒体数据的质量进行了预测,从而进一步提高了对待处理多媒体数据进行处理的准确率。
根据上述实施例所描述的方法,本实施例将从多媒体数据处理装置的角度进一步进行描述,该多媒体数据处理装置可以集成在电子设备中
请参照图10,图10为本发明实施例提供的多媒体数据处理装置的结构图,该装置可以包括接收模块301、判断模块302、分析模块303和处理模块304。
(1)接收模块301
接收模块301用于接收待处理多媒体数据,并获取该待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据。
从文件类型角度,可以将多媒体数据划分为音频、视频以及与音乐相关的图片、文本等不同种类的多媒体数据。如图4所示,多媒体数据以歌单形式展现,其中歌单内有若干首歌曲。该歌单不仅包括歌曲对应的音频、视频、图片,还包括歌单标题、歌单描述等文本。多媒体数据的属性信息用于标注各种多媒体数据的本质特征或特性,比如用标签标注音频的风格,又如音频的大小。在本优选实施例中,接收模块301获取到的待处理多媒体数据的属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识等。
在本发明实施例中,每一类待处理多媒体数据均对应一标签列表,即一标签列表用于标注一类待处理多媒体数据。其中该标签列表中包括一个或多个标签。比如,对于图4中的歌单,从歌单标题“重温粤语经典好歌”中,接收模块301可以提取出标签“粤语”、“经典”,从歌单描述中,接收模块301可以提取出标签“忧郁”、“沧桑”和“经典”,上述标签组成标签列表{粤语,经典,忧郁,沧桑,经典},用于标注歌单中的文本。同理的,接收模块301对音频“朋友”分析得到标签“粤语”和“流行”,接收模块301对音频“月半小夜曲”分析得到标签“粤语”和“流行”,依次对该歌单中的所有音频进行分析,得到全部标签,进而组成标签列表{粤语,流行},用于标注歌单中的音频。
具体的,如图11所示,接收模块301包括打分子模块3011、第一判断子模块3012和提取子模块3013。
当待处理多媒体数据包括待处理图片时,打分子模块3011用于提取待处理图片的噪声值、模糊度及曝光度,按照预设公式对待处理图片进行计算,生成打分结果。第一判断子模块3012用于判断打分结果是否小于预设分数阈值。提取子模块3013用于在该打分结果不小于预设分数阈值时,提取待处理图片的标签,以形成该标签列表。
具体的,打分子模块3011可以采用如下预设公式进行计算:
score=1-0.8*blur-0.1*noise-0.1*abs(exposure)
其中,score为打分结果,blur为模糊度,noise为噪声值,exposure为曝光度,abs()为绝对值函数。若第一判断子模块3012判断打分结果score小于预设分数阈值,说明待处理图片质量不达标,因此提取子模块3013可以删除待处理多媒体数据,或者将该待处理多媒体数据转存至其他存储设备中。若第一判断子模块3012判断打分结果score不小于预设分数阈值,则提取子模块3013还可以进一步对待处理图片进行分析,以得到其对应的标签,形成标签列表。
具体的,提取子模块3013可以采用CNN(Convolutional Neural Network,卷积神经网络)、DBN(Deep Belief Network,深度信念网络)、RNN(Recurrent Neural Network,循环神经网络)、递归神经张量网络等网络模型,进行图像识别、人脸检测,以提取出待处理图片的标签。比如,提取子模块3013对图8中的图片进行分析,得到图片中人物的情绪参数值--消极度(negative)为0.012,积极度(positive)为0.988,则可以使用标签“欢乐”标注该图片。
在一些实施例中,提取子模块3013还可以通过对待处理图片提取出的标签进行分析,过滤掉包含不良信息的待处理多媒体数据。比如说,设置一包含“暴力”、“血腥”等不良标签的预设标签列表,当待处理图片的标签列表与该预设标签列表具有相同标签时,将该待处理多媒体数据视为包含不良信息的多媒体数据,因此可以将该待处理多媒体数据删除。需要说明的是,在本实施例中,提取子模块3013还可以先提取待处理图片的标签进行分析,再提取噪声值、模糊度及曝光度对图片质量进行检测。
如图11所示,接收模块301还包括获取子模块3014和聚类子模块3015。当待处理多媒体数据包括待处理音频时,获取子模块3014用于获取待处理音频对应的多个预设标签。聚类子模块3015用于对该多个预设标签进行聚类,得到聚类标签,以形成该标签列表。
具体的,聚类子模块3015可以采用K-means方法对多个预设标签进行聚类,得到K个聚类标签,以形成标签列表,其中K为正整数。如图9所示,待处理多媒体数据“我的歌单”中,每一个待处理音频都有一个或多个预设标签,先获取这些预设标签,然后对这些标签进行聚类,得到2个聚类标签“动画”和“治愈”,这2个聚类标签即构成待处理音频对应的标签列表{动画,治愈}。
如图11所示,接收模块301还包括第一提取子模块3016和第二提取子模块3017。当待处理多媒体数据包括待处理文本时,第一提取子模块3016用于基于预设短语模板,从处于预设字数范围内的待处理文本中提取名词性短语作为标签,以形成该标签列表;和/或第二提取子模块3017用于基于TextRank算法,从超出预设字数范围的待处理文本中提取标签,以形成该标签列表。
假设预设字数范围为0-10,则如图4所示的歌单中,由于歌单标题“重温粤语经典好歌”处于该预设字数范围,因此第一提取子模块3016可以基于预设短语模板从该歌单标题中提取出“粤语”,作为标签。又如歌单中的描述文本超出了预设字数范围,因此第二提取子模块3017可以基于TextRank算法,从中提出“经典”。然后将这些标签组成标签列表{粤语,经典}。
(2)判断模块302
判断模块302用于判断该多个标签列表是否一致,若一致,则根据该多媒体数目和该多媒体播放量生成该待处理多媒体数据的热门度,并根据该多媒体标识生成该待处理多媒体数据的新颖度。
如图12所示,该判断模块302具体可以包括:映射子模块3021、判断子模块3022和第一确定子模块3023。
其中,映射子模块3021用于基于预设映射关系,将标签列表中的标签映射至预设主词库中对应的主词上,以使每一标签列表形成一对应的主词列表。判断子模块3022用于判断任意两个主词列表是否都具有相同主词。第一确定子模块3023用于在任意两个主词列表都具有相同主词时,确定该多个标签列表一致。
假设预设主词库为{治愈,ACG(Animation Comic Game),兴奋},标签与预设主词库中主词的映射关系如图5所示,不同的标签围绕在对应的主词周围,比如主词“治愈”,其与标签“温暖”、“纯音”、“孤独”等存在映射关系。如图6所示,待处理多媒体数据包括待处理文本、待处理图片、待处理音频和待处理视频四种文件类型的多媒体数据。其中,若待处理文本对应的标签列表a1为{清新,情歌,史诗},则映射子模块3021将该标签列表a1中的标签映射到该预设主词库中,得到对应的主词列表为b1{治愈,兴奋}。若待处理图片对应的标签列表a2为{动画,温暖},则映射子模块3021将该标签列表a2中的标签映射到该预设主词库中,得到对应的主词列表b2为{ACG,治愈},若待处理音频对应的标签列表a3为{纯音,抒情,激情},则映射子模块3021将该标签列表a3中的标签映射到该预设主词库中,得到对应的主词列表b3为{治愈,兴奋},待处理视频对应的标签列表a4为{纯音,情歌},则映射子模块3021将该标签列表a4中的标签映射到该预设主词库中,得到对应的主词列表b4为{治愈}。
判断子模块3022将上述主词列表b1、b2、b3和b4两两进行对比,如果任意两个主词列表均具有相同主词,则第一确定子模块3023确定上述标签列表a1、a2、a3和a4一致,如果存在两个主词列表不具有相同主词,则确定上述标签列表a1、a2、a3和a4不一致。由于主词列表b1、b2、b3和b4都具有主词“治愈”,因此可以确定上述标签列表a1、a2、a3和a4一致,也说明待处理多媒体数据中各类多媒体数据的风格是统一的。
若该多个标签不一致,说明待处理多媒体数据中不同文件类型的多媒体数据风格不统一,因此可以将该待处理多媒体数据删除或转存至其他存储设备中。如果该多个标签一致,则判断模块302可以进一步对待处理多媒体数据的热门度和新颖度进行检测。
其中,判断模块302可以根据多媒体数目和多媒体播放量生成该待处理多媒体数据的热门度,具体步骤如下:
根据多媒体数目和多媒体播放量,生成多媒体平均播放量。
根据多媒体平均播放量确定待处理多媒体数据的热门度。
具体的,判断模块302可以根据如下公式进行计算多媒体平均播放量h:
Figure GDA0002571099360000211
其中,Pi表示第i个多媒体的多媒体播放量,N表示多媒体数量,N为正整数。热门度可以根据多媒体平均播放量所处的播放量等级来确定。比如多媒体数据中包含多首歌曲,则可将歌曲平均播放量超过100万次/月的多媒体数据设置为第一播放量等级,对应第一热门等级;将歌曲平均播放量处于50-100万次/月之间的多媒体数据设置为第二播放量等级,对应第二热门等级。
假设待处理多媒体数据中包括三首歌曲,歌曲播放量分别为100万次/月、50万次/月和30万次/月,则根据上述公式可以计算出待处理多媒体数据的歌曲平均播放量为60万次/月,进而可以得到该待处理多媒体数据的歌曲平均播放量为第二播放量等级,即该待处理多媒体数据为第二热门等级。
在一些实施例中,判断模块302还可以根据如下公式直接计算热门度hot_score:
Figure GDA0002571099360000212
其中,通过对现有多媒体数据的多媒体平均播放量进行统计,当使Pi以百万次/月为单位时,可以使热门度hot_score的取值处于[0,10]之间。
经过对大量多媒体数据进行统计分析可知,当待处理多媒体数据的热门度hot_score小于0.69时,该待处理多媒体数据对应的多媒体平均播放量P小于5次/月。由于此类待处理多媒体数据使多媒体数据处理装置缺乏足够多的先验知识来进行判定,因此可以将该类待处理多媒体数据保留,以进行下一步检测。而对于热门度hot_score大于6的待处理多媒体数据来说,其内多媒体平均播放量P在百万次/月以上,经统计发现,这类待处理多媒体数据趋向于简单的将热门视频、热门音频汇集,往往其主题不明确,风格不统一,因此可以将其删除或转存至其他存储设备。
综上,可以将热门上限值6设置为预设热门阈值。当热门度大于等于该热门阈值时,可以将该待处理多媒体数据删除或转存至其他存储设备。
如图12所示,判断模块302还包括标识获取子模块3024和第二确定子模块3025。标识获取子模块3024用于获取已保留多媒体数据的多媒体标识。第二确定子模块3025用于根据已保留多媒体数据的多媒体标识以及待处理多媒体数据的多媒体标识,确定待处理多媒体数据的新颖度。
具体的,可以根据如下公式计算新颖度N:
Figure GDA0002571099360000221
S为待处理多媒体数据,Si为待处理多媒体数据中第i个多媒体的多媒体标识,其中,n>=i>0,i为正整数,n为待处理多媒体数据中的多媒体数量。K为已保留多媒体数据,Kj为已保留多媒体数据中第j个多媒体的多媒体标识。其中,m>=j>0,j为正整数,m为已保留多媒体数据中的多媒体数量。
可以设置一预设新颖阈值,当大于该预设新颖阈值时,说明该待处理多媒体数据与已保留多媒体数据的相似度较小。当不大于该预设新颖时,说明该待处理多媒体数据与已保留多媒体数据的相似度较高,为了提高多媒体数据的丰富程度,可以删除该待处理多媒体数据。
(3)分析模块303
分析模块303用于对该热门度和该新颖度进行分析处理,若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,则获取该待处理多媒体数据的用户信息。
若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,说明待处理多媒体数据不是过热数据,且与已保留多媒体数据相似度不高,因此可以进一步获取该待处理多媒体数据的用户信息进行分析。其中,用户信息包括该待处理多媒体数据的作者。如图4所示的歌单,作者为金鱼姬,即该歌单对应的用户信息。
(4)处理模块304
处理模块304用于根据该用户信息对应的历史多媒体数据信息,该待处理多媒体数据的该多个标签列表、该热门度和该新颖度,处理该待处理多媒体数据。
优选的,处理模块304可以统计用户信息对应的历史多媒体数据信息,对待处理多媒体数据的质量进行预测。具体的,可以获取用户信息对应的历史多媒体数据评分和历史多媒体数据数量进行分析。若历史多媒体数据评分小于预设多媒体数据评分,且该历史多媒体数据数量大于预设多媒体数据数量,说明该待处理多媒体数据可能质量太差,因此处理模块304可以删除或转存该待处理多媒体数据。
以用户编辑歌单投稿为例,如果该用户的月平均投稿量是其他用户的两倍,但是已投歌单都未被保留,则可以预测该用户的待处理歌单是质量较差的歌单,因此处理模块304可以删除该用户投稿的歌单,或者将该歌单转存至其他存储设备。
如图13所示,处理模块304包括信息获取子模块3041、训练子模块3042、第二判断子模块3043和保留子模块3044。
其中信息获取子模块3041用于获取用户信息对应的历史多媒体数据信息。训练子模块3042用于将已保留多媒体数据作为训练集,把该历史多媒体数据信息、该多个标签列表、该热门度和该新颖度作为特征值输入逻辑回归模型进行训练,得到训练结果。第二判断子模块3043用于判断该训练结果是否满足预设条件。保留子模块3044用于在该训练结果满足预设条件时,保留该待处理多媒体数据。
具体的,训练子模块3042可以将已保留的多媒体数据作为训练集,把上述历史多媒体数据评分、历史多媒体数据数量,该待处理多媒体数据的多个标签列表、热门度和新颖度作为特征值,输入逻辑回归模型(Logistic Regression)进行训练,然后通过第二判断子模块3043判断该待处理多媒体数据是否满足预设条,在满足预设条件时,保留子模块3044将该待处理多媒体数据保留。
本发明实施例的多媒体数据处理装置,通过先获取待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识。再对标签列表的一致性进行分析,在一致时,根据多媒体数目和多媒体播放量生成热门度,并根据多媒体标识生成新颖度。在热门度小于预设热门阈值,且新颖度大于预设新颖阈值时,获取待处理多媒体数据的用户信息对应的历史多媒体数据信息。最后根据该历史多媒体数据信息、标签列表、热门度和新颖度来处理该待处理多媒体数据。该方案不仅对待处理多媒体数据的多个检测变量进行了一致性分析,还从深层次对待处理多媒体数据进行了分析,有效的提高了待处理多媒体数据处理的准确率。
相应的,本发明实施例还提供一种电子设备,如图14所示,其示出了本发明实施例所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图14中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
接收待处理多媒体数据,并获取该待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;
判断该多个标签列表是否一致,若一致,则根据该多媒体数目和该多媒体播放量生成该待处理多媒体数据的热门度,并根据该多媒体标识生成该待处理多媒体数据的新颖度;
对该热门度和该新颖度进行分析处理,若该热门度小于预设热门阈值,且该新颖度大于预设新颖阈值,则获取该待处理多媒体数据的用户信息;以及
根据该用户信息对应的历史多媒体数据信息,该待处理多媒体数据的该多个标签列表、该热门度和该新颖度,处理该待处理多媒体数据。
该电子设备可以实现本发明实施例所提供的任一种多媒体数据处理装置所能实现的有效效果,详见前面的实施例,在此不再赘述。
本发明实施例的电子设备,通过先获取待处理多媒体数据的属性信息,其中该属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识。再对标签列表的一致性进行分析,在一致时,根据多媒体数目和多媒体播放量生成热门度,并根据多媒体标识生成新颖度。在热门度小于预设热门阈值,且新颖度大于预设新颖阈值时,获取待处理多媒体数据的用户信息对应的历史多媒体数据信息。最后根据该历史多媒体数据信息、标签列表、热门度和新颖度来处理该待处理多媒体数据。该方案不仅对待处理多媒体数据的多个检测变量进行了一致性分析,还从深层次对待处理多媒体数据进行了分析,有效的提高了待处理多媒体数据处理的准确率。
本文提供了实施例的各种操作。在一个实施例中,所述的一个或多个操作可以构成一个或多个计算机可读介质上存储的计算机可读指令,其在被电子设备执行时将使得计算设备执行所述操作。描述一些或所有操作的顺序不应当被解释为暗示这些操作必需是顺序相关的。本领域技术人员将理解具有本说明书的益处的可替代的排序。而且,应当理解,不是所有操作必需在本文所提供的每个实施例中存在。
而且,尽管已经相对于一个或多个实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变形和修改。本公开包括所有这样的修改和变形,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件、资源等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或多个其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的方法。
综上所述,虽然本发明已以实施例揭露如上,实施例前的序号仅为描述方便而使用,对本发明各实施例的顺序不造成限制。并且,上述实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。

Claims (15)

1.一种多媒体数据处理方法,其特征在于,包括:
接收待处理多媒体数据,并获取所述待处理多媒体数据的属性信息,其中所述属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;
判断所述多个标签列表是否一致,若一致,则根据所述多媒体数目和所述多媒体播放量生成所述待处理多媒体数据的热门度,并根据所述多媒体标识生成所述待处理多媒体数据的新颖度;
对所述热门度和所述新颖度进行分析处理,若所述热门度小于预设热门阈值,且所述新颖度大于预设新颖阈值,则获取所述待处理多媒体数据的用户信息;以及
根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据。
2.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述判断所述多个标签列表是否一致步骤,包括:
基于预设映射关系,将所述标签列表中的标签,映射至预设主词库中对应的主词上,以使每一标签列表形成一对应的主词列表;
判断任意两个所述主词列表是否都具有相同主词;
若任意两个所述主词列表都具有相同主词,则确定所述多个标签列表一致。
3.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述待处理多媒体数据包括待处理文本,而所述获取所述待处理多媒体数据的属性信息步骤包括:
基于预设短语模板,从处于预设字数范围内的待处理文本中提取名词性短语作为标签,以形成所述标签列表;和/或
基于TextRank算法,从超出预设字数范围的待处理文本中提取标签,以形成所述标签列表。
4.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述待处理多媒体数据包括待处理图片,而所述获取所述待处理多媒体数据的属性信息步骤包括:
提取所述待处理图片的噪声值、模糊度及曝光度,按照预设公式对所述待处理图片进行计算,生成打分结果;
判断所述打分结果是否小于预设分数阈值;
若所述打分结果不小于所述预设分数阈值,则提取所述待处理图片的标签,以形成所述标签列表。
5.根据权利要求1所述的多媒体数据处理方法,其特征在于,所述待处理多媒体数据包括待处理音频,而所述获取所述待处理多媒体数据的属性信息步骤包括:
获取所述待处理音频对应的多个预设标签;
对所述多个预设标签进行聚类,得到聚类标签,以形成所述标签列表。
6.根据权利要求1-5任意一项所述的多媒体数据处理方法,其特征在于,所述根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据步骤,包括:
获取所述用户信息对应的所述历史多媒体数据信息;
将已保留多媒体数据作为训练集,把所述历史多媒体数据信息、所述多个标签列表、所述热门度和所述新颖度作为特征值输入逻辑回归模型进行训练,得到训练结果;
判断所述训练结果是否满足预设条件;
若所述训练结果满足预设条件,则保留所述待处理多媒体数据。
7.根据权利要求1-5任意一项所述的多媒体数据处理方法,其特征在于,所述根据所述多媒体标识生成所述待处理多媒体数据的新颖度步骤,包括:
获取已保留多媒体数据的多媒体标识;
根据所述已保留多媒体数据的多媒体标识以及所述待处理多媒体数据的多媒体标识,确定所述待处理多媒体数据的新颖度。
8.一种多媒体数据处理装置,其特征在于,包括:
接收模块,用于接收待处理多媒体数据,并获取所述待处理多媒体数据的属性信息,其中所述属性信息包括多个标签列表、多媒体数目、多媒体播放量及多媒体标识,每一标签列表用于标注一类待处理多媒体数据;
判断模块,用于判断所述多个标签列表是否一致,若一致,则根据所述多媒体数目和所述多媒体播放量生成所述待处理多媒体数据的热门度,并根据所述多媒体标识生成所述待处理多媒体数据的新颖度;
分析模块,用于对所述热门度和所述新颖度进行分析处理,若所述热门度小于预设热门阈值,且所述新颖度大于预设新颖阈值,则获取所述待处理多媒体数据的用户信息;以及
处理模块,用于根据所述用户信息对应的历史多媒体数据信息,所述待处理多媒体数据的所述多个标签列表、所述热门度和所述新颖度,处理所述待处理多媒体数据。
9.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述判断模块包括:
映射子模块,用于基于预设映射关系,将所述标签列表中的标签,映射至预设主词库中对应的主词上,以使每一标签列表形成一对应的主词列表;
判断子模块,用于判断任意两个所述主词列表是否都具有相同主词;
第一确定子模块,用于在任意两个所述主词列表都具有相同主词时,确定所述多个标签列表一致。
10.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述待处理多媒体数据包括待处理文本,而所述接收模块包括:
第一提取子模块,用于基于预设短语模板,从处于预设字数范围内的待处理文本中提取名词性短语作为标签,以形成所述标签列表;和/或
第二提取子模块,用于基于TextRank算法,从超出预设字数范围的待处理文本中提取标签,以形成所述标签列表。
11.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述待处理多媒体数据包括待处理图片,而所述接收模块包括:
打分子模块,用于提取所述待处理图片的噪声值、模糊度及曝光度,按照预设公式对所述待处理图片进行计算,生成打分结果;
第一判断子模块,用于判断所述打分结果是否小于预设分数阈值;
提取子模块,用于在所述打分结果不小于所述预设分数阈值时,提取所述待处理图片的标签,以形成所述标签列表。
12.根据权利要求8所述的多媒体数据处理装置,其特征在于,所述待处理多媒体数据包括待处理音频,而所述接收模块包括:
获取子模块,用于获取所述待处理音频对应的多个预设标签;
聚类子模块,用于对所述多个预设标签进行聚类,得到聚类标签,以形成所述标签列表。
13.根据权利要求8-12任意一项所述的多媒体数据处理装置,其特征在于,所述处理模块包括:
信息获取子模块,用于获取所述用户信息对应的所述历史多媒体数据信息;
训练子模块,用于将已保留多媒体数据作为训练集,把所述历史多媒体数据信息、所述多个标签列表、所述热门度和所述新颖度作为特征值输入逻辑回归模型进行训练,得到训练结果;
第二判断子模块,用于判断所述训练结果是否满足预设条件;
保留子模块,用于在所述训练结果满足预设条件时,保留所述待处理多媒体数据。
14.根据权利要求8-12任意一项所述的多媒体数据处理装置,其特征在于,所述判断模块包括:
标识获取子模块,用于获取已保留多媒体数据的多媒体标识;
第二确定子模块,用于根据所述已保留多媒体数据的多媒体标识以及所述待处理多媒体数据的多媒体标识,确定所述待处理多媒体数据的新颖度。
15.一种存储介质,其内存储有处理器可执行指令,该处理器通过执行所述指令提供如权利要求1-7中任一的多媒体数据处理方法。
CN201810044934.3A 2018-01-17 2018-01-17 多媒体数据处理方法、装置及存储介质 Active CN108170845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810044934.3A CN108170845B (zh) 2018-01-17 2018-01-17 多媒体数据处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810044934.3A CN108170845B (zh) 2018-01-17 2018-01-17 多媒体数据处理方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN108170845A CN108170845A (zh) 2018-06-15
CN108170845B true CN108170845B (zh) 2020-10-13

Family

ID=62514530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810044934.3A Active CN108170845B (zh) 2018-01-17 2018-01-17 多媒体数据处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN108170845B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112199564B (zh) * 2019-07-08 2024-09-24 Tcl科技集团股份有限公司 一种信息过滤方法、装置及终端设备
CN110688517B (zh) * 2019-09-02 2023-05-30 平安科技(深圳)有限公司 音频分配方法、装置及存储介质
CN110704648B (zh) * 2019-09-27 2022-07-01 北京达佳互联信息技术有限公司 用户行为属性的确定方法、装置、服务器及存储介质
CN115412375B (zh) * 2022-11-01 2023-04-18 山东省信息技术产业发展研究院(中国赛宝(山东)实验室) 一种工业互联网数据防护系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528174A (zh) * 2015-12-10 2016-04-27 广东欧珀移动通信有限公司 一种歌曲分享方法及用户终端
CN106227816A (zh) * 2016-07-22 2016-12-14 北京小米移动软件有限公司 推送歌单的方法及装置
CN107544963A (zh) * 2016-06-23 2018-01-05 南京中兴软件有限责任公司 多媒体文件存储方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7209900B2 (en) * 1999-08-27 2007-04-24 Charles Eric Hunter Music distribution systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528174A (zh) * 2015-12-10 2016-04-27 广东欧珀移动通信有限公司 一种歌曲分享方法及用户终端
CN107544963A (zh) * 2016-06-23 2018-01-05 南京中兴软件有限责任公司 多媒体文件存储方法及装置
CN106227816A (zh) * 2016-07-22 2016-12-14 北京小米移动软件有限公司 推送歌单的方法及装置

Also Published As

Publication number Publication date
CN108170845A (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
CN108009228B (zh) 一种内容标签的设置方法、装置及存储介质
Yu et al. Deep cross-modal correlation learning for audio and lyrics in music retrieval
CN106874279B (zh) 生成应用类别标签的方法及装置
CN110209844B (zh) 多媒体数据匹配方法、装置和存储介质
CN112533051B (zh) 弹幕信息显示方法、装置、计算机设备和存储介质
Lo et al. Cost-sensitive multi-label learning for audio tag annotation and retrieval
CN108170845B (zh) 多媒体数据处理方法、装置及存储介质
CN108334601B (zh) 基于标签主题模型的歌曲推荐方法、装置及存储介质
EP3401802A1 (en) Webpage training method and device, and search intention identification method and device
CN111143604B (zh) 一种音频的相似度匹配方法、装置及存储介质
JP2012027845A (ja) 情報処理装置、関連文提供方法、及びプログラム
CN112052356B (zh) 多媒体分类方法、装置和计算机可读存储介质
Li et al. Music artist style identification by semi-supervised learning from both lyrics and content
CN113934941B (zh) 一种基于多维度信息的用户推荐系统及方法
CN106919575A (zh) 应用程序搜索方法及装置
CN111782863B (zh) 音频分段方法、装置、存储介质及电子设备
WO2022222942A1 (zh) 问答记录生成方法、装置、电子设备及存储介质
De Boom et al. Semantics-driven event clustering in Twitter feeds
US11275787B2 (en) Entity viewpoint determinations
US9740695B2 (en) Method for enriching a multimedia content, and corresponding device
CN114328799A (zh) 数据处理方法、装置以及计算机可读存储介质
Wang et al. Video interestingness prediction based on ranking model
CN111507400A (zh) 应用分类方法、装置、电子设备以及存储介质
CN112612867B (zh) 新闻稿件传播分析方法、计算机可读存储介质及电子设备
CN112040313B (zh) 一种视频内容结构化方法、装置、终端设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant