Nothing Special   »   [go: up one dir, main page]

CN115935049A - 基于人工智能的推荐处理方法、装置及电子设备 - Google Patents

基于人工智能的推荐处理方法、装置及电子设备 Download PDF

Info

Publication number
CN115935049A
CN115935049A CN202111005050.5A CN202111005050A CN115935049A CN 115935049 A CN115935049 A CN 115935049A CN 202111005050 A CN202111005050 A CN 202111005050A CN 115935049 A CN115935049 A CN 115935049A
Authority
CN
China
Prior art keywords
candidate
recommendation information
recommendation
recommended
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111005050.5A
Other languages
English (en)
Inventor
程川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111005050.5A priority Critical patent/CN115935049A/zh
Publication of CN115935049A publication Critical patent/CN115935049A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种基于人工智能的推荐处理方法、装置、电子设备及计算机可读存储介质;方法包括:获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;获取针对所述待推荐对象的目标推荐信息,并生成所述目标推荐信息的多个候选显示方式;从所述多个候选显示方式中确定与所述状态特征和所述环境特征至少之一适配的目标显示方式;按照所述目标显示方式显示所述目标推荐信息。通过本申请,能够通过实时拍摄的图像提高推荐准确度。

Description

基于人工智能的推荐处理方法、装置及电子设备
技术领域
本申请涉及人工智能技术,尤其涉及一种基于人工智能的推荐处理方法、装置、电子设备及计算机可读存储介质。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。
信息推荐是人工智能的重要应用,推荐系统中的排序模块通常是基于机器学习模型预测点击率并排序,将评分高的作为优先推荐的对象。相关技术中为了提高为机器学习模型的点击率预测精度进行了各种努力,例如在特征工程阶段构建大量的特征数据以使机器学习模型进行充分学习,但是即时推荐信息本身与待推荐对象之间匹配度非常高,仍然存在无法产生互动行为的情况。
发明内容
本申请实施例提供一种基于人工智能的推荐处理方法、装置、电子设备及计算机可读存储介质,能够借助实时拍摄的图像提高推荐准确度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种基于人工智能的推荐处理方法,包括:
获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
获取针对所述待推荐对象的目标推荐信息,并生成所述目标推荐信息的多个候选显示方式;
从所述多个候选显示方式中确定与所述状态特征和所述环境特征至少之一适配的目标显示方式;
按照所述目标显示方式显示所述目标推荐信息。
本申请实施例提供一种基于人工智能的推荐处理装置,包括:
拍摄模块,用于获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
识别模块,用于对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
推荐模块,用于获取针对所述待推荐对象的目标推荐信息,并生成所述目标推荐信息的多个候选显示方式;
显示模块,用于从所述多个候选显示方式中确定与所述状态特征和所述环境特征至少之一适配的目标显示方式;
所述显示模块,还用于按照所述目标显示方式显示所述目标推荐信息。
在上述方案中,所述推荐模块,还用于:获取针对所述待推荐对象的多个候选的推荐信息;从所述多个候选的推荐信息中确定与所述状态特征和所述环境特征至少之一适配的目标推荐信息。
在上述方案中,所述推荐模块,还用于:针对每个所述候选的推荐信息执行以下处理:获取所述候选的推荐信息的内容特征以及所述待推荐对象的画像特征;将所述候选的推荐信息的内容特征、所述待推荐对象的画像特征、以及所述状态特征和所述环境特征至少之一进行第一特征交叉处理,得到第一特征交叉处理结果;对所述第一特征交叉处理结果进行逻辑回归处理,得到所述候选的推荐信息的第一推荐指标;将超过第一推荐指标阈值的第一推荐指标对应候选的推荐信息确定为目标推荐信息。
在上述方案中,所述推荐模块,还用于:选取超过第一推荐指标阈值的第一推荐指标对应的多个候选的推荐信息;在选取的多个候选的推荐信息中选取满足多样性条件的至少一个推荐信息作为目标推荐信息;其中,所述多样性条件规定了属于相同类别的目标推荐信息的最大数目。
在上述方案中,所述推荐模块,还用于:生成所述目标推荐信息的至少一个候选模板;生成所述目标推荐信息的至少一个候选摘要;生成所述目标推荐信息的至少一个候选封面;将所述至少一个候选模板、所述至少一个候选摘要与所述至少一个候选封面进行不同方式地组合,得到所述多个候选显示方式;其中,所述候选摘要包括以下至少之一:所述目标推荐信息的标题、所述目标推荐信息的推荐理由、所述目标推荐信息的介绍。
在上述方案中,所述推荐模块,还用于:执行以下处理至少之一:提取所述目标推荐信息的关键内容,根据所述关键内容生成所述候选摘要;确定与所述目标推荐信息具有互动行为的互动对象,根据所述互动对象生成所述候选摘要;确定与所述目标推荐信息的关联度超过关联度阈值的关联信息,根据所述关联信息生成所述候选摘要。
在上述方案中,所述推荐模块,还用于:当所述目标推荐信息为推荐视频时,对所述推荐视频分割为多个镜头,其中,每个所述镜头包括多个连续的视频帧;针对每个所述镜头执行以下处理:对所述镜头的多个视频帧进行聚类处理,得到所述镜头下的多个聚类;确定每个所述聚类中与对应的聚类中心距离最近的视频帧,并将所述最近的视频帧确定为所述候选封面。
在上述方案中,所述推荐模块,还用于:针对所述推荐视频的每个视频帧执行以下处理:确定所述视频帧的每个像素点的位置;将任意两个连续的视频帧组成分割单元,并针对所述推荐视频的每个分割单元执行以下处理:确定所述分割单元的两个视频帧的相同位置的像素点的灰度差值,并对多个位置的像素点的灰度差值进行求平均处理,得到所述分割单元的差值;确定大于差值阈值的差值对应的分割单元具有镜头边界,并将所述分割单元的两个视频帧划分为不同的镜头。
在上述方案中,所述推荐模块,还用于:将所述多个连续视频帧组成视频帧集合;从所述视频帧集合中随机选择N个视频帧,将对应所述N个视频帧的图像特征作为多个聚类集合的初始聚类中心,并将所述N个视频帧从所述视频帧集合移除,其中,N为对应所述镜头的候选封面的数目,N为大于或者等于2的整数;初始化聚类处理的迭代次数为M,并建立对应每个所述聚类的空的集合,其中,M为大于或者等于2的整数;在所述聚类处理的每一次迭代过程中执行以下处理:对每个所述聚类的集合进行更新处理,并基于更新处理结果执行聚类中心生成处理,得到每个所述聚类的新聚类中心,当所述新聚类中心不同于所述初始聚类中心时,将所述初始聚类中心对应的视频帧再次添加至所述视频帧集合,并基于所述新聚类中心更新所述初始聚类中心;将迭代M次后得到的每个所述聚类的集合确定为聚类处理结果,或者,将迭代m次后得到的每个所述聚类的集合确定为聚类处理结果;其中,迭代m次后得到的多个聚类与迭代m-1次后得到的多个聚类的聚类中心相同,m为整数变量且取值满足2≤m≤M。
在上述方案中,所述推荐模块,还用于:针对每个所述聚类执行以下处理:对所述聚类的每个视频帧的图像特征进行求平均处理,得到所述聚类的聚类中心;根据所述聚类的每个视频帧的图像特征与所述聚类中心之间的距离,确定与所述聚类中心距离最近的视频帧。
在上述方案中,所述识别模块,还用于执行以下处理至少之一:对所述图像进行状态识别处理,得到所述待推荐对象的状态特征;对所述图像进行环境识别处理,得到所述环境的环境特征。
在上述方案中,所述显示模块,用于针对每个所述候选显示方式执行以下处理:提取所述候选显示方式的文本特征以及图像特征;所述候选显示方式的文本特征以及图像特征、所述画像特征、以及所述状态特征和所述环境特征至少之一进行第二特征交叉处理,得到第二特征交叉处理结果;对所述第二特征交叉处理结果进行逻辑回归处理,得到所述目标推荐信息的候选显示方式的第二推荐指标。将超过第二推荐指标阈值的第二推荐指标对应的候选显示方式确定为所述目标显示方式。
本申请实施例提供一种基于人工智能的推荐处理方法,包括:
获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
获取针对所述待推荐对象的多个候选的推荐信息;
从所述多个候选的推荐信息中确定与所述状态特征和所述环境特征至少之一适配的目标推荐信息;
显示所述目标推荐信息。
本申请实施例提供一种基于人工智能的推荐处理装置,包括:
拍摄模块,用于获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
识别模块,用于对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
推荐模块,用于获取针对所述待推荐对象的多个候选的推荐信息;
所述推荐模块,还用于从所述多个候选的推荐信息中确定与所述状态特征和所述环境特征至少之一适配的目标推荐信息;
显示模块,用于显示所述目标推荐信息。
本申请实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的基于人工智能的推荐处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本申请实施例提供的基于人工智能的推荐处理方法。
本申请实施例具有以下有益效果:
获取待推荐对象(用户)在环境中观看信息时进行拍摄得到图像,并以此获取用户的状态特征和环境特征至少之一,后续从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式,并按照目标显示方式显示目标推荐信息,由于目标显示方式与状态特征和环境特征至少之一相关,且状态特征和环境特征至少之一能够直接表征用户在实时推荐过程中的表现以及所处的环境,因此能够准确推导出目标显示方式,有效提高用户的点击率,从而提高推荐准确度以及推荐效率。
附图说明
图1是相关技术中提供的推荐处理方法的推荐逻辑示意图;
图2是本申请实施例提供的基于人工智能的推荐处理系统的架构示意图;
图3是本申请实施例提供的电子设备的结构示意图;
图4A-4D是本申请实施例提供的基于人工智能的推荐处理方法的流程示意图;
图5是本申请实施例提供的推荐处理方法的流程示意图;
图6是本申请实施例提供的推荐处理方法的显示流程图;
图7是本申请实施提供的关键帧提取示意图;
图8是本申请实施例提供的图像处理流程图;
图9是本申请实施例提供的显示处理示意图;
图10是本申请实施例提供的基于人工智能的推荐处理方法的产品界面图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)特征:特征是能够有效的反映问题的不同特性的数据表示形式。
2)特征提取:特征提取过程能够把原始的数据转换成基于要解决的问题更有效的表现形式;
3)特征工程:特征工程是利用数据领域的相关知识来创建能够使算法达到最佳性能的特征的过程;
4)用户画像:用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的用户模型;
5)个性化推荐:个性化推荐是基于用户画像给不同用户推送不同内容的技术;
6)个性化显示:是基于用户画像把同一内容以不同的方式显示给用户的技术。
参见图1,图1是相关技术中提供的推荐处理方法的推荐逻辑示意图,提取用户特征,如年龄,居住地,性别,工作,学校,喜欢的明星,常看信息类型等等,基于用户特征构建用户画像,提取内容特征,如内容的类别,内容的关键字,内容对应的作品、内容受欢迎程度等等,将内容特征和用户特征作为推荐模型的输入特征,机器学习的推荐模型根据输入特征进行点击率预测,基于点击率预测结果为用户生成推荐内容,最后把推荐内容显示给用户。
对用户进行视频的个性化推送的时候,需要根据用户的历史个人观看行为表征的画像特征和推送视频的内容特征进行匹配,确定出最合适的视频进行推送,因此画像特征对推荐系统来说至关重要,是提高用户兴趣度和视频点击率的重要保证,通常我们通过大量的训练数据来提取出有用的特征,从而使用机器学习的方法来进行训练得到模型。而模型的有效性,很大程度上是取决于特征工程从原始数据中提取出来的特征是否有效。
申请人在实施本申请实施例时发现,在进行推荐的过程中,推荐视频和怎么呈现推荐视频都影响着用户是否查看该内容,相关技术中存在以下缺点:对于不同的用户可能是基于不同的理由推荐同样的内容,但是显示给不同用户的却是同样的标题、封面等相同的显示方式,因此用户可能不能察觉到推荐内容的感兴趣之处,从而不会点击进入推荐信息的详情页,从而观看推荐信息的详细内容以及推荐信息的相关内容,并且用户画像是长期的行为表示,基于用户画像无法反应用户当前观看推荐信息的心情状态和所处的观看环境,推荐信息或者推荐信息的显示方式很可能不符合用户当前的心情状态和所处的观看环境,从而造成用户困扰。
针对上述技术问题,本申请实施例提供一种基于人工智能的推荐处理方法、装置、电子设备和计算机可读存储介质,能够对于不同的用户,所显示的视频摘要都是依照其当时的表情状态和用户画像所自动生成的。因此用户更能接受由推荐系统所推送的内容,从而提高推荐的有效性。
本申请实施例提供的推荐处理方法可以由各种电子设备实施,例如可以由终端或服务器单独实施,也可以由终端和服务器协同实施。
参见图2,图2是本申请实施例提供的基于人工智能的推荐处理系统的架构示意图,终端400通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
在一些实施例中,基于人工智能的推荐处理系统的功能是基于服务器200和终端400实现的,在用户使用终端400的过程中,响应于终端400接收到用户的刷新操作,终端400获取用户的图像,其中,图像是当用户在环境中观看信息时进行拍摄得到;终端400将图像以及推荐请求发送至服务器200,通过服务器200对图像进行识别处理,得到用户的状态特征和环境的环境特征至少之一;通过服务器200获取针对用户的目标推荐信息,并生成目标推荐信息的多个候选显示方式;从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式;服务器200将目标显示方式以及目标推荐信息返回至终端400,在终端400上按照目标显示方式显示目标推荐信息。
在一些实施例中,当推荐处理系统应用于视频推荐场景时,响应于终端400接收到用户的刷新操作,终端400获取待推荐对象的图像,其中,图像是当待推荐对象在环境中观看视频时进行拍摄得到;终端400将图像发送至服务器200,通过服务器200对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一;通过服务器200获取针对待推荐对象的目标推荐视频,并生成目标推荐视频的多个候选显示方式;从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式;服务器200将目标显示方式以及目标推荐视频返回至终端400,在终端400上按照目标显示方式显示目标推荐视频。
在另一些实施例中,当本申请实施例提供的推荐处理方法由终端单独实施时,在上文所描述的各种应用场景中,响应于终端400接收到用户的刷新操作,由终端400获取待推荐对象的图像,其中,图像是当待推荐对象在环境中观看信息时进行拍摄得到,对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一,获取针对待推荐对象的目标推荐信息,并生成目标推荐信息的多个候选显示方式,从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式,按照目标显示方式显示目标推荐信息。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能电视、智能车载设备等,终端400上可以设有客户端,例如,视频客户端、浏览器客户端、信息流客户端、图像拍摄客户端等等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
接下来,说明本申请实施例提供的用于实施基于人工智能的推荐处理方法的电子设备的结构,如前,本申请实施例提供的电子设备可以是图2中的服务器200或终端400。参见图3,图3是本申请实施例提供的电子设备的结构示意图,以该电子设备为终端400为例进行说明。图3所示的终端400包括:至少一个处理器410、存储器450、至少一个网络接口420。终端400中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统440。
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口430包括使得能够呈现媒体内容的一个或多个输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口430还包括一个或多个输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Me mory),易失性存储器可以是随机存取存储器(RAM,Random Access Memor y)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块452,用于经由一个或多个(有线或无线)网络接口420到达其他电子设备,示例性的网络接口420包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块453,用于经由一个或多个与用户接口430相关联的输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块454,用于对一个或多个来自一个或多个输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的基于人工智能的推荐处理装置可以采用软件方式实现,图3示出了存储在存储器450中的基于人工智能的推荐处理装置455-1,其可以是程序和插件等形式的软件,包括以下软件模块:拍摄模块4551-1、识别模块4552-1、推荐模块4553-1以及显示模块4554-1,图3示出了存储在存储器450中的基于人工智能的推荐处理装置455-2,其可以是程序和插件等形式的软件,包括以下软件模块:拍摄模块4551-2、识别模块4552-2、推荐模块4553-2以及显示模块4554-2,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分,将在下文中说明各个模块的功能。
下面将结合本申请实施例提供的终端400的示例性应用和实施,说明本申请实施例提供的基于人工智能的推荐处理方法。
参见图4A,图4A是本申请实施例提供的基于人工智能的推荐处理方法的流程示意图,将结合图4A示出的步骤进行说明。
在步骤101中,获取待推荐对象的图像。
作为示例,待推荐对象是使用终端的用户,以视频APP为例进行说明,则待推荐对象是使用终端上视频APP的用户,图像是当待推荐对象在环境中观看信息时进行拍摄得到,例如,用户A正在地铁上观看视频APP的首页的信息,则图像是用户A在地铁环境下观看视频APP的首页的信息时拍摄得到的,拍摄所得到的是视频或者照片,即图像是拍摄得到照片或者是拍摄得到的视频中的视频帧。
在步骤102中,对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一。
在一些实施例中,步骤102中对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一,可以通过以下技术方案实现:执行以下处理至少之一:对图像进行状态识别处理,得到待推荐对象的状态特征;对图像进行环境识别处理,得到环境的环境特征。
作为示例,参见图8,图8是本申请实施例提供的图像处理流程图,图像拍摄的前提是用户授权,例如,响应于待推荐对象的授权操作,推荐客户端永久获取对用户进行拍摄的权限,或者推荐客户端在用户使用推荐客户端期间获取对用户进行拍摄的权限,或者推荐客户端在用户使用推荐客户端期间,且触发推荐请求时获取对用户进行拍摄的权限,在获取图像之后,基于表情识别模型(心情识别模型)和场景识别模型(环境识别模型),可以得出表征用户的心情状态的状态特征和浏览推荐APP时所处的环境的环境特征,其中,表情识别模型和场景识别模型可以是神经网络模型,通过机器学习训练得到。
作为示例,针对表情识别模型的训练过程,将图像样本以及预标记状态输入至表情识别模型,通过表情识别模型预测出图像样本的预测状态,以图像样本和预标记状态的误差作为第一损失,以最小化第一损失为目标更新表情识别模型的参数,从而得到表情识别模型,针对场景识别模型的训练过程,将图像样本以及预标记环境输入至场景识别模型,通过场景识别模型预测出图像样本的预测环境,以图像样本和预标记环境的误差作为第二损失,以最小化第二损失为目标更新场景识别模型的参数,从而得到场景识别模型。
在步骤103中,获取针对待推荐对象的目标推荐信息,并生成目标推荐信息的多个候选显示方式。
在一些实施例中,参见图4B,图4B是本申请实施例提供的基于人工智能的推荐处理方法的流程示意图,步骤103中获取针对待推荐对象的目标推荐信息可以通过步骤1031-步骤1032实现,将结合图4B示出的步骤1031-步骤1032进行说明。
在步骤1031中,获取针对待推荐对象的多个候选的推荐信息。
作为示例,候选的推荐信息可以为以下至少之一:文本、视频或者图像,候选的推荐信息是经过召回处理得到的,或者是经过排序处理得到的,或者是经过重排序处理得到的。
在步骤1032中,从多个候选的推荐信息中确定与状态特征和环境特征至少之一适配的目标推荐信息。
在一些实施例中,上述从多个候选的推荐信息中确定与状态特征和环境特征至少之一适配的目标推荐信息,可以通过以下技术方案实现:针对每个候选的推荐信息执行以下处理:获取候选的推荐信息的内容特征以及待推荐对象的画像特征;将候选的推荐信息的内容特征、待推荐对象的画像特征、以及状态特征和环境特征至少之一进行第一特征交叉处理,得到第一特征交叉处理结果;对第一特征交叉处理结果进行逻辑回归处理,得到候选的推荐信息的第一推荐指标;将超过第一推荐指标阈值的第一推荐指标对应候选的推荐信息确定为目标推荐信息。
作为示例,画像特征是与用户画像数据相关的单特征或者组合特征,单特征可以为用户年龄、用户职业,组合特征可以是用户不同维度的组合特征,例如用户年龄与用户职业的组合特征,内容特征是与推荐信息相关的单特征或者组合特征,单特征可以为推荐信息的发布者,推荐信息的类别,组合特征可以是推荐信息不同维度的组合特征,状态特征和环境特征是对图像进行识别得到的,状态特征表征用户的心情状态,例如,开心或者难过,环境特征用于表征浏览推荐APP时所处的环境,例如,地铁的环境特征、图书馆的环境特征等等,第一特征交叉处理是笛卡尔交叉或者是因子分解机交叉,第一特征交叉处理时将上述特征进行不同方式地组合,其中,每次组合所使用的特征部分不同或完全不同,以形成推荐信息的多个组合特征,以推荐信息的每个组合特征的第一推荐指标因子为权重参数,将推荐信息的每个组合特征加权求和处理,得到推荐信息的第一推荐指标,其中,组合特征的第一推荐指标因子是组合特征所包括的特征的第一推荐指标关联因子的乘积,第一推荐指标关联因子是推荐模型训练过程中可更新的参数,对第一特征交叉处理结果进行逻辑回归处理,逻辑回归处理可以是线性处理或者线性处理与逻辑回归方程结合的处理,对于线性处理而言,则是对各个第一特征交叉处理结果进行线性组合即可得到第一推荐指标,例如点击率,参见公式(1):
Figure BDA0003236908870000141
这里的w0为偏置处理的偏置量,这里的wi为各个第一特征交叉处理结果xi分别对应的第一推荐指标因子。
在一些实施例中,还可以在上述线性处理的基础上将线性组合代入到逻辑回归方程(2)中,如此,将特征的线性组合作为自变量,由于自变量的取值范围是负无穷到正无穷,因此,使用逻辑回归方程将自变量映射到(0,1)上,将代入逻辑回归方程后得到的结果作为第一推荐指标,例如点击率:
Figure BDA0003236908870000142
其中,这里的z为公式(1)示出的特征的线性组合,这里的g为第一推荐指标。
在一些实施例中,上述将超过第一推荐指标阈值的第一推荐指标对应候选的推荐信息确定为目标推荐信息,可以通过以下技术方案实现:选取超过第一推荐指标阈值的第一推荐指标对应的多个候选的推荐信息;在选取的多个候选的推荐信息中选取满足多样性条件的至少一个推荐信息作为目标推荐信息;其中,多样性条件规定了属于相同类别的目标推荐信息的最大数目。
作为示例,在选取的多个候选的推荐信息中选取满足多样性条件的至少一个推荐信息作为目标推荐信息可以通过以下技术方案实现,多个候选的推荐信息组成第一信息集合,将第一信息集合中第一推荐指标最高的推荐信息转移到第二信息集合,以作为第二信息集合中的首个信息,当第二信息集合中的推荐信息的数目小于信息数目阈值时,确定第一信息集合中第一推荐指标最高的信息与首个信息之间的语义距离;当语义距离大于语义距离阈值时,将第一推荐指标最高的信息从第一信息集合转移到第二信息集合,并更新为第二信息集合中的首个信息,将信息进行转移的过程可以仅是基于第一推荐指标进行转移,例如,针对10000条推荐信息,分别进行第一推荐指标预测,得到对应的第一推荐指标,接着将这10000条推荐信息按照推荐指标从高往低排列,可以选取推荐指标排在前序位置的200条推荐信息作为头部推荐信息,将这些推荐信息转移到第二信息集合,这里第一信息集合和第二信息集合中推荐信息的数目可以根据实际需求进行设定,这里将信息数目阈值作为第二信息集合中推荐信息的数目的最小值。
在一些实施例中,当第二信息集合中的推荐信息的数目小于信息数目阈值时,这里的去重功能数目阈值为第二信息集合中的信息数目,即为进行去重处理后需要得到的信息的数目,第二信息集合中的信息的数目小于信息数目阈值,意味着第二信息集合中的信息数目没有达到预先设定的数值,即还需要继续对第一信息集合进行去重处理。
在一些实施例中,当语义距离大于语义距离阈值时,将第一推荐指标最高的推荐信息从第一信息集合中删除,添加到第二信息集合中,更新为第二信息集合中的首个信息,继续将第一信息集合中的第一推荐指标最高的推荐信息与刚刚更新到第二信息集合的首个信息进行语义距离确定,以从第一信息集合中,继续筛选出与上一个转移到第二信息集合中的推荐信息不相似的推荐信息,转移到第二信息集合,这里的相似以及不相似是通过语义距离阈值来界定的,当两个推荐信息之间的语义距离大于语义距离阈值时,确定两个推荐信息属于不相似的推荐信息,当两个推荐信息之间的语义距离不大于语义距离阈值时,确定两个信息属于相似的推荐信息,即属于相同的类别,例如均属于游戏类别,例如均属于A明星的类别等等,类别的层级可以根据实际情况确定。
在一些实施例中,参见图4C,图4C是本申请实施例提供的基于人工智能的推荐处理方法的流程示意图,步骤103中生成目标推荐信息的多个候选显示方式可以通过步骤1033-步骤1036实现,将结合图4C示出的步骤1033-步骤1036进行说明。
在步骤1033中,生成目标推荐信息的至少一个候选模板。
在一些实施例中,候选模板可以是根据目标推荐信息生成的,例如,目标推荐信息是一个新视频,则生成对应新视频的候选模板,对应新视频的候选模板中封面占据比例相比于其他候选模板中封面占据比例更大,
在步骤1034中,生成目标推荐信息的至少一个候选摘要。
在一些实施例中,步骤1034中生成目标推荐信息的至少一个候选摘要,可以通过以下技术方案实现:执行以下处理至少之一:提取目标推荐信息的关键内容,根据关键内容生成候选摘要;确定与目标推荐信息具有互动行为的互动对象,根据互动对象生成候选摘要;确定与目标推荐信息的关联度超过关联度阈值的关联信息,根据关联信息生成候选摘要。
作为示例,提取目标推荐信息的关键内容,根据关键内容生成候选摘要,例如,针对电影A,根据电影A的演员信息生成候选摘要;确定与目标推荐信息具有互动行为的互动对象,根据互动对象生成候选摘要,例如,针对电影A,用户A和用户B曾经评论过电影A,则根据用户A和用户B生成候选摘要,表征用户A和用户B曾经评论过电影A;确定与目标推荐信息的关联度超过关联度阈值的关联信息,根据关联信息生成候选摘要,例如,针对电影A,某个广告A与电影A之间的关联度超过关联度阈值,则根据广告A生成候选摘要,以通过候选摘要向用户推荐广告A。
在步骤1035中,生成目标推荐信息的至少一个候选封面;
在一些实施例中,当目标推荐信息为推荐视频时,步骤1035中生成目标推荐信息的至少一个候选封面,可以通过以下技术方案实现:对推荐视频分割为多个镜头,其中,每个镜头包括多个连续的视频帧;针对每个镜头执行以下处理:对镜头的多个视频帧进行聚类处理,得到镜头下的多个聚类;确定每个聚类中与对应的聚类中心距离最近的视频帧,并将最近的视频帧确定为候选封面。
在一些实施例中,上述对推荐视频分割为多个镜头,可以通过以下技术方案实现:针对推荐视频的每个视频帧执行以下处理:确定视频帧的每个像素点的位置;将任意两个连续的视频帧组成分割单元,并针对推荐视频的每个分割单元执行以下处理:确定分割单元的两个视频帧的相同位置的像素点的灰度差值,并对多个位置的像素点的灰度差值进行求平均处理,得到分割单元的差值;确定大于差值阈值的差值对应的分割单元具有镜头边界,并将分割单元的两个视频帧划分为不同的镜头。
作为示例,把视频分割成多个镜头,主要是寻找镜头的边界,一个镜头是描绘同一场景的一个事件或连续的动作,因此当镜头发生变化的时候,视频帧之间发生的变化会比较大,而相同镜头内的视频帧之间差别会比较小,因此可以通过相邻两个视频帧的差别来判断两个视频帧是否属于同一个镜头,两个视频帧的差别可以通过灰度差来表征,参见公式(3):
Figure BDA0003236908870000171
其中,Dis(分割单元的差值)是视频帧I1和视频帧I2之间的灰度差,M是视频帧I1和视频帧I2的像素数目,x,y是视频帧I1和视频帧I2对应的像素点的位置,I1(x,y)-I2(x,y)是两个视频帧的相同位置的像素点的灰度差值,两帧的差别还可以通过比较两帧的直方图和边缘等方式来计算。
在一些实施例中,上述对镜头的多个视频帧进行聚类处理,得到镜头下的多个聚类,可以通过以下技术方案实现:将多个连续视频帧组成视频帧集合;从视频帧集合中随机选择N个视频帧,将对应N个视频帧的图像特征作为多个聚类集合的初始聚类中心,并将N个视频帧从视频帧集合移除,其中,N为对应镜头的候选封面的数目,N为大于或者等于2的整数;初始化聚类处理的迭代次数为M,并建立对应每个聚类的空的集合,其中,M为大于或者等于2的整数;在聚类处理的每一次迭代过程中执行以下处理:对每个聚类的集合进行更新处理,并基于更新处理结果执行聚类中心生成处理,得到每个聚类的新聚类中心,当新聚类中心不同于初始聚类中心时,将初始聚类中心对应的视频帧再次添加至视频帧集合,并基于新聚类中心更新初始聚类中心;将迭代M次后得到的每个聚类的集合确定为聚类处理结果,或者,将迭代m次后得到的每个聚类的集合确定为聚类处理结果;其中,迭代m次后得到的多个聚类与迭代m-1次后得到的多个聚类的聚类中心相同,m为整数变量且取值满足2≤m≤M。
作为示例,上述对每个聚类的集合进行更新处理,并基于更新处理结果执行聚类中心生成处理,得到每个聚类的新聚类中心,可以通过以下技术方案实现:针对视频帧集合中每个视频帧执行以下处理:确定视频帧的图像特征与每个聚类的初始聚类中心之间的相似度;将最大相似度对应的初始聚类中心确定为与视频帧属于相同聚类,并将视频帧转移至最大相似度初始聚类中心对应的聚类的集合,最大相似度初始聚类中心为最大的相似度对应的初始聚类中心;将每个聚类的集合中每个视频帧的图像特征进行平均处理,得到每个聚类的新聚类中心。
承接上述示例,存在30个视频帧,N为2,则聚类处理的目标是将30个视频帧分为两个聚类,每个聚类存在对应的集合,每个集合中包括对应聚类的视频帧,首先随机选择2个视频帧的图像特征分别作为两个聚类的初始聚类中心,针对剩余的28个视频帧,计算每个视频帧与2个初始聚类中心的相似度,例如采取L2距离来评估相似度,例如,对于视频帧E,它的图像特征与初始聚类中心a的距离较近,则将视频帧E分配到初始聚类中心a所对应的聚类的集合中,针对28个视频帧均执行分配操作后,针对每个聚类重新计算对应的新聚类中心,若两个聚类的新聚类中心相同或者新聚类中心与初始聚类中心的相似度大于相似度阈值,则可以直接将每个集合确定为聚类处理结果,若两个聚类的新聚类中心不相同,且新聚类中心与初始聚类中心的相似度不大于相似度阈值,则继续利用新聚类中心更新初始聚类中心,并再次针对聚类中心对应的视频帧之外的视频帧进行分配操作,例如,原来的初始聚类中心a被新聚类中心代替后,原来的初始聚类中心a对应的视频帧属于聚类中心对应的视频帧之外的视频帧,需要再次参与到分配过程中,直到满足两个聚类的新聚类中心相同,或者新聚类中心与初始聚类中心的相似度大于相似度阈值,或者迭代了指定次数。
在一些实施例中,上述确定每个聚类中与对应的聚类中心距离最近的视频帧,可以通过以下技术方案实现:针对每个聚类执行以下处理:对聚类的每个视频帧的图像特征进行求平均处理,得到聚类的聚类中心;根据聚类的每个视频帧的图像特征与聚类中心之间的距离,确定与聚类中心距离最近的视频帧。
作为示例,针对某个聚类A,存在10个视频帧,对聚类A的10个视频帧的图像特征进行求平均处理,得到聚类的聚类中心,根据聚类A的每个视频帧的图像特征与聚类中心之间的距离,确定与聚类中心距离最近的视频帧,例如视频帧A的图像特征与聚类中心之间的距离最近,则将视频帧A确定为与聚类中心距离最近的视频帧。
在步骤1036中,将至少一个候选模板、至少一个候选摘要与至少一个候选封面进行不同方式地组合,得到多个候选显示方式。
作为示例,候选摘要包括以下至少之一:目标推荐信息的标题、目标推荐信息的推荐理由、目标推荐信息的介绍,多个候选显示方式各自包括一个候选模板、一个候选摘要以及一个候选封面,且多个候选显示方式各不相同。
在一些实施例中,可以仅生成至少一个候选摘要与至少一个候选封面,再将至少一个候选摘要与至少一个候选封面进行不同方式地组合,得到多个候选显示方式。
在步骤104中,从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式。
在一些实施例中,步骤104中从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式,可以通过以下技术方案实现:针对每个候选显示方式执行以下处理:提取候选显示方式的文本特征以及图像特征;候选显示方式的文本特征以及图像特征、画像特征、以及状态特征和环境特征至少之一进行第二特征交叉处理,得到第二特征交叉处理结果;对第二特征交叉处理结果进行逻辑回归处理,得到目标推荐信息的候选显示方式的第二推荐指标。将超过第二推荐指标阈值的第二推荐指标对应的候选显示方式确定为目标显示方式。
作为示例,画像特征是与用户画像数据相关的单特征或者组合特征,单特征可以为用户年龄、用户职业,组合特征可以是用户不同维度的组合特征,例如用户年龄与用户职业的组合特征,状态特征和环境特征是对图像进行识别得到的,状态特征表征用户的心情状态,例如,开心或者难过,环境特征用于表征浏览推荐APP时所处的环境,例如,地铁的环境特征、图书馆的环境特征等等,第一特征交叉处理是笛卡尔交叉或者是因子分解机交叉,第一特征交叉处理时将上述特征进行不同方式地组合,其中,每次组合所使用的特征部分不同或完全不同,以形成推荐信息的多个组合特征,以推荐信息的每个组合特征的第二推荐指标因子为权重参数,将推荐信息的每个组合特征加权求和处理,得到推荐信息的第二推荐指标,其中,组合特征的第二推荐指标因子是组合特征所包括的特征的第二推荐指标关联因子的乘积,第二推荐指标关联因子是推荐模型训练过程中可更新的参数,对第二特征交叉处理结果进行逻辑回归处理,逻辑回归处理可以是线性处理或者线性处理与逻辑回归方程结合的处理,对于线性处理而言,则是对各个第二特征交叉处理结果进行线性组合即可得到第二推荐指标,例如点击率,参见公式(4):
Figure BDA0003236908870000201
这里的w0为偏置处理的偏置量,这里的wi为各个第二特征交叉处理结果xi分别对应的第二推荐指标因子。
在一些实施例中,还可以在上述线性处理的基础上将线性组合代入到逻辑回归方程(5)中,如此,将特征的线性组合作为自变量,由于自变量的取值范围是负无穷到正无穷,因此,使用逻辑回归方程将自变量映射到(0,1)上,将代入逻辑回归方程后得到的结果作为第二推荐指标,例如点击率:
Figure BDA0003236908870000202
其中,这里的z为公式(4)示出的特征的线性组合,这里的g为第二推荐指标。
在步骤105中,按照目标显示方式显示目标推荐信息。
参见图4D,图4D是本申请实施例提供的基于人工智能的推荐处理方法的流程示意图,将结合图4D示出的步骤进行说明。
在步骤201中,获取待推荐对象的图像,其中,图像是当待推荐对象在环境中观看信息时进行拍摄得到。
作为示例,图像是当待推荐对象在环境中观看信息时进行拍摄得到的照片或者视频中的视频帧。
在步骤202中,对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一;
在步骤203中,获取针对待推荐对象的多个候选的推荐信息;
在步骤204中,从多个候选的推荐信息中确定与状态特征和环境特征至少之一适配的目标推荐信息;
在步骤205中,显示目标推荐信息。
作为示例,步骤201-步骤202的实施方式可以参考步骤101-102的实施方式,步骤203-步骤205的实施方式可以参考步骤1031-步骤1032的实施方式。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
在一些实施例中,当推荐处理系统应用于视频推荐场景时,终端获取待推荐对象的图像,其中,图像是当待推荐对象在环境中观看视频时进行拍摄得到;终端将图像发送至服务器,通过服务器对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一;通过服务器获取针对待推荐对象的目标推荐视频,并生成目标推荐视频的多个候选显示方式;从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式;服务器将目标显示方式以及目标推荐视频返回至终端,在终端上按照目标显示方式显示目标推荐视频,参见图10,图10是本申请实施例提供的基于人工智能的推荐处理方法的产品界面图,响应于用户针对目标显示信息501的触发操作,显示目标推荐信息的播放页502,其中,目标显示信息501的显示方式是个性化的,针对不同的用户可以显示不同的封面、标题等等,通过本申请实施例提供的推荐处理方法,终端拍摄用户表情和环境,并结合用户画像,来对个性化推荐内容进行个性化显示,对不同用户显示内容的个性化封面,个性化内容简介,个性化标题和个性化的推荐原因,例如,针对视频A,如果用户表情开心,则显示色彩明亮的封面,附带搞笑的标题,如果用户的表情不高兴,则显示色彩暗淡的封面,附带简单的标题,例如,推荐给高级玩家时,标题上强调操作的精彩程度,推荐给休闲玩家时,内容简介中显示内容的有趣性,例如,推荐给英雄A的玩家时,封面图可以截取英雄A在视频中的表现,推荐给英雄B的玩家时,封面图要选取能突出英雄B的画面,从而可以更加的吸引用户点击观看视频A。
参见图5,图5是本申请实施例提供的推荐处理方法的流程示意图,首先通过特征工程来提取用户画像和视频的内容特征,然后实时获取的用户照片(用户授权后),提取用户照片里状态特征和环境特征(用户照片的特征),使用历史数据来训练推荐模型,根据推荐模型得到用户对应的推荐视频,使用历史数据来训练视频显示模型,使用视频显示模型根据用户照片的特征、用户画像、推荐视频来生成个性化的显示内容,并将个性化的显示内容(封面图,标题,简介,推荐理由等)推送给用户。
本申请实施例的核心思想是通过自动生成推荐视频的显示方式来提高视频推荐的点击率和精确度,参见图6,图6是本申请实施例提供的推荐处理方法的显示流程图,首先通过推荐系统得到用户所对应的个性化的推荐视频,针对视频文本数据,可以从不同的角度来生成多个文本的摘要(标题、简介等等),作为候选摘要,可以通过机器学习的方法来自动生成;同样的视频,可以突出其中的某个维度的信息,例如,针对一个电影相关视频,可以通过以下一些维度来编辑生成内容摘要:a)信息维度:例如突出电影里的演员;b)用户维度:例如突出视频被多个好友看过;c)传播维度:例如突出相关电影的热度,针对显示方式的封面,从推荐视频中提取图片或者视频作为候选封面,获取用户的用户画像以及用户当前照片,基于用户当前照片获取状态特征和环境特征,进而通过视频展示模型(机器学习模型)生成个性化的显示方式,在使用机器学习模型来选取最终的显示方式时,可以选取逻辑回归模型之外的机器学习算法,如神经网络,随机森林等,主要是基于数据分布情况和实际场景来进行选取。
在一些实施例中,参见图7,图7是本申请实施提供的关键帧提取示意图,针对显示方式的候选封面,从视频中提取多个关键帧作为封面的候选,需要使用视频的关键帧提取技术,使用基于聚类的思想,首先把视频分成多个镜头,然后对于镜头中的每帧都提取图像特征(例如,颜色、直方图、形状、运动等特征),然后通过K-Means算法把镜头下的所有视频帧分成K类,最后在每一类中选取离聚类中心最近的视频帧来作为该类的关键帧。把视频分割成多个镜头,主要是寻找镜头的边界,一个镜头是描绘同一场景的一个事件或连续的动作,因此当镜头发生变化的时候,视频帧之间发生的变化会比较大,而相同镜头内的视频帧之间差别会比较小,因此可以通过相邻两个视频帧的差别来判断两个视频帧是否属于同一个镜头,两个视频帧的差别可以通过灰度差来表征,参见公式(6):
Figure BDA0003236908870000231
其中,Dis是视频帧I1和视频帧I2之间的灰度差,M是视频帧I1和视频帧I2的像素数目,x,y是视频帧I1和视频帧I2对应的像素点的位置,两帧的差别还可以通过比较两帧的直方图和边缘等方式来计算。
在一些实施例中,在提取视频中的关键帧时,也可以使用其他的关键帧提取方法,例如,基于视频内容的方法,可以提取出现某个演员的画面作为关键帧,可以针对不同类型的视频训练不同内容识别模型,进而通过内容识别模型提取关键帧。
在一些实施例中,参见图8,图8是本申请实施例提供的图像处理流程图,图像拍摄的前提是用户授权,例如,响应于待推荐对象的授权操作,推荐客户端永久获取对用户进行拍摄的权限,或者推荐客户端在用户使用推荐客户端期间获取对用户进行拍摄的权限,或者推荐客户端在用户使用推荐客户端期间,且触发推荐请求时获取对用户进行拍摄的权限,在获取图像之后,基于表情识别模型和场景识别模型,可以得出表征用户的心情状态的状态特征和浏览推荐APP时所处的环境的环境特征,以形成用户当前看视频的照片特征,其中,表情识别模型和场景识别模型可以是神经网络模型,通过机器学习训练得到。
在一些实施例中,参见图9,图9是本申请实施例提供的显示处理示意图,基于机器学习模型,可以根据用户的状态特征、环境特征、用户画像、从文本和图片的候选中选取最合适的文本和图片作为显示的内容,可以复用推荐系统中使用的逻辑回归模型,对用户提取画像特征、状态特征、环境特征,对候选的文本提取文本特征,例如词袋特征、文章特征等等,对候选的图像提取颜色、直方图等图像特征,然后对上述特征进行交叉处理,使用逻辑回归模型预测用户是否点击推荐视频的某种显示方式,逻辑回归模型的输出是用户点击推荐视频的某种显示方式的概率,因此对于每个推荐视频的候选显示方式,都可以得到用户是否点击的概率,只要选择概率最高的显示方式作为最终的结果即可,其中,逻辑回归模型的训练过程如下:首先,收集训练数据D,训练数据D为多组数据,例如(x1,y1),(x2,y2),…,(xN,yN),其中,x代表一个多维特征向量(包括用户侧的特征和视频侧的特征),y代表用户是否点击推荐视频的候选显示方式,1为点击,0为不点击,训练目标是损失函数最小化,损失函数参见公式(7):
Figure BDA0003236908870000241
其中,P(y=|x;θ)是预测得到的点击率,x是多维特征向量,训练的目标是要找到一组能够最小化损失函数的参数θ,然后应用这组参数来对新的数据进行预测。
本申请实施例提出的基于用户照片的个性化推荐的视频的显示方案能够更好的吸引用户,从而提高视频推荐的点击率和精确度。
下面继续说明本申请实施例提供的基于人工智能的推荐处理装置455-1和455-2的实施为软件模块的示例性结构,在一些实施例中,如图3所示,存储在存储器450的基于人工智能的推荐处理装置455-1中的软件模块可以包括:拍摄模块4551-1,用于获取待推荐对象的图像,其中,图像是当待推荐对象在环境中观看信息时进行拍摄得到;识别模块4552-1,用于对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一;推荐模块4553-1,用于获取针对待推荐对象的目标推荐信息,并生成目标推荐信息的多个候选显示方式;显示模块4554-1,用于从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式;显示模块4554-1,还用于按照目标显示方式显示目标推荐信息。
在一些实施例中,推荐模块4553-1,还用于:获取针对待推荐对象的多个候选的推荐信息;从多个候选的推荐信息中确定与状态特征和环境特征至少之一适配的目标推荐信息。
在一些实施例中,推荐模块4553-1,还用于:针对每个候选的推荐信息执行以下处理:获取候选的推荐信息的内容特征以及待推荐对象的画像特征;将候选的推荐信息的内容特征、待推荐对象的画像特征、以及状态特征和环境特征至少之一进行第一特征交叉处理,得到第一特征交叉处理结果;对第一特征交叉处理结果进行逻辑回归处理,得到候选的推荐信息的第一推荐指标;将超过第一推荐指标阈值的第一推荐指标对应候选的推荐信息确定为目标推荐信息。
在一些实施例中,推荐模块4553-1,还用于:选取超过第一推荐指标阈值的第一推荐指标对应的多个候选的推荐信息;在选取的多个候选的推荐信息中选取满足多样性条件的至少一个推荐信息作为目标推荐信息;其中,多样性条件规定了属于相同类别的目标推荐信息的最大数目。
在一些实施例中,推荐模块4553-1,还用于:生成目标推荐信息的至少一个候选模板;生成目标推荐信息的至少一个候选摘要;生成目标推荐信息的至少一个候选封面;将至少一个候选模板、至少一个候选摘要与至少一个候选封面进行不同方式地组合,得到多个候选显示方式;其中,候选摘要包括以下至少之一:目标推荐信息的标题、目标推荐信息的推荐理由、目标推荐信息的介绍。
在一些实施例中,推荐模块4553-1,还用于:执行以下处理至少之一:提取目标推荐信息的关键内容,根据关键内容生成候选摘要;确定与目标推荐信息具有互动行为的互动对象,根据互动对象生成候选摘要;确定与目标推荐信息的关联度超过关联度阈值的关联信息,根据关联信息生成候选摘要。
在一些实施例中,推荐模块4553-1,还用于:当目标推荐信息为推荐视频时,对推荐视频分割为多个镜头,其中,每个镜头包括多个连续的视频帧;针对每个镜头执行以下处理:对镜头的多个视频帧进行聚类处理,得到镜头下的多个聚类;确定每个聚类中与对应的聚类中心距离最近的视频帧,并将最近的视频帧确定为候选封面。
在一些实施例中,推荐模块4553-1,还用于:针对推荐视频的每个视频帧执行以下处理:确定视频帧的每个像素点的位置;将任意两个连续的视频帧组成分割单元,并针对推荐视频的每个分割单元执行以下处理:确定分割单元的两个视频帧的相同位置的像素点的灰度差值,并对多个位置的像素点的灰度差值进行求平均处理,得到分割单元的差值;确定大于差值阈值的差值对应的分割单元具有镜头边界,并将分割单元的两个视频帧划分为不同的镜头。
在一些实施例中,推荐模块4553-1,还用于:将多个连续视频帧组成视频帧集合;从视频帧集合中随机选择N个视频帧,将对应N个视频帧的图像特征作为多个聚类集合的初始聚类中心,并将N个视频帧从视频帧集合移除,其中,N为对应镜头的候选封面的数目,N为大于或者等于2的整数;初始化聚类处理的迭代次数为M,并建立对应每个聚类的空的集合,其中,M为大于或者等于2的整数;在聚类处理的每一次迭代过程中执行以下处理:对每个聚类的集合进行更新处理,并基于更新处理结果执行聚类中心生成处理,得到每个聚类的新聚类中心,当新聚类中心不同于初始聚类中心时,将初始聚类中心对应的视频帧再次添加至视频帧集合,并基于新聚类中心更新初始聚类中心;将迭代M次后得到的每个聚类的集合确定为聚类处理结果,或者,将迭代m次后得到的每个聚类的集合确定为聚类处理结果;其中,迭代m次后得到的多个聚类与迭代m-1次后得到的多个聚类的聚类中心相同,m为整数变量且取值满足2≤m≤M。
在一些实施例中,推荐模块4553-1,还用于:针对每个聚类执行以下处理:对聚类的每个视频帧的图像特征进行求平均处理,得到聚类的聚类中心;根据聚类的每个视频帧的图像特征与聚类中心之间的距离,确定与聚类中心距离最近的视频帧。
在一些实施例中,识别模块4552-1,还用于执行以下处理至少之一:对图像进行状态识别处理,得到待推荐对象的状态特征;对图像进行环境识别处理,得到环境的环境特征。
在一些实施例中,显示模块4554-1,用于针对每个候选显示方式执行以下处理:提取候选显示方式的文本特征以及图像特征;候选显示方式的文本特征以及图像特征、画像特征、以及状态特征和环境特征至少之一进行第二特征交叉处理,得到第二特征交叉处理结果;对第二特征交叉处理结果进行逻辑回归处理,得到目标推荐信息的候选显示方式的第二推荐指标。将超过第二推荐指标阈值的第二推荐指标对应的候选显示方式确定为目标显示方式。
在一些实施例中,如图3所示,存储在存储器450的基于人工智能的推荐处理装置455-2中的软件模块可以包括:拍摄模块4551-2,用于获取待推荐对象的图像,其中,图像是当待推荐对象在环境中观看信息时进行拍摄得到;识别模块4552-2,用于对图像进行识别处理,得到待推荐对象的状态特征和环境的环境特征至少之一;推荐模块4553-2,用于获取针对待推荐对象的多个候选的推荐信息;推荐模块4553-2,还用于从多个候选的推荐信息中确定与状态特征和环境特征至少之一适配的目标推荐信息;显示模块4554-2,用于显示目标推荐信息。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行本申请实施例上述的基于人工智能的推荐处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将被处理器执行本申请实施例提供的基于人工智能的推荐处理方法,例如,如图4A-4D示出的基于人工智能的推荐处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EP ROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(H TML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
综上所述,通过本申请实施例获取待推荐对象(用户)在环境中观看信息时进行拍摄得到图像,并以此获取用户的状态特征和环境特征至少之一,后续从多个候选显示方式中确定与状态特征和环境特征至少之一适配的目标显示方式,并按照目标显示方式显示目标推荐信息,由于目标显示方式与状态特征和环境特征至少之一相关,且状态特征和环境特征至少之一能够直接表征用户在实时推荐过程中的表现以及所处的环境,因此能够准确推导出目标显示方式,有效提高用户的点击率,从而提高推荐准确度以及推荐效率。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

Claims (16)

1.一种基于人工智能的推荐处理方法,其特征在于,包括:
获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
获取针对所述待推荐对象的目标推荐信息,并生成所述目标推荐信息的多个候选显示方式;
从所述多个候选显示方式中确定与所述状态特征和所述环境特征至少之一适配的目标显示方式;
按照所述目标显示方式显示所述目标推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述获取针对所述待推荐对象的目标推荐信息,包括:
获取针对所述待推荐对象的多个候选的推荐信息;
从所述多个候选的推荐信息中确定与所述状态特征和所述环境特征至少之一适配的目标推荐信息。
3.根据权利要求2所述的方法,其特征在于,所述从所述多个候选的推荐信息中确定与所述状态特征和所述环境特征至少之一适配的目标推荐信息,包括:
针对每个所述候选的推荐信息执行以下处理:
获取所述候选的推荐信息的内容特征以及所述待推荐对象的画像特征;
将所述候选的推荐信息的内容特征、所述待推荐对象的画像特征、以及所述状态特征和所述环境特征至少之一进行第一特征交叉处理,得到第一特征交叉处理结果;
对所述第一特征交叉处理结果进行逻辑回归处理,得到所述候选的推荐信息的第一推荐指标;
将超过第一推荐指标阈值的第一推荐指标对应候选的推荐信息确定为目标推荐信息。
4.根据权利要求3所述的方法,其特征在于,所述将超过第一推荐指标阈值的第一推荐指标对应候选的推荐信息确定为目标推荐信息,包括:
选取超过第一推荐指标阈值的第一推荐指标对应的多个候选的推荐信息;
在选取的多个候选的推荐信息中选取满足多样性条件的至少一个推荐信息作为目标推荐信息;
其中,所述多样性条件规定了属于相同类别的目标推荐信息的最大数目。
5.根据权利要求1所述的方法,其特征在于,所述生成所述目标推荐信息的多个候选显示方式,包括:
生成所述目标推荐信息的至少一个候选模板;
生成所述目标推荐信息的至少一个候选摘要;
生成所述目标推荐信息的至少一个候选封面;
将所述至少一个候选模板、所述至少一个候选摘要与所述至少一个候选封面进行不同方式地组合,得到所述多个候选显示方式;
其中,所述候选摘要包括以下至少之一:所述目标推荐信息的标题、所述目标推荐信息的推荐理由、所述目标推荐信息的介绍。
6.根据权利要求5所述的方法,其特征在于,所述生成所述目标推荐信息的至少一个候选摘要,包括:
执行以下处理至少之一:
提取所述目标推荐信息的关键内容,根据所述关键内容生成所述候选摘要;
确定与所述目标推荐信息具有互动行为的互动对象,根据所述互动对象生成所述候选摘要;
确定与所述目标推荐信息的关联度超过关联度阈值的关联信息,根据所述关联信息生成所述候选摘要。
7.根据权利要求5所述的方法,其特征在于,当所述目标推荐信息为推荐视频时,所述生成所述目标推荐信息的至少一个候选封面,包括:
对所述推荐视频分割为多个镜头,其中,每个所述镜头包括多个连续的视频帧;
针对每个所述镜头执行以下处理:
对所述镜头的多个视频帧进行聚类处理,得到所述镜头下的多个聚类;
确定每个所述聚类中与对应的聚类中心距离最近的视频帧,并将所述最近的视频帧确定为所述候选封面。
8.根据权利要求7所述的方法,其特征在于,所述对所述推荐视频分割为多个镜头,包括:
针对所述推荐视频的每个视频帧执行以下处理:确定所述视频帧的每个像素点的位置;
将任意两个连续的视频帧组成分割单元,并针对所述推荐视频的每个分割单元执行以下处理:确定所述分割单元的两个视频帧的相同位置的像素点的灰度差值,并对多个位置的像素点的灰度差值进行求平均处理,得到所述分割单元的差值;
确定大于差值阈值的差值对应的分割单元具有镜头边界,并将所述分割单元的两个视频帧划分为不同的镜头。
9.根据权利要求7所述的方法,其特征在于,所述对所述镜头的多个视频帧进行聚类处理,得到所述镜头下的多个聚类,包括:
将所述多个连续视频帧组成视频帧集合;
从所述视频帧集合中随机选择N个视频帧,将对应所述N个视频帧的图像特征作为多个聚类集合的初始聚类中心,并将所述N个视频帧从所述视频帧集合移除,其中,N为对应所述镜头的候选封面的数目,N为大于或者等于2的整数;
初始化聚类处理的迭代次数为M,并建立对应每个所述聚类的空的集合,其中,M为大于或者等于2的整数;
在所述聚类处理的每一次迭代过程中执行以下处理:对每个所述聚类的集合进行更新处理,并基于更新处理结果执行聚类中心生成处理,得到每个所述聚类的新聚类中心,当所述新聚类中心不同于所述初始聚类中心时,将所述初始聚类中心对应的视频帧再次添加至所述视频帧集合,并基于所述新聚类中心更新所述初始聚类中心;
将迭代M次后得到的每个所述聚类的集合确定为聚类处理结果,或者,将迭代m次后得到的每个所述聚类的集合确定为聚类处理结果;
其中,迭代m次后得到的多个聚类与迭代m-1次后得到的多个聚类的聚类中心相同,m为整数变量且取值满足2≤m≤M。
10.根据权利要求1所述的方法,其特征在于,所述对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一,包括:
执行以下处理至少之一:
对所述图像进行状态识别处理,得到所述待推荐对象的状态特征;
对所述图像进行环境识别处理,得到所述环境的环境特征。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述从所述多个候选显示方式中确定与所述状态特征和所述环境特征至少之一适配的目标显示方式,包括:
针对每个所述候选显示方式执行以下处理:
提取所述候选显示方式的文本特征以及图像特征;
所述候选显示方式的文本特征以及图像特征、所述画像特征、以及所述状态特征和所述环境特征至少之一进行第二特征交叉处理,得到第二特征交叉处理结果;
对所述第二特征交叉处理结果进行逻辑回归处理,得到所述目标推荐信息的候选显示方式的第二推荐指标;
将超过第二推荐指标阈值的第二推荐指标对应的候选显示方式确定为所述目标显示方式。
12.一种基于人工智能的推荐处理方法,其特征在于,包括:
获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
获取针对所述待推荐对象的多个候选的推荐信息;
从所述多个候选的推荐信息中确定与所述状态特征和所述环境特征至少之一适配的目标推荐信息;
显示所述目标推荐信息。
13.一种基于人工智能的推荐处理装置,其特征在于,包括:
拍摄模块,用于获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
识别模块,用于对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
推荐模块,用于获取针对所述待推荐对象的目标推荐信息,并生成所述目标推荐信息的多个候选显示方式;
显示模块,用于从所述多个候选显示方式中确定与所述状态特征和所述环境特征至少之一适配的目标显示方式;
所述显示模块,还用于按照所述目标显示方式显示所述目标推荐信息。
14.一种基于人工智能的推荐处理装置,其特征在于,包括:
拍摄模块,用于获取待推荐对象的图像,其中,所述图像是当所述待推荐对象在环境中观看信息时进行拍摄得到;
识别模块,用于对所述图像进行识别处理,得到所述待推荐对象的状态特征和所述环境的环境特征至少之一;
推荐模块,用于获取针对所述待推荐对象的多个候选的推荐信息;
所述推荐模块,还用于从所述多个候选的推荐信息中确定与所述状态特征和所述环境特征至少之一适配的目标推荐信息;
显示模块,用于显示所述目标推荐信息。
15.一种电子设备,其特征在于,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至至11或者12中任一项所述的基于人工智能的推荐处理方法。
16.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于被处理器执行时,实现权利要求1至11或者12中任一项所述的基于人工智能的推荐处理方法。
CN202111005050.5A 2021-08-30 2021-08-30 基于人工智能的推荐处理方法、装置及电子设备 Pending CN115935049A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111005050.5A CN115935049A (zh) 2021-08-30 2021-08-30 基于人工智能的推荐处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111005050.5A CN115935049A (zh) 2021-08-30 2021-08-30 基于人工智能的推荐处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN115935049A true CN115935049A (zh) 2023-04-07

Family

ID=86651183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111005050.5A Pending CN115935049A (zh) 2021-08-30 2021-08-30 基于人工智能的推荐处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN115935049A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117351545A (zh) * 2023-10-11 2024-01-05 广东圣千科技有限公司 一种基于大数据挖掘的护肤管理方法及系统
CN117857916A (zh) * 2024-03-08 2024-04-09 深圳市元亨光电股份有限公司 基于人工智能的mini led显示方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117351545A (zh) * 2023-10-11 2024-01-05 广东圣千科技有限公司 一种基于大数据挖掘的护肤管理方法及系统
CN117351545B (zh) * 2023-10-11 2024-03-15 广东圣千科技有限公司 一种基于大数据挖掘的护肤管理方法及系统
CN117857916A (zh) * 2024-03-08 2024-04-09 深圳市元亨光电股份有限公司 基于人工智能的mini led显示方法及装置
CN117857916B (zh) * 2024-03-08 2024-06-18 深圳市元亨光电股份有限公司 基于人工智能的mini led显示方法及装置

Similar Documents

Publication Publication Date Title
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN110446063B (zh) 视频封面的生成方法、装置及电子设备
US10176198B1 (en) Techniques for identifying visually similar content
CN113395578B (zh) 一种提取视频主题文本的方法、装置、设备及存储介质
CN110598048B (zh) 视频检索方法及视频检索映射关系生成方法、装置
CN112163165A (zh) 信息推荐方法、装置、设备及计算机可读存储介质
CN109086439A (zh) 信息推荐方法及装置
CN110390033A (zh) 图像分类模型的训练方法、装置、电子设备及存储介质
CN111966914A (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN109271542A (zh) 封面确定方法、装置、设备及可读存储介质
CN113010703A (zh) 一种信息推荐方法、装置、电子设备和存储介质
CN113204659B (zh) 多媒体资源的标签分类方法、装置、电子设备及存储介质
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
US9129216B1 (en) System, method and apparatus for computer aided association of relevant images with text
CN111783712A (zh) 一种视频处理方法、装置、设备及介质
CN113761253A (zh) 视频标签确定方法、装置、设备及存储介质
WO2023045635A1 (zh) 多媒体文件的字幕处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN111708913A (zh) 一种标签生成方法、设备及计算机可读存储介质
CN113657087A (zh) 信息的匹配方法及装置
CN115935049A (zh) 基于人工智能的推荐处理方法、装置及电子设备
CN113395584B (zh) 一种视频数据处理方法、装置、设备以及介质
CN115130493A (zh) 基于图像识别的面部形变推荐方法、装置、设备和介质
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN113407775A (zh) 视频搜索方法、装置及电子设备
CN111797765B (zh) 图像处理方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40084601

Country of ref document: HK