CN116244496B - 一种基于产业链的资源推荐方法 - Google Patents
一种基于产业链的资源推荐方法 Download PDFInfo
- Publication number
- CN116244496B CN116244496B CN202211555850.9A CN202211555850A CN116244496B CN 116244496 B CN116244496 B CN 116244496B CN 202211555850 A CN202211555850 A CN 202211555850A CN 116244496 B CN116244496 B CN 116244496B
- Authority
- CN
- China
- Prior art keywords
- keyword
- keywords
- recommended
- resource information
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000010801 machine learning Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 5
- 238000007726 management method Methods 0.000 description 19
- 230000009286 beneficial effect Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于产业链的资源推荐方法。包括:获取当前产业链上用户进行资源请求时的操作信息,并提取关键词,构成第一初始关键词标签;获取资源管理后台的待推荐资源信息,并提取每个待推荐资源信息的关键词,构成第二关键词标签数据库;将所述第一初始关键词标签中的关键词进行相似关键词匹配,并与第一初始关键词标签合并,得到第一合并关键词标签;基于第一合并关键词标签与每个第二关键词标签进行逐一匹配,计算对应第二关键词标签的匹配指数;提取匹配指数大于预设阈值的第三关键词标签,并将对应的资源信息进行推荐。通过对关键词的提取比较,实现基于产业链的资源推荐,可以使得对用户的推荐更加精准,用户对资源的需求也更高效。
Description
技术领域
本发明涉及资源推荐技术领域,特别涉及一种基于产业链的资源推荐方法。
背景技术
目前,互联网时代信息不断膨胀,在各种门户网站及信息发布平台中,内容的更新已经成为了网站最基础的问题。在现有能力的限制情况下,如何应对更多的信息内容已经成为了一个重点。
然而,信息量庞大且更新速度快,在现有能力限制的情况下,很难满足用户对于信息推荐需求及时、准确的要求。所以,解决产业链上用户信息推荐不及时以及资源推荐不精准的问题成为需要考虑的首要问题。
因此,本发明提供了一种基于产业链的资源推荐方法。
发明内容
本发明提供一种基于产业链的资源管理方法,用以通过对关键词的提取比较,实现基于产业链的资源推荐,从而可以使得对于用户的资源推荐更加精准,同时,按照资源相关程度高低进行顺序推荐,也可以使得用户对资源的获取更高效。
本发明提供一种基于产业链的资源管理方法,包括:
步骤1:获取当前产业链上用户进行资源请求时的操作信息,作为对照资源信息,并提取对照资源信息中的关键词,构成第一初始关键词标签;
步骤2:获取资源管理后台的待推荐资源信息,并提取每个待推荐资源信息的关键词,构成第二关键词标签数据库;
步骤3:将所述第一初始关键词标签中的若干关键词进行相似关键词的识别匹配,得到对应的第一相似关键词标签,并与第一初始关键词标签进行合并,得到第一合并关键词标签;
步骤4:基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,计算对应第二关键词标签的匹配指数;
步骤5:提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐。
在一种可能实现的方式中,所述获取当前产业链上用户进行资源请求时的操作信息,作为对照资源信息,并提取对照信息中的关键词,构成第一初始关键词标签,包括:
获取在当前产业链上目标用户在预设时间范围内进行资源请求时的所有操作信息,作为对照资源信息;
对所述对照资源信息中的所有分析语句进行词语提取,得到所述对照资源信息的第一词语集合;
获取第一词语集合的每一词语的词语特征以及每一词语在对应分析语句中的语句特征;
基于机器学习模型,并基于所述词语特征和语句特征对所述对照资源信息进行关键词提取,得到所述对照资源信息的全部关键词,进而得到第一初始关键词标签。
在一种可能实现的方式中,所述基于机器学习模型,并基于所述词语特征和语句特征对对照资源信息进行关键词提取,得到当前对照资源信息的全部关键词,进而得到第一初始关键词标签,包括:
提取所述资源管理后台的所有历史对照资源信息中的历史关键词以及每个历史关键词的关键性,对初始学习模型进行训练得到机器学习模型;
基于所述机器学习模型对当前对照资源信息的第一词语集合的每一词语的词语特征以及对应词语在对应分析语句中的语句特征进行分析,获取所述第一词语集合中每个第一词语的关键性,对相同关键词进行剔除,得到剩余关键词并得到第一初始关键词标签;
其中,所述第一初始关键词标签包括所属对应操作信息的操作序列号以及与所述操作信息中涉及到的剩余关键词的词序列号。
在一种可能实现的方式中,所述获取资源管理后台的待推荐资源信息,并提取每个待推荐资源信息的关键词,构成第二关键词标签数据库,包括:
获取所述资源管理后台的所有有效资源信息,得到若干个待推荐资源信息;
计算每个待推荐资源信息的每个分析语句中的每一个词语与分析语句中的其余词语的关联性,从而得到每一词语在当前分析语句中的权重系数,并根据当前分析语句中的所有词语的权重系数以及当前分析语句的权重系数,创建每个待推荐资源信息的有权图;
获取历史资源信息推荐过程中,所述有权图中对应顶点位置作为推荐关键词的概率,并作为对应有权图中每个顶点的顶点推荐概率;
对每个有权图中的所有顶点推荐概率进行排序,提取对应待推荐资源信息中的第二关键词,并获取得到对应的第二关键词标签;
基于所有第二关键词标签,构成第二关键词标签数据库。
在一种可能实现的方式中,所述第一初始关键词标签中的若干关键词进行相似关键词的识别匹配,得到对应的第一相似关键词标签,并与第一初始关键词标签进行合并,得到第一合并关键词标签,包括:
从关键词匹配数据库中匹配与所述第一初始关键词标签中的每个第一关键词对应的相似关键词,从而得到第一相似关键词标签;
将所述第一初始关键词标签和第一相似关键词标签进行标签合并,得到第一合并关键词标签。
在一种可能实现的方式中,所述基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,计算对应第二关键词标签的匹配指数,包括:
基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,并确定每个匹配结果的关键词匹配指数;
;
其中,是对应匹配结果的关键词匹配指数;是指在第一合并关键词标签包含
的个第一合并关键词中第个词语;是指在第二关键词标签数据库中对应第二关键
词标签h包含的个关键词中第个词语;、是指当前词语的词性转化系数;、是指当前词语的语义转化系数;A1表示词性权重;A2表示语义权重。
在一种可能实现的方式中,所述提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐,包括:
获取第一合并关键词标签与第二关键词标签数据库的当前关键词标签的匹配指数,与预设阈值进行比较;
若所述匹配指数大于预设阈值,则提取所述第二关键词标签数据库中当前匹配指数对应的第二关键词标签作为第三关键词标签;
基于当前第三关键词标签匹配的资源信息进行资源推荐;
若所述匹配指数处于预设匹配范围的边界值,则基于待推荐信息的信息数判断当前待推荐信息是否进行推荐。
在一种可能实现的方式中,若所述匹配指数处于预设匹配范围的边界值,则基于待推荐信息的信息数判断当前待推荐信息是否进行推荐,包括:
确定获取资源管理后台的所有待推荐资源信息与对照资源信息的匹配指数处于预设匹配范围的边界的待推荐资源信息的个数;
同时,获取所述对照资源信息对应的第一合并关键词标签的关键词个数;
若待推荐资源信息的个数大于第一合并关键词标签中的关键词个数的预设倍数,则判定当前待推荐资源信息不被推荐;
若待推荐资源信息的个数不大于第一合并关键词标签的关键词个数的预设倍数,则判定当前待推荐信息被推荐。
在一种可能实现的方式中,所述提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐之后,还包括:
获取所有第三关键词标签,并将每个第三关键词标签的匹配指数进行由高到低的顺序,得到对应的第三关键词标签的排列顺序,并基于当前顺序将待推荐信息进行相应顺序推荐;
其中,匹配指数最高的第三关键词标签对应的待推荐信息处于当前产业链推荐位的首位。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于产业链的资源管理方法的流程图;
图2为本发明实施例中一种基于产业链的资源管理方法的得到第一初始关键词标签的流程图;
图3为本发明实施例中一种基于产业链的资源管理方法的构建第二关键词标签数据库的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本发明实施例提供一种基于产业链的资源管理方法,如图1所示,包括:
步骤1:获取当前产业链上用户进行资源请求时的操作信息,作为对照资源信息,并提取对照资源信息中的关键词,构成第一初始关键词标签;
步骤2:获取资源管理后台的待推荐资源信息,并提取每个待推荐资源信息的关键词,构成第二关键词标签数据库;
步骤3:将所述第一初始关键词标签中的若干关键词进行相似关键词的识别匹配,得到对应的第一相似关键词标签,并与第一初始关键词标签进行合并,得到第一合并关键词标签;
步骤4:基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,计算对应第二关键词标签的匹配指数;
步骤5:提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐。
该实施例中,操作信息是基于当前产业链上目标用户进行资源搜索或点击的实际操作信息。
该实施例中,对照资源信息就是基于当前产业链上目标用户的所有操作信息的总和。
该实施例中,对照资源信息的关键词是基于每一词语的词语特征以及每一词语在对应分析语句中的语句特征共同决定的。
该实施例中,第一初始关键词标签包括所属对应操作信息的操作序列号以及与所述操作信息中涉及到的关键词的词序列号;比如,关键词包括:查找、方法、产业链,对应第一初始关键词标签包括:10123 011 111 112,其中,10123为对应操作信息的操作序列号,011、111、112为涉及的关键词的词序列号,其中第一个数字代表当前关键词的词性,比如0代表动词,1代表名词。
该实施例中,待推荐资源是基于资源管理后台中所有在有效时间内的资源信息。
该实施例中,第二关键词标签数据库是基于所有第二关键词标签构成的。
该实施例中,第二关键词标签是基于资源管理后台的一个待推荐资源信息提取到的关键词构成的。
该实施例中,第一相似关键词标签是基于当前第一初始标签中的每一个关键词,在数据库中筛选每一关键词对应的相似词语,所有相似词语构成一个第一相似关键词标签;比如,当前第一初始关键词标签包括:学校、方法,得到对应的第一相似关键词标签包括:小学、中学、大学、方式、方案。
该实施例中,第一合并关键词标签是第一初始关键词标签和第一相似关键词标签合并得到的关键词标签。
该实施例中,匹配指数是基于第二关键词标签数据库中每一第二关键词标签和第一合并关键词标签的进行关键词匹配的匹配指数。
该实施例中,第三关键词标签是指若所述匹配指数大于预设阈值,则提取所述第二关键词标签数据库中当前匹配指数对应的第二关键词标签作为第三关键词标签。
上述技术方案的有益效果是:通过对关键词的提取比较,实现基于产业链的资源推荐,从而可以使得对于用户的资源推荐更加精准,同时,按照资源相关程度高低进行顺序推荐,也可以使得用户对资源的获取更高效。
实施例2:
基于实施例1的基础上,所述获取当前产业链上用户进行资源请求时的操作信息,作为对照资源信息,并提取对照资源信息中的关键词,构成第一初始关键词标签,包括:
获取在当前产业链上目标用户在预设时间范围内进行资源请求时的所有操作信息,作为对照资源信息;
对所述对照资源信息中的所有分析语句进行词语提取,得到所述对照资源信息的第一词语集合;
获取第一词语集合的每一词语的词语特征以及每一词语在对应分析语句中的语句特征;
基于机器学习模型,并基于所述词语特征和语句特征对所述对照资源信息进行关键词提取,得到所述对照资源信息的全部关键词,进而得到第一初始关键词标签。
该实施例中,当前产业链上的用户可以是多个,但是目标用户是指当前产业链上进行信息操作的一个用户。
该实施例中,操作信息是基于当前产业链上目标用户进行资源搜索、点击的实际操作信息以及点击进行画面跳转后对应界面上的显示信息。
该实施例中,对照资源信息就是基于当前产业链上目标用户在预设时间范围内的所有操作信息综合得到的。
该实施例中,分析语句是当前对照资源信息中有实际意义的语句,其中,不包括感叹词组成的感叹句这样无实际意义的语句。
该实施例中,第一词语集合是当前对照资源信息的所有分析语句中提取的词语构成的集合。
该实施例中,比如,词语特征包括当前词语的具体词性语义特征等,语句特征包括当前的词语对对应的分析语句影响情况的语句影响等特征。
该实施例中,机器学习模型是基于资源管理后台的所有历史对照资源信息中的历史关键词以及每个历史关键词的关键性,对初始学习模型进行训练得到的。
该实施例中,关键词的提取是基于对照资源信息中的每一个分析语句中词语的词语特征和词语对语句影响的语句特征综合考量的结果决定的。
该实施例中,第一初始关键词标签包括所属对应操作信息的操作序列号以及与所述操作信息中涉及到的关键词的词序列号;比如,关键词包括:查找、方法、产业链,对应第一初始关键词标签包括:10123 011 111 112,其中,10123为对应操作信息的操作序列号,011、111、112为涉及的关键词的词序列号,其中第一个数字代表当前关键词的词性,比如0代表动词,1代表名词。
上述技术方案的有益效果是:通过对目标用户操作信息中的词语进行提取,并基于词语的词语特征和语句特征确定关键词,从而得到当前目标用户对应操作信息的关键词,并依据关键词资源推荐,可以使得资源推荐更加精准。
实施例3:
基于实施例2的基础上,所述基于机器学习模型,并基于所述词语特征和语句特征对所述对照资源信息进行关键词提取,得到所述对照资源信息的全部关键词,进而得到第一初始关键词标签,如图2所示,包括:
提取所述资源管理后台的所有历史对照资源信息中的历史关键词以及每个历史关键词的关键性,对初始学习模型进行训练得到机器学习模型;
基于所述机器学习模型对当前对照资源信息的第一词语集合的每一词语的词语特征以及对应词语在对应分析语句中的语句特征进行分析,获取所述第一词语集合中每个第一词语的关键性,对相同关键词进行剔除,得到剩余关键词并得到第一初始关键词标签;
其中,所述第一初始关键词标签包括所属对应操作信息的操作序列号以及与所述操作信息中涉及到的剩余关键词的词序列号。
该实施例中,历史对照资源信息是在当前资源管理后台的有效时间内历史用户进行操作对应的资源信息。
该实施例中,历史关键词是基于历史对照资源信息中提取到的所有关键词。
该实施例中,历史关键词的关键性是基于每一个关键词在当前对照资源信息对应的分析语句中的重要程度以及在当前整个对照资源信息的重要程度的一个平均值。
该实施例中,比如,词语特征包括当前词语的具体词性语义特征等,语句特征包括当前的词语对对应的分析语句影响情况的语句影响等特征。
该实施例中,第一初始关键词标签包括所属对应操作信息的操作序列号以及与所述操作信息中涉及到的剩余关键词的词序列号。
上述技术方案的有益效果是:通过对历史关键词进行分析得到机器学习模型,并基于机器学习模型对当前对照资源信息获取的词语进行关键词提取,从而得到当前目标用户对应操作信息的关键词,并依据关键词资源推荐,可以使得资源推荐更加精准。
实施例4:
基于实施例1的基础上,所述获取资源管理后台的待推荐资源信息,并提取每个待推荐资源信息的关键词,构成第二关键词标签数据库,如图3所示,包括:
获取所述资源管理后台的所有有效资源信息,得到若干个待推荐资源信息;
计算每个待推荐资源信息的每个分析语句中的每一个词语与分析语句中的其余词语的关联性,从而得到每一词语在当前分析语句中的权重系数,并根据当前分析语句中的所有词语的权重系数以及当前分析语句的权重系数,创建每个待推荐资源信息的有权图;
获取历史资源信息推荐过程中,所述有权图中对应顶点位置作为推荐关键词的概率,并作为对应有权图中每个顶点的顶点推荐概率;
对每个有权图中的所有顶点推荐概率进行排序,提取对应待推荐资源信息中的第二关键词,并获取得到对应的第二关键词标签;
基于所有第二关键词标签,构成第二关键词标签数据库。
该实施例中,有效资源信息是在有效时间内的可以进行公开查询推荐的资源信息。
该实施例中,关联性是指当前词语与其他词语之间的关联程度。
该实施例中,词语的权重系数是指在当前词语对应的分析语句中,词语对分析语句影响程度的权重系数。
该实施例中,分析语句的权重系数是当前分析语句在对应的待推荐资源信息中,分析语句对待推荐资源的影响程度的权重系数。
该实施例中,待推荐资源的有权图是指是由每一个词语在分析语句中的权重系数、每一个分析语句在待推荐资源薪资中的权重系数,以及每一个词语构成的。
该实施例中,有权图顶点的推荐概率就是当前词语作为关键词进行资源推荐的概率。
该实施例中,提取对应待推荐资源信息中的第二关键词是基于有权图的所有顶点按照推荐概率排序后,提取推荐概率大于预设值的顶点对应的词语作为第二关键词,从而构成第二关键词标签。
该实施例中,第二关键词标签数据库是由所有待推荐资源信息的第二关键词标签构成的。
上述技术方案的有益效果是:通过判断词语的关联性以及词语在对应分析语句中的权重系数,从而获取当前待推荐资源信息对应的第二关键词标签,并构建第二关键词标签,可以更加精准的获取当前待推荐资源的关键词,使得关键词的匹配更加准确,从而使得资源推荐更加精准。
实施例5:
基于实施例3的基础上,所述第一初始关键词标签中的若干关键词进行相似关键词的识别匹配,得到对应的第一相似关键词标签,并与第一初始关键词标签进行合并,得到第一合并关键词标签,包括:
从关键词匹配数据库中匹配与所述第一初始关键词标签中的每个第一关键词对应的相似关键词,从而得到第一相似关键词标签;
将所述第一初始关键词标签和第一相似关键词标签进行标签合并,得到第一合并关键词标签。比如,第一初始关键词标签还有3个关键词,在第一相似关键词标签中含有5个与第一初始关键词标签中的关键词相似的关键词,将第一初始关键词标签和第一相似关键词标签进行标签合并就是将两个标签中包含的8个关键词进行合并,构成一个新的集合,然后再依据每个关键词在前,当前关键词对应的相似关键词在后的顺序进行排列,一组关键词和相似关键词排列结束后再对下一个关键词进行排列,从而得到第一合并关键词。
该实施例中,相似关键词是在关键词匹配数据库中包含的与当前关键词词性相同/语义相近的词语。
上述技术方案的有益效果是:通过对对照资源信息中提取的第一初始关键词标签中的关键词进行相似匹配,可以得到与当前关键词相似的关键词,从而得到第一合并关键词标签,可以使得对于关键词的匹配更加全面,从而得到更多的与对照资源信息相匹配的待推荐资源信息。
实施例6:
基于实施例5的基础上,所述基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,计算对应第二关键词标签的匹配指数,包括:
基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,并确定每个匹配结果的关键词匹配指数;
;
其中,是对应匹配结果的关键词匹配指数;是指在第一合并关键词标签包含
的个第一合并关键词中第个词语;是指在第二关键词标签数据库中对应第二关键
词标签h包含的个关键词中第个词语;、是指当前词语的词性转化系数;、是指当前词语的语义转化系数;A1表示词性权重;A2表示语义权重。
该实施例中,关键词匹配指数是基于第二关键词标签数据库中每一第二关键词标签和第一合并关键词标签的进行关键词匹配的匹配指数。
该实施例中,关键词匹配指数是基于关键词之间的词性匹配程度和语义匹配程度以及词性、语义对词语的影响情况确定的。
该实施例中,每个第二关键词标签的关键词个数可以存在差异。
该实施例中,词性转化系数、语义转化系数主要是为了将对应的词语转换为可以计算的参数值,方便计算得到关键词匹配指数。
该实施例中,词性权重和语义权重是基于词性以及语义对词语比较过程的影响程度确定的。
上述技术方案的有益效果是:通过对对照资源信息对应的第一合并关键词标签以及待推荐资源信息对应的第二关键词标签数据库的每个第二关键词标签进行逐一匹配,得到匹配指数,从而依据匹配指数对待推荐资源信息进行推荐,可以使得资源推荐更加精准。
实施例7:
基于实施例6的基础上,所述提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐,包括:
获取第一合并关键词标签与第二关键词标签数据库的当前关键词标签的匹配指数,与预设阈值进行比较;
若所述匹配指数大于预设阈值,则提取所述第二关键词标签数据库中当前匹配指数对应的第二关键词标签作为第三关键词标签;
基于当前第三关键词标签匹配的资源信息进行资源推荐;
若所述匹配指数处于预设匹配范围的边界值,则基于待推荐信息的信息数判断当前待推荐信息是否进行推荐。
该实施例中,预设阈值是基于历史推荐信息预先确定的,可以依据实际推荐情况进行调整。
该实施例中,第三关键词标签是指若所述匹配指数大于预设阈值,则提取所述第二关键词标签数据库中当前匹配指数对应的第二关键词标签作为第三关键词标签。
上述技术方案的有益效果是:通过对匹配指数大于预设阈值的资源信息进行推荐,可以使得目标用户可以更加精准的获取到与当前操作信息匹配度较高的推荐信息。
实施例8:
基于实施例7的基础上,若所述匹配指数处于预设匹配范围的边界值,则基于待推荐信息的信息数判断当前待推荐信息是否进行推荐,包括:
确定获取资源管理后台的所有待推荐资源信息与对照资源信息的匹配指数处于预设匹配范围的边界的待推荐资源信息的个数;
同时,获取所述对照资源信息对应的第一合并关键词标签的关键词个数;
若待推荐资源信息的个数大于第一合并关键词标签中的关键词个数的预设倍数,则判定当前待推荐资源信息不被推荐;
若待推荐资源信息的个数不大于第一合并关键词标签的关键词个数的预设倍数,则判定当前待推荐信息被推荐。
该实施例中,预设倍数可以依据关键词的数量进行适应性调整。
上述技术方案的有益效果是:通过对处于匹配范围边界的匹配指数进行分类讨论,若待推荐资源信息的个数偏少,则对边界范围的待推荐资源信息进行推荐,若待推荐资源信息的个数偏多,则放弃推荐边界范围的待推荐资源信息,可以使得目标用户获得的推荐资源尽可能的精准且满足目标用户的需求。
实施例9:
基于实施例7的基础上,所述提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐之后,还包括:
获取所有第三关键词标签,并将每个第三关键词标签的匹配指数进行由高到低的顺序,得到对应的第三关键词标签的排列顺序,并基于当前顺序将待推荐信息进行相应顺序推荐;
其中,匹配指数最高的第三关键词标签对应的待推荐信息处于当前产业链推荐位的首位。
该实施例中,第三关键词标签是指若所述匹配指数大于预设阈值,则提取所述第二关键词标签数据库中当前匹配指数对应的第二关键词标签作为第三关键词标签。
该实施例中,待推荐信息的推荐顺序是按照对应的第三关键词标签的匹配指数由高到低的顺序排列的。
上述技术方案的有益效果是:通过对关键词标签的匹配指数进行比较,并基于匹配指数的比较结果对待推荐信息进行排序,从而使得当前产业链的目标用户对资源的获取更加高效、快捷。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (7)
1.一种基于产业链的资源推荐方法,其特征在于,包括:
步骤1:获取当前产业链上用户进行资源请求时的操作信息,作为对照资源信息,并提取对照资源信息中的关键词,构成第一初始关键词标签;
步骤2:获取资源管理后台的待推荐资源信息,并提取每个待推荐资源信息的关键词,构成第二关键词标签数据库;
步骤3:将所述第一初始关键词标签中的若干关键词进行相似关键词的识别匹配,得到对应的第一相似关键词标签,并与第一初始关键词标签进行合并,得到第一合并关键词标签;
步骤4:基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,计算对应第二关键词标签的匹配指数;
步骤5:提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐;
其中,将所述第一初始关键词标签中的若干关键词进行相似关键词的识别匹配,得到对应的第一相似关键词标签,并与第一初始关键词标签进行合并,得到第一合并关键词标签,包括:
从关键词匹配数据库中匹配与所述第一初始关键词标签中的每个第一关键词对应的相似关键词,从而得到第一相似关键词标签;
将所述第一初始关键词标签和第一相似关键词标签进行标签合并,得到第一合并关键词标签;
其中,基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,计算对应第二关键词标签的匹配指数,包括:
基于第一合并关键词标签与第二关键词标签数据库中的每个第二关键词标签进行逐一匹配,并确定每个匹配结果的关键词匹配指数;
;
其中,是对应匹配结果的关键词匹配指数;/>是指在第一合并关键词标签包含的个第一合并关键词中第/>个词语;/>是指在第二关键词标签数据库中对应第二关键词标签h包含的/>个关键词中第/>个词语;/>、/>是指当前词语的词性转化系数;、/>是指当前词语的语义转化系数;A1表示词性权重;A2表示语义权重;nh为对应第二关键词标签h包含的关键词总个数。
2.如权利要求1所述的一种基于产业链的资源推荐方法,其特征在于,获取当前产业链上用户进行资源请求时的操作信息,作为对照资源信息,并提取对照信息中的关键词,构成第一初始关键词标签,包括:
获取在当前产业链上目标用户在预设时间范围内进行资源请求时的所有操作信息,作为对照资源信息;
对所述对照资源信息中的所有分析语句进行词语提取,得到所述对照资源信息的第一词语集合;
获取第一词语集合的每一词语的词语特征以及每一词语在对应分析语句中的语句特征;
基于机器学习模型,并基于所述词语特征和语句特征对所述对照资源信息进行关键词提取,得到所述对照资源信息的全部关键词,进而得到第一初始关键词标签。
3.如权利要求2所述的一种基于产业链的资源推荐方法,其特征在于,基于机器学习模型,并基于所述词语特征和语句特征对对照资源信息进行关键词提取,得到当前对照资源信息的全部关键词,进而得到第一初始关键词标签,包括:
提取所述资源管理后台的所有历史对照资源信息中的历史关键词以及每个历史关键词的关键性,对初始学习模型进行训练得到机器学习模型;
基于所述机器学习模型对当前对照资源信息的第一词语集合的每一词语的词语特征以及对应词语在对应分析语句中的语句特征进行分析,获取所述第一词语集合中每个第一词语的关键性,对相同关键词进行剔除,得到剩余关键词并得到第一初始关键词标签;
其中,所述第一初始关键词标签包括所属对应操作信息的操作序列号以及与所述操作信息中涉及到的剩余关键词的词序列号。
4.如权利要求1所述的一种基于产业链的资源推荐方法,其特征在于,获取资源管理后台的待推荐资源信息,并提取每个待推荐资源信息的关键词,构成第二关键词标签数据库,包括:
获取所述资源管理后台的所有有效资源信息,得到若干个待推荐资源信息;
计算每个待推荐资源信息的每个分析语句中的每一个词语与分析语句中的其余词语的关联性,从而得到每一词语在当前分析语句中的权重系数,并根据当前分析语句中的所有词语的权重系数以及当前分析语句的权重系数,创建每个待推荐资源信息的有权图;
获取历史资源信息推荐过程中,所述有权图中对应顶点位置作为推荐关键词的概率,并作为对应有权图中每个顶点的顶点推荐概率;
对每个有权图中的所有顶点推荐概率进行排序,提取对应待推荐资源信息中的第二关键词,并获取得到对应的第二关键词标签;
基于所有第二关键词标签,构成第二关键词标签数据库。
5.如权利要求1所述的一种基于产业链的资源推荐方法,其特征在于,提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐,包括:
获取第一合并关键词标签与第二关键词标签数据库的当前关键词标签的匹配指数,与预设阈值进行比较;
若所述匹配指数大于预设阈值,则提取所述第二关键词标签数据库中当前匹配指数对应的第二关键词标签作为第三关键词标签;
基于当前第三关键词标签匹配的资源信息进行资源推荐;
若所述匹配指数处于预设匹配范围的边界值,则基于待推荐信息的信息数判断当前待推荐信息是否进行推荐。
6.如权利要求5所述的一种基于产业链的资源推荐方法,其特征在于,若所述匹配指数处于预设匹配范围的边界值,则基于待推荐信息的信息数判断当前待推荐信息是否进行推荐,包括:
确定获取资源管理后台的所有待推荐资源信息与对照资源信息的匹配指数处于预设匹配范围的边界的待推荐资源信息的个数;
同时,获取所述对照资源信息对应的第一合并关键词标签的关键词个数;
若待推荐资源信息的个数大于第一合并关键词标签中的关键词个数的预设倍数,则判定当前待推荐资源信息不被推荐;
若待推荐资源信息的个数不大于第一合并关键词标签的关键词个数的预设倍数,则判定当前待推荐信息被推荐。
7.如权利要求6所述的一种基于产业链的资源推荐方法,其特征在于,提取匹配指数大于预设阈值的第三关键词标签,并将与所述第三关键词标签匹配的资源信息进行推荐之后,还包括:
获取所有第三关键词标签,并将每个第三关键词标签的匹配指数进行由高到低的顺序,得到对应的第三关键词标签的排列顺序,并基于当前顺序将待推荐信息进行相应顺序推荐;
其中,匹配指数最高的第三关键词标签对应的待推荐信息处于当前产业链推荐位的首位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211555850.9A CN116244496B (zh) | 2022-12-06 | 2022-12-06 | 一种基于产业链的资源推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211555850.9A CN116244496B (zh) | 2022-12-06 | 2022-12-06 | 一种基于产业链的资源推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116244496A CN116244496A (zh) | 2023-06-09 |
CN116244496B true CN116244496B (zh) | 2023-12-01 |
Family
ID=86630258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211555850.9A Active CN116244496B (zh) | 2022-12-06 | 2022-12-06 | 一种基于产业链的资源推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116244496B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106598940A (zh) * | 2016-11-01 | 2017-04-26 | 四川用联信息技术有限公司 | 基于全局优化关键词质量的文本相似度求解算法 |
CN106611059A (zh) * | 2016-12-28 | 2017-05-03 | 北京小米移动软件有限公司 | 推荐多媒体文件的方法及装置 |
CN106776881A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院软件研究所 | 一种基于微博平台的领域信息推荐系统及方法 |
CN108256119A (zh) * | 2018-02-14 | 2018-07-06 | 北京方正阿帕比技术有限公司 | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 |
CN108287916A (zh) * | 2018-02-11 | 2018-07-17 | 北京方正阿帕比技术有限公司 | 一种资源推荐方法 |
CN108334490A (zh) * | 2017-04-07 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 关键词提取方法以及关键词提取装置 |
CN109637642A (zh) * | 2018-12-04 | 2019-04-16 | 平安医疗健康管理股份有限公司 | 医疗机构透析水平的考核方法、装置、设备及存储介质 |
CN109815333A (zh) * | 2019-01-14 | 2019-05-28 | 金蝶软件(中国)有限公司 | 信息获取方法、装置、计算机设备和存储介质 |
CN111104803A (zh) * | 2019-12-31 | 2020-05-05 | 科大讯飞股份有限公司 | 语义理解处理方法、装置、设备及可读存储介质 |
CN111782772A (zh) * | 2020-07-24 | 2020-10-16 | 平安银行股份有限公司 | 基于ocr技术的文本自动生成方法、装置、设备及介质 |
CN111814490A (zh) * | 2020-06-05 | 2020-10-23 | 江苏遨信科技有限公司 | 一种机器人自学习提升语义识别能力的方法与系统 |
CN114911917A (zh) * | 2022-07-13 | 2022-08-16 | 树根互联股份有限公司 | 资产元信息搜索方法、装置、计算机设备及可读存储介质 |
-
2022
- 2022-12-06 CN CN202211555850.9A patent/CN116244496B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106598940A (zh) * | 2016-11-01 | 2017-04-26 | 四川用联信息技术有限公司 | 基于全局优化关键词质量的文本相似度求解算法 |
CN106776881A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院软件研究所 | 一种基于微博平台的领域信息推荐系统及方法 |
CN106611059A (zh) * | 2016-12-28 | 2017-05-03 | 北京小米移动软件有限公司 | 推荐多媒体文件的方法及装置 |
CN108334490A (zh) * | 2017-04-07 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 关键词提取方法以及关键词提取装置 |
CN108287916A (zh) * | 2018-02-11 | 2018-07-17 | 北京方正阿帕比技术有限公司 | 一种资源推荐方法 |
CN108256119A (zh) * | 2018-02-14 | 2018-07-06 | 北京方正阿帕比技术有限公司 | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 |
CN109637642A (zh) * | 2018-12-04 | 2019-04-16 | 平安医疗健康管理股份有限公司 | 医疗机构透析水平的考核方法、装置、设备及存储介质 |
CN109815333A (zh) * | 2019-01-14 | 2019-05-28 | 金蝶软件(中国)有限公司 | 信息获取方法、装置、计算机设备和存储介质 |
CN111104803A (zh) * | 2019-12-31 | 2020-05-05 | 科大讯飞股份有限公司 | 语义理解处理方法、装置、设备及可读存储介质 |
CN111814490A (zh) * | 2020-06-05 | 2020-10-23 | 江苏遨信科技有限公司 | 一种机器人自学习提升语义识别能力的方法与系统 |
CN111782772A (zh) * | 2020-07-24 | 2020-10-16 | 平安银行股份有限公司 | 基于ocr技术的文本自动生成方法、装置、设备及介质 |
CN114911917A (zh) * | 2022-07-13 | 2022-08-16 | 树根互联股份有限公司 | 资产元信息搜索方法、装置、计算机设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116244496A (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108363790B (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
CN109829104B (zh) | 基于语义相似度的伪相关反馈模型信息检索方法及系统 | |
CN111125334B (zh) | 一种基于预训练的搜索问答系统 | |
WO2021093755A1 (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
US10565533B2 (en) | Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches | |
CN110727779A (zh) | 基于多模型融合的问答方法及系统 | |
CN112307182B (zh) | 一种基于问答系统的伪相关反馈的扩展查询方法 | |
CN114416942A (zh) | 一种基于深度学习的自动化问答方法 | |
CN111105209A (zh) | 适用于人岗匹配推荐系统的职位简历匹配方法及装置 | |
CN111291188A (zh) | 一种智能信息抽取方法及系统 | |
CN113282711B (zh) | 一种车联网文本匹配方法、装置、电子设备及存储介质 | |
CN111401065A (zh) | 实体识别方法、装置、设备及存储介质 | |
CN111858888A (zh) | 一种值机场景的多轮对话系统 | |
CN113569011A (zh) | 文本匹配模型的训练方法、装置、设备及存储介质 | |
CN115827819A (zh) | 一种智能问答处理方法、装置、电子设备及存储介质 | |
CN113297351A (zh) | 文本数据标注方法及装置、电子设备及存储介质 | |
CN111241397A (zh) | 一种内容推荐方法、装置和计算设备 | |
Celikyilmaz et al. | A graph-based semi-supervised learning for question-answering | |
CN117807232A (zh) | 商品分类方法、商品分类模型构建方法及装置 | |
CN109284389A (zh) | 一种文本数据的信息处理方法、装置 | |
CN114491079A (zh) | 知识图谱构建和查询方法、装置、设备和介质 | |
CN117291192B (zh) | 一种政务文本语义理解分析方法及系统 | |
CN113688633A (zh) | 一种提纲确定方法及装置 | |
CN113535960A (zh) | 一种文本分类方法、装置和设备 | |
CN113051886A (zh) | 一种试题查重方法、装置、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Resource Recommendation Method Based on Industry Chain Granted publication date: 20231201 Pledgee: Rizhao Bank Co.,Ltd. Jinan Huaiyin Branch Pledgor: Shandong laver cloud Digital Technology Co.,Ltd. Registration number: Y2024980024828 |