CN114398477A - 基于知识图谱的政策推荐方法及其相关设备 - Google Patents
基于知识图谱的政策推荐方法及其相关设备 Download PDFInfo
- Publication number
- CN114398477A CN114398477A CN202210057430.1A CN202210057430A CN114398477A CN 114398477 A CN114398477 A CN 114398477A CN 202210057430 A CN202210057430 A CN 202210057430A CN 114398477 A CN114398477 A CN 114398477A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- policy
- data
- target
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000009193 crawling Effects 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 55
- 230000011218 segmentation Effects 0.000 claims description 31
- 230000004927 fusion Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000000547 structure data Methods 0.000 claims description 9
- 238000013075 data extraction Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 239000000463 material Substances 0.000 description 11
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- QPLDLSVMHZLSFG-UHFFFAOYSA-N Copper oxide Chemical class [Cu]=O QPLDLSVMHZLSFG-UHFFFAOYSA-N 0.000 description 3
- 229910017052 cobalt Inorganic materials 0.000 description 3
- 239000010941 cobalt Substances 0.000 description 3
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 3
- 229910052759 nickel Inorganic materials 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000238413 Octopus Species 0.000 description 1
- 240000002834 Paulownia tomentosa Species 0.000 description 1
- 235000010678 Paulownia tomentosa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例属于大数据技术领域,应用于智慧政务领域中,涉及一种基于知识图谱的政策推荐方法及其相关设备,包括爬取目标网站的政策信息,获得政策文本数据;对政策文本数据进行标签生成操作,获得政策类别标签,将政策文本数据转化为结构化数据,获得结构政策数据;基于产业实体和产业实体关系构建产业知识图谱;获取待推荐企业的企业信息,基于企业信息从产业知识图谱中推理待推荐企业的企业关联信息,将企业信息和所述企业关联信息作为待推荐企业的目标企业数据;计算结构政策数据与目标企业数据的匹配度,在匹配度达到匹配阈值时,将对应的政策文本数据推荐给待推荐企业。产业知识图谱可存储于区块链中。本申请提高政策推荐精准度。
Description
技术领域
本申请涉及大数据技术领域,尤其涉及基于知识图谱的政策推荐方法及其相关设备。
背景技术
为搭建良好的营商环境,各级政府部门会适时推出各项惠企政策,但由于政策多、总量大、查找难以及对于政策的各项条款难以理解等情况,影响企业的良性发展。
目前虽然存在根据知识图谱向企业推荐政策的方式,但是常常存在推荐不够精准的问题,达不到企业的需求。
发明内容
本申请实施例的目的在于提出一种基于知识图谱的政策推荐方法及其相关设备,提高政策推荐精准度。
为了解决上述技术问题,本申请实施例提供一种基于知识图谱的政策推荐方法,采用了如下所述的技术方案:
一种基于知识图谱的政策推荐方法,包括下述步骤:
对目标网站的政策信息进行爬取操作,获得政策文本数据;
对所述政策文本数据进行标签生成操作,获得政策类别标签,基于所述政策类别标签将所述政策文本数据转化为结构化数据,获得结构政策数据;
接收产业文档,从所述产业文档中抽取产业实体和产业实体关系,基于所述产业实体和所述产业实体关系构建产业知识图谱;
获取待推荐企业的企业信息,基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息,并将所述企业信息和所述企业关联信息作为所述待推荐企业的目标企业数据;
计算所述结构政策数据与所述目标企业数据的匹配度,在所述匹配度达到匹配阈值时,将对应的政策文本数据推荐给所述待推荐企业。
进一步的,所述基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息的步骤包括:
从所述企业信息中识别企业实体,将所述企业实体与所述产业知识图谱的产业实体相匹配,将匹配成功的产业实体作为目标产业实体;
确定在所述产业知识图谱中,与所述目标产业实体具有连接关系的产业实体,作为目标企业实体;
基于所述目标产业实体和所述目标企业实体确定企业信息关系,根据所述企业实体、所述目标企业实体和所述企业信息关系生成所述企业关联信息。
进一步的,所述基于所述目标产业实体和所述目标企业实体确定企业信息关系的步骤包括:
确定所述目标产业实体与所述目标企业实体是否直接连接;
若所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过一条边直接连接,则将连接所述目标产业实体与所述目标企业实体的边对应的所述产业实体关系作为所述企业信息关系;
若所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过多条边间接连接,则将从所述目标产业实体出发至所述目标企业实体,所经过的最后一条边对应的所述产业实体关系作为所述企业信息关系。
进一步的,所述从所述产业文档中抽取产业实体和产业实体关系的步骤包括:
对所述产业文档进行分词处理,获得多个产业词语;
对所述产业词语进行实体识别操作,获得多个所述产业实体;
将所述产业实体转换为实体向量,并获取所述产业实体在所述产业文档中的位置信息,基于所述位置信息生成位置向量;
融合所述产业文档的同一句子中任意两个产业实体的所述实体向量和所述位置向量,获得融合特征;
将所述融合特征输入至预训练的卷积神经网络中,获得输出的产业实体关系。
进一步的,所述对所述政策文本数据进行标签生成操作,获得政策类别标签的步骤包括:
调用预设的分词工具,将预设的政策词典替换所述分词工具的词典,获得目标分词工具;
通过所述目标分词工具对所述政策文本数据进行分词操作,获得多个初始政策词语;
从所述初始政策词语中去掉停用词,获得目标政策词语;
将所述目标政策词语输入至预先训练的向量模型中,获得词向量;
基于所述词向量进行分类预测,输出对应的所述政策类别标签。
进一步的,将所述企业信息和所述企业关联信息作为目标企业数据的步骤包括:
将所述企业信息和所述企业关联信息作为初始企业数据;
识别属于地理位置的初始企业数据,作为地理数据;
将所述地理数据所属的省级名称作为目标地理数据,并通过所述目标地理数据替换所述地理数据,获得所述目标企业数据。
进一步的,所述计算所述结构政策数据与所述目标企业数据的匹配度的步骤包括:
从所述政策类别标签中确定关键政策标签,基于所述关键政策标签对所述结构政策数据进行数据抽取操作,获得目标结构数据;
通过所述目标企业数据生成多个企业数据类别,将与所述关键政策标签相同的企业数据类别作为关键企业类别,并通过所述关键企业类别对所述目标企业数据进行数据抽取操作,获得关键企业数据;
将所述目标结构数据和所述关键企业数据分别转换为目标结构向量和关键企业向量;
计算所述目标结构向量和所述关键企业向量的余弦相似度,获得所述匹配度。
为了解决上述技术问题,本申请实施例还提供一种基于知识图谱的政策推荐装置,采用了如下所述的技术方案:
一种基于知识图谱的政策推荐装置,包括:
爬取模块,用于对目标网站的政策信息进行爬取操作,获得政策文本数据;
转化模块,用于对所述政策文本数据进行标签生成操作,获得政策类别标签,基于所述政策类别标签将所述政策文本数据转化为结构化数据,获得结构政策数据;
抽取模块,用于接收产业文档,从所述产业文档中抽取产业实体和产业实体关系,基于所述产业实体和所述产业实体关系构建产业知识图谱;
推理模块,用于获取待推荐企业的企业信息,基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息,并将所述企业信息和所述企业关联信息作为所述待推荐企业的目标企业数据;
计算模块,用于计算所述结构政策数据与所述目标企业数据的匹配度,在所述匹配度达到匹配阈值时,将对应的政策文本数据推荐给所述待推荐企业。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现上述的基于知识图谱的政策推荐方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述的基于知识图谱的政策推荐方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请根据爬取的政策文本数据生成政策类别标签,进而将政策文本数据转化为结构政策数据,便于后续的匹配度计算。根据获取的企业信息从构建的产业知识图谱中推理出企业关联信息,从而实现对企业的信息的补全。进而通过由企业信息和企业关联信息组成的目标企业数据以及结构政策数据计算匹配度,从而在匹配度达到匹配阈值时,向待推荐企业推荐对应的政策,提高向企业推荐的政策的精确度和准确性。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的基于知识图谱的政策推荐方法的一个实施例的流程图;
图3是根据本申请的基于知识图谱的政策推荐装置的一个实施例的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
附图标记:200、计算机设备;201、存储器;202、处理器;203、网络接口;300、基于知识图谱的政策推荐装置;301、爬取模块;302、转化模块;303、抽取模块;304、推理模块;305、计算模块。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Movi ng Pi cture ExpertsGroup Aud i o Layer I I I,动态影像专家压缩标准音频层面3)、MP4(Movi ng Pi ctureExperts Group Aud i o Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于知识图谱的政策推荐方法一般由服务器/终端设备执行,相应地,基于知识图谱的政策推荐装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的基于知识图谱的政策推荐方法的一个实施例的流程图。所述的基于知识图谱的政策推荐方法,包括以下步骤:
S1:对目标网站的政策信息进行爬取操作,获得政策文本数据。
在本实施例中,从各相关渠道中(如政府网站),通过八爪鱼爬虫系统爬取政策信息,获得政策全文。
S2:对所述政策文本数据进行标签生成操作,获得政策类别标签,基于所述政策类别标签将所述政策文本数据转化为结构化数据,获得结构政策数据。
在本实施例中,对所述政策文本数据进行标签生成操作,获得政策类别标签。政策类别标签包括产业类别、受理部门、地区、城市、支持力度、申报时间、申报材料、申报条件、申报系统、政策来源、政策类别等信息。进而根据生成的政策类别标签将政策的文本数据转化为结构化的数据。
具体的,在步骤S2中,即所述对所述政策文本数据进行标签生成操作,获得政策类别标签的步骤包括:
调用预设的分词工具,将预设的政策词典替换所述分词工具的词典,获得目标分词工具;
通过所述目标分词工具对所述政策文本数据进行分词操作,获得多个初始政策词语;
从所述初始政策词语中去掉停用词,获得目标政策词语;
将所述目标政策词语输入至预先训练的向量模型中,获得词向量;
基于所述词向量进行分类预测,输出对应的所述政策类别标签。
在本实施例中,训练过程:将预先收集到的政策全文分为训练集和测试集。测试集仅包含用于测试的政策全文;训练集包含政策全文及其对应的政策类别,用于对向量模型(word2vec)进行训练,具体的,调用斯坦福的分词工具,通过预设政策词典对训练集进行分词操作并去掉停用词,然后根据分词结果和政策类别标签对word2vec进行训练,使得word2vec学习到关于政策类别的词向量;
应用过程:通过分词工具对政策文本数据进行分词操作并去掉停用词,获得多个目标政策词语,然后将目标政策词语输入至向量模型(word2vec)中,获得词向量,基于所述词向量进行分类预测,输出对应的所述政策类别标签。具体的,将词向量输入预训练的分类模型(NPL模型)中,获得输出的分类结果,即政策类别标签。
此外,本申请基于所述政策类别标签将所述政策文本数据转化为结构化数据,获得结构政策数据的步骤包括:基于所述政策类别标签切分所述政策文本数据,获得政策片段数据;基于所述政策类别标签和所述政策片段数据的对应关系生成所述结构政策数据。通过word2vec模型,对爬取到的政策文档进行结构化标签提取,以下为基于政策类别标签生成的结构政策数据的结果示例:
S3:接收产业文档,从所述产业文档中抽取产业实体和产业实体关系,基于所述产业实体和所述产业实体关系构建产业知识图谱。
在本实施例中,构建包含产业名称、行业名称和相关产品名称的产业知识图谱。例如,前沿材料(产业名称)包含新能源材料(行业名称),新能源材料包含镍、钴、铜氧化物(相关产品名称)。所述产业实体包括行业名称、产业名称、企业名称、产品名称。本申请通过构建产业知识图谱,用于后续补全企业的相关信息。
在本实施例中,基于知识图谱的政策推荐方法运行于其上的电子设备(例如图1所示的服务器/终端设备)可以通过有线连接方式或者无线连接方式接收产业文档。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、Wi Fi连接、蓝牙连接、Wi MAX连接、Zi gbee连接、UWB(u l tra wi deband)连接、以及其他现在已知或将来开发的无线连接方式。
具体的,在步骤S3中,即所述从所述产业文档中抽取产业实体和产业实体关系的步骤包括:
对所述产业文档进行分词处理,获得多个产业词语;
对所述产业词语进行实体识别操作,获得多个所述产业实体;
将所述产业实体转换为实体向量,并获取所述产业实体在所述产业文档中的位置信息,基于所述位置信息生成位置向量;
融合所述产业文档的同一句子中任意两个产业实体的所述实体向量和所述位置向量,获得融合特征;
将所述融合特征输入至预训练的卷积神经网络中,获得输出的产业实体关系。
在本实施例中,通过融合产业文档中的处于同一句子中的产业实体的向量,实现获得产业实体之间的产业实体关系。具体的融合方式为向量对应的维度的数值相加或者向量拼接操作。
S4:获取待推荐企业的企业信息,基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息,并将所述企业信息和所述企业关联信息作为所述待推荐企业的目标企业数据。
在本实施例中,通过企查查、工商局等企业数据来源数据获取企业信息,但从网络获取的企业信息存在不完整的情况,需要通过产业知识图谱补全企业的信息。即基于获取到的企业信息从产业知识图谱中推理出企业关联信息。企业信息和企业关联信息构成企业完整的信息。例如,从工商信息获取,浙江M股份有限公司于2002年05月22日在浙江省工商行政管理局登记成立。法定代表人陈XX,企业主营产品名称包括研发、生产、销售:钴、镍、铜氧化物等。通过构建的产业知识图谱,可知钴、镍、铜氧化物属于前沿材料-新能源材料,进而推理可得浙江M股份有限公司是属于新能源材料产业的公司。将新能源材料作为企业关联信息。以此方法,对企业基础信息、企业所属行业信息、企业主营产品信息进行收集,完善企业的信息,获得目标企业数据。
具体的,在步骤S4中,即所述基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息的步骤包括:
从所述企业信息中识别企业实体,将所述企业实体与所述产业知识图谱的产业实体相匹配,将匹配成功的产业实体作为目标产业实体;
确定在所述产业知识图谱中,与所述目标产业实体具有连接关系的产业实体,作为目标企业实体;
基于所述目标产业实体和所述目标企业实体确定企业信息关系,根据所述企业实体、所述目标企业实体和所述企业信息关系生成所述企业关联信息。
在本实施例中,通过企业实体与产业实体相匹配,确定出目标产业实体,从而根据目标产业实体确定产业知识图谱中的目标企业实体,则目标企业实体为企业关联信息的一部分内容。通过企业信息关系连接企业实体和目标企业实体,则生成了企业关联信息。例如,企业信息关系为属于,企业实体为浙江M股份有限公司,目标企业实体为新能源材料。则生成的企业关联信息为:浙江M股份有限公司是属于新能源材料的公司。
其中,所述基于所述目标产业实体和所述目标企业实体确定企业信息关系的步骤包括:
确定所述目标产业实体与所述目标企业实体是否直接连接;
若所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过一条边直接连接,则将连接所述目标产业实体与所述目标企业实体的边对应的所述产业实体关系作为所述企业信息关系;
若所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过多条边间接连接,则将从所述目标产业实体出发至所述目标企业实体,所经过的最后一条边对应的所述产业实体关系作为所述企业信息关系。
在本实施例中,在目标产业实体与目标企业实体间接连接的情况下,需要经过多个边,则可能出现多种企业信息关系,此时,由于目标企业实体是属于企业信息关系的组成部分,将从所述目标产业实体出发至所述目标企业实体,所经过的最后一条边对应的所述产业实体关系,即最靠近目标企业实体的产业实体关系,作为所述企业信息关系,能够使获得的企业信息关系的准确性更高。
此外,在步骤S4中,即所述将所述企业信息和所述企业关联信息作为目标企业数据的步骤包括:
将所述企业信息和所述企业关联信息作为初始企业数据;
确定所述初始企业数据的地理数据所属的省级名称,作为目标地理数据;
将所述初始企业数据的地理数据替换为所述目标地理数据,获得所述目标企业数据。
在本实施例中,本申请还通过由于企业所属省份-浙江,以此方法,对企业基础信息、企业所属行业信息、企业主营产品信息进行收集、构建企业图谱。例如:【企业】浙江M股份有限公司—所属城市—【城市】桐乡。例如,若企业属于桐乡市,则基于城市图谱,推理出所有浙江省的政策也适用。实现在后续的匹配过程中,从地域维度:【企业】浙江M股份有限公司—所属城市—【城市】桐乡;【政策】浙江省高新技术企业培育入库-适用于-【省份】浙江;【省份】浙江-包含城市-【城市】桐乡。推理出【政策】浙江省高新技术企业培育入库-适用于-浙江M股份有限公司。
S5:计算所述结构政策数据与所述目标企业数据的匹配度,在所述匹配度达到匹配阈值时,将对应的政策文本数据推荐给所述待推荐企业。
在本实施例中,对政策类别标签与企业标签进行匹配,推理出适用于企业的政策,推荐给相应的企业。从产业维度:【企业】浙江M股份有限公司-属于—【产业】前沿材料-新能源材料;【政策】浙江省高新技术企业培育入库-适用产业-【产业】前沿材料-新能源材料。推理出:【政策】浙江省高新技术企业培育入库-适用于-【企业】浙江M股份有限公司。本申请可以通过直接对比结构政策数据与目标企业数据的词语重叠度作为所述匹配度。
具体的,在步骤S5中,即所述计算所述结构政策数据与所述目标企业数据的匹配度的步骤包括:
从所述政策类别标签中确定关键政策标签,基于所述关键政策标签对所述结构政策数据进行数据抽取操作,获得目标结构数据;
通过所述目标企业数据生成多个企业数据类别,将与所述关键政策标签相同的企业数据类别作为关键企业类别,并通过所述关键企业类别对所述目标企业数据进行数据抽取操作,获得关键企业数据;
将所述目标结构数据和所述关键企业数据分别转换为目标结构向量和关键企业向量;
计算所述目标结构向量和所述关键企业向量的余弦相似度,获得所述匹配度。
在本实施例中,从所述政策类别标签中确定关键政策标签的具体过程是通过将用户在前端页面选中的政策类别标签,作为关键政策标签。在进行匹配度计算时,通过关键政策标签实现对结构政策数据与所述目标企业数据的筛选,进而根据筛选后获得的目标结构数据和所述关键企业数据计算匹配度,提高精确性,实现对重点维度数据的计算,具体的,结构政策数据中每个句子均分别对应有一个政策类别标签,确定结构政策数据中对应关键政策标签的句子,将其抽取出来,作为目标结构数据。其中,关键政策标签别包括产业类别、地区、政策类别以及申报条件。本申请企业数据类别的生成过程选择预训练的多标签分类模型对进行分类,获得输出的多个企业数据类别。
本申请根据爬取的政策文本数据生成政策类别标签,进而将政策文本数据转化为结构政策数据,便于后续的匹配度计算。根据获取的企业信息从构建的产业知识图谱中推理出企业关联信息,从而实现对企业的信息的补全。进而通过由企业信息和企业关联信息组成的目标企业数据以及结构政策数据计算匹配度,从而在匹配度达到匹配阈值时,向待推荐企业推荐对应的政策,提高向企业推荐的政策的精确度和准确性。
需要强调的是,为进一步保证上述产业知识图谱的私密和安全性,上述产业知识图谱还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(B l ockchai n),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请可应用于智慧政务领域中,从而推动智慧城市的建设。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-On l y Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图3,作为对上述图2所示方法的实现,本申请提供了一种基于知识图谱的政策推荐装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例所述的基于知识图谱的政策推荐装置300包括:爬取模块301、转化模块302、抽取模块303、推理模块304以及计算模块305。其中:所述爬取模块301,用于对目标网站的政策信息进行爬取操作,获得政策文本数据;所述转化模块302,用于对所述政策文本数据进行标签生成操作,获得政策类别标签,基于所述政策类别标签将所述政策文本数据转化为结构化数据,获得结构政策数据;所述抽取模块303,用于接收产业文档,从所述产业文档中抽取产业实体和产业实体关系,基于所述产业实体和所述产业实体关系构建产业知识图谱;所述推理模块304,用于获取待推荐企业的企业信息,基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息,并将所述企业信息和所述企业关联信息作为所述待推荐企业的目标企业数据;所述计算模块305,用于计算所述结构政策数据与所述目标企业数据的匹配度,在所述匹配度达到匹配阈值时,将对应的政策文本数据推荐给所述待推荐企业。
在本实施例中,本申请根据爬取的政策文本数据生成政策类别标签,进而将政策文本数据转化为结构政策数据,便于后续的匹配度计算。根据获取的企业信息从构建的产业知识图谱中推理出企业关联信息,从而实现对企业的信息的补全。进而通过由企业信息和企业关联信息组成的目标企业数据以及结构政策数据计算匹配度,从而在匹配度达到匹配阈值时,向待推荐企业推荐对应的政策,提高向企业推荐的政策的精确度和准确性。
所述转化模块302包括替换子模块、分词子模块、去除子模块、输入子模块和分类子模块,其中,所述替换子模块用于调用预设的分词工具,将预设的政策词典替换所述分词工具的词典,获得目标分词工具;所述分词子模块用于通过所述目标分词工具对所述政策文本数据进行分词操作,获得多个初始政策词语;所述去除子模块用于从所述初始政策词语中去掉停用词,获得目标政策词语;所述输入子模块用于将所述目标政策词语输入至预先训练的向量模型中,获得词向量;所述分类子模块用于基于所述词向量进行分类预测,输出对应的所述政策类别标签。
所述抽取模块303包括产业词语获得子模块、识别子模块、转换子模块、融合子模块以及关系确定子模块,其中,所述获得子模块用于对所述产业文档进行分词处理,获得多个产业词语;所述识别子模块用于对所述产业词语进行实体识别操作,获得多个所述产业实体;所述转换子模块用于将所述产业实体转换为实体向量,并获取所述产业实体在所述产业文档中的位置信息,基于所述位置信息生成位置向量;所述融合子模块用于融合所述产业文档的同一句子中任意两个产业实体的所述实体向量和所述位置向量,获得融合特征;所述关系确定子模块用于将所述融合特征输入至预训练的卷积神经网络中,获得输出的产业实体关系。
所述推理模块304包括匹配子模块、目标企业实体确定子模块以及生成子模块,其中,所述匹配子模块用于从所述企业信息中识别企业实体,将所述企业实体与所述产业知识图谱的产业实体相匹配,将匹配成功的产业实体作为目标产业实体;所述目标企业实体确定子模块用于确定在所述产业知识图谱中,与所述目标产业实体具有连接关系的产业实体,作为目标企业实体;所述生成子模块用于基于所述目标产业实体和所述目标企业实体确定企业信息关系,根据所述企业实体、所述目标企业实体和所述企业信息关系生成所述企业关联信息。
所述生成子模块包括判断单元、第一信息关系确定单元和第二信息关系确定单元,其中,所述判断单元用于确定所述目标产业实体与所述目标企业实体是否直接连接;所述第一信息关系确定单元用于在所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过一条边直接连接时,将连接所述目标产业实体与所述目标企业实体的边对应的所述产业实体关系作为所述企业信息关系;所述第二信息关系确定单元用于在所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过多条边间接连接时,将从所述目标产业实体出发至所述目标企业实体,所经过的最后一条边对应的所述产业实体关系作为所述企业信息关系。
所述推理模块304还包括初始企业数据确定子模块、目标地理数据确定子模块以及目标企业数据获得子模块,其中,所述初始企业数据确定子模块用于将所述企业信息和所述企业关联信息作为初始企业数据;所述目标地理数据确定子模块用于确定所述初始企业数据的地理数据所属的省级名称,作为目标地理数据;所述目标企业数据获得子模块用于将所述初始企业数据的地理数据替换为所述目标地理数据,获得所述目标企业数据。
所述计算模块305包括目标结构数据确定子模块、类别生成子模块、向量转换子模块以及匹配度计算子模块,其中,所述确定子模块用于从所述政策类别标签中确定关键政策标签,基于所述关键政策标签对所述结构政策数据进行数据抽取操作,获得目标结构数据;所述类别生成子模块用于通过所述目标企业数据生成多个企业数据类别,将与所述关键政策标签相同的企业数据类别作为关键企业类别,并通过所述关键企业类别对所述目标企业数据进行数据抽取操作,获得关键企业数据;所述向量转换子模块用于将所述目标结构数据和所述关键企业数据分别转换为目标结构向量和关键企业向量;所述匹配度计算子模块用于计算所述目标结构向量和所述关键企业向量的余弦相似度,获得所述匹配度。
本申请根据爬取的政策文本数据生成政策类别标签,进而将政策文本数据转化为结构政策数据,便于后续的匹配度计算。根据获取的企业信息从构建的产业知识图谱中推理出企业关联信息,从而实现对企业的信息的补全。进而通过由企业信息和企业关联信息组成的目标企业数据以及结构政策数据计算匹配度,从而在匹配度达到匹配阈值时,向待推荐企业推荐对应的政策,提高向企业推荐的政策的精确度和准确性。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备200包括通过系统总线相互通信连接存储器201、处理器202、网络接口203。需要指出的是,图中仅示出了具有组件201-203的计算机设备200,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(App licat ion Specific I ntegrated Ci rcuit,ASI C)、可编程门阵列(Fie l d-Programmab l eGate Array,FPGA)、数字处理器(Digita l Signa l Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器201至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器201可以是所述计算机设备200的内部存储单元,例如该计算机设备200的硬盘或内存。在另一些实施例中,所述存储器201也可以是所述计算机设备200的外部存储设备,例如该计算机设备200上配备的插接式硬盘,智能存储卡(Smart Med ia Card,SMC),安全数字(Secure Di gita l,SD)卡,闪存卡(F l ash Card)等。当然,所述存储器201还可以既包括所述计算机设备200的内部存储单元也包括其外部存储设备。本实施例中,所述存储器201通常用于存储安装于所述计算机设备200的操作系统和各类应用软件,例如基于知识图谱的政策推荐方法的计算机可读指令等。此外,所述存储器201还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器202在一些实施例中可以是中央处理器(Centra l Process i ng Uni t,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器202通常用于控制所述计算机设备200的总体操作。本实施例中,所述处理器202用于运行所述存储器201中存储的计算机可读指令或者处理数据,例如运行所述基于知识图谱的政策推荐方法的计算机可读指令。
所述网络接口203可包括无线网络接口或有线网络接口,该网络接口203通常用于在所述计算机设备200与其他电子设备之间建立通信连接。
在本实施例中,根据获取的企业信息从构建的产业知识图谱中推理出企业关联信息,从而实现对企业的信息的补全。通过由企业信息和企业关联信息组成的目标企业数据以及结构政策数据计算匹配度,从而在匹配度达到匹配阈值时,向待推荐企业推荐对应的政策,提高向企业推荐的政策的精确度和准确性。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于知识图谱的政策推荐方法的步骤。
在本实施例中,根据获取的企业信息从构建的产业知识图谱中推理出企业关联信息,从而实现对企业的信息的补全。通过由企业信息和企业关联信息组成的目标企业数据以及结构政策数据计算匹配度,从而在匹配度达到匹配阈值时,向待推荐企业推荐对应的政策,提高向企业推荐的政策的精确度和准确性。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种基于知识图谱的政策推荐方法,其特征在于,包括下述步骤:
对目标网站的政策信息进行爬取操作,获得政策文本数据;
对所述政策文本数据进行标签生成操作,获得政策类别标签,基于所述政策类别标签将所述政策文本数据转化为结构化数据,获得结构政策数据;
接收产业文档,从所述产业文档中抽取产业实体和产业实体关系,基于所述产业实体和所述产业实体关系构建产业知识图谱;
获取待推荐企业的企业信息,基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息,并将所述企业信息和所述企业关联信息作为所述待推荐企业的目标企业数据;
计算所述结构政策数据与所述目标企业数据的匹配度,在所述匹配度达到匹配阈值时,将对应的所述政策文本数据推荐给所述待推荐企业。
2.根据权利要求1所述的基于知识图谱的政策推荐方法,其特征在于,所述基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息的步骤包括:
从所述企业信息中识别企业实体,将所述企业实体与所述产业知识图谱的产业实体相匹配,将匹配成功的产业实体作为目标产业实体;
确定在所述产业知识图谱中,与所述目标产业实体具有连接关系的产业实体,作为目标企业实体;
基于所述目标产业实体和所述目标企业实体确定企业信息关系,根据所述企业实体、所述目标企业实体和所述企业信息关系生成所述企业关联信息。
3.根据权利要求2所述的基于知识图谱的政策推荐方法,其特征在于,所述基于所述目标产业实体和所述目标企业实体确定企业信息关系的步骤包括:
确定所述目标产业实体与所述目标企业实体是否直接连接;
若所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过一条边直接连接,则将连接所述目标产业实体与所述目标企业实体的边对应的所述产业实体关系作为所述企业信息关系;
若所述目标产业实体与所述目标企业实体在所述产业知识图谱中通过多条边间接连接,则将从所述目标产业实体出发至所述目标企业实体,所经过的最后一条边对应的所述产业实体关系作为所述企业信息关系。
4.根据权利要求1所述的基于知识图谱的政策推荐方法,其特征在于,所述从所述产业文档中抽取产业实体和产业实体关系的步骤包括:
对所述产业文档进行分词处理,获得多个产业词语;
对所述产业词语进行实体识别操作,获得多个所述产业实体;
将所述产业实体转换为实体向量,并获取所述产业实体在所述产业文档中的位置信息,基于所述位置信息生成位置向量;
融合所述产业文档的同一句子中任意两个产业实体的所述实体向量和所述位置向量,获得融合特征;
将所述融合特征输入至预训练的卷积神经网络中,获得输出的产业实体关系。
5.根据权利要求1所述的基于知识图谱的政策推荐方法,其特征在于,所述对所述政策文本数据进行标签生成操作,获得政策类别标签的步骤包括:
调用预设的分词工具,将预设的政策词典替换所述分词工具的词典,获得目标分词工具;
通过所述目标分词工具对所述政策文本数据进行分词操作,获得多个初始政策词语;
从所述初始政策词语中去掉停用词,获得目标政策词语;
将所述目标政策词语输入至预先训练的向量模型中,获得词向量;
基于所述词向量进行分类预测,输出对应的所述政策类别标签。
6.根据权利要求1所述的基于知识图谱的政策推荐方法,其特征在于,所述将所述企业信息和所述企业关联信息作为目标企业数据的步骤包括:
将所述企业信息和所述企业关联信息作为初始企业数据;
确定所述初始企业数据的地理数据所属的省级名称,作为目标地理数据;
将所述初始企业数据的地理数据替换为所述目标地理数据,获得所述目标企业数据。
7.根据权利要求1所述的基于知识图谱的政策推荐方法,其特征在于,所述计算所述结构政策数据与所述目标企业数据的匹配度的步骤包括:
从所述政策类别标签中确定关键政策标签,基于所述关键政策标签对所述结构政策数据进行数据抽取操作,获得目标结构数据;
通过所述目标企业数据生成多个企业数据类别,将与所述关键政策标签相同的企业数据类别作为关键企业类别,并通过所述关键企业类别对所述目标企业数据进行数据抽取操作,获得关键企业数据;
将所述目标结构数据和所述关键企业数据分别转换为目标结构向量和关键企业向量;
计算所述目标结构向量和所述关键企业向量的余弦相似度,获得所述匹配度。
8.一种基于知识图谱的政策推荐装置,其特征在于,包括:
爬取模块,用于对目标网站的政策信息进行爬取操作,获得政策文本数据;
转化模块,用于对所述政策文本数据进行标签生成操作,获得政策类别标签,基于所述政策类别标签将所述政策文本数据转化为结构化数据,获得结构政策数据;
抽取模块,用于接收产业文档,从所述产业文档中抽取产业实体和产业实体关系,基于所述产业实体和所述产业实体关系构建产业知识图谱;
推理模块,用于获取待推荐企业的企业信息,基于所述企业信息从所述产业知识图谱中推理所述待推荐企业的企业关联信息,并将所述企业信息和所述企业关联信息作为所述待推荐企业的目标企业数据;
计算模块,用于计算所述结构政策数据与所述目标企业数据的匹配度,在所述匹配度达到匹配阈值时,将对应的政策文本数据推荐给所述待推荐企业。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于知识图谱的政策推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于知识图谱的政策推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210057430.1A CN114398477A (zh) | 2022-01-19 | 2022-01-19 | 基于知识图谱的政策推荐方法及其相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210057430.1A CN114398477A (zh) | 2022-01-19 | 2022-01-19 | 基于知识图谱的政策推荐方法及其相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114398477A true CN114398477A (zh) | 2022-04-26 |
Family
ID=81230680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210057430.1A Pending CN114398477A (zh) | 2022-01-19 | 2022-01-19 | 基于知识图谱的政策推荐方法及其相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114398477A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971833A (zh) * | 2022-06-22 | 2022-08-30 | 平安银行股份有限公司 | 一种税收信息处理方法及相关设备 |
CN115718823A (zh) * | 2022-11-24 | 2023-02-28 | 维正科技服务有限公司 | 一种多维度产业政策匹配方法、系统及存储介质 |
CN117435817A (zh) * | 2023-12-20 | 2024-01-23 | 泰安北航科技园信息科技有限公司 | 一种基于产业大数据的bi智能中心系统 |
CN117609432A (zh) * | 2023-12-21 | 2024-02-27 | 中国疾病预防控制中心慢性非传染性疾病预防控制中心 | 一种通过标签抽取策略实现政策智能检索方法 |
CN117708350A (zh) * | 2024-02-06 | 2024-03-15 | 成都草根有智创新科技有限公司 | 企业政策的信息关联方法、装置及电子设备 |
CN117743564A (zh) * | 2024-01-30 | 2024-03-22 | 广东省华南技术转移中心有限公司 | 一种科技政策信息自动抽取与推荐方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395410A (zh) * | 2021-01-13 | 2021-02-23 | 北京智源人工智能研究院 | 一种基于实体抽取的产业舆情推荐方法、装置及电子设备 |
CN112579753A (zh) * | 2020-12-17 | 2021-03-30 | 京东数字科技控股股份有限公司 | 信息获取方法、装置、设备、介质及产品 |
CN112765441A (zh) * | 2021-04-07 | 2021-05-07 | 北京零号窗网络信息技术有限公司 | 用于数字政务的企业政策信息多重动态智能匹配推荐方法 |
CN113505242A (zh) * | 2021-07-16 | 2021-10-15 | 珍岛信息技术(上海)股份有限公司 | 一种知识图谱自动嵌入的方法及系统 |
-
2022
- 2022-01-19 CN CN202210057430.1A patent/CN114398477A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112579753A (zh) * | 2020-12-17 | 2021-03-30 | 京东数字科技控股股份有限公司 | 信息获取方法、装置、设备、介质及产品 |
CN112395410A (zh) * | 2021-01-13 | 2021-02-23 | 北京智源人工智能研究院 | 一种基于实体抽取的产业舆情推荐方法、装置及电子设备 |
CN112765441A (zh) * | 2021-04-07 | 2021-05-07 | 北京零号窗网络信息技术有限公司 | 用于数字政务的企业政策信息多重动态智能匹配推荐方法 |
CN113505242A (zh) * | 2021-07-16 | 2021-10-15 | 珍岛信息技术(上海)股份有限公司 | 一种知识图谱自动嵌入的方法及系统 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971833A (zh) * | 2022-06-22 | 2022-08-30 | 平安银行股份有限公司 | 一种税收信息处理方法及相关设备 |
CN115718823A (zh) * | 2022-11-24 | 2023-02-28 | 维正科技服务有限公司 | 一种多维度产业政策匹配方法、系统及存储介质 |
CN117435817A (zh) * | 2023-12-20 | 2024-01-23 | 泰安北航科技园信息科技有限公司 | 一种基于产业大数据的bi智能中心系统 |
CN117435817B (zh) * | 2023-12-20 | 2024-03-15 | 泰安北航科技园信息科技有限公司 | 一种基于产业大数据的bi智能中心系统 |
CN117609432A (zh) * | 2023-12-21 | 2024-02-27 | 中国疾病预防控制中心慢性非传染性疾病预防控制中心 | 一种通过标签抽取策略实现政策智能检索方法 |
CN117743564A (zh) * | 2024-01-30 | 2024-03-22 | 广东省华南技术转移中心有限公司 | 一种科技政策信息自动抽取与推荐方法及系统 |
CN117743564B (zh) * | 2024-01-30 | 2024-05-10 | 广东省华南技术转移中心有限公司 | 一种科技政策信息自动抽取与推荐方法及系统 |
CN117708350A (zh) * | 2024-02-06 | 2024-03-15 | 成都草根有智创新科技有限公司 | 企业政策的信息关联方法、装置及电子设备 |
CN117708350B (zh) * | 2024-02-06 | 2024-05-14 | 成都草根有智创新科技有限公司 | 企业政策的信息关联方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114398477A (zh) | 基于知识图谱的政策推荐方法及其相关设备 | |
WO2022174491A1 (zh) | 基于人工智能的病历质控方法、装置、计算机设备及存储介质 | |
CN112101437A (zh) | 基于图像检测的细粒度分类模型处理方法、及其相关设备 | |
CN112231569A (zh) | 新闻推荐方法、装置、计算机设备及存储介质 | |
CN112686022A (zh) | 违规语料的检测方法、装置、计算机设备及存储介质 | |
CN113220734A (zh) | 课程推荐方法、装置、计算机设备及存储介质 | |
CN113836131A (zh) | 一种大数据清洗方法、装置、计算机设备及存储介质 | |
CN112632278A (zh) | 一种基于多标签分类的标注方法、装置、设备及存储介质 | |
CN112650858A (zh) | 应急协助信息的获取方法、装置、计算机设备及介质 | |
CN113761577A (zh) | 一种大数据脱敏的方法、装置、计算机设备及存储介质 | |
CN113627797A (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN112084342A (zh) | 试题生成方法、装置、计算机设备及存储介质 | |
CN114926282A (zh) | 一种异常交易的识别方法、装置、计算机设备及存储介质 | |
CN112883730B (zh) | 相似文本匹配方法、装置、电子设备及存储介质 | |
CN114493255A (zh) | 基于知识图谱的企业异常监控方法及其相关设备 | |
CN111639360A (zh) | 智能数据脱敏方法、装置、计算机设备及存储介质 | |
CN113657547A (zh) | 基于自然语言处理模型的舆情监测方法及其相关设备 | |
CN113569998A (zh) | 票据自动识别方法、装置、计算机设备及存储介质 | |
CN112199954A (zh) | 基于语音语义的疾病实体匹配方法、装置及计算机设备 | |
CN112686053A (zh) | 一种数据增强方法、装置、计算机设备及存储介质 | |
CN112084779A (zh) | 用于语义识别的实体获取方法、装置、设备及存储介质 | |
CN112528040B (zh) | 基于知识图谱的引导教唆语料的检测方法及其相关设备 | |
CN111797297B (zh) | 页面数据处理方法、装置、计算机设备及存储介质 | |
CN113641714A (zh) | 医疗数据矫正方法、装置、计算机设备及存储介质 | |
CN112417886A (zh) | 意图实体信息抽取方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |