Nothing Special   »   [go: up one dir, main page]

CN115878864A - 一种数据检索方法、装置、设备及可读存储介质 - Google Patents

一种数据检索方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN115878864A
CN115878864A CN202211550050.8A CN202211550050A CN115878864A CN 115878864 A CN115878864 A CN 115878864A CN 202211550050 A CN202211550050 A CN 202211550050A CN 115878864 A CN115878864 A CN 115878864A
Authority
CN
China
Prior art keywords
data
index
information
retrieval
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211550050.8A
Other languages
English (en)
Inventor
张哲�
李菁汉
牛伟嘉
吴志刚
冷炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202211550050.8A priority Critical patent/CN115878864A/zh
Publication of CN115878864A publication Critical patent/CN115878864A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据检索方法、装置、设备及可读存储介质,涉及互联网数据管理技术领域,包括接收符合预设文件格式的数据源文件,根据所述数据源文件的数据内容和数据形式创建数据颗粒单元;对所述数据颗粒单元进行解析,得到解析文件;根据所述解析文件中的数据信息构建数据模型;根据所述数据模型和预设的数据,建立数据库;对所述数据库进行数据检索,得到检索结果。本发明可以支持检索与目标数据相似且标签信息匹配的数据,并且可以提高数据检索效率。支持对数据进行多维度、多条件检索;此外,通过设置索引和索引类别对数据进行了一定程度上的分类,既提高了数据检索的效率,也便于用户对数据进行分类管理。

Description

一种数据检索方法、装置、设备及可读存储介质
技术领域
本发明涉及互联网数据管理技术领域,具体而言,涉及数据检索方法、装置、设备及可读存储介质。
背景技术
目前国内外的数据管理系统大多都是针对一种或几种特定类型的数据,事先根据数据的内容、形式设计好数据库和系统结构,系统开发好后,只能让符合数据库结构的数据入库存储,并且也只能按照事先设计好的检索模式检索数据,管理过程中一旦出现新的数据类型和数据关联关系,就需要修改系统和数据库,发布新版本系统后才能存储管理新类型数据。现有的数据管理系统在存储和检索数据时存在的缺陷如下:针对未来新增类别的数据,需要手动修改数据库的结构以及输入接口;发布新版本系统后才能存储新类型数据,并且需要长期投入人力进行维护。
发明内容
本发明的目的在于提供一种数据检索方法、装置、设备及可读存储介质,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:
第一方面,本申请提供了一种数据检索方法,包括:
接收符合预设文件格式的数据源文件,根据所述数据源文件的数据内容和数据形式创建数据颗粒单元;
对所述数据颗粒单元进行解析,得到解析文件;
根据所述解析文件中的数据信息构建数据模型;
根据所述数据模型和预设的数据,建立数据库;
对所述数据库进行数据检索,得到检索结果。
第二方面,本申请还提供了一种数据检索装置,包括:
接收模块:用于接收符合预设文件格式的数据源文件,根据所述数据源文件的数据内容和数据形式创建数据颗粒单元;
解析模块:用于对所述数据颗粒单元进行解析,得到解析文件;
构建模块:用于根据所述解析文件中的数据信息构建数据模型;
建立模块:用于根据所述数据模型和预设的数据,建立数据库;
第一检索模块:用于对所述数据库进行数据检索,得到检索结果。
第三方面,本申请还提供了一种数据检索设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述数据检索方法的步骤。
第四方面,本申请还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于数据检索方法的步骤。
本发明的有益效果为:本发明的技术方案从预先建立的检索图的一个节点出发,以预定的检索方式进行检索,以确定候选节点集合并根据该候选节点集合确定目标数据对应的检索结果,可以支持检索与目标数据相似且标签信息匹配的数据,并且可以提高数据检索效率。支持对数据进行多维度、多条件检索。此外,通过设置索引和索引类别对数据进行了一定程度上的分类,既提高了数据检索的效率,也便于用户对数据进行分类管理。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例中所述的数据检索方法流程示意图;
图2为本发明实施例中所述的数据检索装置结构示意图;
图3为本发明实施例中所述的数据检索设备结构示意图。
图中:701、接收模块;702、解析模块;7021、构建单元;7022、第一获取单元;70221、第五获取单元;70222、关联单元;70223、第六获取单元;70224、第一存储单元;70225、第二存储单元;7023、第二获取单元;7024、第三获取单元;7025、第四获取单元;7026、判断单元;703、构建模块;704、建立模块;705、第一检索模块;7051、接收单元;7052、检索结果单元;7053、获取信息单元;7054、更新数据单元;7055、加载单元;7056、第九获取单元;7057、第二检索单元;7058、确定单元;706、第一获取模块;707、第二获取模块;708、判断模块;709、第三获取模块;800、数据检索设备;801、处理器;802、存储器;803、多媒体组件;804、输入/输出(I/O)接口;805、通信组件。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1:
本实施例提供了一种数据检索方法。
参见图1,图中示出了本方法包括步骤S100、步骤S200、步骤S300、步骤S400和步骤S500。
S100、接收符合预设文件格式的数据源文件,根据数据源文件的数据内容和数据形式创建数据颗粒单元。
可以理解的是,在本步骤中,计算机接收到符合格式条件的数据源文件包括数据内容信息和颗粒单元。
S200、对数据颗粒单元进行解析,得到解析文件。
可以理解的是,在本步骤中S200之后包括S201、S202、S203、S204、S205和S206,其中:
S201、通过数据颗粒单元构建动态关联图;
S202、获取第三信息,第三信息为前端获得到的检索内容和索引类别,索引类别在索引类别配置中记录;
S203、根据第三信息,获取第四信息,第四信息为通过查找获得与索引类别关联的至少一个索引,索引类别与索引的关联关系在索引配置中记录;
S204、根据第四信息,获取第五信息,第五信息为通过查找获得与索引关联的至少一个数据对象,索引与数据对象的关联关系在索引配置中记录;
S205、根据第五信息,获取第六信息,第六信息为获得与数据对象关联的至少一个属性,数据对象和属性关联关系在数据对象配置中记录;
S206、判断至少一个属性中是否存在与检索内容相匹配的属性;若存在相匹配的属性,确定数据对象为匹配数据对象并将匹配数据对象返回至前端进行展示。
其中,需要说明的是,S202之前还包括S2021、S2022、S2023、S2024和S2025,其中:
S2021、获取作为调用参数传入的数据对象和与数据对象关联的至少一个属性;
S2022、将数据对象和至少一个属性按照数据对象配置中的关系关联进行存储;
S2023、获取索引配置中的数据对象相对应的索引;
S2024、将数据对象和索引按照索引配置中的关系关联存储;
S2025、获取索引配置中的索引对应的索引类别,并将索引与索引类别按照索引配置中的关系关联进行存储。
在本发明实施例提供的数据检索方法中,需要使用索引类别配置、索引配置、索引策略配置以及数据对象配置共四种配置,其中,索引类别配置中记录了索引类别名称,索引配置中记录了索引和索引类别的关联关系(一个索引类别下可以有一个或多个索引),索引策略配置中记录了索引和数据对象的关联关系(一个索引下可以有一个或多个数据对象),数据对象配置中记录了数据对象与属性的关联关系(一个数据对象下可以有一个或多个属性)。
在一种实施方式中,这些配置的内容可以为:索引类别配置:索引类别名称;索引配置:索引名称、索引类别名称;索引策略配置:索引策略名称、索引名称、数据对象名称;数据对象配置:对象名称、属性名称。
检索内容由用户在前端界面上输入,并被发送至后台,同时用户在检索时还应当指定索引类别。其中,指定的索引类别应当定义在索引类别配置中。
索引类别与索引的关联关系在索引配置中记录,但需要注意的是,索引配置中记录的只是对关联关系的描述,真正的索引类别与索引在数据检索系统的底层进行了关联存储,通过索引配置中的记录可以获取到索引类别,进而获取到与之关联的索引。
索引与数据对象的关联关系在索引配置中记录,但需要注意的是,索引策略配置中记录的只是对关联关系的描述,真正的索引与数据对象在数据检索系统的底层进行了关联存储,通过索引策略配置中的记录可以获取到索引,进而获取到与之关联的数据对象。
数据对象与属性的关联关系在数据对象配置中记录,但需要注意的是,数据对象配置中记录的只是对关联关系的描述,真正的数据对象与属性在数据检索系统的底层进行了关联存储,通过数据对象配置中的记录可以获取到数据对象,进而获取到与之关联的属性。
S300、根据解析文件中的数据信息构建数据模型。
S400、根据数据模型和预设的数据,建立数据库。
可以理解的是,在本步骤中S400之后包括S401、S402和S403,其中:
S401、获取第一信息,第一信息包括为需存储的数据制定索引信息,并将数据的索引信息记录在索引文件中;
S402、根据第一信息,获取第二信息,第二信息包括为数据制定存储位置信息,并将数据的存储位置信息记录在定位文件中;
S403、根据索引文件,判断数据是否满足检索的需求。
S500、对数据库进行数据检索,得到检索结果。
可以理解的是,在本步骤中S500包括S501、S502和S503,其中:
S501、获取对数据库的数据检索请求,数据检索请求包括目标数据和目标数据的标签信息,数据库包括多个节点,一个节点对应一个检索数据,数据库中的至少两个节点之间具有预设的关联关系;
S502、以预设的检索方式对数据库进行检索,以确定候选节点集合,候选节点集合中的候选节点与目标数据的相似度大于或等于第一阈值;其中,预定的检索方式包括:响应于当前节点与目标数据的相似度大于第一阈值,且当前节点的标签信息与目标数据的标签信息匹配,将当前节点加入候选节点集合;
S503、根据候选节点集合确定目标数据对应的检索结果。
在本发明实施例中,先根据数据库中的检索数据建立检索图,其中,数据库中的检索数据可以为数据(例如图像数据、音视频数据等)的特征向量。在一种可选的实现方式中,将数据库中的检索数据记为一个节点,计算节点之间的相似度,并将相似度大于预设的第二阈值的节点用边连接起来,这些节点和边构成了检索图。在另一种可选的实现方式中,将数据库中的检索数据记为一个节点,计算节点之间的相似度,将一个节点和与该节点相似度最高的m个节点用边连接起来,其中,m为预先设定的值,这些节点和边构成了检索图。
每个节点对应于一个检索数据,节点之间的连线用于表征两个节点之间具有预定的关联关系其中,具有关联关系的两个节点之间的相似度满足第一预定条件。在一种可选的实现方式中,第一预定条件具体为两个节点之间的相似度大于第二阈值。在另一种可选的实现方式中,预定条件具体为两个节点之间的相似度至少在其中一个节点对应的相似度序列中位于前m位,其中,相似度序列为:从高到低排序后的节点与检索图中其他节点的相似度。
本实施例的数据检索方法包括以下步骤:
获取对于检索图的数据检索请求。其中,数据检索请求包括目标数据和目标数据的标签信息。假设目标数据为图像数据,标签信息可以为图像的分辨率、图像格式、图像上传日期或产生日期、图像对应的作者等信息中的一项或多项。检索图包括多个节点,一个节点对应于一个数据库中的检索数据,检索图中的至少两个节点之间具有上述关联关系。
从检索图的一个节点出发,以预定的检索方式对检索图进行检索,以确定候选节点集合。其中,候选节点集合中的候选节点与目标数据的相似度大于或等于第一阈值。在一种可选的实现方式中,第一阈值是动态变化的。在候选节点集合中的节点数量被预先设置为第一预定值时,计算候选节点集合中的节点分别与目标数据的相似度,将候选节点集合中的节点与目标数据之间的相似度的最小值确定为第一阈值。在候选节点集合中的节点数量达到第一预定值后,响应于将当前节点加入候选节点集合,将第一阈值对应的候选数据从候选节点集合中移出,并计算当前的候选节点集合中的节点与目标数据之间的相似度的最小值以更新第一阈值。在另一种可选的实现方式中,第一阈值为预设值。
在本实施例中,预定的检索方式包括:
响应于当前节点与目标数据的相似度大于第一阈值,且当前节点的标签信息与目标数据的标签信息匹配,将当前节点加入候选节点集合;响应于当前节点与目标数据的相似度大于第一阈值,且当前节点的标签信息与目标数据的标签信息不匹配,计算候选概率,并响应于候选概率满足预定条件将当前节点加入候选节点集合。在一种可选的实现方式中,根据当前节点与目标数据的相似度计算当前节点的候选概率。可选的,候选概率与当前节点和目标数据之间的相似度负相关。可选的,候选概率满足预定条件具体为候选概率大于随机获取的随机概率,或者候选概率大于预设的概率阈值。由此,可以在检索与目标数据相似且标签信息匹配的数据的同时,提高数据检索效率。
其中,需要说明的是,S500之后还包括S600、S700、S800、S900和S1000,其中:
S600、接收检索请求;
S700、根据检索请求在数据库中进行检索,得到检索结果;
S800、获取更新数据存储路径信息;
S900、根据更新数据存储路径信息,获取第七信息,第七信息用于更新数据库的更新数据;
S1000、将更新数据加载至数据库中,得到更新后的检索数据库。
将接收到的检索请求进行更新,并将更新后的检索结果存入数据库中,上述数据检索方法在数据对象配置中对待检索的数据进行对象化的定义,并设置了数据对象的希望被用于检索的属性。其中,属性可以看作是数据对象的标签,在这些标签中进行检索,其效率远远高于现有技术中在所有数据中进行检索,因此能够实现高效的数据检索。同时,由于属性可以在数据对象配置中自定义设置,其自由度非常高,因此可以支持对数据进行多维度、多条件检索。此外,通过设置索引和索引类别相当对数据进行了一定程度上的分类,既提高了数据检索的效率,也便于用户对数据进行分类管理。
实施例2:
如图2所示,本实施例提供了一种数据检索装置,参见图2所述装置包括一种数据检索装置,包括接收模块701、解析模块702、构建模块703、建立模块704和第一检索模块705,其中:
接收模块701:用于接收符合预设文件格式的数据源文件,根据所述数据源文件的数据内容和数据形式创建数据颗粒单元;
解析模块702:用于对所述数据颗粒单元进行解析,得到解析文件;
构建模块703:用于根据所述解析文件中的数据信息构建数据模型;
建立模块704:用于根据所述数据模型和预设的数据,建立数据库;
第一检索模块705:用于对所述数据库进行数据检索,得到检索结果。
优选地,建立模块704,之后包括第一获取模块706、第二获取模块707和判断模块708,其中:
第一获取模块706:用于获取第一信息,所述第一信息包括为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;
第二获取模块707:用于根据所述第一信息,获取第二信息,所述第二信息包括为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;
判断模块708:用于根据所述索引文件,判断所述数据是否满足检索的需求。
优选地,第一检索模块705,包括第九获取单元7056、第二检索单元7057和确定单元7058,其中:
第九获取单元7056:用于获取对所述数据库的数据检索请求,所述数据检索请求包括目标数据和所述目标数据的标签信息,所述数据库包括多个节点,一个所述节点对应一个检索数据,所述数据库中的至少两个所述节点之间具有预设的关联关系;
第二检索单元7057:用于以预设的检索方式对所述数据库进行检索,以确定候选节点集合,所述候选节点集合中的候选节点与所述目标数据的相似度大于或等于第一阈值;其中,预定的所述检索方式包括:响应于当前节点与所述目标数据的相似度大于所述第一阈值,且所述当前节点的标签信息与所述目标数据的标签信息匹配,将所述当前节点加入所述候选节点集合;
确定单元7058:用于根据所述候选节点集合确定所述目标数据对应的检索结果。
优选地,解析模块702,之后包括构建单元7021、第一获取单元7022、第二获取单元7023、第三获取单元7024、第四获取单元7025和判断单元7026,其中:
构建单元7021:用于通过所述数据颗粒单元构建动态关联图;
第一获取单元7022:用于获取第三信息,所述第三信息为前端获得到的检索内容和索引类别,所述索引类别在索引类别配置中记录;
第二获取单元7023:用于根据所述第三信息,获取第四信息,所述第四信息为通过查找获得与所述索引类别关联的至少一个索引,所述索引类别与所述索引的关联关系在索引配置中记录;
第三获取单元7024:用于根据所述第四信息,获取第五信息,所述第五信息为通过查找获得与所述索引关联的至少一个数据对象,所述索引与所述数据对象的关联关系在索引配置中记录;
第四获取单元7025:用于根据所述第五信息,获取第六信息,所述第六信息为获得与所述数据对象关联的至少一个属性,所述数据对象和所述属性关联关系在数据对象配置中记录;
判断单元7026:用于判断至少一个所述属性中是否存在与所述检索内容相匹配的属性;若存在相匹配的属性,确定所述数据对象为匹配数据对象并将所述匹配数据对象返回至所述前端进行展示。
优选地,第一获取单元7022,之前还包括第五获取单元70221、关联单元70222、第六获取单元70223、第一存储单元70224和第二存储单元70225,其中:
第五获取单元70221:用于获取作为调用参数传入的所述数据对象和与所述数据对象关联的至少一个所述属性;
关联单元70222:用于将所述数据对象和至少一个所述属性按照所述数据对象配置中的关系关联进行存储;
第六获取单元70223:用于获取所述索引配置中的所述数据对象相对应的所述索引;
第一存储单元70224:用于将所述数据对象和所述索引按照所述索引配置中的关系关联存储;
第二存储单元70225:用于获取所述索引配置中的所述索引对应的所述索引类别,并将所述索引与所述索引类别按照所述索引配置中的关系关联进行存储。
优选地,第一检索模块705,之后还包括接收单元7051、检索结果单元7052、获取信息单元7053、更新数据单元7054和加载单元7055,其中:
接收单元7051:用于接收检索请求;
检索结果单元7052:用于根据所述检索请求在所述数据库中进行检索,得到检索结果;
获取信息单元7053:用于获取更新数据存储路径信息;
更新数据单元7054:用于根据所述更新数据存储路径信息,获取第七信息,所述第七信息用于更新所述数据库的更新数据;
加载单元7055:用于将所述更新数据加载至所述数据库中,得到更新后的检索数据库。
需要说明的是,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3:
相应于上面的方法实施例,本实施例中还提供了一种数据检索设备,下文描述的一种数据检索设备与上文描述的一种数据检索方法可相互对应参照。
图3是根据示例性实施例示出的一种数据检索设备800的框图。如图3所示,该数据检索设备800可以包括:处理器801,存储器802。该数据检索设备800还可以包括多媒体组件803,I/O接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该数据检索设备800的整体操作,以完成上述的数据检索方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该数据检索设备800的操作,这些数据例如可以包括用于在该数据检索设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该数据检索设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(NearFieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,数据检索设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的数据检索方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的数据检索方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由数据检索设备800的处理器801执行以完成上述的数据检索方法。
实施例4:
相应于上面的方法实施例,本实施例中还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种数据检索方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的数据检索方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (14)

1.一种数据检索方法,其特征在于,包括:
接收符合预设文件格式的数据源文件,根据所述数据源文件的数据内容和数据形式创建数据颗粒单元;
对所述数据颗粒单元进行解析,得到解析文件;
根据所述解析文件中的数据信息构建数据模型;
根据所述数据模型和预设的数据,建立数据库;
对所述数据库进行数据检索,得到检索结果。
2.根据权利要求1所述的数据检索方法,其特征在于,所述根据所述数据模型和预设的数据,建立数据库,之后包括:
获取第一信息,所述第一信息包括为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;
根据所述第一信息,获取第二信息,所述第二信息包括为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;
根据所述索引文件,判断所述数据是否满足检索的需求。
3.根据权利要求1所述的数据检索方法,其特征在于,所述对所述数据库进行数据检索,得到检索结果,包括:
获取对所述数据库的数据检索请求,所述数据检索请求包括目标数据和所述目标数据的标签信息,所述数据库包括多个节点,一个所述节点对应一个检索数据,所述数据库中的至少两个所述节点之间具有预设的关联关系;
以预设的检索方式对所述数据库进行检索,以确定候选节点集合,所述候选节点集合中的候选节点与所述目标数据的相似度大于或等于第一阈值;其中,预定的所述检索方式包括:响应于当前节点与所述目标数据的相似度大于所述第一阈值,且所述当前节点的标签信息与所述目标数据的标签信息匹配,将所述当前节点加入所述候选节点集合;
根据所述候选节点集合确定所述目标数据对应的检索结果。
4.根据权利要求1所述的数据检索方法,其特征在于,所述对所述数据颗粒单元进行解析,得到解析文件,之后包括:
通过所述数据颗粒单元构建动态关联图;
获取第三信息,所述第三信息为前端获得到的检索内容和索引类别,所述索引类别在索引类别配置中记录;
根据所述第三信息,获取第四信息,所述第四信息为通过查找获得与所述索引类别关联的至少一个索引,所述索引类别与所述索引的关联关系在索引配置中记录;
根据所述第四信息,获取第五信息,所述第五信息为通过查找获得与所述索引关联的至少一个数据对象,所述索引与所述数据对象的关联关系在索引配置中记录;
根据所述第五信息,获取第六信息,所述第六信息为获得与所述数据对象关联的至少一个属性,所述数据对象和所述属性关联关系在数据对象配置中记录;
判断至少一个所述属性中是否存在与所述检索内容相匹配的属性;若存在相匹配的属性,确定所述数据对象为匹配数据对象并将所述匹配数据对象返回至所述前端进行展示。
5.根据权利要求4所述的数据检索方法,其特征在于,所述获取第三信息,所述第三信息为前端获得到的检索内容和索引类别,之前还包括:
获取作为调用参数传入的所述数据对象和与所述数据对象关联的至少一个所述属性;
将所述数据对象和至少一个所述属性按照所述数据对象配置中的关系关联进行存储;
获取所述索引配置中的所述数据对象相对应的所述索引;
将所述数据对象和所述索引按照所述索引配置中的关系关联存储;
获取所述索引配置中的所述索引对应的所述索引类别,并将所述索引与所述索引类别按照所述索引配置中的关系关联进行存储。
6.根据权利要求1所述的数据检索方法,其特征在于,所述对所述数据库进行数据检索,得到检索结果,之后还包括:
接收检索请求;
根据所述检索请求在所述数据库中进行检索,得到检索结果;
获取更新数据存储路径信息;
根据所述更新数据存储路径信息,获取第七信息,所述第七信息用于更新所述数据库的更新数据;
将所述更新数据加载至所述数据库中,得到更新后的检索数据库。
7.一种数据检索装置,其特征在于,包括:
接收模块:用于接收符合预设文件格式的数据源文件,根据所述数据源文件的数据内容和数据形式创建数据颗粒单元;
解析模块:用于对所述数据颗粒单元进行解析,得到解析文件;
构建模块:用于根据所述解析文件中的数据信息构建数据模型;
建立模块:用于根据所述数据模型和预设的数据,建立数据库;
第一检索模块:用于对所述数据库进行数据检索,得到检索结果。
8.根据权利要求7所述的数据检索装置,其特征在于,所述建立模块,之后包括:
第一获取模块:用于获取第一信息,所述第一信息包括为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;
第二获取模块:用于根据所述第一信息,获取第二信息,所述第二信息包括为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;
判断模块:用于根据所述索引文件,判断所述数据是否满足检索的需求。
9.根据权利要求7所述的数据检索装置,其特征在于,所述第一检索模块,包括:
第九获取单元:用于获取对所述数据库的数据检索请求,所述数据检索请求包括目标数据和所述目标数据的标签信息,所述数据库包括多个节点,一个所述节点对应一个检索数据,所述数据库中的至少两个所述节点之间具有预设的关联关系;
第二检索单元:用于以预设的检索方式对所述数据库进行检索,以确定候选节点集合,所述候选节点集合中的候选节点与所述目标数据的相似度大于或等于第一阈值;其中,预定的所述检索方式包括:响应于当前节点与所述目标数据的相似度大于所述第一阈值,且所述当前节点的标签信息与所述目标数据的标签信息匹配,将所述当前节点加入所述候选节点集合;
确定单元:用于根据所述候选节点集合确定所述目标数据对应的检索结果。
10.根据权利要求7所述的数据检索装置,其特征在于,所述解析模块,之后包括:
构建单元:用于通过所述数据颗粒单元构建动态关联图;
第一获取单元:用于获取第三信息,所述第三信息为前端获得到的检索内容和索引类别,所述索引类别在索引类别配置中记录;
第二获取单元:用于根据所述第三信息,获取第四信息,所述第四信息为通过查找获得与所述索引类别关联的至少一个索引,所述索引类别与所述索引的关联关系在索引配置中记录;
第三获取单元:用于根据所述第四信息,获取第五信息,所述第五信息为通过查找获得与所述索引关联的至少一个数据对象,所述索引与所述数据对象的关联关系在索引配置中记录;
第四获取单元:用于根据所述第五信息,获取第六信息,所述第六信息为获得与所述数据对象关联的至少一个属性,所述数据对象和所述属性关联关系在数据对象配置中记录;
判断单元:用于判断至少一个所述属性中是否存在与所述检索内容相匹配的属性;若存在相匹配的属性,确定所述数据对象为匹配数据对象并将所述匹配数据对象返回至所述前端进行展示。
11.根据权利要求10所述的数据检索装置,其特征在于,所述第一获取单元,之前还包括:
第五获取单元:用于获取作为调用参数传入的所述数据对象和与所述数据对象关联的至少一个所述属性;
关联单元:用于将所述数据对象和至少一个所述属性按照所述数据对象配置中的关系关联进行存储;
第六获取单元:用于获取所述索引配置中的所述数据对象相对应的所述索引;
第一存储单元:用于将所述数据对象和所述索引按照所述索引配置中的关系关联存储;
第二存储单元:用于获取所述索引配置中的所述索引对应的所述索引类别,并将所述索引与所述索引类别按照所述索引配置中的关系关联进行存储。
12.根据权利要求7所述的数据检索装置,其特征在于,所述第一检索模块,之后还包括:
接收单元:用于接收检索请求;
检索结果单元:用于根据所述检索请求在所述数据库中进行检索,得到检索结果;
获取信息单元:用于获取更新数据存储路径信息;
更新数据单元:用于根据所述更新数据存储路径信息,获取第七信息,所述第七信息用于更新所述数据库的更新数据;
加载单元:用于将所述更新数据加载至所述数据库中,得到更新后的检索数据库。
13.一种数据检索设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述数据检索方法的步骤。
14.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述数据检索方法的步骤。
CN202211550050.8A 2022-12-05 2022-12-05 一种数据检索方法、装置、设备及可读存储介质 Pending CN115878864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211550050.8A CN115878864A (zh) 2022-12-05 2022-12-05 一种数据检索方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211550050.8A CN115878864A (zh) 2022-12-05 2022-12-05 一种数据检索方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN115878864A true CN115878864A (zh) 2023-03-31

Family

ID=85765910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211550050.8A Pending CN115878864A (zh) 2022-12-05 2022-12-05 一种数据检索方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN115878864A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118035251A (zh) * 2024-04-11 2024-05-14 河北省交通规划设计研究院有限公司 基于多特征融合的城市数据模型管理系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118035251A (zh) * 2024-04-11 2024-05-14 河北省交通规划设计研究院有限公司 基于多特征融合的城市数据模型管理系统及方法

Similar Documents

Publication Publication Date Title
CN108509569B (zh) 企业画像的生成方法、装置、电子设备以及存储介质
CN112579728A (zh) 基于海量数据全文检索的行为异常识别方法及装置
CN112818162A (zh) 图像检索方法、装置、存储介质和电子设备
CN112149419B (zh) 字段的规范化自动命名方法、装置及系统
CN110704699A (zh) 数据画像的构建方法、装置、计算机设备及存储介质
CN115878864A (zh) 一种数据检索方法、装置、设备及可读存储介质
CN110895587B (zh) 用于确定目标用户的方法和装置
CN114398315A (zh) 一种数据存储方法、系统、存储介质及电子设备
CN111460268B (zh) 数据库查询请求的确定方法、装置和计算机设备
CN112163415A (zh) 针对反馈内容的用户意图识别方法、装置及电子设备
CN118013364A (zh) 一种多维数据智能标识方法
CN114282119B (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
CN115577147A (zh) 可视化情报图谱检索方法、装置、电子设备及存储介质
JP6750838B1 (ja) 業務自動処理の手順定義装置、及び業務自動処理の手順定義システム
CN114416174A (zh) 基于元数据的模型重构方法、装置、电子设备及存储介质
CN114648010A (zh) 数据表标准化方法、装置、设备及计算机存储介质
CN114281688A (zh) 一种无码或低码的自动化用例管理方法和装置
CN115114415A (zh) 问答知识库更新方法、装置、计算机设备和存储介质
CN118820319A (zh) 信息处理方法、装置、设备和介质
CN111311329B (zh) 标签数据获取方法、装置、设备及可读存储介质
CN118860977A (zh) 文档生成方法、装置、计算机设备、存储介质和计算机程序产品
CN118551097A (zh) 搜索信息提示方法、装置、计算机设备和存储介质
CN118170360A (zh) 请求处理的方法、装置、设备和存储介质
CN117392402A (zh) 一种自监督学习方法、装置、计算机设备及存储介质
JP2023021647A (ja) 学習装置および方法、予測装置および方法、プログラム、機械学習モデルの評価方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination