Nothing Special   »   [go: up one dir, main page]

CN115831380A - 一种基于医疗知识图谱的智能医疗数据管理系统及方法 - Google Patents

一种基于医疗知识图谱的智能医疗数据管理系统及方法 Download PDF

Info

Publication number
CN115831380A
CN115831380A CN202211554252.XA CN202211554252A CN115831380A CN 115831380 A CN115831380 A CN 115831380A CN 202211554252 A CN202211554252 A CN 202211554252A CN 115831380 A CN115831380 A CN 115831380A
Authority
CN
China
Prior art keywords
medical
extraction
maternal
entity
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211554252.XA
Other languages
English (en)
Inventor
刘尊亮
吴芸
王路路
李云志
吉昱行
郝宁
商超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Leo Biotechnology Co ltd
Original Assignee
Suzhou Leo Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Leo Biotechnology Co ltd filed Critical Suzhou Leo Biotechnology Co ltd
Priority to CN202211554252.XA priority Critical patent/CN115831380A/zh
Publication of CN115831380A publication Critical patent/CN115831380A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及医疗知识图谱领域,具体为一种基于医疗知识图谱的智能医疗数据管理系统及方法,所述系统包括数据获取模块、知识图谱构建模块、实体抽取模块以及辅助优化管理模块;所述辅助优化管理模块用于对医疗病例、医学知识进行智能管理,根据妇幼患者信息匹配最佳诊疗方案;本发明通过运用ML算法构建隐马尔科夫模型,基于隐马尔可夫模型对医疗知识进行实体抽取,基于RNN关系抽取模型实现关系抽取,最后将得到的数据进行知识融合,构建医疗知识图谱,实现对妇幼医疗病例、妇幼医学知识进行智能管理,达到辅助医生优化诊疗方案的效果。

Description

一种基于医疗知识图谱的智能医疗数据管理系统及方法
技术领域
本发明涉及医疗知识图谱领域,具体为一种基于医疗知识图谱的智能医疗数据管理系统及方法。
背景技术
目前医院中都普遍使用CDSS(ClinicalDecisionSupportSystem,临床决策支持系统)来进行病例、患者管理。CDSS中主要用于对所有的病例数据进行数据库字段的存储和管理;其对诊疗流程和各种风险的预测,主要是通过人工规则的方式进行设定,缺乏灵活性。医生只能单纯地查看、编辑这些数据。
但是由于不同医院之间使用的CDSS一般不通用,因此CDSS的使用只能对本医院的病人病例和数据进行管理,灵活性差。此外,目前的CDSS系统,普遍缺乏对电子数据的有效分析,因此其进行诊疗流程和风险预测的能力有限。
随着科学技术的发展。在进行诊疗优化、风险预测时,CDSS会应用知识图谱数据,通过知识图谱中的数据信息,进行最佳诊疗匹配,而鉴于知识图谱数据构建本身的要求较高,因此,现在CDSS经常会遇到很多问题,例如:知识图谱数据规模较小,在实际应用中应用场景受限;数据错误过多,无法真正用于实际的医疗工作;数据过于丰富,但是缺乏场景定制化(针对不同国家、不同地区,提供的数据完全相同),忽略了不同地域人群之间的患病概率、治疗水平等外部因素的差异,导致实际使用中指导性较差;
知识图谱涉及技术繁多,其中主要包括知识表示、图谱构建和图谱应用三个方面。知识表示是针对计算机内部表示和处理客观事件知识的方法研究;知识图谱侯建解决如何构建一个算法从客观世界或各种数据资源获取客观事件的互联网知识,知识图谱应用的主要任务是研究如何利用知识图谱去更好的解决现实生活中的实际问题;
知识图谱的构建需要基于特定的知识表示模型,利用几何学习和信息抽取等技术,从复杂的互联网信息中进行抽取出有利用价值的信息,并作为知识图谱的数据来源,从而为知识图谱的构建提供数据参照,其核心技术为信息抽取和语义集成;影响知识图谱构建的因素有很多,其中主要的三个因素为:第一,从何处进行学习知识,根据什么样的数据资源进行学习,其中原始网页数据包括结构化、半结构化和非结构化三种数据,第二,学习的知识包括哪些内容,其中主要包括概念层次、事实知识、事件知识等;第三,需要采用何种学习方式来进行知识的获取;
知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性值,实体间通过关系相互连接,构成网状的知识结构。
综上所述,目前并没有一种具有针对性、实用性强、效率高的系统来辅助医生进行诊疗优化;而知识图谱从图形上描述了现实世界中的概念和实体之间的复杂关系,让互联网通过一种让人类更容易接受的认知世界的方式去传达信息,去组织、管理信息,也让人们能够更好的理解知识;知识图谱还可以结合大数据、深度学习等为我国的智能科技的发展做出巨大的贡献。
发明内容
本发明的目的在于提供一种基于医疗知识图谱的智能医疗数据管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:
一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述方法包括以下步骤:
S1、通过医疗大数据获取妇幼患者的信息;
S2、采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取;
S3、结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱;
S4、根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案。
进一步的,所述S1中通过医疗大数据获取妇幼患者的信息的方法包括以下步骤:
SA1、通过医疗大数据获取妇幼患者性别、年龄、疾病名称、诊断报告,并将获取的信息作为第一特征信息;
SA2、通过医疗大数据获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备,并将获取的信息作为第二特征信息。
进一步的,所述S2中采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取的方法包括以下步骤:
SB1、根据统计的方法对特征信息进行训练,通过训练样本得到隐马尔科夫模型参数,运用ML算法构建隐马尔科夫模型,并设定状态集合Q={妇幼患者性别、年龄、疾病名称、诊断报告}和观测事件集合V={妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备};
SB2、获取状态集合和观测事件集合中元素,并构建状态集合S对应的模型状态序列T,表达式为S={s1,s2,s3,...,sT},O={o1,o2,o3,...,oT},其中O表示对应训练序列的观测序列;
SB3、根据公式
Figure BDA0003982381280000031
对训练序列的初始概率和转移概率进行分块,其中Pi表示初始状态为i的概率,Pi→j表示从状态i转移到状态j的概率,Oi表示观测序列O中初始状态为i的序列个数,Oi→j表示观测序列O中,从状态i转移到状态j的次数;
SB4、根据公式
Figure BDA0003982381280000032
1≤j≤T,1≤S≤M得到输出释放概率,其中Si(Vj)表示观测序列O中,状态为i对应释放单词Vj的次数,M表示输出单词的值,即观测事件集合中的元素;
SB5、基于隐马尔科夫模型进行文本信息抽取,以观测序列O={o1,o2,o3,...,oT}作为模型的输入,采用Viterbi算法,找出最大概率的状态标签序列,被标记为目标状态标签的观察文本即为妇幼医疗知识抽取的内容,其中Viterbi算法是一种动态规划算法,用于寻找最有可能产生观测事件序列的维特比路径,可利用python实现Viterbi算法;
SB6、基于RNN关系抽取模型,针对每一个状态集合中元素的输入,通过词嵌入处理转换成固定维度的向量;
SB7、采用双向RNN层进行特征抽取,通过双向RNN建模输入序列的语义特征;
SB8、基于RNN层特征抽取,得到一个输出序列,即{b1,b2,b3,...,bt};
SB9、根据公式mi=MAX(bt)i1<i<LRNN得到状态为i的集合中元素经过处理后转换成固定维度的向量值,记为m,并通过softmax进行处理即可得到输出分类的结果,其中t表示序列的长度,LRNN表示RNN层的大小,当取t个特征向量中最大的值时,得到一个维度为M的向量m,用于表征输入序列。
本发明通过统计方法对设定的特征信息进行进行训练,通过训练样本得到隐马尔科夫模型参数,利用ML算法建立隐马尔科夫模型,通过设定状态集合和观测事件集合,根据公式对训练序列的初始概率和转移概率进行分块,最后基于隐马尔科夫模型实现文本信息抽取,其次基于RNN关系抽取模型,针对每一个输入词语,通过词嵌入进行转换成固定维度的向量,并采用双向RNN层进行特征抽取,通过双向RNN建模输入序列的语义特征,基于RNN层特征抽取,得到输出序列,并通过公式得到句向量m,将其结合softmax进行处理得到输出分类结果。
进一步的,所述S3中结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱的方法包括以下步骤:
SC1、根据SB1得到状态集合Q,并对其进行数据正规化处理,其中数据正规化处理主要对数据集中的数据进行归一化处理,提高后续链接精确度;
SC2、根据Dice系数公式进行集合相似度处理,得到属性相似度,表达式为:
Figure BDA0003982381280000051
SC3、根据CL算法进行实体层次聚类处理,以实现实体相似度处理,其中CL算法用于取两个类中距离最远的两个点的相似度作为两个类的相似度;
SC4、通过Hash函数从医疗大数据中选出潜在匹配的记录作为候选项,并将候选项的大小尽可能的缩小;
SC5、多次采用Map-Reduce操作进行负载均衡操作,直至所有块中的实体数目相当,从而保证分块对性能的提升程度;
SC6、通过Falcon-AO融合工具对本体进行匹配,Dedupe融合工具对实体进行匹配,完成知识融合,并生成医疗知识图谱,其中Falcon-AO融合工具是一个基于Java的自动本体匹配系统,已经成为RDF(S)和OWL所表达的Web本体相匹配的一种实用和流行的选择,Dedupe融合工具用于模糊匹配,记录去重和实体链接的Python库。
本发明根据设定的状态集合,进行数据正规化处理,并通过Dice系数公式进行集合相似度处理,得到属性相似度,再根据CL算法进行实体层次聚类处理,实现实体相似度处理,通过Hash函数从医疗大数据中选出潜在匹配的记录作为候选项,再多次采用Map-Reduce操作进行负载均衡操作,通过Falcon-AO融合工具对本体进行匹配,Dedupe融合工具对实体进行匹配,完成知识融合,并生成医疗知识图谱。
进一步的,所述S4中根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案的方法包括以下步骤:
SD1、获取妇幼患者诊断报告,并提取诊断报告中特征信息;
SD2、通过Bi-LSTM网络和CRF网络联合模型对提取的特征信息进行命名实体识别、关系识别和属性识别,并输出对应的实体识别结果;
SD3、根据输出的实体结果进行标签嵌入和关系抽取;
SD4、根据SD3得到标签嵌入和关系抽取结果;
SD5、对标签嵌入、关系抽取数据进行分析,并与医疗知识图谱进行数据匹配;
SD6、分析输入的患者诊断报告并结合医疗知识图谱进行数据匹配,针对匹配的结果,根据患者提供的诊断报告进行筛选,得出最佳诊疗方案,为医生提供参考依据。
本发明通过提取妇幼患者诊断报告中特征信息,通过Bi-LSTM网络和CRF网络联合模型对提取的特征信息进行命名实体识别、关系识别和属性识别,并输出对应的实体识别结果,根据输出的实体结果进行标签嵌入和关系抽取。
一种基于医疗知识图谱的智能医疗数据管理系统,其特征在于,所述系统包括数据获取模块、知识图谱构建模块、实体抽取模块以及辅助优化管理模块:
所述数据获取模块用于通过医疗大数据获取妇幼患者的信息;
所述知识图谱构建模块用于构建医疗知识图谱;
所述实体抽取模块根据妇幼患者信息,结合医疗知识图谱进行实体识别与关系抽取;
所述辅助优化管理模块用于对医疗病例、医学知识等进行智能管理,根据妇幼患者信息匹配最佳诊疗方案。
进一步的,所述数据获取模块包括第一特征单元和第二特征单元:
所述第一特征单元用于获取妇幼患者性别、年龄、疾病名称、诊断报告;
所述第二特征单元用于获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备。
进一步的,所述知识图谱构建模块包括实体抽取单元、关系抽取单元和属性抽取单元:
所述实体抽取单元用于基于医疗数据抽取妇幼患者疾病对应的知识单元;
所述关系抽取单元用于抽取两个实体之间存在的关联词;
所述属性抽取单元用于刻画医疗实体多方面的特性。
进一步的,所述实体抽取模块包括数据输入单元和神经网络单元:
所述数据输入单元用于通过人工输入妇幼患者信息以及患者症状,根据输入的信息生成文本;
所述神经网络单元由Bi-LSTM网络和CRF网络组成。
本发明通过运用ML算法构建隐马尔科夫模型,基于隐马尔可夫模型对医疗知识进行实体抽取,基于RNN关系抽取模型实现关系抽取,最后将得到的数据进行知识融合,构建医疗知识图谱,实现对妇幼医疗病例、妇幼医学知识进行智能管理,达到辅助医生优化诊疗方案的效果。
附图说明
图1是本发明一种基于医疗知识图谱的智能医疗数据管理系统的模块示意图。
图2是本发明一种基于医疗知识图谱的智能医疗数据管理方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中:一种基于医疗知识图谱的智能医疗数据管理系统及方法,所述医疗数据管理包括以下步骤:
一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述方法包括以下步骤:
S1、通过医疗大数据获取妇幼患者的信息;
S2、采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取;
S3、结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱;
S4、根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案。
所述S1中通过医疗大数据获取妇幼患者的信息的方法包括以下步骤:
SA1、通过医疗大数据获取妇幼患者性别、年龄、疾病名称、诊断报告,并将获取的信息作为第一特征信息;
SA2、通过医疗大数据获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备,并将获取的信息作为第二特征信息。
所述S2中采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取的方法包括以下步骤:
SB1、根据统计的方法对特征信息进行训练,通过训练样本得到隐马尔科夫模型参数,运用ML算法构建隐马尔科夫模型,并设定状态集合Q={妇幼患者性别、年龄、疾病名称、诊断报告}和观测事件集合V={妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备};
SB2、获取状态集合和观测事件集合中元素,并构建状态集合S对应的模型状态序列T,表达式为S={s1,s2,s3,...,sT},O={o1,o2,o3,...,oT},其中O表示对应训练序列的观测序列;
SB3、根据公式
Figure BDA0003982381280000081
对训练序列的初始概率和转移概率进行分块,其中Pi表示初始状态为i的概率,Pi→j表示从状态i转移到状态j的概率,Oi表示观测序列O中初始状态为i的序列个数,Oi→j表示观测序列O中,从状态i转移到状态j的次数;
SB4、根据公式
Figure BDA0003982381280000091
1≤j≤T,1≤S≤M得到输出释放概率,其中Si(Vj)表示观测序列O中,状态为i对应释放单词Vj的次数,M表示输出单词的值,即观测事件集合中的元素;
SB5、基于隐马尔科夫模型进行文本信息抽取,以观测序列O={o1,o2,o3,...,oT}作为模型的输入,采用Viterbi算法,找出最大概率的状态标签序列,被标记为目标状态标签的观察文本即为妇幼医疗知识抽取的内容,其中Viterbi算法是一种动态规划算法,用于寻找最有可能产生观测事件序列的维特比路径,可利用python实现Viterbi算法;
SB6、基于RNN关系抽取模型,针对每一个状态集合中元素的输入,通过词嵌入处理转换成固定维度的向量;
SB7、采用双向RNN层进行特征抽取,通过双向RNN建模输入序列的语义特征;
SB8、基于RNN层特征抽取,得到一个输出序列,即{b1,b2,b3,...,bt};
SB9、根据公式mi=MAX(bt)i1<i<LRNN得到状态为i的集合中元素经过处理后转换成固定维度的向量值,记为m,并通过softmax进行处理即可得到输出分类的结果,其中t表示序列的长度,LRNN表示RNN层的大小,当取t个特征向量中最大的值时,得到一个维度为M的向量m,用于表征输入序列。
所述S3中结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱的方法包括以下步骤:
SC1、根据SB1得到状态集合Q,并对其进行数据正规化处理,其中数据正规化处理主要对数据集中的数据进行归一化处理,提高后续链接精确度;
SC2、根据Dice系数公式进行集合相似度处理,得到属性相似度,表达式为:
Figure BDA0003982381280000092
SC3、根据CL算法进行实体层次聚类处理,以实现实体相似度处理,其中CL算法用于取两个类中距离最远的两个点的相似度作为两个类的相似度;
SC4、通过Hash函数从医疗大数据中选出潜在匹配的记录作为候选项,并将候选项的大小尽可能的缩小;
SC5、多次采用Map-Reduce操作进行负载均衡操作,直至所有块中的实体数目相当,从而保证分块对性能的提升程度;
SC6、通过Falcon-AO融合工具对本体进行匹配,Dedupe融合工具对实体进行匹配,完成知识融合,并生成医疗知识图谱,其中Falcon-AO融合工具是一个基于Java的自动本体匹配系统,已经成为RDF(S)和OWL所表达的Web本体相匹配的一种实用和流行的选择,Dedupe融合工具用于模糊匹配,记录去重和实体链接的Python库。
所述S4中根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案的方法包括以下步骤:
SD1、获取妇幼患者诊断报告,并提取诊断报告中特征信息;
SD2、通过Bi-LSTM网络和CRF网络联合模型对提取的特征信息进行命名实体识别、关系识别和属性识别,并输出对应的实体识别结果;
SD3、根据输出的实体结果进行标签嵌入和关系抽取;
SD4、根据SD3得到标签嵌入和关系抽取结果;
SD5、对标签嵌入、关系抽取数据进行分析,并与医疗知识图谱进行数据匹配;
SD6、分析输入的患者诊断报告并结合医疗知识图谱进行数据匹配,针对匹配的结果,根据患者提供的诊断报告进行筛选,得出最佳诊疗方案,为医生提供参考依据。
一种基于医疗知识图谱的智能医疗数据管理系统,其特征在于,所述系统包括数据获取模块、知识图谱构建模块、实体抽取模块以及辅助优化管理模块:
所述数据获取模块用于通过医疗大数据获取妇幼患者的信息;
所述知识图谱构建模块用于构建医疗知识图谱;
所述实体抽取模块用于根据妇幼患者信息,结合医疗知识图谱进行实体识别与关系抽取;
所述辅助优化管理模块用于对医疗病例、医学知识等进行智能管理,根据妇幼患者信息匹配最佳诊疗方案。
所述数据获取模块包括第一特征单元和第二特征单元:
所述第一特征单元用于获取妇幼患者性别、年龄、疾病名称、诊断报告;
所述第二特征单元用于获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备。
所述知识图谱构建模块包括实体抽取单元、关系抽取单元和属性抽取单元:
所述实体抽取单元基于医疗数据抽取妇幼患者疾病对应的知识单元;
所述关系抽取单元用于抽取两个实体之间存在的关联词;
所述属性抽取单元用于刻画医疗实体多方面的特性。
所述实体抽取模块包括数据输入单元和神经网络单元:
所述数据输入单元用于通过人工输入妇幼患者信息以及患者症状,根据输入的信息生成文本;
所述神经网络单元由Bi-LSTM网络和CRF网络组成。
本实施例中,根据构建医疗知识图谱,医生根据妇幼患者提供的特征信息,通过人工输入患者第一特征信息:性别、年龄、疾病名称以及诊断报告,第二特征信息:患者疾病伴随症状、检查报告,系统根据Dice系数公式进行属性相似度匹配,通过医疗知识图谱抽取相似症状的概念信息,辅助医生优化诊疗方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述方法包括以下步骤:
S1、通过医疗大数据获取妇幼患者的信息;
S2、采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取;
S3、结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱;
S4、根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案。
2.根据权利要求1所述一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述S1中通过医疗大数据获取妇幼患者的信息的方法包括以下步骤:
SA1、通过医疗大数据获取妇幼患者性别、年龄、疾病名称、诊断报告,并将获取的信息作为第一特征信息;
SA2、通过医疗大数据获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备,并将获取的信息作为第二特征信息。
3.根据权利要求2所述一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述S2中采用机器学习技术,根据获取的妇幼患者的信息进行实体抽取、关系抽取和属性抽取的方法包括以下步骤:
SB1、根据统计的方法对特征信息进行训练,通过训练样本得到隐马尔科夫模型参数,运用ML算法构建隐马尔科夫模型,并设定状态集合Q={妇幼患者性别、年龄、疾病名称、诊断报告}和观测事件集合V={妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备};
SB2、获取状态集合和观测事件集合中元素,并构建状态集合S对应的模型状态序列T,表达式为S={s1,s2,s3,...,sT},O={o1,o2,o3,...,oT},其中O表示对应训练序列的观测序列;
SB3、根据公式
Figure FDA0003982381270000021
对训练序列的初始概率和转移概率进行分块,其中Pi表示初始状态为i的概率,Pi→j表示从状态i转移到状态j的概率,Oi表示观测序列O中初始状态为i的序列个数,Oi→j表示观测序列O中,从状态i转移到状态j的次数;
SB4、根据公式
Figure FDA0003982381270000022
得到输出释放概率,其中Si(Vj)表示观测序列O中,状态为i对应释放单词Vj的次数,M表示输出单词的值,即观测事件集合中的元素;
SB5、基于隐马尔科夫模型进行文本信息抽取,以观测序列O={o1,o2,o3,...,oT}作为模型的输入,采用Viterbi算法,找出最大概率的状态标签序列,被标记为目标状态标签的观察文本即为妇幼医疗知识抽取的内容;
SB6、基于RNN关系抽取模型,针对每一个状态集合中元素的输入,通过词嵌入处理转换成固定维度的向量;
SB7、采用双向RNN层进行特征抽取,通过双向RNN建模输入序列的语义特征;
SB8、基于RNN层特征抽取,得到一个输出序列,即{b1,b2,b3,...,bt};
SB9、根据公式mi=MAX(bt)i1<i<LRNN得到状态为i的集合中元素经过处理后转换成固定维度的向量值,记为m,并通过softmax进行处理即可得到输出分类的结果,其中t表示序列的长度,LRNN表示RNN层的大小。
4.根据权利要求3所述一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述S3中结合实体抽取、关系抽取和属性抽取的内容进行知识融合,并构建医疗知识图谱的方法包括以下步骤:
SC1、根据SB1得到状态集合Q,并对其进行数据正规化处理;
SC2、根据Dice系数公式进行集合相似度处理,得到属性相似度,表达式为:
Figure FDA0003982381270000031
SC3、根据CL算法进行实体层次聚类处理,以实现实体相似度处理;
SC4、通过Hash函数从医疗大数据中选出潜在匹配的记录作为候选项;
SC5、多次采用Map-Reduce操作进行负载均衡操作,直至所有块中的实体数目相当;
SC6、通过Falcon-AO融合工具对本体进行匹配,Dedupe融合工具对实体进行匹配,完成知识融合,并生成医疗知识图谱。
5.根据权利要求4所述一种基于医疗知识图谱的智能医疗数据管理方法,其特征在于,所述S4中根据患者信息,结合医疗知识图谱进行实体识别与关系抽取,匹配最佳诊疗方案的方法包括以下步骤:
SD1、获取妇幼患者诊断报告,并提取诊断报告中特征信息;
SD2、通过Bi-LSTM网络和CRF网络联合模型对提取的特征信息进行命名实体识别、关系识别和属性识别,并输出对应的实体识别结果;
SD3、根据输出的实体结果进行标签嵌入和关系抽取;
SD4、根据SD3得到标签嵌入和关系抽取结果;
SD5、对标签嵌入、关系抽取数据进行分析,并与医疗知识图谱进行数据匹配;
SD6、分析输入的患者诊断报告并结合医疗知识图谱进行数据匹配,针对匹配的结果,根据患者提供的诊断报告进行筛选,得出最佳诊疗方案,为医生提供参考依据。
6.一种基于医疗知识图谱的智能医疗数据管理系统,其特征在于,所述系统包括数据获取模块、知识图谱构建模块、实体抽取模块以及辅助优化管理模块:
所述数据获取模块用于通过医疗大数据获取妇幼患者的信息;
所述知识图谱构建模块用于构建医疗知识图谱;
所述实体抽取模块用于根据妇幼患者信息,结合医疗知识图谱进行实体识别与关系抽取;
所述辅助优化管理模块用于对医疗病例、医学知识等进行智能管理,根据妇幼患者信息匹配最佳诊疗方案。
7.根据权利要求6所述一种基于医疗知识图谱的智能医疗数据管理系统及方法,其特征在于,所述数据获取模块包括第一特征单元和第二特征单元:
所述第一特征单元用于获取妇幼患者性别、年龄、疾病名称、诊断报告;
所述第二特征单元用于获取妇幼患者疾病伴随症状、检查报告、药物配方、手术名词以及医疗设备。
8.根据权利要求6所述一种基于医疗知识图谱的智能医疗数据管理系统及方法,其特征在于,所述知识图谱构建模块包括实体抽取单元、关系抽取单元和属性抽取单元:
所述实体抽取单元基于医疗数据抽取妇幼患者疾病对应的知识单元;
所述关系抽取单元用于抽取两个实体之间存在的关联词;
所述属性抽取单元用于刻画医疗实体多方面的特性。
9.根据权利要求6所述一种基于医疗知识图谱的智能医疗数据管理系统及方法,其特征在于,所述实体抽取模块包括数据输入单元和神经网络单元:
所述数据输入单元用于通过人工输入妇幼患者信息以及患者症状,根据输入的信息生成文本;
所述神经网络单元由Bi-LSTM网络和CRF网络组成。
CN202211554252.XA 2022-12-06 2022-12-06 一种基于医疗知识图谱的智能医疗数据管理系统及方法 Pending CN115831380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211554252.XA CN115831380A (zh) 2022-12-06 2022-12-06 一种基于医疗知识图谱的智能医疗数据管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211554252.XA CN115831380A (zh) 2022-12-06 2022-12-06 一种基于医疗知识图谱的智能医疗数据管理系统及方法

Publications (1)

Publication Number Publication Date
CN115831380A true CN115831380A (zh) 2023-03-21

Family

ID=85544183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211554252.XA Pending CN115831380A (zh) 2022-12-06 2022-12-06 一种基于医疗知识图谱的智能医疗数据管理系统及方法

Country Status (1)

Country Link
CN (1) CN115831380A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117476218A (zh) * 2023-12-27 2024-01-30 长春中医药大学 一种基于临床知识图谱的中医妇科护理辅助决策系统
CN118571470A (zh) * 2024-08-05 2024-08-30 长春中医药大学 一种妇科患者在围手术期发生并发症的诊断辅助方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117476218A (zh) * 2023-12-27 2024-01-30 长春中医药大学 一种基于临床知识图谱的中医妇科护理辅助决策系统
CN117476218B (zh) * 2023-12-27 2024-03-08 长春中医药大学 一种基于临床知识图谱的中医妇科护理辅助决策系统
CN118571470A (zh) * 2024-08-05 2024-08-30 长春中医药大学 一种妇科患者在围手术期发生并发症的诊断辅助方法

Similar Documents

Publication Publication Date Title
CN109299239B (zh) 一种基于es的电子病历检索方法
CN112786194B (zh) 基于人工智能的医学影像导诊导检系统、方法及设备
CN111192680B (zh) 一种基于深度学习和集成分类的智能辅助诊断方法
CN111414393B (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
RU2703679C2 (ru) Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов
CN106682411A (zh) 一种将体检诊断数据转化为疾病标签的方法
CN111191048A (zh) 基于知识图谱的急诊问答系统构建方法
CN115831380A (zh) 一种基于医疗知识图谱的智能医疗数据管理系统及方法
CN113764112A (zh) 一种在线医疗问答方法
Gudivada et al. A literature review on machine learning based medical information retrieval systems
CN109360658A (zh) 一种基于词向量模型的疾病模式挖掘方法及装置
Vidal et al. Semantic data integration techniques for transforming big biomedical data into actionable knowledge
CN114496231B (zh) 基于知识图谱的体质识别方法、装置、设备和存储介质
WO2019132686A1 (ru) Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта
CN114780738A (zh) 基于不同应用场景的医学影像检查项目名称标准化方法及系统
CN115248842A (zh) 一种基于知识图谱与检索引擎的icd智能编码的系统
CN113343680A (zh) 一种基于多类型病历文本的结构化信息提取方法
CN116737945B (zh) 一种患者emr知识图谱映射方法
Saigaonkar et al. Predicting chronic diseases using clinical notes and fine-tuned transformers
Saeed et al. Developing a software for diagnosing heart disease via data mining techniques
Zubke et al. Using openEHR archetypes for automated extraction of numerical information from clinical narratives
CN110289065A (zh) 一种辅助生成医学电子报告的控制方法以及装置
WO2015155588A2 (es) Método de priorización de historias clínicas electrónicas para estudios retrospectivos
Lal et al. Learning Disease representations from Discharge Summaries
Feng et al. Extracting meaningful correlations among heterogeneous datasets for medical question answering with domain knowledge

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination