CN108922634A - 基于在线问诊的问题答复处理方法、装置和计算机设备 - Google Patents
基于在线问诊的问题答复处理方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN108922634A CN108922634A CN201810606392.4A CN201810606392A CN108922634A CN 108922634 A CN108922634 A CN 108922634A CN 201810606392 A CN201810606392 A CN 201810606392A CN 108922634 A CN108922634 A CN 108922634A
- Authority
- CN
- China
- Prior art keywords
- user
- vector
- doctor
- text
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 239000013598 vector Substances 0.000 claims abstract description 129
- 238000004891 communication Methods 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims description 41
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 20
- 238000012512 characterization method Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 17
- 210000005036 nerve Anatomy 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 206010019233 Headaches Diseases 0.000 description 2
- 231100000869 headache Toxicity 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 206010029421 Nipple pain Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种基于在线问诊的问题答复处理方法、装置和计算机设备。所述方法包括:接收用户终端上传的问诊请求;所述问诊请求携带了用户标识;根据所述问诊请求为所述用户标识分配对应的医生,建立所述用户终端与医生终端之间的通信连接;监听所述用户终端与所述医生终端之间的通信信息;在所述通信信息中监听到用户提问时,计算所述用户提问对应的文本向量;获取样本问题对应的文本向量,将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配,在所述样本问题中筛选出与所述用户提问匹配的多个推荐问题和推荐答案;将多个推荐问题和推荐答案发送至对应的医生终端。采用本方法能够有效的缩短答复用户提问的耗时,提高答复准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于在线问诊的问题答复处理方法、装置、计算机设备和存储介质。
背景技术
通过在线问诊平台可以方便用户就疾病问题在线向医生咨询。用户提出问题之后,期望能够得到医生及时的答复。而医生在看到用户的提问之后,需要经过谨慎地思考再手动输入答复内容。如果用户的问题较为复杂,医生答复的时间可能会较长。由于用户提出的问题存在大量相似的以及重复的,在常见的方式中,利用用户提出的大量问题以及医生答复建立常见问题库,当医生在收到用户的提问时,可以在常见问题库中检索合适的问题,将相应的答复内容发送给用户,以便缩短医生答复用户提问的耗时。
但是这种方式检索得到的问题与用户实际提出的问题可能并不匹配。比如,检索与“头疼”相关的问题,可能检索到的是“乳头疼怎么办”。这种情况下,可能需要重复检索或者医生手动输入答复内容。因此,如何有效的缩短答复用户提问的耗时,提高答复准确性成为目前需要解决的一个技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效的缩短答复用户提问的耗时,提高答复准确性的基于在线问诊的问题答复处理方法、装置、计算机设备和存储介质。
一种基于在线问诊的问题答复处理方法,所述方法包括:
接收用户终端上传的问诊请求;所述问诊请求携带了用户标识;
根据所述问诊请求为所述用户标识分配对应的医生,建立所述用户终端与医生终端之间的通信连接;
监听所述用户终端与所述医生终端之间的通信信息;
在所述通信信息中监听到用户提问时,计算所述用户提问对应的文本向量;
获取样本问题对应的文本向量,将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配,在所述样本问题中筛选出与所述用户提问匹配的多个推荐问题和推荐答案;
将多个推荐问题和推荐答案发送至对应的医生终端。
在其中一个实施例中,所述根据所述问诊请求为所述用户标识分配对应的医生包括:
根据所述用户标识获取多种用户信息;
对所述用户信息进行向量化处理,得到多维向量矩阵;
通过第一神经网络模型基于所述多维向量矩阵进行预测运算,得到与所述用户标识对应的科室;
根据所述科室向所述用户标识分配对应的医生。
在其中一个实施例中,所述计算所述用户提问对应的文本向量包括:
对所述用户提问进行预处理,得到预处理后的文本;
调用第二神经网络模型,所述第二神经网络模型包括LSTM以及全连接层;
通过所述LSTM对预处理后的文本进行运算,得到表征向量;
通过所述全连接层对所述表征向量进行转换,得到与所述用户提问对应的文本向量。
在其中一个实施例中,所述LSTM包括遗忘门、输入门和输出门,所述通过所述LSTM对预处理后的文本进行运算包括:
当获取到当前时刻的预处理后的文本时,通过遗忘门对上一时刻的预处理后的文本进行遗忘处理;
在所述遗忘门进行遗忘处理时,通过所述输入门对当前时刻输入的预处理后的文本进行更新;
通过输出门对遗忘处理后得到的文本以及更新得到的文本进行运算,得到与用户提问对应的表征向量。
在其中一个实施例中,所述将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配包括:
计算所述用户提问对应的文本向量与多个样本问题对应的文本向量之间的相似度;
当所述相似度达到阈值时,将所述相似度对应的样本问题标记为待推荐问题;
在多个待推荐问题中进行筛选,将筛选出的预设数量的待推荐问题标记为与所述用户提问对应的推荐问题。
一种基于在线问诊的问题答复处理装置,所述装置包括:
通信模块,用于接收用户终端上传的问诊请求;所述问诊请求携带了用户标识;
医生分配模块,用于根据所述问诊请求为所述用户标识分配对应的医生;
所述通信模块还用于建立所述用户终端与医生终端之间的通信连接;
监听模块,用于监听所述用户终端与所述医生终端之间的通信信息;
向量化处理模块,用于在所述通信信息中监听到用户提问时,计算所述用户提问对应的文本向量;
匹配模块,用于获取样本问题对应的文本向量,将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配,在所述样本问题中筛选出与所述用户提问匹配的多个推荐问题和推荐答案;
所述通信模块还用于将多个推荐问题和推荐答案发送至对应的医生终端。
在其中一个实施例中,所述问诊请求中携带了用户标识;所述装置还包括:
医生分配模块,用于根据所述用户标识获取多种用户信息;对所述用户信息进行向量化处理,得到多维向量矩阵;通过第一神经网络模型基于所述多维向量矩阵进行预测运算,得到与所述用户标识对应的科室;根据所述科室向所述用户标识分配对应的医生。
在其中一个实施例中,所述向量化处理模块还用于对所述用户提问进行预处理,得到预处理后的文本;调用第二神经网络模型,所述第二神经网络模型包括LSTM以及全连接层;通过所述LSTM对预处理后的文本进行运算,得到表征向量;通过所述全连接层对所述表征向量进行转换,得到与所述用户提问对应的文本向量。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
上述基于在线问诊的问题答复处理方法、装置、计算机设备和存储介质,当用户需要在线问诊时,可以根据问诊请求中携带的用户标识为用户分配相应的医生,建立用户终端与医生终端之间的通信连接,并且对用户终端与医生终端之间的通信信息进行监听。在所述通信信息中监听到用户提问时,计算所述用户提问对应的文本向量,将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配,在样本问题中筛选出与所述用户提问匹配的多个推荐问题和推荐答案,将多个推荐问题和推荐答案发送至对应的医生终端。由此能够使得在线问诊过程中,无需医生针对用户提问进行思考以及手动输入答案,可以直接从推荐问题中选择与用户提问最接近的推荐问题,将相应的推荐答案发送至用户终端。从而有效的缩短了答复用户提问的耗时。由于推荐问题是通过进行文本向量匹配得到的,推荐问题与用户提问相接近,利用推荐答案回复用户提问,有效提高了答复的准确性。
附图说明
图1为一个实施例中基于在线问诊的问题答复处理方法的应用场景图;
图2为一个实施例中基于在线问诊的问题答复处理方法的流程示意图;
图3为一个实施例中根据问诊请求为用户标识分配对应的医生步骤的流程示意图;
图4为一个实施例中将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配步骤的流程示意图;
图5为一个实施例中基于在线问诊的问题答复处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于在线问诊的问题答复处理方法,可以应用于如图1所示的应用环境中。其中,用户终端102通过网络与服务器104进行通信。医生终端106通过网络与服务器104进行通信其中,用户终端102以及医生终端106可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当用户希望在线咨询医生时,可以通过用户终端102向服务器104上传问诊请求。服务器104根据问诊请求,为用户分配相应的医生,建立用户终端102与医生终端106之间的通信连接。服务器104对用户终端与医生终端之间的通信信息进行监听。在监听过程中,如果识别到通信信息中存在用户提问,则计算用户提问对应的文本向量。服务器104上预设设立了问题库,问题库中包括多种样本问题。服务器104获取样本问题对应的文本向量,将用户提问对应的文本向量与样本问题对应的文本向量进行匹配,在样本问题中筛选出与用户提问匹配的多个推荐问题和推荐答案。服务器104将多个推荐问题和推荐答案发送至对应的医生终端106。医生通过医生终端106在多个推荐问题中选择与用户提问最接近的推荐问题以及推荐答案,将选择出的推荐答案发送至用户终端102。
在一个实施例中,如图2所示,提供了一种基于在线问诊的问题答复处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,接收用户终端上传的问诊请求;问诊请求携带了用户标识。
步骤204,根据问诊请求为用户标识分配对应的医生,建立用户终端与医生终端之间的通信连接。
用户终端上安装了在线问诊的应用程序。在登录该应用程序之前,用户需要进行注册。注册信息中包含了用户标识、性别等基本信息。当用户希望在线咨询医生时,可以点击应用程序中的问诊按钮,生成问诊请求,通过应用程序向服务器发送问诊请求。服务器接收用户终端上传的问诊请求,调用第一神经网络模型,通过第一神经网络模型为用户分配科室。服务器根据科室为用户分配相应的医生。服务器建立用户终端与医生终端之间的通信连接。
步骤206,监听用户终端与医生终端之间的通信信息。
在用户终端与医生终端之间建立通信连接之后,用户通过用户终端输入主诉信息。主诉信息中包括了与用户症状相关的内容。用户终端将主诉信息发送至医生终端。医生可以通过医生终端向用户进行提问,以便了解用户的详细情况。用户也可以通过用户终端向医生终端发送提问。在用户终端与医生终端之间进行实时通信时,服务器可以通过监听脚本对用户终端与医生终端之间的通信信息进行监听,以便自动识别出用户提问。
步骤208,在通信信息中识别到用户提问时,计算用户提问对应的文本向量。
用户终端与医生终端之间进行通信时,来自用户终端的通信信息中可以携带了用户标识或者终端标识。来自医生终端的通信信息中可以携带了医生标识或者医生终端标识。服务器对用户终端与医生终端之间的通信信息进行监听时,可以识别通信信息中是否存在用户提问。具体的,服务器可以根据预设字符或预设字符串对监听到的通信信息进行匹配,若在监听到的通信信息中识别出存在预设字符或预设字符串,且该通信信息来自用户终端,则服务器将该条通信信息标记为用户提问。例如,预设字符为“?”,预设字符串为“怎么”、“如何”等。监听到的其中一条通信信息为“最近一直头疼该怎么治疗呢”,服务器在该通信信息中识别出了预设字符串“怎么”,且该通信信息中携带了用户标识,表示该信息来源于客户终端,则服务器可以将该条通信信息标记为用户提问。
服务器调用第二神经网络模型,通过第二神经网络模型计算用户提问对应的文本向量。用户提问对应的文本向量也可以称为提问向量。
步骤210,获取样本问题对应的文本向量,将用户提问对应的文本向量与样本问题对应的文本向量进行匹配,在样本问题中筛选出与用户提问匹配的多个推荐问题和推荐答案。
步骤212,将多个推荐问题和推荐答案发送至对应的医生终端。
服务器上预设设立了问题库,问题库中包括科室、样本问题以及对应的样本答案。每个科室可以对应多个样本问题。每个样本问题都具有对应的样本答案。
服务器可以在问题库中获取多个样本问题,通过第二神经网络模型计算每个样本问题对应的文本向量。其中,样本问题对应的文本向量也可以称为样本向量。为了有效提高匹配效率,服务器可以预先通过第二神经网络模型计算问题库中每个样本问题的样本向量。
服务器将提问向量与多个样本向量进行匹配,得到与用户提问相接近的多个样本问题。服务器将与用户提问相接近的多个样本问题可以标记为待推荐问题。服务器可以从多个待推荐问题中筛选得到向医生推荐的样本问题,即推荐问题。
服务器获取预设数量的推荐问题以及对应的推荐答案,将推荐问题和推荐答案发送至医生终端。医生通过医生终端在多个推荐问题中选择与用户提问最接近的推荐问题以及推荐答案,将选择出的推荐答案发送至用户终端。由此能够使得在线问诊过程中,无需医生针对用户提问进行思考以及手动输入答案,可以直接从推荐问题中选择与用户提问最接近的推荐问题,将相应的推荐答案发送至用户终端。
本实施例中,当用户需要在线问诊时,可以根据问诊请求中携带的用户标识为用户分配相应的医生,建立用户终端与医生终端之间的通信连接,并且对用户终端与医生终端之间的通信信息进行监听。在通信信息中监听到用户提问时,计算用户提问对应的文本向量,将用户提问对应的文本向量与样本问题对应的文本向量进行匹配,在样本问题中筛选出与用户提问匹配的多个推荐问题和推荐答案,将多个推荐问题和推荐答案发送至对应的医生终端。由此能够使得在线问诊过程中,无需医生针对用户提问进行思考以及手动输入答案,可以直接从推荐问题中选择与用户提问最接近的推荐问题,将相应的推荐答案发送至用户终端。从而有效的缩短了答复用户提问的耗时。由于推荐问题是通过进行文本向量匹配得到的,推荐问题与用户提问相接近,利用推荐答案回复用户提问,有效提高了答复的准确性。
在一个实施例中,如图3所示,根据问诊请求为用户标识分配对应的医生的步骤具体包括:
步骤302,根据用户标识获取多种用户信息;
步骤304,对用户信息进行向量化处理,得到多维向量矩阵;
步骤306,通过第一神经网络模型基于多维向量矩阵进行预测运算,得到与用户标识对应的科室;
步骤308,根据科室向用户标识分配对应的医生。
服务器接收用户终端上传的问诊请求时,服务器根据问诊请求中携带的用户标识获取多种用户信息,包括:主诉信息、基本信息、历史信息等。服务器接收到问诊请求时,向用户终端返回相应的问题。用户可以通过用户终端回答这些问题。用户在回答这些问题时,可以描述与当前症状相关的内容。用户终端将用户的回答上传至服务器,服务器将其标记为主诉信息。服务器在收集用户标识对应的主诉信息的同时,还会并行收集相应的基本信息和历史信息。基本信息可以是用户注册应用程序时,通过用户终端上传至服务器的信息,包括:年龄、性别等。不同年龄或者不同性别的用户,有可能主诉信息存在相似之处,但在问诊时需要分配至不同的科室。历史信息包括用户通过应用程序进行在线问诊的历史记录、现在诊疗机构的诊疗记录等。由于用户复诊时通常会进入与初诊时相同的科室,如果用户本次在线问诊为复诊,则进入同一科室的概率就会较高。因此用户的历史信息能够有助于提高科室分配的准确性。
服务器对收集到的多种用户信息进行向量进行转换,得到与主诉信息、基本信息以及历史信息分部对应的多维向量矩阵。服务器将多个多维向量矩阵进行合并,生成第一神经网络模型对应的输入向量矩阵。服务器调用第一神经网络模型,将输入向量矩阵作为第一神经网络模型的输入,第一神经网络模型进行运算,预测该多维向量矩阵对应的科室的概率。服务器可以将概率最高的科室作为用户标识对应的科室,并将该科室确定为向用户标识分配的科室。获取服务器将概率从高到低排序,将预设数量(如2个或3个)科室确定为向用户标识分配的科室。服务器根据分配的科室选择相应的医生,将医生分配至用户。
本实施例中,当用户需要在线问诊时,无需手动选择科室,通过第一神经网络模型基于多维向量矩阵进行预测运算,可以自动且准确地为用户分配科室,从而能够为每位用户分配与其症状相适应的医生。
在一个实施例中,计算用户提问对应的文本向量包括:对用户提问进行预处理,得到预处理后的文本;调用第二神经网络模型,第二神经网络模型包括LSTM以及全连接层;通过LSTM对预处理后的文本进行运算,得到表征向量;通过全连接层对表征向量进行转换,得到与用户提问对应的文本向量。
服务器为用户分配相应的科室以及相应的医生之后,服务器建立用户终端与医生终端之间的通信连接。医生可以通过医生终端向用户终端发送问题,以便进一步了解用户的症状。用户也可以通过用户终端向医生提问。
服务器对用户提问进行预处理。预处理包括:分词、去停用词、繁转简等。其中,分词是指对一个句子分割成分词。去停用词是指去掉“恩”“啊”之类对语义理解无意义的词语。繁转简是指如果是香港、澳门、台湾地区的用户采用了繁体中文输入,则将其输入的用户信息转换为简体中文。
服务器上预先建立了第二神经网络模型,第二神经网络模型可以是预先基于问题库经过深度学习得到的。在预处理完成之后,服务器调用第二神经网络模型,通过第二神经网络模型对预处理之后的用户提问进行向量化处理。
在用户终端与医生终端之间进行通信时,用户提问的内容可能与之前的时间距离很长的内容相关。也就是说,用户提问时,提问的内容需要结合上下文进行识别。基于此,第二神经网络模型采用LSTM(Long Short-Term Memory,长短期记忆网络)以及全连接层来搭建。LSTM可以识别用户终端输入的两个句子是否在语义上相关。为了准确识别两个句子是否存在语义上相关,需要对一些用户终端输入的上下文之间不相关的信息以及冗余信息进行丢弃。为了得到准确的运算结果,LSTM也需要对用户提问的内容进行更新,以便预测得到准确的结果。例如,用户的性别对诊疗判断很重要。用户在注册时填写的性别信息可能是随意的,那么医生在给出专业的回答之前,就需要对性别再次进行确认。如果只丢弃了初始的性别信息或者只添加新的性别信息,都会对输出结果造成负面影响。
LSTM包括遗忘门、输入门和输出门。其中,遗忘门可以对不相关的信息以及冗余信息进行丢弃,也就决定了上一时刻的提问内容有多少可以保留到当前时刻。输入门可以对用户提问的内容进行更新,也就是决定了当前时刻输入的提问内容有多少可以保存。输出门可以控制有多少提问内容可以输出到LSTM的当前输出值。
在传统的方式中,LSTM首先通过遗忘门决定哪些提问内容被丢弃,即被遗忘。在遗忘之后,再通过输入门对用户提问的内容进行更新。接着再通过输出门进行输出。但是这种方式得到输出结果,准确率较低。为了有效提高输出结果的准确率,可以对传统方式中的LSTM进行优化。
在其中一个实施例中,通过LSTM对预处理后的文本进行运算包括:当获取到当前时刻的预处理后的文本时,通过遗忘门对上一时刻的预处理后的文本进行遗忘处理;在遗忘门进行遗忘处理时,通过输入门对当前时刻输入的预处理后的文本进行更新;通过输出门对遗忘处理后得到的文本以及更新得到的文本进行运算,得到与用户提问对应的表征向量。
通过对传统LSTM进行优化,在输入当前时刻的提问内容时,可以同时对上一时刻的用户提问进行遗忘以及对当前时刻的用户提问进行更新。由此能够对遗忘门的遗忘处理以及输入门的更新处理进行综合考虑,有效提高了输出结果的准确率。从而对后续预测样本问题的准确度也有了一定程度的提升。
LSTM中配置了多项参数,其中包括,遗忘门的权重矩阵和偏置项、输入门的权重矩阵和偏置项、输出门的权重矩阵和偏置项等。
当大量的用户同时进行在线问诊时,LSTM面临的运算量是巨大的。为了有效简化运算量,提高处理速度,本实施例中,还可以对LSTM进一步进行优化。可以为遗忘门的参数与输出门设置相同的参数。即遗忘门的权重矩阵与输出门的权重矩阵相同,遗忘门的偏置项与输出门的偏置项相同,可以使得遗忘门与输出门可以采用同样的公式进行运算。由此能够有效简化运算量,提高处理速度。
第二神经网络中的LSTM可以对多个时刻的输出计算相应的平均值,作为用户提问的表征向量。通过第二神经网络模型中的全连接层对表征向量进行转换,从而得到与用户提问对应的文本向量。通过对用户提问的文本向量与样本文本对应的文本向量进行匹配,可以可得相应的待推荐问题。由于文本向量的处理效率得到了提升,因此也促进了匹配效率的提升,从而能够实现快速向医生进行样本问题推荐。
在一个实施例中,如图4所示,将用户提问对应的文本向量与样本问题对应的文本向量进行匹配包括:
步骤402,计算用户提问对应的文本向量与多个样本问题对应的文本向量之间的相似度;
步骤404,当相似度达到阈值时,将相似度对应的样本问题标记为待推荐问题;
步骤406,在多个待推荐问题中进行筛选,将筛选出的预设数量的待推荐问题标记为与用户提问对应的推荐问题。
用户提问对应的文本向量可以称为提问向量,样本问题对应的文本向量可以称为样本向量。服务器可以在接收到问诊请求之后,对用户提问计算相应的提问向量,以及对问题库中的多个样本问题计算相应的样本向量。服务器也可以预先对问题库中所有样本问题进行向量化处理,将相应的样本向量存储在数据库中。
服务器在计算提问向量与多个样本向量之间的相似度,以此通过相似度对用户提问与样本问题进行匹配。其中,相似度可以是余弦相似度。当提问向量与样本向量之间的相似度达到阈值时,表示用户提问与样本问题可能相接近。服务器可以将相似度超过阈值的样本向量所对应的样本问题标记为待推荐问题。待推荐问题可以有多个,不同的用户提问对应的待推荐问题的数量可以相同,也可以不同。服务器可以根据待相似度对多个待推荐问题进行筛选,例如,可以按照相似度从高到低的顺序进行排序,从排序最高的开始筛选,得到预设数量的待推荐问题。筛选得到的也可以称为推荐问题。
服务器获取预设数量的推荐问题以及对应的推荐答案,将推荐问题和推荐答案发送至医生终端。医生终端在多个推荐问题中选择与用户提问最接近的推荐问题以及推荐答案,将选择出的推荐答案发送至用户终端。由此能够使得在线问诊过程中,无需医生针对用户提问进行思考以及手动输入答案,可以直接从推荐问题中选择与用户提问最接近的推荐问题,将相应的推荐答案发送至用户终端。
为了有效提高用户提问与样本问题进行匹配的效率,可以对匹配过程中的运算量进行简化。具体的,服务器在接收到用户终端上传的问诊请求之后,可以为用户分配相应的科室,继而在科室中选择相应的医生分配给用户。当服务器监听到用户终端与医生终端之间的通信信息中存在用户提问时,服务器可以为用户提问添加科室信息。在对用户提问进行预处理,预处理后的文本中包含了相应的科室信息。当服务器调用第二神经网络模型对用户提问进行向量化处理时,可以是对包含科室信息的预处理后的文本进行向量化处理。由此得到的表征向量以及文本向量中都包含了与科室维度。
当服务器对用户提问与样本问题进行匹配时,由于用户提问对应的文本向量(即提问向量)中包含了科室维度,因此服务器可以根据科室维度,在相同科室中选择样本问题对应的样本向量进行匹配。从而在不需要进行降维处理的情况下,有效简化了运算量,显著提升了用户提问与样本问题进行匹配的效率。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种基于在线问诊的问题答复处理装置,包括:通信模块502、医生分配模块504、监听模块506、向量化处理模块508和匹配模块510,其中:
通信模块502,用于接收用户终端上传的问诊请求;问诊请求携带了用户标识。
医生分配模块504,用于根据问诊请求为用户标识分配对应的医生。
通信模块502还用于建立用户终端与医生终端之间的通信连接。
监听模块506,用于监听用户终端与医生终端之间的通信信息。
向量化处理模块508,用于在通信信息中监听到用户提问时,计算用户提问对应的文本向量。
匹配模块510,用于获取样本问题对应的文本向量,将用户提问对应的文本向量与样本问题对应的文本向量进行匹配,在样本问题中筛选出与用户提问匹配的多个推荐问题和推荐答案。
通信模块502还用于将多个推荐问题和推荐答案发送至对应的医生终端。
在一个实施例中,医生分配模块504还用于根据用户标识获取多种用户信息;对用户信息进行向量化处理,得到多维向量矩阵;通过第一神经网络模型基于多维向量矩阵进行预测运算,得到与用户标识对应的科室;根据科室向用户标识分配对应的医生。
在一个实施例中,向量化处理模块508还用于对用户提问进行预处理,得到预处理后的文本;调用第二神经网络模型,第二神经网络模型包括LSTM以及全连接层;通过LSTM对预处理后的文本进行运算,得到表征向量;通过全连接层对表征向量进行转换,得到与用户提问对应的文本向量。
在一个实施例中,LSTM包括遗忘门、输入门和输出门,向量化处理模块508还用于当获取到当前时刻的预处理后的文本时,通过遗忘门对上一时刻的预处理后的文本进行遗忘处理;在遗忘门进行遗忘处理时,通过输入门对当前时刻输入的预处理后的文本进行更新;通过输出门对遗忘处理后得到的文本以及更新得到的文本进行运算,得到与用户提问对应的表征向量。
在一个实施例中,匹配模块510还用于计算用户提问对应的文本向量与多个样本问题对应的文本向量之间的相似度;当相似度达到阈值时,将相似度对应的样本问题标记为待推荐问题;在多个待推荐问题中进行筛选,将筛选出的预设数量的待推荐问题标记为与用户提问对应的推荐问题。
关于基于在线问诊的问题答复处理装置的具体限定可以参见上文中对于基于在线问诊的问题答复处理方法的限定,在此不再赘述。上述基于在线问诊的问题答复处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本向量等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于在线问诊的问题答复处理方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述各个方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于在线问诊的问题答复处理方法,所述方法包括:
接收用户终端上传的问诊请求;所述问诊请求携带了用户标识;
根据所述问诊请求为所述用户标识分配对应的医生,建立所述用户终端与医生终端之间的通信连接;
监听所述用户终端与所述医生终端之间的通信信息;
在所述通信信息中监听到用户提问时,计算所述用户提问对应的文本向量;
获取样本问题对应的文本向量,将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配,在所述样本问题中筛选出与所述用户提问匹配的多个推荐问题和推荐答案;
将多个推荐问题和推荐答案发送至对应的医生终端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述问诊请求为所述用户标识分配对应的医生包括:
根据所述用户标识获取多种用户信息;
对所述用户信息进行向量化处理,得到多维向量矩阵;
通过第一神经网络模型基于所述多维向量矩阵进行预测运算,得到与所述用户标识对应的科室;
根据所述科室向所述用户标识分配对应的医生。
3.根据权利要求1所述的方法,其特征在于,所述计算所述用户提问对应的文本向量包括:
对所述用户提问进行预处理,得到预处理后的文本;
调用第二神经网络模型,所述第二神经网络模型包括LSTM以及全连接层;
通过所述LSTM对预处理后的文本进行运算,得到表征向量;
通过所述全连接层对所述表征向量进行转换,得到与所述用户提问对应的文本向量。
4.根据权利要求3所述的方法,其特征在于,所述LSTM包括遗忘门、输入门和输出门,所述通过所述LSTM对预处理后的文本进行运算包括:
当获取到当前时刻的预处理后的文本时,通过遗忘门对上一时刻的预处理后的文本进行遗忘处理;
在所述遗忘门进行遗忘处理时,通过所述输入门对当前时刻输入的预处理后的文本进行更新;
通过输出门对遗忘处理后得到的文本以及更新得到的文本进行运算,得到与用户提问对应的表征向量。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配包括:
计算所述用户提问对应的文本向量与多个样本问题对应的文本向量之间的相似度;
当所述相似度达到阈值时,将所述相似度对应的样本问题标记为待推荐问题;
在多个待推荐问题中进行筛选,将筛选出的预设数量的待推荐问题标记为与所述用户提问对应的推荐问题。
6.一种基于在线问诊的问题答复处理装置,其特征在于,所述装置包括:
通信模块,用于接收用户终端上传的问诊请求;所述问诊请求携带了用户标识;
医生分配模块,用于根据所述问诊请求为所述用户标识分配对应的医生;
所述通信模块还用于建立所述用户终端与医生终端之间的通信连接;
监听模块,用于监听所述用户终端与所述医生终端之间的通信信息;
向量化处理模块,用于在所述通信信息中监听到用户提问时,计算所述用户提问对应的文本向量;
匹配模块,用于获取样本问题对应的文本向量,将所述用户提问对应的文本向量与所述样本问题对应的文本向量进行匹配,在所述样本问题中筛选出与所述用户提问匹配的多个推荐问题和推荐答案;
所述通信模块还用于将多个推荐问题和推荐答案发送至对应的医生终端。
7.根据权利要求6所述的装置,其特征在于,所述医生分配模块还用于根据所述用户标识获取多种用户信息;对所述用户信息进行向量化处理,得到多维向量矩阵;通过第一神经网络模型基于所述多维向量矩阵进行预测运算,得到与所述用户标识对应的科室;根据所述科室向所述用户标识分配对应的医生。
8.根据权利要求6所述的装置,其特征在于,所述向量化处理模块还用于对所述用户提问进行预处理,得到预处理后的文本;调用第二神经网络模型,所述第二神经网络模型包括LSTM以及全连接层;通过所述LSTM对预处理后的文本进行运算,得到表征向量;通过所述全连接层对所述表征向量进行转换,得到与所述用户提问对应的文本向量。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810606392.4A CN108922634A (zh) | 2018-06-13 | 2018-06-13 | 基于在线问诊的问题答复处理方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810606392.4A CN108922634A (zh) | 2018-06-13 | 2018-06-13 | 基于在线问诊的问题答复处理方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108922634A true CN108922634A (zh) | 2018-11-30 |
Family
ID=64420525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810606392.4A Pending CN108922634A (zh) | 2018-06-13 | 2018-06-13 | 基于在线问诊的问题答复处理方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108922634A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635091A (zh) * | 2018-12-14 | 2019-04-16 | 上海钛米机器人科技有限公司 | 一种语义识别方法、装置、终端设备和存储介质 |
CN112035674A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 导诊数据获取方法、装置、计算机设备和存储介质 |
CN112699224A (zh) * | 2019-10-22 | 2021-04-23 | 中信百信银行股份有限公司 | 问答对话方法、装置、电子设备及计算机可读存储介质 |
CN112786176A (zh) * | 2021-02-22 | 2021-05-11 | 北京融威众邦电子技术有限公司 | 智能自助就诊方法、装置、计算机设备 |
CN113192500A (zh) * | 2020-01-29 | 2021-07-30 | 丰田自动车株式会社 | 代理装置、代理系统以及非暂时性记录介质 |
CN114944227A (zh) * | 2022-06-17 | 2022-08-26 | 平安科技(深圳)有限公司 | 皮肤病在线问诊方法、装置、系统、设备及介质 |
US11475068B2 (en) * | 2019-07-26 | 2022-10-18 | Beijing Boe Technology Development Co., Ltd. | Automatic question answering method and apparatus, storage medium and server |
US20230051306A1 (en) * | 2021-08-11 | 2023-02-16 | International Business Machines Corporation | Multi-user voice assistant with disambiguation |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653840A (zh) * | 2015-12-21 | 2016-06-08 | 青岛中科慧康科技有限公司 | 基于词句分布表示的相似病例推荐系统及相应的方法 |
CN106649561A (zh) * | 2016-11-10 | 2017-05-10 | 复旦大学 | 面向税务咨询业务的智能问答系统 |
CN106650261A (zh) * | 2016-12-22 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 智能问诊方法、装置和系统 |
CN106650789A (zh) * | 2016-11-16 | 2017-05-10 | 同济大学 | 一种基于深度lstm网络的图像描述生成方法 |
CN107247868A (zh) * | 2017-05-18 | 2017-10-13 | 深思考人工智能机器人科技(北京)有限公司 | 一种人工智能辅助问诊系统 |
CN108062303A (zh) * | 2017-12-06 | 2018-05-22 | 北京奇虎科技有限公司 | 垃圾短信的识别方法及装置 |
-
2018
- 2018-06-13 CN CN201810606392.4A patent/CN108922634A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653840A (zh) * | 2015-12-21 | 2016-06-08 | 青岛中科慧康科技有限公司 | 基于词句分布表示的相似病例推荐系统及相应的方法 |
CN106649561A (zh) * | 2016-11-10 | 2017-05-10 | 复旦大学 | 面向税务咨询业务的智能问答系统 |
CN106650789A (zh) * | 2016-11-16 | 2017-05-10 | 同济大学 | 一种基于深度lstm网络的图像描述生成方法 |
CN106650261A (zh) * | 2016-12-22 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 智能问诊方法、装置和系统 |
CN107247868A (zh) * | 2017-05-18 | 2017-10-13 | 深思考人工智能机器人科技(北京)有限公司 | 一种人工智能辅助问诊系统 |
CN108062303A (zh) * | 2017-12-06 | 2018-05-22 | 北京奇虎科技有限公司 | 垃圾短信的识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
包晓安 等: ""基于LSTM的智能家居机器学习系统预测模型研究"", 《浙江理工大学学报(自然科学版)》, vol. 39, no. 02 * |
包晓安 等: ""基于LSTM的智能家居机器学习系统预测模型研究"", 《浙江理工大学学报(自然科学版)》, vol. 39, no. 2 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635091A (zh) * | 2018-12-14 | 2019-04-16 | 上海钛米机器人科技有限公司 | 一种语义识别方法、装置、终端设备和存储介质 |
US11475068B2 (en) * | 2019-07-26 | 2022-10-18 | Beijing Boe Technology Development Co., Ltd. | Automatic question answering method and apparatus, storage medium and server |
CN112699224A (zh) * | 2019-10-22 | 2021-04-23 | 中信百信银行股份有限公司 | 问答对话方法、装置、电子设备及计算机可读存储介质 |
CN112699224B (zh) * | 2019-10-22 | 2024-05-17 | 中信百信银行股份有限公司 | 问答对话方法、装置、电子设备及计算机可读存储介质 |
CN113192500A (zh) * | 2020-01-29 | 2021-07-30 | 丰田自动车株式会社 | 代理装置、代理系统以及非暂时性记录介质 |
CN112035674A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 导诊数据获取方法、装置、计算机设备和存储介质 |
CN112035674B (zh) * | 2020-08-28 | 2023-05-23 | 康键信息技术(深圳)有限公司 | 导诊数据获取方法、装置、计算机设备和存储介质 |
CN112786176A (zh) * | 2021-02-22 | 2021-05-11 | 北京融威众邦电子技术有限公司 | 智能自助就诊方法、装置、计算机设备 |
US20230051306A1 (en) * | 2021-08-11 | 2023-02-16 | International Business Machines Corporation | Multi-user voice assistant with disambiguation |
US11830490B2 (en) * | 2021-08-11 | 2023-11-28 | International Business Machines Corporation | Multi-user voice assistant with disambiguation |
CN114944227A (zh) * | 2022-06-17 | 2022-08-26 | 平安科技(深圳)有限公司 | 皮肤病在线问诊方法、装置、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108922634A (zh) | 基于在线问诊的问题答复处理方法、装置和计算机设备 | |
CN112035674B (zh) | 导诊数据获取方法、装置、计算机设备和存储介质 | |
CN109065139A (zh) | 医疗随访方法、装置、计算机设备和存储介质 | |
CN112035611B (zh) | 目标用户推荐方法、装置、计算机设备和存储介质 | |
US11250951B2 (en) | Feature engineering method, apparatus, and system | |
CN111914562B (zh) | 电子信息分析方法、装置、设备及可读存储介质 | |
CN109816220A (zh) | 基于智能决策的业务质量监控及处理方法和装置 | |
CN111444724A (zh) | 医疗问答对质检方法、装置、计算机设备和存储介质 | |
CN112287068A (zh) | 基于人工智能的问诊对话数据处理方法及装置 | |
CN115238173B (zh) | 基于大数据的行为分析与医疗服务推送方法、设备及介质 | |
CN112925888A (zh) | 一种问答响应及小样本文本匹配模型的训练方法和装置 | |
CN114974501A (zh) | 基于人工智能的药品推荐方法、装置、设备及存储介质 | |
CN114860887A (zh) | 基于智能联想的疾病内容推送方法、装置、设备及介质 | |
CN111415760B (zh) | 医生推荐方法、系统、计算机设备及存储介质 | |
CN116894498A (zh) | 网络模型的训练方法、策略识别方法、装置以及设备 | |
CN112925723B (zh) | 测试服务推荐方法、装置、计算机设备及存储介质 | |
CN109003193B (zh) | 投保风险预测方法、装置、计算机设备和存储介质 | |
WO2021139271A1 (zh) | 基于fm模型的医学热点的预测方法、装置和计算机设备 | |
CN117130938A (zh) | 基于知识图谱的测试案例的生成方法和装置 | |
CN113961811B (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
CN116525093A (zh) | 会话结束的预测方法、装置、设备及存储介质 | |
KR102306953B1 (ko) | 음성인식 기반 진료 지원 방법 | |
KR20220123160A (ko) | 인공지능 심리 상태 진단 시스템 및 방법 | |
CN112509713A (zh) | 网络交互、问诊交互及服务确定方法、装置、存储介质 | |
CN113434676A (zh) | 文本关系提取模型训练、文本关系提取方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181130 |