Nothing Special   »   [go: up one dir, main page]

CN117350409A - 一种基于机器学习的人机对话模型训练系统 - Google Patents

一种基于机器学习的人机对话模型训练系统 Download PDF

Info

Publication number
CN117350409A
CN117350409A CN202311638885.3A CN202311638885A CN117350409A CN 117350409 A CN117350409 A CN 117350409A CN 202311638885 A CN202311638885 A CN 202311638885A CN 117350409 A CN117350409 A CN 117350409A
Authority
CN
China
Prior art keywords
data
unit
vector
statistics
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311638885.3A
Other languages
English (en)
Other versions
CN117350409B (zh
Inventor
张卫平
张伟
邵胜博
李显阔
丁洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Numerical Technology Co ltd
Original Assignee
Global Digital Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Global Digital Group Co Ltd filed Critical Global Digital Group Co Ltd
Priority to CN202311638885.3A priority Critical patent/CN117350409B/zh
Publication of CN117350409A publication Critical patent/CN117350409A/zh
Application granted granted Critical
Publication of CN117350409B publication Critical patent/CN117350409B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供了一种基于机器学习的人机对话模型训练系统,涉及电数字数据处理领域,包括数据采集模块、数据转换模块、前置统计模块和模型训练模块,所述数据采集模块用于采集对话数据,所述数据转换模块用于将文本数据转换成向量数据,所述前置统计模块用于对对话数据进行统计,所述模型训练模块根据统计结果对向量数据进行训练;本系统通过设置了前置统计模块对训练数据进行统计处理,根据统计结果对数据进行分类,并依次对每一类的数据进行训练,相比于直接训练更加能够提高训练效果。

Description

一种基于机器学习的人机对话模型训练系统
技术领域
本发明涉及电数字数据处理领域,具体涉及一种基于机器学习的人机对话模型训练系统。
背景技术
人机对话系统是计算机和人类进行自然语言交流的一种智能系统。它可以广泛应用于客户服务、智能家居控制、语音助手和教育辅导等多个领域,近年来,随着深度学习、自然语言处理和机器学习技术的迅速发展,人机对话系统得到了极大的推动和发展,不同的模型采用不同的训练方式,而训练方式会对训练效果产生影响。
背景技术的前述论述仅意图便于理解本发明。此论述并不认可或承认提及的材料中的任一种公共常识的一部分。
现在已经开发出了很多人机对话模型训练系统,经过我们大量的检索与参考,发现现有的模型训练系统有如公开号为CN113050787B所公开的系统,这些系统方法一般包括将流水线型对话系统的子模块整合为整体的端到端的结构框架,通过获取用户本轮对话数据以及上一轮历史数据,并编码为向量序列,最后依次通过自然语言理解、对话状态追踪、对话策略学习和自然语言生成四个子模块,得到系统本轮回复。但该系统时对对话数据处理后直接用于训练,训练效果有待提高。
发明内容
本发明的目的在于,针对所存在的不足,提出了一种基于机器学习的人机对话模型训练系统。
本发明采用如下技术方案:
一种基于机器学习的人机对话模型训练系统,包括数据采集模块、数据转换模块、前置统计模块和模型训练模块;
所述数据采集模块用于采集对话数据,所述数据转换模块用于将文本数据转换成向量数据,所述前置统计模块用于对对话数据进行统计,所述模型训练模块根据统计结果对向量数据进行训练;
所述数据转换模块包括词汇编码单元、词汇提取单元,向量转换单元和配对管理单元,所述词汇编码单元用于记录每个词汇对应的编码,所述词汇提取单元用于从对话数据中提取出词汇编码单元中记录的词汇并转换成对应的编码,所述向量转换单元将编码数据中的每个编码转换成向量形式,所述配对管理单元将编码数据和向量数据进行配对管理;
所述前置统计模块包括窗口提取单元、对比单元和统计记录单元,所述窗口提取单元用于在编码数据中提取出固定长度的编码组,所述对比单元用于将提取出的编码组进行对比得到统计项以及目标项,当所述窗口提取单元对所有编码数据处理完成后,所述统计记录单元根据次数计算出所有目标项的频率;
所述模型训练模块包括数据分组单元、输入单元、隐藏处理单元、输出单元和反馈修正单元,所述数据分组单元将具有相同统计项的向量数据进行归类,所述输入单元用于输入统计项以及目标项的向量数据,所述隐藏处理单元用于对向量数据进行处理,所述输出单元用于输出目标项的概率值,所述反馈修正单元用于将概率分布与统计记录单元中的频率值比较;
进一步的,所述窗口提取单元包括长度管理器、编码数据管理器和编码计算处理器,所述长度管理器用于对提取的编码组长度进行控制管理,所述编码数据管理器用于对进行提取的编码数据进行控制管理,所述编码计算处理器用于对提取出的编码组进行计算处理;
进一步的,所述对比单元包括对比值寄存器、对比值检索处理器和对比值反馈处理器,所述对比值寄存器用于存储接收的对比值,所述对比值检索处理器用于在存储的对比值中检索是否存在新接收的对比值,当存在时,所述对比值反馈处理器从窗口提取单元中获取该对比值对应的编码组以及目标项并发送给统计记录单元;
进一步的,所述隐藏处理单元包括节点计算处理器和节点连接处理器,所述节点计算处理器用于对至少两个向量值进行计算处理并输出一个向量值,所述节点连接处理器用于控制节点的输入连接和输出连接;
所述节点计算处理器对输入节点和中间节点的输入向量值根据下述步骤进行处理:
S21、将m个输入向量值构建成一个m*n的矩阵A:,其中,表示第j个输入向量值;
S22、根据下式处理得到一个中间向量
其中,为节点内置的m维向量;
S23、对中间向量中的元素值按照下式进行转换:
其中,为中间向量中第i个元素值,/>为转换后的元素值;
所述节点计算处理器对输出节点的输入向量值根据下式进行计算处理:
其中,表示第j个输入向量的第i个元素值;
进一步的,所述反馈修正单元包括输出寄存器、概率换算处理器和反馈处理器,所述输出寄存器按照类型对输出单元输出的Pr进行分类存储,所述概率换算处理器用于计算出同一分类下的每个Pr对应的概率值,所述反馈处理器对概率值和频率值的偏差进行计算处理并将结果反馈给隐藏处理单元。
本发明所取得的有益效果是:
本系统通过设置了前置统计模块对训练数据进行统计处理,根据统计结果对数据进行分类,并依次对每一类的数据进行训练,相比于直接训练更加能够提高训练效果,在训练时,通过对每一个统计项后面的目标项的出现概率进行计算预测,并与统计结果进行比较,基于比较的偏差对模型中的参数进行优化,使得模型输出的概率结果能够更加准确。
为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。
附图说明
图1为本发明整体结构框架示意图;
图2为本发明数据转换模块构成示意图;
图3为本发明前置统计模块构成示意图;
图4为本发明模型训练模块构成示意图;
图5为本发明反馈修正单元构成示意图。
具体实施方式
以下是通过特定的具体实施例来说明本发明的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不悖离本发明的精神下进行各种修饰与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。
实施例一:本实施例提供了一种基于机器学习的人机对话模型训练系统,结合图1,包括数据采集模块、数据转换模块、前置统计模块和模型训练模块;
所述数据采集模块用于采集对话数据,所述数据转换模块用于将文本数据转换成向量数据,所述前置统计模块用于对对话数据进行统计,所述模型训练模块根据统计结果对向量数据进行训练;
所述数据转换模块包括词汇编码单元、词汇提取单元,向量转换单元和配对管理单元,所述词汇编码单元用于记录每个词汇对应的编码,所述词汇提取单元用于从对话数据中提取出词汇编码单元中记录的词汇并转换成对应的编码,所述向量转换单元将编码数据中的每个编码转换成向量形式,所述配对管理单元将编码数据和向量数据进行配对管理;
所述前置统计模块包括窗口提取单元、对比单元和统计记录单元,所述窗口提取单元用于在编码数据中提取出固定长度的编码组,所述对比单元用于将提取出的编码组进行对比得到统计项以及目标项,当所述窗口提取单元对所有编码数据处理完成后,所述统计记录单元根据次数计算出所有目标项的频率;
所述模型训练模块包括数据分组单元、输入单元、隐藏处理单元、输出单元和反馈修正单元,所述数据分组单元将具有相同统计项的向量数据进行归类,所述输入单元用于输入统计项以及目标项的向量数据,所述隐藏处理单元用于对向量数据进行处理,所述输出单元用于输出目标项的概率值,所述反馈修正单元用于将概率分布与统计记录单元中的频率值比较;
所述窗口提取单元包括长度管理器、编码数据管理器和编码计算处理器,所述长度管理器用于对提取的编码组长度进行控制管理,所述编码数据管理器用于对进行提取的编码数据进行控制管理,所述编码计算处理器用于对提取出的编码组进行计算处理;
所述对比单元包括对比值寄存器、对比值检索处理器和对比值反馈处理器,所述对比值寄存器用于存储接收的对比值,所述对比值检索处理器用于在存储的对比值中检索是否存在新接收的对比值,当存在时,所述对比值反馈处理器从窗口提取单元中获取该对比值对应的编码组以及目标项并发送给统计记录单元;
所述隐藏处理单元包括节点计算处理器和节点连接处理器,所述节点计算处理器用于对至少两个向量值进行计算处理并输出一个向量值,所述节点连接处理器用于控制节点的输入连接和输出连接;
所述节点计算处理器对输入节点和中间节点的输入向量值根据下述步骤进行处理:
S21、将m个输入向量值构建成一个m*n的矩阵A:,其中,表示第j个输入向量值;
S22、根据下式处理得到一个中间向量
其中,为节点内置的m维向量;
S23、对中间向量中的元素值按照下式进行转换:
其中,为中间向量中第i个元素值,/>为转换后的元素值;
所述节点计算处理器对输出节点的输入向量值根据下式进行计算处理:
其中,表示第j个输入向量的第i个元素值;
所述反馈修正单元包括输出寄存器、概率换算处理器和反馈处理器,所述输出寄存器按照类型对输出单元输出的Pr进行分类存储,所述概率换算处理器用于计算出同一分类下的每个Pr对应的概率值,所述反馈处理器对概率值和频率值的偏差进行计算处理并将结果反馈给隐藏处理单元。
实施例二:本实施例包含了实施例一中的全部内容,提供了一种基于机器学习的人机对话模型训练系统,包括数据采集模块、数据转换模块、前置统计模块和模型训练模块;
所述数据采集模块用于采集对话数据,所述数据转换模块用于将文本数据转换成向量数据,所述前置统计模块用于对对话数据进行统计,所述模型训练模块根据统计结果对向量数据进行训练;
所述数据采集模块包括联网单元、识别单元、采集单元和存储单元,所述联网单元用于接入互联网,所述识别单元用于识别互联网中的对话数据,所述采集单元将识别的对话数据进行复制,所述存储单元用于保存复制的对话数据;
结合图2,所述数据转换模块包括词汇编码单元、词汇提取单元,向量转换单元和配对管理单元,所述词汇编码单元用于记录每个词汇对应的编码,所述词汇提取单元用于从对话数据中提取出词汇编码单元中记录的词汇并转换成对应的编码,称为编码数据,所述向量转换单元将编码数据中的每个编码转换成向量形式,称为向量数据,所述配对管理单元将编码数据和向量数据进行配对管理,所述编码数据被发送至所述前置统计模块进行统计处理,所述向量数据被发送至所述模型训练模块进行训练处理;
结合图3,所述前置统计模块包括窗口提取单元、对比单元和统计记录单元,所述窗口提取单元用于在编码数据中提取出固定长度的编码组,所述对比单元用于将提取出的编码组进行对比,对比一致的编码组作为一个统计项,所述统计记录单元对所有统计项后出现编码的次数进行统计,统计项后跟随的编码称为目标项,当所述窗口提取单元对所有编码数据处理完成后,所述统计记录单元根据次数计算出所有目标项的频率;
结合图4,所述模型训练模块包括数据分组单元、输入单元、隐藏处理单元、输出单元和反馈修正单元,所述数据分组单元将具有相同统计项的向量数据进行归类,所述输入单元用于输入统计项以及目标项的向量数据,所述隐藏处理单元用于对向量数据进行处理,所述输出单元用于输出目标项的概率值,所述反馈修正单元用于将概率分布与统计记录单元中的频率值比较,比较结果用于对隐藏处理单元中的参数进行优化;
所述向量转换单元将编码转换成向量Ve的公式为:
其中,Code为词汇的编码,n为向量的元素个数,为向量Ve中第i个元素值;
所述配对管理单元将编码Code和向量Ve进行配对记录;
所述窗口提取单元包括长度管理器、编码数据管理器和编码计算处理器,所述长度管理器用于对提取的编码组长度进行控制管理,所述编码数据管理器用于对进行提取的编码数据进行控制管理,所述编码计算处理器用于对提取出的编码组进行计算处理;
所述窗口提取单元的工作流程包括如下步骤:
S1、所述编码数据管理器接收所有编码数据并从中选择一段对话的编码数据,称为目标编码数据,并向所述长度管理器发送启动信号;
S2、所述长度管理器向所述编码数据管理器发送一个长度值;
S3、所述编码数据管理器根据长度值设置一个窗口;
S4、利用窗口从目标编码数据中获取编码组发送给所述编码计算处理器;
S5、所述编码计算处理器根据下式计算出对比值:
其中,L为窗口的长度值,表示编码组中的第i个编码值;
将对比值发送给所述对比单元;
S6、重复步骤S4和步骤S5,直至窗口获取完目标编码数据的所有编码组,向所述长度管理器发送长度变更信号;
S7、所述长度管理器向所述编码数据管理器发送一个新的长度值,回到步骤S3,若无新的长度值,则向编码数据管理器发送目标变更信号,进入步骤S8;
S8、所述编码数据管理器选择新的目标编码数据,并向所述长度管理器发送启动信号,回到步骤S2,若无新的目标编码数据,结束整个工作流程;
所述对比单元包括对比值寄存器、对比值检索处理器和对比值反馈处理器,所述对比值寄存器用于存储接收的对比值,所述对比值检索处理器用于在存储的对比值中检索是否存在新接收的对比值,当存在时,所述对比值反馈处理器从窗口提取单元中获取该对比值对应的编码组以及目标项并发送给统计记录单元;
所述统计记录单元包括记录寄存器和频率计算处理器,所述记录寄存器用于记录每个统计项信息以及对应目标项的出现次数进行记录,所述频率计算处理器计算出每个目标项在对应统计项后出现的频率;
所述数据分组单元包括向量数据寄存器和分组配对处理器,所述向量数据寄存器用于接收并保存向量数据,所述分组配对处理器基于统计项信息向配对管理单元进行查询获得对应的向量数据信息,基于查询到的信息将向量数据寄存器中的向量数据进行分类;
所述隐藏处理单元包括节点计算处理器和节点连接处理器,所述节点计算处理器用于对至少两个向量值进行计算处理并输出一个向量值,所述节点连接处理器用于控制节点的输入连接和输出连接;
节点分为输入节点、中间节点和输出节点,所述输入节点以输入单元输入的向量值作为节点的输入向量值,所述中间节点以其余节点的输出值作为本节点的输入向量值,并将本节点的输出值作为另一个节点的输入向量值,所述输出节点只有一个,以其余节点的输出值作为本节点的输入向量值,输出节点的输出值被发送至输出单元,节点之间存在这种连接关系,而节点连接处理器对这种连接关系进行控制;
所述节点计算处理器对输入节点和中间节点的输入向量值根据下述步骤进行处理:
S21、将m个输入向量值构建成一个m*n的矩阵A:,其中,表示第j个输入向量值;
S22、根据下式处理得到一个中间向量
其中,为节点内置的m维向量;
S23、对中间向量中的元素值按照下式进行转换:
其中,为中间向量中第i个元素值,/>为转换后的元素值;
所述节点计算处理器对输出节点的输入向量值根据下式进行计算处理:
其中,表示第j个输入向量的第i个元素值;
结合图5,所述反馈修正单元包括输出寄存器、概率换算处理器和反馈处理器,所述输出寄存器按照类型对输出单元输出的Pr进行分类存储,所述概率换算处理器用于计算出同一分类下的每个Pr对应的概率值,所述反馈处理器对概率值和频率值的偏差进行计算处理并将结果反馈给隐藏处理单元;
所述概率换算处理器根据下式计算出概率值
其中,表示同一分类下的其余输出值;
所述反馈处理器根据下式计算出偏差值
其中,表示第i个目标项的概率值,/>表示第i个目标项的频率值,k为目标项的数量;
所述隐藏处理单元基于偏差值对每个节点中的内置向量/>进行优化;
对向量的优化方式不唯一,下面给出一种优化方式:
其中,表示向量/>中的第i个元素,/>为优化后的元素值;
本文中出现的i和j为用于表示序号的序数。
以上所公开的内容仅为本发明的优选可行实施例,并非因此局限本发明的保护范围,所以凡是运用本发明说明书及附图内容所做的等效技术变化,均包含于本发明的保护范围内,此外,随着技术发展其中的元素可以更新的。

Claims (5)

1.一种基于机器学习的人机对话模型训练系统,其特征在于,包括数据采集模块、数据转换模块、前置统计模块和模型训练模块;
所述数据采集模块用于采集对话数据,所述数据转换模块用于将文本数据转换成向量数据,所述前置统计模块用于对对话数据进行统计,所述模型训练模块根据统计结果对向量数据进行训练;
所述数据转换模块包括词汇编码单元、词汇提取单元,向量转换单元和配对管理单元,所述词汇编码单元用于记录每个词汇对应的编码,所述词汇提取单元用于从对话数据中提取出词汇编码单元中记录的词汇并转换成对应的编码,所述向量转换单元将编码数据中的每个编码转换成向量形式,所述配对管理单元将编码数据和向量数据进行配对管理;
所述前置统计模块包括窗口提取单元、对比单元和统计记录单元,所述窗口提取单元用于在编码数据中提取出固定长度的编码组,所述对比单元用于将提取出的编码组进行对比得到统计项以及目标项,当所述窗口提取单元对所有编码数据处理完成后,所述统计记录单元根据次数计算出所有目标项的频率;
所述模型训练模块包括数据分组单元、输入单元、隐藏处理单元、输出单元和反馈修正单元,所述数据分组单元将具有相同统计项的向量数据进行归类,所述输入单元用于输入统计项以及目标项的向量数据,所述隐藏处理单元用于对向量数据进行处理,所述输出单元用于输出目标项的概率值,所述反馈修正单元用于将概率分布与统计记录单元中的频率值比较。
2.如权利要求1所述的一种基于机器学习的人机对话模型训练系统,其特征在于,所述窗口提取单元包括长度管理器、编码数据管理器和编码计算处理器,所述长度管理器用于对提取的编码组长度进行控制管理,所述编码数据管理器用于对进行提取的编码数据进行控制管理,所述编码计算处理器用于对提取出的编码组进行计算处理。
3.如权利要求2所述的一种基于机器学习的人机对话模型训练系统,其特征在于,所述对比单元包括对比值寄存器、对比值检索处理器和对比值反馈处理器,所述对比值寄存器用于存储接收的对比值,所述对比值检索处理器用于在存储的对比值中检索是否存在新接收的对比值,当存在时,所述对比值反馈处理器从窗口提取单元中获取该对比值对应的编码组以及目标项并发送给统计记录单元。
4.如权利要求3所述的一种基于机器学习的人机对话模型训练系统,其特征在于,所述隐藏处理单元包括节点计算处理器和节点连接处理器,所述节点计算处理器用于对至少两个向量值进行计算处理并输出一个向量值,所述节点连接处理器用于控制节点的输入连接和输出连接;
所述节点计算处理器对输入节点和中间节点的输入向量值根据下述步骤进行处理:
S21、将m个输入向量值构建成一个m*n的矩阵A:,其中,/>表示第j个输入向量值;
S22、根据下式处理得到一个中间向量
其中,为节点内置的m维向量;
S23、对中间向量中的元素值按照下式进行转换:
其中,为中间向量中第i个元素值,/>为转换后的元素值;
所述节点计算处理器对输出节点的输入向量值根据下式进行计算处理:
其中,表示第j个输入向量的第i个元素值。
5.如权利要求4所述的一种基于机器学习的人机对话模型训练系统,其特征在于,所述反馈修正单元包括输出寄存器、概率换算处理器和反馈处理器,所述输出寄存器按照类型对输出单元输出的Pr进行分类存储,所述概率换算处理器用于计算出同一分类下的每个Pr对应的概率值,所述反馈处理器对概率值和频率值的偏差进行计算处理并将结果反馈给隐藏处理单元。
CN202311638885.3A 2023-12-04 2023-12-04 一种基于机器学习的人机对话模型训练系统 Active CN117350409B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311638885.3A CN117350409B (zh) 2023-12-04 2023-12-04 一种基于机器学习的人机对话模型训练系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311638885.3A CN117350409B (zh) 2023-12-04 2023-12-04 一种基于机器学习的人机对话模型训练系统

Publications (2)

Publication Number Publication Date
CN117350409A true CN117350409A (zh) 2024-01-05
CN117350409B CN117350409B (zh) 2024-03-01

Family

ID=89367018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311638885.3A Active CN117350409B (zh) 2023-12-04 2023-12-04 一种基于机器学习的人机对话模型训练系统

Country Status (1)

Country Link
CN (1) CN117350409B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114297986A (zh) * 2021-12-14 2022-04-08 重庆大学 一种基于强化学习的icd自动合并编码系统和方法
CN116049557A (zh) * 2023-02-10 2023-05-02 南京邮电大学 一种基于多模态预训练模型的教育资源推荐方法
CN116861929A (zh) * 2023-06-29 2023-10-10 郑州轻工业大学 基于深度学习的机器翻译系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114297986A (zh) * 2021-12-14 2022-04-08 重庆大学 一种基于强化学习的icd自动合并编码系统和方法
CN116049557A (zh) * 2023-02-10 2023-05-02 南京邮电大学 一种基于多模态预训练模型的教育资源推荐方法
CN116861929A (zh) * 2023-06-29 2023-10-10 郑州轻工业大学 基于深度学习的机器翻译系统

Also Published As

Publication number Publication date
CN117350409B (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
CN111694924B (zh) 一种事件抽取方法和系统
CN112733866B (zh) 一种提高可控图像文本描述正确性的网络构建方法
CN112926303B (zh) 一种基于BERT-BiGRU的恶意URL检测方法
CN113268609A (zh) 基于知识图谱的对话内容推荐方法、装置、设备及介质
CN113177141B (zh) 基于语义嵌入软相似性的多标签视频哈希检索方法及设备
CN111026887B (zh) 一种跨媒体检索的方法及系统
CN116484024A (zh) 一种基于知识图谱的多层次知识库构建方法
CN107832047A (zh) 一种基于lstm的非api函数实参推荐方法
CN118093834A (zh) 一种基于aigc大模型的语言处理问答系统及方法
CN112860904A (zh) 一种融入外部知识的生物医疗关系抽取方法
CN112766368A (zh) 一种数据分类方法、设备和可读存储介质
CN111767697A (zh) 文本处理方法、装置、计算机设备以及存储介质
CN118113815B (zh) 内容搜索方法、相关装置和介质
CN117350409B (zh) 一种基于机器学习的人机对话模型训练系统
CN116842021B (zh) 基于ai生成式技术的数据字典标准化方法、设备及介质
CN117235137A (zh) 一种基于向量数据库的职业信息查询方法及装置
CN116628594A (zh) 基于ai智能的用户信息管理系统及其方法
CN116452353A (zh) 一种财务数据管理方法及系统
CN114238563A (zh) 基于多角度交互的中文句子对语义智能匹配方法和装置
Wang Video description with GAN
CN114171206A (zh) 模型训练、传感病预测方法、装置、设备及存储介质
CN113822018A (zh) 实体关系联合抽取方法
CN111158640B (zh) 一种基于深度学习的一对多需求分析识别方法
CN116884630B (zh) 一种提高疾病自动编码效率的方法
CN118378627B (zh) 一种中医药命名实体识别方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 518063 No. 01-03, floor 17, block B, building 10, Shenzhen Bay science and technology ecological park, No. 10, Gaoxin South ninth Road, Yuehai street, Nanshan District, Shenzhen, Guangdong

Patentee after: Global Numerical Technology Co.,Ltd.

Country or region after: China

Address before: No. 01-03, 17th Floor, Building B, Shenzhen Bay Science and Technology Ecological Park, No. 10 Gaoxin South 9th Road, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province

Patentee before: Global Digital Group Co.,Ltd.

Country or region before: China