Nothing Special   »   [go: up one dir, main page]

CN113254576B - 一种人类行为与情感的预测、溯源方法及装置 - Google Patents

一种人类行为与情感的预测、溯源方法及装置 Download PDF

Info

Publication number
CN113254576B
CN113254576B CN202110453104.8A CN202110453104A CN113254576B CN 113254576 B CN113254576 B CN 113254576B CN 202110453104 A CN202110453104 A CN 202110453104A CN 113254576 B CN113254576 B CN 113254576B
Authority
CN
China
Prior art keywords
emotion
behavior
label
individual
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110453104.8A
Other languages
English (en)
Other versions
CN113254576A (zh
Inventor
胡玥
谢玉强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN202110453104.8A priority Critical patent/CN113254576B/zh
Publication of CN113254576A publication Critical patent/CN113254576A/zh
Application granted granted Critical
Publication of CN113254576B publication Critical patent/CN113254576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种人类行为与情感的预测、溯源方法及装置,对情感、需求和行为三者关联关系进行统一建模,可以从认知的角度通过情感、需求和行动之间的关系来模拟个体活动,实现了情感预测、情感溯源、行为预测及行为溯源四个任务。本发明可以对文本内容进行初步有效的情感预测和溯源以及行为预测和溯源,更好地揭示需求、情感和行为之间的本质关系,有助于研究人员追踪情绪反应和行为的起源,并为分析提供更合理的解释。

Description

一种人类行为与情感的预测、溯源方法及装置
技术领域
本发明属于自然语言处理领域,特别涉及一种人类行为与情感的预测、溯源方法及装置。
背景技术
人类个体的一切社会活动是个体在其内心的驱动下与外部环境(个体之外的物理世界及抽象事件等)进行交互的过程,具体体现为:个体通过其行为对外部环境产生影响,外部环境对通过在个体内心产生情感反应来影响个体。整个交互过程是通过个体的内心需求,情感和行为三者协同工作来完成和实现的。因此,全面分析个体活动中情感,需求和行为各因素的产生和变化规律,建模三者之间的关联关系,能让我们从认知层面深入分析人类活动产生的根本原因并对分析结果给出合理的解释。这项技术将对智能对话,故事生成,推荐系统以及舆情分析等多个领域产生深远影响,具有广阔的应用前景。
传统的情感分析技术主要集中在情感检测上,并已被广泛使用(Socher等,2013;
Hamilton等,2016)。尽管当前最先进的情感分析系统可以检测文本的极性(Zhang等,2018)或考虑可能引起情感的细粒度类别(又称方面)(Pontiki等,2016),对预测的分析及其原因的解释仍然很有限。
近年来,有许多大规模数据资源(Ding和Riloff,2018年;Rahimtoroghi等人,2017年)来探索人类的需求,行动或情感。Rashkin等人(2018a)提出了Story Commonsense(故事常识)来解释故事中人物心理状态变化的原因。Sap等人,2019b引入了SOCIAL IQA,用于在日常情况下探究情绪和社交智能。然后,Event2mind(Rashkin等人,2018b),ATOMIC(Sap等人,2019a)和COMET-ATOMIC2020(Hwang等人,2020)收集了不同的“what-if”心理关系。
另外,一些工作(Gaonkar等,2020;Yuan等,2020)考虑将各种心理状态引入NLP任务中,例如情绪分析。Li和Hovy,2017年探讨了人类情感分析需求的重要性。Otani和Hovy,2019将人类动机视为人类情感的驱动力,提升系统情绪分析的能力。此外,大量工作(Du等人,2019;Paul和Frank,2019;Bosselut和Choi,2019)将心理状态知识转换为预训练的模型,并将其应用于条件故事生成任务。基于在常识语料库上接受预训练的GPT(COMET),许多工作都将COMET生成的心理状态作为故事生成的条件(Xu等人,2020;Brahman和Chaturvedi,2020;Ammanabrolu等人,2020;Yuan等(2020)。
但现有技术中还存在如下问题:
1.现有数据资源集中在分析人类行为和心理状态(需求或情感)之间的二元关系上。
2.现有技术着重于对“需求与行动”或“情感与行动”之间关系的分析,而没有对人类的需求,行动和情感进行统一考虑。
发明内容
本发明提出了一种人类行为与情感的预测、溯源方法及装置,该方法以人类需求、行为、情感的自然语言文本描述为输入,经过相应的模型,实现对情感和行为的预测与溯源。
本发明的技术方案包括:
一种人类行为与情感的预测、溯源方法,其步骤包括:
1)根据任务类型,选取元素组合输入基线系统,其中任务类型包括:情感预测任务、情感溯源任务、行为预测任务或行为溯源任务,所述情感预测任务的元素组合包括:个体X、需求标签N和文本行为A,所述情感溯源任务或行为溯源任务的元素组合包括:个体X、情感标签E和文本行为A,所述行为预测任务的元素组合包括:个体X、需求标签N和情感标签E;
2)基线系统根据元素组合,选取处理路径,并通过以下策略进行处理,获取情感预测任务结果、情感溯源任务结果、行为预测任务结果或行为溯源任务结果:
2.1)当元素组合包括个体X、需求标签N和文本行为A时,通过以下步骤进行处理:
2.1.1)将通过个体X与需求标签N生成的第一自然语言文本序列输入编码器,得到编码hs1,并根据编码hs1,获取各情感类别标签的第一概率分布;
2.1.2)将文本行为A输入情感概念知识库,得到文本行为A中每一常识在各情感类别标签下的重要程度,并结合设定查找表,得到情感常识性知识第一分布;
2.1.3)根据各情感类别标签的第一概率分布与情感常识性知识第一分布进行投票,选取最佳情感类别标签,以获取情感预测任务结果;
2.2)当元素组合包括个体X、情感标签E和文本行为A时,通过以下步骤进行处理:
2.1.1)将通过个体X与情感标签E生成的第二自然语言文本序列输入编码器,得到编码hs2,并根据编码hs2,获取各情感类别标签的第二概率分布或各行为类别标签的概率分布;
2.1.2)将文本行为A输入需求概念知识库,得到文本行为A中每一常识在各情感类别标签或各行为类别标签下的重要程度,并结合设定查找表,得到情感常识性知识第二分布或行为常识性知识分布;
2.1.3)根据各情感类别标签的第二概率分布与情感常识性知识第二分布,或各行为类别标签的概率分布与行为常识性知识分布进行投票,选取最佳情感类别标签或行为类别标签,以获取情感溯源任务结果或行为溯源任务结果;
2.3)当元素组合包括个体X、需求标签N和情感标签E时,将个体X、需求标签N和情感标签E输入语言模型,获取行为预测任务结果。
进一步地,步骤1)中,基线系统对输入的需求标签N与情感标签E进行预处理;预处理包括:通过一设定提示模板,以扩展需求标签N或情感标签E的语义信息。
进一步地,所述编码器包括:GRU模型、BERT模型或RoBERTa模型。
进一步地,文本行为A输入情感概念知识库之前,对文本行为A进行预处理;预处理包括:删除了停用词和高频词。
进一步地,通过以下步骤构建情感概念知识库:
1)采集情感常识概念;
2)计算各情感类别中每个常识概念的出现次数,以形成矩阵
Figure BDA0003039581150000031
其中dc为常识概念的维度,dn为情感类别中的维度;
3)计算每一常识概念在各情感类别中的重要程度
Figure BDA0003039581150000032
其中
Figure BDA0003039581150000033
是第i个标签的第j个常识概念,s为当前标签,Ct为常识概念出现的次数,V为常识概念相应词汇的大小,N为常识概念出现的总数。
进一步地,进行投票的方法包括:使用池化机制;池化机制包括:平均池化、最大值池化或求和池化。
进一步地,语言模型包括:BERT模型或GPT-2模型。
进一步地,通过以下步骤得到情感预测任务结果:
1)设置情感预测任务的槽填充模板;
2)使用槽填充方法将最佳情感类别标签相应的预测结果,填充到槽填充模板中,以得到自然语言解释的情感预测任务结果。
一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述所述的方法。
一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机以执行上述所述的方法。
与现有技术相比,本发明的有益效果如下:
1.提出一个用于分析人类需求、行为和情感的认知框架,CogFrHA,该框架可以从认知的角度通过情感,需求和行动之间的关系来模拟个体活动。
2.建立了一个数据集HAIL并引入了四个新任务:情感预测、情感溯源、行为预测、行为溯源以及相应的基线系统,系统能够根据需求、行为和情感的文本输入,实现情感预测、情感溯源、行为预测、行为溯源。
3.从认知的角度通过情感,需求和行动之间的关系来模拟个体活动,对三者关系进行统一考虑;实验表明,与现有方法相比,我们的框架可以更好地揭示需求,情感和行为之间的本质关系。这将有助于研究人员追踪情绪反应和行为的起源,并为分析提供更合理的解释。
4.可以对文本内容进行初步有效的情感预测和溯源,以及行为预测和溯源。
附图说明
图1CogFrHA框架的组成图。
图2CogFrHA框架的基本要素示意图。
图3直接活动模式和间接活动模式的示意图。
图4需求与行为关系与需求与情感反应关系的示意图。
图5HAIL数据集的数据分布示意图。
图6本发明的四种新任务类型的通用模型架构图。
图7情感概念知识库的分布示例示意图。
图8需求概念知识库的分布示例示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一个新的人类个体活动认知框架CogFrHA(Cognitive Frameworkof Human Activities)对情感、需求和行为三者关联关系进行统一建模,具体内容为:具体来说,我们定义了人类活动的组成部分和基本要素。同时,我们提出了人类活动起点和终点的概念,并将个体活动分为直接活动模式和间接活动模式。此外,我们认为基本因素是为了实现情绪反应和产生动作,人类的需求是情感反应和行动的起源。然后,我们定义两个基本因果关系来建模需求、行动和情绪之间的关系。这些关系将有助于研究人员追踪情绪反应和行为的起源,并为分析提供更合理的解释。
一、CogFrHA框架
利用需求与行为的因果关系,我们可以对个体行为进行深入的行为预测分析和行为溯源分析;利用需求与情感反应的因果关系,我们可以对个体情感进行比以往工作更深入的情感预测分析和情感溯源分析,并对分析结果给出合理的解释。
我们认为,人类个体(Mankind's individual)的活动是个体在其内心的驱动下与外部环境进行交互的过程。我们从两者交互的角度建模框架并对框架中各部分进行分析,主要内容包括:
1)定义框架的组成;
2)定义框架的基本要素;
3)定义个体活动中各要素作用及相互关系;
4)提出了“需求与行为”之间的关系定义和“需求与情感”之间的关系定义。
1.1CogFrHA框架的组成
CogFrHA由二部分组成,如图1所示,包括人类个体和外部环境,其中,个体由需求、行为和情感表示,情感包括情感反应和情感期望;外部环境本文定义为能够对个体内心产生影响的事实事件和个体行为事件及结果,本文统称为“外部环境”。E_rac是情感反应,E_exp是情感期望。
1.2CogFrHA框架的基本要素
在CogFrHA中,个体活动的基本要素如图2,包括:内心需求、情感反应、情感期望和行为,其中传统的“动机”在我们的框架中解释为由个体内心需求和其情感期望共同形成。由于其作用可以由内心需求和情感期望代替,所以不做为框架中的基本要素:
(1)内心需求:是人类与生俱来的生理和心理需求,是产生人类活动的根源。不同的心理学理论对人类需求有不同的划分体系。本文采用Maslow需求层次模型将需求分为生理需求、安全需求、爱与归属、自尊需求和精神需求五个层次。
(2)情感反应:是个体内心需求对外部环境满意程度的心理反应,由内心需求(内因)和外部环境(外因)的共同形成,当外部环境满足内心需求时产生正向情感反应,反之,当外部环境不能满足内心需求时产生负向情感反应,根据满意程度的不同,情感反应可以分为不同的等级,当内心需求与外部环境无关时不产生情感反应。本文采用Plutchik基础情感将情感分为八个类别:喜悦,信任,悲伤,惊奇,恐惧,厌恶,愤怒,期待。
(3)情感期望:是与某个需求对应的关于该需求渴望得到的情感,情感期望做为情感的一部分参与行为的产生,其中本发明中的情感期望是通过在HAIL数据集上的统计结果得到的。
(4)行为:本发明中的行动是在“一个人有一定的需求,并希望能够满足这一需求”的心理条件下进行的,是个体在“有某种内心需求,并希望该需求能够得到满足”的心理条件下产生的对外部环境进行影响的言行。本文我们采用<施事者,谓语,受事者>三元组的形式定义行为。
1.3个体活动中各要素作用及相互关系
人类个体活动是个体在其内心的驱动下与外部环境进行交互的过程。我们将个体的一次活动定义为:以个体产生某种内心需求为起点,进行与外部环境的信息交流,以个体获得某种情感反应为终点,完成一次个体活动。
活动过程有二种方式,如图3:
1)个体直接从外界获取信息,并由此产生情感反应,不发出行为,我们称之为“直接活动方式”;
2)个体发出行为,该行为对外部环境产生影响,影响结果使个体产生情感反应。我们称之为“间接活动方式”。
直接活动模式:个体在某种内心需求驱动下对外部环境产生情感反应:(1)当外部环境满足个体内心需求时产生正向情感,并根据满意程度不同产生不同等级的正向情感,(2)当外部环境不能满足个体内心需求时产生负向情感,并根据不满意的程度产生不同等级的负向情感。活动过程只有信息获取环节。
间接活动模式:个体由内心需求和情感预期一起形成行为动机,并以此来驱动行为的产生,该行为的结果对个体产生影响,即(1)当结果满足个体内心需求时产生正向情感,并根据满意程度不同产生不同等级的正向情感,(2)当外部环境不能满足个体内心需求时产生负向情感,并根据不满意的程度产生不同等级的负向情感。活动环节包括行为产生和信息获取二个环节。
通过分析我们可以看到,对个体活动的分析可归为对“信息获取”和“行为产生”二个基本环节的分析。其中,“信息获取环节”分析个体情感反应如何产生和产生的根源是什么;“行为产生环节”分析行为如何产生和产生的根源是什么。由于内心需求是个体行为和情感反应产生的内在根源,我们可以通过分析和建模需求与行为之间关系来深入分析行为的产生和产生原因,通过分析和建模需求与情感间关系来深入分析情感的产生和产生原因。
1.4“需求与行为关系”和“需求与情感反应关系”定义
“需求与行为关系”:需求与行为之间是在情感期望作用下的因果关系,其中,需求是因,行为是果,情感期望的作用是对行为的方式和程度起决定作用。(见图4中的A)
例:如有需求是“食物需求”,则该需求对应情感期望可以是开心,满意,基本满足等正向情感;如果情感期望是开心,个体的行为可能会是“去高级餐厅吃顿大餐”,如果感期望是基本满足,个体的行为可能会是“去食堂吃个便餐”。
基于此关系,我们可以对个体行为进行深入的行为预测和行为溯源分析,并对分析结果给出合理的解释。
·行为预测(需求→行为)
如已知个体需求和它对应的情感期望,可以预测出个体将会产生的行为。
·行为溯源(行为→需求)
根据个体行为,可以分析出产生此行为的内在根源(内心需求)。
“需求与情感反应关系”:个体的情感反应由内心需求和外部环境共同形成,但只有当个体有内心需求时才会产生情感反应,即内心需求是情感反应的内在根源,外部环境是决定产生什么样的情感反应的外部条件,我们将三者关系定义为:需求与情感反应之间是在外部环境参与下的因果关系,其中,需求是因,情感反应是果,外部环境的作用是决定在已知的内心需求条件下会产生什么样的果。(见图4中的B)
基于此关系,我们可以对个体情感反应进行比以往更深入的情感预测和情感溯源分析,并对分析结果给出合理的解释。
·情感反应预测(需求→情感反应)
如已知个体需求和外部环境,可以预测出个体将会产生的情感反应。
·情感反应溯源(情感反应→需求)
根据外部环境和个体的情感反应,可以分析出产生此情感反应的内在心需求。
二、行为与情感的预测、溯源的实现方式
2.1任务定义与数据收集
为了验证我们的认知框架的有效性,我们构建了一个数据集HAIL(HumanActivities In Life),并提出了二项深层情感分析任务:情感预测任务和情感溯源任务,同时还提出了二项深层行为分析任务:行为预测任务和行为溯源任务,并对此四项任务分别给出了相应的基线系统。
2.2任务定义
1)行为预测任务:根据需求和对应的情感期望(如果没有指定情感期望值,则根据常识选最大正向情感作为情感期望值)预测/推理出个体将产生的行为。
2)行为溯源任务:根据个体行为分析出产生该行为的内心需求。
3)情感预测任务:根据内心需求和外部环境预测/推理出个体的情感反应。
4)情感溯源任务:根据情感反应和外部环境分析出产生该情感反应的内心需求。
2.3数据收集
我们使用NLP工具和手动注释建立了一个从现有资源Story Commonsense(Rashkin et al.,2018a)收集的新数据集HAIL。我们对HAIL数据集进行统计。从图5可以看出,数据的标签分布比较均匀,有利于模型的学习。
2.4基线系统
这四个任务的通用系统架构如图6所示。我们在下面描述每个系统输入。在情感预测任务中,给系统输入一个个体X,一个需求N的标签,以及一个文本行为A。在情感溯源和行为溯源任务中,系统的输入是情感标签E,X和A。行为预测任务X,N和E被分配给生成器。此外,我们设计简单的提示模板来扩展需求和情感标签的语义信息,并指出拥有需求和情感的个人。例如,在情绪预测任务中,模板包括单词(individual,has,needs)和要由标签填充的位置。
2.5编码器
我们在下面描述编码器:
1)GRU(Chung等,2014)是一种单层双GRU,用于对输入文本进行编码,并从两个方向连接最终的时间步隐藏状态,以产生句子表示hs
2)BERT(Devlin等,2019):我们按照作者对于分类任务的设置使用BERT进行文本序列的分类。
3)RoBERTa(Liu等人,2019)是一种经过改进的更鲁棒的BERT,在许多NLP任务中均显示了最先进的性能。此外,我们为每个句子添加一个额外的标签。我们使用<s>的隐藏状态表示作为句子表示hs
2.6知识库
我们引入一种方法来计算常识在外部环境(语料库)中对所有类别(需求/情感)的分布。在本文中,常识知识是指在外部环境(语料库)中出现的具有特定含义的常识概念(单词)。
需求概念知识库
我们分三步构建需求概念知识库。首先,我们提取代表性的常识概念。然后,我们计算需求类别中每个常识概念的出现次数,即每个标签上每个常识概念的出现次数,以形成矩阵
Figure BDA0003039581150000081
其中dc和dn分别是概念和需求的维度。最后一步是根据此矩阵计算每一个词(常识)在各类别标签下的重要程度
Figure BDA0003039581150000082
其中
Figure BDA0003039581150000083
是第i个标签的第j个概念(s表示当前标签),Ct是概念出现的次数,V是词汇的大小(通过统计独立单词的个数得到),n是概念出现的总数。
情感概念知识库
同样,我们通过上述方法设置了情感概念知识库。不同之处在于Matrix的分类和维度。在情感概念知识库中,矩阵
Figure BDA0003039581150000091
其中dc和de分别是概念和情感数量的维数。
通过这种方法,可以计算每个标签下每个概念的分布。基于我们提出的H AIL数据集的训练集,我们自动构建需求和情绪的知识库。图7和图8中分别显示了它们的示例。这两个知识库可用于进行预测或辅助深层模型的决策。此外,它们还可用于评估或解释预测结果。
2.7分类器
编码器的神经分布
一旦提取了编码hs的句子,我们就通过MLP通过分类令牌
Figure BDA0003039581150000095
的隐藏层表示,计算情感标签或需求标签Pz的概率分布:
Pz=W2 tanh(W1hs+b1)
其中H是隐藏层的维度,权重量
Figure BDA0003039581150000092
偏置量
Figure BDA0003039581150000093
权重量
Figure BDA0003039581150000094
H是隐藏层的维度,N是标签数。模型的预测答案与概率最高的需求(/情感)标签相对应。
知识库的先验分布
在2.6中构建的知识库可以根据操作中的常识概念给出需求类别和情感类别的先验分布,这对应于图7及图8中的先验分布。我们首先使用诸如NLTK(http://www,nltk.org/)和Spacy(https://spacy,io/)之类的工具删除了停用词和高频词,以提取与当前动作相对应的代表性常识概念,并使用每个常识概念来检索知识库中的相应分布,得到每一个词(常识)在各类别标签下的重要程度,并利用该重要程度在查找表中查找,获得当前需求(或情感)类别中所有常识性知识的分布{Pc1,Pc2,...,Pcn}。
2.8投票模块
如图6所示,我们构建了一个投票门模块来投票并集成标签Pz的概率分布以及常识性知识的分布{Pc1,Pc2,...,Pcn}。具体的投票方法如下:
Pf=f_v(Pz,[Pc1,Pc2,...,Pcn])
其中n是相关概念的数量,f_v表示通过池化机制(如AVER,MAX或者SUM池化)进行的投票集成。最后,通过投票,将选择的概率最大的标签用作最终的预测结果。
2.9解释生成器
在获得最终的预测结果之后,系统将根据当前任务生成对心理状态的自然语言解释,这有助于研究人员更好地理解需求、行动和情感之间的关系。本文使用槽填充方法,将预测结果填充到预设的槽中。我们为情感预测,情感溯源和行为溯源任务设置了槽填充模板。
2.10行为生成器
由于这些工作(Forbes等,2020;Rudinger等,2020;Sakaguchi等,2020)在相关的自然语言生成任务中表现出色,我们的主要兴趣是评估预训练语言模型(LanguageModel)。我们采用了一种编码器-解码器架构BART(Lewis等人,2019)或一个“标准”的语言模型GPT-2(Radford等,2019)。
三、实验部分
实验表明在我们的认知框架下,能够进行比现有的方法更深层的情感和行为的分析和解释任务。
3.1实验设置
模型训练:在情感预测,情感溯源和行为溯源任务中,我们使用交叉熵损失微调编码器和MLP分类器。对于行为预测任务,行为生存器的目标是给定个体、需求、情感预期,生成个体的合理行为。因此,我们使用条件对数似然损失来训练行为生存器:
Figure BDA0003039581150000101
系统实现细节:我们在7k HAIL训练示例上训练模型,然后根据开发集上表现最佳的模型(2k)选择超参数,然后在测试集上报告结果(2k)。我们通过网格搜索对超参数设置进行精确化(在{1e-5,2e-5}中选取学习率,在{8,16,32}中选取批处理大小,并且在{3,5,10}中选取微调轮数}),并报告最高的效果。GPT-2Large(1.5B参数)的隐藏层大小为H=1024,而BERT/RoBERTa Large(340M参数)的隐藏大小为H=1024。我们使用HuggingFacePyTorch(Paszke等,2019年)进行训练实现所有的结果。
评估指标:我们报告了情感预测,情感溯源和行为溯源任务的微平均精度(P),召回率(R)和F1得分(https://github.com/scikit-learn/scikit-learn)。对于行为预测任务,我们采用两种自动措施来评估生成的文本动作在内容质量和合理性方面的结果。为了评估内容质量,我们使用以下评估标准:(1)BLEU得分(Papineni等,2002),其中n=1、2、4。(2)Rouge(Li等,2016)得分,其中n=1、2,L。我们还会对生成的动作外观进行人工评估。和Song等,(2019)一样,我们要求工作人员从两个不同的角度以0-3的比例评估一对故事(3个非常好):(1)内容质量:表明所产生的行为是否流畅;(2)内容合理性:评估它是否遵循合理且一致的给定需求和情感。
3.2实验结果
分类任务
我们在表1的测试集上显示结果,其中最后三行是消融实验。
Figure BDA0003039581150000113
表示遵循相应论文中的实验设置。我们的方法使用提示模板,构造的知识库,RoBERTa和投票模块,在所有模型中得分最高。有趣的是,对于预训练的语言模型,情感预测和溯源很难。在行为溯源中,所有模型的结果都接近人类的表现。这进一步支持了我们的假设,即期望情绪对于溯源行为很重要。
Figure BDA0003039581150000111
表1情绪预测,情绪溯源和行为溯源的结果
生成任务
在表2中,训练数据(train data)是指模型训练时的给定输入。N代表需求。E代表情感。
Figure BDA0003039581150000114
表示以语言模型为目标,用相应的语料库预训练GPT-2,ROC是ROCStories(Mostafazadeh等,2016),而HAIL是我们提出的数据集的训练集。最后两列是人工评估的结果。我们可以得出结论,GPT-2模型的BLEU-1得分最高,而BLEU-2、4得分最低。对于Rouge得分,BART模型显示出良好的性能。原因之一是BART已通过汇总任务进行了预训练。人工评估表明,具有我们设计的提示模板和训练损失的模型优于基于语言模型目标的故事语料库上预先训练的模型。有趣的是,所生成行为的内容是流利且符合语法的,这表明GPT-2和BART像人类一样擅长组织句子。
总之,与其他最新模型相比,我们的方法显示出更好的性能。所有任务的结果验证了CogFrHA的可行性和重要性。
Figure BDA0003039581150000112
表2 GPT-2和BART行为预测结果。
3.3分析实验
消融实验
我们对情绪预测,情绪溯源和行为溯源的方法进行消融实验。如表1的最后3行所示,(1)表示为RoBERTa设计的提示模板的重要性。(2,3)表明,RoBERTa和KB在情绪预测和情绪溯源方面得分相似。但是,对于行为溯源任务,RoBERTa更好。一个可以解释的猜测,就是行为溯源可能需要更多的自然语言理解能力。
案例分析
我们将介绍由我们基于GPT-2和BART方法训练好的生成器生成的有趣的行为文本。从表3的样本中,其中X是个人、N是需求、E是情感期望,我们发现所有元素对于行为预测都很重要。特别是,个人的需求更为重要。基于GPT-2的生成器倾向于产生短暂但合理的行为。但是基于BART的生成器产生的行为通常很长,但会重复出现。从*标记的样本中,我们可以看出,只有需求或情感很难做出动作预测。有趣的是,经过故事语料库训练的生成器可以学习特定个体的个性或其他特征。
Figure BDA0003039581150000121
表3案例分析
可视化分析
我们对需求,行动和情感之间的关系进行可视化分析。表4显示了需求和情绪的最终预测概率矩阵。该矩阵使需求,行动和情感紧密联系在一起,并表明需求(精神成长)具有期望的情感期望(即,预期(0.19))。使用这个矩阵,我们可以根据给定的需求预测情绪,并根据情绪推断需求。因此,我们可以基于可视化对需求,行动和情绪之间的关系进行更深入的解释。
Figure BDA0003039581150000131
表4模型最终分布的可视化
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的精神和范围,本发明的保护范围应以权利要求所述为准。

Claims (10)

1.一种人类行为与情感的预测、溯源方法,其步骤包括:
1)根据任务类型,选取元素组合输入基线系统,其中任务类型包括:情感预测任务、情感溯源任务、行为预测任务或行为溯源任务,所述情感预测任务的元素组合包括:个体X、需求标签N和文本行为A,所述情感溯源任务或行为溯源任务的元素组合包括:个体X、情感标签E和文本行为A,所述行为预测任务的元素组合包括:个体X、需求标签N和情感标签E;
2)基线系统根据元素组合,选取处理路径,并通过以下策略进行处理,获取情感预测任务结果、情感溯源任务结果、行为预测任务结果或行为溯源任务结果:
2.1)当元素组合包括个体X、需求标签N和文本行为A时,通过以下步骤进行处理:
2.1.1)将通过个体X与需求标签N生成的第一自然语言文本序列输入编码器,得到编码hs1,并根据编码hs1,获取各情感类别标签的第一概率分布;
2.1.2)将文本行为A输入情感概念知识库,得到文本行为A中每一常识在各情感类别标签下的重要程度,并结合设定查找表,得到情感常识性知识第一分布;
2.1.3)根据各情感类别标签的第一概率分布与情感常识性知识第一分布进行投票,选取最佳情感类别标签,以获取情感预测任务结果;
2.2)当元素组合包括个体X、情感标签E和文本行为A时,通过以下步骤进行处理:
2.2 .1)将通过个体X与情感标签E生成的第二自然语言文本序列输入编码器,得到编码hs2,并根据编码hs2,获取各情感类别标签的第二概率分布或各行为类别标签的概率分布;
2.2 .2)将文本行为A输入需求概念知识库,得到文本行为A中每一常识在各情感类别标签或各行为类别标签下的重要程度,并结合设定查找表,得到情感常识性知识第二分布或行为常识性知识分布;
2.2 .3)根据各情感类别标签的第二概率分布与情感常识性知识第二分布,或各行为类别标签的概率分布与行为常识性知识分布进行投票,选取最佳情感类别标签或行为类别标签,以获取情感溯源任务结果或行为溯源任务结果;
2.3)当元素组合包括个体X、需求标签N和情感标签E时,将个体X、需求标签N和情感标签E输入语言模型,获取行为预测任务结果。
2.如权利要求1所述的方法,其特征在于,步骤1)中,基线系统对输入的需求标签N与情感标签E进行预处理;预处理包括:通过一设定提示模板,以扩展需求标签N或情感标签E的语义信息。
3.如权利要求1所述的方法,其特征在于,所述编码器包括:GRU模型、BERT模型或RoBERTa模型。
4.如权利要求1所述的方法,其特征在于,文本行为A输入情感概念知识库之前,对文本行为A进行预处理;预处理包括:删除了停用词和高频词。
5.如权利要求1所述的方法,其特征在于,通过以下步骤构建情感概念知识库:
1)采集情感常识概念;
2)计算各情感类别中每个常识概念的出现次数,以形成矩阵
Figure FDA0003039581140000021
其中dc为常识概念的维度,dn为情感类别中的维度;
3)计算每一常识概念在各情感类别中的重要程度
Figure FDA0003039581140000022
其中
Figure FDA0003039581140000023
是第i个标签的第j个常识概念,s为当前标签,Ct为常识概念出现的次数,V为常识概念相应词汇的大小,N为常识概念出现的总数。
6.如权利要求1所述的方法,其特征在于,进行投票的方法包括:使用池化机制;池化机制包括:平均池化、最大值池化或求和池化。
7.如权利要求1所述的方法,其特征在于,语言模型包括:BERT模型或GPT-2模型。
8.如权利要求1所述的方法,其特征在于,通过以下步骤得到情感预测任务结果:
1)设置情感预测任务的槽填充模板;
2)使用槽填充方法将最佳情感类别标签相应的预测结果,填充到槽填充模板中,以得到自然语言解释的情感预测任务结果。
9.一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1-8中任一所述方法。
10.一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行如权利要求1-8中任一所述方法。
CN202110453104.8A 2021-04-26 2021-04-26 一种人类行为与情感的预测、溯源方法及装置 Active CN113254576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110453104.8A CN113254576B (zh) 2021-04-26 2021-04-26 一种人类行为与情感的预测、溯源方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110453104.8A CN113254576B (zh) 2021-04-26 2021-04-26 一种人类行为与情感的预测、溯源方法及装置

Publications (2)

Publication Number Publication Date
CN113254576A CN113254576A (zh) 2021-08-13
CN113254576B true CN113254576B (zh) 2022-07-26

Family

ID=77221712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110453104.8A Active CN113254576B (zh) 2021-04-26 2021-04-26 一种人类行为与情感的预测、溯源方法及装置

Country Status (1)

Country Link
CN (1) CN113254576B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114676259B (zh) * 2022-04-11 2022-09-23 哈尔滨工业大学 一种基于因果感知交互网络的对话情绪识别方法
CN115221301B (zh) * 2022-07-19 2024-01-23 重庆理工大学 联合多任务学习的对话情感分类和对话行为识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831184A (zh) * 2012-08-01 2012-12-19 中国科学院自动化研究所 根据对社会事件的文字描述来预测社会情感的方法及系统
US8346391B1 (en) * 2006-12-28 2013-01-01 Science Applications International Corporation Methods and systems for an autonomous robotic platform
CN112183064A (zh) * 2020-10-22 2021-01-05 福州大学 基于多任务联合学习的文本情绪原因识别系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8209182B2 (en) * 2005-11-30 2012-06-26 University Of Southern California Emotion recognition system
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8346391B1 (en) * 2006-12-28 2013-01-01 Science Applications International Corporation Methods and systems for an autonomous robotic platform
CN102831184A (zh) * 2012-08-01 2012-12-19 中国科学院自动化研究所 根据对社会事件的文字描述来预测社会情感的方法及系统
CN112183064A (zh) * 2020-10-22 2021-01-05 福州大学 基于多任务联合学习的文本情绪原因识别系统

Also Published As

Publication number Publication date
CN113254576A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
Chen et al. Multi-modal dimensional emotion recognition using recurrent neural networks
Katz et al. Natural language processing in the legal domain
KR20190019962A (ko) 컴퓨터 학습 및 이해를 위한 아키텍처 및 프로세스들
Kusal et al. A systematic review of applications of natural language processing and future challenges with special emphasis in text-based emotion detection
Sobol-Shikler et al. Classification of complex information: Inference of co-occurring affective states from their expressions in speech
CN113254576B (zh) 一种人类行为与情感的预测、溯源方法及装置
Dsouza et al. Chat with bots intelligently: A critical review & analysis
Dhar et al. Understanding the evolution of an emerging technological paradigm and its impact: The case of Digital Twin
Qiu et al. Predicting the quality of answers with less bias in online health question answering communities
Aakur et al. Leveraging symbolic knowledge bases for commonsense natural language inference using pattern theory
Park et al. Depression Emotion Multi-Label Classification Using Everytime Platform with DSM-5 Diagnostic Criteria
Lu Advancing Mathematical Reasoning with Language Models: A Multimodal and Knowledge-Intensive Perspective
Kang Biologically inspired product design combining Kansei Engineering and Association Creative Thinking Method
CN117252265A (zh) 基于可解释机器学习人机交互方法、系统、介质及设备
Kabra et al. Attention-Emotion-Embedding BiLSTM-GRU network based sentiment analysis
KR20200141863A (ko) 개인기록물 데이터 기반 인공지능 대화 서비스 제공 시스템
Carsetti Causality, meaningful complexity and embodied cognition
Azimi et al. Discovering associations among technologies using neural networks for tech-mining
Nacheva et al. Concept map mining approach based on the mental models retrieval
Farahani et al. An Introduction to Artificial Psychology
Iovane et al. A computational model for managing emotions and affections in emotional learning platforms and learning experience in emotional computing context
Ghazi Identifying expressions of emotions and their stimuli in text
Ferri et al. Computational Models of Language Evolution: Challenges and Future Perspectives.
CN115221301B (zh) 联合多任务学习的对话情感分类和对话行为识别方法
Kazemzadeh Using interval type-2 fuzzy logic to translate emotion words from spanish to english

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant