CN109725798B - 智能角色的切换方法及相关装置 - Google Patents
智能角色的切换方法及相关装置 Download PDFInfo
- Publication number
- CN109725798B CN109725798B CN201711009546.3A CN201711009546A CN109725798B CN 109725798 B CN109725798 B CN 109725798B CN 201711009546 A CN201711009546 A CN 201711009546A CN 109725798 B CN109725798 B CN 109725798B
- Authority
- CN
- China
- Prior art keywords
- intelligent
- role
- target
- switching
- intelligent role
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例提供智能角色的切换方法及相关装置。每一上述智能角色用于人机交互,对应用于人机交互的多个配置类别;任意两智能角色在至少一个配置类别上具有不同的配置数据;该切换方法包括:获取通过输入设备输入的信号;在输入的信号用于触发切换至目标智能角色时,从当前智能角色切换至目标智能角色。在本申请实施例中,每一智能角色对应多个配置类别,任两智能角色在至少一个配置类别上具有不同的配置数据,如此将多个配置类别下的配置数据整体包装为智能角色,切换智能角色即可完成对多个配置类别下的配置数据的切换。与现有的单独切换的方式,本申请实施例提供的技术方案简化了操作流程,提高了切换的便捷度,更适合于在车载场景下使用。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及智能角色的切换方法及相关装置。
背景技术
信息处理系统(例如智能助理)可实现人机交互,实现通过对话、用户触摸输入等方式控制设备、应用和服务的功能。
以智能助理为例,其可通过多个人机交互配置类别来实现人机交互,上述配置类别示例性得可包括界面皮肤、助理形象、话术系统和声音模型等。以声音模型为例,其进一步可包括多个不同的声音模型,每一声音模型对应一系列声音配置数据,以实现男声、童声、女声、模拟名人等不同的发音效果;同理,其他配置类别也可有多组配置数据可供选择。
目前,智能助理支持分别切换配置类别的配置数据。仍以声音模型为例,假定智能助理当前使用的声音模型为A,用户可触摸选择声音模型B,从而切换为使用声音模型B发音。
可见,现有的切换方式存在操作步骤复杂的问题,尤其不利于车载场景下使用。
发明内容
有鉴于此,本申请实施例提供智能角色的切换方法及相关装置,以简化切换的操作步骤。
为实现上述目的,本申请实施例提供如下技术方案:
一种智能角色的切换方法,所述智能角色用于人机交互,对应多个用于人机交互的配置类别;任意两个所述智能角色在至少一个所述配置类别上具有不同的配置数据;
所述切换方法包括:
获取通过输入设备输入的信号;
在输入的信号用于触发切换至目标智能角色时,从当前智能角色切换至所述目标智能角色。
在一个可能的设计中,上述切换方法还包括:通知其他应用所述目标智能角色的智能角色标识,以便所述其他应用将配置数据切换为与所述目标智能角色相匹配的配置数据。
在一个可能的设计中,所述输入设备包括语音输入设备和非语音输入设备中的一种或多种。
在一个可能的设计中,每一智能角色与至少一个免唤醒关键词相关联;所述获取通过输入设备输入的信号包括:通过语音输入设备采集语音信号;其中,若采集到的语音信号与任一其他角色的免唤醒关键词相一致,所述采集到的语音信号用于触发切换至目标智能角色,而所述目标智能角色为与所述采集到的语音信号相一致的免唤醒关键词所关联的智能角色;其中,所述任一其他角色为非当前智能角色。
在一个可能的设计中,所述获取通过输入设备输入的信号包括:通过语音输入设备在预设时间窗内接收第一语音信号;所述方法还包括:根据接收的所述第一语音信号获得结构化参数;根据所述结构化参数确定对应的操作;其中,若所述结构化参数包含表征切换智能角色的命令内容以及智能角色名称,所述结构化参数对应的语音信号用于触发切换至目标智能角色,而根据所述切换智能角色指令确定的操作包括:从当前智能角色切换至目标智能角色;所述智能角色名称对应的智能角色为所述目标智能角色。
在一个可能的设计中,所述获取通过输入设备输入的信号包括:接收通过非语音输入设备输入的智能角色切换指令;其中,所述智能角色切换指令用于触发切换至目标智能角色;所述智能角色切换指令至少包含智能角色标识;所述智能角色切换指令包含的智能角色标识所对应的智能角色为所述目标智能角色。
在一个可能的设计中,在切换至所述目标智能角色后,所述方法还包括:所述目标智能角色通过所述输入设备接收输入的信号;针对切换后通过所述输入设备输入的信号,所述目标智能角色确定对应的反馈信息,并使用目标配置数据表现所述反馈信息;所述目标配置数据包括目标智能角色对应的配置数据。
在一个可能的设计中,在所述目标智能角色通过所述输入设备接收输入的信号后,所述方法还包括:针对切换后通过所述输入设备输入的信号,所述目标智能角色确定对应的目标操作并执行。
在一个可能的设计中,所述多个配置类别包括:界面皮肤、智能角色形象、话术系统和声音模型中的至少两类。
在一个可能的设计中,不同的智能角色对应不同的本地话术系统,所述切换至所述目标智能角色包括:切换至所述目标智能角色对应的本地话术系统。
在一个可能的设计中,不同智能角色对应不同的本地话术系统;每一本地话术系统包括反馈语句编号以及与反馈语句编号对应的文本;不同的本地话术系统或智能角色针对同一反馈语句编号所对应的文本不相同。
在一个可能的设计中,在本地切换至所述目标智能角色对应的话术系统后,所述目标智能角色通过所述输入设备接收输入的信号包括:通过语音输入设备在预设时间窗内接收第二语音信号;所述目标智能角色确定对应的目标操作并执行包括:所述目标智能角色根据所述第二语音信号获得结构化参数;所述目标智能角色根据获得的结构化参数确定对应的目标操作并执行;所述使用目标配置数据表现所述反馈信息包括:根据获得的结构化参数确定对应的反馈语句编号,所述对应的反馈语句编号为目标编号,所述反馈信息包括所述目标编号;所述目标智能角色根据所述目标编号索引得到目标文本;其中,所述目标文本为目标本地话术系统中与所述目标编号对应的文本;所述目标本地话术系统为与所述目标智能角色相对应的本地话术系统;所述目标智能角色将所述获得的结构化参数和执行所述目标操作得到的操作结果数据填入所述目标文本,得到播报文本;所述目标智能角色调用目标声音模型播报所述播报文本;所述目标声音模型为所述目标智能角色对应的声音模型;所述目标配置数据包括所述目标文本和所述目标声音模型对应的声音配置参数。
在一个可能的设计中,不同的智能角色对应不同的云端话术系统,所述切换至所述目标智能角色还包括:上传所述目标智能角色的智能角色标识,以便所述服务器切换至所述目标智能角色对应的云端话术系统。
在一个可能的设计中,不同的智能角色对应不同的声音模型;所述切换至所述目标智能角色包括:切换至所述目标智能角色对应的声音模型。
在一个可能的设计中,不同智能角色的智能角色标识对应不同的声音配置参数;所述切换至所述目标智能角色对应的声音模型包括:令所述目标智能角色的智能角色标识对应的声音配置参数生效。
在一个可能的设计中,不同的智能角色对应不同的界面皮肤;所述切换至所述目标智能角色包括:切换至所述目标智能角色对应的界面皮肤。
在一个可能的设计中,不同智能角色的智能角色标识对应不同的应用界面UI素材;所述切换至所述目标智能角色对应的界面皮肤包括:根据所述目标智能角色的智能角色标识切换使用对应的UI素材渲染应用界面。
在一个可能的设计中,不同的智能角色对应不同的动画形象;所述切换至所述目标智能角色包括:切换至所述目标智能角色对应的动画形象。
在一个可能的设计中,不同智能角色的智能角色标识对应不同的动画素材或代码;所述切换至所述目标智能角色对应的动画形象包括:根据所述目标智能角色的智能角色标识切换使用对应的动画素材或代码。
在一个可能的设计中,任意两个所述智能角色在作为所述目标智能角色时,针对同一输入信号所确定的反馈信息是相同的,但使用不同的目标配置数据表现所述反馈信息。
一种信息处理系统,其特征在于,至少用于智能角色的切换,所述智能角色用于人机交互,每一智能角色对应多个用于人机交互的配置类别,任意两个所述智能角色在至少一个所述配置类别上具有不同的配置数据;
所述信息处理系统包括:
获取单元,用于获取通过输入设备输入的信号;
切换单元,用于在输入的信号用于触发切换至目标智能角色时,所述从当前智能角色切换至所述目标智能角色。
本申请实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种切换方法中的步骤。
在本申请实施例中,每一智能角色对应多个配置类别,任两智能角色在至少一个配置类别上具有不同的配置数据,如此将多个配置类别下的配置数据整体包装为智能角色,切换智能角色即可完成对多个配置类别下的配置数据的切换。与现有的单独切换的方式,本申请实施例提供的技术方案简化了操作流程,提高了切换的便捷度。与现有切换方式相比,更适合于在车载场景下使用。
附图说明
图1为本申请实施例提供的场景应用示意图;
图2为本申请实施例提供的信息处理系统的结构示意图;
图3为本申请实施例提供的切换设备的示例性结构图;
图4、6、7、9、10为本申请实施例提供的切换方法的示例性流程图;
图5为本申请实施例提供的通知其他应用的示例性流程图;
图8为本申请实施例提供的触控切换智能角色的示意图;
图11为本申请实施例提供的切换云端话术系统及切换后的示例性流程图。
具体实施方式
任何需要进行人机交互,并需要将多个用于人机交互的配置类别下的配置数据整体打包切换的场合,均可使用本申请提供的技术方案——智能角色的切换方法及相关装置(例如信息处理系统、切换设备、服务器)。
本申请的核心思想是:将多个配置类别下的配置数据整体包装为智能角色,任两智能角色在至少一个配置类别上具有不同的配置数据,切换智能角色即可完成对多个配置类别下的配置数据的切换。
需要说明的是,上述智能角色用于人机交互,而上述多个配置类别可包括多个用于人机交互的配置类别,本文后续将进行介绍。
在介绍完核心思想后,下面介绍本申请实施例所涉及的相关装置。
信息处理系统一般为软件形式,部署于用户设备(终端设备)中。
更具体的,上述信息处理系统可为独立的软件,例如智能助理。当然,也可作为大型系统(例如操作系统)的子系统(子组件),为该大型系统与用户之间提供人机交互服务。
以智能助理为例,智能助理又可称为虚拟助理、数据助理、智能助理、自动数字助理等,其可通过对话、、用户触摸输入等了解用户的意图并做出回应。它会记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和“学习”包括智能终端中的文本文件、电子邮件、图片、视频等数据,来理解用户的语义和语境,从而实现人机交互。
请参见图1,上述智能助理作为客户端,还可与服务器交互。例如,用户通过客户端语音输入“你好吗”,可能需要通过与服务器交互,由服务器决策出反馈语句并返回客户端。
下面介绍各装置的内部结构。
上述信息处理系统(例如智能助理)的一种示例性结构如图2所示,包括:获取单元201和切换单元202,其中,获取单元201可用于获取通过输入设备输入的信号,切换单元202可用于在输入的信号用于触发切换至目标智能角色时,从当前智能角色切换至上述目标智能角色。
在本申请其他实施例中,仍请参见图2,上述切换设备还可包括通知单元203,用于通知其他应用上述目标智能角色的智能角色标识,以便其他应用将配置数据切换为与该目标智能角色相匹配的配置数据。本文后续还将结合方法介绍各单元的功能,在此不作赘述。
上述用户设备可为任何电子设备,例如智能终端、平板电脑、便携式媒体播放器、台式计算机、膝上型计算机、智能电视机、电视机顶盒、可穿戴电子设备、车载设备等。
需要说明的是,由于本申请实施例主要介绍智能角色的切换,因此,也可将上述用户设备/终端设备称为切换设备。
图3示出了上述用户设备(切换设备)的一种可能的结构示意图,包括:
总线、处理器1、存储器2、通信接口3、输入设备4和输出设备5。处理器1、存储器2、通信接口3、输入设备4和输出设备5通过总线相互连接。其中:
总线可包括一通路,在计算机系统各个部件之间传送信息。
处理器1可以是通用处理器,例如通用中央处理器(CPU)、网络处理器(NetworkProcessor,简称NP)、微处理器等,也可以是特定应用集成电路(application-specificintegrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。还可以是数字信号处理器(DSP)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
处理器1可包括主处理器,还可包括基带芯片、调制解调器等。
存储器2中保存有执行本申请技术方案的程序或脚本,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。脚本则通常以文本(如ASCII)保存,只在被调用时进行解释或编译。
更具体的,存储器2可以包括只读存储器(read-only memory,ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory,RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。
输入设备4可包括接收用户输入的数据和信息的装置,例如触摸屏、语音输入装置、键盘、鼠标、摄像头、重力感应器等。
输出设备5可包括允许输出信息给用户的装置,例如显示屏、扬声器等。
通信接口3可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(WLAN)等。
处理器1通过执行存储器2中所存放的程序以及调用其他设备,可实现下述所有实施例提供的切换方法。
此外,图2所示的切换设备中各单元的功能,可由前述的处理器1执行存储器2中所存放的程序以及调用其他设备实现。
可以理解的是,图3仅仅示出了切换设备的简化设计。在实际应用中,上述切换设备可以包含任意数量的发射器,接收器,处理器,控制器,存储器,通信接口等,而所有可以实现本申请的切换设备都在本申请的保护范围之内。
前述提及的服务器或硬件形式的智能助理,也可采用与上述切换设备的类似的计算机架构。
下面将基于上面所述的本申请涉及的共性方面,对本申请实施例进一步详细说明。
图4示出了以智能助理为例的智能角色的切换方法的一种示例性交互流程。
本实施例实施的基础是将多个用于人机交互的配置类别下的配置数据整体包装为智能角色,每一智能角色可对应一个唯一的智能角色标识(ID)。
举例来讲,可配置“李白”、“叮当”、“妲己”三个智能角色,这三个智能角色各有其唯一的智能角色ID。
可由智能助理系统默认配置多个智能角色,当然,在一些场景下,用户也可自定义智能角色。
上述多个用于人机交互的配置类别可包括界面皮肤、智能角色形象、话术系统、声音模型中的任意两种或任意组合。
此外,上述配置类别还可包括智能角色唤醒词(可简称唤醒词)。智能角色唤醒词可在用户设备处于休眠状态时,唤醒当前智能角色。
举例来讲,在休眠前的智能角色为“李白”,则“李白”即为当前智能角色。在用户设备处于休眠状态时,语音输入“李白”的智能角色唤醒词,即可唤醒用户设备中智能助理的当前智能角色——“李白”。
不同智能角色对应的“唤醒词文本”是不同的(唤醒词文本即为唤醒词这一配置类别的配置数据)。例如,“李白”的唤醒词文本可为“召唤李白”,而妲己的唤醒词文本可为“召唤妲己”。
一般而言,任意两智能角色在至少一个上述配置类别上具有不同的配置数据。
以声音模型简单举例,“李白”这一智能角色的声音模型可实现男声的发音效果,而“妲己”这一智能角色的声音模型可实现女声的发音效果。此外,“李白”和“妲己”这两个智能角色示例性得在话术系统、智能角色形象、界面皮肤、智能角色唤醒词上的配置数据也可具有不同的配置数据。
基于上述多个智能角色,本实施例提供的智能角色的切换方法至少可包括如下步骤:
401部分:智能助理获取通过输入设备输入的信号;
上述输入设备可包括语音输入装置(例如麦克风)和非语音输入装置(例如触摸屏、键盘、鼠标等)。
也即,用户可通过语音输入装置输入语音信号,也可通过非语音输入装置输入非语音信号。
更具体的,可由前述的获取单元201执行401部分。
402部分:在输入的信号用于触发切换至目标智能角色时,智能助理从当前智能角色切换至目标智能角色。
沿用前例,假定当前生效智能角色为“李白”,而目标智能角色为“妲己”,则智能助理将从“李白”切换至“妲己”。
前已述及,一个智能角色是多个配置类别下的配置数据整体包装,而上述多个配置类别可包括界面皮肤、智能角色形象、话术系统、声音模型、智能角色唤醒词中的任意两种或任意组合。
则上述“切换至目标智能角色”可具体包括如下切换操作中的任意两种或任意组合:
①由当前智能角色对应的界面皮肤切换至目标智能角色对应的界面皮肤;
沿用前例,则将从“李白”对应的界面皮肤切换至“妲己”对应的界面皮肤。
②由当前智能角色对应的智能角色形象切换至目标智能角色对应的智能角色形象;
沿用前例,则将从“李白”对应的智能角色形象切换至“妲己”对应的智能角色形象。
智能角色形象代表了一个虚拟智能角色的外在形象,其包含但不仅限于针对该智能角色形象设计、动画设计、颜色设计、服饰设计等。
③由当前智能角色对应的话术系统切换至目标智能角色对应的话术系统;
沿用前例,则将从“李白”对应的话术系统切换至“妲己”对应的话术系统。
④由当前智能角色对应的声音模型切换至目标智能角色对应的声音模型;
沿用前例,则将从“李白”对应的声音模型切换至“妲己”对应的声音模型。
⑤由当前智能角色对应的唤醒词切换至目标智能角色对应的唤醒词。
沿用前例,则将从“李白”对应的唤醒词切换至“妲己”对应的唤醒词。
后续还会对上述各切换操作进行更为详细的介绍。
更具体的,可由前述的切换单元202执行402部分。
可见,在本实施例中,每一智能角色对应多个配置类别,任两智能角色在至少一个配置类别上具有不同的配置数据,如此将多个配置类别下的配置数据整体包装为智能角色,切换智能角色即可完成对多个配置类别下的配置数据的切换。与现有的单独切换的方式,本申请实施例提供的技术方案简化了操作流程,提高了切换的便捷度,且有利于智能角色整体设计。与现有切换方式相比,更适合于在车载场景下使用。
在实际应用中,智能助理可通过网络或接口与诸如电话、日历、信息服务、消息服务、导航应用(例如腾讯导航)、新闻应用(例如腾讯新闻)、地图、电台、即时通讯应用(例如微信)、微博等其他应用通信。
则仍请参见图4,上述切换方法还可包括如下步骤:
403部分:智能助理通知其他应用上述目标智能角色的智能角色标识。
更具体的,可由前述的通知单元203执行403部分。
此外,在其他实施例中,智能助理可通知操作系统上述目标智能角色的智能角色标识,或同时通知操作系统和其他应用上述目标智能角色的智能角色标识。
收到通知的其他应用或操作系统,可将自身的配置数据切换为与目标智能角色相匹配的配置数据,从而可实现多应用乃至操作系统自身同时切换至同一智能角色,达到增加智能角色设计的效果。
举例来讲,假定导航应用与智能助理一样,都具有“李白”、“叮当”、“妲己”等智能角色。则在智能助理切换至“妲己”这一智能角色后,智能助理可通知导航应用“妲己”的智能角色ID,导航应用就可将自身的配置数据切换为与“妲己”这一智能角色相匹配的配置数据。
以声音模型为例,请参见图5,智能助理在切换至目标智能角色后,可通过广播形式发送目标智能角色的智能角色ID至其他各应用(图5示例性得以应用A-C表征其他应用)。
其他应用或操作系统在接收智能角色ID后,可以根据自己的播报系统实现方式来切换至与该智能角色ID相一致的声音模型,此外,其他应用或操作系统也可将自身的话术系统切换至与该智能角色ID相一致的话术系统。
当然,若无法识别智能角色ID或无与之相应的声音模型/话术系统,则其他应用或操作系统在收到通知后可不切换声音模型/话术系统。
在另一实施例中,上述智能助理也可与其他应用或操作系统事先协商好各声音模型对应的唯一标识(ID)。在切换至目标智能角色后,智能助理可广播目标智能角色对应的声音模型ID,其他应用或操作系统可根据接收到的声音模型ID切换至相应的声音模型。
下面,将以车载为场景,详细介绍切换智能角色的方式。切换智能角色方式至少有三种:免唤醒切换、语音唤醒切换和触控切换。
先介绍免唤醒切换方式。
免唤醒指的是:无任何应用占用语音输入设备的情况下,说出特定的语音指令(免唤醒关键词),即可使用户设备执行指令对应的功能操作,无需触控或唤起智能助理。
所谓无任何应用占用语音输入设备的情况,可理解为在后台进行录音(或称为免唤醒录音)的状态。以车载设备为例,当车载设备处于锁屏状态或屏幕关闭状态,但麦克风仍处于工作状态时,即为免唤醒录音状态。
或者,屏幕和麦克风虽然开启,但用户在浏览网页,前台运行的应用并没有使用麦克风,也属于免唤醒录音状态。
在免唤醒录音状态下,除非语音输入免唤醒关键词或语音输入当前智能角色的角色唤醒词,用户设备对其他的语音输入并不进行响应。当然,语音输入当前智能角色的角色唤醒词,只可唤醒当前智能角色,并不能触发角色切换。
至于免唤醒关键词,每一智能角色都关联有独特的免唤醒关键词(个数可为一个或多个)。
举例来讲,“李白”这一智能角色的免唤醒关键词可为“李白醒醒”,“妲己”这一智能角色的免唤醒关键词可为“妲己醒醒”。
在一个示例中,可由系统默认设置免唤醒关键词,当然在一些场景下,用户也可自行设置免唤醒关键词。
需要说明的是,各智能角色对应的免唤醒关键词是同时生效的,这样才可实现智能角色间的任意切换。
智能助理预先会存储各免唤醒关键词对应的音频文件或文本。
下面以用户、智能助理之间的交互流程来介绍免唤醒切换方式,请参见图6,上述交互流程至少可包括:
601部分:在免唤醒录音状态下,智能助理持续采集语音信号;
其中,若用户说出目标智能角色的免唤醒关键词,则智能助理采集到免唤醒关键词的语音信号。
沿用前例,用户可说出“李白醒醒”,则智能助理采集到“李白醒醒”的语音输入(语音信号)。
在一个示例中,可由前述的获取单元201执行601部分。
602部分:将采集到的语音信号与各免唤醒关键词所对应的音频文件进行匹配;
在本实施例中,智能助理预先存储的是各免唤醒关键词对应的音频文件。因此,可将采集到的语音信号与各免唤醒关键词对应的音频文件逐一匹配。
更具体的,在一个示例中,可得到语音信号的频谱波形图,将其与各免唤醒关键词对应的频谱波形图进行匹配。在另一个示例中,也可将采集到的语音信号转换为字母,将其与各免唤醒关键词对应的字母进行匹配。
上述音频文件可包括上述提及的频谱波形图或字母。
而在其他实施例中,若智能助理预先存储的是各免唤醒关键词对应的文本,则可将601部分采集到的语音信号转化为文本,再将转化得到的文本与各免唤醒关键词对应的文本逐一匹配。
603部分:若匹配成功,且确定出的目标智能角色与当前智能角色不同,智能助理从当前智能角色切换至该目标智能角色。
需要说明的是,若采集到的语音信号与任一智能角色的免唤醒关键词匹配成功,则可确定出匹配成功的免唤醒关键词所关联的智能角色为目标智能角色。
但需要考虑一种特殊情况:若目标智能角色与当前智能角色为同一个,则不执行切换,直接唤醒当前智能角色即可。
因此,也可如此描述:若采集到的语音信号与任一其他智能角色的免唤醒关键词匹配成功(或采集到的语音信号与任一其他智能角色的免唤醒关键词一致),则可确定在601部分输入的语音信号可用于触发切换至目标智能角色,同时,匹配成功的免唤醒关键词所关联的智能角色为目标智能角色。这里的任一其他智能角色为当前智能角色之外的智能角色。
沿用前例,假定当前角色为“妲已”,在免唤醒录音状态下,用户语音输入了“李白醒醒”,其与智能助理预存的、其他智能角色(“李白”这一角色)的音频文件或文本匹配成功,则可确定目标智能角色为“李白”,进一步,也可得到目标智能角色的ID。
而如果601部分输入的语音信号与预存的各免唤醒关键词均不一致,则不会再进行下面的步骤。
但需要说明的是,在一些场景下,即使匹配失败也可唤醒当前智能角色。举例来讲,假定当前智能角色为“妲己”,在免唤醒录音状态下,用户说了妲已的唤醒词,虽然不能切换智能角色,但能唤醒“妲己”这一智能角色。
更具体的,可由前述的切换单元202执行602和603部分。切换的相关介绍可参见前述402部分的介绍,在此不作赘述。
此外,无论何种匹配方式,可采用在线匹配或离线匹配。
在本申请其他实施例中,上述切换方法还可包括如下步骤:
604部分:智能助理通知其他应用上述目标智能角色的智能角色标识。
此外,在其他实施例中,智能助理可通知操作系统上述目标智能角色的智能角色标识,或同时通知操作系统和其他应用上述目标智能角色的智能角色标识。
604部分与前述的403部分相类似,在此不作赘述。
可见,在本实施例中,在用户设备处于免唤醒录音状态下,可通过语音输入免唤醒关键词,令智能助理从当前智能角色切换至目标智能角色。从用户角度而言,其只说出了一个免唤醒关键词,就可直接切换至相应的智能角色,期间无需触控,操作简单,尤其适应于车载场景。
除了免唤醒录音状态,用户设备还可能会处于唤醒录音状态。
唤醒录音状态,指占用语音输入设备录音的情况,可理解为在前台进行录音、录音界面处于打开的状态。
以智能助理为例,用户在使用智能助理进行人机交互时,若用户点击了智能助理的界面上的录音按钮,语音输入设备(麦克风)被智能助理占用,录音过程在前台进行,此时,用户输入的任何语音信号,智能助理都会响应,向用户输出反馈。
例如,用户说“你好”,语音助理会回应“你好”。即使用户说的语音信号语音助理无法识别,也会回应说“我听不清楚”。
而在前述介绍的免唤醒录音状态下,用户只有输入特定的语音信号(例如语音输入免唤醒关键词号),智能助理才会响应用户。
语音唤醒切换发生在智能助理处于唤醒录音状态下,请参见图7,其至少可包括如下交互流程:
701部分:在录音状态下,智能助理在预设时间窗内采集到第一语音信号。
时间窗的长度N可进行设置。
示例性的,若用户点击了智能助理的界面上的录音按钮,智能助理会在长度为N的时间窗内采集语音信号,到达时长N后,智能助理会停止录音。直到用户再次点击录音按钮,智能助理才会再次录音。
具体的,可由前述的获取单元201执行701部分。
702部分:智能助理根据上述第一语音信号获得结构化参数。
具体的,可先将语音信号转换为文本,对文本进行语义解析,得到结构化参数。
在一个示例中,结构化参数可为Jason格式的参数。
可由前述的切换单元202执行702部分。
703部分:智能助理根据结构化参数确定对应的操作。
若上述结构化参数中包含表征切换智能角色的命令内容以及智能角色名称(也可认为结构化参数中包含智能角色切换指令,而智能角色切换指令包括上述命令内容和智能角色名称),则该结构化参数对应的语音信号用于触发切换至目标智能角色,而“根据结构化参数确定对应的操作”则具体包括“从当前智能角色切换至目标智能角色”。
举例来讲,假定在唤醒录音状态下,用户说出“切换至李白”,则得到的结构化参数中可包括“切换”和“李白”,再通过“李白”这个名字索引到对应的智能角色ID,则智能助理后续可做出切换至“李白”的操作。当然,若目标智能角色与当前智能角色为同一个,则不执行切换。
切换的相关介绍可参见前述402部分的介绍,在此不作赘述。
此外,若用户设备处于休眠状态(一般屏幕关闭可认为处于休眠状态),用户也可先唤醒用户设备(使用前述的智能角色唤醒词或任意语音输入),待进入唤醒录音状态后,再执行上述701-703部分。
在本申请其他实施例中,上述切换方法还可包括如下步骤:
704部分:智能助理通知其他应用上述目标智能角色的智能角色标识。
此外,在其他实施例中,智能助理可通知操作系统上述目标智能角色的智能角色标识,或同时通知操作系统和其他应用上述目标智能角色的智能角色标识。
704部分与前述的403部分相类似,在此不作赘述。
可见,在本实施例中,在智能助理处于唤醒录音状态时,可通过语音控制智能助理从当前智能角色切换至目标智能角色,与现有技术相比,其操作简单,适应于车载场景。
下面介绍触控切换,请参见图8,假定当前智能角色为“叮当”,用户触摸“李白”可切换至“李白”这一智能角色。
而在技术实现上,请参见图9,用户、智能助理之间的交互流程可包括如下步骤:
901部分:用户触摸显示屏上显示的任一其他智能角色(即目标智能角色),则智能助理接收到通过非语音输入设备输入的智能角色切换命令。
这里的任一其他智能角色为当前智能角色之外的智能角色。
上述智能角色切换指令可包含目标智能角色的智能角色ID,用于触发切换至目标智能角色的操作。
具体的,在当前操作界面上,可显示其他智能角色的图标或头像,用户对其进行触摸,则可触发角色切换。
举例来讲,用户触摸了屏幕上显示的“李白”的图标或头像,则智能助理接收到指示切换至“李白”的智能角色切换命令(该命令中可包含“李白”的智能角色ID),接下来,智能助理将会执行切换至“李白”这一智能角色的操作。
可由前述的获取单元201执行901部分。
902部分:智能助理从当前智能角色切换至该目标智能角色。
切换的相关介绍可参见前述402部分的介绍,在此不作赘述。
更具体的,可由前述的切换单元202执行902部分。
在本申请其他实施例中,上述切换方法还可包括如下步骤:
903部分:智能助理通知其他应用目标智能角色的智能角色标识。
此外,在其他实施例中,智能助理可通知操作系统上述目标智能角色的智能角色标识,或同时通知操作系统和其他应用上述目标智能角色的智能角色标识。
903部分与前述的403部分相类似,在此不作赘述。
可见,在本实施例中,可通过一次触摸从当前智能角色切换至目标智能角色,操作简单,适应于车载场景。
下面,将介绍话术系统、声音模型、界面皮肤、动画形象、智能角色唤醒词的切换。
①切换TSS话术系统(简称话术系统)。
对应每一种外界输入情况,智能助理会根据产品策略设计而反馈语句,谓之话术。
需要说明的是,TTS(text to speech,文转声)技术用于将文字转化为声音播报出来,智能助理的声音反馈主要通过TTS技术播报给用户。
换句话讲,智能助理通过话术系统得到针对用户语音输入的反馈文本,由声音模型通过TTS技术读出上述反馈文本。
在本申请中,每一个智能角色(智能角色ID)对应一套TTS话术系统(简称话术系统)。以“李白”、“妲己”、“叮当”这三个智能角色为例,其可分别对应三个不同的话术系统。
话术系统进一步的可包含本地代码内的话术系统(简称本地话术系统)和云端话术系统。则在切换至目标智能角色时,除将本地话术系统切换至目标智能角色对应的本地话术系统,服务器端也会切换至目标智能角色对应的云端话术系统。
以本地话术系统为例,请参见下表1,“李白”、“妲己”、“叮当”这三个智能角色分别对应话术系统A-C。
进一步的,每一智能角色对应的本地话术系统可包括反馈语句编号以及与反馈语句编号对应的文本。
以表1为例,表1中的“欢迎话术反馈语句”、“无录音输入反馈语句”、“没听懂反馈语句”可分别为其分配反馈语句编号001-003。
而不同的本地话术系统针对同一反馈语句编号所对应的反馈语句文本是不相同的。举例来讲,“欢迎话术反馈语句”编号为001,其在话术系统A-C中对应的文本分别是“床前明月光,我是李白”、“妲己陪你玩”和“你好,我叫叮当”。
表1
更具体的,可将每一智能角色对应的反馈语句编号和相应的文本分离至多个文件中,例如,反馈语句编号存储在反馈语句编号文件中,而反馈语句编号对应的反馈语句文本则存储于多个播报文件中。
当然,不同智能角色针对同一操作对应的语句编号是一致的,因此,在一个示例中,多个智能角色可共享同一反馈语句编号文件,同时,不同智能角色对应的反馈语句文本存放在各自的播报文件中(也即一个智能角色与一个播报文件对应,各智能角色之间一般不共享播报文件)。将反馈语句编号和文本分离可便于扩展和修改。
在一个示例中,在进行话术系统开发时,可基于某一角色已开发的话术系统,对其他角色的话术系统进行自动开发。
具体的,可搜索已开发出的话术系统中符合自动开发规则的文本,对其进行自动化处理,得到用于其他智能角色的话术系统的文本。
举例来讲,已开发出“叮当”这一角色的话术系统(第一话术系统),“李白”这一角色的话术系统(第二话术系统)待开发,第一、第二及后续的第三仅用于区分不同的话术系统。
可搜索出第一话术系统中所有含“叮当”的文本(自动开发规则包括“含有叮当”),而上述“进行自动开发处理”可包括:将含“叮当”的文本中的“叮当”替换为“李白”。
再举例来讲,已开发出“叮当”这一角色的话术系统,而“妲已”这一角色的话术系统(第三话术系统)待开发。
则可搜索出第一话术系统中所有含“叮当”的文本(自动开发规则包括“含有叮当”),并将含“叮当”的文本中的“叮当”替换为“妲已”(也即上述“进行自动开发处理”可包括:将含“叮当”的文本中的“叮当”替换为“妲已”)。
此外,还可搜索出第一话术系统中所有含语气词“了”的文本(则自动开发规还包括“含语气词‘了’”),而相应的,上述“进行自动开发处理”还可包括:将语气词“了”替换为“啦”等等。
本领域技术人员可根据实际情况进行灵活设计,在此不作赘述。
下面介绍云端话术系统切换以及切换后的交互流程。
请参见图10,智能助理、服务器间的交互流程如下:
切换流程:
1001部分:智能助理上传目标智能角色的智能角色标识。
1001部分可发生于上述401部分、602部分、703部分、901部分之后。
可由前述的通知单元203执行1001部分。
1002部分:服务器切换至目标智能角色对应的云端话术系统。
举例来讲,假定目标智能角色为“李白”,则服务器将该智能助理的云端话术系统切换至“李白”的云端话术系统。
对话流程:
需要说明的是,针对某些用户的特定意图(例如问“你好吗?”),本地话术系统无法处理,可过语音上传指令、服务端下发反馈语句来回答的形式完成的。这种形式可称为对话或问答(QA)。
本申请实施例可针对每个智能角色建立对应的问答数据库(也即话术系统),提前将各智能角色对应的问答写入服务器数据文件中。不同的智能角色可对应不同的服务器数据文件,也可将不同智能角色对应的问答写入同一服务器数据文件,并以智能角色ID区分。
1003部分:当用户发起对应特定意图的请求(可认为输入指令Q)时,智能助理向服务器发送带有指令Q和目标智能角色ID的请求。
1004部分:服务器根据智能角色ID在对应的问答数据库中索引指令Q,得到反馈语句A,并将对应的反馈语句A下发至智能助理。
反馈语句一般为文本形式。
收到反馈语句A后,智能助理会使用目标智能角色对应的声音模型播报反馈A。
进一步的,与本地话术系统相类似,每一智能角色对应的云端话术系统也可包括反馈语句编号以及与反馈语句编号对应的文本;同时,智能角色对应的云端话术系统的开发,也可采用前述介绍的自动开发方式,在此不作赘述。
可见,本实施例提供了令本地话术系统和云端话术系统同时切换生效的方法,有利于增加智能角色设计的效果。
②切换声音模型。
在本实施例中,一个智能角色对应一个声音模型,多个智能角色即分别对应不同的声音模型。
而不同的声音模型对应了不同的声音配置参数,则也可理解为:不同智能角色(的智能角色标识)对应不同的声音配置参数。
则前述的切换至目标智能角色对应的声音模型可具体包括:令目标智能角色的智能角色标识对应的声音配置参数生效。
上述多个声音模型对应的多套声音配置参数,可存放在一个TTS资源文件中,以智能角色ID区分多套声音配置参数。
此外,也可将不同的声音模型对应的声音配置参数(也即不同智能角色标识对应的声音配置参数)分别存放在不同的TTS资源文件中。
③切换界面皮肤。
界面皮肤泛指智能助理的界面设计,包含但不仅限于界面标题栏、文字、背景(窗口背景、其他控件背景等)、颜色、菜单、交互布局、按钮样式等。
界面皮肤通过UI素材渲染,不同智能角色的智能角色标识对应不同的一组UI素材。
因此,前述的“切换至目标智能角色对应的界面皮肤”可具体包括:根据目标智能角色的智能角色标识切换使用对应的UI素材渲染应用界面。
上述多个智能角色对应的多组UI素材,可存放在一个应用系统资源文件中,以智能角色ID区分上述多组UI素材(UI素材为与界面皮肤对应的配置数据)。
此外,也可将不同的智能角色对应的UI素材(也即不同智能角色标识对应的UI素材)分别存放在不同的应用系统资源文件中。
④切换动画形象。
在切换目标智能角色时,可将当前智能角色的动画形象切换成目标智能角色对应的动画形象。
更具体的,可通过两种方式实现动画效果:一种是播放动画素材(图片),一种是代码实现。
不同智能角色的智能角色标识可对应不同的一组动画素材或一段代码,在切换时,可根据目标智能角色的智能角色标识切换使用对应的动画素材或代码。
下面简单介绍动画素材。
下表2中每一行为一类动画。当然,对于不同智能角色,每一类动画进一步的还可以有多个不同的动画素材。
以“聆听中”这一类动画为例,其可进一步包括智能角色“李白”的“聆听中”动画素材,智能角色“叮当”的“聆听中”动画素材等等。
表2
与前述的话术系统相类似,每一类动画可对应一个动画编号,不同智能角色针对同一动画编号的动画素材是不相同的。这样可实现不同智能角色在同一操作下的动画效果不一致但表达意思(即反馈信息)完全一致的效果。
更具体的,可将每一智能角色对应的动画编号和动画素材分离至多个文件中,例如,动画编号存在一个动画编号文件中,而编号对应的动画素材存在动画资源文件中。
在一个示例中,可由多个智能角色共享同一动画编号文件,同时,不同智能角色对应的动画素材存放在各自的动画资源文件中。将动画编号和动画素材分离可便于扩展和修改。
⑤切换智能角色唤醒词。
前述在图4所示实施例部分介绍了智能角色唤醒词。
下表3示例性得示出了不同的智能角色对应不同智能角色唤醒词的情况。
表3
智能角色唤醒词是唤醒资源的一部分,可存在语音应用数据文件中。
每个智能角色对应一组智能角色唤醒词。上述多个智能角色对应的多组智能角色唤醒词,可存放在一个语音应用数据文件中,以智能角色ID区分上述多组智能角色唤醒词。也可将不同的智能角色对应的多组智能角色唤醒词(也即不同智能角色标识对应的智能角色唤醒词)分别存放在不同的语音应用数据文件中。
与免唤醒关键词不同的是,智能角色唤醒词并不会同时生效:在切换至目标智能角色后,智能助理将使用该目标智能角色的智能角色唤醒词。
下面将介绍切换后,目标智能角色与用户的人机交互流程。
在切换至目标智能角色后,目标智能角色可通过前述的输入设备接收信号;针对切换后接收的信号,目标智能角色将确定对应的反馈信息,并使用目标配置数据表现该反馈信息。其中,目标配置数据包括目标智能角色对应的配置数据。此外,在目标智能角色通过输入设备接收输入的信号后,目标智能角色还可针对切换后输入的信号,确定对应的目标操作并执行。
请参见图11,下面将以用户输入语音信号为例,介绍切换后目标智能角色与用户的人机交互流程,其可包括:
1101部分:目标智能角色(通过语音输入设备)在预设时间窗内接收第二语音信号;
时间窗的长度N可进行设置。
示例性的,若用户点击了目标智能角色的录音界面上的录音按钮,目标智能角色会在长度为N的时间窗内采集语音信号,到达时长N后,则会停止录音。直到用户再次点击录音按钮,目标智能角色才会再次录音。
为与前述701部分的第一语音信号相区别,本部分使用第二语音信号。
1102部分:目标智能角色将第二语音信号转换为文本,并对该文本进行语义解析,如解析得到结构化参数,进入1105部分,否则,进入1103部分。
需要说明的是,对文本进行语义解析,有时可得到结构化参数,有时则得不到。举例来讲,用户说“你好”,则未必解析得出结构化参数。而用户如说“今天北京天气如何”,则可解析得到结构化参数“天气”和地址“北京”。
1103部分:目标智能角色将上述文本映射到指令编号;
具体的,智能助理已经预存了各文本与指令编号之间的对应关系(可称为第一对应关系,可预先在代码中设置好各文本与指令编号之间的对应关系,或以对应关系表的形式存储各文本与指令编号之间的对应关系),因此,目标智能角色可根据上述第一对应关系将文本映射到指令编号。
同理,智能助理还预存了结构化参数与指令编号之间的对应关系(可称为第二对应关系,可预先在代码中设置好结构化参数与指令编号之间的对应关系,或以对应关系表的形式存储结构化参数与指令编号之间的对应关系),因此,在解析出结构化参数的情况下,可根据预存的第二对应关系将结构化参数映射到指令编号。
指令编号与前述的反馈语句编号相关联(也即指令编号与反馈语句编号之间存在对应关系,可在代码中写好指令编号与反馈语句编号之间的对应关系,或以对应关系表形式存储指令编号与反馈语句编号之间的对应关系),这样,在确定了指令编号后,也可进一步确定与该指令编号相关联的反馈语句编号。为便于称呼,可将与该指令编号相关联的反馈语句编号称为目标编号。
1104部分:目标智能角色根据上述目标编号索引得到目标文本,并根据目标文本得到播报文本,调用目标声音模型播报该播报文本。
其中,上述目标文本可为目标本地话术系统中与目标编号对应的文本,而目标本地话术系统则为与上述目标智能角色相对应的本地话术系统。
在一个示例中,可直接使用目标文本作为播报文本,也可使用第二语音信号转化的文本填入目标文本得到播报文本。
举例来讲,用户说“你叫什么名字”,其映射的目标编号为001X,目标智能角色为叮当,与001X对应的目标文本是“我叫叮当”,则可将该目标文本直接做为播报文本,调用叮当的声音模型播报该播报文本。
再举例讲,用户说“你会跳舞吗”,其映射的目标编号为002X,目标智能角色为叮当,与002X对应的目标文本是“抱歉,我不会XX”,则可将语音信号转化的文本“跳舞”填入“抱歉,我不会XX”中,得到播报文本为“抱歉,我不会跳舞”,然后调用叮当的声音模型播报该播报文本。
需要说明的是,1101-1104部分描述的是人机纯粹对话聊天的过程,目标智能角色只需要进行反馈,并不需要做额外的操作;而后续1105-1108部分描述的是非纯粹对话聊天的过程,与纯粹对话聊天的过程相比,其最大的区别是会确定并执行目标操作。
1105部分:目标智能角色根据获得的结构化参数确定目标操作并执行;
以用户输入语音信号“今天北京的天气如何”为例,经解析得到的结构化参数包括“天气”以及地址“北京”。
相应的,目标智能角色根据结构化参数——“天气”和“北京”确定的目标操作可包括:向其他应用(例如天气应用)发送查询请求,或者,调用浏览器,并在浏览器内填入“北京天气”进行搜索。
再例如,用户输入的语音信号为"打开浏览器",经解析得到的结构化参数包括“打开”以及“浏览器”。
相应的,目标智能角色根据结构化参数——“打开”和“浏览器”确定的目标操作可包括:搜索浏览器应用软件,并打开搜索到的浏览器软件。
1106部分:目标智能角色将获得的结构化参数映射到指令编号;
相关介绍请参见前述1103部分的记载。
指令编号与前述的反馈语句编号相关联,这样,在确定了指令编号后,也可进一步确定与该指令编号相关联的反馈语句编号。为便于称呼,可将与该指令编号相关联的反馈语句编号称为目标编号。
1107部分:目标智能角色根据目标编号索引得到目标文本。
目标文本请参见前述1104部分的记载,在此不作赘述。
1108部分:目标智能角色将获得的结构化参数以及执行上述目标操作得到的操作结果数据填入目标文本,得到播报文本,并调用目标声音模型播报该播报文本。
以用户输入语音信号“今天北京的天气如何”为例,解析得到的结构化参数包括“天气”以及地址“北京”。
则目标智能角色根据结构化参数——“天气”和“北京”确定的目标操作可包括:向其他应用(例如天气应用)发送查询请求,或者,调用浏览器,并在浏览器内填入“北京天气”进行搜索。
假定,上述结构化参数(天气)对应的目标编号为00X,目标智能角色为“叮当”,“叮当”对应目标编号00X的文本可包括:“今天XX的天气为:XX”。
若上述目标操作的查询结果为:“晴转多云,东南风2级,最高气温19摄氏度,最低气温7摄氏度”。
则可将“北京”(结构化参数)以及“查询结果”数据填入目标文本,得到如下播报文本:
“今天北京的天气为:晴转多云,东南风2级,最高气温19摄氏度,最低气温7摄氏度”。
此外,需要说明的是,一个编号可对应一个以上的文本。仍沿用前例,“叮当”对应目标编号00X的目标文本除包括第一目标文本(今天XX的天气为:XX)外,还可包括第二文本:“正在为您查询”或“正在为您查询XX天气”。
同理,第二文本中也可填入结构化参数,例如,可向“正在为您查询XX天气”这一文本中填入“北京”,得到“正在为您查询北京天气”的播报文本。
则在查询过程中,可先播报“正在为您查询”或“正在为您查询北京天气”(可称为第二播报文本),再播报“今天北京的天气为:晴转多云,东南风2级,最高气温19摄氏度,最低气温7摄氏度”(可称为第一播报文本)。
需要说明的是,在本实施例中,前述提及的反馈信息可包括目标编号,前述提及的目标配置数据可包括目标文本和目标声音模型对应的声音配置参数。
此外,在本申请其他实施例中,前述提及的指令编号还可和动画编号相关联(为便于称呼,可将与该指令编号相关联的动画编号称为目标动画编号)。因此,目标智能角色还可查找与目标动画编号相对应的动画素材,在播报上述播报文本的同时,还可播放查找到的动画素材。则相应的,前述提及的反馈信息还可包括目标动画编号,而前述提及的目标配置数据还可包括目标动画编号对应的动画素材。
本文最后,将介绍游戏中的虚拟角色(简称为游戏角色)与本申请中的智能角色的不同之处。
智能角色与游戏角色的区别主要有以下几点:
第一点,功能(或作用)不同。
虚拟场景中的游戏角色,代表的是用户的虚拟形象,其行为也可视为是用户的虚拟行为;游戏角色并不能为用户提供人机交互服务。
而智能角色是用户(人)与机器之间的“人机交互接口”的虚拟形象,并不用于代表用户,可为用户提供人机交互服务。
第二点,处理过程不同。
本申请中,任意两个的智能角色在作为目标智能角色时(也即切换后),针对同一输入信号所确定的反馈信息是相同的,但会采用不同的配置数据表现该反馈信息。
上述同一输入信号可指“同一语音信号”、“同一触控信号”等。
例如,不同智能角色对应不同的话术系统,而不同的本地话术系统针对同一反馈语句编号(反馈语句编号属于反馈信息)所对应的文本(属于配置数据)是不相同的。
举例来讲,用户语音输入“北京天气如何?”,会映射到反馈语句编号A,对于反馈语句编号A,李白、妲已、丁当这三个角色对应的文本可分别包括“李白正在为阁下查询天气”、“妲己正在为主人查询天气”和“叮当正在为您查询天气”。上述三个文本虽然不同,但均用于表达正在查询。
此外,不同智能角色在同一动画编号(动画编号也可属于反馈信息)下的动画素材不同(属于配置数据),所实现的动画效果不一致但表达意思完全一致(可详见切换动画部分)。
而游戏角色主要是执行用户通过鼠标、键盘、触摸屏等输入的指令,并且,针对同一指令,因游戏角色的不同会对应不同的操作事件,从而得到不同的反馈信息,而非同样的反馈信息。
例如,在一些虚拟游戏中,用户点击“发大招”按钮,配备了武器A的游戏角色会使用武器A采用技能A进行攻击(操作事件A),而配备了武器B的游戏角色会使用武器B采用技能B进行攻击(操作事件B)。
不同的武器、不同的技能进行攻击会有不同的杀伤力,则其反馈结果也不会相同。
第三点:游戏角色以非语音输入形式切换,其无免唤醒关键词,不能通过免唤醒关键词切换,也不能通过角色唤醒词唤醒,也不能在唤醒录音状态下进行切换。
第四点:游戏角色切换,多涉及的是角色自身形象和动画形象的切换。游戏角色的切换并不会改变游戏应用主体的界面皮肤(例如边框、界面标题栏、文字、窗口背景、控件背景、菜单、交互布局、按钮样式等);
而本申请中,智能角色的切换,会引用应用主体界面皮肤的切换。
从另一方面来讲,不同的智能角色代表了应用软件主体的不同形象,而游戏角色则并不能代表游戏软件主体的形象。
第五点:游戏角色无法与其他应用进行通信,例如,游戏角色无法与电话、日历、信息服务、消息服务、导航应用、新闻应用、地图、电台、时通讯应用、微博等其他应用通信。而智能角色则可与其他应用进行通信,向其他应用发送服务请求,或执行开启、登陆其他应用等操作。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件单元,或者二者的结合来实施。软件单元可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (14)
1.一种智能角色的切换方法,其特征在于,所述智能角色用于人机交互,对应多个用于人机交互的配置类别;任意两个所述智能角色在至少一个所述配置类别上具有不同的配置数据;
所述切换方法包括:
获取通过输入设备输入的信号;
在输入的信号用于触发切换至目标智能角色时,从当前智能角色切换至所述目标智能角色;
通知其他应用所述目标智能角色的智能角色标识,以便所述其他应用将配置数据切换为与所述目标智能角色相匹配的配置数据。
2.如权利要求1所述的方法,其特征在于,
每一智能角色与至少一个免唤醒关键词相关联;
所述获取通过输入设备输入的信号包括:通过语音输入设备采集语音信号;
其中,若采集到的语音信号与任一其他智能角色的免唤醒关键词相一致,所述采集到的语音信号用于触发切换至目标智能角色,而所述目标智能角色为与所述采集到的语音信号相一致的免唤醒关键词所关联的智能角色;其中,所述任一其他智能角色为非当前智能角色。
3.如权利要求1所述的方法,其特征在于,
所述获取通过输入设备输入的信号包括:通过语音输入设备在预设时间窗内接收第一语音信号;
所述方法还包括:
根据接收的所述第一语音信号获得结构化参数;
根据所述结构化参数确定对应的操作;
其中,若所述结构化参数包含表征切换智能角色的命令内容以及智能角色名称,则所述结构化参数对应的语音信号用于触发切换至目标智能角色,而根据所述结构化参数确定对应的操作包括:从当前智能角色切换至目标智能角色,所述智能角色名称对应的智能角色为所述目标智能角色。
4.如权利要求1所述的方法,其特征在于,所述获取通过输入设备输入的信号包括:接收通过非语音输入设备输入的智能角色切换指令;
其中,所述智能角色切换指令用于触发切换至目标智能角色;
所述智能角色切换指令至少包含智能角色标识;所述智能角色切换指令包含的智能角色标识所对应的智能角色为所述目标智能角色。
5.如权利要求1所述的方法,其特征在于,在切换至所述目标智能角色后,所述方法还包括:
所述目标智能角色通过所述输入设备接收输入的信号;
针对切换后通过所述输入设备输入的信号,所述目标智能角色确定对应的反馈信息,并使用目标配置数据表现所述反馈信息;所述目标配置数据包括目标智能角色对应的配置数据。
6.如权利要求5所述的方法,其特征在于,在所述目标智能角色通过所述输入设备接收输入的信号后,所述方法还包括:
针对切换后通过所述输入设备输入的信号,所述目标智能角色确定对应的目标操作并执行。
7.如权利要求6所述的方法,其特征在于,
所述多个配置类别包括:界面皮肤、智能角色形象、话术系统和声音模型中的至少两类。
8.如权利要求7所述的方法,其特征在于,不同的智能角色对应不同的本地话术系统,所述切换至所述目标智能角色包括:
切换至所述目标智能角色对应的本地话术系统。
9.如权利要求8所述的方法,其特征在于,不同智能角色对应不同的本地话术系统;每一本地话术系统包括反馈语句编号以及与反馈语句编号对应的文本;不同的本地话术系统或智能角色针对同一反馈语句编号所对应的文本不相同。
10.如权利要求8所述的方法,其特征在于,不同的智能角色对应不同的云端话术系统,所述切换至所述目标智能角色还包括:
上传所述目标智能角色的智能角色标识,以便服务器切换至所述目标智能角色对应的云端话术系统。
11.如权利要求1-10任一项所述的方法,其特征在于,任意两个所述智能角色在作为所述目标智能角色时,针对同一输入信号所确定的反馈信息是相同的,但使用不同的目标配置数据表现所述反馈信息。
12.一种信息处理系统,其特征在于,至少用于智能角色的切换,所述智能角色用于人机交互,每一智能角色对应多个用于人机交互的配置类别,任意两个所述智能角色在至少一个所述配置类别上具有不同的配置数据;
所述信息处理系统包括:
获取单元,用于获取通过输入设备输入的信号;
切换单元,用于在输入的信号用于触发切换至目标智能角色时,从当前智能角色切换至所述目标智能角色;
通知单元,用于通知其他应用所述目标智能角色的智能角色标识,以便所述其他应用将配置数据切换为与所述目标智能角色相匹配的配置数据。
13.一种切换设备,其特征在于,至少包括处理器和存储器;所述处理器通过执行所述存储器中存放的程序以及调用其他设备,执行如权利要求1-11 任一项所述的切换方法。
14.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1-11任一项所述的切换方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711009546.3A CN109725798B (zh) | 2017-10-25 | 2017-10-25 | 智能角色的切换方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711009546.3A CN109725798B (zh) | 2017-10-25 | 2017-10-25 | 智能角色的切换方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109725798A CN109725798A (zh) | 2019-05-07 |
CN109725798B true CN109725798B (zh) | 2021-07-27 |
Family
ID=66290575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711009546.3A Active CN109725798B (zh) | 2017-10-25 | 2017-10-25 | 智能角色的切换方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109725798B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110767220B (zh) * | 2019-10-16 | 2024-05-28 | 腾讯科技(深圳)有限公司 | 一种智能语音助手的交互方法、装置、设备及存储介质 |
CN111261160B (zh) * | 2020-01-20 | 2023-09-19 | 联想(北京)有限公司 | 一种信号处理方法及装置 |
CN114154491A (zh) * | 2021-11-17 | 2022-03-08 | 阿波罗智联(北京)科技有限公司 | 界面皮肤更新方法、装置、设备、介质及程序产品 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102917271A (zh) * | 2011-08-05 | 2013-02-06 | 三星电子株式会社 | 控制电子设备的方法和应用该方法的电子设备 |
CN103236259A (zh) * | 2013-03-22 | 2013-08-07 | 乐金电子研发中心(上海)有限公司 | 语音识别处理及反馈系统、语音回复方法 |
CN103443852A (zh) * | 2011-04-07 | 2013-12-11 | 微软公司 | 音频交互的消息交换 |
CN104679472A (zh) * | 2015-02-13 | 2015-06-03 | 百度在线网络技术(北京)有限公司 | 人机语音交互方法和装置 |
CN105709416A (zh) * | 2016-03-14 | 2016-06-29 | 上海科睿展览展示工程科技有限公司 | 对多用户操作游戏的个性化配音方法及系统 |
CN106020763A (zh) * | 2015-03-26 | 2016-10-12 | 三星电子株式会社 | 用于提供内容的方法和电子设备 |
CN107223280A (zh) * | 2017-03-03 | 2017-09-29 | 深圳前海达闼云端智能科技有限公司 | 机器人唤醒方法、装置和机器人 |
CN107340991A (zh) * | 2017-07-18 | 2017-11-10 | 百度在线网络技术(北京)有限公司 | 语音角色的切换方法、装置、设备以及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9400634B2 (en) * | 2013-10-28 | 2016-07-26 | Google Technology Holdings LLC | Systems and methods for communicating notifications and textual data associated with applications |
CN107289964B (zh) * | 2016-03-31 | 2020-04-14 | 高德信息技术有限公司 | 一种导航语音播报方法及装置 |
CN106328139A (zh) * | 2016-09-14 | 2017-01-11 | 努比亚技术有限公司 | 一种语音交互的方法和系统 |
-
2017
- 2017-10-25 CN CN201711009546.3A patent/CN109725798B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103443852A (zh) * | 2011-04-07 | 2013-12-11 | 微软公司 | 音频交互的消息交换 |
CN102917271A (zh) * | 2011-08-05 | 2013-02-06 | 三星电子株式会社 | 控制电子设备的方法和应用该方法的电子设备 |
CN103236259A (zh) * | 2013-03-22 | 2013-08-07 | 乐金电子研发中心(上海)有限公司 | 语音识别处理及反馈系统、语音回复方法 |
CN104679472A (zh) * | 2015-02-13 | 2015-06-03 | 百度在线网络技术(北京)有限公司 | 人机语音交互方法和装置 |
CN106020763A (zh) * | 2015-03-26 | 2016-10-12 | 三星电子株式会社 | 用于提供内容的方法和电子设备 |
CN105709416A (zh) * | 2016-03-14 | 2016-06-29 | 上海科睿展览展示工程科技有限公司 | 对多用户操作游戏的个性化配音方法及系统 |
CN107223280A (zh) * | 2017-03-03 | 2017-09-29 | 深圳前海达闼云端智能科技有限公司 | 机器人唤醒方法、装置和机器人 |
CN107340991A (zh) * | 2017-07-18 | 2017-11-10 | 百度在线网络技术(北京)有限公司 | 语音角色的切换方法、装置、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109725798A (zh) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110381389B (zh) | 一种基于人工智能的字幕生成方法和装置 | |
US11302302B2 (en) | Method, apparatus, device and storage medium for switching voice role | |
CN110634483B (zh) | 人机交互方法、装置、电子设备及存储介质 | |
KR102309540B1 (ko) | 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법 | |
US11830482B2 (en) | Method and apparatus for speech interaction, and computer storage medium | |
EP2933607A1 (en) | Navigation system having language category self-adaptive function and method of controlling the system | |
CN110493123B (zh) | 即时通讯方法、装置、设备及存储介质 | |
CN107291704B (zh) | 处理方法和装置、用于处理的装置 | |
CN109725798B (zh) | 智能角色的切换方法及相关装置 | |
WO2016203805A1 (ja) | 情報処理装置、情報処理システム、情報処理方法及びプログラム | |
CN108806688A (zh) | 智能电视的语音控制方法、智能电视、系统及存储介质 | |
CN106383590A (zh) | 一种智能输入的方法及装置 | |
CN108055617A (zh) | 一种麦克风的唤醒方法、装置、终端设备及存储介质 | |
CN108345625B (zh) | 一种信息挖掘方法和装置、一种用于信息挖掘的装置 | |
EP3734472A1 (en) | Method and device for text processing | |
CN117253478A (zh) | 一种语音交互方法和相关装置 | |
CN109814730B (zh) | 输入方法和装置、用于输入的装置 | |
CN110866410B (zh) | 多语言转换方法、装置、计算机设备及存储介质 | |
CN109550256A (zh) | 虚拟角色调整方法、装置和存储介质 | |
CN111816168A (zh) | 一种模型训练的方法、语音播放的方法、装置及存储介质 | |
CN112631435A (zh) | 一种输入方法、装置、设备及存储介质 | |
CN114360510A (zh) | 一种语音识别方法和相关装置 | |
CN111381685A (zh) | 一种句联想方法和装置 | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
CN117424956A (zh) | 设置项处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |