CN111667823B - 智能体装置、智能体装置的控制方法及存储介质 - Google Patents
智能体装置、智能体装置的控制方法及存储介质 Download PDFInfo
- Publication number
- CN111667823B CN111667823B CN202010141245.1A CN202010141245A CN111667823B CN 111667823 B CN111667823 B CN 111667823B CN 202010141245 A CN202010141245 A CN 202010141245A CN 111667823 B CN111667823 B CN 111667823B
- Authority
- CN
- China
- Prior art keywords
- function
- agent
- occupant
- unit
- added
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000004044 response Effects 0.000 claims abstract description 87
- 230000006870 function Effects 0.000 claims description 505
- 238000012545 processing Methods 0.000 claims description 34
- 239000003795 chemical substances by application Substances 0.000 description 424
- 238000004891 communication Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 20
- 238000003058 natural language processing Methods 0.000 description 9
- 239000008186 active pharmaceutical agent Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000004807 localization Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/44—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for communication between vehicles and infrastructures, e.g. vehicle-to-cloud [V2C] or vehicle-to-home [V2H]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
提供一种智能体装置、智能体装置的控制方法及存储介质。智能体装置(100)具备:多个智能体功能部(150‑1~150‑3),它们根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;以及选择部(122),其选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部,在对所述多个智能体功能部中的1个智能体功能部追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,所述选择部相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
Description
技术领域
本发明涉及智能体装置、智能体装置的控制方法及存储介质。
背景技术
以往,公开了与智能体相关的技术,该智能体一边与车辆的乘员进行对话,一边提供与乘员的要求相应的驾驶支援相关的信息、车辆的控制、其他应用程序等(例如,参照日本特开2006-335231号公报)。
发明内容
发明要解决的课题
近年来,关于多个智能体向车辆的搭载,正在推进实用化。另外,存在智能体能够执行的功能被逐次更新的情况。然而,存在如下情况:即便对某个智能体追加了新功能,在存在早已能够执行该新功能的其他智能体的情况下,也难以使乘员利用被追加了新功能的智能体来执行新功能。
本发明的目的之一在于,提供一种能够使得乘员容易使用新功能的智能体装置、智能体装置的控制方法及存储介质。
用于解决课题的方案
本发明的智能体装置、智能体装置的控制方法及存储介质采用了以下的结构。
(1):本发明的一方案的智能体装置,其具备:多个智能体功能部,它们根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;以及选择部,其选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部,所述选择部在所述多个智能体功能部中的1个智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
(2):本发明的另一方案的智能体装置具备:多个智能体功能部,它们根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;以及选择部,其选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部,所述多个智能体功能部中包括车辆智能体功能部,该车辆智能体功能部具有指示车辆设备进行动作的功能,所述选择部在所述多个智能体功能部中的所述车辆智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的所述车辆智能体功能部而产生的功能向所述乘员提供。
(3):在上述(1)或(2)的方案中,所述选择部即便对于指定了所述多个智能体功能部中的特定的智能体功能部的提问,在向所述乘员提供新追加的所述功能的情况下,也相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
(4):在上述(1)~(3)的任一方案中,所述智能体功能部在所述多个智能体功能部中的至少1个智能体功能部被追加了新的功能的情况下,对不确定所述新的功能的详情的询问进行响应,向所述乘员提供与新追加的所述功能相关的信息。
(5):在上述(1)~(4)的任一方案中,所述智能体功能部在所述多个智能体功能部中的至少1个智能体功能部被追加了新的功能的情况下,在正进行与所述新的功能无关的响应时,向所述乘员提供与新追加的所述功能相关的信息。
(6):本发明的另一方案的智能体装置的控制方法,计算机使多个智能体功能部中的任意智能体功能部启动,作为启动了的所述智能体功能部的功能而进行如下处理:根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部;以及在所述多个智能体功能部中的1个智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
(7):本发明的另一方案的存储介质,其存储有程序,所述程序让计算机使多个智能体功能部中的任意智能体功能部启动,作为启动了的所述智能体功能部的功能而进行如下处理:根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部;以及在所述多个智能体功能部中的1个智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
发明效果
根据上述(1)~(7)的方案,能够使得用户容易使用新功能。
附图说明
图1是包含智能体装置的智能体系统的结构图。
图2是示出第一实施方式的智能体装置的结构和搭载于车辆的设备的图。
图3是示出显示·操作装置的配置例的图。
图4是示出扬声器单元的配置例的图。
图5是示出功能一览信息的内容的一例的图。
图6是用于对声像定位的位置确定的原理进行说明的图。
图7是示出智能体服务器的结构和智能体装置的结构的一部分的图。
图8是示出提供地图检索功能的情况下的智能体和乘员的对话的一例的图。
图9是示出智能体针对包含唤醒词的讲话进行的回答的一例的图。
图10是示出智能体装置的动作的一系列的流程的流程图。
图11是示出对智能体功能部附加了优先级的情况下的智能体装置的动作的一系列的流程的流程图。
图12是示出提供与新追加的功能相关的信息的情况下的智能体和乘员的对话的一例的图。
图13是示出智能体装置的介绍未执行的功能的处理的一系列的流程的流程图。
附图标记说明:
1…智能体系统,10…话筒,20…显示·操作装置,22…第一显示器,24…第二显示器,30…扬声器单元,32…放大器,34…混音器,40…导航装置,50…车辆设备,60…车载通信装置,70…通用通信装置,80…乘员识别装置,100…智能体装置,110…管理部,112…声响处理部,114…按每个智能体WU判定部,116…显示控制部,118…声音控制部,120…功能确定部,122…选择部,150、150-1、150-2、150-3…智能体功能部,152…配对应用执行部,160…存储部,162…功能一览信息,200、200-1、200-2、200-3…智能体服务器,210…通信部,220…声音识别部,222…自然语言处理部,224…对话管理部,226…网络检索部,228…响应文生成部,250…存储部,252…个人简介,300…网页服务器。
具体实施方式
以下,参照附图,对本发明的智能体装置、智能体装置的控制方法及存储介质的实施方式进行说明。智能体装置是实现智能体系统的一部分或全部的装置。以下,作为智能体装置的一例,对搭载于车辆(以下,车辆M)并具备多个种类的智能体功能的智能体装置进行说明。所谓智能体功能,例如是如下功能:一边与车辆M的乘员进行对话,一边进行基于乘员的讲话中所包含的要求(指令)的各种信息提供,或者居间于网络服务的功能。多个种类的智能体的各自起到的功能、处理步骤、控制、输出形态·内容也可以分别不同。另外,智能体功能中,也可以存在具有进行车辆内的设备(例如与驾驶控制、车身控制相关的设备)的控制等的功能的智能体功能。
智能体功能例如除了识别乘员的声音的声音识别功能(将声音文本化的功能)之外,还综合地利用自然语言处理功能(理解文本的构造、意思的功能)、对话管理功能、经由网络而检索其他装置或检索自身装置所持有的规定的数据库的网络检索功能等来实现。这些功能的一部分或全部可以利用AI(Artificial Intelligence)技术来实现。另外,用于进行这些功能的结构的一部分(尤其是,声音识别功能、自然语言处理解释功能)也可以搭载于能够与车辆M的车载通信装置或被带入到车辆M中的通用通信装置进行通信的智能体服务器(外部装置)。在以下的说明中,将结构的一部分搭载于智能体服务器且智能体装置与智能体服务器协同配合地实现智能体系统作为前提。另外,将智能体装置与智能体服务器协同配合而假想地出现的服务提供主体(服务·实体)称作智能体。
<整体结构>
图1是包含智能体装置100的智能体系统1的结构图。智能体系统1例如具备智能体装置100和多个智能体服务器200-1、200-2、200-3、…。附图标记的末尾的连字符以下数字设为用于区分智能体的标识符。在不对是哪一个智能体服务器进行区分的情况下,存在简称作智能体服务器200的情况。在图1中示出了3个智能体服务器200,但是,智能体服务器200的数量既可以是2个,也可以是4个以上。各智能体服务器200由互不相同的智能体系统的提供者运营。因此,本发明中的智能体,是由互不相同的提供者实现的智能体。作为提供者,例如可以举出机动车制造商、网络服务商、电子商贸商、便携终端的销售者及制造者等,任意的主体(法人、团体、个人等)都能够成为智能体系统的提供者。
智能体装置100经由网络NW而与智能体服务器200通信。网络NW例如包括互联网、蜂窝网、Wi-Fi网、WAN(Wide Area Network)、LAN(Local Area Network)、公用线路、电话线、无线基地站等中的一部分或全部。网络NW连接有各种网页服务器300,智能体服务器200或智能体装置100能够经由网络NW而从各种网页服务器300取得网页。
智能体装置100与车辆M的乘员进行对话,将来自乘员的声音向智能体服务器200发送,将从智能体服务器200得到的回答以声音输出、图像显示的形式向乘员提示。
<第一实施方式>
[车辆]
图2是示出第一实施方式的智能体装置100的结构和搭载于车辆M的设备的图。在车辆M例如搭载有一个以上的话筒10、显示·操作装置20、扬声器单元30、导航装置40、车辆设备50、车载通信装置60、乘员识别装置80、及智能体装置100。另外,存在智能手机等通用通信装置70被带入到车室内,作为通信装置而被使用的情况。这些装置通过CAN(Controller Area Network)通信线等多路通信线、串行通信线、无线通信网等而互相连接。需要说明的是,图2所示的结构只不过是一例,既可以省略结构的一部分,也可以还追加别的结构。
话筒10是收集在车室内产生的声音的收音部。显示·操作装置20是显示图像并且能够接受输入操作的装置(或装置群)。显示·操作装置20例如包括作为触摸面板而构成的显示器装置。显示·操作装置20也可以还包括HUD(Head Up Display)、机械式的输入装置。扬声器单元30例如包括配设于车室内的互不相同的位置的多个扬声器(声音输出部)。显示·操作装置20也可以在智能体装置100和导航装置40中共用。关于它们的详情后述。
导航装置40具备导航HMI(Human machine Interface)、GPS(Global PositioningSystem)等位置测定装置、存储有地图信息的存储装置、及进行路径搜索等的控制装置(导航控制器)。话筒10、显示·操作装置20及扬声器单元30中的一部分或全部可以作为导航HMI而被使用。导航装置40搜索用于从由位置测定装置确定出的车辆M的位置移动至由乘员输入的目的地的路径(导航路径),使用导航HMI输出引导信息,以便车辆M能够沿着路径行驶。路径搜索功能也可以处于能够经由网络NW访问的导航服务器中。在该情况下,导航装置40从导航服务器取得路径而输出引导信息。需要说明的是,智能体装置100也可以以导航控制器为基础而构筑,在该情况下,导航控制器与智能体装置100硬件上构成为一体。
车辆设备50例如包括发动机、行驶用马达等驱动力输出装置、发动机的启动马达、车门锁定装置、车门开闭装置、车窗、车窗的开闭装置及车窗的开闭控制装置、座椅、座椅位置的控制装置、车室内后视镜及其角度位置控制装置、车辆内外的照明装置及其控制装置、刮水器、除雾器及各自的控制装置、方向指示灯及其控制装置、空调装置、以及管理行驶距离信息、车辆位置信息或轮胎的空气压信息、燃料的剩余量信息等与车辆相关的信息的车辆信息装置等。
车载通信装置60例如是能够利用蜂窝网、Wi-Fi网访问网络NW的无线通信装置。
乘员识别装置80例如包括就座传感器、车室内相机、图像识别装置等。就座传感器包括设置于座位的下部的压力传感器、安装于座椅安全带的张力传感器等。车室内相机是设置于车室内的CCD(Charge Coupled Device)相机、CMOS(Complementary Metal OxideSemiconductor)相机。图像识别装置对车室内相机的图像进行解析,识别每个座位的乘员的有无、面部朝向等。在本实施方式中,乘员识别装置80是就座位置识别部的一例。
图3是示出显示·操作装置20的配置例的图。显示·操作装置20例如包括第一显示器22、第二显示器24、操作开关ASSY(操作开关组)26。显示·操作装置20也可以还包括HUD28。
在车辆M中,例如存在设置有转向盘SW的驾驶员座DS、和相对于驾驶员座DS设置于车宽方向(图中Y方向)上的副驾驶员座AS。第一显示器22是从仪表板中的驾驶员座DS与副驾驶员座AS的中间附近延伸至与副驾驶员座AS的左端部对置的位置的横长形状的显示器装置。第二显示器24设置于驾驶员座DS与副驾驶员座AS的车宽方向上的中间附近且第一显示器的下方。例如,第一显示器22和第二显示器24均作为触摸面板而构成,作为显示部而具备LCD(Liquid Crystal Display)、有机EL(Electroluminescence)、等离子体显示器等。操作开关ASSY26是拨码开关、按钮式开关等集聚而成的。显示·操作装置20将由乘员进行的操作的内容向智能体装置100输出。第一显示器22或第二显示器24显示的内容可以由智能体装置100决定。
图4是示出扬声器单元30的配置例的图。扬声器单元30例如包括扬声器30A~30H。扬声器30A设置于驾驶员座DS侧的窗柱(所谓的A柱)。扬声器30B设置于靠近驾驶员座DS的车门的下部。扬声器30C设置于副驾驶员座AS侧的窗柱。扬声器30D设置于靠近副驾驶员座AS的车门的下部。扬声器30E设置于靠近右侧后部座位BS1侧的车门的下部。扬声器30F设置于靠近左侧后部座位BS2侧的车门的下部。扬声器30G设置于第二显示器24的附近。扬声器30H设置于车室的顶棚(roof)。
在该配置中,例如,在专门使扬声器30A及30B输出了声音的情况下,声像会定位于驾驶员座DS附近。另外,在专门使扬声器30C及30D输出了声音的情况下,声像会定位于副驾驶员座AS附近。另外,在专门使扬声器30E输出了声音的情况下,声像会定位于右侧后部座位BS1附近。另外,在专门使扬声器30F输出了声音的情况下,声像会定位于左侧后部座位BS2附近。另外,在专门使扬声器30G输出了声音的情况下,声像会定位于车室的前方附近,在专门使扬声器30H输出了声音的情况下,声像会定位于车室的上方附近。不限定于此,扬声器单元30能够通过使用混音器、放大器调整各扬声器输出的声音的分配,来使声像定位于车室内的任意的位置。
[智能体装置]
返回图2,智能体装置100具备管理部110、智能体功能部150-1、150-2、150-3、配对应用执行部152、存储部160。管理部110例如具备声响处理部112、按每个智能体WU(WakeUp)判定部114、显示控制部116、声音控制部118、功能确定部120、选择部122。在不对是哪一个智能体功能部进行区分的情况下,简称作智能体功能部150。示出了3个智能体功能部150,这不过是与图1中的智能体服务器200的数量对应的一例,智能体功能部150的数量也可以是2个,还可以是4个以上。图2所示的软件配置是为了说明而简易地示出,实际上,能够像例如也可以在智能体功能部150与车载通信装置60之间介入有管理部110那样任意地改变。
智能体装置100的各构成要素例如通过由CPU(Central Processing Unit)等硬件处理器执行程序(软件)来实现。这些构成要素中的一部分或全部既可以通过LSI(LargeScale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等硬件(包括电路部;circuitry)来实现,也可以通过软件与硬件的协同配合来实现。程序既可以预先保存于HDD(Hard Disk Drive)、闪存器等存储装置(具备非暂时性的存储介质的存储装置)中,也可以保存于DVD、CD-ROM等可装卸的存储介质(非暂时性的存储介质)并通过将存储介质装配于驱动装置而进行安装。存储部160通过前述的存储装置来实现。在存储部160中例如存储功能一览信息162。
图5是示出功能一览信息162的内容的一例的图。功能一览信息162是智能体能够执行的功能、变得能够执行该功能的日子(图示的、能够执行日)及该功能的执行履历针对每个智能体而分别建立了对应关系的信息。对于执行履历,例如与表示乘员是“已执行”功能还是“未执行”功能的信息建立对应关系,关于乘员哪怕利用了一次的功能,也与表示“已执行”的信息建立对应关系。功能一览信息162的内容例如每当功能存在更新(例如,每当追加新的功能)、或者每隔规定的时间间隔由智能体服务器200更新。
在图5中,对于智能体1,表示地图检索功能、声音播放功能、接龙功能的信息互相建立了对应关系,关于任一功能,执行履历都是表示“未执行”的信息。另外,对于智能体2,表示地图检索功能、音乐播放功能的信息建立了对应关系,是表示地图检索功能“已执行”的信息,是表示音乐播放功能“未执行”的信息。另外,对于智能体3,表示地图检索功能、音乐播放功能的信息建立了对应关系,关于任一功能,执行履历都是表示“已执行”的信息。关于智能体1~3的详情后述。
管理部110通过执行OS(Operating System)、中间件等程序而发挥功能。
管理部110的声响处理部112对被输入的声音进行声响处理,以使得成为适于识别针对每个智能体预先设定的唤醒词、智能体能够执行的功能的状态。
按每个智能体WU判定部114与智能体功能部150-1、150-2、150-3分别相对应地存在,识别针对每个智能体预先设定的唤醒词。按每个智能体WU判定部114从进行了声响处理的声音(声音流)识别声音的意思。首先,按每个智能体WU判定部114基于声音流中的声音波形的振幅和零交叉来检测声音区间。按每个智能体WU判定部114也可以进行通过基于混合高斯分布模型(GMM;Gaussian mixture model)的帧单位的声音识别及非声音识别实现的区间检测。
接着,按每个智能体WU判定部114将检测到的声音区间中的声音文本化,设为文字信息。然后,按每个智能体WU判定部114判定文本化了的文字信息是否符合唤醒词。在判定为是唤醒词的情况下,按每个智能体WU判定部114将表示对应的智能体功能部150的信息向选择部通知。需要说明的是,与按每个智能体WU判定部114相当的功能也可以搭载于智能体服务器200。在该情况下,管理部110将由声响处理部112进行了声响处理的声音流向智能体服务器200发送,在智能体服务器200判定为是唤醒词的情况下,按照来自智能体服务器200的指示,智能体功能部150启动。需要说明的是,各智能体功能部150可以始终启动且自行进行唤醒词的判定。在该情况下,无需管理部110具备按每个智能体WU判定部114。
功能确定部120确定乘员要求提供的智能体的功能。首先,功能确定部120基于声音流中的声音波形的振幅和零交叉来检测声音区间。功能确定部120也可以进行通过基于混合高斯分布模型的帧单位的声音识别及非声音识别实现的区间检测。接着,功能确定部120将检测到的声音区间中的声音文本化,设为文字信息。然后,功能确定部120判定文本化了的文字信息是否符合功能一览信息162的功能栏所包含的功能的名称。功能确定部120在判定为文字信息符合功能的名称的情况下,将该功能确定为乘员要求提供的智能体的功能。
需要说明的是,功能确定部120也可以每当功能被确定时,向各智能体功能部150询问功能的名称、功能的发布日及执行履历等。在该情况下,也可以在存储部160中不存储功能一览信息162。
选择部122选择由按每个智能体WU判定部114识别到唤醒词的智能体功能部150或实现由功能确定部120确定出的功能的(即,与乘员的讲话相对应的)智能体功能部150。关于选择部122选择智能体功能部150的处理的详情后述。选择部122向所选择的智能体功能部150发送声音流。选择部122使所选择的智能体功能部150启动。
智能体功能部150与对应的智能体服务器200协同配合而使智能体出现,与车辆的乘员的讲话相应地,提供包含使输出部输出基于声音的响应的服务。在智能体功能部150中可以包含被赋予了控制车辆设备50的权限的功能部。另外,智能体功能部150中可以存在经由配对应用执行部152而与通用通信装置70协作来与智能体服务器200通信的功能部。例如,对智能体功能部150-1赋予了控制车辆设备50的权限。智能体功能部150-1经由车载通信装置60而与智能体服务器200-1通信。智能体功能部150-2经由车载通信装置60而与智能体服务器200-2通信。智能体功能部150-3经由配对应用执行部152而与通用通信装置70协作来与智能体服务器200-3通信。配对应用执行部152例如通过Bluetooth(注册商标)与通用通信装置70进行配对,使智能体功能部150-3与通用通信装置70连接。需要说明的是,智能体功能部150-3也可以通过利用了USB(Universal Serial Bus)等的有线通信而连接于通用通信装置70。以下,存在如下情况:将智能体功能部150-1与智能体服务器200-1协同配合而出现的智能体称作智能体1,将智能体功能部150-2与智能体服务器200-2协同配合而出现的智能体称作智能体2,将智能体功能部150-3与智能体服务器200-3协同配合而出现的智能体称作智能体3。
显示控制部116根据来自智能体功能部150的指示,使第一显示器22或第二显示器24显示图像。以下,设为使用第一显示器22。显示控制部116通过一部分的智能体功能部150的控制,例如生成在车室内进行与乘员的交流的拟人化了的智能体的图像(以下,称作智能体图像),使所生成的智能体图像显示于第一显示器22。智能体图像例如是对乘员搭话的形态的图像。智能体图像例如可以至少包含由观看者(乘员)识别表情、面部朝向的程度的面部图像。例如,智能体图像可以是,在面部区域中呈现模仿眼睛、鼻子的部件,基于面部区域中的部件的位置而识别表情、面部朝向。另外,智能体图像也可以被立体地感受,通过包含三维空间中的头部图像而由观看者识别智能体的面部朝向,通过包含主体(身躯、手脚)的图像而由观看者识别智能体的动作、举止、姿态等。另外,智能体图像也可以是动画图像。
声音控制部118根据来自智能体功能部150的指示,使扬声器单元30所包含的扬声器中的一部分或全部输出声音。声音控制部118也可以进行使用多个扬声器单元30而使智能体声音的声像定位于与智能体图像的显示位置对应的位置的控制。所谓与智能体图像的显示位置对应的位置,例如是被预测为乘员感到智能体图像正在讲出智能体声音的位置,具体而言,是智能体图像的显示位置附近(例如,2~3[cm]以内)的位置。另外,所谓声像定位,例如是通过调节向乘员的左右耳传递的声音的大小而设定乘员感到的声源的空间上的位置。
图6是用于对声像定位的位置确定的原理进行说明的图。在图6中,为了简化说明,示出了使用上述的扬声器30B、30D及30G的例子,但是,可以使用扬声器单元30所包含的任意的扬声器。声音控制部118控制连接于各扬声器的放大器(AMP)32及混音器34而使声像定位。例如,在使声像定位于图6所示的空间位置MP1的情况下,声音控制部118通过控制放大器32及混音器34,使扬声器30B进行最大强度的5%的输出,使扬声器30D进行最大强度的80%的输出,使扬声器30G进行最大强度的15%的输出。其结果是,从乘员P的位置,感到声像仿佛定位于图6所示的空间位置MP1。
另外,在使声像定位于图6所示的空间位置MP2的情况下,声音控制部118通过控制放大器32及混音器34,使扬声器30B进行最大强度的45%的输出,使扬声器30D进行最大强度的45%的输出,使扬声器30G进行最大强度的45%的输出。其结果是,从乘员P的位置,感到声像仿佛定位于图6所示的空间位置MP2。这样,通过调整设置于车室内的多个扬声器和从各扬声器输出的声音的大小,能够使声像被定位的位置变化。需要说明的是,更详细而言,声像定位的位置,基于声源原本持有的声音特性、车室内环境的信息、头部传递函数(HRTF;Head-related transfer function)而定,所以,声音控制部118通过以预先利用感官试验等得到的最佳的输出分配来控制扬声器单元30,使声像定位于规定的位置。
[智能体服务器]
图7是示出智能体服务器200的结构和智能体装置100的结构的一部分的图。以下,与智能体服务器200的结构一起,对智能体功能部150等的动作进行说明。在此,省略关于从智能体装置100到网络NW的物理上的通信的说明。
智能体服务器200具备通信部210。通信部210例如是NIC(Network InterfaceCard)等网络接口。而且,智能体服务器200例如具备声音识别部220、自然语言处理部222、对话管理部224、网络检索部226、响应文生成部228。这些构成要素例如通过由CPU等硬件处理器执行程序(软件)来实现。这些构成要素中的一部分或全部既可以通过LSI、ASIC、FPGA、GPU等硬件(包括电路部;circuitry)来实现,也可以通过软件与硬件的协同配合来实现。程序既可以预先保存于HDD、闪存器等存储装置(具备非暂时性的存储介质的存储装置)中,也可以保存于DVD、CD-ROM等可装卸的存储介质(非暂时性的存储介质)中并通过将存储介质装配于驱动装置而进行安装。
智能体服务器200具备存储部250。存储部250通过上述的各种存储装置来实现。在存储部250中保存有个人简介252、字典DB(数据库)254、知识库DB256、响应规则DB258等数据、程序。
在智能体装置100中,智能体功能部150将声音流、或进行了压缩、编码等处理的声音流向智能体服务器200发送。智能体功能部150在识别到能够进行本地处理(不经由智能体服务器200的处理)的声音指令的情况下,可以进行通过声音指令要求的处理。所谓能够进行本地处理的声音指令,是通过参照智能体装置100所具备的存储部(未图示)而能够回答的声音指令,在智能体功能部150-1的情况下是控制车辆设备50的声音指令(例如,将空调装置开启的指令等)。因此,智能体功能部150也可以具有智能体服务器200所具备的功能的一部分。
当取得声音流后,声音识别部220进行声音识别并将文本化了的文字信息输出,自然语言处理部222针对文字信息一边参照字典DB254一边进行意思解释。字典DB254中,对于文字信息,抽象化了的意思信息建立了对应关系。字典DB254也可以包含同义词、近义词的一览信息。声音识别部220的处理和自然语言处理部222的处理,可以不明确分阶段,而是接受自然语言处理部222的处理结果而声音识别部220修正识别结果等相互影响地进行。
自然语言处理部222例如在识别到“今日的天气是”、“天气怎么样”等意思作为识别结果的情况下,生成置换为标准文字信息“今日的天气”的指令。由此,即便在请求的声音存在了表述差异的情况下,也能够容易进行与要求相符的对话。另外,自然语言处理部222例如也可以使用利用了概率的机器学习处理等人工智能处理来识别文字信息的意思,生成基于识别结果的指令。
对话管理部224基于自然语言处理部222的处理结果(指令),一边参照个人简介252、知识库DB256、响应规则DB258一边决定针对车辆M的乘员的讲话的内容。个人简介252包含针对每个乘员保存着的乘员的个人信息、兴趣偏好、过去的对话的履历等。知识库DB256是规定了事物的关系性的信息。响应规则DB258是规定了针对指令而智能体应该进行的动作(回答、设备控制的内容等)的信息。
另外,对话管理部224通过使用从声音流得到的特征信息而与个人简介252进行对照,来确定乘员。在该情况下,个人简介252中,例如声音的特征信息与个人信息建立了对应关系。所谓声音的特征信息,例如是与声音的高度、语调、节奏(声音的高低的模式)等说话方式的特征、基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients)等的特征量相关的信息。声音的特征信息例如是在乘员的初始登记时使乘员对规定的单词、句子等进行发声,通过识别发出的声音而得到的信息。
对话管理部224在指令是要求能够经由网络NW而检索的信息的指令的情况下,使网络检索部226进行检索。网络检索部226经由网络NW而访问各种网页服务器300,取得期望的信息。所谓“能够经由网络NW而检索的信息”,例如是处于车辆M的周边的餐厅的基于一般用户的评价结果、与那一天的车辆M的位置相应的天气预报。
响应文生成部228以使得由对话管理部224决定的讲话的内容向车辆M的乘员传达的方式,生成响应文,并向智能体装置100发送。响应文生成部228在确定了乘员是在个人简介中登记了的乘员的情况下,也可以生成乘员的名字、设为模仿乘员的说话方式的说话方式的响应文。
智能体功能部150当取得响应文后,指示声音控制部118进行声音合成并输出声音。另外,智能体功能部150与声音输出相配合地指示显示控制部116显示智能体的图像。这样,假想地出现的智能体对车辆M的乘员进行响应的智能体功能得以实现。
[关于智能体功能部150的选择处理:无唤醒词]
以下,对选择部122选择智能体功能部150的选择处理进行说明。图8是示出提供地图检索功能的情况下的智能体和乘员的对话的一例的图。首先,乘员针对智能体进行包含要求提供地图检索功能的意旨的讲话CV1。讲话CV1例如是“启动地图检索功能”等语句。接受到该情况,选择部122例如将通过上述的处理而功能确定部120确定出的功能(该一例中,地图检索功能)作为检索关键字,对功能一览信息162进行检索,确定与该功能建立了对应关系的智能体。在图5的功能一览信息162中,与地图检索功能建立了对应关系的智能体是智能体1~3的智能体。
接着,即便在与该功能建立了对应关系的智能体中已经存在该功能的执行履历表示“已执行”的智能体的情况下,选择部122也优先地选择该功能的执行履历表示“未执行”的智能体。在图5的功能一览信息162中,表示地图检索功能“未执行”的智能体仅是智能体1。因此,作为对乘员的声音进行响应的智能体功能部,选择部122相对于智能体功能部150-2、智能体功能部150-3优先地选择智能体功能部150-1并使其启动。
由选择部122启动了的智能体功能部150(该一例中,智能体功能部150-1)从对应的智能体服务器200(该一例中,智能体服务器200-1)取得针对讲话CV1的响应文RP1,指示声音控制部118对该响应文RP1进行声音合成并输出声音。响应文RP1例如在讲话CV1中,包含介绍执行所要求的功能的智能体功能部150的智能体的语句。响应文RP1例如是“你好,我是ΔΔ(智能体1)。由我来提供地图检索功能。”等语句。
智能体功能部150-1在针对响应文RP1的乘员的讲话CV2是肯定性的内容的情况下,进行所要求的功能(该一例中,地图检索功能)的提供。另外,智能体功能部150-1在针对响应文RP1的乘员的讲话CV2是否定性的内容的情况下,对选择部122再次指示智能体功能部150的选择。在该情况下,选择部122从除了一度选择了的智能体功能部150之外的智能体功能部150中,选择提供乘员要求的功能的智能体功能部150。
[关于智能体功能部150的选择处理:有唤醒词]
接着,对乘员针对智能体进行包含唤醒词和要求提供地图检索功能的意旨的讲话CV3的情况进行说明。图9是示出针对包含唤醒词的讲话CV3的智能体的回答的一例的图。讲话CV3例如是“‘喂,○○(智能体2)’(唤醒词),启动地图检索功能?”等语句。接受到该情况,选择部122例如如上所述,确定为与地图检索功能建立了对应关系的智能体是智能体1~3。接着,即便是与该功能建立了对应关系的智能体中已经存在该功能的执行履历表示“已执行”的智能体、且存在由唤醒词指定的智能体的情况下,选择部122也优先地选择该功能的执行履历表示“未执行”的智能体。在图5的功能一览信息162中,表示地图检索功能“未执行”的智能体仅是智能体1。因此,作为对乘员的声音进行响应的智能体功能部,选择部122相对于智能体功能部150-2、智能体功能部150-3优先地选择智能体功能部150-1并使其启动。
由选择部122启动了的智能体功能部150(该一例中,智能体功能部150-1)从对应的智能体服务器200(该一例中,智能体服务器200-1)取得针对讲话CV1的响应文RP2,指示声音控制部118对该响应文RP2进行声音合成并输出声音。在此,例如在讲话CV1中包含使由选择部122启动了的智能体功能部150实现的智能体(该一例中,智能体1)以外的智能体2~3启动的唤醒词的情况下,为了防止乘员的混乱,响应文RP2包含自报启动了的智能体是智能体1的语句。另外,响应文RP2例如包含介绍所要求的功能也能够通过由选择部122启动了的智能体功能部150来执行的语句。响应文RP2例如是“你好,我是ΔΔ(智能体1)。我也能够使用地图检索功能了哦。可以的话试着使用一下?”等语句。
智能体功能部150-1在针对响应文RP2的乘员的讲话CV4是肯定性的内容的情况下,进行所要求的功能(该一例中,地图检索功能)的提供。另外,智能体功能部150-1在针对响应文RP2的乘员的讲话CV4是否定性的内容的情况下,对选择部122再次指示智能体功能部150的选择。在该情况下,选择部122从除了一度选择了的智能体功能部150之外的智能体功能部150中,选择提供乘员要求的功能的智能体功能部150。
如以上所说明那样,根据本实施方式的智能体装置100,具有新功能的智能体优先地进行乘员的应对,能够使得乘员容易使用新功能。
[动作流程]
图10是示出智能体装置100的动作的一系列的流程的流程图。首先,声响处理部112针对由话筒10收集到的声音进行声响处理(步骤S100)。接着,功能确定部120基于被进行了声响处理的声音流,确定乘员要求提供的智能体的功能(步骤S102)。选择部122判定能够执行由功能确定部120确定出的功能的智能体的有无(步骤S104)。选择部122在不存在能够实现确定出的功能的智能体的情况下,根据规定的规则选择/启动智能体功能部150,向启动了的智能体功能部150提供声音流(步骤S106)。规定的规则例如是基于预先设定的选择顺序来选择智能体功能部150的规则、随机选择智能体功能部150的规则。
与此相应地,智能体服务器200生成用于向乘员回答无法提供功能的意旨的响应文,向管理部110提供。接着,智能体功能部150取得由智能体服务器200提供的响应文(步骤S108)。接着,智能体功能部150判定智能体的任务是否结束了(步骤S110)。例如,智能体功能部150在被提供了针对乘员的讲话的响应文的情况下,判定为任务结束了。声音控制部118对由智能体功能部150-1取得的响应文进行声音合成并输出声音(步骤S112)。
选择部122在判定为存在能够实现确定出的功能的智能体的情况下,判定在该智能体中,是否存在该功能的执行履历表示“未执行”的智能体(步骤S114)。选择部122判定为不存在功能的执行履历表示“未执行”的智能体的情况下,从执行履历表示“已执行”的智能体功能中,根据规定的规则,选择实现所要求的功能的智能体功能部150(步骤S116)。选择部122向所选择的智能体功能部150提供声音流(步骤S118)。
与此相应地,智能体服务器200生成用于向乘员回答智能体提供所要求的功能的意旨的响应文,向管理部110提供。接着,所选择的智能体功能部150取得由智能体服务器200提供的响应文(步骤S120)。接着,智能体功能部150判定智能体的任务是否结束了(步骤S122)。例如,智能体功能部150在被提供了针对乘员的讲话的响应文的情况下,判定为任务结束了。声音控制部118对由智能体功能部150取得的响应文进行声音合成并输出声音(步骤S124)。
选择部122在判定为存在表示“未执行”的智能体的情况下,向实现确定出的智能体的智能体功能部150提供声音流(步骤S126)。需要说明的是,选择部122在判定为存在表示“未执行”的智能体的情况下,也可以根据规定的规则,选择实现确定出的智能体的智能体功能部150中的、实现所要求的功能的智能体功能部150。
与此相应地,智能体服务器200生成用于向乘员回答该智能体提供所要求的功能的意旨的响应文,向管理部110提供。接着,智能体功能部150取得由智能体服务器200提供的响应文(步骤S128)。接着,智能体功能部150判定智能体的任务是否结束了(步骤S130)。声音控制部118对由智能体功能部150取得的响应文进行声音合成并输出声音(步骤S132)。
[关于智能体功能部150的优先级]
需要说明的是,选择部122在存在多个表示乘员所要求的功能“未执行”的智能体功能部150的情况下,也可以基于对各智能体功能部150附加的优先级,来选择智能体功能部150。多个智能体功能部150中的被附加高的优先级的智能体功能部150例如是具有指示车辆设备50动作的功能的车辆智能体功能部(该一例中,智能体功能部150-1)。以下,设为优先级最高的智能体功能部150是智能体功能部150-1,与其他智能体功能部150的优先级的关系是,智能体功能部150-1>智能体功能部150-2>智能体功能部150-3。
例如,选择部122在乘员所要求的功能是“音乐播放功能”的情况下,执行履历表示“未执行”的智能体是智能体1~2,但是,实现智能体1的智能体功能部150-1与实现智能体2的智能体功能部150-2相比优先级高,所以,选择智能体功能部150-1。
如以上所说明那样,根据本实施方式的智能体装置100,特定的智能体优先地进行乘员的应对,能够增加乘员与惯用的智能体对话的机会。
[动作流程]
图11是示出对智能体功能部150附加了优先级的情况下的智能体装置100的动作的一系列的流程的流程图。需要说明的是,关于与图10所示的步骤编号同样的处理,标注同一步骤编号并省略说明。
选择部122判定为存在功能的执行履历表示“未执行”的智能体的情况下,判定在该智能体中是否包含优先级高的智能体(该一例中,智能体1)(步骤S200)。选择部122在判定为在智能体中包含智能体1的情况下,向实现优先级高的智能体1的智能体功能部150-1提供声音流(步骤S202)。与此相应地,智能体服务器200-1生成用于向乘员回答智能体1提供所要求的功能的意旨的响应文,并向管理部110提供。接着,智能体功能部150取得由智能体服务器200提供的响应文(步骤S204)。接着,智能体功能部150判定智能体的任务是否结束了(步骤S206)。例如,智能体功能部150在被提供了针对乘员的讲话的响应文的情况下,判定为任务结束了。声音控制部118对由智能体功能部150取得的响应文进行声音合成并输出声音(步骤S208)。
选择部122在步骤S114中判定为不存在功能的执行履历表示“未执行”的智能体的情况下,或判定为在能够实现确定出的功能的智能体中不包含智能体1的情况下,根据规定的规则,选择实现所要求的功能的智能体功能部150(步骤S210)。规定的规则例如是基于预先设定的选择顺序来选择智能体功能部150的规则、随机选择智能体功能部150的规则、选择执行履历表示“已执行”的智能体中的、优先级高的智能体的智能体功能部150的规则。选择部122向实现所选择的智能体的智能体功能部150提供声音流(步骤S212)。
与此相应地,智能体服务器200生成用于向乘员回答该智能体提供所要求的功能的意旨的响应文,并向管理部110提供。接着,智能体功能部150取得由智能体服务器200提供的响应文(步骤S214)。接着,智能体功能部150判定智能体的任务是否结束了(步骤S216)。声音控制部118对由智能体功能部150取得的响应文进行声音合成并输出声音(步骤S218)。
[关于提供与新追加的功能相关的信息的处理:存在询问的情况]
另外,智能体功能部150在被追加了新的功能的情况下,也可以将与该新追加的功能相关的信息向乘员提供。图12是示出提供与新追加的功能相关的信息的情况下的智能体和乘员的对话的一例的图。首先,乘员针对智能体,进行关于智能体的新追加的功能询问的讲话CV3。讲话CV3例如是“有什么新的功能吗?”等语句。接受到该情况,功能确定部120判定文本化了的文字信息是否包含“新的功能”等词句。功能确定部120例如在文本化了的文字信息中包含“新的功能”等词句的情况下,判定为乘员关于智能体的新追加的功能进行了询问。
选择部122在由功能确定部120判定为乘员关于智能体的新追加的功能进行了询问的情况下,确定功能一览信息162中的、执行履历为“未执行”的功能。在图5中,执行履历为“未执行”的功能例如是智能体1能够执行的接龙功能。作为对乘员的声音进行响应的智能体功能部,选择部122选择智能体功能部150-1并使其启动。
由选择部122启动了的智能体功能部150(该一例中,智能体功能部150-1)从对应的智能体服务器200(该一例中,智能体服务器200-1)取得针对讲话CV3的响应文RP2,指示声音控制部118对该响应文RP2进行声音合成并输出声音。响应文RP2例如包含介绍新追加的功能能够通过由选择部122启动了的智能体功能部150来执行的语句。响应文RP2例如是“你好,我是ΔΔ(智能体1)。我能够执行‘接龙功能’了。您要使用吗?”等语句。
智能体功能部150-1在针对响应文RP2的乘员的讲话CV4是肯定性的内容的情况下,进行所要求的功能(该一例中,接龙功能)的提供。另外,智能体功能部150-1在针对响应文RP2的乘员的讲话CV4是否定性的内容的情况下,对选择部122再次指示智能体功能部150的选择。在该情况下,选择部122选择除了一度选择了的功能之外的功能且是使用履历为“未执行”的功能,选择能够执行该功能的智能体功能部150。
如以上所说明那样,根据本实施方式的智能体装置100,向乘员介绍新功能,使得乘员容易使用新功能。
[动作流程]
图13是示出智能体装置100的介绍未执行的功能的处理的一系列的流程的流程图。首先,声响处理部112针对由话筒10收集到的声音进行声响处理(步骤S300)。接着,功能确定部120基于进行了声响处理的声音流,判定乘员是否进行了追加功能的询问(步骤S302)。智能体装置100在乘员没有进行追加功能的询问的情况下,结束图13的流程图的处理。功能确定部120在判定为乘员进行了追加功能的询问的情况下,基于功能一览信息162,判定未执行的智能体的功能的有无(步骤S304)。声音控制部118在由功能确定部120判定为没有未执行的智能体的功能的情况下,对通知没有追加功能的意旨的响应文进行声音合成并输出声音(步骤S306)。功能确定部120例如指示智能体功能部150生成通知没有追加功能的响应文,从该智能体功能部150接受响应文的提供。通知没有追加功能的响应文既可以从优先级最高的智能体功能部150接受提供,也可以从其他智能体功能部150接受提供。
功能确定部120向具有未执行的功能的智能体功能部150提供声音流(步骤S308)。与此相应地,智能体服务器200生成用于向乘员回答该智能体提供所要求的功能的意旨的响应文,并向管理部110提供。接着,智能体功能部150取得由智能体功能部150提供的响应文(步骤S310)。接着,智能体功能部150判定智能体的任务是否结束了(步骤S312)。声音控制部118对由智能体功能部150取得的响应文进行声音合成并输出声音(步骤S314)。
[关于提供与新追加的功能相关的信息的处理:没有询问的情况下]
需要说明的是,上述中,智能体功能部150在从乘员产生了追加功能的询问的情况下向乘员提供与该新追加的功能相关的信息的情况进行了说明,但不限定于此。智能体功能部150例如在正在进行与新追加的功能无关的响应(例如,杂谈)时,也可以向乘员提供与新追加的功能相关的信息。例如,在新追加的功能是“接龙功能”且智能体功能部150正在对乘员进行“地图检索功能”的响应的情况下,智能体功能部150在结束了地图检索功能的响应之后,也可以通过进行“这么说来,我能够执行“接龙功能”了。您要使用吗?”等响应,来向乘员提供与新追加的功能相关的信息。
以上使用实施方式说明了本发明的具体实施方式,但本发明丝毫不被这样的实施方式限定,在不脱离本发明的主旨的范围内能够施加各种变形及替换。
Claims (6)
1.一种智能体装置,其中,
所述智能体装置具备:
多个智能体功能部,它们根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;以及
选择部,其选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部,
所述选择部在所述多个智能体功能部中的1个智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供,
所述选择部即便对于指定了所述多个智能体功能部中的特定的智能体功能部的提问,在向所述乘员提供新追加的所述功能的情况下,也相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
2.一种智能体装置,其中,
所述智能体装置具备:
多个智能体功能部,它们根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;以及
选择部,其选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部,
所述多个智能体功能部中包括车辆智能体功能部,该车辆智能体功能部具有指示车辆设备进行动作的功能,
所述选择部在所述多个智能体功能部中的所述车辆智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的所述车辆智能体功能部而产生的功能向所述乘员提供,
所述选择部即便对于指定了所述多个智能体功能部中的特定的智能体功能部的提间,在向所述乘员提供新追加的所述功能的情况下,也相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
3.根据权利要求1或2所述的智能体装置,其中,
所述智能体功能部在所述多个智能体功能部中的至少1个智能体功能部被追加了新的功能的情况下,对不确定所述新的功能的详情的询问进行响应,向所述乘员提供与新追加的所述功能相关的信息。
4.根据权利要求1或2所述的智能体装置,其中,
所述智能体功能部在所述多个智能体功能部中的至少1个智能体功能部被追加了新的功能的情况下,在正进行与所述新的功能无关的响应时,向所述乘员提供与新追加的所述功能相关的信息。
5.一种智能体装置的控制方法,其中,
计算机使多个智能体功能部中的任意智能体功能部启动,作为启动了的所述智能体功能部的功能而进行如下处理:
根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;
选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部;以及
在所述多个智能体功能部中的1个智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供,
即便对于指定了所述多个智能体功能部中的特定的智能体功能部的提问,在向所述乘员提供新追加的所述功能的情况下,也相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
6.一种存储介质,其存储有程序,其中,
所述程序让计算机使多个智能体功能部中的任意智能体功能部启动,作为启动了的所述智能体功能部的功能而进行如下处理:
根据车辆的乘员的讲话,提供包含使输出部输出通过声音进行的响应的服务;
选择所述多个智能体功能部中的、与所述乘员的讲话对应的智能体功能部;以及
在所述多个智能体功能部中的1个智能体功能部被追加了新的功能的情况下,在向所述乘员提供新追加的所述功能时,相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供,
即便对于指定了所述多个智能体功能部中的特定的智能体功能部的提问,在向所述乘员提供新追加的所述功能的情况下,也相对于已经具有与新追加的所述功能相同的功能的其他智能体功能部优先地,使通过被追加了该新的功能的智能体功能部而产生的功能向所述乘员提供。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-040964 | 2019-03-06 | ||
JP2019040964A JP7175221B2 (ja) | 2019-03-06 | 2019-03-06 | エージェント装置、エージェント装置の制御方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111667823A CN111667823A (zh) | 2020-09-15 |
CN111667823B true CN111667823B (zh) | 2023-10-20 |
Family
ID=72354271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010141245.1A Active CN111667823B (zh) | 2019-03-06 | 2020-03-03 | 智能体装置、智能体装置的控制方法及存储介质 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7175221B2 (zh) |
CN (1) | CN111667823B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023218244A1 (ja) * | 2022-05-11 | 2023-11-16 | 日産自動車株式会社 | 情報提供方法及び情報提供システム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000020888A (ja) * | 1998-07-07 | 2000-01-21 | Aqueous Reserch:Kk | エージェント装置 |
JP2003022092A (ja) * | 2001-07-09 | 2003-01-24 | Fujitsu Ten Ltd | 対話システム |
JP2004021521A (ja) * | 2002-06-14 | 2004-01-22 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2008105608A (ja) * | 2006-10-26 | 2008-05-08 | Toyota Motor Corp | 車両用音声対応制御装置 |
CN101273342A (zh) * | 2005-05-10 | 2008-09-24 | 文卡特·斯里尼瓦斯·米纳瓦里 | 用于控制基于sip的电话中的多媒体功能和服务的系统和改进的方法 |
JP2013207718A (ja) * | 2012-03-29 | 2013-10-07 | Canon Inc | 画像処理装置、画像処理装置の制御方法及びプログラム |
JP2016218361A (ja) * | 2015-05-25 | 2016-12-22 | クラリオン株式会社 | 音声認識システム、車載器およびサーバ装置 |
CN107415959A (zh) * | 2016-05-17 | 2017-12-01 | 本田技研工业株式会社 | 车辆控制系统、车辆控制方法和车辆控制程序 |
JP2018054850A (ja) * | 2016-09-28 | 2018-04-05 | 株式会社東芝 | 情報処理システム、情報処理装置、情報処理方法、及びプログラム |
CN108806690A (zh) * | 2013-06-19 | 2018-11-13 | 松下电器(美国)知识产权公司 | 声音对话方法及声音对话代理服务器 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4155854B2 (ja) * | 2003-03-24 | 2008-09-24 | 富士通株式会社 | 対話制御システム及び方法 |
JP4694198B2 (ja) * | 2004-12-28 | 2011-06-08 | パイオニア株式会社 | 対話装置、対話方法、対話プログラムおよびコンピュータに読み取り可能な記録媒体 |
US11164570B2 (en) * | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
-
2019
- 2019-03-06 JP JP2019040964A patent/JP7175221B2/ja active Active
-
2020
- 2020-03-03 CN CN202010141245.1A patent/CN111667823B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000020888A (ja) * | 1998-07-07 | 2000-01-21 | Aqueous Reserch:Kk | エージェント装置 |
JP2003022092A (ja) * | 2001-07-09 | 2003-01-24 | Fujitsu Ten Ltd | 対話システム |
JP2004021521A (ja) * | 2002-06-14 | 2004-01-22 | Sony Corp | 情報処理装置および方法、並びにプログラム |
CN101273342A (zh) * | 2005-05-10 | 2008-09-24 | 文卡特·斯里尼瓦斯·米纳瓦里 | 用于控制基于sip的电话中的多媒体功能和服务的系统和改进的方法 |
JP2008105608A (ja) * | 2006-10-26 | 2008-05-08 | Toyota Motor Corp | 車両用音声対応制御装置 |
JP2013207718A (ja) * | 2012-03-29 | 2013-10-07 | Canon Inc | 画像処理装置、画像処理装置の制御方法及びプログラム |
CN108806690A (zh) * | 2013-06-19 | 2018-11-13 | 松下电器(美国)知识产权公司 | 声音对话方法及声音对话代理服务器 |
JP2016218361A (ja) * | 2015-05-25 | 2016-12-22 | クラリオン株式会社 | 音声認識システム、車載器およびサーバ装置 |
CN107415959A (zh) * | 2016-05-17 | 2017-12-01 | 本田技研工业株式会社 | 车辆控制系统、车辆控制方法和车辆控制程序 |
JP2018054850A (ja) * | 2016-09-28 | 2018-04-05 | 株式会社東芝 | 情報処理システム、情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN111667823A (zh) | 2020-09-15 |
JP2020144618A (ja) | 2020-09-10 |
JP7175221B2 (ja) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111661068B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
JP7266432B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
CN111661065B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111681651B (zh) | 智能体装置、智能体系统、服务器装置、智能体装置的控制方法及存储介质 | |
CN111739525B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111667824A (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111559328B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111731320B (zh) | 智能体系统、智能体服务器及其控制方法、存储介质 | |
CN111746435B (zh) | 信息提供装置、信息提供方法及存储介质 | |
JP7340943B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
CN111667823B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111717142A (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111559317B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
JP2020154082A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
CN111724778B (zh) | 车载装置、车载装置的控制方法及存储介质 | |
CN111696547B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111754999B (zh) | 智能体装置及其控制方法、智能体系统、存储介质 | |
CN111752235B (zh) | 服务器装置、智能体装置、信息提供方法及存储介质 | |
JP7245695B2 (ja) | サーバ装置、情報提供システム、および情報提供方法 | |
JP2020160133A (ja) | エージェントシステム、エージェントシステムの制御方法、およびプログラム | |
CN111726772B (zh) | 智能体系统及其控制方法、服务器装置、存储介质 | |
CN111824174B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
CN111739524B (zh) | 智能体装置、智能体装置的控制方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |