Nothing Special   »   [go: up one dir, main page]

JP2020154994A - Agent system, agent server, control method of agent server, and program - Google Patents

Agent system, agent server, control method of agent server, and program Download PDF

Info

Publication number
JP2020154994A
JP2020154994A JP2019054880A JP2019054880A JP2020154994A JP 2020154994 A JP2020154994 A JP 2020154994A JP 2019054880 A JP2019054880 A JP 2019054880A JP 2019054880 A JP2019054880 A JP 2019054880A JP 2020154994 A JP2020154994 A JP 2020154994A
Authority
JP
Japan
Prior art keywords
agent
unit
user
function unit
agent function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019054880A
Other languages
Japanese (ja)
Inventor
本田 裕
Yutaka Honda
裕 本田
俊克 倉持
Toshikatsu Kuramochi
俊克 倉持
裕介 大井
Yusuke Oi
裕介 大井
基嗣 久保田
Mototsugu Kubota
基嗣 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019054880A priority Critical patent/JP2020154994A/en
Priority to CN202010189080.5A priority patent/CN111731320B/en
Priority to US16/820,754 priority patent/US11518398B2/en
Publication of JP2020154994A publication Critical patent/JP2020154994A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/10Interpretation of driver requests or demands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/14Means for informing the driver, warning the driver or prompting a driver intervention
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2540/00Input parameters relating to occupants
    • B60W2540/21Voice

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mechanical Engineering (AREA)
  • Transportation (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

To provide an agent system, an agent server, a control method of the agent server, and a program that permit a user to easily determine an agent function.SOLUTION: An agent system according to an embodiment comprises: a plurality of agent function units which are mounted on a different plurality of objects, and each of which provides a service including a response based on a voice according to speech of a user; and an information provision unit that provides attribute information which is associated with each of the same kind of agent function unit by being included in response content by means of the same kind of agent function unit to a portable type mobile terminal of the user, when there is the same kind of agent function unit in the plurality of objects of the plurality of agent function units.SELECTED DRAWING: Figure 4

Description

本発明は、エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムに関する。 The present invention relates to an agent system, an agent server, an agent server control method, and a program.

従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている(例えば、特許文献1参照)。 Conventionally, a technology related to an agent function that provides information on driving support according to a request of a occupant, vehicle control, other applications, etc. while interacting with a vehicle occupant has been disclosed (see, for example, Patent Document 1). ..

特開2006−335231号公報Japanese Unexamined Patent Publication No. 2006-335231

近年では、複数のエージェント機能を車両等の物体に搭載することについて実用化が進められているが、あるユーザが、エージェント機能を搭載した物体を複数所有していた場合に、どの物体に搭載したエージェント機能からの情報提供であるかが判断できない場合があった。 In recent years, practical application has been promoted for mounting a plurality of agent functions on an object such as a vehicle. However, when a user owns a plurality of objects equipped with the agent function, the load is mounted on which object. In some cases, it could not be determined whether the information was provided by the agent function.

本発明は、このような事情を考慮してなされたものであり、エージェント機能をユーザに判別させ易くすることができるエージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and an object of the present invention is to provide an agent system, an agent server, an agent server control method, and a program that can make it easier for a user to identify an agent function. It is one of.

この発明に係るエージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係るエージェントシステムは、異なる複数の物体に搭載され、それぞれがユーザの発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、前記複数のエージェント機能部のうち、前記複数の物体に同一種類のエージェント機能部が存在する場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、を備えるエージェントシステムである。
The agent system, the agent server, the control method of the agent server, and the program according to the present invention have adopted the following configurations.
(1): The agent system according to one aspect of the present invention includes a plurality of agent function units mounted on a plurality of different objects, each of which provides a service including a voice response in response to a user's utterance, and the plurality of agents. When the same type of agent function unit exists in the plurality of objects, the attribute information associated with each of the same type agent function unit is returned by the same type agent function unit. It is an agent system including an information providing unit provided to the user's portable mobile terminal, including the contents.

(2):上記(1)の態様において、前記複数の物体は、前記ユーザに対応付けられた車両を含むものである。 (2): In the aspect of (1) above, the plurality of objects include a vehicle associated with the user.

(3):上記(2)の態様において、前記属性情報は、前記車両に関する情報を含むものである。 (3): In the aspect of (2) above, the attribute information includes information about the vehicle.

(4):上記(2)または(3)の態様において、前記複数のエージェント機能部のうち、所定のエージェント機能部における前記応答の出力態様を設定する設定部を更に備えるものである。 (4): In the aspect of (2) or (3) above, among the plurality of agent function units, a setting unit for setting an output mode of the response in a predetermined agent function unit is further provided.

(5):上記(4)の態様において、前記所定のエージェント機能部は、前記車両の制御が可能なエージェント機能部である。 (5): In the aspect of (4) above, the predetermined agent function unit is an agent function unit capable of controlling the vehicle.

(6):上記(4)または(5)の態様において、前記所定のエージェント機能部は、前記複数のエージェント機能部に含まれる他のエージェント機能部の応答内容を取得するものである。 (6): In the above aspect (4) or (5), the predetermined agent function unit acquires the response contents of other agent function units included in the plurality of agent function units.

(7):上記(4)〜(6)のうち何れか一つの態様において、前記所定のエージェント機能部は、他のエージェント機能部から取得した応答内容を、前記他のエージェント機能部に代理して前記携帯端末に出力させるものである。 (7): In any one of the above (4) to (6), the predetermined agent function unit substitutes the response content acquired from the other agent function unit to the other agent function unit. Is output to the mobile terminal.

(8):本発明の他の態様に係るエージェントサーバは、ユーザの発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、を備えるエージェントサーバである。 (8): In the agent server according to another aspect of the present invention, an agent function unit that provides a service including a voice response in response to a user's utterance, and the agent function unit are associated with the user. When the agent function unit mounted on a plurality of objects and mounted on each of the plurality of objects is an agent function unit of the same type, the attribute information associated with each of the agent function units of the same type is described. It is an agent server including an information providing unit provided to the user's portable mobile terminal, including the response contents by the agent function unit of the same type.

(9):本発明の他の態様に係るエージェントサーバの制御方法は、コンピュータが、エージェント機能部を起動させ、前記起動したエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供し、前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する、エージェントサーバの制御方法である。
(10):本発明の他の態様に係るプログラムは、コンピュータが、エージェント機能部を起動させ、前記起動させたエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供させ、前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供させる、プログラムである。
(9): The agent server control method according to another aspect of the present invention is a service in which a computer activates an agent function unit and, as a function of the activated agent function unit, responds to a user's utterance. When the agent function unit is mounted on a plurality of objects associated with the user and the agent function unit mounted on each of the plurality of objects is an agent function unit of the same type, the above is provided. This is an agent server control method in which attribute information associated with each of the agent function units of the same type is included in the response content of the agent function unit of the same type and provided to the user's portable mobile terminal.
(10): In the program according to another aspect of the present invention, the computer activates the agent function unit, and as a function of the activated agent function unit, provides a service including a response in response to a user's utterance. When the agent function unit is mounted on a plurality of objects associated with the user and the agent function unit mounted on each of the plurality of objects is the same type of agent function unit, the same type of agent function unit is used. It is a program that includes the attribute information associated with each of the agent function units in the response content by the agent function unit of the same type and provides the user with the portable mobile terminal.

上記(1)〜(10)の態様によれば、エージェント機能をユーザに判別させ易くすることができる。 According to the above aspects (1) to (10), it is possible to make it easier for the user to discriminate the agent function.

エージェント装置100を含むエージェントシステム1の構成図である。It is a block diagram of the agent system 1 including the agent apparatus 100. 第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。It is a figure which shows the structure of the agent apparatus 100 which concerns on 1st Embodiment, and the apparatus mounted on the vehicle M. 表示・操作装置20およびスピーカユニット30の配置例を示す図である。It is a figure which shows the arrangement example of a display / operation apparatus 20 and a speaker unit 30. 第1実施形態に係るエージェントサーバ200および携帯端末300の構成と、エージェント装置100の構成の一部とを示す図である。It is a figure which shows the configuration of the agent server 200 and the mobile terminal 300 which concerns on 1st Embodiment, and a part of the configuration of agent apparatus 100. エージェント管理情報260の内容の一例を示す図である。It is a figure which shows an example of the content of agent management information 260. エージェントの出力態様を設定するための画像IM1の一例を示す図である。It is a figure which shows an example of the image IM1 for setting the output mode of an agent. 携帯端末300を介して情報提供される内容の一例を示す図である。It is a figure which shows an example of the content which information is provided through a mobile terminal 300. 第1実施形態に係るエージェントシステム1により実行される処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the process executed by the agent system 1 which concerns on 1st Embodiment. 第2実施形態に係るエージェントサーバの構成の一例を示す図である。It is a figure which shows an example of the configuration of the agent server which concerns on 2nd Embodiment. 第2実施形態において、携帯端末300から出力される情報の一例を示す図である。It is a figure which shows an example of the information output from a mobile terminal 300 in 2nd Embodiment. エージェントサーバ200#が他のエージェントサーバに代理応答させる処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the process which agent server 200 # causes another agent server to make a proxy response. 他のエージェントサーバから受信した応答内容に基づいて、自己のエージェントが代理応答する処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the processing flow which own agent makes a proxy response based on the response content received from another agent server.

以下、図面を参照し、本発明のエージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラムの実施形態について説明する。エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。車両は、物体の一例である。エージェント機能とは、例えば、車両のユーザと対話をしながら、ユーザの発話の中に含まれる要求(コマンド)に基づく各種の情報提供を行ったり、ユーザのスケジュールを管理したり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントは、それぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。 Hereinafter, the agent system, the agent server, the control method of the agent server, and the embodiment of the program of the present invention will be described with reference to the drawings. An agent device is a device that realizes a part or all of an agent system. Hereinafter, as an example of the agent device, an agent device mounted on a vehicle and having a plurality of types of agent functions will be described. A vehicle is an example of an object. The agent function is, for example, providing various information based on a request (command) included in a user's utterance, managing a user's schedule, and mediating a network service while interacting with a vehicle user. It is a function to do. The functions, processing procedures, controls, output modes and contents of the plurality of types of agents may be different from each other. In addition, some of the agent functions may have a function of controlling equipment in the vehicle (for example, equipment related to driving control and vehicle body control).

エージェント機能は、例えば、ユーザの音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体(サービス・エンティティ)をエージェントと称する。 Agent functions include, for example, a voice recognition function that recognizes a user's voice (a function that converts voice into text), a natural language processing function (a function that understands the structure and meaning of text), a dialogue management function, and a network. It is realized by integratedly using a network search function or the like that searches for another device or a predetermined database owned by the own device. Some or all of these functions may be realized by AI (Artificial Intelligence) technology. In addition, a part of the configuration for performing these functions (particularly, the voice recognition function and the natural language processing interpretation function) is an agent server capable of communicating with the in-vehicle communication device of the vehicle M or the general-purpose communication device brought into the vehicle M. It may be mounted on (external device). In the following description, it is assumed that a part of the configuration is installed in the agent server, and the agent device and the agent server cooperate to realize the agent system. Further, a service provider (service entity) in which an agent device and an agent server cooperate to appear virtually is called an agent.

<全体構成>
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、ユーザU1に対応付けられた複数の車両MA、MB、…のそれぞれに搭載されるエージェント装置100A、100B、…と、複数のエージェントサーバ200−1、200−2、200−3、…と、ユーザU1に対応付けられた携帯端末300とを備える。「ユーザU1に対応付けられる」とは、例えば、ユーザU1が所有する、ユーザU1が管理する、或いはユーザU1に割り当てられていることに相当する。また、上記において、符号の末尾のハイフン以下の数字は、エージェントを区別するための識別子であるものとする。何れのエージェントサーバであるかを区別しない場合、単にエージェントサーバ200と称する場合があるものとし、他の構成についても同様とする。図1では3つのエージェントサーバ200を示しているが、エージェントサーバ200の数は2つであってもよいし、4つ以上であってもよい。それぞれのエージェントサーバ200は、例えば、互いに異なるエージェントシステムの提供者が運営するものである。したがって、本実施形態におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者等が挙げられ、任意の主体(法人、団体、個人等)がエージェントシステムの提供者となり得る。
<Overall configuration>
FIG. 1 is a configuration diagram of an agent system 1 including an agent device 100. The agent system 1 includes, for example, agent devices 100A, 100B, ... Mounted on each of a plurality of vehicles MA, MB, ... Associated with the user U1, and a plurality of agent servers 200-1, 200-2, 200. -3, ... And the mobile terminal 300 associated with the user U1. "Associating with user U1" corresponds to, for example, being owned by user U1, managed by user U1, or assigned to user U1. Further, in the above, the number below the hyphen at the end of the code shall be an identifier for distinguishing agents. When it is not distinguished which agent server it is, it may be simply referred to as an agent server 200, and the same applies to other configurations. Although three agent servers 200 are shown in FIG. 1, the number of agent servers 200 may be two or four or more. Each agent server 200 is operated by, for example, different agent system providers. Therefore, the agents in this embodiment are agents realized by different providers. Examples of providers include automobile manufacturers, network service providers, e-commerce businesses, sellers and manufacturers of mobile terminals, and any entity (corporation, group, individual, etc.) is the provider of the agent system. Can be.

エージェント装置100A、100B、…は、それぞれが異なる車両MA、MB、…に搭載されていることを除いてほぼ同様の機能を備えるため、何れのエージェント装置であるかを区別しない場合、単にエージェント装置100と称する。また、車両についても何れの車両であるかを区別しない場合、単に車両Mと称する。また、図1では2つのエージェント装置100を示しているが、エージェント装置の数は3つ以上でもよい。エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。また、エージェントサーバ200は、ネットワークNWを介して携帯端末300と通信する。また、エージェント装置100は、ネットワークNWを介して携帯端末300と通信してもよい。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局等のうち一部または全部を含む。ネットワークNWには、各種ウェブサーバ400が接続されており、エージェント装置100、エージェントサーバ200、または携帯端末300は、ネットワークNWを介して各種ウェブサーバ400からウェブページを取得することができる。 The agent devices 100A, 100B, ... Have almost the same functions except that they are mounted on different vehicles MA, MB, .... Therefore, when it is not distinguished which agent device, the agent devices 100A, 100B, ... It is called 100. Further, when it is not distinguished which vehicle the vehicle is, it is simply referred to as a vehicle M. Further, although FIG. 1 shows two agent devices 100, the number of agent devices may be three or more. The agent device 100 communicates with the agent server 200 via the network NW. Further, the agent server 200 communicates with the mobile terminal 300 via the network NW. Further, the agent device 100 may communicate with the mobile terminal 300 via the network NW. The network NW includes, for example, a part or all of the Internet, cellular network, Wi-Fi network, WAN (Wide Area Network), LAN (Local Area Network), public line, telephone line, wireless base station and the like. Various web servers 400 are connected to the network NW, and the agent device 100, the agent server 200, or the mobile terminal 300 can acquire web pages from the various web servers 400 via the network NW.

エージェント装置100は、ユーザU1と対話を行い、ユーザU1からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答に基づく応答内容を、音声出力や画像表示の形でユーザU1に提供する。ここで、エージェント装置100は、ユーザU1が車両内に存在する場合には、車両Mに搭載された表示部やスピーカユニットを用いて情報提供を行い、ユーザU1が車両Mに存在しない場合には、ユーザU1の携帯端末300に情報提供を行ってもよい。また、エージェント装置100は、ユーザからの要求に基づいて車両機器50に対する制御等を行ってもよい。 The agent device 100 interacts with the user U1, transmits the voice from the user U1 to the agent server 200, and sends the response content based on the answer obtained from the agent server 200 to the user U1 in the form of voice output or image display. provide. Here, the agent device 100 provides information using the display unit and the speaker unit mounted on the vehicle M when the user U1 exists in the vehicle, and when the user U1 does not exist in the vehicle M, the agent device 100 provides information. , Information may be provided to the mobile terminal 300 of the user U1. Further, the agent device 100 may control the vehicle device 50 or the like based on a request from the user.

<第1実施形態>
[車両]
図2は、第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100とが搭載される。また、スマートフォン等の汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。表示・操作装置20と、スピーカユニット30とを合わせたものが「出力部」の一例である。
<First Embodiment>
[vehicle]
FIG. 2 is a diagram showing the configuration of the agent device 100 according to the first embodiment and the equipment mounted on the vehicle M. The vehicle M includes, for example, one or more microphones 10, a display / operation device 20, a speaker unit 30, a navigation device 40, a vehicle device 50, an in-vehicle communication device 60, an occupant recognition device 80, and an agent device. 100 and are installed. Further, a general-purpose communication device 70 such as a smartphone may be brought into the vehicle interior and used as a communication device. These devices are connected to each other by a multiplex communication line such as a CAN (Controller Area Network) communication line, a serial communication line, a wireless communication network, or the like. The configuration shown in FIG. 2 is merely an example, and a part of the configuration may be omitted or another configuration may be added. A combination of the display / operation device 20 and the speaker unit 30 is an example of the “output unit”.

マイク10は、車室内で発せられた音を収集する音声入力部である。表示・操作装置20は、画像を表示するとともに、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置20は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置20は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。スピーカユニット30は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ(音声出力部)を含む。表示・操作装置20は、エージェント装置100とナビゲーション装置40とで共用されてもよい。これらの詳細については後述する。 The microphone 10 is a voice input unit that collects sounds emitted in the vehicle interior. The display / operation device 20 is a device (or a group of devices) capable of displaying an image and accepting an input operation. The display / operation device 20 includes, for example, a display device configured as a touch panel. The display / operation device 20 may further include a HUD (Head Up Display) or a mechanical input device. The speaker unit 30 includes, for example, a plurality of speakers (audio output units) arranged at different positions in the vehicle interior. The display / operation device 20 may be shared by the agent device 100 and the navigation device 40. Details of these will be described later.

ナビゲーション装置40は、ナビHMI(Human Machine Interface)と、GPS(Global Positioning System)等の位置測位装置と、地図情報を記憶した記憶装置と、経路探索等を行う制御装置(ナビゲーションコントローラ)とを備える。マイク10、表示・操作装置20、およびスピーカユニット30のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置40は、位置測位装置によって特定された車両Mの位置から、ユーザによって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置40は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置100は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置100は、ハードウェア上は一体に構成される。 The navigation device 40 includes a navigation HMI (Human Machine Interface), a positioning device such as a GPS (Global Positioning System), a storage device that stores map information, and a control device (navigation controller) that performs route search and the like. .. A part or all of the microphone 10, the display / operation device 20, and the speaker unit 30 may be used as the navigation HMI. The navigation device 40 searches for a route (navigation route) for moving from the position of the vehicle M specified by the positioning device to the destination input by the user, so that the vehicle M can travel along the route. , Navi HMI is used to output guidance information. The route search function may be provided in a navigation server accessible via the network NW. In this case, the navigation device 40 acquires a route from the navigation server and outputs guidance information. The agent device 100 may be constructed based on the navigation controller. In that case, the navigation controller and the agent device 100 are integrally configured on the hardware.

車両機器50は、例えば、車両Mに搭載される機器である。車両機器50は、例えば、エンジンや走行用モータ等の駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置および窓の開閉制御装置、シート、シート位置の制御装置、ルームミラーおよびその角度位置制御装置、車両内外の照明装置およびその制御装置、ワイパーやデフォッガーおよびそれぞれの制御装置、方向指示灯およびその制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報等の車両情報装置等を含む。 The vehicle device 50 is, for example, a device mounted on the vehicle M. The vehicle equipment 50 includes, for example, a driving force output device such as an engine or a traveling motor, an engine start motor, a door lock device, a door opening / closing device, a window, a window opening / closing device, a window opening / closing control device, a seat, and a seat position. Control device, room mirror and its angle position control device, lighting device inside and outside the vehicle and its control device, wiper and defogger and their respective control devices, direction indicator and its control device, air conditioner, mileage and tire pressure information And vehicle information devices such as fuel level information.

車載通信装置60は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。 The in-vehicle communication device 60 is, for example, a wireless communication device that can access the network NW using a cellular network or a Wi-Fi network.

乗員認識装置80は、例えば、着座センサ、車室内カメラ、画像認識装置等を含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサ等を含む。車室内カメラは、車室内に設けられたCCD(Charge Coupled Device)カメラやCMOS(Complementary Metal Oxide Semiconductor)カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員(ユーザ)の有無、顔向き等を認識する。乗員認識装置80による認識結果は、エージェント装置100やエージェントされた200に出力される。 The occupant recognition device 80 includes, for example, a seating sensor, a vehicle interior camera, an image recognition device, and the like. The seating sensor includes a pressure sensor provided at the lower part of the seat, a tension sensor attached to the seat belt, and the like. The vehicle interior camera is a CCD (Charge Coupled Device) camera or a CMOS (Complementary Metal Oxide Semiconductor) camera installed in the vehicle interior. The image recognition device analyzes the image of the vehicle interior camera and recognizes the presence / absence of a occupant (user) for each seat, the face orientation, and the like. The recognition result by the occupant recognition device 80 is output to the agent device 100 and the agent 200.

図3は、表示・操作装置20およびスピーカユニット30の配置例を示す図である。表示・操作装置20は、例えば、第1ディスプレイ22と、第2ディスプレイ24と、操作スイッチASSY26とを含む。表示・操作装置20は、更に、HUD28を含んでもよい。また、表示・操作装置20は、更に、インストルメントパネルのうち運転席DSに対面する部分に設けられるメーターディスプレイ29を含んでもよい。第1ディスプレイ22と、第2ディスプレイ24と、HUD28と、メーターディスプレイ29とを合わせたものが「表示部」の一例である。 FIG. 3 is a diagram showing an arrangement example of the display / operation device 20 and the speaker unit 30. The display / operation device 20 includes, for example, a first display 22, a second display 24, and an operation switch ASSY 26. The display / operation device 20 may further include a HUD 28. Further, the display / operation device 20 may further include a meter display 29 provided on a portion of the instrument panel facing the driver's seat DS. A combination of the first display 22, the second display 24, the HUD 28, and the meter display 29 is an example of the “display unit”.

車両Mには、例えば、ステアリングホイールSWが設けられた運転席DSと、運転席DSに対して車幅方向(図中Y方向)に設けられた助手席ASとが存在する。第1ディスプレイ22は、インストルメントパネルにおける運転席DSと助手席ASとの中間辺りから、助手席ASの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第2ディスプレイ24は、運転席DSと助手席ASとの車幅方向に関する中間あたり、且つ第1ディスプレイの下方に設置されている。例えば、第1ディスプレイ22と第2ディスプレイ24は、共にタッチパネルとして構成され、表示部としてLCD(Liquid Crystal Display)や有機EL(Electroluminescence)、プラズマディスプレイ等を備えるものである。操作スイッチASSY26は、ダイヤルスイッチやボタン式スイッチ等が集積されたものである。HUD28は、例えば、風景に重畳させて画像を視認させる装置であり、一例として、車両Mのフロントウインドシールドやコンバイナーに画像を含む光を投光することで、乗員に虚像を視認させる。メーターディスプレイ29は、例えば、LCDや有機EL等であり、速度計や回転速度計等の計器類を表示する。表示・操作装置20は、乗員によってなされた操作の内容をエージェント装置100に出力する。上述した各表示部が表示する内容は、エージェント装置100によって決定されてよい。 The vehicle M includes, for example, a driver's seat DS provided with a steering wheel SW and a passenger seat AS provided in the vehicle width direction (Y direction in the drawing) with respect to the driver's seat DS. The first display 22 is a horizontally long display device extending from an intermediate portion between the driver's seat DS and the passenger's seat AS on the instrument panel to a position facing the left end of the passenger's seat AS. The second display 24 is installed at the middle of the driver's seat DS and the passenger's seat AS in the vehicle width direction and below the first display. For example, both the first display 22 and the second display 24 are configured as a touch panel, and include an LCD (Liquid Crystal Display), an organic EL (Electroluminescence), a plasma display, and the like as display units. The operation switch ASSY26 is an integrated dial switch, button type switch, and the like. The HUD 28 is, for example, a device that superimposes an image on a landscape to visually recognize an image. As an example, a virtual image is visually recognized by an occupant by projecting light including an image onto a front windshield or a combiner of a vehicle M. The meter display 29 is, for example, an LCD, an organic EL, or the like, and displays instruments such as a speedometer and a rotational speedometer. The display / operation device 20 outputs the content of the operation performed by the occupant to the agent device 100. The content displayed by each of the above-mentioned display units may be determined by the agent device 100.

スピーカユニット30は、例えば、スピーカ30A〜30Fを含む。スピーカ30Aは、運転席DS側の窓柱(いわゆるAピラー)に設置されている。スピーカ30Bは、運転席DSに近いドアの下部に設置されている。スピーカ30Cは、助手席AS側の窓柱に設置されている。スピーカ30Dは、助手席ASに近いドアの下部に設置されている。スピーカ30Eは、第2ディスプレイ24の近傍に設置されている。スピーカ30Fは、車室の天井(ルーフ)に設置されている。また、スピーカユニット30は、右側後部座席や左側後部座席に近いドアの下部に設置されてもよい。 The speaker unit 30 includes, for example, speakers 30A to 30F. The speaker 30A is installed on a window pillar (so-called A pillar) on the driver's seat DS side. The speaker 30B is installed under the door near the driver's seat DS. The speaker 30C is installed on the window pillar on the passenger seat AS side. The speaker 30D is installed at the bottom of the door near the passenger seat AS. The speaker 30E is installed in the vicinity of the second display 24. The speaker 30F is installed on the ceiling (roof) of the vehicle interior. Further, the speaker unit 30 may be installed at the lower part of the door near the right rear seat or the left rear seat.

係る配置において、例えば、専らスピーカ30Aおよび30Bに音を出力させた場合、音像は運転席DS付近に定位することになる。「音像が定位する」とは、例えば、乗員の左右の耳に伝達される音の大きさを調節することにより、乗員が感じる音源の空間的な位置を定めることである。また、専らスピーカ30Cおよび30Dに音を出力させた場合、音像は助手席AS付近に定位することになる。また、専らスピーカ30Eに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ30Fに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット30は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。 In such an arrangement, for example, when the speakers 30A and 30B exclusively output sound, the sound image is localized in the vicinity of the driver's seat DS. “The sound image is localized” means, for example, determining the spatial position of the sound source felt by the occupant by adjusting the loudness of the sound transmitted to the left and right ears of the occupant. Further, when the sound is output exclusively to the speakers 30C and 30D, the sound image is localized in the vicinity of the passenger seat AS. Further, when the sound is output exclusively to the speaker 30E, the sound image is localized near the front of the passenger compartment, and when the sound is output exclusively to the speaker 30F, the sound image is localized near the upper part of the passenger compartment. Become. Not limited to this, the speaker unit 30 can localize the sound image at an arbitrary position in the vehicle interior by adjusting the distribution of the sound output from each speaker by using a mixer or an amplifier.

[エージェント装置]
図2に戻り、エージェント装置100は、管理部110と、エージェント機能部150−1、150−2、150−3と、ペアリングアプリ実行部160と、記憶部170とを備える。管理部110は、例えば、音響処理部112と、エージェントごとWU(Wake Up)判定部114と、エージェント設定部116と、出力制御部120と備える。以下、何れのエージェント機能部であるか区別しない場合、単にエージェント機能部150と称する。3つのエージェント機能部150を示しているのは、図1におけるエージェントサーバ200の数に対応させた一例に過ぎず、エージェント機能部150の数は、2つであってもよいし、4つ以上であってもよい。図2に示すソフトウェア配置は、説明のために簡易に示しており、実際には、例えば、エージェント機能部150と車載通信装置60の間に管理部110が介在してもよいように、任意に改変することができる。また、以下では、エージェント機能部150−1とエージェントサーバ200−1が協働して出現させるエージェントを「エージェント1」、エージェント機能部150−2とエージェントサーバ200−2が協働して出現させるエージェントを「エージェント2」、エージェント機能部150−3とエージェントサーバ200−3が協働して出現させるエージェントを「エージェント3」と称する場合がある。
[Agent device]
Returning to FIG. 2, the agent device 100 includes a management unit 110, agent function units 150-1, 150-2, 150-3, a pairing application execution unit 160, and a storage unit 170. The management unit 110 includes, for example, an sound processing unit 112, a WU (Wake Up) determination unit 114 for each agent, an agent setting unit 116, and an output control unit 120. Hereinafter, when it is not distinguished which agent function unit it is, it is simply referred to as an agent function unit 150. The three agent function units 150 are shown only as an example corresponding to the number of agent servers 200 in FIG. 1, and the number of agent function units 150 may be two or four or more. It may be. The software arrangement shown in FIG. 2 is shown briefly for the sake of explanation. In practice, for example, the management unit 110 may be optionally interposed between the agent function unit 150 and the in-vehicle communication device 60. It can be modified. Further, in the following, the agent that the agent function unit 150-1 and the agent server 200-1 collaborate to appear is “agent 1”, and the agent function unit 150-2 and the agent server 200-2 cooperate to appear. The agent may be referred to as "agent 2", and the agent caused by the agent function unit 150-3 and the agent server 200-3 working together may be referred to as "agent 3".

エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。 Each component of the agent device 100 is realized by, for example, a hardware processor such as a CPU (Central Processing Unit) executing a program (software). Some or all of these components are hardware such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), GPU (Graphics Processing Unit), etc. It may be realized by (including circuits), or it may be realized by the cooperation of software and hardware. The program may be stored in advance in a storage device such as an HDD (Hard Disk Drive) or a flash memory (a storage device including a non-transient storage medium), or a removable storage device such as a DVD or a CD-ROM. It is stored in a medium (non-transient storage medium) and may be installed by mounting the storage medium in a drive device.

記憶部170は、上記の各種記憶装置により実現される。記憶部170には、各種データやプログラムが格納される。 The storage unit 170 is realized by the above-mentioned various storage devices. Various data and programs are stored in the storage unit 170.

管理部110は、OS(Operating System)やミドルウェア等のプログラムが実行されることで機能する。 The management unit 110 functions by executing a program such as an OS (Operating System) or middleware.

管理部110の音響処理部112は、マイク10から収集される音を受け付け、受け付けた音に対して、エージェントごとに予め設定されているウエイクアップワード(起動ワード)を認識するのに適した状態になるように音響処理を行う。音響処理とは、例えば、バンドパスフィルタ等のフィルタリングによるノイズ除去や音の増幅等である。また、音響処理部112は、音響処理された音声を、エージェントごとWU判定部114や起動中のエージェント機能部に出力する。 The sound processing unit 112 of the management unit 110 receives the sound collected from the microphone 10, and is suitable for recognizing a wake-up word (starting word) preset for each agent for the received sound. Sound processing is performed so as to become. The acoustic processing is, for example, noise removal by filtering such as a bandpass filter, sound amplification, and the like. Further, the sound processing unit 112 outputs the sound-processed voice to the WU determination unit 114 and the activated agent function unit together with the agent.

エージェントごとWU判定部114は、エージェント機能部150−1、150−2、150−3のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとWU判定部114は、音響処理が行われた音声(音声ストリーム)から音声の意味を認識する。まず、エージェントごとWU判定部114は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとWU判定部114は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。 The WU determination unit 114 for each agent exists corresponding to each of the agent function units 150-1, 150-2, and 150-3, and recognizes a wakeup word predetermined for each agent. The WU determination unit 114 for each agent recognizes the meaning of the voice from the voice (voice stream) subjected to the acoustic processing. First, the WU determination unit 114 for each agent detects a voice section based on the amplitude and zero intersection of the voice waveform in the voice stream. The WU determination unit 114 for each agent may perform frame-by-frame speech recognition based on a mixture Gaussian mixture model (GMM) and section detection based on non-speech recognition.

次に、エージェントごとWU判定部114は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとWU判定部114は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントごとWU判定部114は、対応するエージェント機能部150を起動させる。なお、エージェントごとWU判定部114に相当する機能がエージェントサーバ200に搭載されてもよい。この場合、管理部110は、音響処理部112によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部150が起動する。なお、各エージェント機能部150は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントごとWU判定部114を備える必要はない。 Next, the WU determination unit 114 for each agent converts the voice in the detected voice section into text and converts it into character information. Then, the WU determination unit 114 for each agent determines whether or not the textual character information corresponds to the wakeup word. When it is determined that the word is a wakeup word, the WU determination unit 114 for each agent activates the corresponding agent function unit 150. The agent server 200 may be equipped with a function corresponding to the WU determination unit 114 for each agent. In this case, when the management unit 110 transmits the voice stream to which the sound processing has been performed by the sound processing unit 112 to the agent server 200 and determines that the agent server 200 is a wakeup word, the management unit 110 follows an instruction from the agent server 200. The agent function unit 150 starts. It should be noted that each agent function unit 150 may be always activated and may determine the wakeup word by itself. In this case, the management unit 110 does not need to include the WU determination unit 114 for each agent.

また、エージェントごとWU判定部114は、上述した手順と同様の手順で、発話された音声に含まれる終了ワードを認識した場合であり、且つ、終了ワードに対応するエージェントが起動している状態(以下、必要に応じて「起動中」と称する)である場合、起動しているエージェント機能部を停止(終了)させる。なお、起動中のエージェントは、音声の入力を所定時間以上受け付けなかった場合や、エージェントを終了させる所定の指示操作を受け付けた場合に、エージェントを停止させてもよい。 Further, the WU determination unit 114 for each agent recognizes the end word included in the spoken voice by the same procedure as the above-mentioned procedure, and the agent corresponding to the end word is activated ( Hereinafter, if necessary, it is referred to as "starting"), the running agent function unit is stopped (finished). The activated agent may stop the agent when it does not accept the voice input for a predetermined time or longer, or when it receives a predetermined instruction operation for terminating the agent.

エージェント設定部116は、エージェントごとの応答時の出力態様を設定する。出力態様とは、例えば、後述するエージェント画像または疑似的にエージェント画像が発していると聴者(乗員)に認識させるための音声(以下、エージェント音声を称する)のうち、一方または双方である。エージェント設定部116は、複数のエージェント機能部150−1〜150−3のうち、所定のエージェント機能部に対応付けられたエージェント画像やエージェント音声のみを設定できるようにしてもよい。所定のエージェント機能部には、例えば、車両Mの制御が可能なエージェント機能部150−1が含まれる。「車両Mの制御が可能」とは、例えば、車両機器50に対する制御や、ナビゲーション装置40、表示・操作装置20に対する制御が可能であることである。エージェント設定部116における設定内容の詳細については後述する。 The agent setting unit 116 sets the output mode at the time of response for each agent. The output mode is, for example, one or both of an agent image described later or a voice (hereinafter, referred to as an agent voice) for causing the listener (occupant) to recognize that the agent image is emitted in a pseudo manner. The agent setting unit 116 may be able to set only the agent image and the agent voice associated with the predetermined agent function unit among the plurality of agent function units 150-1 to 150-3. The predetermined agent function unit includes, for example, an agent function unit 150-1 capable of controlling the vehicle M. “The vehicle M can be controlled” means that, for example, it is possible to control the vehicle device 50, the navigation device 40, and the display / operation device 20. The details of the setting contents in the agent setting unit 116 will be described later.

出力制御部120は、管理部110またはエージェント機能部150からの指示に応じて表示部またはスピーカユニット30に応答内容等の情報を出力させることで、乗員にサービス等の提供を行う。出力制御部120は、例えば、表示制御部122と、音声制御部124とを備える。 The output control unit 120 provides the occupant with services and the like by causing the display unit or the speaker unit 30 to output information such as response contents in response to an instruction from the management unit 110 or the agent function unit 150. The output control unit 120 includes, for example, a display control unit 122 and a voice control unit 124.

表示制御部122は、出力制御部120からの指示に応じて表示部の少なくとも一部の領域に画像を表示させる。以下では、エージェントに関する画像を第1ディスプレイ22に表示させるものとして説明する。表示制御部122は、出力制御部120の制御により、エージェント画像を生成し、生成したエージェント画像を第1ディスプレイ22に表示させる。エージェント画像は、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像である。また、エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者(乗員)によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、立体的に感じられ、観者によって三次元空間における頭部画像を含むことでエージェントの顔向きが認識されたり、本体(胴体や手足)の画像を含むことで、エージェントの動作や振る舞い、姿勢等が認識されるものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。例えば、表示制御部122は、乗員認識装置80により認識された乗員の位置に近い表示領域にエージェント画像を表示させたり、乗員の位置に顔を向けたエージェント画像を生成して表示させてもよい。 The display control unit 122 causes the image to be displayed in at least a part of the area of the display unit in response to an instruction from the output control unit 120. Hereinafter, an image relating to the agent will be described as being displayed on the first display 22. The display control unit 122 generates an agent image under the control of the output control unit 120, and displays the generated agent image on the first display 22. The agent image is, for example, an image of an anthropomorphic agent communicating with an occupant in the vehicle interior. Further, the agent image is, for example, an image of a mode of talking to an occupant. The agent image may include, for example, a facial image such that the facial expression and the facial orientation are recognized by the viewer (occupant) at least. For example, in the agent image, parts imitating eyes and nose are represented in the face area, and the facial expression and face orientation may be recognized based on the positions of the parts in the face area. In addition, the agent image is felt three-dimensionally, and the viewer can recognize the face orientation of the agent by including the head image in the three-dimensional space, or the agent's image can be included by including the image of the main body (body and limbs). The movement, behavior, posture, etc. may be recognized. Further, the agent image may be an animation image. For example, the display control unit 122 may display the agent image in the display area close to the position of the occupant recognized by the occupant recognition device 80, or may generate and display the agent image with the face facing the position of the occupant. ..

音声制御部124は、出力制御部120からの指示に応じて、スピーカユニット30に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部124は、複数のスピーカユニット30を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近(例えば、2〜3[cm]以内)の位置である。 The voice control unit 124 causes a part or all of the speakers included in the speaker unit 30 to output voice in response to an instruction from the output control unit 120. The voice control unit 124 may use a plurality of speaker units 30 to control the localization of the sound image of the agent voice at a position corresponding to the display position of the agent image. The position corresponding to the display position of the agent image is, for example, a position where the occupant is expected to feel that the agent image is speaking the agent voice. Specifically, the position is near the display position of the agent image (for example, 2). It is within ~ 3 [cm]).

エージェント機能部150は、対応するエージェントサーバ200と協働してエージェントを出現させ、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部150には、車両M(例えば、車両機器50)を制御する権限が付与されたものが含まれてよい。また、エージェント機能部150には、ペアリングアプリ実行部160を介して汎用通信装置70と連携し、エージェントサーバ200と通信するものがあってよい。例えば、エージェント機能部150−1には、車両M(例えば、車両機器50)を制御する権限が付与されている。エージェント機能部150−1は、車載通信装置60を介してエージェントサーバ200−1と通信する。エージェント機能部150−2は、車載通信装置60を介してエージェントサーバ200−2と通信する。エージェント機能部150−3は、ペアリングアプリ実行部160を介して汎用通信装置70と連携し、エージェントサーバ200−3と通信する。 The agent function unit 150 causes an agent to appear in cooperation with the corresponding agent server 200, and provides a service including a voice response in response to an utterance of a vehicle occupant. The agent function unit 150 may include one to which the authority to control the vehicle M (for example, the vehicle equipment 50) is granted. Further, the agent function unit 150 may be one that cooperates with the general-purpose communication device 70 via the pairing application execution unit 160 and communicates with the agent server 200. For example, the agent function unit 150-1 is given the authority to control the vehicle M (for example, the vehicle device 50). The agent function unit 150-1 communicates with the agent server 200-1 via the vehicle-mounted communication device 60. The agent function unit 150-2 communicates with the agent server 200-2 via the vehicle-mounted communication device 60. The agent function unit 150-3 cooperates with the general-purpose communication device 70 via the pairing application execution unit 160, and communicates with the agent server 200-3.

ペアリングアプリ実行部160は、例えば、Bluetooth(登録商標)によって汎用通信装置70とペアリングを行い、エージェント機能部150−3と汎用通信装置70とを接続させる。なお、エージェント機能部150−3は、USB(Universal Serial Bus)等を利用した有線通信によって汎用通信装置70に接続されるようにしてもよい。 The pairing application execution unit 160 pairs with the general-purpose communication device 70 by, for example, Bluetooth (registered trademark), and connects the agent function unit 150-3 and the general-purpose communication device 70. The agent function unit 150-3 may be connected to the general-purpose communication device 70 by wired communication using USB (Universal Serial Bus) or the like.

[エージェントサーバおよび携帯端末]
図4は、第1実施形態に係るエージェントサーバ200および携帯端末300の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200および携帯端末300の構成とともに、車両MAおよび車両MBのそれぞれに搭載される同一種類のエージェントに対応するエージェント機能部等の動作について説明する。以下、同一種類のエージェントの一例としてエージェント1を用いることとし、エージェント装置100Aおよび100Bのそれぞれの構成部の符号には、「A」または「B」の文字を付与して、それぞれの構成を識別するものとする。また、以下では、ネットワークNWを用いた物理的な通信についての説明を省略する。また、以下では、主にエージェント装置100Aおよびエージェントサーバ200−1の動作を中心として説明する。
[Agent server and mobile terminal]
FIG. 4 is a diagram showing a configuration of the agent server 200 and the mobile terminal 300 according to the first embodiment and a part of the configuration of the agent device 100. Hereinafter, along with the configuration of the agent server 200 and the mobile terminal 300, the operation of the agent function unit and the like corresponding to the agents of the same type mounted on the vehicle MA and the vehicle MB will be described. Hereinafter, the agent 1 will be used as an example of the agent of the same type, and the letters "A" or "B" are added to the codes of the respective constituent parts of the agent devices 100A and 100B to identify the respective configurations. It shall be. Further, in the following, the description of physical communication using the network NW will be omitted. Further, in the following, the operations of the agent device 100A and the agent server 200-1 will be mainly described.

エージェントサーバ200−1は、サーバ側通信部210を備える。サーバ側通信部210は、例えば、NIC(Network Interface Card)等のネットワークインターフェースである。更に、エージェントサーバ200−1は、例えば、音声認識部220と、自然言語処理部222と、対話管理部224と、ネットワーク検索部226と、応答内容生成部228と、情報提供部230と、記憶部250とを備える。これらの構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。音声認識部220と、自然言語処理部222とを合わせたものが「認識部」の一例である。 The agent server 200-1 includes a server-side communication unit 210. The server-side communication unit 210 is, for example, a network interface such as a NIC (Network Interface Card). Further, the agent server 200-1 stores, for example, a voice recognition unit 220, a natural language processing unit 222, a dialogue management unit 224, a network search unit 226, a response content generation unit 228, and an information providing unit 230. A unit 250 is provided. These components are realized, for example, by a hardware processor such as a CPU executing a program (software). Some or all of these components may be realized by hardware such as LSI, ASIC, FPGA, GPU (including circuit part; circuitry), or realized by collaboration between software and hardware. May be good. The program may be stored in advance in a storage device such as an HDD or flash memory (a storage device including a non-transient storage medium), or a removable storage medium such as a DVD or a CD-ROM (non-transient). It is stored in a sex storage medium) and may be installed by attaching the storage medium to a drive device. A combination of the voice recognition unit 220 and the natural language processing unit 222 is an example of the "recognition unit".

記憶部250は、上記の各種記憶装置により実現される。記憶部250には、例えば、辞書DB(データベース)252、パーソナルプロファイル254、知識ベースDB256、応答規則DB258、エージェント管理情報260等のデータやプログラムが格納される。 The storage unit 250 is realized by the above-mentioned various storage devices. Data and programs such as a dictionary DB (database) 252, a personal profile 254, a knowledge base DB 256, a response rule DB 258, and agent management information 260 are stored in the storage unit 250.

エージェント装置100において、エージェント機能部150A−1は、例えば、音響処理部112等から入力される音声ストリーム、或いは圧縮や符号化等の処理を行った音声ストリームを、エージェントサーバ200−1に送信する。エージェント機能部150A−1は、ローカル処理(エージェントサーバ200−1を介さない処理)が可能なコマンド(要求内容)が認識できた場合には、コマンドで要求された処理を実行してもよい。ローカル処理が可能なコマンドとは、例えば、エージェント装置100Aのそれぞれが備える記憶部170Aを参照することで応答可能なコマンドである。より具体的には、ローカル処理が可能なコマンドとは、例えば、記憶部170A内に存在する電話帳データから特定者の名前を検索し、合致した名前に対応付けられた電話番号に電話をかける(相手を呼び出す)コマンドである。したがって、エージェント機能部150A−1は、エージェントサーバ200−1が備える機能の一部を有してもよい。 In the agent device 100, the agent function unit 150A-1 transmits, for example, an audio stream input from the sound processing unit 112 or the like, or an audio stream that has undergone processing such as compression or coding to the agent server 200-1. .. When the agent function unit 150A-1 can recognize a command (request content) capable of local processing (processing that does not go through the agent server 200-1), the agent function unit 150A-1 may execute the processing requested by the command. The command capable of local processing is, for example, a command that can be responded to by referring to the storage unit 170A provided in each of the agent devices 100A. More specifically, the command capable of local processing is, for example, searching for the name of a specific person from the telephone directory data existing in the storage unit 170A and calling the telephone number associated with the matching name. It is a command (call the other party). Therefore, the agent function unit 150A-1 may have a part of the functions provided by the agent server 200-1.

音声ストリームを取得すると、音声認識部220が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部222が文字情報に対して辞書DB252を参照しながら意味解釈を行う。辞書DB252は、例えば、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB252は、同義語や類義語の一覧情報を含んでもよい。音声認識部220の処理と、自然言語処理部222の処理は、段階が明確に分かれるものではなく、自然言語処理部222の処理結果を受けて音声認識部220が認識結果を修正する等、相互に影響し合って行われてよい。 When the voice stream is acquired, the voice recognition unit 220 performs voice recognition and outputs textual character information, and the natural language processing unit 222 interprets the character information with reference to the dictionary DB 252. The dictionary DB 252 is, for example, associated with abstract semantic information with respect to character information. The dictionary DB 252 may include list information of synonyms and synonyms. The stages of the processing of the voice recognition unit 220 and the processing of the natural language processing unit 222 are not clearly separated, and the voice recognition unit 220 corrects the recognition result in response to the processing result of the natural language processing unit 222. It may be done by influencing each other.

自然言語処理部222は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部222は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成してもよい。 For example, when the natural language processing unit 222 recognizes the meanings such as "today's weather" and "how is the weather" as the recognition result, the natural language processing unit 222 generates a command replaced with the standard character information "today's weather". As a result, even if there is a character fluctuation in the voice of the request, it is possible to facilitate the dialogue according to the request. Further, the natural language processing unit 222 may recognize the meaning of character information by using artificial intelligence processing such as machine learning processing using probability, or may generate a command based on the recognition result.

対話管理部224は、入力されたコマンドに基づいて、パーソナルプロファイル254や知識ベースDB256、応答規則DB258を参照しながら車両Mの乗員に対する応答内容(例えば、乗員への発話内容や出力部から出力する画像、音声)を決定する。パーソナルプロファイル254は、ユーザ(乗員)ごとに保存されているユーザの個人情報、趣味嗜好、過去の対話の履歴等を含む。ユーザの個人情報には、例えば、ユーザの携帯端末300と通信を行うためのアドレス情報等が含まれる。知識ベースDB256は、物事の関係性を規定した情報である。応答規則DB258は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容等)を規定した情報である。 Based on the input command, the dialogue management unit 224 outputs the response content to the occupant of the vehicle M (for example, the utterance content to the occupant and the output unit) while referring to the personal profile 254, the knowledge base DB 256, and the response rule DB 258. Image, sound) is decided. The personal profile 254 includes the user's personal information, hobbies and preferences, the history of past dialogues, etc. stored for each user (occupant). The user's personal information includes, for example, address information for communicating with the user's mobile terminal 300. The knowledge base DB 256 is information that defines the relationships between things. The response rule DB 258 is information that defines the actions (answers, device control contents, etc.) that the agent should perform in response to the command.

また、対話管理部224は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル254と照合を行うことで、ユーザを特定してもよい。この場合、パーソナルプロファイル254には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、ユーザの初期登録時に所定の単語や文章等をユーザに発声させ、発声させた音声を認識することで得られる情報である。 In addition, the dialogue management unit 224 may identify the user by collating with the personal profile 254 using the feature information obtained from the voice stream. In this case, in the personal profile 254, for example, personal information is associated with voice feature information. The voice feature information is, for example, information on the characteristics of how to speak such as voice pitch, intonation, and rhythm (sound pitch pattern), and the feature amount based on the Mel Frequency Cepstrum Coefficients. .. The voice feature information is, for example, information obtained by having the user utter a predetermined word or sentence at the time of initial registration of the user and recognizing the uttered voice.

対話管理部224は、コマンドが、ネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部226に検索を行わせる。ネットワーク検索部226は、ネットワークNWを介して各種ウェブサーバ400にアクセスし、所望の情報を取得する。「ネットワークNWを介して検索可能な情報」とは、例えば、車両Mの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Mの位置に応じた天気予報であったりする。 The dialogue management unit 224 causes the network search unit 226 to perform a search when the command requests information that can be searched via the network NW. The network search unit 226 accesses various web servers 400 via the network NW and acquires desired information. The "information searchable via the network NW" may be, for example, an evaluation result by a general user of a restaurant in the vicinity of the vehicle M, or a weather forecast according to the position of the vehicle M on that day.

応答内容生成部228は、対話管理部224により決定された発話の内容が車両Mの乗員に伝わるように、応答内容を生成し、生成した応答内容をエージェント装置100に送信する。応答内容には、例えば、乗員に提供する応答文や各制御対象機器に対する制御コマンド等が含まれる。また、応答内容生成部228は、乗員認識装置80による認識結果をエージェント装置100から取得し、取得した認識結果によりコマンドを含む発話を行った乗員がパーソナルプロファイル254に登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答内容を生成してもよい。 The response content generation unit 228 generates the response content so that the content of the utterance determined by the dialogue management unit 224 is transmitted to the occupant of the vehicle M, and transmits the generated response content to the agent device 100. The response content includes, for example, a response statement provided to the occupant, a control command for each controlled device, and the like. Further, the response content generation unit 228 acquires the recognition result by the occupant recognition device 80 from the agent device 100, and the occupant who made a speech including a command based on the acquired recognition result is a occupant registered in the personal profile 254. If specified, the occupant's name may be called or a response may be generated that resembles the occupant's speech.

情報提供部230は、応答内容生成部228により生成された応答内容に対し、記憶部250に記憶されたエージェント管理情報260を参照し、エージェントの出力態様に対応する応答内容を生成する。図5は、エージェント管理情報260の内容の一例を示す図である。エージェント管理情報260には、例えば、ユーザを識別する識別情報であるユーザIDおよび車両Mを識別する識別情報である車両IDに、属性情報、およびエージェント設定情報が対応付けられている。属性情報とは、例えば、ユーザに対応付けられた複数の車両のそれぞれに搭載された同一種類のエージェントを識別するための識別情報である。属性情報には、例えば、車名やナンバープレートに記載された自動車登録番号が含まれる。また、属性情報は、ユーザが複数の車両のうち何れかの車両を特定できる情報であればよく、具体的は、自動車メーカー、車体の色情報や形状情報、購入時期等の情報が含まれてもよい。エージェント設定情報には、例えば、エージェント設定部116で設定されたエージェント画像情報およびエージェント音声情報が含まれる。 The information providing unit 230 refers to the agent management information 260 stored in the storage unit 250 with respect to the response content generated by the response content generating unit 228, and generates the response content corresponding to the output mode of the agent. FIG. 5 is a diagram showing an example of the contents of the agent management information 260. In the agent management information 260, for example, attribute information and agent setting information are associated with a user ID which is identification information for identifying a user and a vehicle ID which is identification information for identifying a vehicle M. The attribute information is, for example, identification information for identifying an agent of the same type mounted on each of a plurality of vehicles associated with a user. The attribute information includes, for example, a vehicle name or a vehicle registration number written on a license plate. Further, the attribute information may be any information that allows the user to identify any one of a plurality of vehicles, and specifically includes information such as an automobile manufacturer, vehicle body color information and shape information, and purchase time. May be good. The agent setting information includes, for example, agent image information and agent audio information set by the agent setting unit 116.

例えば、情報提供部230は、エージェント機能部150A−1から音声と共に送信されたユーザIDおよび車両IDを用いて、記憶部250に記憶されたエージェント管理情報260を参照し、ユーザIDおよび車両IDに対応付けられたエージェント設定情報を取得する。そして、情報提供部230は、エージェント設定情報のエージェント画像およびエージェント音声に対応させた応答内容を生成し、生成した応答内容を、音声を送信したエージェント機能部150A−1に送信する。 For example, the information providing unit 230 refers to the agent management information 260 stored in the storage unit 250 by using the user ID and the vehicle ID transmitted from the agent function unit 150A-1 together with the voice, and uses the user ID and the vehicle ID as the user ID and the vehicle ID. Acquires the associated agent setting information. Then, the information providing unit 230 generates a response content corresponding to the agent image of the agent setting information and the agent voice, and transmits the generated response content to the agent function unit 150A-1 that has transmitted the voice.

エージェント機能部150A−1は、エージェントサーバ200−1から応答内容を取得すると、音声合成等を行って音声を出力するように音声制御部124に指示する。また、エージェント機能部150A−1は、音声出力に合わせてエージェント画像を生成し、生成したエージェント画像や応答結果に含まれる画像等を表示するように表示制御部122に指示する。このようにして、仮想的に出現したエージェントが車両Mの乗員に応答するエージェント機能が実現される。 When the agent function unit 150A-1 acquires the response content from the agent server 200-1, the agent function unit 150A-1 instructs the voice control unit 124 to perform voice synthesis or the like and output the voice. Further, the agent function unit 150A-1 generates an agent image in accordance with the voice output, and instructs the display control unit 122 to display the generated agent image, the image included in the response result, and the like. In this way, the agent function in which the virtually appearing agent responds to the occupant of the vehicle M is realized.

また、情報提供部230は、例えば、エージェント機能部150−1から取得したユーザU1に提供する情報であって、乗員認識装置80からの認識結果により車両MA、MBにユーザU1が乗車していない場合に、パーソナルプロファイル254に記憶された個人情報から携帯端末300のアドレス情報を取得し、取得したアドレス情報に基づいて携帯端末300に応答内容を出力する。ユーザU1に提供する情報とは、例えば、車両に関する情報やユーザU1との対話によって予約されていた情報等のユーザU1に早期に通知すべきであると推定される情報である。携帯端末300に情報提供を行う場合における情報提供部230の機能の詳細については後述する。 Further, the information providing unit 230 is, for example, information to be provided to the user U1 acquired from the agent function unit 150-1, and the user U1 is not on the vehicle MA or MB based on the recognition result from the occupant recognition device 80. In this case, the address information of the mobile terminal 300 is acquired from the personal information stored in the personal profile 254, and the response content is output to the mobile terminal 300 based on the acquired address information. The information provided to the user U1 is, for example, information that should be notified to the user U1 at an early stage, such as information about the vehicle and information reserved by dialogue with the user U1. The details of the function of the information providing unit 230 when providing information to the mobile terminal 300 will be described later.

エージェントサーバ200−1は、車両MAに搭載されたエージェント装置100Aが備えるエージェント機能部150A−1と、車両MBに搭載されたエージェント装置100Bが備えるエージェント機能部150B−1とのそれぞれに対して上述した機能を実行する。 The agent server 200-1 describes the agent function unit 150A-1 included in the agent device 100A mounted on the vehicle MA and the agent function unit 150B-1 included in the agent device 100B mounted on the vehicle MB, respectively. Perform the function you did.

[携帯端末]
携帯端末300は、例えば、エージェント機能が搭載されていない可搬型の端末装置である。携帯端末300は、例えば、スマートフォンやタブレット端末、ウェアラブル端末である。携帯端末300は、例えば、端末側通信部310と、端末側マイク320と、端末側表示・操作装置330と、端末側スピーカ340と、端末側音響処理部350と、端末側出力制御部360とを備える。これらの構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
[Mobile terminal]
The mobile terminal 300 is, for example, a portable terminal device not equipped with an agent function. The mobile terminal 300 is, for example, a smartphone, a tablet terminal, or a wearable terminal. The mobile terminal 300 includes, for example, a terminal-side communication unit 310, a terminal-side microphone 320, a terminal-side display / operation device 330, a terminal-side speaker 340, a terminal-side sound processing unit 350, and a terminal-side output control unit 360. To be equipped. These components are realized, for example, by a hardware processor such as a CPU executing a program (software). Some or all of these components may be realized by hardware such as LSI, ASIC, FPGA, GPU (including circuit part; circuitry), or realized by collaboration between software and hardware. May be good. The program may be stored in advance in a storage device such as an HDD or flash memory (a storage device including a non-transient storage medium), or a removable storage medium such as a DVD or a CD-ROM (non-transient). It is stored in a sex storage medium) and may be installed by attaching the storage medium to a drive device.

端末側通信部310は、ネットワークNWを介してエージェントサーバ200や他の外部装置と通信を行う。端末側マイク320は、ユーザU1が発した音を収集する音声入力部である。端末側表示・操作装置330は、画像を表示するとともに、入力操作を受付可能な装置である。端末側表示・操作装置330は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。端末側表示・操作装置330は、表示部としてLCDや有機EL、プラズマディスプレイ等を備え、操作部として各種ボタンや画面上にGUI(Graphical User Interface)スイッチを備える。端末側スピーカ340は、音声を出力する音声出力部である。 The terminal-side communication unit 310 communicates with the agent server 200 and other external devices via the network NW. The terminal-side microphone 320 is a voice input unit that collects the sound emitted by the user U1. The terminal-side display / operation device 330 is a device capable of displaying an image and accepting an input operation. The terminal-side display / operation device 330 includes, for example, a display device configured as a touch panel. The terminal-side display / operation device 330 includes an LCD, an organic EL, a plasma display, etc. as a display unit, and various buttons and a GUI (Graphical User Interface) switch on the screen as an operation unit. The terminal-side speaker 340 is an audio output unit that outputs audio.

端末側音響処理部350は、端末側マイク320から収集される音を受け付け、受け付けた音に対して、エージェントサーバ200−1側での音声認識が可能となるような音響処理を行う。端末側音響処理部350は、音響処理された音声を、端末側通信部310を介してエージェントサーバ200−1に送信する。 The terminal-side sound processing unit 350 receives the sound collected from the terminal-side microphone 320, and performs sound processing on the received sound so that the agent server 200-1 can recognize the sound. The terminal-side sound processing unit 350 transmits the sound-processed voice to the agent server 200-1 via the terminal-side communication unit 310.

端末側出力制御部360は、エージェントサーバ200−1から入力された応答内容に基づいて、端末側表示・操作装置330の表示部または端末側スピーカ340に情報を出力させる。端末側出力制御部360は、例えば、表示制御部362と、音声制御部364とを備える。表示制御部362は、端末側出力制御部360からの指示に応じて表示部の少なくとも一部の表示領域にエージェント画像等の各種画像を表示させる。音声制御部364は、端末側出力制御部360からの指示に応じて、端末側スピーカ340にエージェント音声等の各種音声を出力させる。 The terminal-side output control unit 360 causes the display unit of the terminal-side display / operation device 330 or the terminal-side speaker 340 to output information based on the response content input from the agent server 200-1. The terminal-side output control unit 360 includes, for example, a display control unit 362 and a voice control unit 364. The display control unit 362 causes various images such as an agent image to be displayed in at least a part of the display area of the display unit in response to an instruction from the terminal side output control unit 360. The voice control unit 364 causes the terminal side speaker 340 to output various voices such as agent voice in response to an instruction from the terminal side output control unit 360.

[エージェント設定部の機能]
以下、エージェント設定部116の機能について具体的に説明する。エージェント設定部116は、例えば、表示・操作装置20へのユーザ操作によりエージェントの設定指示を受け付けた場合、またはユーザが最初にエージェントを使用する場合に、エージェントの出力態様を設定するための画像を表示制御部122に生成させ、生成させた画像をエージェント設定画面として表示・操作装置20の表示部に出力させる。
[Function of agent setting part]
Hereinafter, the function of the agent setting unit 116 will be specifically described. The agent setting unit 116 displays an image for setting the output mode of the agent, for example, when an agent setting instruction is received by a user operation on the display / operation device 20, or when the user first uses the agent. The display control unit 122 is generated, and the generated image is output to the display unit of the display / operation device 20 as an agent setting screen.

図6は、エージェントの出力態様を設定するための画像IM1の一例を示す図である。なお、画像IM1に表示される内容やレイアウト等については、これに限定されるものではない。画像IM1には、例えば、エージェント選択領域A11と、エージェント画像選択領域A12と、音声選択領域A13と、GUIスイッチ選択領域A14とが含まれる。なお、画像IM1には、上述した領域に加えて、ユーザのIDや車両ID、車両の色、形状を設定する設定領域や属性情報を設定する設定領域、エージェントの名称を設定する設定領域等が含まれてもよい。 FIG. 6 is a diagram showing an example of the image IM1 for setting the output mode of the agent. The content, layout, etc. displayed on the image IM1 are not limited to this. The image IM1 includes, for example, an agent selection area A11, an agent image selection area A12, an audio selection area A13, and a GUI switch selection area A14. In addition to the above-mentioned areas, the image IM1 includes a setting area for setting a user ID, a vehicle ID, a vehicle color, and a shape, a setting area for setting attribute information, a setting area for setting an agent name, and the like. May be included.

エージェント選択領域A11には、例えば、ユーザU1が、出力態様を設定するエージェントを選択するための情報が表示される。例えば、エージェント1〜エージェント3のうち、エージェント1およびエージェント2が設定可能であり、エージェント3が設定不可能である場合、エージェント選択領域A11には、エージェント1およびエージェント2の選択肢のみが表示される。なお、エージェントの出力態様の設定(変更)が可能なエージェントには、車両Mの制御が可能なエージェント(ここでは、エージェント1)が含まれる。エージェント1は、車両の制御が行えるという特殊性から、他のエージェントよりも車両Mとの関連性が高いため、車両に関する情報を携帯端末300に通知する場合に、エージェント1を使用する頻度が高いことが予測される。したがって、エージェント1の出力態様を車両ごとに変更可能とすることで、ユーザU1に対し、携帯端末300に出力される情報から車両を判別させ易くすることができる。また、図6の例において、エージェント選択領域A11には、プルダウンメニュー(ドロップダウンメニュー)が表示されているが、これに代えて、リストボックスやラジオボタン等のGUIを用いてエージェントが選択可能に表示されてもよい。 In the agent selection area A11, for example, information for the user U1 to select an agent for which an output mode is set is displayed. For example, if agent 1 and agent 2 can be set and agent 3 cannot be set among agents 1 to 3, only the options of agent 1 and agent 2 are displayed in the agent selection area A11. .. The agent capable of setting (changing) the output mode of the agent includes an agent capable of controlling the vehicle M (here, agent 1). Since the agent 1 has a higher relationship with the vehicle M than other agents due to the peculiarity of being able to control the vehicle, the agent 1 is frequently used when notifying the mobile terminal 300 of information about the vehicle. Is expected. Therefore, by making it possible to change the output mode of the agent 1 for each vehicle, it is possible to make it easier for the user U1 to identify the vehicle from the information output to the mobile terminal 300. Further, in the example of FIG. 6, a pull-down menu (drop-down menu) is displayed in the agent selection area A11, but instead of this, an agent can be selected by using a GUI such as a list box or a radio button. It may be displayed.

エージェント画像選択領域A12には、例えば、予め決められた一以上のエージェント画像が表示される。図6の例において、エージェント画像選択領域A12には、エージェント画像EI1〜EI3(Character A〜C)が表示されている。ユーザU1は、エージェント画像EI1〜EI3のうち何れかの画像の表示領域をタッチすることで、エージェント画像が選択される。図6の例において、エージェント画像選択領域A12には、エージェント画像EI1が選択された状態が示されている。 In the agent image selection area A12, for example, one or more predetermined agent images are displayed. In the example of FIG. 6, agent images EI1 to EI3 (Character A to C) are displayed in the agent image selection area A12. The user U1 selects an agent image by touching the display area of any of the agent images EI1 to EI3. In the example of FIG. 6, the agent image selection area A12 shows the state in which the agent image EI1 is selected.

音声選択領域A13には、例えば、予め決められた一以上のエージェント音声が表示される。エージェント音声には、例えば、合成音声や、声優や著名人、タレント等の実際の人物の音声等を識別する情報が含まれる。図6の例において、音声選択領域A13には、プルダウンメニュー(ドロップダウンメニュー)が表示されているが、これに代えて、リストボックスやラジオボタン等のGUIを用いてエージェント音声が選択可能に表示されてもよい。 In the voice selection area A13, for example, one or more predetermined agent voices are displayed. The agent voice includes, for example, synthetic voice and information for identifying the voice of an actual person such as a voice actor, a celebrity, or a talent. In the example of FIG. 6, a pull-down menu (drop-down menu) is displayed in the voice selection area A13, but instead of this, the agent voice can be selected and displayed by using a GUI such as a list box or a radio button. May be done.

GUIスイッチ選択領域A14には、ユーザ選択可能な各種GUIボタンが表示される。図6の例において、GUIスイッチ選択領域A14には、例えば、各領域A11〜A13で選択した内容での設定を許可する設定許可ボタン(OKボタン)IC1と、設定を許可しないキャンセルボタンIC2とが含まれる。ユーザU1が、設定許可ボタンIC1を選択した場合、各領域A11〜A13で選択された内容でエージェントの出力態様が設定される。この場合、エージェント設定部116は、設定情報を、予め決められた(または設定された)ユーザID、車両ID、および属性情報等と対応付けて、エージェント選択領域A11で選択したエージェントに対応するエージェントサーバ200に送信する。図6の例では、エージェント1が選択されているため、設定情報(エージェント画像「characterA」、エージェント音声「VoiceA」)は、ユーザU1のユーザID(例えば、「U1」)、車両MAの車両ID(例えば、「V001」)、属性情報(例えば、車名「AAA」)と共に、エージェントサーバ200−1に送信される。エージェントサーバ200−1は、エージェント設定部116により送信された情報を、エージェント管理情報260として記憶部250に記憶させる。 Various user-selectable GUI buttons are displayed in the GUI switch selection area A14. In the example of FIG. 6, in the GUI switch selection area A14, for example, a setting permission button (OK button) IC1 that permits setting with the contents selected in each area A11 to A13 and a cancel button IC2 that does not permit setting are provided. included. When the user U1 selects the setting permission button IC1, the output mode of the agent is set according to the contents selected in each of the areas A11 to A13. In this case, the agent setting unit 116 associates the setting information with a predetermined (or set) user ID, vehicle ID, attribute information, and the like, and the agent corresponding to the agent selected in the agent selection area A11. Send to server 200. In the example of FIG. 6, since the agent 1 is selected, the setting information (agent image "characterA", agent voice "VoiceA") is the user ID of the user U1 (for example, "U1") and the vehicle ID of the vehicle MA. (For example, "V001") and attribute information (for example, vehicle name "AAA") are transmitted to the agent server 200-1. The agent server 200-1 stores the information transmitted by the agent setting unit 116 in the storage unit 250 as the agent management information 260.

なお、エージェント設定部116は、例えば、ユーザIDに対応付けて設定された出力態様(エージェント画像、エージェント音声)が、同一車両の他のエージェントの出力態様と重複する場合に、その設定情報の登録を中止し、異なる内容で再度設定するようにユーザU1に通知してもよい。これにより、同一車両に搭載された複数のエージェントの区別が付きにくくなることを抑制することができる。また、エージェント設定部116は、すでに登録されている他の車両の同一種類のエージェントの出力態様と重複する場合にも、同様に再度設定するような制御を行ってもよい。 The agent setting unit 116 registers the setting information when, for example, the output mode (agent image, agent voice) set in association with the user ID overlaps with the output mode of another agent in the same vehicle. May be canceled and the user U1 may be notified to set again with a different content. As a result, it is possible to prevent it from becoming difficult to distinguish between a plurality of agents mounted on the same vehicle. Further, the agent setting unit 116 may perform control to set again in the same manner even when the output mode overlaps with the output mode of the agent of the same type of another vehicle that has already been registered.

また、キャンセルボタンIC2が選択された場合、エージェント設定部116は、画像IM1によって設定された内容をクリアにする。なお、上述の例では、エージェント画像およびエージェント音声の設定を行う例について説明したが、例えば、エージェント画像またはエージェント音声の何れか一方を設定する画像を表示して、表示された内容に対する設定を行ってもよい。 When the cancel button IC2 is selected, the agent setting unit 116 clears the contents set by the image IM1. In the above example, an example of setting the agent image and the agent sound has been described. However, for example, an image for setting either the agent image or the agent sound is displayed, and the displayed contents are set. You may.

[情報提供部の機能]
次に、情報提供部230の機能について具体的に説明する。なお、以下では、情報提供部230の機能に関連する応答内容生成部228の機能についても説明する。応答内容生成部228は、例えば、エージェント機能部150A−1からユーザに提供する情報として、車両MAに関する情報が入力された場合に、車両MAに関する情報をユーザU1に通知する応答内容を生成する。「車両に関する情報」には、例えば、車両Mの窓やドアの開閉状態、燃料やバッテリの状態(例えば、残量)、ライトや室内照明のオン・オフ状態、または乗員認識装置80による認識結果のうち、少なくとも一つが含まれる。
[Function of information provision department]
Next, the function of the information providing unit 230 will be specifically described. In the following, the function of the response content generation unit 228 related to the function of the information providing unit 230 will also be described. The response content generation unit 228 generates response content for notifying the user U1 of the information regarding the vehicle MA when the information regarding the vehicle MA is input as the information provided to the user from the agent function unit 150A-1, for example. The "information about the vehicle" includes, for example, the open / closed state of windows and doors of the vehicle M, the state of fuel and battery (for example, the remaining amount), the on / off state of lights and interior lighting, or the recognition result by the occupant recognition device 80. Of these, at least one is included.

ここで、例えば、エージェントサーバ200−1は、車両MAのエージェント機能部150A−1から「後部座席の窓が開いている」という情報を取得したとする。また、エージェントサーバ200−1は、車両MA、MBに搭載された乗員認識装置80A、80Bの認識結果により、車両MA、MBに乗員が存在しないという情報を取得しているものとする。 Here, for example, it is assumed that the agent server 200-1 has acquired the information that "the rear seat window is open" from the agent function unit 150A-1 of the vehicle MA. Further, it is assumed that the agent server 200-1 has acquired the information that there is no occupant in the vehicles MA and MB based on the recognition results of the occupant recognition devices 80A and 80B mounted on the vehicles MA and MB.

この場合、情報提供部230は、ユーザU1の携帯端末300に車両MAに関する情報を出力させる。この場合、情報提供部230は、記憶部250に記憶されたエージェント管理情報260から、ユーザIDおよび車両IDに対応する属性情報を取得し、取得した属性情報を含む応答内容を生成する。図5の例において、ユーザU1のユーザIDが「U1」であり、車両MAの車両IDが「V001」である場合、応答内容生成部228は、出力態様がエージェント画像「characterA」、エージェント音声「VoiceA」の応答内容を生成すると共に、属性情報(例えば、車名「AAA」)の情報を含めた応答内容を生成し、生成した応答内容を携帯端末300に送信する。 In this case, the information providing unit 230 causes the mobile terminal 300 of the user U1 to output information about the vehicle MA. In this case, the information providing unit 230 acquires the attribute information corresponding to the user ID and the vehicle ID from the agent management information 260 stored in the storage unit 250, and generates a response content including the acquired attribute information. In the example of FIG. 5, when the user ID of the user U1 is "U1" and the vehicle ID of the vehicle MA is "V001", the response content generation unit 228 outputs the agent image "chargerA" and the agent voice "characterA". The response content of "VoiceA" is generated, the response content including the information of the attribute information (for example, the vehicle name "AAA") is generated, and the generated response content is transmitted to the mobile terminal 300.

端末側出力制御部360は、エージェントサーバ200−1により送信された応答内容に対応する画像を端末側表示・操作装置330の表示部に出力したり、応答内容に対応する音声を端末側スピーカ340により出力させる。 The terminal-side output control unit 360 outputs an image corresponding to the response content transmitted by the agent server 200-1 to the display unit of the terminal-side display / operation device 330, and outputs a voice corresponding to the response content to the terminal-side speaker 340. Is output by.

図7は、携帯端末300を介して情報提供される内容の一例を示す図である。図7の例では、表示制御部362により生成されて端末側表示・操作装置330の表示部に表示される画像IM2と、端末側スピーカ340により出力される音声の例を示している。画像IM2には、例えば、文字情報表示領域A21と、エージェント表示領域A22とが含まれる。文字情報表示領域A21には、例えば、ユーザU1と対話を行うエージェントに関する情報が表示される。図7の例において、文字情報表示領域A21には、「「AAA」のエージェント1が対話中」という文字情報が表示されている。 FIG. 7 is a diagram showing an example of the content provided as information via the mobile terminal 300. In the example of FIG. 7, an example of the image IM2 generated by the display control unit 362 and displayed on the display unit of the terminal side display / operation device 330 and the sound output by the terminal side speaker 340 is shown. The image IM2 includes, for example, a character information display area A21 and an agent display area A22. In the character information display area A21, for example, information about an agent interacting with the user U1 is displayed. In the example of FIG. 7, in the character information display area A21, the character information "The agent 1 of" AAA "is in a dialogue" is displayed.

エージェント表示領域A22には、例えば、対話中のエージェントに対応付けられたエージェント画像やエージェントの応答内容が表示される。図7の例において、エージェント表示領域A22には、ユーザU1および車両MAのエージェント1に対応付けられたエージェント画像EI1が表示されている。この場合、エージェント画像EI1は、車両ごとに設定されたエージェント設定情報のエージェント画像が表示される。また、エージェント表示領域A22には、応答内容に対応する文字情報として、「後部座席の窓が開いています。閉めますか?」という文字情報が表示される。また、音声制御部364は、応答内容に対応する音声として「「AAA」のエージェント1です。「AAA」の後部座席の窓が開いています。閉めますか?」といった音声を生成し、生成した音声を出力させる。この場合、音声は、ユーザU1および車両MAに対応付けられたエージェント音声で出力される。このように、画像に表示される文字情報やエージェント画像、エージェント音声によって、エージェント自身が、どの車両のエージェントであるかをユーザU1に伝えることで、対話しているエージェントをユーザU1に判別させ易くすることができる。 In the agent display area A22, for example, an agent image associated with the agent in conversation and the response content of the agent are displayed. In the example of FIG. 7, the agent image EI1 associated with the user U1 and the agent 1 of the vehicle MA is displayed in the agent display area A22. In this case, the agent image EI1 displays the agent image of the agent setting information set for each vehicle. Further, in the agent display area A22, the character information "The rear seat window is open. Do you want to close it?" Is displayed as the character information corresponding to the response content. In addition, the voice control unit 364 is the agent 1 of "AAA" as the voice corresponding to the response content. The rear seat window of "AAA" is open. Do you want to close it? ", And output the generated voice. In this case, the voice is output as the agent voice associated with the user U1 and the vehicle MA. In this way, by telling the user U1 which vehicle the agent itself is the agent of which vehicle by the character information displayed in the image, the agent image, and the agent voice, it is easy for the user U1 to identify the agent who is interacting with the agent. can do.

また、携帯端末300に上述した図7に示すような情報提供がなされた後、ユーザU1が「閉めて」と発話した場合、端末側マイク320により取得された上記の発話の音声に対する音響処理が行われ、音響処理された音声が端末側通信部310からエージェントサーバ200−1に送信される。エージェントサーバ200−1は、携帯端末300から受信した音声に対する音声認識を行い、認識結果に基づく応答として、車両MAの後部座席の窓を閉めるコマンド等を生成し、生成したコマンドをサーバ側通信部210からエージェント機能部150A−1に送信する。エージェント機能部150A−1は、受信したコマンドに従って車両機器50を制御し、後部座席の窓を閉める制御を実行する。これにより、ユーザU1は、特定した車両に適切な指示を行うことができる。 Further, when the user U1 utters "close" after the information as shown in FIG. 7 is provided to the mobile terminal 300, the sound processing for the voice of the utterance acquired by the terminal side microphone 320 is performed. The performed and sound-processed voice is transmitted from the terminal-side communication unit 310 to the agent server 200-1. The agent server 200-1 performs voice recognition for the voice received from the mobile terminal 300, generates a command for closing the window of the rear seat of the vehicle MA as a response based on the recognition result, and generates the generated command in the server-side communication unit. It is transmitted from 210 to the agent function unit 150A-1. The agent function unit 150A-1 controls the vehicle equipment 50 according to the received command, and executes the control of closing the rear seat window. As a result, the user U1 can give an appropriate instruction to the specified vehicle.

[処理フロー]
図8は、第1実施形態に係るエージェントシステム1により実行される処理の流れの一例を示すフローチャートである。なお、以下では、ユーザU1が、同一種類のエージェント機能を備える複数のエージェント装置100A、100Bがそれぞれ搭載された二台の車両MA、MBと、携帯端末300を所有しているものとする。また、以下では、主に、車両MAのエージェントからの情報提供を携帯端末300に行う処理を中心に説明するものとする。また、以下では、既にエージェント設定部116により車両ごとに各エージェントのエージェント画像およびエージェント音声が設定されているものとする。また、以下の処理は、所定のタイミングまたは周期で繰り返し実行されるものとする。
[Processing flow]
FIG. 8 is a flowchart showing an example of a processing flow executed by the agent system 1 according to the first embodiment. In the following, it is assumed that the user U1 owns two vehicles MA and MB and a mobile terminal 300, which are each equipped with a plurality of agent devices 100A and 100B having the same type of agent function. Further, in the following, the process of providing the information from the agent of the vehicle MA to the mobile terminal 300 will be mainly described. Further, in the following, it is assumed that the agent image and the agent voice of each agent have already been set for each vehicle by the agent setting unit 116. In addition, the following processing shall be repeatedly executed at a predetermined timing or cycle.

図8の例において、まず、エージェント機能部150は、ユーザU1への応答を行うか否かを判定する(ステップS100)。応答とは、対話中ではなく単に情報提供を行う場合も含む。ユーザU1への応答を行うと判定された場合、応答内容生成部228は、情報提供の内容に基づいて、エージェント設定情報(エージェント画像、エージェント音声)に対応する出力態様の応答内容を生成する(ステップS102)。次に、情報提供部230は、生成した応答内容をユーザU1の携帯端末300に送信するか否かを判定する(ステップS104)。例えば、車両MAまたはMBにユーザU1が乗車していない場合、情報提供部230は、応答内容を携帯端末300に送信すると判定する。 In the example of FIG. 8, first, the agent function unit 150 determines whether or not to respond to the user U1 (step S100). The response includes the case of simply providing information rather than during a dialogue. When it is determined that the response to the user U1 is performed, the response content generation unit 228 generates the response content of the output mode corresponding to the agent setting information (agent image, agent voice) based on the content of the information provision ( Step S102). Next, the information providing unit 230 determines whether or not to transmit the generated response content to the mobile terminal 300 of the user U1 (step S104). For example, when the user U1 is not on the vehicle MA or MB, the information providing unit 230 determines that the response content is transmitted to the mobile terminal 300.

応答内容を携帯端末300に送信すると判定された場合、情報提供部230は、エージェントの属性情報を含む応答内容を生成し(ステップS106)、生成した応答内容を携帯端末300に送信する(ステップS108)。この結果、携帯端末300からは、エージェントの属性情報を含む応答内容が出力されることになり、どの車両のエージェントからの情報提供であるかをユーザU1に判別させ易くすることができる。 When it is determined that the response content is transmitted to the mobile terminal 300, the information providing unit 230 generates the response content including the attribute information of the agent (step S106), and transmits the generated response content to the mobile terminal 300 (step S108). ). As a result, the response content including the attribute information of the agent is output from the mobile terminal 300, and it is possible to make it easy for the user U1 to determine from which vehicle the agent the information is provided.

また、ステップS104の処理において、携帯端末300に送信しないと判定された場合、情報提供部230は、応答内容生成部228により生成された応答内容を、乗員が乗車している車両に送信する(ステップS110)。なお、ユーザU1への応答が車両MAのエージェントから提供された情報であり、ユーザU1が車両MB(他の車両)に乗車している場合には、他の車両MBの同一種類のエージェントの出力態様で応答内容を出力してもよく、属性情報を含む応答内容を生成し、生成した応答内容を出力してもよい。これにより、本フローチャートの処理は、終了する。また、ステップS100の処理において、ユーザへの応答を行わないと判定された場合、本フローチャートの処理は終了する。 Further, in the process of step S104, when it is determined not to transmit to the mobile terminal 300, the information providing unit 230 transmits the response content generated by the response content generating unit 228 to the vehicle on which the occupant is riding ( Step S110). The response to the user U1 is the information provided by the agent of the vehicle MA, and when the user U1 is in the vehicle MB (another vehicle), the output of the agent of the same type of the other vehicle MB The response content may be output depending on the mode, or the response content including the attribute information may be generated and the generated response content may be output. As a result, the processing of this flowchart ends. Further, in the process of step S100, when it is determined that the response to the user is not performed, the process of this flowchart ends.

上述した第1実施形態に係るエージェントシステム1によれば、ユーザが複数のエージェント機能が搭載された複数の車両を所有する場合に、エージェントからの情報提供に、エージェントの属性情報を付与させることで、どの車両に搭載されたエージェントであるかをユーザに区別させ易くすることができる。また、第1実施形態に係るエージェントシステム1によれば、携帯端末300にエージェント機能が搭載されていない場合であっても車両側のエージェントと連携させた対話を実現することができる。 According to the agent system 1 according to the first embodiment described above, when the user owns a plurality of vehicles equipped with a plurality of agent functions, the information provided by the agent is given the attribute information of the agent. , It is possible to make it easy for the user to distinguish which vehicle the agent is mounted on. Further, according to the agent system 1 according to the first embodiment, even when the mobile terminal 300 is not equipped with the agent function, it is possible to realize a dialogue linked with the agent on the vehicle side.

<第2実施形態>
次に、第2実施形態に係るエージェントシステムについて説明する。例えば、物体に搭載されるエージェントによっては、エージェント提供者ごとに決められた制約や権限等により、エージェント画像やエージェントの音声が変更できない場合がある。この状況において、携帯端末300への情報提供を行う場合、複数の物体に搭載される同一種類のエージェントの出力態様が同じになるため、どの物体のエージェントであるかが区別しきれない場合があり得る。したがって、第2実施形態では、エージェント画像やエージェント音声が車両ごとに区別可能に設定されていないエージェントからの情報を提供する場合に、その物体に搭載された他のエージェントであって、エージェント画像やエージェント音声が設定されているエージェント(代理応答エージェント)が代わりに情報提供を行う。なお、第2実施形態のエージェントシステムは、第1実施形態のエージェントシステム1と比較して、エージェントサーバの構成のみが異なる。したがって、以下では、主にエージェントサーバの機能を中心に説明する。また、以下の説明において、第1実施形態の構成と同様の構成については、同一の名称および符号を付するものとし、具体的な説明は省略するものとする。
<Second Embodiment>
Next, the agent system according to the second embodiment will be described. For example, depending on the agent mounted on the object, the agent image and the agent voice may not be changed due to restrictions and privileges determined for each agent provider. In this situation, when providing information to the mobile terminal 300, the output modes of the same type of agents mounted on a plurality of objects are the same, so it may not be possible to distinguish which object the agent is. obtain. Therefore, in the second embodiment, when the agent image or the agent voice provides information from the agent that is not set to be distinguishable for each vehicle, the agent image or the agent sound is another agent mounted on the object. The agent (proxy response agent) for which the agent voice is set provides information instead. The agent system of the second embodiment differs from the agent system 1 of the first embodiment only in the configuration of the agent server. Therefore, in the following, the functions of the agent server will be mainly described. Further, in the following description, the same name and reference numerals will be given to the same configurations as those of the first embodiment, and specific description will be omitted.

図9は、第2実施形態に係るエージェントサーバの構成の一例を示す図である。図9の例では、一例として車両MAに搭載された複数の異なるエージェント1〜3に対応付けられたエージェント機能部150A−1〜150A−3およびエージェントサーバ200#−1〜200#−3を示すものとする。エージェントサーバ200#−1〜200#−3は、それぞれが実行可能な機能やデータベース等で相違はあるものの、大まかな処理は同様であるため、以下ではエージェントサーバ200#−1を用いて説明するものとする。 FIG. 9 is a diagram showing an example of the configuration of the agent server according to the second embodiment. In the example of FIG. 9, as an example, the agent function units 150A-1 to 150A-3 and the agent servers 200 # -1 to 200 # 3 associated with a plurality of different agents 1 to 3 mounted on the vehicle MA are shown. It shall be. Although the agent servers 200 # -1 to 200 # -3 differ in the functions and databases that can be executed by each, the rough processing is the same. Therefore, the agent servers 200 # -1 will be described below. It shall be.

エージェントサーバ200#−1は、例えば、第1実施形態に係るエージェントサーバ200と比較して、情報提供部230に代えて情報提供部230#を備える点で相違する。したがって、以下では、主に情報提供部230#を中心として説明する。情報提供部230#は、情報提供部230と同様の機能を備えるのに加え、応答内容を携帯端末300に出力する場合であって、且つ、エージェント管理情報260に、車両ごとのエージェント設定情報がない場合に、同一車両に搭載された他のエージェントであって、且つ、車両ごとのエージェント設定情報が存在するエージェントに、応答内容を代理出力させる。 The agent server 200 # -1 is different from the agent server 200 according to the first embodiment in that it includes an information providing unit 230 # instead of the information providing unit 230, for example. Therefore, in the following, the information providing unit 230 # will be mainly described. In addition to having the same functions as the information providing unit 230, the information providing unit 230 # is a case where the response content is output to the mobile terminal 300, and the agent management information 260 contains agent setting information for each vehicle. If not, the response content is output as a proxy by another agent mounted on the same vehicle and having agent setting information for each vehicle.

具体的には、エージェントサーバ200#−1の情報提供部230#は、応答内容を携帯端末300に出力する場合であって、且つ、エージェント管理情報260に、車両ごとのエージェント設定情報がない場合に、他のエージェントサーバ(例えば、エージェントサーバ200#−2、200#−3)にユーザIDおよび車両IDを送信して代理応答の可否に関する問い合わせを行う。 Specifically, the information providing unit 230 # of the agent server 200 # -1 outputs the response content to the mobile terminal 300, and the agent management information 260 does not include the agent setting information for each vehicle. Inquires about whether or not a proxy response is possible by transmitting a user ID and a vehicle ID to another agent server (for example, agent servers 200 # -2 and 200 # -3).

他のエージェントサーバ200#−2、200#−3の情報提供部230#は、受信したユーザIDおよび車両IDを用いて、自己のエージェント管理情報260を参照し、合致するエージェント管理情報が存在する場合に、代理応答が可能であると判定し、合致するエージェント管理情報が存在しない場合に、代理応答が不可能であると判定する。なお、代理応答の可否判定については、上述の例に代えて(または加えて)、ユーザが予め設定した可否フラグに基づいて可否判定を行ってもよく、携帯端末300に送信できるか否かに基づいて可否判定を行ってもよく、その他の条件により可否判定を行ってもよい。他のエージェントサーバ200#−2、200#−3の情報提供部230#は、問い合わせ結果をエージェントサーバ200#−1に送信する。 The information providing unit 230 # of the other agent servers 200 # -2 and 200 # -3 refers to its own agent management information 260 by using the received user ID and vehicle ID, and there is matching agent management information. In this case, it is determined that the proxy response is possible, and if there is no matching agent management information, it is determined that the proxy response is not possible. Regarding the pass / fail judgment of the proxy response, instead of (or in addition to) the above example, the pass / fail judgment may be made based on the pass / fail flag set in advance by the user, and whether or not the proxy response can be transmitted to the mobile terminal 300 is determined. The pass / fail judgment may be made based on the above, or the pass / fail judgment may be made based on other conditions. The information providing unit 230 # of the other agent servers 200 # -2 and 200 # -3 transmits the inquiry result to the agent server 200 # -1.

エージェントサーバ200#−1の情報提供部230#は、他のエージェントサーバ200#−2、200#−3のうち、代理応答の許可があったエージェントサーバに応答内容を送信し、送信先のエージェントサーバに対応付けられたエージェントに携帯端末300への応答内容の出力を実行させる。なお、複数のエージェントサーバから応答許可があった場合、情報提供部230#は、最初に応答許可を送信したエージェントサーバまたは予め決められた優先度の高いエージェントサーバに応答内容を送信する。なお、情報提供部230#は、他のエージェントサーバに上述の問い合わせを行わずに、強制的に特定のエージェントサーバに応答内容を送信して代理出力させてもよい。 The information providing unit 230 # of the agent server 200 # -1 sends the response content to the agent server of the other agent servers 200 # -2 and 200 # -3 that has permission for the proxy response, and the destination agent The agent associated with the server is made to output the response contents to the mobile terminal 300. When response permission is given from a plurality of agent servers, the information providing unit 230 # sends the response content to the agent server that first sent the response permission or the agent server having a predetermined high priority. Note that the information providing unit 230 # may forcibly send the response content to a specific agent server and output it as a proxy without making the above inquiry to another agent server.

エージェントサーバ200#−1から応答内容を受信したエージェントサーバの情報提供部230#は、応答内容にエージェントの属性情報やエージェント種別等を付与した応答内容を自己のエージェントの出力態様で携帯端末300に出力させる。 Upon receiving the response content from the agent server 200 # -1, the information providing unit 230 # of the agent server adds the agent attribute information, the agent type, etc. to the response content to the mobile terminal 300 in the output mode of its own agent. Output.

図10は、第2実施形態において、携帯端末300から出力される情報の一例を示す図である。図10には、携帯端末300の端末側表示・操作装置330の表示部に表示される画像IM3の一例が示されている。また、図10の例では、エージェント3のエージェントサーバ200#−3により生成された応答内容をエージェントサーバ200#−1に対応付けられたエージェント1が提供する場面を示している。画像IM3には、例えば、文字情報表示領域A31と、エージェント表示領域A32とが含まれる。文字情報表示領域A31には、現在対話中のエージェントに関する情報が表示される。図10の例において、文字情報表示領域A31には、「「AAA」のエージェント1が対話中」という文字情報が表示されている。 FIG. 10 is a diagram showing an example of information output from the mobile terminal 300 in the second embodiment. FIG. 10 shows an example of the image IM3 displayed on the display unit of the terminal side display / operation device 330 of the mobile terminal 300. Further, the example of FIG. 10 shows a scene in which the agent 1 associated with the agent server 200 # -1 provides the response content generated by the agent server 200 # -3 of the agent 3. The image IM3 includes, for example, a character information display area A31 and an agent display area A32. In the character information display area A31, information about the agent currently interacting is displayed. In the example of FIG. 10, in the character information display area A31, the character information "The agent 1 of" AAA "is in a dialogue" is displayed.

エージェント表示領域A32には、例えば、対話中のエージェント画像や応答結果(提供される情報)が表示される。図10の例において、エージェント表示領域A32には、応答内容をエージェント3に代わってユーザU1に通知しているエージェント1に対応するエージェント画像EI1と、エージェント3が生成した応答結果として「本日 15:00 ○○に出かける。」という文字情報とが表示されている。なお、この場面において出力される応答結果には、属性情報を含む自己のエージェントに関する情報と、応答内容を生成したエージェントに関する情報と、エージェントが生成した応答内容とが含まれる。図10の例において、エージェント表示領域A32には、応答結果の音声情報として、「「AAA」のエージェント1です。」および「エージェント3より本日15時から○○に出かける予定についての連絡が入っています。」という音声が出力されている。 In the agent display area A32, for example, an agent image during dialogue and a response result (provided information) are displayed. In the example of FIG. 10, in the agent display area A32, the agent image EI1 corresponding to the agent 1 that notifies the user U1 of the response content on behalf of the agent 3, and the response result generated by the agent 3 are "Today 15: The text information "Go out to 00 ○○." Is displayed. The response result output in this scene includes information about the own agent including attribute information, information about the agent that generated the response content, and the response content generated by the agent. In the example of FIG. 10, the agent display area A32 is the agent 1 of "AAA" as the voice information of the response result. "And" Agent 3 has contacted me about my plan to go to XX from 15:00 today. "

なお、第2実施形態において、代理応答エージェントは、所定エージェントのみが行うことができるように設定されていてもよい。この場合、所定のエージェントとは、例えば、エージェントの出力態様を設定可能なエージェントである。また、所定のエージェントには、車両Mの制御が可能なエージェント(ここでは、エージェント1)が含まれる。また、エージェント1は、例えば、他のエージェントよりも代理応答を行う優先度が高くされたり、強制的に代理応答を行う特定のエージェントに選択される。車両Mとの関連性が高いエージェント1に代理応答させることで、どの車両から提供された情報であるかをユーザに判別させ易くすることができる。 In the second embodiment, the proxy response agent may be set so that only a predetermined agent can perform the proxy response agent. In this case, the predetermined agent is, for example, an agent whose output mode of the agent can be set. Further, the predetermined agent includes an agent capable of controlling the vehicle M (here, agent 1). Further, the agent 1 is, for example, selected as a specific agent that has a higher priority for performing a proxy response than other agents or forcibly performs a proxy response. By causing the agent 1 having a high relevance to the vehicle M to make a proxy response, it is possible to make it easier for the user to determine from which vehicle the information is provided.

[処理フロー]
以下、第2実施形態に係るエージェントシステムにより実行される処理の流れについて説明する。なお、第2実施形態に係るエージェントシステムにより実行される処理は、例えば、エージェントサーバ200#の情報提供部230#が他のエージェントサーバに代理応答させる処理と、他のエージェントサーバから受信した応答内容に基づいて、自己のエージェントが代理応答する処理とに大別されるため、それぞれを分けて説明する。
[Processing flow]
Hereinafter, the flow of processing executed by the agent system according to the second embodiment will be described. The processes executed by the agent system according to the second embodiment include, for example, a process in which the information providing unit 230 # of the agent server 200 # causes another agent server to make a proxy response, and a response content received from the other agent server. Based on the above, the processing is roughly divided into the processing in which the own agent responds by proxy, so each of them will be described separately.

図11は、エージェントサーバ200#が他のエージェントサーバに代理応答させる処理の流れの一例を示すフローチャートである。図11にフローチャートは、上述した図8に示す第1実施形態におけるフローチャートと比較して、ステップS120〜S128の処理が追加されている点で相違する。したがって、以下では、主にステップS120〜S128の処理を中心に説明する。ステップS100の処理において、ユーザへの情報提供を行うと判定された場合、情報提供部230#は、エージェント管理情報260にユーザIDおよび車両IDに対応するエージェント設定情報が存在するか否かを判定する(ステップS120)。エージェント設定情報が存在すると判定された場合、ステップS102〜S110の処理を実行する。 FIG. 11 is a flowchart showing an example of a processing flow in which the agent server 200 # causes another agent server to respond by proxy. The flowchart in FIG. 11 is different from the flowchart in the first embodiment shown in FIG. 8 described above in that the processes of steps S120 to S128 are added. Therefore, in the following, the processing of steps S120 to S128 will be mainly described. When it is determined in the process of step S100 that the information is provided to the user, the information providing unit 230 # determines whether or not the agent management information 260 contains the agent setting information corresponding to the user ID and the vehicle ID. (Step S120). If it is determined that the agent setting information exists, the processes of steps S102 to S110 are executed.

また、エージェント設定情報が存在しないと判定された場合、応答内容生成部228は、応答内容を生成する(ステップS122)。次に、情報提供部230#は、同一車両に搭載された他のエージェント(より具体的には、他のエージェントサーバ)に代理応答の可否を問い合わせる(ステップS124)。次に、情報提供部230#は、ステップS124に対する問い合わせ結果から代理応答エージェントが存在するか否かを判定する(ステップS126)。代理応答エージェントが存在しない場合、ステップS104〜S110の処理を実行する。また、代理応答エージェントが存在する場合、情報提供部230#は、代理応答エージェントに応答内容を送信する(ステップS128)。 If it is determined that the agent setting information does not exist, the response content generation unit 228 generates the response content (step S122). Next, the information providing unit 230 # inquires of another agent (more specifically, another agent server) mounted on the same vehicle whether or not a proxy response is possible (step S124). Next, the information providing unit 230 # determines whether or not the proxy response agent exists from the inquiry result for step S124 (step S126). If the proxy response agent does not exist, the processes of steps S104 to S110 are executed. If the proxy response agent exists, the information providing unit 230 # transmits the response content to the proxy response agent (step S128).

図12は、他のエージェントサーバから受信した応答内容に基づいて、自己のエージェントが代理応答する処理の流れの一例を示すフローチャートである。図12の例において、情報提供部230#は、他のエージェントサーバから代理応答の可否の問い合わせを受け付けたか否かを判定する(ステップS200)。代理応答の可否の問い合わせを受け付けた場合、情報提供部230#は、問い合わせ情報として取得したユーザIDおよび車両IDとに基づいて、エージェント管理情報260を参照し、ユーザIDおよび車両IDに対応するエージェント設定情報が存在するか否かを判定する(ステップS202)。 FIG. 12 is a flowchart showing an example of a processing flow in which the own agent makes a proxy response based on the response contents received from another agent server. In the example of FIG. 12, the information providing unit 230 # determines whether or not an inquiry as to whether or not a proxy response is possible has been received from another agent server (step S200). When receiving an inquiry as to whether or not a proxy response is possible, the information providing unit 230 # refers to the agent management information 260 based on the user ID and the vehicle ID acquired as the inquiry information, and the agent corresponding to the user ID and the vehicle ID. It is determined whether or not the setting information exists (step S202).

エージェント設定情報が存在する場合、情報提供部230#は、代理応答が可能であると判断し、代理応答が可能であることを問い合わせのあったエージェントサーバに通知する(ステップS204)。次に、情報提供部230#は、代理応答が可能であることを通知したエージェントサーバから応答内容を受信したか否かを判定する(ステップS206)。応答内容を受信したと判定された場合、情報提供部230#は、受信した応答内容をユーザU1の携帯端末300に送信するか否かを判定する(ステップS208)。応答内容を携帯端末300に送信すると判定された場合、情報提供部230#は、エージェントの属性情報および応答内容を生成したエージェント種別を含む応答内容を生成し(ステップS210)、生成した応答内容を携帯端末300に送信する(ステップS212)。この結果、携帯端末300により出力される提供情報には、エージェントの属性情報やエージェント種別も含まれることになり、車両およびエージェントをユーザU1に判別させ易くすることができる。 If the agent setting information exists, the information providing unit 230 # determines that the proxy response is possible, and notifies the inquired agent server that the proxy response is possible (step S204). Next, the information providing unit 230 # determines whether or not the response content has been received from the agent server that has notified that the proxy response is possible (step S206). When it is determined that the response content has been received, the information providing unit 230 # determines whether or not to transmit the received response content to the mobile terminal 300 of the user U1 (step S208). When it is determined that the response content is transmitted to the mobile terminal 300, the information providing unit 230 # generates the response content including the attribute information of the agent and the agent type that generated the response content (step S210), and generates the generated response content. It is transmitted to the mobile terminal 300 (step S212). As a result, the provided information output by the mobile terminal 300 also includes the attribute information of the agent and the agent type, so that the user U1 can easily identify the vehicle and the agent.

また、ステップS208の処理において、携帯端末300に送信しないと判定された場合、情報提供部230#は、応答内容生成部228により生成された応答内容を、乗員が乗車している車両に送信する(ステップS214)。また、ステップS02の処理において、エージェント設定情報が存在しないと判定された場合、情報提供部230#は、代理応答が不可能であることを問い合わせのあったエージェントサーバに通知する(ステップS216)。これにより、本フローチャートの処理は、終了する。また、ステップS200の処理において、代理応答の可否の問い合わせを受け付けていないと判定された場合、またはステップS206の処理において、応答内容を受信していないと判定された場合、本フローチャートの処理は終了する。 Further, in the process of step S208, when it is determined not to transmit to the mobile terminal 300, the information providing unit 230 # transmits the response content generated by the response content generating unit 228 to the vehicle on which the occupant is riding. (Step S214). If it is determined in the process of step S02 that the agent setting information does not exist, the information providing unit 230 # notifies the inquired agent server that the proxy response is impossible (step S216). As a result, the processing of this flowchart ends. Further, in the process of step S200, when it is determined that the inquiry as to whether or not the proxy response is possible is not accepted, or when it is determined in the process of step S206 that the response content is not received, the process of this flowchart ends. To do.

上述した第2実施形態に係るエージェントシステムによれば、第1実施形態におけるエージェントシステムと同様の効果を奏する他、ユーザが所有する複数の車両に搭載されたエージェントに対する出力態様の設定状況に応じて、同一車両の他のエージェントに代理応答させることで、ユーザに、どの車両に搭載されたどのエージェントからの情報であるかを区別させ易くすることができる。 According to the agent system according to the second embodiment described above, the same effect as that of the agent system in the first embodiment is obtained, and the output mode is set according to the agent mounted on a plurality of vehicles owned by the user. By having other agents in the same vehicle respond on behalf of the user, it is possible to make it easier for the user to distinguish which agent is installed in which vehicle.

上述した第1実施形態および第2実施形態のそれぞれは、他の実施形態の一部または全部を組み合わせてもよい。また、エージェント装置100の機能のうち一部または全部は、エージェントサーバ200(200#)に含まれていてもよい。また、エージェントサーバ200(200#)の機能のうち一部または全部は、エージェント装置100に含まれていてもよい。つまり、エージェント装置100およびエージェントサーバ200(200#)における機能の切り分けは、各装置の構成要素、エージェントサーバ200(200#)やエージェントシステムの規模等によって適宜変更されてよい。また、エージェント装置100およびエージェントサーバ200(200#)における機能の切り分けは、車両Mごとに設定されてもよい。 Each of the first embodiment and the second embodiment described above may be a combination of some or all of the other embodiments. Further, a part or all of the functions of the agent device 100 may be included in the agent server 200 (200 #). Further, a part or all of the functions of the agent server 200 (200 #) may be included in the agent device 100. That is, the division of functions between the agent device 100 and the agent server 200 (200 #) may be appropriately changed depending on the components of each device, the scale of the agent server 200 (200 #), the agent system, and the like. Further, the division of functions in the agent device 100 and the agent server 200 (200 #) may be set for each vehicle M.

また、第1実施形態および第2実施形態における物体の一例として車両を用いて説明したが、車両に代えて(または加えて)、例えば、自宅や会社等の特定の地点に設置された端末装置や、車両以外の出力部を備えた移動体(例えば、船舶、飛行機、ドローン、自動二輪車)であってもよい。また、上述の実施形態の携帯端末300は、エージェント機能を搭載していない携帯端末として説明したが、これに限定されるものではなく、携帯端末300に一以上のエージェント機能が搭載されていてもよい。この場合、携帯端末300には、上述したエージェント機能部150と同様の機能が搭載され、エージェントサーバ200等を介して、上述したエージェントと同様の機能が実現される。 Further, although the vehicle has been described as an example of the object in the first embodiment and the second embodiment, the terminal device installed in place of (or in addition to) the vehicle, for example, at a specific point such as a home or a company. Alternatively, it may be a moving body (for example, a ship, an airplane, a drone, a motorcycle) having an output unit other than a vehicle. Further, the mobile terminal 300 of the above-described embodiment has been described as a mobile terminal not equipped with an agent function, but the present invention is not limited to this, and even if the mobile terminal 300 is equipped with one or more agent functions. Good. In this case, the mobile terminal 300 is equipped with the same function as the agent function unit 150 described above, and the same function as the agent described above is realized via the agent server 200 or the like.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.

1…エージェントシステム、10…マイク、20…表示・操作装置、30…スピーカユニット、40…ナビゲーション装置、50…車両機器、60…車載通信装置、70…汎用通信装置、80…乗員認識装置、100…エージェント装置、110…管理部、112…音響処理部、114…エージェントごとWU判定部、116…エージェント設定部、120…出力制御部、122、362…表示制御部、124、364…音声制御部、150…エージェント機能部、160…ペアリングアプリ実行部、170、250…記憶部、200…エージェントサーバ、210…サーバ側通信部、220…音声認識部、222…自然言語処理部、224…対話管理部、226…ネットワーク検索部、228…応答内容生成部、230、230#…情報提供部、300…携帯端末、310…端末側通信部、320…端末側マイク、330…端末側表示・操作装置、340…端末側スピーカ、350…端末側音響処理部、360…端末側出力制御部、400…各種ウェブサーバ 1 ... Agent system, 10 ... Microphone, 20 ... Display / operation device, 30 ... Speaker unit, 40 ... Navigation device, 50 ... Vehicle equipment, 60 ... In-vehicle communication device, 70 ... General-purpose communication device, 80 ... Crew recognition device, 100 ... Agent device, 110 ... Management unit, 112 ... Sound processing unit, 114 ... WU determination unit for each agent, 116 ... Agent setting unit, 120 ... Output control unit, 122, 362 ... Display control unit, 124, 364 ... Voice control unit , 150 ... Agent function unit, 160 ... Pairing application execution unit, 170, 250 ... Storage unit, 200 ... Agent server, 210 ... Server side communication unit, 220 ... Voice recognition unit, 222 ... Natural language processing unit, 224 ... Dialogue Management unit, 226 ... Network search unit, 228 ... Response content generation unit, 230, 230 # ... Information provision unit, 300 ... Mobile terminal, 310 ... Terminal side communication unit, 320 ... Terminal side microphone, 330 ... Terminal side display / operation Device, 340 ... Terminal side speaker, 350 ... Terminal side sound processing unit, 360 ... Terminal side output control unit, 400 ... Various web servers

Claims (10)

異なる複数の物体に搭載され、それぞれがユーザの発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、
前記複数のエージェント機能部のうち、前記複数の物体に同一種類のエージェント機能部が存在する場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、
を備えるエージェントシステム。
Multiple agent function units mounted on multiple different objects, each of which provides a service including a voice response according to the user's utterance.
When the same type of agent function unit exists in the plurality of objects among the plurality of agent function units, the attribute information associated with each of the same type agent function unit is transmitted to the same type of agent function unit. The information providing unit provided to the user's portable mobile terminal, including the contents of the response by
Agent system with.
前記複数の物体は、前記ユーザに対応付けられた車両を含む、
請求項1に記載のエージェントシステム。
The plurality of objects include a vehicle associated with the user.
The agent system according to claim 1.
前記属性情報は、前記車両に関する情報を含む、
請求項2に記載のエージェントシステム。
The attribute information includes information about the vehicle.
The agent system according to claim 2.
前記複数のエージェント機能部のうち、所定のエージェント機能部における前記応答の出力態様を設定する設定部を更に備える、
請求項2または3に記載のエージェントシステム。
Among the plurality of agent function units, a setting unit for setting an output mode of the response in a predetermined agent function unit is further provided.
The agent system according to claim 2 or 3.
前記所定のエージェント機能部は、前記車両の制御が可能なエージェント機能部である、
請求項4に記載のエージェントシステム。
The predetermined agent function unit is an agent function unit capable of controlling the vehicle.
The agent system according to claim 4.
前記所定のエージェント機能部は、前記複数のエージェント機能部に含まれる他のエージェント機能部の応答内容を取得する、
請求項4または5に記載のエージェントシステム。
The predetermined agent function unit acquires the response contents of other agent function units included in the plurality of agent function units.
The agent system according to claim 4 or 5.
前記所定のエージェント機能部は、他のエージェント機能部から取得した応答内容を、前記他のエージェント機能部に代理して前記携帯端末に出力させる、
請求項4から6のうち何れか1項に記載のエージェントシステム。
The predetermined agent function unit causes the mobile terminal to output the response content acquired from the other agent function unit on behalf of the other agent function unit.
The agent system according to any one of claims 4 to 6.
ユーザの発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、
前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する情報提供部と、
を備えるエージェントサーバ。
An agent function unit that provides services including voice responses in response to user utterances,
When the agent function unit is mounted on a plurality of objects associated with the user and the agent function unit mounted on each of the plurality of objects is the same type of agent function unit, the same type of agent An information providing unit that includes the attribute information associated with each of the functional units in the response content of the agent function unit of the same type and provides the user's portable mobile terminal.
Agent server with.
コンピュータが、
エージェント機能部を起動させ、
前記起動したエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供し、
前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供する、
エージェントサーバの制御方法。
The computer
Start the agent function part and
As a function of the activated agent function unit, a service including a response is provided in response to a user's utterance.
When the agent function unit is mounted on a plurality of objects associated with the user and the agent function unit mounted on each of the plurality of objects is the same type of agent function unit, the same type of agent The attribute information associated with each of the functional units is included in the response content by the agent functional unit of the same type and provided to the user's portable mobile terminal.
How to control the agent server.
コンピュータが、
エージェント機能部を起動させ、
前記起動させたエージェント機能部の機能として、ユーザの発話に応じて、応答を含むサービスを提供させ、
前記エージェント機能部が、前記ユーザに対応付けられた複数の物体に搭載され、前記複数の物体のそれぞれに搭載されたエージェント機能部が同一種類のエージェント機能部である場合に、前記同一種類のエージェント機能部のそれぞれに対応付けられた属性情報を前記同一種類のエージェント機能部による応答内容に含めて、前記ユーザの可搬型の携帯端末に提供させる、
プログラム。
The computer
Start the agent function part and
As a function of the activated agent function unit, a service including a response is provided in response to a user's utterance.
When the agent function unit is mounted on a plurality of objects associated with the user and the agent function unit mounted on each of the plurality of objects is the same type of agent function unit, the same type of agent The attribute information associated with each of the functional units is included in the response content of the agent functional unit of the same type, and is provided to the user's portable mobile terminal.
program.
JP2019054880A 2019-03-22 2019-03-22 Agent system, agent server, control method of agent server, and program Pending JP2020154994A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019054880A JP2020154994A (en) 2019-03-22 2019-03-22 Agent system, agent server, control method of agent server, and program
CN202010189080.5A CN111731320B (en) 2019-03-22 2020-03-17 Intelligent body system, intelligent body server, control method thereof and storage medium
US16/820,754 US11518398B2 (en) 2019-03-22 2020-03-17 Agent system, agent server, method of controlling agent server, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019054880A JP2020154994A (en) 2019-03-22 2019-03-22 Agent system, agent server, control method of agent server, and program

Publications (1)

Publication Number Publication Date
JP2020154994A true JP2020154994A (en) 2020-09-24

Family

ID=72559340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019054880A Pending JP2020154994A (en) 2019-03-22 2019-03-22 Agent system, agent server, control method of agent server, and program

Country Status (3)

Country Link
US (1) US11518398B2 (en)
JP (1) JP2020154994A (en)
CN (1) CN111731320B (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7354888B2 (en) * 2020-03-17 2023-10-03 トヨタ自動車株式会社 Information processing device, program, and information processing method
JP7310706B2 (en) * 2020-05-18 2023-07-19 トヨタ自動車株式会社 AGENT CONTROL DEVICE, AGENT CONTROL METHOD, AND AGENT CONTROL PROGRAM

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4645310B2 (en) 2005-06-02 2011-03-09 株式会社デンソー Display system using agent character display
US20100087987A1 (en) * 2008-10-08 2010-04-08 Gm Global Technoloogy Operations, Inc. Apparatus and Method for Vehicle Driver Recognition and Customization Using Onboard Vehicle System Settings
US20110172873A1 (en) * 2010-01-08 2011-07-14 Ford Global Technologies, Llc Emotive advisory system vehicle maintenance advisor
US9466217B2 (en) * 2011-05-20 2016-10-11 Valeo Schalter Und Sensoren Gmbh Method for supporting a driver using a portable device in a vehicle
US20140094987A1 (en) * 2012-09-28 2014-04-03 Intel Corporation Tiered level of access to a set of vehicles
DE102017109053A1 (en) * 2016-05-02 2017-11-02 Google Inc. Sharing vehicle settings data
US20170355382A1 (en) * 2016-06-09 2017-12-14 Hyundai America Technical Center, Inc Utilization of a multi-touch smartphone display as a track pad in a motor vehicle
KR101906197B1 (en) * 2016-11-07 2018-12-05 엘지전자 주식회사 Vehicle and Control method thereof
JP6822325B2 (en) * 2017-06-21 2021-01-27 日本電気株式会社 Maneuvering support device, maneuvering support method, program
WO2019087349A1 (en) * 2017-11-02 2019-05-09 株式会社Leis Financial transaction control system, application therefor, financial transaction method using same, and financial transaction control method
US11798552B2 (en) * 2018-10-05 2023-10-24 Honda Motor Co., Ltd. Agent device, agent control method, and program

Also Published As

Publication number Publication date
US11518398B2 (en) 2022-12-06
US20200317215A1 (en) 2020-10-08
CN111731320B (en) 2024-04-12
CN111731320A (en) 2020-10-02

Similar Documents

Publication Publication Date Title
US20200320997A1 (en) Agent apparatus, agent apparatus control method, and storage medium
US11532303B2 (en) Agent apparatus, agent system, and server device
US11240342B2 (en) Agent device, method of controlling agent device, and computer-readable non-transient storage medium
CN111731320B (en) Intelligent body system, intelligent body server, control method thereof and storage medium
JP2020144274A (en) Agent device, control method of agent device, and program
US20200317055A1 (en) Agent device, agent device control method, and storage medium
US11325605B2 (en) Information providing device, information providing method, and storage medium
JP7280074B2 (en) AGENT DEVICE, CONTROL METHOD OF AGENT DEVICE, AND PROGRAM
JP7266418B2 (en) AGENT DEVICE, CONTROL METHOD OF AGENT DEVICE, AND PROGRAM
JP2020144264A (en) Agent device, control method of agent device, and program
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
JP7175221B2 (en) AGENT DEVICE, CONTROL METHOD OF AGENT DEVICE, AND PROGRAM
US11518399B2 (en) Agent device, agent system, method for controlling agent device, and storage medium
CN111559317B (en) Agent device, method for controlling agent device, and storage medium
JP7252029B2 (en) SERVER DEVICE, INFORMATION PROVISION METHOD, AND PROGRAM
JP2020142758A (en) Agent device, method of controlling agent device, and program
JP2020160133A (en) Agent system, agent system control method, and program
JP2020160848A (en) Server apparatus, information providing system, information providing method, and program
JP2020152298A (en) Agent device, control method of agent device, and program
JP2020157853A (en) In-vehicle agent system, control method of in-vehicle agent system, and program
JP7297483B2 (en) AGENT SYSTEM, SERVER DEVICE, CONTROL METHOD OF AGENT SYSTEM, AND PROGRAM
JP7274901B2 (en) AGENT DEVICE, CONTROL METHOD OF AGENT DEVICE, AND PROGRAM
JP2020160132A (en) Agent device, agent device control method and program, agent server as well as agent server control method