Nothing Special   »   [go: up one dir, main page]

JP2018055422A - 情報処理システム、情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理システム、情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2018055422A
JP2018055422A JP2016191015A JP2016191015A JP2018055422A JP 2018055422 A JP2018055422 A JP 2018055422A JP 2016191015 A JP2016191015 A JP 2016191015A JP 2016191015 A JP2016191015 A JP 2016191015A JP 2018055422 A JP2018055422 A JP 2018055422A
Authority
JP
Japan
Prior art keywords
user
conversion
information
unit
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016191015A
Other languages
English (en)
Inventor
祐紀 金子
Sukenori Kaneko
祐紀 金子
田中 康成
Yasunari Tanaka
康成 田中
政久 篠崎
Masahisa Shinozaki
政久 篠崎
久子 吉田
Hisako Yoshida
久子 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2016191015A priority Critical patent/JP2018055422A/ja
Priority to US16/336,779 priority patent/US20190228760A1/en
Priority to PCT/JP2017/033084 priority patent/WO2018061776A1/ja
Priority to CN201780059201.0A priority patent/CN109791571A/zh
Publication of JP2018055422A publication Critical patent/JP2018055422A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】汎用性と多様性を両立させることができる情報処理システム、情報処理装置、情報処理方法、及びプログラムを提供することである。
【解決手段】実施形態の情報処理システムは、対話部と、記憶部と、システム/ユーザ変換部と、を持つ。対話部は、発言を生成してユーザとの対話を行う。記憶部は、発言の変換規則を示す変換情報を記憶する。システム/ユーザ変換部は、前記記憶部に記憶された変換情報を用いて、前記対話部が生成した発言をユーザに応じた態様に変換する。
【選択図】図2

Description

本発明の実施形態は、情報処理システム、情報処理装置、情報処理方法、及びプログラムに関する。
情報処理技術を用いて、ユーザからの問いかけに対する解を探索し、ユーザに提示するシステムが存在する。しかしながら、従来の技術では、問いかけに対する応答が画一的であったり、ユーザに依存してしまったりするため、汎用性と多様性を両立させることができない場合がある。
特表2008−512789号公報
本発明が解決しようとする課題は、汎用性と多様性を両立させることができる情報処理システム、情報処理装置、情報処理方法、及びプログラムを提供することである。
実施形態の情報処理システムは、対話部と、記憶部と、システム/ユーザ変換部と、を持つ。対話部は、発言を生成してユーザとの対話を行う。記憶部は、発言の変換規則を示す変換情報を記憶する。システム/ユーザ変換部は、前記記憶部に記憶された変換情報を用いて、前記対話部が生成した発言をユーザに応じた態様に変換する。
第1の実施形態に係る情報処理システムの概要を示す図。 同実施形態に係るフィルタの概要を示す図。 同実施形態に係る情報処理システムの構成を示すブロック図。 同実施形態に係る端末装置の構成を示すブロック図。 同実施形態に係る応答制御装置の構成を示すブロック図。 同実施形態に係るユーザ情報のデータ構成を示す図。 同実施形態に係る履歴情報のデータ構成を示す図。 同実施形態に係る情報処理システムによる処理の流れを示すフローチャート。 同実施形態に係る情報処理システムによる応答の提示例を示す第1図。 同実施形態に係る情報処理システムによる応答の提示例を示す第2図。 第2の実施形態に係るフィルタの概要を示す図。 同実施形態に係る応答制御装置の構成を示すブロック図。 同実施形態に係る情報処理システムによる処理の流れを示すフローチャート。 第3の実施形態に係るフィルタの概要を示す図。 同実施形態に係る応答制御装置の構成を示すブロック図。 同実施形態に係る情報処理システムによる処理の流れを示すフローチャート。 第4の実施形態に係る端末装置の構成を示すブロック図。 同実施形態に係る応答制御装置の構成を示すブロック図。
以下、実施形態の情報処理システム、情報処理装置、情報処理方法、及びプログラムを、図面を参照して説明する。
(第1の実施形態)
第1の実施形態に係る情報処理システム1の概要について説明する。
図1は、情報処理システム1の概要を示す図である。
図1に示すように、情報処理システム1は、ユーザの発言に応じて、意見や選択肢等の発言を返すシステムである。以下では、ユーザの発言に対して、情報処理システム1が返す発言を「応答」と称する。また、以下では、ユーザの発言と情報処理システム1が生成する発言とのやり取りを、「対話」と称する。なお、情報処理システム1に入力されるユーザからの発言や、情報処理システム1から出力される応答は、音声に限らずテキスト等でもよい。
情報処理システム1には、応答を生成するための構成が設けられている。以下では、独立して応答を生成可能な構成の単位を「エージェント」と称する。情報処理システム1は、複数のエージェントを備える。各エージェントは、異なる個性を有する。以下では、「個性」とは、応答の傾向、応答の内容、応答の表現方法等に影響する要素をいう。例えば、各エージェントの個性は、応答を生成するために用いられる情報(例えば、機械学習の教師データ、後述する履歴情報、ユーザ情報等)の内容、応答の生成における論理展開、応答の生成に用いられるアルゴリズム等の要素により定められる。エージェントの個性付けは、任意の方法で行われてよい。このように、情報処理システム1は、個性が異なる複数のエージェントにより生成された応答を提示するため、ユーザに対して多様な考え方や選択肢を提案し、ユーザの決断を支援することができる。
本実施形態では、各エージェントによる応答は、フィルタによる変換を経て、ユーザに提示される。ここで、図2を参照して、対話の流れとフィルタによる変換との概要について説明する。
図2は、本実施形態に係るフィルタの概要を示す図である。
本実施形態に係る対話では、まず、ユーザが質問等の発言を行う(p1)。次に、エージェントa1、a2、…は、それぞれ、ユーザの発言に対する応答を生成する(p2−1、p2−2、…)。エージェントが生成する応答は、ユーザの発言内容に依存し、ユーザには依存しない。
次に、システム/ユーザ変換フィルタlfは、エージェントa1、a2、…の応答を、ユーザに応じて変換し、ユーザに提示する(p3−1、p3−2、…)。本実施形態では、システム/ユーザ変換フィルタlfは、ユーザごとに設けられている。次に、ユーザは、エージェントa1、a2、…の応答を評価する。この評価は、システム/ユーザ変換フィルタlfによる変換処理と、エージェントa1、a2、…による応答の生成処理とに反映される(p4、p5)。このように、情報処理システム1は、エージェントa1、a2、…の応答をそのまま提示するのではなく、変換してから提示する。従って、ユーザに応じた望ましい応答を提示することができる。
次に、情報処理システム1の構成について説明する。
図3は、情報処理システム1の構成を示すブロック図である。
情報処理システム1は、複数の端末装置10−1、10−2、…と、応答制御装置30とを備える。以下では、特に区別しない限り、複数の端末装置10−1、10−2、…を、端末装置10と総称する。端末装置10と、応答制御装置30とは、ネットワークNWを介して通信可能に接続されている。
端末装置10は、コンピュータシステムを備える電子機器である。具体的には、端末装置10は、パーソナルコンピュータ、携帯電話、タブレット、スマートフォン、PHS(Personal Handy−phone System)端末装置、ゲーム機等である。端末装置10は、ユーザからの入力を受け付けたり、ユーザに対して情報の提示を行ったりする。
応答制御装置30は、コンピュータシステムを備える電子機器である。具体的には、応答制御装置30は、サーバ装置等である。応答制御装置30は、エージェントとフィルタ(例えば、システム/ユーザ変換フィルタlf)とを実装する。本実施形態では、一例として、エージェントとフィルタとが人工知能により実現される場合について説明する。人工知能とは、学習、推論、判断等の人間の知的な機能を模倣するコンピュータシステムである。人工知能を実現するためのアルゴリズムは、任意であってよい。具体的には、人工知能は、ニューラルネットワーク、事例ベース推論等により実現されてよい。
ここで、情報処理システム1による処理の流れの概要について説明する。
端末装置10は、ユーザから発言の入力を受け付ける。端末装置10は、ユーザの発言を示す情報を、応答制御装置30に送信する。応答制御装置30は、ユーザの発言を示す情報を、端末装置10から受信する。応答制御装置30は、ユーザの発言を示す情報を参照し、ユーザの発言に応じた応答を示す情報を生成する。応答制御装置30は、応答を示す情報を、フィルタにより変換し、変換結果を示す情報を生成する。応答制御装置30は、変換結果を示す情報を端末装置10に送信する。端末装置10は、変換結果を示す情報を、応答制御装置30から受信する。端末装置10は、変換結果を示す情報を参照し、変換された応答の内容を、表示や音声により提示する。
次に、端末装置10の構成について説明する。
図4は、端末装置10の構成を示すブロック図である。
端末装置10は、通信部11と、入力部12と、表示部13と、音声出力部14と、記憶部15と、制御部16と、を備える。
通信部11は、応答制御装置30等のネットワークNWに接続する他の装置と、各種情報を送受信する。通信部11は、通信用IC(Integrated Circuit)等を含む。
入力部12は、各種情報の入力を受け付ける。例えば、入力部12は、ユーザによる発言の入力、対話のシーンの選択を受け付ける。入力部12は、文字入力、音声入力、ポインティング等の任意の方法により、ユーザからの入力を受け付けてよい。入力部12は、キーボード、マウス、タッチセンサ、マイク等を含む。
表示部13は、各種情報を表示する。例えば、表示部13は、ユーザの発言の内容、エージェントの応答の内容等を表示する。表示部13は、液晶ディスプレイパネル、有機EL(Electro−Luminescence)ディスプレイパネル等を含む。
音声出力部14は、各種音源を再生する。例えば、音声出力部14は、応答の内容等を音声出力する。音声出力部14は、スピーカ、ウーファー等を含む。
記憶部15は、各種情報を記憶する。例えば、記憶部15は、端末装置10が備えるCPU(Central Processing Unit)により実行可能なプログラムや、当該プログラムが参照する情報等を記憶する。記憶部15は、ROM(Read Only Memory)、RAM(Random Access Memory)等を含む。
制御部16は、端末装置10が備える各種構成を制御する。例えば、制御部16は、端末装置10が備えるCPUが、記憶部15に記憶されたプログラムを実行することにより実現される。制御部16は、対話処理部161を備える。
対話処理部161は、対話のための入出力処理を制御する。例えば、対話処理部161は、対話のためのユーザインタフェースを提供するための処理を実行する。また、例えば、対話処理部161は、応答制御装置30との間におけるユーザの発言を示す情報や応答の変換結果を示す情報の送受信を制御する。
次に、応答制御装置30の構成について説明する。
図5は、応答制御装置30の構成を示すブロック図である。
応答制御装置30は、通信部31と、記憶部32と、制御部33と、を備える。
通信部31は、端末装置10等のネットワークNWに接続する他の装置と、各種情報を送受信する。通信部31は、通信用IC等を含む。
記憶部32は、各種情報を記憶する。例えば、記憶部32は、応答制御装置30が備えるCPUにより実行可能なプログラムや、当該プログラムが参照する情報等を記憶する。記憶部32は、ROM、RAM等を含む。記憶部32は、システム/ユーザ変換情報記憶部321と、1以上のエージェント構成情報記憶部322−1、322−2、…と、ユーザ情報記憶部323と、履歴情報記憶部324と、を備える。以下では、特に区別しない限り、エージェント構成情報記憶部322−1、322−2、…を、エージェント構成情報記憶部322と総称する。
システム/ユーザ変換情報記憶部321は、システム/ユーザ変換情報を記憶する。システム/ユーザ変換情報とは、システム/ユーザ変換フィルタlfによる変換規則を示す情報である。つまり、システム/ユーザ変換情報とは、発言の変換規則を示す変換情報の一例である。本実施形態では、一例として、システム/ユーザ変換情報が、ユーザごとに設定され、ユーザごとに記憶される場合について説明する。例えば、システム/ユーザ変換フィルタlfがニューラルネットワークにより実現される場合、システム/ユーザ変換情報は、機械学習の結果、例えば機械学習により変動する活性化関数のパラメータ等の情報を含む。なお、システム/ユーザ変換フィルタlfが人工知能以外で実現される場合、システム/ユーザ変換フィルタlfは、例えば、応答と、応答に対する変換結果と、を一義的に対応付けた情報等であってよい。この対応付けは、テーブル等により行われてもよいし、関数等により行われてもよい。
エージェント構成情報記憶部322は、エージェント構成情報を記憶する。エージェント構成情報とは、後述するエージェント実行部35の構成を示す情報である。例えば、エージェント実行部35がニューラルネットワークにより実現される場合、エージェント構成情報は、機械学習の結果、例えば機械学習により変動する活性化関数のパラメータ等の情報を含む。エージェント構成情報は、対話における応答の生成規則を示す情報の一例である。なお、エージェント実行部35が人工知能以外で実現される場合、エージェント構成情報は、例えば、ユーザの発言と、発言に対する応答と、を一義的に対応付けた情報等であってよい。
ユーザ情報とは、ユーザの属性を示す情報である。ここで、ユーザ情報のデータ構成の例について説明する。
図6は、ユーザ情報のデータ構成を示す図である。
ユーザ情報は、ユーザ識別情報(図6における「ユーザ」)と、年齢情報(図6における「年齢」)と、性別情報(図6における「性別」)と、嗜好情報(図6における「嗜好」)と、ユーザ性格情報(図6における「性格」)と、を互いに対応付けた情報である。
ユーザ識別情報とは、ユーザを一意に識別するための情報である。年齢情報とは、ユーザの年齢を示す情報である。性別情報とは、ユーザの性別を示す情報である。嗜好情報とは、ユーザの嗜好を示す情報である。ユーザ性格情報とは、ユーザの性格を示す情報である。
このように、ユーザ情報では、ユーザと、その属性とが対応付けられている。換言すると、ユーザ情報は、ユーザの個性を示す。従って、端末装置10と応答制御装置30とは、ユーザ情報を参照することにより、ユーザの個性を確認することができる。
図5に戻り、応答制御装置30の構成について、説明を続ける。
履歴情報記憶部324は、履歴情報を記憶する。履歴情報とは、ユーザと情報処理システム1との間における対話の履歴を示す情報である。履歴情報は、ユーザごとに管理されてよい。ここで、履歴情報のデータ構成の例について説明する。
図7は、履歴情報のデータ構成を示す図である。
履歴情報は、トピック識別情報(図7における「トピック」)と、肯定キーワード情報(図7における「肯定キーワード」)と、否定キーワード情報(図7における「否定キーワード」)と、を互いに対応付けた情報である。
トピック識別情報とは、対話を一意に識別するための情報である。肯定キーワード情報とは、対話において、ユーザが肯定的な反応を示したキーワードを示す情報である。否定キーワード情報とは、対話において、ユーザが否定的な反応を示したキーワードを示す情報である。履歴情報では、1つのシーン識別情報に対して、1以上の肯定キーワード情報、否定キーワード情報が対応付けられてよい。
このように、履歴情報は、対話の履歴を示す。つまり、履歴情報を参照することにより、各ユーザにとって望ましい応答の傾向を、履歴情報から把握することができる。従って、端末装置10と応答制御装置30とは、履歴情報を参照することにより、ユーザが受け入れにくい提案を行うことを防いだり、ユーザが受け入れやすい提案を行ったりすることができる。
図5に戻り、応答制御装置30の構成について、説明を続ける。
制御部33は、応答制御装置30が備える各種構成を制御する。例えば、制御部33は、応答制御装置30が備えるCPUが、記憶部32に記憶されたプログラムを実行することにより実現される。制御部33は、対話処理部331と、システム/ユーザフィルタ部34と、1以上のエージェント実行部35−1、35−2、…とを備える。以下では、特に区別しない限り、エージェント実行部35−1、35−2、…を、エージェント実行部35と総称する。
対話処理部331は、対話のための入出力処理を制御する。対話処理部331は、端末装置10の対話処理部161に対応する応答制御装置30側の構成である。例えば、対話処理部331は、端末装置10との間において、ユーザの発言を示す情報や応答の変換結果を示す情報の送受信を制御する。
また、対話処理部331は、履歴情報を管理する。例えば、対話処理部331は、対話においてユーザの発言に肯定的な文言が含まれている場合、その文言に対応するユーザの発言のキーワード、又は、応答のキーワードを特定し、肯定キーワード情報に登録する。また、例えば、対話処理部331は、ユーザの発言に否定的な文言が含まれている場合、その文言に対応するユーザの発言のキーワード、又は、応答のキーワードを特定し、否定キーワード情報に登録する。このように、対話処理部331は、履歴情報のデータ構成に合せて、履歴情報の追記、編集、削除等を行ってよい。
システム/ユーザフィルタ部34は、システム/ユーザ変換フィルタlfとして機能する。本実施形態では、一例として、システム/ユーザフィルタ部34は、ユーザごとのシステム/ユーザ変換フィルタlfとして機能する。システム/ユーザフィルタ部34は、ユーザ情報や履歴情報等のユーザに係る情報を参照して処理を行ってよい。システム/ユーザフィルタ部34は、システム/ユーザ変換部341と、システム/ユーザ変換学習部342と、を備える。
システム/ユーザ変換部341は、エージェント実行部35が生成した応答を、システム/ユーザ変換情報に基づいて変換する。応答の変換は、応答内容の隠蔽、置換、派生、表現方法の変更等により行われてよい。応答内容の隠蔽とは、応答内容の一部又は全てを提示しないことである。置換とは、応答内容を他の文言に置換することである。派生とは、応答内容から導き出される他の発言を生成することである。表現方法の変更とは、応答の実質的な内容を変更せずに、応答の文体やニュアンス等を変更することである。例えば、表現方法の変更には、エージェントの口調の変更が含まれる。
システム/ユーザ変換学習部342は、システム/ユーザ変換フィルタlfの機能を実現するための機械学習を行う。システム/ユーザ変換学習部342は、ユーザの利用開始前に行なわれる機械学習と、対話におけるユーザの評価による機械学習との2種類の機械学習を実行可能である。システム/ユーザ変換学習部342による機械学習の結果は、システム/ユーザ変換情報に反映される。なお、以下では、「評価」とは、ユーザにとっての応答の精度や的確さを表す指標であるとして説明する。システム/ユーザ変換学習部342による機械学習に用いられる教師データは、応答(例えば、図2に示すp2−1、p2−2等)と、変換結果(例えば、図2に示すp3−1、p3−2等)と、評価と、を対応付けたデータである。また、この教師データには、ユーザ情報や履歴情報が対応付けられていてもよい。評価は、真偽の2値であってもよいし、3段階以上の値であってもよい。このような教師データを用いて機械学習を重ねることにより、システム/ユーザ変換部341は、応答をユーザに応じた態様に変換することができる。
また、システム/ユーザ変換学習部342は、対話におけるユーザの評価による機械学習を、ユーザごと区別して行ってよい。つまり、システム/ユーザ変換情報は、ユーザごとに記憶されてよい。以下では、一例として、ユーザごとに機械学習を行う場合について説明する。この場合は、あるユーザの発言に対する応答の変換結果の評価を、そのユーザのシステム/ユーザ変換情報のみに反映させる。このような機械学習を行うことにより、システム/ユーザ変換部341は、エージェントの応答を、ユーザごとに望ましい態様に変換することができるようになる。
エージェント実行部35−1、35−2、…は、それぞれ、異なるエージェント(例えば、図2に示すエージェントa1、a2、…)として機能する。エージェント実行部35−1、35−2、…は、エージェント構成情報記憶部322−1、322−2、…に記憶されるエージェント構成情報に基づいて実現される。エージェント実行部35−1、35−2、…は、対話部351−1、351−2、…と、エージェント学習部352−1、352−2、…とを備える。以下では、対話部351−1、351−2、…を、対話部351と総称する。また、以下では、エージェント学習部352−1、352−2、…を、エージェント学習部352と総称する。本実施形態では、一例として、エージェント実行部35は、ユーザ情報や履歴情報等のユーザに係る情報の参照が制限されている。
対話部351は、ユーザの発言に対するエージェントの応答を生成する。
エージェント学習部352は、エージェント実行部35の機能を実現するための機械学習を行う。エージェント学習部352は、ユーザの利用開始前に行なわれる機械学習と、対話におけるユーザの評価による機械学習との2種類の機械学習を実行可能である。エージェント学習部352による機械学習の結果は、エージェント構成情報に反映される。
エージェント学習部352による機械学習に用いられる教師データは、ユーザの発言(例えば、図2に示すp1等)と、応答(例えば、図2に示すp2−1、p2−2等)と、評価と、を対応付けたデータである。また、この教師データは、ユーザの発言(例えば、図2に示すp1等)と、応答の変換結果(例えば、図2に示すp3−1、p3−2等)と、評価と、を対応付けたデータであってもよい。エージェント学習部352は、そのエージェント学習部352を含むエージェント実行部35ではない、別のエージェント実行部35が行った応答を教師データとして用いてもよい。このような教師データを用いて学習を重ねることにより、対話部351は、ユーザの発言に応じた応答を生成可能になる。
なお、この教師データには、ユーザ情報や履歴情報が対応付けられていてもよいが、本実施形態では、一例として、エージェント学習部352は、ユーザ情報や履歴情報を対応付けない教師データを用いて機械学習を行う場合について説明する。これにより、対話部351は、ユーザではなく、発言内容に純粋に依存した応じた応答を生成可能になる。つまり、エージェント実行部35を各ユーザ間で共通の汎用的な構成とすることができる。
次に、情報処理システム1の動作について説明する。
図8は、情報処理システム1による処理の流れを示すフローチャートである。
(ステップS100)端末装置10は、ユーザの発言を受け付ける。その後、情報処理システム1は、ステップS102に処理を進める。
(ステップS102)応答制御装置30は、ステップS100で受け付けたユーザの発言に対する各エージェントの応答を、エージェント構成情報に基づいて生成する。その後、情報処理システム1は、ステップS104に処理を進める。
(ステップS104)応答制御装置30は、ステップS102で生成した応答を、ユーザ情報、履歴情報、システム/ユーザ変換情報等に基づいて変換する。端末装置10は、ユーザの発言と、当該発言に応じて生成された応答の変換結果とを、ユーザに提示する。その後、情報処理システム1は、ステップS106に処理を進める。
(ステップS106)応答制御装置30は、システム/ユーザ変換フィルタlf及びエージェントの機械学習を、対話結果に基づいて行う。対話結果とは、提示された変換結果に対するユーザの反応や対話の総括であり、システム/ユーザ変換フィルタlf及びエージェントに対する評価を示す。対話結果は、対話全体に対するものであってもよいし、個々の応答に対するものであってもよい。その後、情報処理システム1は、図8に示す処理を終了する。
なお、ステップS106における機械学習のためのユーザの評価(対話結果)は、ユーザの発言から特定してもよいし、対話後にユーザに入力させてもよい。評価は、肯定と否定との2値で入力されてもよいし、3段階以上の値で入力されてもよいし、自然文から値に変換されてもよい。また、評価は、対話の特徴に基づいて行われてもよい。例えば、対話におけるユーザの発言の数、応答の数、対話の長さ等は、対話が活発であったことを示す。そこで、対話におけるユーザの発言の数、応答の数、対話の長さを、評価の指標としてもよい。
また、フィルタを評価する場合の評価対象は、評価を行ったユーザのシステム/ユーザ変換フィルタlfであってもよいし、評価を行ったユーザと属性が同じであるユーザのシステム/ユーザ変換フィルタlfであってもよい。また、エージェントを評価する場合の評価対象は、全てのエージェントであってもよいし、エージェントの一部であってもよい。例えば、対話全体に対する評価は、評価を行ったユーザのシステム/ユーザ変換フィルタlf、当該ユーザと属性が同じユーザのシステム/ユーザ変換フィルタlf、対話に参加した全てのエージェント等に反映されてよい。また、応答に対する評価は、評価を行ったユーザのシステム/ユーザ変換フィルタlf、当該ユーザと属性が同じユーザのシステム/ユーザ変換フィルタlfに反映されてもよいし、その応答を行ったエージェントにのみ反映されてもよい。
次に、対話における応答の提示態様について説明する。
図9、図10は、情報処理システム1による応答の提示例を示す図である。
図9と図10とに示す例では、いずれも、「胸のつかえがある」との医療相談がユーザにより行われている。ただし、図9に示す例では、ユーザは医療関係者であるのに対して、図10に示す例では、ユーザは会社員である。医療関係者に対しては、正確な医療情報の提供が求められる。そこで、図9に示す例では、フィルタは、エージェントa1、a2の応答をあえて変換することなくそのまま提示している。
これに対して、会社員に対しては、必ずしも正確に医療情報を提供することが最適とは限らない。例えば、ユーザがストレスの有無を指摘されることを嫌う場合や深刻な病気である可能性をむやみに通知して、いたずらに不安にさせることは望ましくない場合等がある。そこで、図10に示す例では、フィルタは、エージェントa1によるストレスの有無について指摘する応答を、ストレスの解消方法を提示する応答に変換している。また、フィルタは、エージェントa2による病気の可能性を指摘する応答を、病名の一部を伏せ、対処方法を提示する応答に変換している。
以上説明したように、情報処理システム1(情報処理システムの一例)は、対話部351(対話部の一例)と、記憶部32(記憶部の一例)と、システム/ユーザフィルタ部34(システム/ユーザ変換部の一例)と、を備える。対話部351は、応答(発言の一例)を生成してユーザとの対話を行う。記憶部32は、発言の変換規則を示すシステム/ユーザ変換情報(変換情報の一例)を記憶する。システム/ユーザフィルタ部34は、記憶部32に記憶されたシステム/ユーザ変換情報を用いて、対話部351が生成した発言をユーザに応じた態様に変換する。
これにより、対話部351が生成した応答は、システム/ユーザフィルタ部34によりユーザに応じた態様に変換される。例えば、対話部351が生成した応答に、ユーザにとって不快感を与える内容やユーザへの提示が望ましくない情報が含まれている場合であっても、応答を変換して、不快感を低減したり、情報の提示を抑制したりする。また、例えば、対話部351が生成した応答を、丁寧な表現に変換したり、箇条書きの表現に変換したりすることにより、ユーザに受け入れやすくしたり、確認しやすくする。従って、情報処理システム1は、ユーザに応じた応答を行うことができる。そして、情報処理システム1は、ユーザに応答の生成と応答の変換とを別の処理としているため、応答の生成についてはユーザに依存させないことで汎用性を確保しつつ、応答の変換についてはユーザに依存させることで多様性を確保することができる。つまり、情報処理システム1は、汎用性と多様性とを両立させることができる。
また、情報処理システム1において、記憶部32は、システム/ユーザ変換情報をユーザごとに記憶する。システム/ユーザフィルタ部34は、記憶部32に記憶されたユーザごとのシステム/ユーザ変換情報(変換情報の一例)を用いて、対話部351が生成した発言をユーザに応じた態様に変換する。
これにより、対話部351が生成した応答は、ユーザごとのシステム/ユーザ変換情報を用いて、ユーザに応じた態様に変換される。つまり、個々のユーザ専用の変換規則により応答の変換が行われる。そのため、情報処理システム1は、個性が異なる個々のユーザに適した変換を行いやすい。従って、情報処理システム1は、ユーザに応じた応答を行うことができる。
(第2の実施形態)
第2の実施形態について説明する。本実施形態では、上述した構成と同様の構成については、同一の符号を付し、説明を援用する。
第2の実施形態に係る情報処理システム1A(不図示)は、情報処理システム1と同様に、エージェントによる応答を変換して提示するシステムである。ただし、情報処理システム1Aは、ユーザの発言を変換する点が異なる。
ここで、図11を参照して、対話の流れとフィルタによる変換との概要について説明する。
図11は、本実施形態に係るフィルタの概要を示す図である。
本実施形態の対話では、まず、ユーザが質問等の発言を行う(p’1)。次に、ユーザ/システム変換フィルタufは、ユーザの発言を変換し、各エージェントa1、a2、…に出力する(p’2)。ユーザ/システム変換フィルタufは、ユーザごとに設けられてもよいし、各ユーザ間で共通であってもよい。ここでは、一例として、ユーザ/システム変換フィルタufが、各ユーザ間で共通である場合について説明する。次に、エージェントa1、a2、…は、それぞれ、ユーザの発言に対する応答を生成する(p’3−1、p’3−2、…)。この変換では、例えば、個人情報の削除や表現の修正等が行われる。
次に、システム/ユーザ変換フィルタlfは、エージェントa1、a2、…の応答を、ユーザに応じて変換し、ユーザに提示する(p’4−1、p’4−2、…)。次に、ユーザは、エージェントa1、a2、…の応答を評価する。この評価は、ユーザ/システム変換フィルタufによる変換処理、システム/ユーザ変換フィルタlfによる変換処理、エージェントa1、a2、…による応答の生成処理に反映される(p’5、p’6、p’7)。このように、情報処理システム1Aは、ユーザの発言をそのままエージェントa1、a2、…に出力するのではなく、変換してから出力する。そのため、例えば、ユーザの個人情報がエージェントa1、a2、…に学習され、他のユーザに対する応答時に利用されてしまうことを防いだり、ユーザの発言の意図を正確に把握してエージェントa1、a2、…による応答の精度を向上させたりすることができる。
次に、情報処理システム1Aの構成について説明する。
情報処理システム1Aは、情報処理システム1が備える応答制御装置30に代えて、応答制御装置30Aを備える。
図12は、応答制御装置30Aの構成を示すブロック図である。
応答制御装置30Aの記憶部32は、ユーザ/システム変換情報記憶部325Aを備える。応答制御装置30Aの制御部33は、ユーザ/システムフィルタ部36Aを備える。
ユーザ/システム変換情報記憶部325Aは、ユーザ/システム変換情報を記憶する。ユーザ/システム変換情報とは、ユーザ/システム変換フィルタufによる変換規則を示す情報である。つまり、ユーザ/システム変換情報とは、発言の変換規則を示す変換情報の一例である。例えば、ユーザ/システム変換フィルタufがニューラルネットワークにより実現される場合、ユーザ/システム変換情報は、機械学習の結果、例えば機械学習により変動する活性化関数のパラメータ等の情報を含む。なお、ユーザ/システム変換フィルタufが人工知能以外で実現される場合、ユーザ/システム変換フィルタufは、例えば、発言と、発言に対する変換結果と、を一義的に対応付けた情報等であってよい。この対応付けは、テーブル等により行われてもよいし、関数等により行われてもよい。
ユーザ/システムフィルタ部36Aは、ユーザ/システム変換フィルタufとして機能する。ユーザ/システムフィルタ部36Aは、ユーザ/システム変換部361Aと、ユーザ/システム変換学習部362Aと、を備える。
ユーザ/システム変換部361Aは、ユーザの発言を、ユーザ/システム変換情報に基づいて変換する。ユーザの発言の変換は、発言内容の隠蔽、置換、派生、表現方法の変更等により行われてよい。発言内容の隠蔽とは、発言内容の一部又は全てを提示しないことである。置換とは、発言内容を、他の文言に置換することである。派生とは、発言内容から導き出される他の発言を生成することである。表現方法の変更とは、発言の実質的な内容を変更せずに、発言の文体やニュアンス等を変更することである。例えば、表現方法の変更には、発言を構成する文言を形態素解析して、その結果を合せて示すこと、発言内容を短文化すること等が含まれる。つまり、ユーザの言い回しの癖の解消等を行ってよい。
ユーザ/システム変換学習部362は、ユーザ/システム変換フィルタufの機能を実現するための機械学習を行う。ユーザ/システム変換学習部362は、ユーザの利用開始前に行なわれる機械学習と、対話におけるユーザの評価による機械学習との2種類の機械学習を実行可能である。ユーザ/システム変換学習部362による機械学習の結果は、ユーザ/システム変換情報に反映される。ユーザ/システム変換学習部362による機械学習に用いられる教師データは、発言(例えば、図11に示すp’1)と、変換結果(例えば、図11に示すp’2)と、評価と、を対応付けたデータである。評価は、真偽の2値であってもよいし、3段階以上の値であってもよい。このような教師データを用いて学習を重ねることにより、ユーザ/システム変換部361Aは、ユーザの発言を変換可能になる。
次に、情報処理システム1Aの動作について説明する。
図13は、情報処理システム1Aによる処理の流れを示すフローチャートである。
図13に示すステップS100、S102、S104は、図8に示すステップS100、S102、S104と同様であるため、説明を援用する。
(ステップSA101)ステップS100の後、応答制御装置30Aは、ステップS100で受け付けたユーザの発言を、ユーザ情報、履歴情報、ユーザ/システム変換情報等に基づいて変換する。その後、情報処理システム1Aは、ステップS102に処理を進める。
(ステップSA106)ステップS104の後、応答制御装置30Aは、ユーザ/システム変換フィルタuf、システム/ユーザ変換フィルタlf及びエージェントの機械学習を、対話結果に基づいて行う。対話結果とは、提示された変換結果に対するユーザの反応であり、ユーザ/システム変換フィルタuf、システム/ユーザ変換フィルタlf及びエージェントに対する評価を示す。その後、情報処理システム1Aは、図13に示す処理を終了する。
なお、ユーザ/システム変換フィルタufは、システム/ユーザ変換フィルタlf及びエージェントによる学習を制御してよい。例えば、ユーザ/システム変換フィルタufは、機械学習を行わせるシステム/ユーザ変換フィルタlf及びエージェントを選択(判定)し、機械学習を行わせるシステム/ユーザ変換フィルタlf及びエージェントに対してのみ、ユーザの評価(対話結果)を通知してよい。これに対して、ユーザ/システム変換フィルタufは、機械学習を行わせないシステム/ユーザ変換フィルタlf及びエージェントに対しては、ユーザの評価を通知しない。
例えば、ユーザの反応がシステム/ユーザ変換フィルタlfにより削除された応答内容に関するものである場合等、変換に起因して行われた評価については、システム/ユーザ変換フィルタlfにのみ学習を行わせてよい。これに対して、ユーザの反応がシステム/ユーザ変換フィルタlfによる変換前後で変化がない応答内容に関するものである場合等、変換に起因しないで行われた評価については、エージェントにのみ学習を行わせてよい。
また、例えば、学習を行わせるエージェントを、ユーザとエージェントとの関係性、エージェントの属性等に応じて選択してよい。ユーザとエージェントとの関係性に応じて選択する場合、例えば、ユーザによる各エージェントの評価の履歴を管理しておく。そして、より高い評価を獲得しているエージェント、いわばユーザと相性の良いエージェントに対してのみ学習を行わせるようにしてよい。また、エージェントの属性に応じて選択する場合、例えば、ユーザにより評価された応答を行ったエージェントと、同じ属性を有するエージェントに対してのみ、学習を行わせるようにしてよい。
なお、エージェントの属性は、エージェントごとにその属性を示した情報を、予め設定しておくことにより管理されてよい。エージェントの属性としては、例えば、カテゴリや性格等が設定されてよい。カテゴリとは、エージェントの分類であり、例えば、対話におけるエージェントの専門分野である。また、性格とは、積極性や感情表現等の応答の傾向である。なお、システム/ユーザ変換フィルタlf及びエージェントの学習の制御は、例えば、対話処理部331等、ユーザ/システム変換フィルタufとは異なる構成により行われてもよい。
以上説明したように、情報処理システム1A(情報処理システムの一例)は、対話処理部331(受付部の一例)と、ユーザ/システムフィルタ部36A(ユーザ/システム変換部の一例)と、を備える。対話処理部331は、ユーザから発言を受け付ける。ユーザ/システムフィルタ部36Aは、対話処理部331が受け付けた発言を、対話部351に応じた態様に変換する。
これにより、ユーザの発言は、対話部351に応じた態様に変換される。例えば、ユーザの発言に個人情報が含まれている場合には、個人情報が削除される。また、例えば、ユーザの発言の表現が対話部351による処理に不適である場合には、対話部351による処理に適した態様に変換される。従って、情報処理システム1は、個人情報を保護したり、適切な応答を生成したりすることができる。
また、情報処理システム1A(情報処理システムの一例)は、システム/ユーザフィルタ部34(システム/ユーザ変換部の一例)と、ユーザ/システムフィルタ部36A(判定部の一例)と、を備える。システム/ユーザフィルタ部34は、機械学習に基づいて変換を行う。ユーザ/システムフィルタ部36Aは、前記機械学習をするか否かを判定する。
これにより、システム/ユーザフィルタ部34が必要な機械学習のみを行う。従って、情報処理システム1Aは、変換の精度を向上させることができる。
また、情報処理システム1A(情報処理システムの一例)は、複数のエージェント実行部35(対話部の一例)と、ユーザ/システムフィルタ部36A(判定部の一例)と、を備える。エージェント実行部35は、機械学習に基づいて発言を生成する。ユーザ/システムフィルタ部36Aは、複数のエージェント実行部35のうち、機械学習するエージェント実行部35を選択する。
つまり、情報処理システム1Aは、機械学習するエージェント実行部35を絞り込む。これに対して、複数のエージェント実行部35が同様の機械学習を行った場合には、各エージェント実行部35の応答が均質化されてしまう可能性がある。この点、情報処理システム1Aは、機械学習の対象を選択するため、個々のエージェント実行部35の個性を維持し、応答の汎用性と多様性を両立させることができる。また、情報処理システム1Aは、例えば、機械学習の対象を、ユーザと相性の良いエージェントとすることにより、個性が類似するユーザへの応答の精度を向上させることができる。
(第3の実施形態)
第3の実施形態について説明する。本実施形態では、上述した構成と同様の構成については、同一の符号を付し、説明を援用する。
第3の実施形態に係る情報処理システム1B(不図示)は、情報処理システム1と同様に、エージェントによる応答を変換して提示するシステムである。ただし、情報処理システム1Bは、複数のシステム/ユーザ変換フィルタを備える点が異なる。
ここで、図14を参照して、対話の流れとフィルタによる変換との概要について説明する。
図14は、本実施形態に係るフィルタの概要を示す図である。
ここでは、一例として、3つのシステム/ユーザ変換フィルタlf1、lf2、lf3を備える場合について説明する。以下では、個々のシステム/ユーザ変換フィルタlf1、lf2、lf3を区別しない場合には、システム/ユーザ変換フィルタlfと総称する。
本実施形態に係る対話では、まず、ユーザが質問等の発言を行う(p”1)。次に、エージェントa1、a2、…は、それぞれ、ユーザの発言に対する応答を生成する(p”2−1、p”2−2、…)。次に、第1システム/ユーザ変換フィルタlf1は、エージェントa1、a2、…の応答を、ユーザに応じて変換し、ユーザに提示する(p”3−1、p”3−2、…)。次に、第2システム/ユーザ変換フィルタlf2は、第2のシステム/ユーザ変換フィルタlf1の変換結果を、ユーザに応じて変換し、ユーザに提示する(p”4−1、p”4−2、…)。ここで、この例では、情報処理システム1Bは、第3システム/ユーザ変換フィルタlf3を備えるが、第3システム/ユーザ変換フィルタlf3は適用せず、第3システム/ユーザ変換フィルタlf3による変換は行わない。
次に、ユーザは、エージェントa1、a2、…の応答を評価する。この評価は、適用したシステム/ユーザ変換フィルタlf1、lf2による変換処理と、エージェントa1、a2、…による応答の生成処理とに反映される(p”5−1、p”5−2、p”6)。このように、情報処理システム1Bは、エージェントa1、a2、…の応答を、複数のシステム/ユーザ変換フィルタにより変換可能である。そして、適用するシステム/ユーザ変換フィルタを選択可能である。従って、例えば、ユーザごとに適用するシステム/ユーザ変換フィルタを切り替えることにより、ユーザに応じた望ましい応答を提示することができる。
次に、情報処理システム1Bの構成について説明する。
情報処理システム1Bは、情報処理システム1が備える応答制御装置30に代えて、応答制御装置30Bを備える。
図15は、応答制御装置30Bの構成を示すブロック図である。
応答制御装置30Bの記憶部32は、システム/ユーザ変換情報記憶部321に代えて、システム/ユーザ変換情報記憶部321B−1、321B−2、…を備える。以下では、システム/ユーザ変換情報記憶部321−1、321−2、…を、システム/ユーザ変換情報記憶部321Bと総称する。応答制御装置30Bの制御部33は、対話部351に代えて対話部351Bを備える。また、応答制御装置30Bの制御部33は、システム/ユーザフィルタ部34に代えてシステム/ユーザフィルタ部34B−1、34B−2、…を備える。以下では、システム/ユーザフィルタ部34B−1、34B−2、…を、システム/ユーザフィルタ部34Bと総称する。
システム/ユーザ変換情報記憶部321Bは、システム/ユーザ変換情報を記憶する。ただし、本実施形態に係るシステム/ユーザ変換情報は、ユーザごとではなく、ユーザの属性ごとの情報である点が異なる。
対話処理部331Bは、対話処理部331と同様に、対話のための入出力処理を制御する。また、対話処理部331Bは、適用するシステム/ユーザ変換フィルタlfを、ユーザに応じて選択する。例えば、対話処理部331Bは、対話するユーザのユーザ情報を参照し、ユーザの属性を確認する。そして、対話処理部331Bは、対話するユーザの属性を用いてシステム/ユーザ変換情報を検索し、対話するユーザの属性に合致するシステム/ユーザ変換フィルタlfを選択する。具体的は、ユーザが男性である場合には男性用のシステム/ユーザ変換フィルタlfを選択したり、ユーザが小学生である場合には青少年用のシステム/ユーザ変換フィルタlfを選択したりする。
システム/ユーザフィルタ部34Bは、システム/ユーザフィルタ部34と同様に、システム/ユーザ変換フィルタlfとして機能する。ただし、システム/ユーザフィルタ部34Bは、ユーザごとのシステム/ユーザ変換フィルタlfではなく、ユーザの属性ごとのシステム/ユーザ変換フィルタlfとして機能する点が異なる。
次に、情報処理システム1Bの動作について説明する。
図16は、情報処理システム1Bによる処理の流れを示すフローチャートである。
ここでは、一例として、ユーザとの対話のために、2つのシステム/ユーザ変換フィルタlfが適用対象として選択されている場合について説明する。また、図16に示すステップS100、S102は、図8に示すステップS100、S102と同様であるため、説明を援用する。
(ステップSB104)ステップS102の処理の後、応答制御装置30Bは、ステップS102で生成した応答を、ユーザ情報、履歴情報、第1システム/ユーザ変換フィルタlf1のシステム/ユーザ変換情報に基づいて変換する。その後、情報処理システム1Bは、ステップSB105に処理を進める。
(ステップSB105)応答制御装置30Bは、ステップSB104で生成した応答を、ユーザ情報、履歴情報、第2システム/ユーザ変換フィルタlf2のシステム/ユーザ変換情報に基づいて変換する。その後、情報処理システム1Bは、ステップSB106に処理を進める。
(ステップSB106)応答制御装置30Bは、適用した2つのシステム/ユーザ変換フィルタlf及びエージェントの機械学習を、対話結果に基づいて行う。対話結果とは、提示された変換結果に対するユーザの反応であり、適用したシステム/ユーザ変換フィルタlf及びエージェントに対する評価を示す。その後、情報処理システム1Bは、図16に示す処理を終了する。
以上説明したように、情報処理システム1B(情報処理システムの一例)において、記憶部32(記憶部の一例)は、システム/ユーザ変換情報(変換情報の一例)を、ユーザの属性ごとに記憶する。システム/ユーザフィルタ部34は、記憶部32に記憶されたシステム/ユーザ変換情報をユーザの属性を用いて検索し、検索により特定された変換情報を用いて、対話部351が生成した発言を当該ユーザに応じた態様に変換する。
これにより、対話部351が生成した応答は、ユーザの属性に基づいて、ユーザに応じた態様に変換される。つまり、ユーザ属性ごとの汎用的な変換規則を用いて、個々のユーザに応じた応答の変換が行われる。そのため、情報処理システム1Bは、個々のユーザ専用の変換規則を設定するのに比して少ない負荷で、ユーザに応じた変換を行いやすい。従って、情報処理システム1は、ユーザに応じた応答を行うことができる。
(第4の実施形態)
第4の実施形態について説明する。本実施形態では、上述した構成と同様の構成については、同一の符号を付し、説明を援用する。
第4の実施形態に係る情報処理システム1C(不図示)は、情報処理システム1と同様に、エージェントによる応答を変換して提示するシステムである。ただし、情報処理システム1では、応答制御装置30にフィルタの機能を持たせたのに対して、情報処理システム1Cでは、ユーザの端末装置側にフィルタの機能を持たせた点が異なる。
情報処理システム1Cの構成について説明する。
情報処理システム1Cは、情報処理システム1が備える端末装置10と応答制御装置30とに代えて、端末装置10Cと応答制御装置30Cを備える。
図17は、端末装置10Cの構成を示すブロック図である。
端末装置10Cの記憶部15は、システム/ユーザ変換情報記憶部151Cと、ユーザ情報記憶部152Cと、履歴情報記憶部153Cとを備える。また、端末装置10Cの制御部16は、システム/ユーザフィルタ部17Cを備える。システム/ユーザフィルタ部17Cは、システム/ユーザ変換部171Cと、システム/ユーザ変換学習部172Cと、を備える。
システム/ユーザ変換情報記憶部151Cは、システム/ユーザ変換情報記憶部321と同様の構成である。ユーザ情報記憶部152Cは、ユーザ情報記憶部323と同様の構成である。履歴情報記憶部153Cは、履歴情報記憶部324と同様の構成である。
システム/ユーザフィルタ部17Cは、システム/ユーザフィルタ部34と同様の構成である。システム/ユーザ変換部171Cは、システム/ユーザ変換部341と同様の構成である。システム/ユーザ変換学習部172Cは、システム/ユーザ変換学習部342と同様の構成である。
図18は、応答制御装置30Cの構成を示すブロック図である。
応答制御装置30Cの記憶部32は、応答制御装置30の記憶部32が備えるシステム/ユーザ変換情報記憶部321を備えない。応答制御装置30Cの制御部33は、システム/ユーザフィルタ部34を備えない。
以上説明したように、情報処理システム1C(情報処理システムの一例)では、端末装置10Cがシステム/ユーザフィルタ部17Cを備える。このように、上述した各実施形態における任意の構成は、別体の装置に分離して備えられてよいし、組み合わされてもよい。
なお、上記各実施形態では、システム/ユーザ変換フィルタlfは、ユーザに応じた変換規則を示すものとして説明したが、これには限らない。システム/ユーザ変換フィルタlfは、エージェントに応じた変換規則を示してもよいし、ユーザとエージェントとの組み合わせに応じた変換規則を示してもよい。つまり、ユーザとエージェントとの関係性に応じた変換規則を示してもよい。
なお、上記実施形態において、各種情報のデータ構成は、上述したものに限られない。各情報の対応付けは、直接的に行われてもよいし、間接的に行われてもよい。また、処理に必須ではない情報を省略してもよいし、類似の情報を追加して処理を行ってもよい。例えば、ユーザ情報として、ユーザの居所や職業等を含めてもよい。また、例えば、履歴情報は、上記実施形態のように、対話の内容を集約したものでなく、対話そのものを記録した情報であってもよい。
なお、上記実施形態において、応答の提示態様は、上述したものに限られない。例えば、各発言は、時系列に提示されてもよい。また、例えば、応答を行った応答用エージェントを明確にすることなく応答を提示してもよい。
なお、上記実施形態では、ユーザ情報や履歴情報等のユーザに関する情報の参照が、エージェント実行部35に対して制限されている場合について説明したが、これには限らない。例えば、エージェント実行部35は、ユーザに関する情報を参照して応答の生成や機械学習を行ってもよい。ただし、エージェント実行部35に対してユーザに関する情報を制限することにより、個人情報を保護することができる。
例えば、エージェント実行部35を複数のユーザへの応答に利用する場合は、あるユーザへの応答において、他のユーザへの機械学習の結果が反映される。この機械学習に他のユーザの個人情報が含まれると、生成された応答に個人情報が含まれて、ユーザの個人情報が流出してしまう恐れがある。この点、ユーザ情報の参照を制限することにより、応答に個人情報が含まれることがなくなる。このように、実施形態で説明した任意の情報の利用は、ユーザからの指定や初期設定で制限されてよい。
上記各実施形態では、制御部16、制御部33はソフトウェア機能部であるものとしたが、LSI(Large Scale Integration)等のハードウェア機能部であってもよい。
以上説明した少なくともひとつの実施形態によれば、システム/ユーザフィルタ部34を持つことにより、ユーザの発言に対して、ユーザに応じた応答を行うことができる。
また、上述の端末装置10、10C、応答制御装置30、30A〜30Cの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより端末装置10、10C、応答制御装置30、30A〜30Cとしての処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD−ROM等の非一過性の記録媒体であってもよい。また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部または外部に設けられた記録媒体も含まれる。配信サーバの記録媒体に記憶されるプログラムのコードは、端末装置で実行可能な形式のプログラムのコードと異なるものでもよい。すなわち、配信サーバからダウンロードされて端末装置で実行可能な形でインストールができるものであれば、配信サーバで記憶される形式は問わない。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に端末装置で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
また、上述した端末装置10、10C、応答制御装置30、30A〜30Cの機能の一部または全部を、LSI等の集積回路として実現してもよい。上述した各機能は個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
1…情報処理システム、10、10C…端末装置、30、30A〜30C…応答制御装置、11…通信部、12…入力部、13…表示部、14…音声出力部、15…記憶部、16…制御部、151C…システム/ユーザ変換情報記憶部、152C…ユーザ情報記憶部、153C…履歴情報記憶部、161…対話処理部、17C…システム/ユーザフィルタ部、171C…システム/ユーザ変換部、172C…システム/ユーザ変換学習部、31…通信部、32…記憶部、33…制御部、321、321B…システム/ユーザ変換情報記憶部、322…エージェント構成情報記憶部、323…ユーザ情報記憶部、324…履歴情報記憶部、325A…ユーザ/システム変換情報記憶部、331…対話処理部、34、34B…システム/ユーザフィルタ部、341、341B…システム/ユーザ変換部、342…システム/ユーザ変換学習部、35…エージェント実行部、351…対話部、352…エージェント学習部

Claims (9)

  1. 発言を生成してユーザとの対話を行う対話部と、
    発言の変換規則を示す変換情報を記憶する記憶部と、
    前記記憶部に記憶された変換情報を用いて、前記対話部が生成した発言をユーザに応じた態様に変換するシステム/ユーザ変換部と、
    を備える情報処理システム。
  2. ユーザから発言を受け付ける受付部と、
    前記受付部により受け付けた発言を、前記対話部に応じた態様に変換するユーザ/システム変換部と、
    を備える請求項1に記載の情報処理システム。
  3. 前記システム/ユーザ変換部は、記憶部に記憶されたユーザごとの変換情報を用いて、前記対話部が生成した発言をユーザに応じた態様に変換する
    請求項1又は請求項2に記載の情報処理システム。
  4. 前記システム/ユーザ変換部は、記憶部に記憶されたユーザの属性ごとの変換情報をユーザの属性を用いて検索し、検索により特定された変換情報を用いて、前記対話部が生成した発言を当該ユーザに応じた態様に変換する
    請求項1から請求項3のいずれか一項に記載の情報処理システム。
  5. 前記システム/ユーザ変換部は、機械学習に基づいて変換を行い、
    前記機械学習をするか否かを判定する判定部、
    を備える請求項1から請求項4のいずれか一項に記載の情報処理システム。
  6. 前記対話部は、機械学習に基づいて発言を生成し、
    複数の前記対話部の中から、機械学習する対話部を判定する判定部、
    を備える請求項1から請求項4のいずれか一項に記載の情報処理システム。
  7. 発言を生成してユーザとの対話を行う対話部と、
    発言の変換規則を示す変換情報を、当該変換情報を予め記憶する記憶部から読み出して、前記対話部が生成した発言をユーザに応じた態様に変換するシステム/ユーザ変換部と、
    を備える情報処理装置。
  8. 発言の変換規則を示す変換情報を記憶する記憶部を備える情報処理システムによる情報処理方法であって、
    前記情報処理システムが、発言を生成してユーザとの対話を行う第1ステップと、
    前記情報処理システムが、前記記憶部に記憶された変換情報を用いて、前記第1ステップにおいて生成した発言をユーザに応じた態様に変換する第2ステップと、
    を含む情報処理方法。
  9. コンピュータに、
    発言を生成してユーザとの対話を行う第1ステップと、
    発言の変換規則を示す変換情報を、当該変換情報を予め記憶する記憶部から読み出して、前記第1ステップにおいて生成した発言をユーザに応じた態様に変換する第2ステップと、
    を実行させるためのプログラム。
JP2016191015A 2016-09-29 2016-09-29 情報処理システム、情報処理装置、情報処理方法、及びプログラム Pending JP2018055422A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2016191015A JP2018055422A (ja) 2016-09-29 2016-09-29 情報処理システム、情報処理装置、情報処理方法、及びプログラム
US16/336,779 US20190228760A1 (en) 2016-09-29 2017-09-13 Information processing system, information processing apparatus, information processing method, and recording medium
PCT/JP2017/033084 WO2018061776A1 (ja) 2016-09-29 2017-09-13 情報処理システム、情報処理装置、情報処理方法、及び記憶媒体
CN201780059201.0A CN109791571A (zh) 2016-09-29 2017-09-13 信息处理系统、信息处理装置、信息处理方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016191015A JP2018055422A (ja) 2016-09-29 2016-09-29 情報処理システム、情報処理装置、情報処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2018055422A true JP2018055422A (ja) 2018-04-05

Family

ID=61760293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016191015A Pending JP2018055422A (ja) 2016-09-29 2016-09-29 情報処理システム、情報処理装置、情報処理方法、及びプログラム

Country Status (4)

Country Link
US (1) US20190228760A1 (ja)
JP (1) JP2018055422A (ja)
CN (1) CN109791571A (ja)
WO (1) WO2018061776A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019191939A (ja) * 2018-04-25 2019-10-31 メドケア株式会社 指導支援システム、指導支援方法及び指導支援サーバ
WO2019225201A1 (ja) * 2018-05-25 2019-11-28 ソニー株式会社 情報処理装置及び情報処理方法、並びに情報処理システム
WO2020153146A1 (ja) * 2019-01-23 2020-07-30 ソニー株式会社 情報処理装置、及び情報処理方法
JP2020149310A (ja) * 2019-03-13 2020-09-17 日本電気株式会社 処理装置、処理方法及びプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10826864B2 (en) 2018-07-27 2020-11-03 At&T Intellectual Property I, L.P. Artificially intelligent messaging
US20220229994A1 (en) * 2021-01-21 2022-07-21 Servicenow, Inc. Operational modeling and optimization system for a natural language understanding (nlu) framework

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002031814A1 (en) * 2000-10-10 2002-04-18 Intel Corporation Language independent voice-based search system
WO2016104736A1 (ja) * 2014-12-26 2016-06-30 株式会社オルツ コミュニケーション提供システム及びコミュニケーション提供方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100779978B1 (ko) * 2000-09-12 2007-11-27 소니 가부시끼 가이샤 정보제공시스템, 정보제공장치 및 정보제공방법과데이터기록매체
US7127402B2 (en) * 2001-01-12 2006-10-24 International Business Machines Corporation Method and apparatus for converting utterance representations into actions in a conversational system
KR102011495B1 (ko) * 2012-11-09 2019-08-16 삼성전자 주식회사 사용자의 심리 상태 판단 장치 및 방법
US20150161606A1 (en) * 2013-12-11 2015-06-11 Mastercard International Incorporated Method and system for assessing financial condition of a merchant
JP6302707B2 (ja) * 2014-03-06 2018-03-28 クラリオン株式会社 対話履歴管理装置、対話装置および対話履歴管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002031814A1 (en) * 2000-10-10 2002-04-18 Intel Corporation Language independent voice-based search system
WO2016104736A1 (ja) * 2014-12-26 2016-06-30 株式会社オルツ コミュニケーション提供システム及びコミュニケーション提供方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019191939A (ja) * 2018-04-25 2019-10-31 メドケア株式会社 指導支援システム、指導支援方法及び指導支援サーバ
WO2019225201A1 (ja) * 2018-05-25 2019-11-28 ソニー株式会社 情報処理装置及び情報処理方法、並びに情報処理システム
JPWO2019225201A1 (ja) * 2018-05-25 2021-07-08 ソニーグループ株式会社 情報処理装置及び情報処理方法、並びに情報処理システム
JP7342862B2 (ja) 2018-05-25 2023-09-12 ソニーグループ株式会社 情報処理装置及び情報処理方法、並びに情報処理システム
US11869496B2 (en) 2018-05-25 2024-01-09 Sony Corporation Information processing device and information processing method, and information processing system
WO2020153146A1 (ja) * 2019-01-23 2020-07-30 ソニー株式会社 情報処理装置、及び情報処理方法
US12008992B2 (en) 2019-01-23 2024-06-11 Sony Group Corporation Generating dialog responses from dialog response frame based on device capabilities
JP2020149310A (ja) * 2019-03-13 2020-09-17 日本電気株式会社 処理装置、処理方法及びプログラム
JP7293743B2 (ja) 2019-03-13 2023-06-20 日本電気株式会社 処理装置、処理方法及びプログラム

Also Published As

Publication number Publication date
US20190228760A1 (en) 2019-07-25
WO2018061776A1 (ja) 2018-04-05
CN109791571A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
WO2018061776A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記憶媒体
US10944708B2 (en) Conversation agent
US8811638B2 (en) Audible assistance
US8934652B2 (en) Visual presentation of speaker-related information
US9495350B2 (en) System and method for determining expertise through speech analytics
WO2017217507A1 (ja) コミュニケーションを支援する人工知能システム
US20130144595A1 (en) Language translation based on speaker-related information
WO2018061774A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記憶媒体
Richardson et al. A framework for examining patient attitudes regarding applications of artificial intelligence in healthcare
US20190019078A1 (en) Apparatus and method for distributing a question
Chakraborty et al. An AI-based medical chatbot model for infectious disease prediction
McTear et al. The dawn of the conversational interface
JP7096172B2 (ja) キャラクタ性に応じた形容発話を含む対話シナリオを生成する装置、プログラム及び方法
JP2016076117A (ja) 情報処理装置及び発話内容出力方法
Soufyane et al. An intelligent chatbot using NLP and TF-IDF algorithm for text understanding applied to the medical field
JP2024539644A (ja) 観測されたクエリパターンに基づくターゲットデバイスへの蒸留
Griol et al. Modeling the user state for context-aware spoken interaction in ambient assisted living
KR102507809B1 (ko) 공감대 형성을 통한 심리 치료용 인공지능 대화 시스템
US20160365091A1 (en) Analysis of Professional-Client Interactions
Attigeri et al. Advanced NLP Models for Technical University Information Chatbots: Development and Comparative Analysis
JP6712387B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
Upadhyaya et al. Smart Multi-linguistic Health Awareness System using RASA Model
CN109783677A (zh) 回复方法、回复装置、电子设备及计算机可读存储介质
Vineeth et al. A proposed chatbot Psykh your personal therapist and stress buster using RASA open-source framework
Sai Pranav et al. Natural language processing in chatbots

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20211221