JP4849662B2 - 会話制御装置 - Google Patents
会話制御装置 Download PDFInfo
- Publication number
- JP4849662B2 JP4849662B2 JP2005307868A JP2005307868A JP4849662B2 JP 4849662 B2 JP4849662 B2 JP 4849662B2 JP 2005307868 A JP2005307868 A JP 2005307868A JP 2005307868 A JP2005307868 A JP 2005307868A JP 4849662 B2 JP4849662 B2 JP 4849662B2
- Authority
- JP
- Japan
- Prior art keywords
- plan
- conversation
- sentence
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 108
- 238000000034 method Methods 0.000 claims description 86
- 230000008569 process Effects 0.000 claims description 77
- 230000004044 response Effects 0.000 claims description 27
- 238000010586 diagram Methods 0.000 description 23
- 238000000605 extraction Methods 0.000 description 17
- 230000015654 memory Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000010365 information processing Effects 0.000 description 4
- 206010033799 Paralysis Diseases 0.000 description 3
- 241001282135 Poromitra oscitans Species 0.000 description 3
- 206010047700 Vomiting Diseases 0.000 description 3
- 206010048232 Yawning Diseases 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000008673 vomiting Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
本発明は、ユーザ発話に応じて回答文を出力する会話制御装置として提案される。
この会話制御装置は、回答文と、当該回答文の次の順番で出力することが予定される回答文である次候補回答文を指定する次候補指定情報(例えば、次プラン指定情報)とをそれぞれが有する複数のプランを記憶するプラン記憶手段(例えば、記憶装置又は会話データベース)と、第1のユーザ発話に応じて、プラン記憶手段に記憶されたいずれかのプランを選択し、そのプランが有する回答文を出力し、その後、第2のユーザ発話に応じて、当該プランが有する次候補指定情報に基づいて、次候補回答文を出力するプラン会話手段(例えば、CPU又はプラン会話処理部)とを有し、プランの少なくとも一部は、ユーザを誘導するための一連の質問を回答文として有しており、次候補指定情報は、複数の次候補回答文を指定する情報であることを特徴としている。また、前記プラン会話手段は、第2のユーザ発話が次候補回答文と関連性がないか若しくは関連性が不明である場合に、前記次候補回答文の出力を保留し、会話制御装置が談話空間会話手段(例えば、CPU又は談話空間会話制御処理部)を更に有し、該談話空間会話手段は、前記プラン会話手段が次候補回答文の出力を保留した場合に、前記第2のユーザ発話に応じて、前記次候補回答文と関連性を有する話題以外の話題についての回答文を出力することを特徴とする。更に、会話制御装置では、ユーザ発話を受けるごとに、前回の発話に基づく回答文の出力制御において更新されて設定された4つの基本制御状態「結束」「破棄」「維持」「継続」に応じて回答文の出力制御を行なうメイン処理が実行され、該メイン処理では、ユーザ発話が実行中のプランに一致する基本制御状態「結束」の場合、前記プラン会話手段は、当該プランを終了して、当該プランが有する次候補指定情報にて指定された回答文に対応するプランに移行し、ユーザ発話内容が実行中のプランの終了を要求していると判断され、または、ユーザの関心が実行中のプラン以外の事項に移ったと判定される基本制御状態「破棄」の場合、前記プラン会話手段は、破棄の対象となったプラン以外にユーザ発話に対応するプランがないかどうかを検索し、存在する場合にはそのプランの実行を開始し、存在しない場合には、プランの実行を終了し、ユーザ発話が実行中のプランに一致せずユーザ発話が基本制御状態「破棄」に該当するものではないと判断される基本制御状態「維持」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、前記プラン会話手段が他のプランの実行を開始し、或いは、前記談話空間会話手段による処理を行ない、ユーザ発話がプラン再開に適している場合には、前記プラン会話手段が該プランが有する次候補指定情報に基づいて回答文の出力を行い、ユーザ発話が実行中のプランに含まれる回答文に対応せずユーザ発話内容が基本制御状態「破棄」に該当しない判断され且つユーザ発話から解釈されるユーザの意図が明瞭でない基本制御状態「継続」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、ユーザとの会話の流れを途切れさせることなく継続させるための繋ぎの回答文を出力するCA会話制御処理を行なう。そして、前記メイン処理の最後に基本制御情報更新処理が行なわれ、この基本制御情報更新処理では、前記プラン会話手段が回答文出力を行った場合に基本制御情報が「結束」に設定され、前記プラン会話手段が回答文出力を停止した場合に基本制御情報が「破棄」に設定され、前記談話空間会話手段が回答文出力を行った場合に基本制御情報が「維持」に設定され、前記CA会話制御手段が回答文出力を行った場合に基本制御情報が「継続」に設定される。
本発明の第1の実施の形態は、ユーザ発話に対して回答を出力し、ユーザとの会話を成立させる会話制御装置として提案される。
[1.会話制御装置の構成例]
[1.1.全体構成]
図1は、本実施の形態に係る会話制御装置1の構成例を示す機能ブロック図である。
入力部100は、利用者から入力された入力情報(ユーザ発話)を取得するものである。入力部100は、取得した発話内容に対応する音声を音声信号として音声認識部200に出力する。なお、入力部100は必ずしも、音声を扱うものに限られる必要はなく、キーボードや、タッチパネルなどの文字入力を扱うものであってもかまわない。この場合には後述する音声認識部200をもうける必要はない。
音声認識部200は、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定するものである。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号に基づいて、この音声信号を、音声認識辞書記憶部700に格納されている辞書および会話データベース500と照合して、音声信号から推測される音声認識結果を出力する。なお、図1に示す構成例では、音声認識部200は、会話制御部300に会話データベース500の記憶内容の取得を要求し、会話制御部300が要求に応じて取得した会話データベース500の記憶内容を受け取るようになっているが、音声認識部200が直接会話データベース500の記憶内容を取得して音声信号との比較を行う構成であってもかまわない。
図2に、音声認識部200の構成例を示す機能ブロック図を示す。音声認識部200は、特徴抽出部200Aと、バッファメモリ(BM)200Bと、単語照合部200Cと、バッファメモリ(BM)200Dと、候補決定部200Eと、単語仮説絞込部200Fを有している。単語照合部200C及び単語仮説絞込部200Fは音声認識辞書記憶部700に接続されており、候補決定部200Eは会話データベース500に接続されている。
以上の実施の形態において、特徴抽出部200Aと、単語照合部200Cと、候補決定部200Eと、単語仮説絞込部200Fは、例えば、マイクロコンピュータなどのコンピュータで構成され、バッファメモリ200B,200Dと、音声認識辞書記憶部700とは、例えばハードデイスクメモリなどの記憶装置で構成される。
また、本実施の形態では、音声認識部200は会話制御装置1の一部分として説明するが、音声認識部200、音声認識辞書記憶部700、及び会話データベース500より構成される、独立した音声認識装置とすることも可能である。
つぎに図4を参照しながら音声認識部200の動作について説明する。図4は、音声認識部200の動作例を示すフローチャートである。入力部100より音声信号を受け取ると、音声認識部200は入力された音声の特徴分析を行い、特徴パラメータを生成する(ステップS401)。次に、この特徴パラメータと音声認識辞書記憶部700に記憶された音素HMM及び言語モデルとを比較して、所定個数の単語仮説及びその尤度を取得する(ステップS402)。次に、音声認識部200は、取得した所定個数の単語仮説と検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定する(ステップS403、S404)。一致するものがある場合は、音声認識部200はその一致する単語仮説を認識結果として出力する(ステップS405)。一方、一致するものがない場合は、音声認識部200は取得した単語仮説の尤度に従って、最大尤度を有する単語仮説を認識結果として出力する(ステップS406)。
再び、図1に戻って、会話制御装置1の構成例の説明を続ける。
音声認識辞書記憶部700は、標準的な音声信号に対応する文字列を格納するものである。この照合をした音声認識部200は、その音声信号に対応する単語仮説に対応する文字列を特定し、その特定した文字列を文字列信号として会話制御部300に出力する。
次に、図5を参照しながら文解析部400の構成例について説明する。図5は、会話制御装置1の部分拡大ブロック図であって、会話制御部300及び文解析部400の具体的構成例を示すブロック図である。なお、図5においては、会話制御部300、文解析部400、および会話データベース500のみ図示しており、その他の構成要素は表示を省略している。
形態素抽出部420は、文字列特定部410で区切られた一文節の文字列に基づいて、その一文節の文字列の中から、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するものである。ここで、形態素とは、本実施の形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、例えば、名詞、形容詞、動詞などの品詞が挙げられる。
入力種類判定部440は、文字列特定部410で特定された文字列に基づいて、発話内容の種類(発話種類)を判定するものである。この発話種類は、発話内容の種類を特定する情報であって、本実施の形態では、例えば図7に示す「発話文のタイプ」を意味する。図7は、「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図である。
次に、会話データベース500が記憶するデータのデータ構成例について図9を参照しながら説明する。図9は、会話データベース500が記憶するデータの構成例を示す概念図である。
話題特定情報810「佐藤」には、複数の話題タイトル(820)1−1、1−2、…が対応付けされている。それぞれの話題タイトル(820)1−1,1−2,…には回答文(830)1−1,1−2、…が対応付けされて記憶されている。回答文830は、回答種類840ごとに用意されている。
ここで図5に戻り、会話制御部300の構成例を説明する。
会話制御部300は、会話制御装置1内の各構成要素(音声認識部200,文解析部400、会話データベース500,出力部600,音声認識辞書記憶部700)間のデータの受け渡しを制御するとともに、ユーザ発話に応答する回答文の決定、出力を行う機能を有する。
[1.1.6.1.管理部]
管理部310は談話履歴を記憶し、且つ必要に応じて更新する機能を有する。管理部310は話題特定情報検索部350と、省略文補完部360と、話題検索部370と、回答取得部380からの要求に応じて、記憶している談話履歴の全部又は一部をこれら各部に渡す機能を有する。
プラン会話処理部320は、プランを実行し、プランに従った会話をユーザとの間で成立させる機能を有する。「プラン」とは、予め定めた順番に従って予め定めた回答をユーザに提供することをいう。以下、プラン会話処理部320について説明する。
図5に戻り、会話制御部300の構成例の説明を続ける。
談話空間会話制御処理部330は、話題特定情報検索部350と、省略文補完部360と、話題検索部370と、回答取得部380とを有している。前記管理部310は、会話制御部300の全体を制御するものである。
[1.1.6.3.1.話題特定情報検索部]
話題特定情報検索部350は、形態素抽出部420で抽出された第一形態素情報と各話題特定情報とを照合し、各話題特定情報の中から、第一形態素情報を構成する形態素と一致する話題特定情報を検索するものである。具体的に、話題特定情報検索部350は、形態素抽出部420から入力された第一形態素情報が「佐藤」及び「好き」の二つの形態素で構成される場合には、入力された第一形態素情報と話題特定情報群とを照合する。
省略文補完部360は、前記第一形態素情報を、前回までに検索された話題特定情報810(以下、「着目話題特定情報」と呼ぶ)及び前回の回答文に含まれる話題特定情報810(以下、「回答文話題特定情報」と呼ぶ)を利用して、補完することにより複数種類の補完された第一形態素情報を生成する。例えばユーザ発話が「好きだ」という文であった場合、省略文補完部360は、着目話題特定情報「佐藤」を、第一形態素情報「好き」に含めて、補完された第一形態素情報「佐藤、好き」を生成する。
話題検索部370は、省略文補完部360で話題タイトル810が決まらなかったとき、第一形態素情報と、利用者入力文話題特定情報に対応する各話題タイトル810とを照合し、各話題タイトル810の中から、第一形態素情報に最も適する話題タイトル810を検索するものである。
具体的に、省略文補完部360から検索命令信号が入力された話題検索部370は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトルの中から、その第一形態素情報に最も適した話題タイトル810を検索する。話題検索部370は、その検索した話題タイトル810を検索結果信号として回答取得部380に出力する。
話題検索部370は、その照合結果に基づいて、各話題タイトル(820)1-1〜1-2の中から、入力された第一形態素情報「佐藤、好き」と一致する話題タイトル(820)1-1(佐藤;*;好き)を特定する。話題検索部340は、検索した話題タイトル(820)1-1(佐藤;*;好き)を検索結果信号として回答取得部380に出力する。
回答取得部380は、省略文補完部360,或いは話題検索部370で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた回答文830を取得する。また、回答取得部380は、話題検索部370で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた各回答種類と、入力種類判定部440で判定された発話種類とを照合する。その照合をした回答取得部380は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する。
ここで、上記"DA"、"TA"等のうち、"A"は、肯定形式を意味する。従って、発話種類及び回答種類に"A"が含まれているときは、ある事柄について肯定することを示している。また、発話種類及び回答種類には、"DQ"、"TQ"等の種類を含めることもできる。この"DQ"、"TQ"等のうち"Q"は、ある事柄についての質問を意味する。
CA会話処理部340は、ユーザ発話に対して、プラン会話処理部320および談話空間会話制御処理部330のいずれにおいても回答文が決定しない場合に、ユーザ発話の内容に応じて、ユーザとの会話を継続できるような回答文を出力する機能を有する。
[1.1.7.出力部]
出力部600は、回答取得部380で取得された回答文を出力するものである。この出力部600は、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部310から回答文が入力された出力部600は、入力された回答文に基づいて、音声をもってその回答文、例えば、「私も佐藤が好きです」を出力する。
以上で会話制御装置1の構成例の説明を終了する。
上記構成を有する会話制御装置1は、以下のように動作することにより会話制御方法を実行する。
基本制御状態情報は、プランの基本制御状態を記述する役割を有する。
この基本制御状態は、ユーザ発話が実行中のプラン1402、より詳しくはプラン1402に対応する話題タイトル820や用例文1701に一致する場合である。この場合は、プラン会話処理部320は当該プラン1402を終了し、次プラン指定情報1502にて指定された回答文1501に対応するプラン1402に移行する。
この基本制御状態は、ユーザ発話内容がプラン1402の終了を要求していると判断される場合、またはユーザの関心が実行中のプラン以外の事項に移ったと判定される場合に、設定される基本制御状態である。基本制御状態情報が破棄を示している場合は、プラン会話処理部320は、破棄の対象となったプラン1402以外にユーザ発話に対応するプラン1402がないかどうかを検索し、存在する場合にはそのプラン1402の実行を開始し、存在しない場合には、プランの実行を終了する。
この基本制御状態は、ユーザ発話が、実行中のプラン1402に対応する話題タイトル820(図13参照)や用例文1701(図17参照)に該当しない場合であって、かつユーザ発話が基本制御状態「破棄」に該当するものではないと判断される場合に、基本制御状態情報に記述される基本制御状態である。
この状態は、ユーザ発話が、実行中のプラン1402に含まれる回答文1501に対応しない場合であって、かつユーザ発話内容が基本制御状態「破棄」に該当するものではないと判断され、かつユーザ発話から解釈されるユーザの意図が明瞭でない場合に、設定される基本制御状態である。
基本制御状態情報を参照したプラン会話処理部320は、基本制御状態情報が示す基本制御状態が「結束」であるか否かを判定する(S1902)。基本制御状態が「結束」であると判定した場合(S1902、Yes)は、プラン会話処理部320は、基本制御状態情報が示す実行中のプラン1402において、回答文1501が最終回答文であるかどうかを判定する(S1903)。
回答文出力処理(S1908)後、プラン会話処理部320はプラン会話制御処理を終了する。
プラン会話制御処理(S1801)を終了すると、会話制御部300は談話空間会話制御処理を開始する(S1802)。ただし、プラン会話制御処理(S1801)において回答文出力を行った場合は、会話制御部300は談話空間会話制御処理(S1802)、および後に説明するCA会話制御処理(S1803)のいずれも行わず、基本制御情報更新処理(S1904)を行ってメイン処理を終了する。
先ず、入力部100が、利用者からの発話内容を取得するステップを行う(ステップS2201)。具体的には、入力部100は、利用者の発話内容を構成する音声を取得する。入力部100は、取得した音声を音声信号として音声認識部200に出力する。なお、入力部100は、利用者からの音声ではなく、利用者から入力された文字列(例えば、テキスト形式で入力された文字データ)を取得してもよい。この場合、入力部100はマイクではなく、キーボードやタッチパネルなどの文字入力装置となる。
この照合をした形態素抽出部420は、入力された文字列の中から、予め記憶された形態素群に含まれる各形態素と一致する各形態素(m1、m2、…)を抽出する。形態素抽出部420は、抽出した各形態素を第一形態素情報として話題特定情報検索部350に出力する。
第一形態素情報を構成する形態素と着目話題タイトル820focusとが一致する場合、話題特定情報検索部350は、その話題タイトル820を回答取得部380に出力する。一方、話題特定情報検索部350は、第一形態素情報を構成する形態素と話題タイトル820とが一致しなかった場合には、入力された第一形態素情報及び利用者入力文話題特定情報を検索命令信号として省略文補完部360に出力する。
会話制御部300は談話空間会話制御処理を終了すると、CA会話制御処理を実行する(S1803)。ただし、プラン会話制御処理(S1801)および談話空間会話制御処理(S1801)において回答文出力を行った場合は、会話制御部300はCA会話制御処理(S1803)を行わず、基本制御情報更新処理(S1804)を行ってメイン処理を終了する。
次に、本発明の第2の実施の形態について述べる。第2の実施の形態にかかる会話制御装置1は、ユーザに質問を繰り返して行うことで、ユーザにある結論やアドバイスなどの情報にたどり着かせるための、誘導談話と呼ぶタイプのプランを扱うことができることを特徴としている。かかる会話制御装置1は、会話データベース500に記憶されているプラン1402(複数)の少なくとも一部は、ユーザを誘導するための一連の質問を回答文として有しており、そのプランの有する次プラン指定情報は、複数の次候補回答文を指定する情報である。
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図21における「結束」に対応する状態である。ユーザ発話が実行中のプラン1402、より詳しくはプラン1402に対応する話題タイトル820や用例文1701に一致する場合である。この場合は、プラン会話処理部320は当該プラン1402を終了し、次プラン指定情報1502にて指定された回答文1501に対応するプラン1402に移行する。
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図21における「破棄」と同様である。ユーザ発話内容がプラン1402の終了を要求していると判断される場合、またはユーザの関心が実行中のプラン以外の事項に移ったと判定される場合に、設定される基本制御状態である。基本制御状態情報が破棄を示している場合は、プラン会話処理部320は、破棄の対象となったプラン1402以外にユーザ発話に対応するプラン1402がないかどうかを検索し、存在する場合にはそのプラン1402の実行を開始し、存在しない場合には、プランの実行を終了する。
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図21における「維持」と同様である。すなわち、基本制御状態「維持」は、ユーザ発話が、実行中のプラン1402に対応するに対応する話題タイトル820(図13参照)や用例文1701(図17参照)に該当しない場合であって、かつユーザ発話が基本制御状態「破棄」に該当するものではないと判断される場合に、基本制御状態情報に記述される基本制御状態である。
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図21における「継続」に対応している。この基本制御状態は、ユーザ発話が、実行中のプラン1402に含まれる回答文1501に対応しない場合であって、かつユーザ発話内容が基本制御状態「破棄」に該当するものではないと判断され、かつユーザ発話から解釈されるユーザの意図が明瞭でない場合に、設定される基本制御状態である。
100 … 入力部
200 … 音声認識部
300 … 会話制御部
320 … プラン会話処理部
330 … 談話空間会話制御処理部
340 … CA会話処理部
400 … 文解析部
500 … 会話データベース
600 … 出力部
700 … 音声認識辞書記憶部
Claims (1)
- ユーザ発話に応じて回答文を出力する会話制御装置であって、
回答文と、当該回答文の次の順番で出力することが予定される回答文である次候補回答文を指定する次候補指定情報とをそれぞれが有する複数のプランを記憶するプラン記憶手段と、
第1のユーザ発話に応じて、前記プラン記憶手段に記憶されたいずれかのプランを選択し、そのプランが有する回答文を出力し、その後、第2のユーザ発話に応じて、当該プランが有する次候補指定情報に基づいて、次候補回答文を出力するプラン会話手段と、
を有し、
前記プランの少なくとも一部は、ユーザを誘導するための一連の質問を前記回答文として有しており、前記次候補指定情報は、複数の次候補回答文を指定する情報であり、
前記プラン会話手段は、第2のユーザ発話が次候補回答文と関連性がないか若しくは関連性が不明である場合に、前記次候補回答文の出力を保留し、
会話制御装置が談話空間会話手段を更に有し、該談話空間会話手段は、前記プラン会話手段が次候補回答文の出力を保留した場合に、前記第2のユーザ発話に応じて、前記次候補回答文と関連性を有する話題以外の話題についての回答文を出力する、会話制御装置において、
ユーザ発話を受けるごとに、前回の発話に基づく回答文の出力制御において更新されて設定された4つの基本制御状態「結束」「破棄」「維持」「継続」に応じて回答文の出力制御を行なうメイン処理が実行され、該メイン処理では、
ユーザ発話が実行中のプランに一致する基本制御状態「結束」の場合、前記プラン会話手段は、当該プランを終了して、当該プランが有する次候補指定情報にて指定された回答文に対応するプランに移行し、
ユーザ発話内容が実行中のプランの終了を要求していると判断され、または、ユーザの関心が実行中のプラン以外の事項に移ったと判定される基本制御状態「破棄」の場合、前記プラン会話手段は、破棄の対象となったプラン以外にユーザ発話に対応するプランがないかどうかを検索し、存在する場合にはそのプランの実行を開始し、存在しない場合には、プランの実行を終了し、
ユーザ発話が実行中のプランに一致せずユーザ発話が基本制御状態「破棄」に該当するものではないと判断される基本制御状態「維持」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、前記プラン会話手段が他のプランの実行を開始し、或いは、前記談話空間会話手段による処理を行ない、ユーザ発話がプラン再開に適している場合には、前記プラン会話手段が該プランが有する次候補指定情報に基づいて回答文の出力を行い、
ユーザ発話が実行中のプランに含まれる回答文に対応せずユーザ発話内容が基本制御状態「破棄」に該当しない判断され且つユーザ発話から解釈されるユーザの意図が明瞭でない基本制御状態「継続」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、ユーザとの会話の流れを途切れさせることなく継続させるための繋ぎの回答文を出力するCA会話制御処理を行ない、
前記メイン処理の最後に基本制御情報更新処理が行なわれ、この基本制御情報更新処理では、前記プラン会話手段が回答文出力を行った場合に基本制御情報が「結束」に設定され、前記プラン会話手段が回答文出力を停止した場合に基本制御情報が「破棄」に設定され、前記談話空間会話手段が回答文出力を行った場合に基本制御情報が「維持」に設定され、前記CA会話制御手段が回答文出力を行った場合に基本制御情報が「継続」に設定される、
ことを特徴とする会話制御装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005307868A JP4849662B2 (ja) | 2005-10-21 | 2005-10-21 | 会話制御装置 |
US11/581,372 US7949530B2 (en) | 2005-10-21 | 2006-10-17 | Conversation controller |
CN2006101357929A CN1953055B (zh) | 2005-10-21 | 2006-10-20 | 会话控制器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005307868A JP4849662B2 (ja) | 2005-10-21 | 2005-10-21 | 会話制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007115144A JP2007115144A (ja) | 2007-05-10 |
JP4849662B2 true JP4849662B2 (ja) | 2012-01-11 |
Family
ID=37986357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005307868A Active JP4849662B2 (ja) | 2005-10-21 | 2005-10-21 | 会話制御装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7949530B2 (ja) |
JP (1) | JP4849662B2 (ja) |
CN (1) | CN1953055B (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8126713B2 (en) * | 2002-04-11 | 2012-02-28 | Shengyang Huang | Conversation control system and conversation control method |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7451579B2 (en) | 2005-10-12 | 2008-11-18 | Concrete Accessories, Inc. | Reinforcement bar spacer wheel |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
JP5378717B2 (ja) * | 2008-07-01 | 2013-12-25 | 株式会社ユニバーサルエンターテインメント | 会話制御システム、並びに端末装置 |
JP5149737B2 (ja) * | 2008-08-20 | 2013-02-20 | 株式会社ユニバーサルエンターテインメント | 自動会話システム、並びに会話シナリオ編集装置 |
JP5829000B2 (ja) * | 2008-08-20 | 2015-12-09 | 株式会社ユニバーサルエンターテインメント | 会話シナリオ編集装置 |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
CN103457834B (zh) * | 2013-08-18 | 2018-06-05 | 苏州量跃信息科技有限公司 | 即时通信中item项触发语音搜索的方法及客户端 |
US9905225B2 (en) * | 2013-12-26 | 2018-02-27 | Panasonic Intellectual Property Management Co., Ltd. | Voice recognition processing device, voice recognition processing method, and display device |
JP6024675B2 (ja) * | 2014-01-17 | 2016-11-16 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP6390264B2 (ja) * | 2014-08-21 | 2018-09-19 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
US9898459B2 (en) | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10140988B2 (en) | 2016-03-01 | 2018-11-27 | Microsoft Technology Licensing, Llc | Speech recognition |
US10192550B2 (en) | 2016-03-01 | 2019-01-29 | Microsoft Technology Licensing, Llc | Conversational software agent |
US10140986B2 (en) | 2016-03-01 | 2018-11-27 | Microsoft Technology Licensing, Llc | Speech recognition |
US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
US10403273B2 (en) * | 2016-09-09 | 2019-09-03 | Oath Inc. | Method and system for facilitating a guided dialog between a user and a conversational agent |
JP6715943B2 (ja) * | 2016-10-06 | 2020-07-01 | シャープ株式会社 | 対話装置、対話装置の制御方法、および制御プログラム |
US11341174B2 (en) * | 2017-03-24 | 2022-05-24 | Microsoft Technology Licensing, Llc | Voice-based knowledge sharing application for chatbots |
JP6560730B2 (ja) * | 2017-11-22 | 2019-08-14 | 日本瓦斯株式会社 | 対話形式で顧客ヒアリング、ガス器具販売および決済を行なう方法、コンピュータおよびプログラム |
US11133010B1 (en) * | 2018-01-23 | 2021-09-28 | United Services Automobile Association (Usaa) | Intelligent agent for interactive service environments |
US10997359B2 (en) | 2018-04-27 | 2021-05-04 | International Business Machines Corporation | Real-time cognitive modifying a mark-up language document |
JP6773074B2 (ja) * | 2018-05-01 | 2020-10-21 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
EP3576084B1 (de) * | 2018-05-29 | 2020-09-30 | Christoph Neumann | Effiziente dialoggestaltung |
CN108897872B (zh) * | 2018-06-29 | 2022-09-27 | 北京百度网讯科技有限公司 | 对话处理方法、装置、计算机设备和存储介质 |
KR102098003B1 (ko) * | 2018-10-11 | 2020-04-07 | 삼성생명보험주식회사 | 챗봇 구동 방법, 장치 및 컴퓨터 판독가능 매체 |
CN113127608A (zh) * | 2019-12-31 | 2021-07-16 | 微软技术许可有限责任公司 | 计划引导的响应提供 |
JP7420109B2 (ja) * | 2021-04-08 | 2024-01-23 | トヨタ自動車株式会社 | 情報出力システム、サーバ装置および情報出力方法 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2979430B2 (ja) | 1990-11-02 | 1999-11-15 | 日本電信電話株式会社 | 通信文自動分割蓄積装置 |
JPH07282134A (ja) | 1994-04-15 | 1995-10-27 | Japan Aviation Electron Ind Ltd | 注文用端末装置 |
US6173266B1 (en) * | 1997-05-06 | 2001-01-09 | Speechworks International, Inc. | System and method for developing interactive speech applications |
US6044347A (en) * | 1997-08-05 | 2000-03-28 | Lucent Technologies Inc. | Methods and apparatus object-oriented rule-based dialogue management |
JP3088364B2 (ja) | 1997-11-05 | 2000-09-18 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 音声言語理解装置及び音声言語理解システム |
US6411924B1 (en) | 1998-01-23 | 2002-06-25 | Novell, Inc. | System and method for linguistic filter and interactive display |
JP3125746B2 (ja) * | 1998-05-27 | 2001-01-22 | 日本電気株式会社 | 人物像対話装置及び人物像対話プログラムを記録した記録媒体 |
US6101492A (en) | 1998-07-02 | 2000-08-08 | Lucent Technologies Inc. | Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis |
US6493671B1 (en) * | 1998-10-02 | 2002-12-10 | Motorola, Inc. | Markup language for interactive services to notify a user of an event and methods thereof |
US6321198B1 (en) * | 1999-02-23 | 2001-11-20 | Unisys Corporation | Apparatus for design and simulation of dialogue |
US6314402B1 (en) * | 1999-04-23 | 2001-11-06 | Nuance Communications | Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system |
US6356869B1 (en) * | 1999-04-30 | 2002-03-12 | Nortel Networks Limited | Method and apparatus for discourse management |
TW501046B (en) * | 1999-06-11 | 2002-09-01 | Ind Tech Res Inst | A portable dialogue manager |
US6901402B1 (en) | 1999-06-18 | 2005-05-31 | Microsoft Corporation | System for improving the performance of information retrieval-type tasks by identifying the relations of constituents |
JP2001005488A (ja) | 1999-06-18 | 2001-01-12 | Mitsubishi Electric Corp | 音声対話システム |
US6553345B1 (en) | 1999-08-26 | 2003-04-22 | Matsushita Electric Industrial Co., Ltd. | Universal remote control allowing natural language modality for television and multimedia searches and requests |
US6510411B1 (en) * | 1999-10-29 | 2003-01-21 | Unisys Corporation | Task oriented dialog model and manager |
JP2001357053A (ja) | 2000-06-12 | 2001-12-26 | Matsushita Electric Ind Co Ltd | 対話装置 |
CA2413657A1 (en) * | 2000-06-16 | 2001-12-20 | Healthetech, Inc. | Speech recognition capability for a personal digital assistant |
JP2002023783A (ja) | 2000-07-13 | 2002-01-25 | Fujitsu Ltd | 対話処理システム |
JP2002032370A (ja) * | 2000-07-18 | 2002-01-31 | Fujitsu Ltd | 情報処理装置 |
US6795808B1 (en) * | 2000-10-30 | 2004-09-21 | Koninklijke Philips Electronics N.V. | User interface/entertainment device that simulates personal interaction and charges external database with relevant data |
US6941266B1 (en) * | 2000-11-15 | 2005-09-06 | At&T Corp. | Method and system for predicting problematic dialog situations in a task classification system |
US7574362B2 (en) | 2001-03-14 | 2009-08-11 | At&T Intellectual Property Ii, L.P. | Method for automated sentence planning in a task classification system |
JP4390402B2 (ja) | 2001-03-29 | 2009-12-24 | 富士通株式会社 | 知識情報管理方法、知識情報利用方法および知識情報管理装置 |
US6944594B2 (en) * | 2001-05-30 | 2005-09-13 | Bellsouth Intellectual Property Corporation | Multi-context conversational environment system and method |
US7305070B2 (en) | 2002-01-30 | 2007-12-04 | At&T Labs, Inc. | Sequential presentation of long instructions in an interactive voice response system |
US7016849B2 (en) * | 2002-03-25 | 2006-03-21 | Sri International | Method and apparatus for providing speech-driven routing between spoken language applications |
US7197460B1 (en) | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
JP3766369B2 (ja) | 2002-10-24 | 2006-04-12 | 東芝テック株式会社 | 注文会計システム |
CN1720520B (zh) * | 2002-12-02 | 2010-05-05 | 索尼株式会社 | 对话控制设备和方法,以及机器人设备 |
US7177817B1 (en) | 2002-12-12 | 2007-02-13 | Tuvox Incorporated | Automatic generation of voice content for a voice response system |
JP4110011B2 (ja) | 2003-02-25 | 2008-07-02 | 株式会社ピートゥピーエー | 会話制御装置及び会話制御方法 |
JP2004258902A (ja) | 2003-02-25 | 2004-09-16 | P To Pa:Kk | 会話制御装置及び会話制御方法 |
JP4110012B2 (ja) | 2003-02-25 | 2008-07-02 | 株式会社ピートゥピーエー | 会話制御装置及び会話制御方法 |
JP3788793B2 (ja) * | 2003-04-25 | 2006-06-21 | 日本電信電話株式会社 | 音声対話制御方法、音声対話制御装置、音声対話制御プログラム |
JP4103085B2 (ja) * | 2003-05-20 | 2008-06-18 | 日本電信電話株式会社 | 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 |
JP2005010691A (ja) | 2003-06-20 | 2005-01-13 | P To Pa:Kk | 音声認識装置、音声認識方法、会話制御装置、会話制御方法及びこれらのためのプログラム |
JP2005157494A (ja) | 2003-11-20 | 2005-06-16 | Aruze Corp | 会話制御装置及び会話制御方法 |
JP2006039120A (ja) | 2004-07-26 | 2006-02-09 | Sony Corp | 対話装置および対話方法、並びにプログラムおよび記録媒体 |
US7610191B2 (en) * | 2004-10-06 | 2009-10-27 | Nuance Communications, Inc. | Method for fast semi-automatic semantic annotation |
US8185399B2 (en) * | 2005-01-05 | 2012-05-22 | At&T Intellectual Property Ii, L.P. | System and method of providing an automated data-collection in spoken dialog systems |
CN1664835A (zh) * | 2005-03-30 | 2005-09-07 | 结信网络技术服务(上海)有限公司 | 企业智能客户服务系统 |
US20070101394A1 (en) | 2005-11-01 | 2007-05-03 | Yesvideo, Inc. | Indexing a recording of audiovisual content to enable rich navigation |
-
2005
- 2005-10-21 JP JP2005307868A patent/JP4849662B2/ja active Active
-
2006
- 2006-10-17 US US11/581,372 patent/US7949530B2/en active Active
- 2006-10-20 CN CN2006101357929A patent/CN1953055B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007115144A (ja) | 2007-05-10 |
CN1953055B (zh) | 2012-05-23 |
US20070094003A1 (en) | 2007-04-26 |
CN1953055A (zh) | 2007-04-25 |
US7949530B2 (en) | 2011-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4849662B2 (ja) | 会話制御装置 | |
JP4846336B2 (ja) | 会話制御装置 | |
JP4849663B2 (ja) | 会話制御装置 | |
JP4888996B2 (ja) | 会話制御装置 | |
JP2007114621A (ja) | 会話制御装置 | |
JP5149737B2 (ja) | 自動会話システム、並びに会話シナリオ編集装置 | |
CN1321401C (zh) | 语音识别设备、语音识别方法、会话控制设备以及会话控制方法 | |
JP2005157494A (ja) | 会話制御装置及び会話制御方法 | |
US20090306979A1 (en) | Data processing system for autonomously building speech identification and tagging data | |
JP2005234572A (ja) | 談話機能に対する予測モデルを判定する方法およびシステム | |
JPH07219961A (ja) | 音声対話システム | |
WO2003085550A1 (en) | Conversation control system and conversation control method | |
JP4475628B2 (ja) | 会話制御装置、会話制御方法並びにこれらのプログラム | |
AT&T | ||
JP4204044B2 (ja) | ゲーム機、ゲームの実行方法、並びにこれらのためのプログラム | |
JP4204043B2 (ja) | ゲーム機、ゲームの実行方法、並びにプログラム | |
JP2005122549A (ja) | 会話制御装置及び会話制御方法 | |
JP4204041B2 (ja) | ゲーム機、ゲームの実行方法、並びにプログラム | |
JP4204042B2 (ja) | ゲーム機、ゲームの実行方法、並びにプログラム | |
JP5378717B2 (ja) | 会話制御システム、並びに端末装置 | |
JP2005118371A (ja) | ゲーム機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111013 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4849662 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |