JP4849662B2

JP4849662B2 - 会話制御装置

Info

Publication number: JP4849662B2
Application number: JP2005307868A
Authority: JP
Inventors: 声揚黄; 裕勝倉
Original assignee: Universal Entertainment Corp; PtoPA Inc
Current assignee: Universal Entertainment Corp; PtoPA Inc
Priority date: 2005-10-21
Filing date: 2005-10-21
Publication date: 2012-01-11
Anticipated expiration: 2025-10-21
Also published as: JP2007115144A; CN1953055B; US20070094003A1; CN1953055A; US7949530B2

Description

本発明は、ユーザからの発話に応じて回答又は返答を出力する会話制御装置に関する。

近年、コスト削減及び迅速な注文処理などの観点から、レストランでの注文受付のために、店員の代わりに端末装置を利用することが提案されるようになっている（例えば、特許文献１、特許文献２など）。この様な注文受付用の端末装置を用いることで、店員が応対せずともいつでも注文を受付けることが可能となる。
特開平７−２８２１３４号公報特開２００４−１４５６０６号公報

この様な注文受付用の端末装置を導入することが、必ずしもユーザに対するサービスの向上とならないという問題点がある。従来店員が注文を受け付けてくれる場合は、注文以外の会話を交えつつ、最終的には顧客の希望する注文を発することが可能であった。しかし、注文受付用の端末装置を用いた場合、顧客は、端末に表示されたメニューを選択することで注文を行うことになる。この場合、顧客は端末装置の表示（指示）に従うしかなく、端末装置が予め用意している流れから外れて、様々なメニューを検討したりすることが出来ない。

本発明の目的は、ユーザに質問を繰り返して行うことことで、ユーザにある結論やアドバイスなどの、予め準備した情報にたどり着かせるための会話を提供する技術を提供することにある。

本発明のさらに別の目的は、予め準備した情報にたどり着かせるための会話と、それ以外の話題についての会話とに共に対処可能な技術を提供することにある。

上記課題を解決するための手段として、本発明は以下の特徴を有している。
本発明は、ユーザ発話に応じて回答文を出力する会話制御装置として提案される。
この会話制御装置は、回答文と、当該回答文の次の順番で出力することが予定される回答文である次候補回答文を指定する次候補指定情報（例えば、次プラン指定情報）とをそれぞれが有する複数のプランを記憶するプラン記憶手段（例えば、記憶装置又は会話データベース）と、第１のユーザ発話に応じて、プラン記憶手段に記憶されたいずれかのプランを選択し、そのプランが有する回答文を出力し、その後、第２のユーザ発話に応じて、当該プランが有する次候補指定情報に基づいて、次候補回答文を出力するプラン会話手段（例えば、ＣＰＵ又はプラン会話処理部）とを有し、プランの少なくとも一部は、ユーザを誘導するための一連の質問を回答文として有しており、次候補指定情報は、複数の次候補回答文を指定する情報であることを特徴としている。また、前記プラン会話手段は、第２のユーザ発話が次候補回答文と関連性がないか若しくは関連性が不明である場合に、前記次候補回答文の出力を保留し、会話制御装置が談話空間会話手段（例えば、ＣＰＵ又は談話空間会話制御処理部）を更に有し、該談話空間会話手段は、前記プラン会話手段が次候補回答文の出力を保留した場合に、前記第２のユーザ発話に応じて、前記次候補回答文と関連性を有する話題以外の話題についての回答文を出力することを特徴とする。更に、会話制御装置では、ユーザ発話を受けるごとに、前回の発話に基づく回答文の出力制御において更新されて設定された４つの基本制御状態「結束」「破棄」「維持」「継続」に応じて回答文の出力制御を行なうメイン処理が実行され、該メイン処理では、ユーザ発話が実行中のプランに一致する基本制御状態「結束」の場合、前記プラン会話手段は、当該プランを終了して、当該プランが有する次候補指定情報にて指定された回答文に対応するプランに移行し、ユーザ発話内容が実行中のプランの終了を要求していると判断され、または、ユーザの関心が実行中のプラン以外の事項に移ったと判定される基本制御状態「破棄」の場合、前記プラン会話手段は、破棄の対象となったプラン以外にユーザ発話に対応するプランがないかどうかを検索し、存在する場合にはそのプランの実行を開始し、存在しない場合には、プランの実行を終了し、ユーザ発話が実行中のプランに一致せずユーザ発話が基本制御状態「破棄」に該当するものではないと判断される基本制御状態「維持」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、前記プラン会話手段が他のプランの実行を開始し、或いは、前記談話空間会話手段による処理を行ない、ユーザ発話がプラン再開に適している場合には、前記プラン会話手段が該プランが有する次候補指定情報に基づいて回答文の出力を行い、ユーザ発話が実行中のプランに含まれる回答文に対応せずユーザ発話内容が基本制御状態「破棄」に該当しない判断され且つユーザ発話から解釈されるユーザの意図が明瞭でない基本制御状態「継続」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、ユーザとの会話の流れを途切れさせることなく継続させるための繋ぎの回答文を出力するＣＡ会話制御処理を行なう。そして、前記メイン処理の最後に基本制御情報更新処理が行なわれ、この基本制御情報更新処理では、前記プラン会話手段が回答文出力を行った場合に基本制御情報が「結束」に設定され、前記プラン会話手段が回答文出力を停止した場合に基本制御情報が「破棄」に設定され、前記談話空間会話手段が回答文出力を行った場合に基本制御情報が「維持」に設定され、前記ＣＡ会話制御手段が回答文出力を行った場合に基本制御情報が「継続」に設定される。

ここで、「ユーザを誘導するための一連の質問」とは、予め準備した一又は複数の情報に関連づけされた複数の質問をいい、ユーザが質問に回答した結果、これらの情報の出力が行われる、いかなる質問（ユーザに回答、選択、決定を促す文、文章、単語を含む）も「ユーザを誘導するための一連の質問」に該当する。

かかる会話制御装置によれば、ユーザに質問を繰り返して行うことで、予め準備した情報にたどり着かせることにより、ユーザに対して適切な情報や、必要な情報を供給することが可能となる。また、かかる会話制御装置によれば、上記一連の質問の主題・話題以外の話題についてユーザが話したい場合には、一連の質問を中断し、会話制御装置はユーザ発話の話題に沿った応答を行なうことができる。また、上記会話制御装置によれば、一旦ユーザの関心が一連の質問とは別の事項に移った場合、質問の出力を一旦保留し、ユーザの関心が再び質問に戻った場合には、質問の出力を保留した箇所から再開することが可能となる（その後にユーザの興味が実行中断した質問の主題・話題に復帰した場合に、再度質問の出力を再開し、その結果、予め準備した情報にたどり着かせることにより、ユーザに対して適切な情報や、必要な情報を供給することを完遂できる。すなわち、ユーザの関心の対象を無視して、一方的に質問を出力するのではなく、ユーザの関心の対象に沿った会話を挟みながら、なおかつ質問を行うことによりユーザを予め準備した情報にたどり着かせる会話制御装置が実現できる）。

また、上記会話制御装置はさらに以下の特徴を有しても良い。すなわち、会話制御装置は、プラン会話制御手段が次候補回答文の出力を保留した場合に、談話空間会話手段が第２のユーザ発話に応じた次候補回答文と関連性を有する話題以外の話題についての回答文を出力できない場合、第２のユーザ発話に応じて、ユーザとの会話を継続させるための回答文を出力する会話継続手段（例えば、ＣＰＵ又はＣＡ会話処理部）をさらに有することを特徴としてもよい。

かかる会話制御装置によれば、プラン会話制御手段、談話空間会話制御手段のいずれによっても回答文の出力ができない場合であっても、ユーザとの会話状態を維持できる回答文を会話継続手段が出力するため、ユーザ発話の内容が不明瞭であったり、意図不明であったりしても、そのような場合には一連の質問の出力を一旦保留し、ユーザの関心が再び質問に戻った場合には、質問を中段した箇所から再開することが可能となる。

本発明によれば、ユーザに質問を繰り返して行うことで、予め準備した情報にたどり着かせることにより、ユーザに対して適切な情報や、必要な情報を供給することが可能となる。

以下に図面を参照しながら本発明の第１の実施の形態を説明する。
本発明の第１の実施の形態は、ユーザ発話に対して回答を出力し、ユーザとの会話を成立させる会話制御装置として提案される。

［Ａ．第１の実施の形態］
［１．会話制御装置の構成例］
［１．１．全体構成］
図１は、本実施の形態に係る会話制御装置１の構成例を示す機能ブロック図である。

会話制御装置１は、その筐体内部に、たとえばコンピュータ、ワークステーションなどの情報処理装置若しくは情報処理装置に相当するハードウエアを搭載している。会話制御装置１が有する情報処理装置は、演算処理装置（ＣＰＵ）、主メモリ（ＲＡＭ）、読出し専用メモリ（ＲＯＭ）、入出力装置（Ｉ／Ｏ）、ハードディスク装置等の外部記憶装置を具備している装置で構成されている。前記ＲＯＭ、もしくは外部記憶装置などに情報処理装置を会話制御装置１として機能させるためのプログラム、もしくは会話制御方法をコンピュータに実行させるためのプログラムが記憶されており、該プログラムを主メモリ上に載せ、ＣＰＵがこれを実行することにより会話制御装置１又は会話処理方法が実現される。また、上記プログラムは必ずしも当該装置内の記憶装置に記憶されていなくともよく、磁気ディスク、光ディスク、光磁気ディスク、ＣＤ（Compact Disc）、ＤＶＤ（Digital Video Disc）などのコンピュータ読み取り可能なプログラム記録媒体や、外部の装置（例えば、ＡＳＰ（アプリケーション・サービス・プロバイダ）のサーバなど）から提供され、これを主メモリに乗せる構成であっても良い。

図１に示すように、会話制御装置１は、入力部１００と、音声認識部２００と、会話制御部３００と、文解析部４００と、会話データベース５００と、出力部６００と、音声認識辞書記憶部７００とを備えている。

［１．１．１．入力部］
入力部１００は、利用者から入力された入力情報（ユーザ発話）を取得するものである。入力部１００は、取得した発話内容に対応する音声を音声信号として音声認識部２００に出力する。なお、入力部１００は必ずしも、音声を扱うものに限られる必要はなく、キーボードや、タッチパネルなどの文字入力を扱うものであってもかまわない。この場合には後述する音声認識部２００をもうける必要はない。

［１．１．２．音声認識部］
音声認識部２００は、入力部１００で取得した発話内容に基づいて、発話内容に対応する文字列を特定するものである。具体的には、入力部１００から音声信号が入力された音声認識部２００は、入力された音声信号に基づいて、この音声信号を、音声認識辞書記憶部７００に格納されている辞書および会話データベース５００と照合して、音声信号から推測される音声認識結果を出力する。なお、図１に示す構成例では、音声認識部２００は、会話制御部３００に会話データベース５００の記憶内容の取得を要求し、会話制御部３００が要求に応じて取得した会話データベース５００の記憶内容を受け取るようになっているが、音声認識部２００が直接会話データベース５００の記憶内容を取得して音声信号との比較を行う構成であってもかまわない。

［１．１．２．１．音声認識部の構成例］
図２に、音声認識部２００の構成例を示す機能ブロック図を示す。音声認識部２００は、特徴抽出部２００Ａと、バッファメモリ（ＢＭ）２００Ｂと、単語照合部２００Ｃと、バッファメモリ（ＢＭ）２００Ｄと、候補決定部２００Ｅと、単語仮説絞込部２００Ｆを有している。単語照合部２００Ｃ及び単語仮説絞込部２００Ｆは音声認識辞書記憶部７００に接続されており、候補決定部２００Ｅは会話データベース５００に接続されている。

単語照合部２００Ｃに接続された音声認識辞書記憶部７００は、音素隠れマルコフモデル（以下、隠れマルコフモデルをＨＭＭという。）を記憶している。音素ＨＭＭは、各状態を含んで表され、各状態はそれぞれ以下の情報を有する。（ａ）状態番号、（ｂ）受理可能なコンテキストクラス、（ｃ）先行状態、及び後続状態のリスト、（ｄ）出力確率密度分布のパラメータ、及び（ｅ）自己遷移確率及び後続状態への遷移確率から構成されている。なお、本実施形態において用いる音素ＨＭＭは、各分布がどの話者に由来するかを特定する必要があるため、所定の話者混合ＨＭＭを変換して生成する。ここで、出力確率密度関数は３４次元の対角共分散行列をもつ混合ガウス分布である。また、単語照合部２００Ｃに接続された音声認識辞書記憶部７００は単語辞書を記憶している。単語辞書は、音素ＨＭＭの各単語毎にシンボルで表した読みを示すシンボル列を格納する。

話者の発声音声はマイクロホンなどに入力されて音声信号に変換された後、特徴抽出部２００Ａに入力される。特徴抽出部２００Ａは、入力された音声信号をＡ／Ｄ変換した後、特徴パラメータを抽出し、これを出力する。特徴パラメータを抽出し、これを出力する方法としては様々なものが考えられるが、例えば一例としては、ＬＰＣ分析を実行し、対数パワー、１６次ケプストラム係数、Δ対数パワー及び１６次Δケプストラム係数を含む３４次元の特徴パラメータを抽出する方法などが挙げられる。抽出された特徴パラメータの時系列はバッファメモリ（ＢＭ）２００Ｂを介して単語照合部２００Ｃに入力される。

単語照合部２００Ｃは、ワン−パス・ビタビ復号化法を用いて、バッファメモリ２００Ｂを介して入力される特徴パラメータのデータに基づいて、音声認識辞書記憶部７００に記憶された音素ＨＭＭと単語辞書とを用いて単語仮説を検出し、尤度を計算して出力する。ここで、単語照合部２００Ｃは、各時刻の各ＨＭＭの状態毎に、単語内の尤度と発声開始からの尤度を計算する。尤度は、尤度の計算対象となる単語の識別番号、その単語の発声開始時刻、その単語に先行して発声されている先行単語の違い毎に個別にもつ。また、計算処理量の削減のために、音素ＨＭＭ及び単語辞書とに基づいて計算される総尤度のうちの低い尤度のグリッド仮説を削減するようにしてもよい。単語照合部２００Ｃは、検出した単語仮説とその尤度の情報を発声開始時刻からの時間情報（具体的には、例えばフレーム番号）とともにバッファメモリ２００Ｄを介して候補決定部２００Ｅ及び単語仮説絞込部２００Ｆに出力する。

候補決定部２００Ｅは、会話制御部３００を参照して、検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定し、一致するものがある場合は、その一致する単語仮説を認識結果として出力し、一方一致するものがない場合は、単語仮説絞込部２００Ｆに単語仮説の絞込を行うよう要求する。

候補決定部２００Ｅの動作例を説明する。今、単語照合部２００Ｃが複数の単語仮説「カンタク」「カタク」「カントク」およびその尤度（認識率）を出力し、所定の談話空間は「映画」に関するものでありその話題特定情報には「カントク（監督）」は含まれているが、「カンタク（干拓）」及び「カタク（仮託）」は含まれていないとする。また「カンタク」「カタク」「カントク」の尤度（認識率）は「カンタク」が最も高く「カントク」は最も低く、「カタク」は両者の中間であったとする。

上記の状況において、候補決定部２００Ｅは、検出した単語仮説と所定の談話空間内の話題特定情報とを比較して、単語仮説「カントク」が、所定の談話空間内の話題特定情報と一致するものであると判定し、単語仮説「カントク」を認識結果として出力し、会話制御部３００に渡す。このように処理することにより、現在扱われている話題「映画」に関連した「カントク（監督）」が、より上位の尤度（認識率）を有する単語仮説「カンタク」「カタク」に優先されて選択され、その結果会話の文脈に即した音声認識結果を出力することが可能となる。

一方、一致するものがない場合は、候補決定部２００Ｅからの単語仮説の絞込を行う要求に応じて単語仮説絞込部２００Ｆが認識結果を出力するよう動作する。単語仮説絞込部２００Ｆは、単語照合部２００Ｃからバッファメモリ２００Ｄを介して出力される複数個の単語仮説に基づいて、音声認識辞書記憶部７００に記憶された統計的言語モデルを参照して、終了時刻が等しく開始時刻が異なる同一の単語の単語仮説に対して、当該単語の先頭音素環境毎に、発声開始時刻から当該単語の終了時刻に至る計算された総尤度のうちの最も高い尤度を有する１つの単語仮説で代表させるように単語仮説の絞り込みを行った後、絞り込み後のすべての単語仮説の単語列のうち、最大の総尤度を有する仮説の単語列を認識結果として出力する。本実施形態においては、好ましくは、処理すべき当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の２つの音素とを含む３つの音素並びをいう。

単語仮説絞込部２００Ｆによる単語絞込処理の例を図３を参照しながら説明する。図３は、単語仮説絞込部２００Ｆの処理の一例を示すタイミングチャートである。

例えば（ｉ−１）番目の単語Ｗi-１の次に、音素列ａ１，ａ２，…，ａnからなるｉ番目の単語Ｗiがくるときに、単語Ｗi-１の単語仮説として６つの仮説Ｗａ，Ｗｂ，Ｗｃ，Ｗｄ，Ｗｅ，Ｗｆが存在しているとする。ここで、前者３つの単語仮説Ｗａ，Ｗｂ，Ｗｃの最終音素は／ｘ／であるとし、後者３つの単語仮説Ｗｄ，Ｗｅ，Ｗｆの最終音素は／ｙ／であるとする。終了時刻ｔeにおいて単語仮説Ｗａ，Ｗｂ，Ｗｃを前提とする３つの仮説と、単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする１の仮説が残っているものとすると、先頭音素環境が等しい前者３つ仮説のうち、総尤度が最も高い仮説一つを残し、その他を削除する。

なお、単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする仮説は先頭音素環境が他の３つの仮説と違うため、すなわち、先行する単語仮説の最終音素がｘではなくｙであるため、この単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする仮説は削除しない。すなわち、先行する単語仮説の最終音素毎に１つのみ仮説を残す。

以上の実施形態においては、当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の２つの音素とを含む３つの音素並びとして定義されているが、本発明はこれに限らず、先行する単語仮説の最終音素と、最終音素と連続する先行する単語仮説の少なくとも１つの音素とを含む先行単語仮説の音素列と、当該単語の単語仮説の最初の音素を含む音素列とを含む音素並びとしてもよい。
以上の実施の形態において、特徴抽出部２００Ａと、単語照合部２００Ｃと、候補決定部２００Ｅと、単語仮説絞込部２００Ｆは、例えば、マイクロコンピュータなどのコンピュータで構成され、バッファメモリ２００Ｂ，２００Ｄと、音声認識辞書記憶部７００とは、例えばハードデイスクメモリなどの記憶装置で構成される。

以上実施形態においては、単語照合部２００Ｃ、単語仮説絞込部２００Ｆとを用いて音声認識を行っているが、本発明はこれに限らず、例えば、音素ＨＭＭを参照する音素照合部と、例えばＯｎｅＰａｓｓＤＰアルゴリズムを用いて統計的言語モデルを参照して単語の音声認識を行う音声認識部とで構成してもよい。
また、本実施の形態では、音声認識部２００は会話制御装置１の一部分として説明するが、音声認識部２００、音声認識辞書記憶部７００、及び会話データベース５００より構成される、独立した音声認識装置とすることも可能である。

［１．１．２．２．音声認識部の動作例］
つぎに図４を参照しながら音声認識部２００の動作について説明する。図４は、音声認識部２００の動作例を示すフローチャートである。入力部１００より音声信号を受け取ると、音声認識部２００は入力された音声の特徴分析を行い、特徴パラメータを生成する（ステップＳ４０１）。次に、この特徴パラメータと音声認識辞書記憶部７００に記憶された音素ＨＭＭ及び言語モデルとを比較して、所定個数の単語仮説及びその尤度を取得する（ステップＳ４０２）。次に、音声認識部２００は、取得した所定個数の単語仮説と検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定する（ステップＳ４０３、Ｓ４０４）。一致するものがある場合は、音声認識部２００はその一致する単語仮説を認識結果として出力する（ステップＳ４０５）。一方、一致するものがない場合は、音声認識部２００は取得した単語仮説の尤度に従って、最大尤度を有する単語仮説を認識結果として出力する（ステップＳ４０６）。

［１．１．３．音声認識辞書記憶部］
再び、図１に戻って、会話制御装置１の構成例の説明を続ける。
音声認識辞書記憶部７００は、標準的な音声信号に対応する文字列を格納するものである。この照合をした音声認識部２００は、その音声信号に対応する単語仮説に対応する文字列を特定し、その特定した文字列を文字列信号として会話制御部３００に出力する。

［１．１．４．文解析部］
次に、図５を参照しながら文解析部４００の構成例について説明する。図５は、会話制御装置１の部分拡大ブロック図であって、会話制御部３００及び文解析部４００の具体的構成例を示すブロック図である。なお、図５においては、会話制御部３００、文解析部４００、および会話データベース５００のみ図示しており、その他の構成要素は表示を省略している。

文解析部４００は、入力部１００又は音声認識部２００で特定された文字列を解析するものである。この文解析部４００は、本実施の形態では、図５に示すように、文字列特定部４１０と、形態素抽出部４２０と、形態素データベース４３０と、入力種類判定部４４０と、発話種類データベース４５０とを有している。文字列特定部４１０は、入力部１００及び音声認識部２００で特定された一連の文字列を一文節毎に区切るものである。この一文節とは、文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切り文を意味する。具体的に、文字列特定部４１０は、一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部４１０は、その区切った各文字列を形態素抽出部４２０及び入力種類判定部４４０に出力する。尚、以下で説明する「文字列」は、一文節毎の文字列を意味するものとする。

［１．１．４．１．形態素抽出部］
形態素抽出部４２０は、文字列特定部４１０で区切られた一文節の文字列に基づいて、その一文節の文字列の中から、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するものである。ここで、形態素とは、本実施の形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、例えば、名詞、形容詞、動詞などの品詞が挙げられる。

各形態素は、図６に示すように、本実施の形態ではm１、m２、m３…、と表現することができる。図６は、文字列とこの文字列から抽出される形態素との関係を示す図である。図６に示すように、文字列特定部４１０から文字列が入力された形態素抽出部４２０は、入力された文字列と、形態素データベース４３０に予め格納されている形態素群（この形態素群は、それぞれの品詞分類に属する各形態素についてその形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として用意されている）とを照合する。その照合をした形態素抽出部４２０は、その文字列の中から、予め記憶された形態素群のいずれかと一致する各形態素（m１、m２、…）を抽出する。この抽出された各形態素を除いた要素（n１、n２、n３…）は、例えば助動詞等が挙げられる。

この形態素抽出部４２０は、抽出した各形態素を第一形態素情報として話題特定情報検索蔀３２０に出力する。なお、第一形態素情報は構造化されている必要はない。ここで「構造化」とは、文字列の中に含まれる形態素を品詞等に基づいて分類し配列することをいい、たとえば発話文である文字列を、「主語＋目的語＋述語」などの様に、所定の順番で形態素を配列してなるデータに変換することを言う。もちろん、構造化した第一形態素情報を用いたとしても、それが本実施の形態を実現をさまたげることはない。

［１．１．４．２．入力種類判定部］
入力種類判定部４４０は、文字列特定部４１０で特定された文字列に基づいて、発話内容の種類（発話種類）を判定するものである。この発話種類は、発話内容の種類を特定する情報であって、本実施の形態では、例えば図７に示す「発話文のタイプ」を意味する。図７は、「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図である。

ここで、「発話文のタイプ」は、本実施の形態では、図７に示すように、陳述文（D ; Declaration）、時間文（T ; Time）、場所文（L ; Location）、反発文（N ; Negation）などから構成される。この各タイプから構成される文は、肯定文又は質問文で構成される。「陳述文」とは、利用者の意見又は考えを示す文を意味するものである。この陳述文は本実施の形態では、図７に示すように、例えば"私は佐藤が好きです"などの文が挙げられる。「場所文」とは、場所的な概念を伴う文を意味するものである。「時間文」とは、時間的な概念を伴う文を意味するものである。「反発文」とは、陳述文を否定するときの文を意味する。「発話文のタイプ」についての例文は図７に示す通りである。

入力種類判定部４４０が「発話文のタイプ」を判定するには、入力種類判定部４４０は、本実施の形態では、図８に示すように、陳述文であることを判定するための定義表現辞書、反発文であることを判定するための反発表現辞書等を用いる。具体的に、文字列特定部４１０から文字列が入力された入力種類判定部４４０は、入力された文字列に基づいて、その文字列と発話種類データベース４５０に格納されている各辞書とを照合する。その照合をした入力種類判定部４４０は、その文字列の中から、各辞書に関係する要素を抽出する。

この入力種類判定部４４０は、抽出した要素に基づいて、「発話文のタイプ」を判定する。例えば、入力種類判定部４４０は、ある事象について陳述している要素が文字列の中に含まれる場合には、その要素が含まれている文字列を陳述文として判定する。入力種類判定部４４０は、判定した「発話文のタイプ」を回答取得部３８０に出力する。

［１．１．５．会話データベース］
次に、会話データベース５００が記憶するデータのデータ構成例について図９を参照しながら説明する。図９は、会話データベース５００が記憶するデータの構成例を示す概念図である。

会話データベース５００は、図９に示すように、話題を特定するための話題特定情報８１０を予め複数記憶している。又、それぞれの話題特定情報８１０は、他の話題特定情報８１０と関連づけられていてもよく、例えば、図９に示す例では、話題特定情報Ｃ（８１０）が特定されると、この話題特定情報Ｃ（８１０）に関連づけられている他の話題特定情報Ａ（８１０）、話題特定情報Ｂ（８１０），話題特定情報Ｄ（８１０）が定まるように記憶されている。

具体的には、話題特定情報８１０は、本実施の形態では、利用者から入力されると予想される入力内容、又は利用者への回答文に関連性のある「キーワード」を意味する。

話題特定情報８１０には、一又は複数の話題タイトル８２０が対応付けられて記憶されている。話題タイトル８２０は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成されている。各話題タイトル８２０には、利用者への回答文８３０が対応付けられて記憶されている。また、回答文８３０の種類を示す複数の回答種類は、回答文８３０に対応付けられている。

次に、ある話題特定情報８１０と他の話題特定情報８１０との関連づけについて説明する。図１０は、ある話題特定情報８１０Ａと他の話題特定情報８１０Ｂ、８１０Ｃ_１〜８１０Ｃ_４、８１０Ｄ_１〜８１０Ｄ_３…との関連付けを示す図である。なお、以下の説明において「関連づけされて記憶される」とは、ある情報Ｘを読み取るとその情報Ｘに関連づけられている情報Ｙを読み取りできることをいい、例えば、情報Ｘのデータの中に情報Ｙを読み出すための情報（例えば、情報Ｙの格納先アドレスを示すポインタ、情報Ｙの格納先物理メモリアドレス、論理アドレスなど）が格納されている状態を、「情報Ｙが情報Ｘに『関連づけされて記憶され』ている」というものとする。

図１０に示す例では、話題特定情報は他の話題特定情報との間で上位概念、下位概念、同義語、対義語（本図の例では省略）が関連づけされて記憶させることができる。本図に示す例では、話題特定情報８１０Ａ（＝「映画」）に対する上位概念の話題特定情報として話題特定情報８１０Ｂ（＝「娯楽」）が話題特定情報８１０Ａに関連づけされて記憶されており、たとえば話題特定情報（「映画」）に対して上の階層に記憶される。

また、話題特定情報８１０Ａ（＝「映画」）に対する下位概念の話題特定情報８１０Ｃ_１（＝「監督」）、話題特定情報８１０Ｃ_２（＝「主演」）、話題特定情報８１０Ｃ_３（＝「配給会社」）、話題特定情報８１０Ｃ_４（＝「上映時間」）、および話題特定情報８１０Ｄ_１（＝「七人の侍」）、話題特定情報８１０Ｄ_２（＝「乱」）、話題特定情報８１０Ｄ_３（＝「用心棒」）、…、が話題特定情報８１０Ａに関連づけされて記憶されている。

又、話題特定情報８１０Ａには、同義語９００が関連付けられている。この例では、話題特定情報８１０Ａであるキーワード「映画」の同義語として「作品」、「内容」、「シネマ」が記憶されている様子を示している。このような同意語を定めることにより、発話にはキーワード「映画」は含まれていないが「作品」、「内容」、「シネマ」が発話文等に含まれている場合に、話題特定情報８１０Ａが発話文等に含まれているものとして取り扱うことを可能とする。

本実施の形態にかかる会話制御装置１は、会話データベース５００の記憶内容を参照することにより、ある話題特定情報８１０を特定するとその話題特定情報８１０に関連づけられて記憶されている他の話題特定情報８１０及びその話題特定情報８１０の話題タイトル８２０、回答文８３０などを高速で検索・抽出することが可能となる。

次に、話題タイトル８２０（「第二形態素情報」ともいう）のデータ構成例について、図１１を参照しながら説明する。図１１は、話題タイトル８２０のデータ構成例を示す図である。

話題特定情報８１０Ｄ_１、８１０Ｄ_２、８１０Ｄ_３、…はそれぞれ複数の異なる話題タイトル８２０_１、８２０_２、…、話題タイトル８２０_３、８２０_４、…、話題タイトル８２０_５、８２０_６、…を有している。本実施の形態では、図１１に示すように、それぞれの話題タイトル８２０は、第一特定情報１００１と、第二特定情報１００２と、第三特定情報１００３によって構成される情報である。ここで、第一特定情報１００１は、本実施の形態では、話題を構成する主要な形態素を意味するものである。第一特定情報１００１の例としては、例えば文を構成する主語が挙げられる。また、第二特定情報１００２は、本実施の形態では、第一特定情報１００１と密接な関連性を有する形態素を意味するものである。この第二特定情報１００２は、例えば目的語が挙げられる。更に、第三特定情報１００３は、本実施の形態では、ある対象についての動きを示す形態素、又は名詞等を修飾する形態素を意味するものである。この第三特定情報１００３は、例えば動詞、副詞又は形容詞が挙げられる。なお、第一特定情報１００１、第二特定情報１００２、第三特定情報１００３それぞれの意味は上述の内容に限定される必要はなく、別の意味（別の品詞）を第一特定情報１００１、第二特定情報１００２、第三特定情報１００３に与えても、これらから文の内容を把握可能な限り、本実施の形態は成立する。

例えば、主語が「七人の侍」、形容詞が「面白い」である場合には、図１１に示すように、話題タイトル（第二形態素情報）８２０_２は、第一特定情報１００１である形態素「七人の侍」と、第三特定情報１００３である形態素「面白い」とから構成されることになる。なお、この話題タイトル８２０_２には第二特定情報１００２に該当する形態素は含まれておらず、該当する形態素がないことを示すための記号「＊」が第二特定情報１００２として格納されている。

なお、この話題タイトル８２０_２（七人の侍；＊；面白い）は、「七人の侍は面白い」の意味を有する。この話題タイトル８２０を構成する括弧内は、以下では左から第一特定情報１００１、第二特定情報１００２、第三特定情報１００３の順番となっている。また、話題タイトル８２０のうち、第一から第三特定情報に含まれる形態素がない場合には、その部分については、「＊」を示すことにする。

なお、上記話題タイトル８２０を構成する特定情報は、上記のような第一から第三特定情報のように三つに限定されるものではなく、例えば更に他の特定情報（第四特定情報、およびそれ以上）を有するようにしてもよい。

次に、回答文８３０について図１２を参照して説明する。回答文８３０は、図１２に示すように、本実施の形態では、利用者から発話された発話文のタイプに対応した回答をするために、陳述（D ; Declaration）、時間（T ; Time）、場所（L ; Location）、否定（N ; Negation）などのタイプ（回答種類）に分類されて、各タイプごとに用意されている。また肯定文は「Ａ」とし、質問文は「Ｑ」とする。

話題特定情報８１０のデータ構成例について、図１３を参照して説明する。図１３は、ある話題特定情報８１０「佐藤」に対応付けされた話題タイトル８２０，回答文８３０の具体例を示す。
話題特定情報８１０「佐藤」には、複数の話題タイトル（８２０）１−１、１−２、…が対応付けされている。それぞれの話題タイトル（８２０）１−１，１−２，…には回答文（８３０）１−１，１−２、…が対応付けされて記憶されている。回答文８３０は、回答種類８４０ごとに用意されている。

話題タイトル（８２０）１−１が(佐藤；＊；好き){これは、「佐藤が好きです」に含まれる形態素を抽出したもの}である場合には、その話題タイトル（８２０）１-１に対応する回答文（８３０）１−１は、(DA；陳述肯定文「私も佐藤が好きです」)、(TA；時間肯定文「私は打席に立ったときの佐藤が好きです」)などが挙げられる。後述する回答取得部３８０は、入力種類判定部４４０の出力を参照しながらその話題タイトル８２０に対応付けられた一の回答文８３０を取得する。

各回答文には、当該回答文に対応するように、ユーザ発話に対して優先的に出力される回答文（「次回答文」とよぶ）を指定する情報である次プラン指定情報８４０が定められている。次プラン指定情報８４０は、次回答文を特定できる情報であれば、どのような情報であってもよく、たとえば、会話データベース５００に格納されているすべての回答文から少なくとも一つの回答文を特定できる回答文ＩＤ、などである。

なお、本実施の形態においては、次プラン指定情報８４０は、回答文単位で次回答文を特定する情報（例えば、回答文ＩＤ）として説明するが、次プラン指定情報８４０は、話題タイトル８２０、話題特定情報８１０単位で、次回答文（この場合には、複数の回答文が次回答文として指定されるので、次回答文群とよぶ。ただし、実際に回答文として出力されるのは、この回答文群に含まれるいずれかの回答文となる）を特定する情報であってもかまわない。たとえば、話題タイトルＩＤ、話題特定情報ＩＤを時プラン指定情報として使用しても本実施の形態は成立する。

［１．１．６．会話制御部］
ここで図５に戻り、会話制御部３００の構成例を説明する。
会話制御部３００は、会話制御装置１内の各構成要素（音声認識部２００，文解析部４００、会話データベース５００，出力部６００，音声認識辞書記憶部７００）間のデータの受け渡しを制御するとともに、ユーザ発話に応答する回答文の決定、出力を行う機能を有する。

会話制御部３００は、本実施の形態では、図５に示すように、管理部３１０と、プラン会話処理部３２０と，談話空間会話制御処理部３３０と、CA会話処理部３４０とを有している。以下これらの構成要素について説明する。
［１．１．６．１．管理部］
管理部３１０は談話履歴を記憶し、且つ必要に応じて更新する機能を有する。管理部３１０は話題特定情報検索部３５０と、省略文補完部３６０と、話題検索部３７０と、回答取得部３８０からの要求に応じて、記憶している談話履歴の全部又は一部をこれら各部に渡す機能を有する。

［１．１．６．２．プラン会話処理部］
プラン会話処理部３２０は、プランを実行し、プランに従った会話をユーザとの間で成立させる機能を有する。「プラン」とは、予め定めた順番に従って予め定めた回答をユーザに提供することをいう。以下、プラン会話処理部３２０について説明する。

プラン会話処理部３２０は、ユーザ発話に応じて、予め定めた順番に従って予め定めた回答を出力する機能を有する。

図１４は、プランを説明するための概念図である。図１４に示すように、プラン空間１４０１には複数のプラン１、プラン２，プラン３、プラン４など様々なプラン１４０２があらかじめ準備されている。プラン空間１４０１とは、会話データベース５００に格納された複数のプラン１４０２の集合をいう。会話制御装置１は、装置起動時若しくは会話開始時にあらかじめ開始用に定められたプランを選択し、若しくは各ユーザ発話の内容に応じて、プラン空間１４０１の中から適宜いずれかのプラン１４０２を選択し、選択したプラン１４０２を用いてユーザ発話に対する回答文の出力を行う。

図１５は、プラン１４０２の構成例を示す図である。プラン１４０２は、回答文１５０１と、これに関連づけられた次プラン指定情報１５０２を有している。次プラン指定情報１５０２は、当該プラン１４０２に含まれる回答文１５０１の次に、ユーザに出力する予定の回答文（次候補回答文と呼ぶ）を含むプラン１４０２を特定する情報である。この例では、プラン１は、プラン１実行時に会話制御装置１が出力する回答文Ａ（１５０１）と、この回答文Ａ（１５０１）に関連づけられた次プラン指定情報１５０２とを有している。次プラン指定情報１５０２は、回答文Ａ（１５０１）についての次候補回答文である回答文Ｂ（１５０１）を有するプラン１４０２を特定する情報「ＩＤ：００２」である。同様に、回答文Ｂ（１５０１）についても、次プラン指定情報１５０２が定められており、回答文Ｂ（１５０１）が出力された場合に、次候補回答文を含むプラン２（１４０２）が指定される。このように、プラン１４０２は次プラン指定情報１５０２により連鎖的につながり、一連の連続した内容をユーザに出力するというプラン会話を実現する。すなわち、ユーザに伝えたい内容（説明文、案内文、アンケート、など）を複数の回答文に分割し、かつ各回答文の順番を予め定めてプランとして準備しておくことにより、ユーザの発話に応じてこれら回答文を順番にユーザに提供することが可能となる。なお、次プラン指定情報１５０２によって指定されたプラン１４０２に含まれる回答文１５０１は、直前の回答文の出力に応答するユーザ発話があれば、必ずしも直ちに出力される必要はなく、ユーザと会話制御装置１との間で、当該プラントは別の話題についての会話を挟んだ後に、次プラン指定情報１５０２によって指定されたプラン１４０２に含まれる回答文１５０１が出力されることもあり得る。

なお、図１５に示す回答文１５０１は、図１３に示す回答文８３０の中のいずれか一の回答文文字列に対応し、また図１５に示す次プラン指定情報１５０２は、図１３に示す次プラン指定情報８４０に対応している。

なお、プラン１４０２のつながりは、図１５に示すような一次元的配列に限られるものではない。図１６は、図１５とは別のつながり方を有するプラン１４０２の例を示す図である。図１６に示す例では、プラン１（１４０２）は次候補回答文となる２つの回答文１５０１，すなわちプラン１４０２を指定できるよう、２つの次プラン指定情報１５０２を有している。ある回答文Ａ（１５０１）を出力した場合の次候補回答文を有するプラン１４０２として、回答文Ｂ（１５０１）を有するプラン２（１４０２）、及び回答文Ｃ（１５０１）を有するプラン３（１４０２）の２つのプラン１４０２が定まるよう、次プラン指定情報１５０２が２つ設けられる。なお、回答文Ｂ、回答文Ｃは選択的・択一的であり、一方が出力された場合は他方は出力されず、当該プラン１（１４０２）は終了する。このように、プラン１４０２のつながりは一次元的順列の形態に限定されるものではなく、樹形図的な連結、網的な連結であってもかまわない。

なお、各プランがいくつの次候補回答文を有するかは限定されるものではない。また、話の終了となるプラン１４０２については、次プラン指定情報１５０２が存在しないこともあり得る。

図１７に、ある一連のプラン１４０２の具体例を示す。この一連のプラン１４０２_１〜１４０２_４は、危機管理に関する情報をユーザに知らせるための４つの回答文１５０１_１〜１５０１_４に対応している。４つの回答文１５０１_１〜１５０１_４は全部で一つのまとまりのある話（説明文章）を構成する。各プラン１４０２_１〜１４０２_４はそれぞれ「１０００−０１」「１０００−０２」「１０００−０３」「１０００−０４」というＩＤデータ１７０２_１〜１７０２_４を有している。なお、ＩＤデータ中のハイフン以下の番号は、出力の順番を示す情報である。また、各プラン１４０２_１〜１４０２_４はそれぞれ次プラン指定情報１５０２_１〜１５０２_４を有している。次プラン指定情報１５０２_４の内容は、「１０００−０Ｆ」というデータであるが、このハイフン以下の番号「０Ｆ」は、次に出力する予定のプランは存在せず、当該回答文が一連の話（説明文章）の終わりであることを示す情報である。

この例では、ユーザ発話が「大地震が発生したときの危機管理を教えて」である場合に、プラン会話処理部３２０がこの一連のプランを実行開始する。すなわち、ユーザ発話「大地震が発生したときの危機管理を教えて」をプラン会話処理部３２０が受け付けると、プラン会話処理部３２０はプラン空間１４０１を検索して、ユーザ発話「大地震が発生したときの危機管理を教えて」に対応する回答文１５０１_１を有するプラン１４０２があるかどうかを調べる。この例では、「大地震が発生したときの危機管理を教えて」に対応するユーザ発話文字列１７０１_１が、プラン１４０２_１に対応するものとする。

プラン会話処理部３２０はプラン１４０２_１を発見すると、そのプラン１４０２_１に含まれる回答文１５０１_１を取得し、この回答文１５０１_１をユーザ発話に対する回答として出力するとともに、次プラン指定情報１５０２_１により次候補回答文を特定する。

つぎに、回答文１５０１_１の出力後に入力部１００や音声認識部２００などを介してユーザ発話を受け付けると、プラン会話処理部３２０は、プラン１４０２_２の実行を行う。すなわち、プラン会話処理部３２０は、次プラン指定情報１５０２_１により指定されたプラン１４０２_２の実行、すなわち２番目の回答文１５０１_２を出力するか否かを判定する。具体的には、プラン会話処理部３２０は当該回答文１５０１_２に対応づけられたユーザ発話文字列（用例文ともいう）１７０１_２、あるいは話題タイトル８２０（図１７において図略）と、受け付けたユーザ発話とを比較し、これらが一致するか否かを判定する。一致する場合には、２番目の回答文１５０１_２を出力する。また、２番目の回答文１５０１_２を含むプラン１４０２_２には、次プラン指定情報１５０２_２が記述されているので、次候補回答文が特定される。

同様に、これ以降継続して成されるユーザ発話に応じて、プラン会話処理部３２０はプラン１４０２_３、プラン１４０２_４に順に移行して、３番目の回答文１５０１_３、４番目の回答文１５０１_３の出力を行うことができる。なお、４番目の回答文１５０１_４は最終回答文であり、４番目の回答文１５０１_４の出力が完了すると、プラン会話処理部３２０はプラン実行を終了する。

このように、プラン１４０２_１〜１４０２_４を次々と実行することにより、あらかじめ用意した会話内容を定めた順番通りにユーザに提供することが可能となる。

［１．１．６．３．談話空間会話制御処理部］
図５に戻り、会話制御部３００の構成例の説明を続ける。
談話空間会話制御処理部３３０は、話題特定情報検索部３５０と、省略文補完部３６０と、話題検索部３７０と、回答取得部３８０とを有している。前記管理部３１０は、会話制御部３００の全体を制御するものである。

「談話履歴」とは、ユーザと会話制御装置１間の会話の話題や主題を特定する情報であって、談話履歴は後述する「着目話題特定情報」「着目話題タイトル」「利用者入力文話題特定情報」「回答文話題特定情報」の少なくともいずれか一つを含む情報である。また、談話履歴に含まれる「着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」は直前の会話によって定められたものに限定されず、過去の所定期間の間に着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」となったもの、若しくはそれらの累積的記録であってもよい。

以下、談話空間会話制御処理部３３０を構成するこれら各部について説明する。
［１．１．６．３．１．話題特定情報検索部］
話題特定情報検索部３５０は、形態素抽出部４２０で抽出された第一形態素情報と各話題特定情報とを照合し、各話題特定情報の中から、第一形態素情報を構成する形態素と一致する話題特定情報を検索するものである。具体的に、話題特定情報検索部３５０は、形態素抽出部４２０から入力された第一形態素情報が「佐藤」及び「好き」の二つの形態素で構成される場合には、入力された第一形態素情報と話題特定情報群とを照合する。

この照合をした話題特定情報検索部３２０は、着目話題タイトル８２０focus（前回までに検索された話題タイトル、他の話題タイトルと区別するため８２０focusと表記する）に第一形態素情報を構成する形態素（例えば「佐藤」）が含まれているときは、その着目話題タイトル８２０focusを回答取得部３８０に出力する。一方、着目話題タイトル８２０focusに第一形態素情報を構成する形態素が含まれていないときは、話題特定情報検索部３５０は、第一形態素情報に基づいて利用者入力文話題特定情報を決定し、入力された第一形態素情報及び利用者入力文話題特定情報を省略文補完部３６０に出力する。なお、「利用者入力文話題特定情報」は、第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する形態素に相当する話題特定情報、若しくは第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する可能性がある形態素に相当する話題特定情報をいう。

［１．１．６．３．２．省略文補完部］
省略文補完部３６０は、前記第一形態素情報を、前回までに検索された話題特定情報８１０（以下、「着目話題特定情報」と呼ぶ）及び前回の回答文に含まれる話題特定情報８１０（以下、「回答文話題特定情報」と呼ぶ）を利用して、補完することにより複数種類の補完された第一形態素情報を生成する。例えばユーザ発話が「好きだ」という文であった場合、省略文補完部３６０は、着目話題特定情報「佐藤」を、第一形態素情報「好き」に含めて、補完された第一形態素情報「佐藤、好き」を生成する。

すなわち、第一形態素情報を「Ｗ」、着目話題特定情報や回答文話題特定情報の集合を「Ｄ」とすると、省略文補完部３６０は、第一形態素情報「Ｗ」に集合「Ｄ」の要素を含めて、補完された第一形態素情報を生成する。

これにより、第一形態素情報を用いて構成される文が、省略文であって日本語として明解でない場合などにおいて、省略文補完部３６０は、集合「Ｄ」を用いて、その集合「Ｄ」の要素(例えば、"佐藤")を第一形態素情報「Ｗ」に含めることができる。この結果、省略文補完部３６０は、第一形態素情報「好き」を補完された第一形態素情報「佐藤、好き」にすることができる。なお、補完された第一形態素情報「佐藤、好き」は、「佐藤が好きだ」というユーザ発話に対応する。

すなわち、省略文補完部３６０は、利用者の発話内容が省略文である場合などであっても、集合「Ｄ」を用いて省略文を補完することができる。この結果、省略文補完部３６０は、第一形態素情報から構成される文が省略文であっても、その文が適正な日本語となるようにすることができる。

また、省略文補完部３６０が、前記集合「Ｄ」に基づいて、補完後の第一形態素情報に一致する話題タイトル８２０を検索する。補完後の第一形態素情報に一致する話題タイトル８２０を発見した場合は、省略文補完部３６０はこの話題タイトル８２０を回答取得部３８０に出力する。回答取得部３８０は、省略文補完部３６０で検索された適切な話題タイトル８２０に基づいて、利用者の発話内容に最も適した回答文８３０を出力することができる。

尚、省略文補完部３６０は、集合「Ｄ」の要素を第一形態素情報に含めるだけに限定されるものではない。この省略文補完部３６０は、着目話題タイトルに基づいて、その話題タイトルを構成する第一特定情報、第二特定情報又は第三特定情報のいずれかに含まれる形態素を、抽出された第一形態素情報に含めても良い。

［１．１．６．３．３．話題検索部］
話題検索部３７０は、省略文補完部３６０で話題タイトル８１０が決まらなかったとき、第一形態素情報と、利用者入力文話題特定情報に対応する各話題タイトル８１０とを照合し、各話題タイトル８１０の中から、第一形態素情報に最も適する話題タイトル８１０を検索するものである。
具体的に、省略文補完部３６０から検索命令信号が入力された話題検索部３７０は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトルの中から、その第一形態素情報に最も適した話題タイトル８１０を検索する。話題検索部３７０は、その検索した話題タイトル８１０を検索結果信号として回答取得部３８０に出力する。

先に掲げた図１３は、ある話題特定情報８１０（＝「佐藤」）に対応付けされた話題タイトル８２０，回答文８３０の具体例を示す。図１３に示すように、例えば、話題検索部３７０は、入力された第一形態素情報「佐藤、好き」に話題特定情報８１０（＝「佐藤」）が含まれるので、その話題特定情報８１０（＝「佐藤」）を特定し、次に、その話題特定情報８１０（＝「佐藤」）に対応付けられた各話題タイトル（８２０）１-１,１-２,…と入力された第一形態素情報「佐藤、好き」とを照合する。
話題検索部３７０は、その照合結果に基づいて、各話題タイトル（８２０）１-１〜１-２の中から、入力された第一形態素情報「佐藤、好き」と一致する話題タイトル（８２０）１-１(佐藤；＊；好き)を特定する。話題検索部３４０は、検索した話題タイトル（８２０）１-１(佐藤；＊；好き)を検索結果信号として回答取得部３８０に出力する。

［１．１．６．３．４．回答取得部］
回答取得部３８０は、省略文補完部３６０，或いは話題検索部３７０で検索された話題タイトル８２０に基づいて、その話題タイトル８２０に対応付けられた回答文８３０を取得する。また、回答取得部３８０は、話題検索部３７０で検索された話題タイトル８２０に基づいて、その話題タイトル８２０に対応付けられた各回答種類と、入力種類判定部４４０で判定された発話種類とを照合する。その照合をした回答取得部３８０は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する。

図１３に示す例においては、回答取得部３５０は、話題検索部３７０で検索された話題タイトルが話題タイトル１-１(佐藤；＊；好き)である場合には、その話題タイトル１-１に対応付けられている回答文１-１（DA,TAなど）の中から、入力種類判定部４４０で判定された「発話文のタイプ」(例えばDA)と一致する回答種類(DA)を特定する。この回答種類(DA)を特定した回答取得部３８０は、特定した回答種類(DA)に基づいて、その回答種類(DA)に対応付けられた回答文１-１（「私も佐藤が好きです。」）を取得する。
ここで、上記"DA"、"TA"等のうち、"A"は、肯定形式を意味する。従って、発話種類及び回答種類に"A"が含まれているときは、ある事柄について肯定することを示している。また、発話種類及び回答種類には、"DQ"、"TQ"等の種類を含めることもできる。この"DQ"、"TQ"等のうち"Q"は、ある事柄についての質問を意味する。

回答種類が上記質問形式(Q)からなるときは、この回答種類に対応付けられる回答文は、肯定形式(A)で構成される。この肯定形式(A)で作成された回答文としては、質問事項に対して回答する文等が挙げられる。例えば、発話文が「あなたはスロットマシンを操作したことがありますか?」である場合には、この発話文についての発話種類は、質問形式(Q)となる。この質問形式(Q)に対応付けられる回答文は、例えば「私はスロットマシンを操作したことがあります」(肯定形式(A))が挙げられる。

一方、発話種類が肯定形式(A)からなるときは、この回答種類に対応付けられる回答文は、質問形式(Q)で構成される。この質問形式(Q)で作成された回答文としては、発話内容に対して聞き返す質問文、又は特定の事柄を聞き出す質問文等が挙げられる。例えば、発話文が「私はスロットマシンで遊ぶのが趣味です」である場合には、この発話文についての発話種類は、肯定形式(A)となる。この肯定形式(A)に対応付けられる回答文は、例えば"パチンコで遊ぶのは趣味ではないのですか?"(特定の事柄を聞き出す質問文(Q))が挙げられる。

回答取得部３８０は、取得した回答文８３０を回答文信号として管理部３１０に出力する。回答取得部３５０から回答文信号が入力された管理部３１０は、入力された回答文信号を出力部６００に出力する。

［１．１．６．４．ＣＡ会話処理部］
ＣＡ会話処理部３４０は、ユーザ発話に対して、プラン会話処理部３２０および談話空間会話制御処理部３３０のいずれにおいても回答文が決定しない場合に、ユーザ発話の内容に応じて、ユーザとの会話を継続できるような回答文を出力する機能を有する。

図１に戻り、会話制御装置１の構成例を再開する。
［１．１．７．出力部］
出力部６００は、回答取得部３８０で取得された回答文を出力するものである。この出力部６００は、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部３１０から回答文が入力された出力部６００は、入力された回答文に基づいて、音声をもってその回答文、例えば、「私も佐藤が好きです」を出力する。
以上で会話制御装置１の構成例の説明を終了する。

［２．会話制御方法］
上記構成を有する会話制御装置１は、以下のように動作することにより会話制御方法を実行する。

次に、本実施の形態にかかる会話制御装置１，より詳しくは会話制御部３００の動作について説明する。

図１８は、会話制御部３００のメイン処理の一例を示すフローチャートである。このメイン処理は、会話制御部３００がユーザ発話を受け付けるごとに実行される処理であり、このメイン処理が行われることによりユーザ発話に対する回答文の出力が行われ、ユーザと会話制御装置１間の会話（対話）が成立する。

メイン処理にはいると、会話制御部３００、より詳しくはプラン会話処理部３２０はまずプラン会話制御処理（Ｓ１８０１）を実行する。プラン会話制御処理は、プランを実行する処理である。

図１９、図２０はプラン会話制御処理の一例を示すフローチャートである。以下に図１９、図２０を参照しながら、プラン会話制御処理の例について説明する。

プラン会話制御処理を開始すると、プラン会話処理部３２０はまず、基本制御状態情報チェックを行う（Ｓ１９０１）。基本制御状態情報は、プラン１４０２の実行の完了の有無が、基本制御状態情報として所定の記憶領域に格納される。
基本制御状態情報は、プランの基本制御状態を記述する役割を有する。

図２１は、シナリオと呼ばれるタイプのプランについて生じうる４つの基本制御状態を示す図である。以下、それぞれの状態について説明する。

（１）結束
この基本制御状態は、ユーザ発話が実行中のプラン１４０２、より詳しくはプラン１４０２に対応する話題タイトル８２０や用例文１７０１に一致する場合である。この場合は、プラン会話処理部３２０は当該プラン１４０２を終了し、次プラン指定情報１５０２にて指定された回答文１５０１に対応するプラン１４０２に移行する。

（２）破棄
この基本制御状態は、ユーザ発話内容がプラン１４０２の終了を要求していると判断される場合、またはユーザの関心が実行中のプラン以外の事項に移ったと判定される場合に、設定される基本制御状態である。基本制御状態情報が破棄を示している場合は、プラン会話処理部３２０は、破棄の対象となったプラン１４０２以外にユーザ発話に対応するプラン１４０２がないかどうかを検索し、存在する場合にはそのプラン１４０２の実行を開始し、存在しない場合には、プランの実行を終了する。

（３）維持
この基本制御状態は、ユーザ発話が、実行中のプラン１４０２に対応する話題タイトル８２０（図１３参照）や用例文１７０１（図１７参照）に該当しない場合であって、かつユーザ発話が基本制御状態「破棄」に該当するものではないと判断される場合に、基本制御状態情報に記述される基本制御状態である。

この基本制御状態である場合には、プラン会話処理部３２０は、ユーザ発話を受け付けると、まず保留・中止しているプラン１４０２を再開するか否かを検討し、ユーザ発話がプラン１４０２再開に適さない場合、例えばユーザ発話がプラン１４０２に対応する話題タイトル８０２や用例文１７０２に対応しない場合は、他のプラン１４０２の実行を開始したり、或いは後述の談話空間会話制御処理（Ｓ１９０２）などをおこなう。ユーザ発話がプラン１４０２再開に適している場合は、記憶している次プラン指定情報１５０２に基づいて、回答文１５０１の出力を行う。

基本制御状態が「維持」である場合は、プラン会話処理部３２０は、当該プラン１４０２に対応する回答文１５０１以外の回答を出力できるように、他のプラン１４０２を検索し、あるいは後述の談話空間会話制御処理などをおこなうが、ユーザ発話が再びプラン１４０２に関するものとなった場合は、そのプラン１４０２の実行を再開する。

（４）継続
この状態は、ユーザ発話が、実行中のプラン１４０２に含まれる回答文１５０１に対応しない場合であって、かつユーザ発話内容が基本制御状態「破棄」に該当するものではないと判断され、かつユーザ発話から解釈されるユーザの意図が明瞭でない場合に、設定される基本制御状態である。

基本制御状態が「継続」である場合は、プラン会話処理部３２０は、ユーザ発話を受け付けるとまず保留・中止しているプラン１４０２を再開するか否かを検討し、ユーザ発話がプラン１４０２再開に適さない場合は、ユーザからさらなる発話を引き出すための回答文を出力できるように、後述のＣＡ会話制御処理などをおこなう。

図１９に戻り、プラン会話制御処理の説明を続ける。
基本制御状態情報を参照したプラン会話処理部３２０は、基本制御状態情報が示す基本制御状態が「結束」であるか否かを判定する（Ｓ１９０２）。基本制御状態が「結束」であると判定した場合（Ｓ１９０２、Ｙｅｓ）は、プラン会話処理部３２０は、基本制御状態情報が示す実行中のプラン１４０２において、回答文１５０１が最終回答文であるかどうかを判定する（Ｓ１９０３）。

最終回答文１５０１が出力済みであると判定した場合（Ｓ１９０３、Ｙｅｓ）、プラン会話処理部３２０は、すでにそのプラン１４０２においてユーザに回答すべき内容をすべて伝え終えているので、新たな別のプラン１４０２を開始するかいなかを判定するため、プラン空間内にユーザ発話に対応するプラン１４０２が存在するか検索を行う（Ｓ１９０４）。この検索の結果ユーザ発話に対応するプラン１４０２が発見できなかった場合（Ｓ１９０５、Ｎｏ）、ユーザに提供すべきプラン１４０２は存在していないので、プラン会話処理部３２０はそのままプラン会話制御処理を終了する。

一方、この検索の結果、ユーザ発話に対応するプラン１４０２を発見した場合（Ｓ１９０５、Ｙｅｓ）、プラン会話処理部３２０は当該プラン１４０２に移行する（Ｓ１９０６）。これは、ユーザに提供すべきプラン１４０２が存在しているため、当該プラン１４０２の実行（プラン１４０２に含まれる回答文１５０１の出力）を開始するためである。

次に、プラン会話処理部３２０は当該プラン１４０２の回答文１５０１を出力する（Ｓ１９０８）。出力された回答文１５０１は、ユーザ発話に対する回答となり、プラン会話処理部３２０はユーザに伝えたい情報を提供することとなる。
回答文出力処理（Ｓ１９０８）後、プラン会話処理部３２０はプラン会話制御処理を終了する。

一方、先に出力した回答文１５０１が最終の回答文１５０１であるか否かの判定（Ｓ１９０３）において、先に出力した回答文１５０１が最終の回答文１５０１でない場合（Ｓ１９０３，Ｎｏ）は、プラン会話処理部３２０は、先に出力した回答文１５０１に続く回答文１５０１、すなわち次プラン指定情報１５０２により特定されている回答文１５０１に対応するプラン１４０２に移行する（Ｓ１９０７）。

この後、プラン会話処理部３２０は該当するプラン１４０２に含まれる回答文１５０１を出力し、ユーザ発話に対する回答を行う（Ｓ１９０８）。出力された回答文１５０１は、ユーザ発話に対する回答となり、プラン会話処理部３２０はユーザに伝えたい情報を提供することとなる。回答文出力処理（Ｓ１９０８）後、プラン会話処理部３２０はプラン会話制御処理を終了する。

さて、Ｓ１９０２の判定処理において、基本制御状態情報が「結束」でない場合（Ｓ１９０２，Ｎｏ）は、プラン会話処理部３２０は基本制御状態情報が示す基本制御状態が「破棄」であるか否かを判定する（Ｓ１９０９）。基本制御状態が「破棄」であると判定した場合（Ｓ１９０９、Ｙｅｓ）は、継続すべきプラン１４０２が存在していないため、プラン会話処理部３２０は、開始すべき新たな別のプラン１４０２が存在するか判定すべく、プラン空間１４０１内にユーザ発話に対応するプラン１４０２が存在するか検索を行う（Ｓ１９０４）。この後、先に述べたＳ１９０３（Ｙｅｓ）における処理と同様に、Ｓ１９０５からＳ１９０８までの処理をプラン会話処理部３２０は実行する。

一方、基本制御状態情報が示す基本制御状態が「破棄」であるか否かの判定（Ｓ１９０９）において、基本制御状態が「破棄」でないと判定した場合（Ｓ１９０９，Ｎｏ）は、プラン会話処理部３２０は、基本制御状態情報が示す基本制御状態が「維持」であるか否かの判定（Ｓ１９１０）をさらに行う。

基本制御状態情報が示す基本制御状態が「維持」である場合（Ｓ１９１０、Ｙｅｓ）には、プラン会話処理部３２０は、保留・停止しているプラン１４０２についてユーザが再び関心を示したか否かを調べ、関心を示した場合には、一時保留・停止しているプラン１４０２を再開するように動作する。すなわち、プラン会話処理部３２０は、保留・停止中のプラン１４０２を検査（図２０；Ｓ２００１）し、ユーザ発話が保留・停止中の当該プラン１４０２が対応するか否かを判定する（Ｓ２００２）。

ユーザ発話が当該プラン１４０２に対応すると判定された場合（Ｓ２００２、Ｙｅｓ）は、プラン会話処理部３２０はそのユーザ発話に対応するプラン１４０２に移行し（Ｓ２００３）、その後、そのプラン１４０２に含まれる回答文１５０１を出力するように、回答文出力処理（図１９；Ｓ１９０８）を実行する。このように動作することにより、プラン会話処理部３２０は、保留・中断していたプラン１４０２を、ユーザ発話に応じて、再開することが可能となり、あらかじめ用意していたプラン１４０２に含まれる内容をすべてユーザに伝達することが可能となる。

一方、先のＳ２００２（図２０参照）において、保留・停止中のプラン１４０２がユーザ発話に対応しないと判定された場合（Ｓ２００２、Ｎｏ）は、プラン会話処理部３２０は、開始すべき新たな別のプラン１４０２が存在するか判定すべく、プラン空間１４０１内にユーザ発話に対応するプラン１４０２が存在するか検索を行う（図１９；Ｓ１９０４）。この後、先に述べたＳ１９０３（Ｙｅｓ）における処理と同様に、Ｓ１９０５からＳ１９０９までの処理をプラン会話処理部３２０は実行する。

さて、Ｓ１９１０の判定において、基本制御状態情報が示す基本制御状態が「維持」でない場合（Ｓ１９１０、Ｎｏ）は、基本制御状態情報が示す基本制御状態が「継続」であることを意味する。この場合には、プラン会話処理部３２０は、回答文の出力を行うことなく、プラン会話制御処理を終了する。

以上で、プラン会話制御処理の説明を終了する。

図１８に戻り、メイン処理の説明を続ける。
プラン会話制御処理（Ｓ１８０１）を終了すると、会話制御部３００は談話空間会話制御処理を開始する（Ｓ１８０２）。ただし、プラン会話制御処理（Ｓ１８０１）において回答文出力を行った場合は、会話制御部３００は談話空間会話制御処理（Ｓ１８０２）、および後に説明するＣＡ会話制御処理（Ｓ１８０３）のいずれも行わず、基本制御情報更新処理（Ｓ１９０４）を行ってメイン処理を終了する。

図２２は、本実施の形態に係る談話空間会話制御処理の一例を示すフローチャートである。
先ず、入力部１００が、利用者からの発話内容を取得するステップを行う（ステップＳ２２０１）。具体的には、入力部１００は、利用者の発話内容を構成する音声を取得する。入力部１００は、取得した音声を音声信号として音声認識部２００に出力する。なお、入力部１００は、利用者からの音声ではなく、利用者から入力された文字列（例えば、テキスト形式で入力された文字データ）を取得してもよい。この場合、入力部１００はマイクではなく、キーボードやタッチパネルなどの文字入力装置となる。

次いで、音声認識部２００が、入力部１００で取得した発話内容に基づいて、発話内容に対応する文字列を特定するステップを行う（ステップＳ２２０２）。具体的には、入力部１００から音声信号が入力された音声認識部２００は、入力された音声信号に基づいて、その音声信号に対応する単語仮説（候補）を特定する。音声認識部２００は、特定した単語仮説（候補）に対応付けられた文字列を取得し、取得した文字列を文字列信号として会話制御部３００、より詳しくは談話空間会話制御部３３０に出力する。

そして、文字列特定部４１０が、音声認識部２００で特定された一連の文字列を一文毎に区切るステップを行う（ステップＳ２２０３）。具体的には、管理部３１０から文字列信号（あるいは形態素信号）が入力された文字列特定部４１０は、その入力された一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部４１０は、その区切った各文字列を形態素抽出部４２０及び入力種類判定部４４０に出力する。なお、文字列特定部４１０は、入力された文字列がキーボードから入力された文字列である場合には、句読点又はスペース等のある部分で文字列を区切るのが好ましい。

その後、形態素抽出部４２０が、文字列特定部４１０で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップを行う（ステップＳ２２０４）。具体的に、文字列特定部４１０から文字列が入力された形態素抽出部４２０は、入力された文字列と、形態素データベース４３０に予め格納されている形態素群とを照合する。なお、その形態素群は、本実施の形態では、それぞれの品詞分類に属する各形態素について、その形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として準備されている。
この照合をした形態素抽出部４２０は、入力された文字列の中から、予め記憶された形態素群に含まれる各形態素と一致する各形態素（m１、m２、…）を抽出する。形態素抽出部４２０は、抽出した各形態素を第一形態素情報として話題特定情報検索部３５０に出力する。

次いで、入力種類判定部４４０が、文字列特定部４１０で特定された一文を構成する各形態素に基づいて、「発話文のタイプ」を判定するステップを行う（ステップＳ２２０５）。具体的には、文字列特定部４１０から文字列が入力された入力種類判定部４４０は、入力された文字列に基づいて、その文字列と発話種類データベース４５０に格納されている各辞書とを照合し、その文字列の中から、各辞書に関係する要素を抽出する。この要素を抽出した入力種類判定部４４０は、抽出した要素に基づいて、その要素がどの「発話文のタイプ」に属するのかを判定する。入力種類判定部４４０は、判定した「発話文のタイプ」（発話種類）を回答取得部３８０に出力する。

そして、話題特定情報検索部３５０が、形態素抽出部４２０で抽出された第一形態素情報と着目話題タイトル８２０focusとを比較するステップを行う（ステップＳ２２０６）。
第一形態素情報を構成する形態素と着目話題タイトル８２０focusとが一致する場合、話題特定情報検索部３５０は、その話題タイトル８２０を回答取得部３８０に出力する。一方、話題特定情報検索部３５０は、第一形態素情報を構成する形態素と話題タイトル８２０とが一致しなかった場合には、入力された第一形態素情報及び利用者入力文話題特定情報を検索命令信号として省略文補完部３６０に出力する。

その後、省略文補完部３６０が、話題特定情報検索部３５０から入力された第一形態素情報に基づいて、着目話題特定情報及び回答文話題特定情報を、入力された第一形態素情報に含めるステップを行う（ステップＳ２２０７）。具体的には、第一形態素情報を「Ｗ」、着目話題特定情報及び回答文話題特定情報の集合を「Ｄ」とすると、省略文補完部３６０は、第一形態素情報「Ｗ」に話題特定情報「Ｄ」の要素を含めて、補完された第一形態素情報を生成し、この補完された第一形態素情報と集合「Ｄ」に関連づけされたすべての話題タイトル８２０とを照合し、補完された第一形態素情報と一致する話題タイトル８２０があるか検索する。補完された第一形態素情報と一致する話題タイトル８２０がある場合は、省略文補完部３６０は、その話題タイトル８２０を回答取得部３８０に出力する。一方、補完された第一形態素情報と一致する話題タイトル８２０を発見しなかった場合は、省略文補完部３６０は、第一形態素情報と利用者入力文話題特定情報とを話題検索部３７０に渡す。

次いで、話題検索部３７０は、第一形態素情報と、利用者入力文話題特定情報とを照合し、各話題タイトル８２０の中から、第一形態素情報に適した話題タイトル８２０を検索するステップを行う（ステップＳ２２０８）。具体的には、省略文補完部３６０から検索命令信号が入力された話題検索部３７０は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトル８２０の中から、その第一形態素情報に適した話題タイトル８２０を検索する。話題検索部３７０は、その検索の結果得られた話題タイトル８２０を検索結果信号として回答取得部３８０に出力する。

次いで、回答取得部３８０が、話題特定情報検索部３５０、省略文補完部３６０，あるいは話題検索部３７０で検索された話題タイトル８２０に基づいて、文解析部４００により判定された利用者の発話種類と、話題タイトル８２０に対応付けられた各回答種類とを照合し、回答文８３０の選択を行う（ステップＳ２２０９）。

具体的には、以下のようにして回答文８３０の選択が行われる。すなわち、話題検索部３７０から検索結果信号と、入力種類判定部４４０から「発話文のタイプ」とが入力された回答取得部３８０は、入力された検索結果信号に対応する「話題タイトル」と、入力された「発話文のタイプ」とに基づいて、その「話題タイトル」に対応付けられている回答種類群の中から、「発話文のタイプ」（DAなど）と一致する回答種類を特定する。

続いて、回答取得部３８０は、管理部３１０を介して、ステップＳ２２０９において取得した回答文８３０を出力部６００に出力する（ステップＳ２２１０）。管理部３１０から回答文を受け取った出力部６００は、入力された回答文８３０を出力する。

以上で、談話空間会話制御処理の説明を終了し、図１８に戻りメイン処理の説明を再開する。
会話制御部３００は談話空間会話制御処理を終了すると、ＣＡ会話制御処理を実行する（Ｓ１８０３）。ただし、プラン会話制御処理（Ｓ１８０１）および談話空間会話制御処理（Ｓ１８０１）において回答文出力を行った場合は、会話制御部３００はＣＡ会話制御処理（Ｓ１８０３）を行わず、基本制御情報更新処理（Ｓ１８０４）を行ってメイン処理を終了する。

ＣＡ会話制御処理（Ｓ１８０３）は、ユーザ発話が、「何かを説明している」のか、「何かを確認している」のか、「非難や攻撃をしている」のか、「これら以外」なのかを判定し、ユーザ発話の内容および判定結果に応じた回答文を出力する処理である。このＣＡ会話制御処理を行うことにより、プラン会話制御処理、および談話空間会話制御処理のいずれにおいても、ユーザ発話に適した回答文が出力できなくとも、ユーザとの会話の流れをとぎれさせることなく継続できるような、いわば「つなぎ」の回答文を出力することが可能となる。

つぎに、会話制御部３００は基本制御情報更新処理を行う（Ｓ１８０４）。この処理において、会話制御部３００，より詳しくは管理部３１０は、プラン会話処理部３２０が回答文出力を行った場合は基本制御情報を「結束」に設定し、プラン会話処理部３２０が回答文出力を停止した場合は基本制御情報を「破棄」に設定し、談話空間会話制御処理部３３０が回答文出力を行った場合は基本制御情報を「維持」に設定し、ＣＡ会話処理部３４０が回答文出力を行った場合は基本制御情報を「継続」に設定する。

この基本制御情報更新処理で設定された基本制御情報は、前述のプラン会話制御処理（Ｓ１８０１）において参照され、プランの継続や再開に利用される。

以上、メイン処理をユーザ発話を受け付けるごとに実行することにより、会話制御装置１は、ユーザ発話に応じて、予め用意したプランを実行できるとともに、プランに含まれない話題についても適宜応答することができる。

［Ｂ．第２の実施の形態］
次に、本発明の第２の実施の形態について述べる。第２の実施の形態にかかる会話制御装置１は、ユーザに質問を繰り返して行うことで、ユーザにある結論やアドバイスなどの情報にたどり着かせるための、誘導談話と呼ぶタイプのプランを扱うことができることを特徴としている。かかる会話制御装置１は、会話データベース５００に記憶されているプラン１４０２（複数）の少なくとも一部は、ユーザを誘導するための一連の質問を回答文として有しており、そのプランの有する次プラン指定情報は、複数の次候補回答文を指定する情報である。

なお、第２の実施の形態にかかる会話制御装置１の説明は、第１の実施の形態と異なる部分についてのみ説明し、第１の実施の形態と同様の構成・動作については説明を省略する。

図２３に、ユーザに質問を繰り返して行うことで、ユーザにある結論やアドバイスなどの情報にたどり着かせるための、一連の質問文を回答文として有するプラン１４０２の具体例を示す。この一連のプラン１４０２_１０〜１４０２_１６は、育児中の母親などからの育児相談に対する４回答文１５０１_１０〜１５０１_１６に対応している。この例では、プラン１４０２_１１、１４０２_１２，及びプラン１４０２_１１、１４０２_１２は選択的な関係にあり、一方が選択された場合は、他方は選択されない関係となっている。

各プラン１４０２_１０〜１４０２_１６はそれぞれ「２０００−０１」「２０００−０２」「２０００−０３」「２０００−０４」「２０００−０５」「２０００−０６」というＩＤデータ１７０２_１０〜１７０２_１６を有している。また、各プラン１４０２_１０〜１４０２_１６はそれぞれ次プラン指定情報１５０２_１０〜１５０２_１６を有している。なお、次プラン指定情報１５０２_１１及び１５０２_１４は、複数の次プランを指定するものであるため、複数のＩＤデータを有している。また、次プラン指定情報１５０２_１２、１５０２_１３、１５０２_１６の内容は、「２０００−０Ｆ」というデータであるが、このハイフン以下の番号「０Ｆ」は、次に出力する予定のプランは存在せず、当該回答文が一連の話（質問）の終わりであることを示す情報である。

この例では、ユーザ発話が「赤ちゃんが頭を打った」である場合に、プラン会話処理部３２０がこの一連のプランを実行開始する。すなわち、ユーザ発話「赤ちゃんが頭を打った」をプラン会話処理部３２０が受け付けると、プラン会話処理部３２０はプラン空間１４０１を検索して、ユーザ発話「赤ちゃんが頭を打った」に対応する回答文１５０１を有するプラン１４０２があるかどうかを調べる。この例では、「赤ちゃんが頭を打った」に対応するユーザ発話文字列１７０１_１０が、プラン１４０２_１０に対応するものとする。

プラン会話処理部３２０はプラン１４０２_１０を発見すると、そのプラン１４０２_１０に含まれる回答文１５０１_１０を取得し、この回答文１５０１_１０をユーザ発話に対する回答「意識はある？」として出力するとともに、次プラン指定情報１５０２_１０により次候補回答文を特定する。この例では、次プラン指定情報１５０２_１０は、２つのＩＤデータ「２０００−０２」「２０００−０３」を含んでいる。プラン会話処理部３２０は、２つのＩＤデータ「２０００−０２」及び「２０００−０３」に対応する２つのプラン１４０２_１１、１４０２_１２の回答文を次候補回答文とする。

ここで、会話制御装置１から出力された回答文「意識はある？」に答えるユーザ発話「はい」がなされた場合には、プラン会話処理部３２０は、次候補回答文として指定されている２つのプラン１４０２_１１、１４０２_１２のうち、このユーザ発話に対応するユーザ発話文字列１７０１_１１を有するプラン１４０２_１１を選択し、このプランの実行を行う。すなわち、プラン会話処理部３２０は、当該プラン１４０２_１１の有する回答文１５０１_１１である「麻痺や呼吸の乱れはある？」という回答を出力させると共に、当該プラン１４０２_１１の有する次プラン指定情報１５０２_１１により次候補回答文を特定する。この例では、次プラン指定情報１５０２_１１は、２つのＩＤデータ「２０００−０４」「２０００−０５」を含んでいる。プラン会話処理部３２０は、２つのＩＤデータ「２０００−０４」及び「２０００−０５」に対応する２つのプラン１４０２_１３、１４０２_１４を有する回答文を次候補回答文とする。

一方、会話制御装置１から出力された回答文「意識はある？」に答えるユーザ発話が「いいえ」であった場合には、プラン会話処理部３２０は、このユーザ発話に対応するユーザ発話文字列１７０１_１２を有するプラン１４０２_１２の実行を行う。すなわち、プラン会話処理部３２０は、当該プラン１４０２_１２の有する回答文１５０１_１２である「すぐに救急車を呼んでください！」という回答を出力させると共に、当該プラン１４０２_１２の有する次プラン指定情報１５０２_１２により、当該回答文が質問の終わりと認識し、プラン会話処理を終了する。

さて、会話制御装置１から出力された回答文「麻痺や呼吸の乱れはある？」に答えるユーザ発話が「はい」であった場合には、プラン会話処理部３２０は、プラン１４０２_１１において次候補回答文として指定されている２つのプラン１４０２_１３、１４０２_１４のうち、このユーザ発話「はい」に対応するユーザ発話文字列１７０１_１３を有するプラン１４０２_１３を選択し、このプランの実行を行う。すなわち、プラン会話処理部３２０は、当該プラン１４０２_１３の有する回答文１５０１_１３である「すぐに救急車を呼んでください！」という回答を出力させると共に、当該プラン１４０２_１３の有する次プラン指定情報１５０２_１３により、当該回答文が質問の終わりと認識し、プラン会話処理を終了する。

さて、会話制御装置１から出力された回答文「麻痺や呼吸の乱れはある？」に答えるユーザ発話が「いいえ」であった場合には、プラン会話処理部３２０は、プラン１４０２_１１において次候補回答文として指定されている２つのプラン１４０２_１３、１４０２_１４のうち、このユーザ発話「いいえ」に対応するユーザ発話文字列１７０１_１４を有するプラン１４０２_１４を選択し、このプランの実行を行う。すなわち、プラン会話処理部３２０は、当該プラン１４０２_１４の有する回答文１５０１_１４である「生あくびや嘔吐はありますか？」という回答を出力させると共に、次プラン指定情報１５０２_１４により次候補回答文を特定する。この例では、次プラン指定情報１５０２_１４は、２つのＩＤデータ「２０００−０４」「２０００−０６」を含んでいる。プラン会話処理部３２０は、２つのＩＤデータ「２０００−０４」及び「２０００−０６」に対応する２つのプラン１４０２_１３、１４０２_１５の回答文を次候補回答文とする。

上記に続いて、会話制御装置１から出力された回答文「生あくびや嘔吐はありますか？」に答えるユーザ発話が「はい」であった場合には、プラン会話処理部３２０は、プラン１４０２_１４において次候補回答文として指定されている２つのプラン１４０２_１３、１４０２_１６のうち、このユーザ発話に対応するユーザ発話文字列１７０１_１３を有するプラン１４０２_１３の実行を行う。すなわち、プラン会話処理部３２０は、当該プラン１４０２_１３の有する回答文１５０１_１３である「すぐに救急車を呼んでください！」という回答を出力させると共に、当該プラン１４０２_１３の有する次プラン指定情報１５０２_１３により、当該回答文が質問の終わりと認識し、プラン会話処理を終了する。

一方、会話制御装置１から出力された回答文「生あくびや嘔吐はありますか？」に答えるユーザ発話が「いいえ」であった場合には、プラン会話処理部３２０は、プラン１４０２_１４において次候補回答文として指定されている２つのプラン１４０２_１３、１４０２_１６のうち、このユーザ発話に対応するユーザ発話文字列１７０１_１５を有するプラン１４０２_１５の実行を行う。すなわち、プラン会話処理部３２０は、当該プラン１４０２_１５の有する回答文１５０１_１５である「頭を打った直後に大声で泣き、やがて泣きやんだ後、機嫌良くしていたら、とりあえず大きな心配はないでしょう」という回答を出力させると共に、当該プラン１４０２_１３の有する次プラン指定情報１５０２_１３により、当該回答文が質問の終わりと認識し、プラン会話処理を終了する。

図２４は、図２３に示すような、ユーザに質問を繰り返して行うことで、ユーザにある結論やアドバイスなどの情報にたどり着かせるための、一連の質問文を回答文として有するタイプのプランについて生じうる４つの基本制御状態を示す図である。以下、それぞれの状態について説明する。

（１）目標達成
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図２１における「結束」に対応する状態である。ユーザ発話が実行中のプラン１４０２、より詳しくはプラン１４０２に対応する話題タイトル８２０や用例文１７０１に一致する場合である。この場合は、プラン会話処理部３２０は当該プラン１４０２を終了し、次プラン指定情報１５０２にて指定された回答文１５０１に対応するプラン１４０２に移行する。

（２）破棄
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図２１における「破棄」と同様である。ユーザ発話内容がプラン１４０２の終了を要求していると判断される場合、またはユーザの関心が実行中のプラン以外の事項に移ったと判定される場合に、設定される基本制御状態である。基本制御状態情報が破棄を示している場合は、プラン会話処理部３２０は、破棄の対象となったプラン１４０２以外にユーザ発話に対応するプラン１４０２がないかどうかを検索し、存在する場合にはそのプラン１４０２の実行を開始し、存在しない場合には、プランの実行を終了する。

（３）維持
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図２１における「維持」と同様である。すなわち、基本制御状態「維持」は、ユーザ発話が、実行中のプラン１４０２に対応するに対応する話題タイトル８２０（図１３参照）や用例文１７０１（図１７参照）に該当しない場合であって、かつユーザ発話が基本制御状態「破棄」に該当するものではないと判断される場合に、基本制御状態情報に記述される基本制御状態である。

この基本制御状態である場合には、プラン会話処理部３２０は、ユーザ発話を受け付けると、まず保留・中止しているプラン１４０２を再開するか否かを検討し、ユーザ発話がプラン１４０２再開に適さない場合、例えばユーザ発話がプラン１４０２に対応する話題タイトル８０２や用例文１７０２に対応しない場合は、他のプラン１４０２の実行を開始したり、或いは前述の談話空間会話制御処理（Ｓ１９０２）などをおこなう。ユーザ発話がプラン１４０２再開に適している場合は、記憶している次プラン指定情報１５０２に基づいて、回答文１５０１の出力を行う。

基本制御状態が「維持」である場合は、プラン会話処理部３２０は、当該プラン１４０２に対応する回答文１５０１以外の回答を出力できるように、他のプラン１４０２を検索し、あるいは前述の談話空間会話制御処理などをおこなうが、ユーザ発話が再びプラン１４０２に関するものとなった場合は、そのプラン１４０２の実行を再開する。

（４）催促
この基本制御状態は、シナリオと呼ぶタイプのプランの基本制御状態を示した図２１における「継続」に対応している。この基本制御状態は、ユーザ発話が、実行中のプラン１４０２に含まれる回答文１５０１に対応しない場合であって、かつユーザ発話内容が基本制御状態「破棄」に該当するものではないと判断され、かつユーザ発話から解釈されるユーザの意図が明瞭でない場合に、設定される基本制御状態である。

基本制御状態が「催促」である場合は、プラン会話処理部３２０は、ユーザ発話を受け付けるとまず保留・中止しているプラン１４０２を再開するか否かを検討し、ユーザ発話がプラン１４０２再開に適さない場合は、ユーザからさらなる発話を引き出すための回答文を出力できるように、前述のＣＡ会話制御処理などをおこなう。

図２５、図２６は、第２の実施の形態において、誘導談話と呼ぶタイプのプランを扱うプラン会話制御処理の一例を示すフローチャートである。図２５，２６に示す第２の実施の形態において、誘導談話と呼ぶタイプのプランを扱うプラン会話制御処理は、Ｓ２５０２において「結束」が「目標達成」に変わっている点を除いて、図１９，２０に示した第１の実施の形態におけるプラン会話制御処理と同様である。具体的には、図２５におけるＳ２５０１からＳ２５１０は、図１９におけるＳ１９０１からＳ１９１０とそれぞれ同様の処理であり、図２６におけるＳ２６０１からＳ２６０３は、図２０におけるＳ２００１からＳ２００３とそれぞれ同様の処理であるので、これらの詳細な説明は省略する。

上記のような第２の実施の形態にかかる会話制御装置１によれば、ユーザに質問を繰り返して行うことで、ユーザにある結論やアドバイスなどの、予め準備した情報にたどり着かせるための会話を提供することが可能となる。

会話制御装置の構成例を示す機能ブロック図音声認識部の構成例を示す機能ブロック図単語仮説絞込部の処理の一例を示すタイミングチャート音声認識部の動作例を示すフローチャート会話制御装置の部分拡大ブロック図文字列とこの文字列から抽出される形態素との関係を示す図「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図文のタイプとそのタイプを判定するための辞書の関係を示す図会話データベースが記憶するデータのデータ構成の一例を示す概念図ある話題特定情報と他の話題特定情報との関連付けを示す図話題タイトル（「第二形態素情報」ともいう）のデータ構成例を示す図回答文のデータ構成例を説明するための図ある話題特定情報に対応付けされた話題タイトル，回答文、次プラン指定情報の具体例を示す図プラン空間を説明するための概念図プランの例を示す図別のプランの例を示す図プラン会話処理の具体例を示す図会話制御部のメイン処理の一例を示すフローチャートプラン会話制御処理の一例を示すフローチャート図１９に続く、プラン会話制御処理の一例を示すフローチャート基本制御状態を示す図談話空間会話制御処理の一例を示すフローチャート第２の実施の形態におけるプラン会話処理の具体例を示す図第２の実施の形態における基本制御状態を示す図第２の実施の形態におけるプラン会話制御処理の一例を示すフローチャート第２の実施の形態における、図２５に続く、プラン会話制御処理の一例を示すフローチャート

符号の説明

１ … 会話制御装置
１００ … 入力部
２００ … 音声認識部
３００ … 会話制御部
３２０ … プラン会話処理部
３３０ … 談話空間会話制御処理部
３４０ … ＣＡ会話処理部
４００ … 文解析部
５００ … 会話データベース
６００ … 出力部
７００ … 音声認識辞書記憶部

Claims

ユーザ発話に応じて回答文を出力する会話制御装置であって、
回答文と、当該回答文の次の順番で出力することが予定される回答文である次候補回答文を指定する次候補指定情報とをそれぞれが有する複数のプランを記憶するプラン記憶手段と、
第１のユーザ発話に応じて、前記プラン記憶手段に記憶されたいずれかのプランを選択し、そのプランが有する回答文を出力し、その後、第２のユーザ発話に応じて、当該プランが有する次候補指定情報に基づいて、次候補回答文を出力するプラン会話手段と、
を有し、
前記プランの少なくとも一部は、ユーザを誘導するための一連の質問を前記回答文として有しており、前記次候補指定情報は、複数の次候補回答文を指定する情報であり、
前記プラン会話手段は、第２のユーザ発話が次候補回答文と関連性がないか若しくは関連性が不明である場合に、前記次候補回答文の出力を保留し、
会話制御装置が談話空間会話手段を更に有し、該談話空間会話手段は、前記プラン会話手段が次候補回答文の出力を保留した場合に、前記第２のユーザ発話に応じて、前記次候補回答文と関連性を有する話題以外の話題についての回答文を出力する、会話制御装置において、
ユーザ発話を受けるごとに、前回の発話に基づく回答文の出力制御において更新されて設定された４つの基本制御状態「結束」「破棄」「維持」「継続」に応じて回答文の出力制御を行なうメイン処理が実行され、該メイン処理では、
ユーザ発話が実行中のプランに一致する基本制御状態「結束」の場合、前記プラン会話手段は、当該プランを終了して、当該プランが有する次候補指定情報にて指定された回答文に対応するプランに移行し、
ユーザ発話内容が実行中のプランの終了を要求していると判断され、または、ユーザの関心が実行中のプラン以外の事項に移ったと判定される基本制御状態「破棄」の場合、前記プラン会話手段は、破棄の対象となったプラン以外にユーザ発話に対応するプランがないかどうかを検索し、存在する場合にはそのプランの実行を開始し、存在しない場合には、プランの実行を終了し、
ユーザ発話が実行中のプランに一致せずユーザ発話が基本制御状態「破棄」に該当するものではないと判断される基本制御状態「維持」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、前記プラン会話手段が他のプランの実行を開始し、或いは、前記談話空間会話手段による処理を行ない、ユーザ発話がプラン再開に適している場合には、前記プラン会話手段が該プランが有する次候補指定情報に基づいて回答文の出力を行い、
ユーザ発話が実行中のプランに含まれる回答文に対応せずユーザ発話内容が基本制御状態「破棄」に該当しない判断され且つユーザ発話から解釈されるユーザの意図が明瞭でない基本制御状態「継続」の場合、前記プラン会話手段は、ユーザ発話を受け付けた段階で、保留・中止しているプランを再開するか否かを検討し、ユーザ発話がプランの再開に適さない場合には、ユーザとの会話の流れを途切れさせることなく継続させるための繋ぎの回答文を出力するＣＡ会話制御処理を行ない、
前記メイン処理の最後に基本制御情報更新処理が行なわれ、この基本制御情報更新処理では、前記プラン会話手段が回答文出力を行った場合に基本制御情報が「結束」に設定され、前記プラン会話手段が回答文出力を停止した場合に基本制御情報が「破棄」に設定され、前記談話空間会話手段が回答文出力を行った場合に基本制御情報が「維持」に設定され、前記ＣＡ会話制御手段が回答文出力を行った場合に基本制御情報が「継続」に設定される、
ことを特徴とする会話制御装置。