Nothing Special   »   [go: up one dir, main page]

JPH07219961A - 音声対話システム - Google Patents

音声対話システム

Info

Publication number
JPH07219961A
JPH07219961A JP6009586A JP958694A JPH07219961A JP H07219961 A JPH07219961 A JP H07219961A JP 6009586 A JP6009586 A JP 6009586A JP 958694 A JP958694 A JP 958694A JP H07219961 A JPH07219961 A JP H07219961A
Authority
JP
Japan
Prior art keywords
voice
response
user
dialogue
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6009586A
Other languages
English (en)
Other versions
JP3454897B2 (ja
Inventor
Toshiyuki Odaka
俊之 小高
Akio Amano
明雄 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP00958694A priority Critical patent/JP3454897B2/ja
Publication of JPH07219961A publication Critical patent/JPH07219961A/ja
Application granted granted Critical
Publication of JP3454897B2 publication Critical patent/JP3454897B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】利用者がシステムの状態を容易に把握できるよ
うにし、利用者とシステムとが常に円滑な対話を実現で
きる音声対話システムを提供する。 【構成】マイク1、音声入力手段2、音声分析手段3、
音声認識手段4、構文解析手段5、意図抽出手段6、対
話管理手段7、問題解決手段8、応答文生成手段10、
音声合成手段11、音声出力手段12、スピーカ13、
複数の中途応答処理手段(14、15、16、17、1
8)からなる音声対話システムにおいて、複数の中途応
答処理手段(14、15、16、17、18)は、入力
系の手段である音声入力手段2、音声分析手段3、音声
認識手段4、構文解析手段5、意図抽出手段6のうち任
意の1つあるいは複数の手段の処理結果を入力として、
処理結果を出力系の手段である音声出力手段12、音声
合成手段11、応答文生成手段10のうち1つあるいは
複数の手段へ出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報検索などを行なう
ために利用する計算機システムに係り、特に、音声入出
力インタフェースを備え、誰でも容易に利用することが
できる音声対話システムに関するものである。
【0002】
【従来の技術】従来の音声対話システムは、従来の計算
機を用いた対話システムのキーボード入力を音声入力で
置き換え、また、従来の計算機を用いた対話システムの
ディスプレイ出力を音声出力で置き換えただけのものが
多い。例えば、利用者の入力を認識・理解し、利用者の
アプリケーション(例えば、情報検索や情報案内)への
問い合わせに対する回答だけを示す。
【0003】
【発明が解決しようとする課題】上記のような従来の音
声対話システムにおいて、利用者は、自分が入力した音
声がシステムにおいてどこまで処理されているのか、音
声がうまく受理されなかった場合には、どこがうまく伝
わっていないのか、あるいはその原因が何であるのか、
というようなシステムの処理状態を把握できない。その
ため、次に何を言ったら良いのかとまどったり、不安を
感じたりすることもあり、システムとの円滑な対話を困
難にしていた。
【0004】本発明の目的は、利用者がシステムの処理
状態を容易に把握できるようにし、利用者とシステムと
の円滑な対話を実現できる音声対話システムを提供する
ことにある。
【0005】
【課題を解決するための手段】本発明による音声対話シ
ステムは、上記目的を達成するために、利用者の発話し
た音声を入力する音声入力手段と、該音声入力手段によ
り入力された音声を分析する音声分析手段と、該音声分
析手段からの分析結果を基に音声を認識し、一つまたは
複数の単語系列を出力する音声認識手段と、前記一つま
たは複数の単語系列に対して構文解析をし、一つまたは
複数の構文情報を出力する構文解析手段と、前記一つま
たは複数の構文情報から利用者の意図を抽出する意図抽
出手段と、前記利用者の意図に基づいてシステムの応答
内容を生成し、あるいは、システムの応答内容を生成す
るために問題解決が必要な場合には、問題解決するため
のコマンドを生成し、かつ、該コマンドに対して得られ
る解も含めてシステムの応答内容を生成する対話管理手
段と、前記コマンドに含まれる問題の解を求める問題解
決手段と、前記対話管理手段から得られる前記システム
の応答内容より応答文を生成する応答文生成手段と、前
記応答文生成手段から得られる応答文を音声波形に変換
する音声合成手段と、前記音声合成手段より得られる音
声波形を音声として出力する音声出力手段と、前記音声
入力手段、前記音声分析手段、前記音声認識手段、前記
構文解析手段、前記意図抽出手段の少なくとも1つの処
理結果を入力として、該処理結果を前記対話管理手段、
前記音声合成手段および前記音声出力手段の少なくとも
1つへ出力する少なくとも1つの中途応答処理手段とを
備え、前記音声入力手段、前記音声分析手段、前記音声
認識手段、前記構文解析手段、前記意図抽出手段の少な
くとも1つの処理結果に応じて、現在のシステムの処理
状態を利用者に知らしめる応答を発声することを特徴と
する。
【0006】
【作用】本発明による音声対話システムでは、利用者に
対して、特に利用者の発声した音声に対して、適宜、利
用者が現在のシステムの動作状況を認識できるような音
声出力を利用者にフィードバックする。その際、システ
ムの入力系の各段階(音声入力、音声分析、音声認識、
構文解析、意図抽出等)でのフィードバックを行なうこ
とにより、利用者に対して迅速かつ木目細かな応答を行
なうことが可能になる。
【0007】システムの応答には、利用者からの問いか
けに対する本来の応答の他に、利用者の発声に対するオ
ウム返し応答もしくは相槌応答、より大きな発声を要求
する応答、入力を促す応答、再発声を要求する応答、利
用者から入力音声の部分的な認識結果の適否(正誤)の
確認のための応答、不足情報を要求する応答、認識でき
た部分を提示するための応答、構文解析不能を通知する
ための応答、意図抽出不能の旨を通知する応答、さらに
は、同義語の表現の言い換えの確認のための応答等が考
えられる。
【0008】例えば、システムのオウム返し応答もしく
は相槌応答によって、利用者は、自分の発話が音声とし
て入力されていることを認識でき、安心して次の発話を
行なえる。
【0009】また、部分的な認識結果の適否の確認応答
によれば、利用者は、認識されなかった部分だけを言い
直せばよいため、利用者に再発話の労力を掛けることが
回避できるとともに、利用者−システム間の対話を円滑
に進行させることが可能となる。
【0010】同義語の言い換え応答によれば、利用者の
省略語等を正規の単語に置き換えてその適否を確認する
ことができるので、より正確な対話が可能になる。
【0011】
【実施例】以下、図を用いて本発明の実施例を説明す
る。
【0012】図1は本発明による音声対話システムの一
実施例を示すブロック図である。
【0013】図1のシステムにおいて、マイク1から入
力された利用者の音声は音声入力手段2においてデジタ
ル化される。音声入力手段2においてデジタル化された
音声は、音声分析手段3において一定時間間隔毎に音響
的な分析が行なわれ、例えば、音声波形のスペクトルや
パワーの時系列パタンが音響分析の結果として出力され
る。音声認識手段4は、音声分析手段3の分析結果か
ら、入力音声を認識し、1つまたは複数の単語系列を出
力する。音声認識手段4から得られた1つまたは複数の
単語系列は、構文解析手段5において解析され、単語系
列の構文的な構造を構文情報として出力する。構文解析
手段5から得られた構文情報は、意図抽出手段6におい
て解析され、利用者の音声に含まれる意図が抽出され
る。
【0014】対話管理手段7は、意図抽出手段6から得
られる利用者の意図に対するシステムの応答内容(項
目、要点、深層構造)を生成する。ここで、システムの
応答内容を生成するために問題解決が必要な場合は、ま
ず問題解決手段8を利用するためのコマンドを生成す
る。対話管理手段7は、問題解決手段8にコマンドを送
った場合には、問題解決手段8から得られた結果に基づ
いて、システムの応答内容を生成する。
【0015】問題解決手段8は、対話管理手段7で生成
されたコマンドにより問題解決(例えば、利用者の質問
に対する回答に必要な情報の検索)を行なう。
【0016】対話管理手段7から得られたシステムの応
答内容は、応答文生成手段10において応答文に変換さ
れる。応答文生成手段10から得られた応答文は、音声
合成手段11において、音声波形に変換される。音声合
成手段11から得られた音声波形は音声出力手段12に
おいてアナログ化され、スピーカ13より音声として出
力される。
【0017】第1の中途応答処理手段14、第2の中途
応答処理手段15、第3の中途応答処理手段16、第4
の中途応答処理手段17、第5の中途応答処理手段18
は、入力系の各手段(音声入力手段2、音声分析手段
3、音声認識手段4、構文解析手段5、意図抽出手段
6)のうち任意の1つまたは複数の手段の処理結果に基
づいて、利用者の発声に対する反復、相槌、確認などの
応答のための処理を行ない、処理結果を出力系の各手段
(応答文生成手段10、音声合成手段11、音声出力手
段12)のうち任意の1つまたは複数の手段に渡す。出
力系の手段を通して、利用者に対する応答が実際になさ
れる。なお、本実施例では中途応答処理手段の数を5つ
としたが、本発明はこれに限定されるものではない。
【0018】対話管理手段7は、対話の進行状況につい
て各中途応答処理手段(図1では、15、16、17、
および18)との間でやり取りを行ない、対話の進行状
況を対話履歴として管理しながら、対話の進行を管理す
る。
【0019】次に本実施例の中で用いている音声認識手
段4について説明する。音声認識手段4の実現方法とし
ては様々な方法が考えられるが、ここではテンプレート
マッチングによる実現方法を説明する。
【0020】図2に、テンプレートマッチングに基づく
音声認識手段4の一構成例を示す。音声分析手段3から
得られる分析パタンは、照合手段41において、予め認
識の基準として標準パタン格納手段42に格納された各
標準パタンとの間で照合され、各標準パタンとの間の類
似度が出力される。照合手段41から出力された各標準
パタンとの類似度は判定手段43に送られ、最も類似し
ている標準パタンの一つあるいは上位複数の候補が類似
度に基づくスコアと共に認識結果として出力される。
【0021】次に本実施例の中で用いている構文解析手
段5について説明する。
【0022】図3に構文解析手段5の一構成例を示す。
構文解析手段5は、入力文に対してその構文構造を解析
し、構文情報を出力するものである。解析に失敗した場
合は、“構文解析不能”を結果として出力する。音声認
識手段4から得られた単語系列は、構文構造解析手段5
1により解析される。このとき、入力される文を受理す
るために予め文法格納手段52に格納された文法と、単
語辞書格納手段53に格納された単語の品詞情報などを
用いて解析する。構文構造解析手段51の実現方法とし
ては様々な方法が考えられる。本発明はこのアルゴリズ
ムを限定するものではないので、詳しい説明は省略す
る。例えば、CKY(Cocke-Kasami-Younger)の方法に
よる実現方法があり、その詳しい説明は例えば、“長尾
真:人工知能シリーズ2、言語工学、昭晃堂”第128
頁〜第132頁にある。
【0023】次に本実施例の中で用いている意図抽出手
段6について説明する。本実施例では、予め用意したキ
ーワードと照合した結果によって利用者の意図を抽出す
る方法を説明する。
【0024】図4に意図抽出手段6の一構成例を示す。
構文解析手段5から得られた構文情報のうち、キーワー
ドになりうる単語(例えば名詞と動詞)のみがキーワー
ド照合手段61に入力され、ここでキーワード格納手段
62に予め格納されていた全てのキーワードと比較さ
れ、一致した1つあるいは複数のキーワードがユーザの
意図として出力される。一致するキーワードがない場合
は、“意図抽出不能”を結果として出力する。
【0025】図5に、一応用例として交通案内を考えた
場合のキーワードの例を示す。この例では、“東京”、
“国分寺”、“横浜”等の地名の他、“所要時間”、
“時間”、“費用”、“交通費”、“経路”、“行き
方”のような交通案内における利用者の問いかけにおい
て出現するであろう用語を予めキーワードとして定めて
いる。
【0026】次に本実施例の中で用いている対話管理手
段7について説明する。
【0027】図6は、状態遷移ネットを用いた対話管理
手段7を実現するための一構成例を示している。状態遷
移ネット格納手段72は状態遷移ネットを格納し、この
状態遷移ネットに基づいて対話進行制御手段71は対話
を進行させ、システムの応答が決まる。さらに対話の進
行において、問題解決が必要な場合はコマンド生成手段
74において問題解決手段8へのコマンドが生成され
る。そのコマンドに対して問題解決手段8において得ら
れた解を解答受理手段75が受けとり、対話進行制御手
段71においてシステムの応答内容が決定され、決定さ
れたシステムの応答内容(応答の種類とデータ)は応答
文生成手段10へ送られる。対話状況記憶手段73は、
対話進行制御手段71が各中途応答処理手段とやりとり
することにより更新される対話の状況が保持され、対話
進行制御手段71が管理している。
【0028】図7に状態遷移ネットの例を示す。図7に
示すように状態遷移ネットは、状態(図では0〜3の4
状態)を表すノードと、ノード間の遷移を表すアークか
らなり、対話の進行は状態間の遷移として考える。
【0029】図8に状態遷移ネットの基本単位を示す。
各アークには、中途応答処理手段識別番号721、中途
応答処理手段内での判定結果722、判定結果に基づく
処理の手順723(例えば、問題解決手段8に対して発
行されるコマンドを生成するためにコマンド生成手段7
4へ送られる指示)、および処理結果に基づく応答生成
のための指示724、の4項目が記述され対応付けられ
ているものとする。但し、不要な部分は空(図7では
“φ”で表わしている)でもよい。中途応答処理手段識
別信号721として、図7では、#nが第nの中途応答
処理手段を表わすものとする(但し、#0は対話管理手
段7を表わす)。ある状態において、その状態から出て
いるアークのうち、各アークに付随して記述されている
中途応答処理手段識別番号721に対応する中途応答処
理手段あるいは対話管理手段7における判定結果(第2
中途応答処理手段内におけるタイムアウト検出や第4の
中途応答処理手段内における構文解析判定結果、あるい
は意図抽出手段における意図抽出結果)が中途応答処理
手段あるいは対話管理手段7で得られると、そのアーク
が、遷移するアークとして選択される。そのアークの手
順723にコマンド生成の指示が与えられていれば、記
述された指示をコマンド生成手段74に送り、そこでコ
マンドが生成される。さらに、そのアークに記述された
応答生成のための指示724を各中途応答処理手段内の
応答文組立手段あるいは応答生成手段10に送る。ま
た、このとき必要に応じて、遷移したアークの情報を対
話管理手段7内の対話状況記憶手段73に蓄えておく。
この対話状況記憶手段73で保持する情報は対話の履歴
情報として次の入力の解析などに使うことができる。
【0030】例えば、図7の中で状態2において利用者
が時間を問い合わせる発声(“所要時間を教えて”)を
行ない、その意図が意図抽出手段6で抽出されると、対
話進行制御手段71が状態2からのアークの記述を参照
し、コマンド生成手段74への指示としては時間問い合
わせを行なうコマンドを生成することが指示され、応答
出力の指示としては時間を答える応答(例えば、「40
分です」)を生成することが応答文生成手段10に指示
され、状態2に遷移する。
【0031】図9にこのときの時間問い合わせ処理のコ
マンドの例を示し、図10にそれに対して得られる結果
の例を示す。図9の例では、“?”を含んだ部分(時間
のスロット)を問い合わせることを表している。
【0032】また、問題解決に依存した対話の状況(出
発地はどこか、目的地はどこか、最近応答した内容は何
かなど)や問題解決に依存しない対話の状況(直前に、
認識不良を確認するための応答を利用者に対して行なっ
たことなど)を対話状況記憶手段73に保存し、必要に
応じてこうした情報を参照する。
【0033】なお、図7は、対話管理手段7の動作を示
すものであり、各中途応答処理手段が対話管理手段7の
関与なしに実行できる応答については、この図に表われ
ていないことに留意されたい。
【0034】次に本実施例の中で用いている問題解決手
段8について説明する。図7の場合と同様、交通案内を
例とする。この場合、問題解決の内容は、出発地、目的
地、検索項目(所要時間、費用、あるいは経路)を与え
て、その出発地から目的地までに関する検索項目の情報
を求めることである。本実施例では、問題解決手段8の
実現方法のうち最も簡単な方法のひとつとして、表形式
に作成された交通情報データベースから表引きする方法
を説明する。
【0035】図11に問題解決手段8の一構成例を示
す。交通情報データベース82と、これに基づいて表引
きを行なう情報検索手段81とからなる。図12に交通
情報データベース82の交通情報の表の例を示す。この
表のエントリーの中から出発地と目的地が利用者の意図
と一致するエントリーを探し、そのエントリーの中から
指定された検索項目の情報を取り出すことで本問題解決
は実現される。例えば、出発地が“国分寺”、目的地が
“東京”であり、検索項目が“費用”であれば、図12
の表中の第2のエントリーが出発地と目的地が利用者の
意図と一致するエントリーとして探し出され、このエン
トリーの“費用”の欄を参照して530円という答が得
られる。
【0036】次に本実施例の中で用いている応答文生成
手段10について説明する。応答文生成手段10の実現
方法として、本実施例では予め用意したテンプレート
(文の雛型)に基づいて応答文を生成する方法を説明す
る。本実施例のように応用を交通案内などに限定した場
合は、語彙や文型は限られており、予め用意したテンプ
レートの穴埋めで十分に対応できる。
【0037】図13に応答文生成手段10の一構成例を
示す。応答文テンプレート格納手段102に格納されて
いるテンプレートを用いて、応答文組立手段101は対
話管理手段7から得られるシステムの応答内容を応答文
に変換する。
【0038】図14に応答文テンプレートの例を示す。
対話管理手段7から受けとったシステムの応答内容を参
照しながら“[”と“]”とで囲まれた部分を置き換え
て応答文とする。例えば、時間提示で40分というデー
タを応答内容として受けとっていれば、“[時間]”を
“40分”で置き換えて「約40分です」という応答文
を生成できる。この方法は、スロット法ともいい、例え
ば“長尾真:人工知能シリーズ2、言語工学、昭晃堂”
に詳しく記載されている。
【0039】次に本実施例の中で用いている音声合成手
段11について説明する。音声合成手段11の実現方法
としては録音再生による方法や規則合成による方法など
が考えられる。本実施例では録音再生による方法を説明
する。前記応答文生成手段10や後で詳しく述べる各中
途応答処理手段の実現方法の説明から明らかなように、
本実施例で生成される応答文を構成する単語は応答文テ
ンプレート格納手段(102ほか)に含まれる単語と交
通情報データベース82に含まれる単語に限られる。し
たがって、これらの単語に対応する音声波形を予め適当
な単位で録音し、適宜連結して出力することで全ての文
に対応できる。例えば、「約40分です」という応答文
に対しては、「約」「40」「分」「です」の4つの音
声波形を用意しておき、連結して出力すれば良い。
【0040】図15に音声合成手段11の構成の一構成
例を示す。生成された応答文に沿って、音声波形格納手
段112から取り出した音声波形を音声波形連結手段1
11で連結して音声出力手段12へ送ることにより実現
できる。
【0041】次に本実施例の中で用いている中途応答処
理手段(図1の中では14、15、16、17、18)
について説明する。
【0042】図16は、図1における第1の中途応答処
理手段14の一構成例を音声入力手段2および音声出力
手段12と共に示している。音声入力手段2はA/D変
換手段21であり、音声出力手段12はD/A変換手段
121である。この例の場合、第1の中途応答処理手段
14は、任意の時間のデジタル化された音声を記憶でき
る音声記憶手段141であり、任意の遅延時間の後に入
力音声をそのまま出力することができる構成とする。遅
延時間は、利用者の元の発声をなるべく遮らないように
利用者の発声の平均的な長さに設定しても良いし、ある
いは音声分析手段3の結果から音声の終端を検出する手
段を別に設けて、音声終端を検出するまでの時間として
も良い。この中途応答処理手段14の処理には、対話管
理手段7は全く関与しない。
【0043】この入力音声の再生、すなわち利用者の発
した言葉のオウム返しにより、利用者は自分の音声が少
なくともシステムに入力されていることがわかる。但
し、この第1の中途応答は、後述する相槌の応答と衝突
するようであれば、なくてもよく、システムに必須のも
のではない。
【0044】なお、本発明は音声対話システムに関する
ものであり、本実施例は音声入出力について説明してい
るが、言うまでもなく音声以外の他のメディアを用いた
構成にも拡張できる。例えば画像表示を有する音声対話
システムであれば、第1の中途応答処理手段の出力を遅
延時間を設けずに画像出力手段に送り、入力された音声
波形を画面に図形として出力することにより、利用者の
元の発声を遮ることなく利用者の音声がシステムに入力
されていることを示すことができる。
【0045】図17は、図1における音声分析手段3に
対応した第2の中途応答処理手段15の一構成例を示し
ている。ポーズ判定手段151でポーズが検出される
と、相槌応答生成手段152は相槌の応答文(例えば
「ええ」、「はい」)を出力する。この結果を音声合成
手段11に渡す。ポーズ判定手段151は、音声分析手
段3より得られる結果のうち一定時間間隔毎の短区間パ
ワーをモニタし、パワーがない状態がある時間続いた場
合として音声中のポーズを検出する。この処理は、対話
管理手段7の関与なく行なわれる。
【0046】図18は、第2の中途応答処理手段15の
他の構成例を示している。音声レベル判定手段153で
低いレベルの音声らしきものが検出されると、相槌応答
生成手段154はより大きな発声を要求する応答文(例
えば「もう少し大きい声でお願いします」)を出力す
る。この結果を音声合成手段11に渡す。音声レベル判
定手段153も、ポーズ判定手段151と同様に音声分
析手段3より得られる結果のうち一定時間間隔毎の短区
間パワーをモニタし、音声レベルがある閾値より低い入
力の塊を小さい音声として検出する。この処理は、対話
管理手段7の関与なく行なわれる。
【0047】これらの相槌応答により、利用者は自分の
音声が少なくとも分析されていることがわかる。
【0048】図27に、第2の中途応答処理手段15の
さらに他の構成例を示す。タイムアウト検出手段155
は、分析結果の一部(例えば、音声のパワー)を監視
し、パワーの値がある閾値を越えないままある一定時間
が経過する(タイムアウト)ことを検出する。その出力
により、予め定めた時間利用者の入力がないことがわか
ると、応答文組立手段156は応答文テンプレート(図
28(a))を参照して、利用者に対して次の入力の促
進要求をする。具体的な応答文は、対話状況記憶手段7
3に蓄えられている対話状況によって、利用者の発話を
促す応答、例えば「何が知りたいですか?」「他にご希
望はありませんか?」など様々な応答が考えられる。こ
の処理には、対話管理手段7が関与する。
【0049】図28(b)は、図27の第2の中途応答
処理手段15で処理が行なわれた場合に、対話管理手段
7内の対話状況記憶手段73に蓄えられる対話状況の一
例を示す。この例の場合、第2の中途応答処理手段15
内の応答文組立手段156から「入力の促進要求」を音
声合成手段11に出力したことを示している。対話管理
手段7では、この情報を参照することによって、システ
ムに対する次の利用者の入力が予想できる。この例の場
合、もうひとつ前のシステムの応答が「1単語スコア小
の確認応答」であったとすると、ここでも次の利用者の
入力が、システムによる確認応答に対する「はい」か
「いいえ」であることが予想できる。
【0050】図19は、図1における音声認識手段4に
対応した第3の中途応答処理手段16の一構成例を示し
ている。認識不良判定手段161は、音声認識手段4に
おける認識結果のうち第1位の候補の単語系列とそのス
コアとを入力とし、主にスコアを検査することで認識不
良を判定して結果を出力するものとする。認識不良とし
ては例えば、1)入力全体のスコアがある基準値より小
さい場合、2)認識結果が一単語分であり、かつそのス
コアがある基準値より小さい場合、3)認識結果が一単
語分であり、かつそのスコアがほぼ等しい候補が2つあ
る場合、などが考えられる。認識不良判定手段161に
より認識不良が検出されると、応答文組立手段162は
各認識不良に対応した応答を生成する。
【0051】ここでは、応答文のテンプレートを予め用
意しておき、そのテンプレートを使って応答文を生成す
る方法を説明する。図20(a)に応答文テンプレート
の例を示す。各認識不良に対応した応答文は応答文テン
プレート格納手段163に予め格納されている。応答文
中に“*”が含まれる場合は、そこを認識結果で置き換
え、含まれない場合はそのまま応答文とする。例えば、
1)入力全体のスコアがある基準値より小さい場合、応
答文は「もう一度お願いします」となる。2)認識結果
が一単語でスコアがある基準値より小さい場合は“*”
部分を認識結果の単語に置き換えて(例えばスコアが低
い認識結果が「東京」のとき「東京ですか」となる)応
答文とする。3)認識結果が1単語分でそのスコアがほ
ぼ等しい候補が2つある場合は、2)の場合と同様にし
て2つの“*”をそれぞれ2つのスコアが等しかった単
語に置き換えて応答文とする。これらの結果を音声合成
手段11に渡す。
【0052】図20(b)は、図19の第3の中途応答
処理手段で処理が行なわれた場合に、対話管理手段7内
の対話状況記憶手段73に蓄えられる対話状況の一例を
示している。この例の場合、第3の中途応答処理手段1
6内の応答文組立手段162から「1単語スコア小の確
認応答」を音声合成手段11に出力したことを示してい
る。対話状況記憶手段73には、このときのスコア小の
認識候補も格納する。対話管理手段7では、この情報を
参照することによって、システムに対する次の利用者の
入力が確認に対する「はい」か「いいえ」であることが
予想できる。
【0053】このように、音声認識手段の結果の一部に
認識不良を検出したとき、当該一部の認識候補の適否を
利用者に確認する応答文を音声合成手段11に出力する
ことにより、利用者は、再度、全文を発声する必要がな
く、その部分のみを再発声すれば済む。
【0054】また、この中途応答処理により、利用者は
自分の音声が認識されているかどうかわかる。
【0055】図29に、第3の応答処理手段16の他の
構成例を示す。定型文検出手段164は、音声認識手段
4の出力から「こんにちわ」「おはよう」「こんばん
は」などの挨拶、「すいません」などの呼び掛け、とい
った定型句や定型文を検出する。その結果を受けて、応
答文組立手段165は、応答文テンプレート(図30
(a))を参考にして応答文を出力する。
【0056】例えば、音声認識手段4の出力からの「こ
んにちは」が検出されれば、「こんにちは」と応答す
る。このような第3の中途応答処理手段16の働きによ
り、構文解析手段5以降は使わずに効率的な応答ができ
る。
【0057】また、図示しないが、利用者の発声した音
声の認識結果自体を合成音声で利用者へ提示することも
可能である。これは、システムの音声出力であって、第
1の中途応答手段で説明したオウム返しが利用者の音声
そのものであるのとは異なる。図示しないが、表示手段
(ディスプレイ)が存在する場合には、その画面上に認
識結果を表示するようにしてもよい。
【0058】次に、「はい」や「いいえ」などの肯定や
否定、あるいは「お願いします」といった依頼、等の定
型句や定型文が検出された場合の処理を説明する。この
場合は、直前にシステムから確認の応答が出力されてい
る筈である。この対話状況は、対話管理手段7へ通知さ
れており、ここで、確認の対象となっている候補(例え
ば、認識スコアが小の単語)は、対話状況記憶手段73
に記憶されている候補である。例えば、音声認識手段4
でスコアが小さかった単語を利用者に確認することによ
り明確にし、その単語を含んだ、「はい」よりも1つ前
の利用者の入力文の認識結果を構文解析手段5に入力
し、それ以降の処理を再開する。この場合、対話管理手
段7から処理の中断および再開の指示を発行する態様
と、該当する中途応答処理手段からその指示を発行する
態様が考えられる。それぞれの音声対話システムの構成
を図34および図35に示す。
【0059】図21は、図1における構文解析手段5に
対応した第4の中途応答処理手段17の一構成例を示し
ている。構文不良判定手段171は、構文解析手段5で
得られた結果から構文的な不良を検出する。構文解析手
段5は、構文解析に成功した場合は構文情報を出力し、
失敗した場合は“構文情報なし”の結果を出力する。す
なわち、構文不良判定手段171は単に“構文情報な
し”の結果を得た場合に構文的な不良を検出する。応答
文組立手段172は、構文不良判定手段171より構文
的な不良の検出結果を得ると、応答文テンプレート格納
手段173に予め用意されている応答文(図22(a)
に応答文テンプレートの例を示す)から該当する分(例
えば、「そのような言い回しはわかりません」)を出力
する。得られた応答文を音声合成手段11に渡す。
【0060】図22(b)は、第4の中途応答処理手段
17で処理が行なわれた場合に、対話管理手段7内の対
話状況記憶手段73に蓄えられる対話状況の一例を示し
ている。この例の場合、第4の中途応答処理手段17内
の応答文組立手段172から「構文解析失敗の通知応
答」を音声合成手段11に出力したことを示している。
対話管理手段7では、この情報を参照することによっ
て、システムに対する次の利用者の入力が構文的な「言
い直し」であることが予想できる。
【0061】また、この中途応答処理により、利用者は
自分の音声が構文解析されているか否かわかる。
【0062】図23は、図1における第4の中途応答処
理手段17の他の例を示している。キーワードスコア不
良判定手段174は、構文解析手段5で得られた結果か
ら利用者の入力の中でキーワードになりうる単語に対し
て認識スコアの検査をする。そして、認識スコアがある
基準値より小さいキーワードを検出する。(なお、この
ときの前記第3の中途応答処理手段と重複しないように
するために、どちらか片方のみ実現してもよいし、前記
認識不良判定手段161で用いる基準値よりキーワード
スコア判定手段で用いる基準値の方を厳しく設定しても
よい。)応答文組立手段175は、キーワードスコア不
良判定手段174よりスコア不良のキーワード検出の結
果を得ると、応答文テンプレート格納手段176に予め
用意されている応答文(図24に応答文テンプレートの
例を示す)から該当する文を出力する。スコア不良のキ
ーワード(KW)が1つの場合は、前記第3の中途応答
処理手段16の場合と同様に、応答文組立手段175は
“*”部分をスコア不良のキーワードに置き換えて確認
の応答文を組み立てる。また、スコア不良のキーワード
が複数の場合は、“*”を入力文全体で置き換えて、入
力文全体の確認の応答文を組み立てることで対応でき
る。得られた応答文を音声合成手段11に渡す。
【0063】この中途応答処理からの応答により、利用
者は自分の音声が認識され、構文解析されているかどう
か分かる。
【0064】図24(b)は、第4の中途応答処理手段
17で処理が行なわれた場合に、対話管理手段7内の対
話状況記憶手段73に蓄えられる対話状況の一例を示
す。この例の場合、第4の中途処理手段17内の応答文
組立手段175から「1KWの確認応答」を音声合成手
段11に出力したことを示している。対話管理手段7で
は、この情報を参照することによって、システムに対す
る次の利用者の入力が、確認応答に対する「はい」か
「いいえ」であることが予想できる。
【0065】図25は、図1における意図抽出手段6に
対応した第5の中途応答処理手段18の一構成例を示し
ている。意味不良判定手段181は、意図抽出手段6よ
り出力される意図抽出結果に基づいて意図不良を検出す
る。意味不良判定手段181で意図不良が検出される
と、生成応答手段182は応答文テンプレート格納手段
183に予め用意されている応答文(図26(a)に応
答文テンプレートの例を示す)から該当する文(例えば
「おっしゃることがわかりません」)を出力する。得ら
れた応答文を音声合成手段11に渡す。
【0066】図26(b)は第5の中途応答処理手段1
8で処理が行なわれた場合に、対話管理手段7内の対話
状況記憶手段73に蓄えられる対話状況の一例を示す。
この例の場合、第5の中途応答処理手段18内の応答文
組立手段182から「意図抽出失敗の通知応答」を音声
合成手段11に出力したことを示している。対話管理手
段7では、この情報を参照することによって、システム
に対する次の利用者の入力が意味的な言い直しであるこ
とが予想できる。
【0067】この中途応答処理により、利用者は自分の
音声が意味理解されているかどうかわかる。
【0068】図31は、第5の応答処理手段の他の例を
示す。同義語検出手段184は、同義語辞書格納手段1
87に格納されている同義語辞書内の表現と、意図抽出
手段6の出力内に含まれる単語の表現を比較することに
より、意図抽出手段6の出力から同義語を持つ単語を検
出する。図32に同義語辞書の例を示す。ひとつの単語
に対する表現の個数は2つとしているが、これに限定さ
れるものではない。同義語検出手段184の結果を受け
て、応答文組立手段185は、応答文テンプレート格納
手段186に格納されている応答文テンプレート(図3
3(a))を参照して、応答文を出力する。このとき、
応答文テンプレートで[*]で表現された部分は、同義
語辞書を参照して検出された単語の別の表現に置き換え
られる。
【0069】さらに、この処理の後に、対話管理手段7
に送られ、対話状況記憶手段73に保持される対話状況
の例を図33(b)に示す。この対話状況としては、応
答の種類の他に確認の対象となった単語の情報も保持さ
れる。
【0070】以上説明した各中途応答処理手段の処理の
進行は、対応する入力系の手段からの出力に基づいて動
作するものであるが、両者の動作自体は独立に/並列に
動作可能な構成としている。例えば、第2の中途応答処
理手段が分析手段の結果を受け取って相槌応答を返す処
理を実行中でも、音声分析手段以降の音声認識手段や構
文解析手段、意図抽出手段の処理を続けることが可能で
ある。相槌応答中に、音声分析手段以降の処理が行なわ
れずにいると、応答速度が遅くなってしまい使い勝手が
悪くなるである。
【0071】図36に、本発明のシステムのハードウエ
ア構成の一例を示す。その最小構成として、音声入出力
装置の利用可能な計算機1台で実現できる。音声入出力
装置は、マイク1、スピーカ13、A/D変換装置2
1、D/A変換装置121から構成される。計算機本体
としては、既存のワークステーション等の基本構成があ
ればよく、CPU2101により主記憶装置202、外
部記憶装置203、表示装置204が制御できる構成と
なる。主記憶装置202は、実行中のプログラムを保持
し、外部記憶装置203はプログラムやデータを蓄えて
おくためのハードディスク等の装置である。システム応
答の表示などに必要であれば、表示装置204としてデ
ィスプレイなどが使える。
【0072】なお、図36は直接示していないが、A/
D変換装置とD/A変換装置は計算機に対して外付けの
ものでもよいし、これらが組み込まれているワークステ
ーションやパーソナルコンピュータでもよい。
【0073】図37に、本システムの利用者へのフィー
ドバック処理の内容をまとめて図表として示す。
【0074】本実施例におけるフィードバック処理は、
対話状況独立型、対話状況準独立型および対話依存型の
3つの種類に分類することができる。対話状況独立型
は、各中途応答処理手段が対話管理手段と情報をやりと
りすることなく、(勝手に)処理できるフィードバック
処理に関するものである。対話状況準独立型は、各中途
応答処理手段が勝手に処理することはできるが、その対
話状況は対話管理手段へ通知するフィードバック処理に
関するものである。この場合、図のシステムブロック図
中では、該当する中途応答処理手段から対話管理部へ一
方向の矢印を用いて、信号(または制御)の流れを示し
ている。対話状況依存型は、各中途応答処理手段が勝手
に処理することのできないフィードバック処理に関する
ものであり、この処理では、対話管理手段7内の対話状
況記憶手段で保持されている対話状況の情報を用いる。
システムブロック図中では双方向の矢印を用いている。
【0075】本発明の音声対話システムの処理はソフト
ウエアで実現される。そのソフトウエアは、単一のプロ
グラムでもよいが、複数のプログラムを同じに実行で
き、プログラム間でデータの受け渡しができる構成でも
よい。例えば、複数のプログラムを同時に実行できるO
Sとして「UNIX」(AT&Tベル研究所の商標)が
あり、ほとんどのワークステーションで使用できる。ま
た、計算機1台あたりの処理能力によっては、複数の計
算機を用いる分散処理の構成でもよい。
【0076】さらに、前記中途応答処理手段の構成例の
中で複数の応答生成手段を個別に示してきたが、これら
の機能はほぼ同じものとなるので、これらを一つに共通
のものとして用意しても良い。
【0077】
【発明の効果】本発明によれば、利用者がシステムの処
理状態を容易に把握でき、システムに話しかけ易くな
る。結果的に、利用者とシステムとの間で円滑な対話が
実現され、作業を効率的に完了できる効果が得られる。
【図面の簡単な説明】
【図1】本発明による音声対話システムの構成の一実施
例を示すブロック図である。
【図2】図1の音声認識手段の構成例を示すブロック図
である。
【図3】図1の構文解析手段の構成例を示すブロック図
である。
【図4】図1の意図抽出手段の構成例を示すブロック図
である。
【図5】図4のキーワード格納手段に格納されるキーワ
ードの例の説明図である。
【図6】図1の対話管理手段の構成例を示すブロック図
である。
【図7】図6の状態遷移ネット格納手段に格納される状
態遷移ネットの説明図である。
【図8】図6の状態遷移ネットの基本遷移を示す説明図
である。
【図9】図6のコマンド生成手段が生成するコマンドの
一例の説明図である。
【図10】図6の解答受理手段が受け取る解の例を示す
説明図である。
【図11】図1の問題解決手段の構成例を示すブロック
図である。
【図12】図11の交通情報データベースの一例を示す
説明図である。
【図13】図1の応答文生成手段の構成例を示すブロッ
ク図である。
【図14】図13の応答文テンプレート格納手段に格納
されるテンプレートの例の説明図である。
【図15】図1の音声合成手段の構成例を示すブロック
図である。
【図16】図1の第1の中途応答処理手段の構成例を示
すブロック図である。
【図17】図1の第2の中途応答処理手段の構成例を示
すブロック図である。
【図18】図1の第2の中途応答処理手段の他の構成例
を示すブロック図である。
【図19】図1の第3の中途応答処理手段の構成例を示
すブロック図ある。
【図20】図19の応答文テンプレート格納手段に格納
されるテンプレートの例(a)および対話状況の一例
(b)の説明図である。
【図21】図1の第4の中途応答処理手段の構成例を示
すブロック図である。
【図22】図21の応答文テンプレート格納手段に格納
されるテンプレートの例(a)および対話状況の一例
(b)の説明図である。
【図23】図1の第4の中途応答処理手段の他の構成例
を示すブロック図である。
【図24】図23の応答文テンプレート格納手段に格納
されるテンプレートの例(a)および対話状況の一例
(b)の説明図である。
【図25】図1の第5の中途応答処理手段の構成例を示
すブロック図である。
【図26】図25の応答文テンプレート格納手段に格納
されるテンプレートの例(a)および対話状況の一例
(b)の説明図である。
【図27】図1の第2の中途応答処理手段の他の構成例
を示すブロック図である。
【図28】図27の応答文テンプレート格納手段に格納
されるテンプレートの例(a)および対話状況の一例
(b)の説明図である。
【図29】図1の第3の中途応答処理手段の他の構成例
を示すブロック図である。
【図30】図29の応答文テンプレート格納手段に格納
されるテンプレートの例(a)および対話状況の一例
(b)の説明図である。
【図31】図1の第5の中途応答処理手段のの他の構成
例を示すブロック図である。
【図32】図31の同義語辞書の一例の説明図である。
【図33】図31の応答文テンプレートの例(a)およ
び対話状況の一例(b)の説明図である。
【図34】本発明の他の音声対話システムのブロック図
である。
【図35】本発明のさらに他の音声対話システムのブロ
ック図である。
【図36】図1の実施例のハードウエア構成例を示すブ
ロック図である。
【図37】本発明の音声対話システムにおけるフィード
バック処理の分類の説明図である。
【符号の説明】
1…マイク、2…音声入力手段、3…音声分析手段、4
…音声認識手段、5…構文解析手段、6…意図抽出手
段、7…対話管理手段、8…問題解決手段、10…応答
文生成手段、11…音声合成手段、12…音声出力手
段、13…スピーカ、14・15・16・17・18…
中途応答処理手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 3/16 330 K 7323−5B 17/28 G10L 3/00 R 531 D 561 G 571 H 9194−5L G06F 15/403 330 C

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】利用者の発話した音声を入力する音声入力
    手段と、 該音声入力手段により入力された音声を分析する音声分
    析手段と、 該音声分析手段からの分析結果を基に音声を認識し、一
    つまたは複数の単語系列を出力する音声認識手段と、 前記一つまたは複数の単語系列に対して構文解析をし、
    一つまたは複数の構文情報を出力する構文解析手段と、 前記一つまたは複数の構文情報から利用者の意図を抽出
    する意図抽出手段と、 前記利用者の意図に基づいてシステムの応答内容を生成
    し、あるいは、システムの応答内容を生成するために問
    題解決が必要な場合には、問題解決するためのコマンド
    を生成し、かつ、該コマンドに対して得られる解も含め
    てシステムの応答内容を生成する対話管理手段と、 前記コマンドに含まれる問題の解を求める問題解決手段
    と、 前記対話管理手段から得られる前記システムの応答内容
    より応答文を生成する応答文生成手段と、 前記応答文生成手段から得られる応答文を音声波形に変
    換する音声合成手段と、 前記音声合成手段より得られる音声波形を音声として出
    力する音声出力手段と、 前記音声入力手段、前記音声分析手段、前記音声認識手
    段、前記構文解析手段、前記意図抽出手段の少なくとも
    1つの処理結果を入力として、該処理結果を前記対話管
    理手段、前記音声合成手段および前記音声出力手段の少
    なくとも1つへ出力する少なくとも1つの中途応答処理
    手段とを備え、 前記音声入力手段、前記音声分析手段、前記音声認識手
    段、前記構文解析手段、前記意図抽出手段の少なくとも
    1つの処理結果に応じて、現在のシステムの処理状態を
    利用者に知らしめる応答を発声することを特徴とする音
    声対話システム。
  2. 【請求項2】前記1つあるいは複数の中途応答処理手段
    は、利用者との対話の状態に関する情報を前記対話管理
    手段との間で授受し、システムの処理状態に依存して確
    認や選択要求の応答を適宜発生可能とする構成としたこ
    とを特徴とする請求項1記載の音声対話システム。
  3. 【請求項3】前記中途応答処理手段の1つは、前記音声
    入力手段により入力された音声データを一時的に保存
    し、該保存した音声データをそのまま前記音声出力手段
    に出力することにより、前記音声入力手段の処理状態を
    利用者に知らしめることを特徴とする請求項1記載の音
    声対話システム。
  4. 【請求項4】前記中途応答処理手段の1つは、前記音声
    分析手段の結果から利用者の発話した音声にポーズを検
    出したとき、予め定めた相槌の応答文を前記音声合成手
    段に出力することを特徴とする請求項1または2記載の
    音声対話システム。
  5. 【請求項5】前記中途応答処理手段の1つは、前記音声
    分析手段の結果から小さい音声を検出したとき、より大
    きな発声を利用者に要求する応答文を前記音声合成手段
    に出力することを特徴とする請求項1、2、3または4
    記載の音声対話システム。
  6. 【請求項6】前記中途応答処理手段の1つは、前記音声
    分析手段の結果から予め定めた時間以上、音声の入力を
    検出しないとき、利用者に入力を促す応答文を前記音声
    合成手段に出力することを特徴とする請求項1、2、
    3、4または5記載の音声対話システム。
  7. 【請求項7】前記中途応答処理手段の1つは、前記音声
    認識手段の結果から認識不良を検出したとき、再発声を
    利用者に要求する応答文を前記音声合成手段に出力する
    ことを特徴とする請求項1〜6のいずれかに記載の音声
    対話システム。
  8. 【請求項8】前記中途応答処理手段の1つは、前記音声
    認識手段の結果の一部に認識不良を検出したとき、当該
    一部の認識候補の適否を利用者に確認する応答文を前記
    音声合成手段に出力することを特徴とする請求項1〜7
    のいずれかに記載の音声対話システム。
  9. 【請求項9】前記中途応答処理手段の1つは、前記構文
    解析手段の結果から構文的な不良を検出したき、構文解
    析不能を利用者に通知する応答文を前記音声合成手段に
    出力することを特徴とする請求項1〜8のいずれかに記
    載の音声対話システム。
  10. 【請求項10】前記中途応答処理手段の1つは、前記構
    文解析手段の結果から1つあるいは複数の認識スコアの
    小さい名詞あるいは動詞を検出したとき、該名詞あるい
    は動詞を利用者に確認する応答文を前記音声合成手段に
    出力することを特徴とする請求項1〜9のいずれかに記
    載の音声対話システム。
  11. 【請求項11】前記中途応答処理手段の1つは、前記意
    図抽出手段の結果から意味的な不良を検出したき、意図
    抽出不能を利用者に通知する応答文を前記音声合成手段
    に出力することを特徴とする請求項1〜10のいずれか
    に記載の音声対話システム。
  12. 【請求項12】前記中途応答処理手段の1つは、同義語
    検出手段を有し、前記意図抽出手段の結果から得られた
    単語に同義語が存在する場合に、その同義語で前記単語
    を言い換えて利用者の意図を確認する応答文を前記音声
    合成手段に出力することを特徴とする請求項1〜11の
    いずれかに記載の音声対話システム。
JP00958694A 1994-01-31 1994-01-31 音声対話システム Expired - Fee Related JP3454897B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00958694A JP3454897B2 (ja) 1994-01-31 1994-01-31 音声対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00958694A JP3454897B2 (ja) 1994-01-31 1994-01-31 音声対話システム

Publications (2)

Publication Number Publication Date
JPH07219961A true JPH07219961A (ja) 1995-08-18
JP3454897B2 JP3454897B2 (ja) 2003-10-06

Family

ID=11724433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00958694A Expired - Fee Related JP3454897B2 (ja) 1994-01-31 1994-01-31 音声対話システム

Country Status (1)

Country Link
JP (1) JP3454897B2 (ja)

Cited By (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10133850A (ja) * 1996-10-31 1998-05-22 Toshiba Corp 音声入力機能を有するコンピュータ及び音声制御方法
WO2001003006A1 (fr) * 1999-07-06 2001-01-11 Cai Co., Ltd. Systeme et procede de dialogue en langage naturel, par ordinateur et support enregistre
US6230132B1 (en) * 1997-03-10 2001-05-08 Daimlerchrysler Ag Process and apparatus for real-time verbal input of a target address of a target address system
WO2003010756A1 (fr) * 2001-07-27 2003-02-06 Sony Corporation Programme, appareil et procede d'interaction vocale
JP2003208196A (ja) * 2002-01-11 2003-07-25 Matsushita Electric Ind Co Ltd 音声対話方法および装置
JP2005196134A (ja) * 2003-12-12 2005-07-21 Toyota Central Res & Dev Lab Inc 音声対話システム及び方法並びに音声対話プログラム
JP2008039928A (ja) * 2006-08-02 2008-02-21 Xanavi Informatics Corp 音声対話装置および音声対話プログラム
WO2009008115A1 (ja) * 2007-07-09 2009-01-15 Mitsubishi Electric Corporation 音声認識装置およびナビゲーションシステム
JP2009211629A (ja) * 2008-03-06 2009-09-17 National Institute Of Information & Communication Technology 対話装置、重み情報学習装置、対話方法、重み情報学習方法、およびプログラム
JP2010015266A (ja) * 2008-07-01 2010-01-21 Universal Entertainment Corp 会話制御システム、並びに端末装置
JP2010079574A (ja) * 2008-09-25 2010-04-08 Taito Corp デジタルストーリー提供システム、デジタルストーリー提供方法、及びこの方法をコンピュータシステムに実行させるためのコンピュータプログラム
JP2010197858A (ja) * 2009-02-26 2010-09-09 Gifu Univ 音声対話システム
WO2014083945A1 (ja) * 2012-11-30 2014-06-05 三菱電機株式会社 意図推定装置および意図推定方法
JP2014222509A (ja) * 2010-01-18 2014-11-27 アップル インコーポレイテッド インテリジェント自動アシスタント
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
WO2019059185A1 (ja) * 2017-09-19 2019-03-28 株式会社 豆蔵 情報処理装置、情報処理システム、情報処理方法及びプログラム
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
JP2019521415A (ja) * 2016-05-17 2019-07-25 グーグル エルエルシー メッセージ分類に基づくメッセージ交換スレッドの自動的拡張
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP2019185230A (ja) * 2018-04-04 2019-10-24 学校法人明治大学 会話処理装置、会話処理システム、会話処理方法及びプログラム
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112006000322T5 (de) * 2005-02-04 2008-04-03 Xanavi Informatics Corp., Zama Audioerkennungssystem zur Erzeugung von Antwort-Audio unter Verwendung extrahierter Audiodaten

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6146521A (ja) * 1984-08-13 1986-03-06 Hitachi Ltd 会話型音声入出力装置
JPS63153631A (ja) * 1986-12-17 1988-06-27 Fujitsu Ltd 自然言語対話処理制御方式
JPS63163498A (ja) * 1986-12-26 1988-07-06 株式会社日立製作所 音声ダイヤル装置
JPS6452199A (en) * 1987-08-24 1989-02-28 Hitachi Ltd Voice output device
JPH02265000A (ja) * 1989-04-06 1990-10-29 Canon Inc 音声対話装置
JPH03248268A (ja) * 1990-02-26 1991-11-06 Nec Corp 音声対話処理方式
JPH04158476A (ja) * 1990-10-22 1992-06-01 Sharp Corp 音声対話装置
JPH05143811A (ja) * 1991-11-20 1993-06-11 Tokico Ltd 発券処理システム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6146521A (ja) * 1984-08-13 1986-03-06 Hitachi Ltd 会話型音声入出力装置
JPS63153631A (ja) * 1986-12-17 1988-06-27 Fujitsu Ltd 自然言語対話処理制御方式
JPS63163498A (ja) * 1986-12-26 1988-07-06 株式会社日立製作所 音声ダイヤル装置
JPS6452199A (en) * 1987-08-24 1989-02-28 Hitachi Ltd Voice output device
JPH02265000A (ja) * 1989-04-06 1990-10-29 Canon Inc 音声対話装置
JPH03248268A (ja) * 1990-02-26 1991-11-06 Nec Corp 音声対話処理方式
JPH04158476A (ja) * 1990-10-22 1992-06-01 Sharp Corp 音声対話装置
JPH05143811A (ja) * 1991-11-20 1993-06-11 Tokico Ltd 発券処理システム

Cited By (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10133850A (ja) * 1996-10-31 1998-05-22 Toshiba Corp 音声入力機能を有するコンピュータ及び音声制御方法
US6230132B1 (en) * 1997-03-10 2001-05-08 Daimlerchrysler Ag Process and apparatus for real-time verbal input of a target address of a target address system
WO2001003006A1 (fr) * 1999-07-06 2001-01-11 Cai Co., Ltd. Systeme et procede de dialogue en langage naturel, par ordinateur et support enregistre
WO2003010756A1 (fr) * 2001-07-27 2003-02-06 Sony Corporation Programme, appareil et procede d'interaction vocale
US7349850B2 (en) 2001-07-27 2008-03-25 Sony Corporation Program, speech interaction apparatus, and method
JP2003208196A (ja) * 2002-01-11 2003-07-25 Matsushita Electric Ind Co Ltd 音声対話方法および装置
JP2005196134A (ja) * 2003-12-12 2005-07-21 Toyota Central Res & Dev Lab Inc 音声対話システム及び方法並びに音声対話プログラム
JP4729902B2 (ja) * 2003-12-12 2011-07-20 株式会社豊田中央研究所 音声対話システム
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP2008039928A (ja) * 2006-08-02 2008-02-21 Xanavi Informatics Corp 音声対話装置および音声対話プログラム
WO2009008115A1 (ja) * 2007-07-09 2009-01-15 Mitsubishi Electric Corporation 音声認識装置およびナビゲーションシステム
JP2009211629A (ja) * 2008-03-06 2009-09-17 National Institute Of Information & Communication Technology 対話装置、重み情報学習装置、対話方法、重み情報学習方法、およびプログラム
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
JP2010015266A (ja) * 2008-07-01 2010-01-21 Universal Entertainment Corp 会話制御システム、並びに端末装置
JP2010079574A (ja) * 2008-09-25 2010-04-08 Taito Corp デジタルストーリー提供システム、デジタルストーリー提供方法、及びこの方法をコンピュータシステムに実行させるためのコンピュータプログラム
JP2010197858A (ja) * 2009-02-26 2010-09-09 Gifu Univ 音声対話システム
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
JP2014222509A (ja) * 2010-01-18 2014-11-27 アップル インコーポレイテッド インテリジェント自動アシスタント
US12087308B2 (en) 2010-01-18 2024-09-10 Apple Inc. Intelligent automated assistant
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9530405B2 (en) 2012-11-30 2016-12-27 Mitsubishi Electric Corporation Intention estimating device and intention estimating method
WO2014083945A1 (ja) * 2012-11-30 2014-06-05 三菱電機株式会社 意図推定装置および意図推定方法
JP5921716B2 (ja) * 2012-11-30 2016-05-24 三菱電機株式会社 意図推定装置および意図推定方法
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US11222030B2 (en) 2016-05-17 2022-01-11 Google Llc Automatically augmenting message exchange threads based on tone of message
US11762865B2 (en) 2016-05-17 2023-09-19 Google Llc Automatically augmenting message exchange threads based on tone of message
US10769155B2 (en) 2016-05-17 2020-09-08 Google Llc Automatically augmenting message exchange threads based on tone of message
US12093270B2 (en) 2016-05-17 2024-09-17 Google Llc Automatically augmenting message exchange threads based on tone of message
JP2019521415A (ja) * 2016-05-17 2019-07-25 グーグル エルエルシー メッセージ分類に基づくメッセージ交換スレッドの自動的拡張
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
JP2019056969A (ja) * 2017-09-19 2019-04-11 株式会社豆蔵 情報処理装置、情報処理システム、情報処理方法及びプログラム
WO2019059185A1 (ja) * 2017-09-19 2019-03-28 株式会社 豆蔵 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP2019185230A (ja) * 2018-04-04 2019-10-24 学校法人明治大学 会話処理装置、会話処理システム、会話処理方法及びプログラム

Also Published As

Publication number Publication date
JP3454897B2 (ja) 2003-10-06

Similar Documents

Publication Publication Date Title
JP3454897B2 (ja) 音声対話システム
JP4849663B2 (ja) 会話制御装置
JP4888996B2 (ja) 会話制御装置
JP4846336B2 (ja) 会話制御装置
JP4849662B2 (ja) 会話制御装置
EP1162602B1 (en) Two pass speech recognition with active vocabulary restriction
JP4186992B2 (ja) 応答生成装置、方法及びプログラム
JP4729902B2 (ja) 音声対話システム
JP2001005488A (ja) 音声対話システム
WO2006054724A1 (ja) 音声認識装置及び方法ならびにプログラム
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP2001101187A (ja) 翻訳装置および翻訳方法、並びに記録媒体
JP2007114621A (ja) 会話制御装置
JP2010048953A (ja) 対話文生成装置
JP2000200273A (ja) 発話意図認識装置
JP2006189730A (ja) 音声対話方法および音声対話装置
JP3795350B2 (ja) 音声対話装置、音声対話方法及び音声対話処理プログラム
JP2004045900A (ja) 音声対話装置及びプログラム
JP3378595B2 (ja) 音声対話システムおよびその対話進行制御方法
JP3468572B2 (ja) 対話処理装置
Ion et al. A dialog manager for micro-worlds
JP2003030187A (ja) 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム
JP4220151B2 (ja) 音声対話装置
JP4475628B2 (ja) 会話制御装置、会話制御方法並びにこれらのプログラム
JPH07191687A (ja) 自然言語処理装置及びその方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees