JP5696638B2 - 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム - Google Patents
対話制御装置、対話制御方法及び対話制御用コンピュータプログラム Download PDFInfo
- Publication number
- JP5696638B2 JP5696638B2 JP2011225261A JP2011225261A JP5696638B2 JP 5696638 B2 JP5696638 B2 JP 5696638B2 JP 2011225261 A JP2011225261 A JP 2011225261A JP 2011225261 A JP2011225261 A JP 2011225261A JP 5696638 B2 JP5696638 B2 JP 5696638B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- service
- unit
- information
- presentation information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
この対話制御装置は、ユーザが過去に情報の提供を受けた各サービス供給源に関連するキーワードをそのサービス供給源と関連付けて記憶しておく。そしてこの対話制御装置は、現在提供されている情報のサービス供給源に関連する特定のキーワードを検出する際の重み付けを、そのサービス供給源とは異なるサービス供給源に関連するキーワードよりも大きくする。これにより、この対話制御装置は、ユーザが意図しないサービス供給源の切り替わりを生じ難くすることで、ユーザが所望する情報を正確に提供可能とする。
端末2とサーバ3とは、例えば、公衆通信回線などの通信ネットワーク4を介して互いに通信可能に接続されている。さらに、サーバ3は、通信ネットワーク4を介して、Webサーバまたはftpサーバなどの外部情報源5と通信可能に接続されている。なお、端末2とサーバ3とは、通信ネットワーク4とは別個の専用線などの通信回線によって接続されていてもよい。
なお、認識候補単語及び提示情報の詳細については後述する。
処理部25が有するこれらの各部は、例えば、処理部25が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。なお、処理部25が有するこれらの各部は、それぞれ、別個の回路として、端末2に実装されてもよい。さらに、処理部25が有するこれらの各部は、その各部の機能を実現する一つの集積回路として端末2に実装されてもよい。
本実施形態では、音声認識部26は、認識対象となる認識語彙を格納した単語辞書と、予め作成された音響モデルを用いて認識候補単語を検出する。音響モデルは、例えば、単語の発音を音素または音節といった単位音ごとに区分し、その単位音の順序に従って、その単位音に対応する単位音響モデルを連結することにより生成され、予め、記憶部24に記憶される。この単位音響モデル及び音響モデルは、例えば、それぞれ、隠れマルコフモデル(Hidden Markov Model, HMM)により表される。音声認識部26は、単位音響モデルを表すHMMを用いて、音声データの所定の区間から抽出される1以上の特徴量に基づいて、特定の単位音に対するその所定の区間が推定音である確率または尤度を算出する。そして音声認識部26は、単語辞書に含まれる単語ごとに単位音を連結して生成した音響モデルについて、得られた確率または尤度の高いものから、認識候補単語として出力する。なお、以下では、音声認識部26は尤度を算出するものとして説明する。
なお、単語辞書は、サーバ3にて検索されるサービスの種類及び提供される情報を特定するために用いられる全てのキーワードについて準備されることが好ましい。
音声合成部27は、先ず、テキスト情報を表音情報に変換する。表音情報は、テキスト情報に含まれる原文の読みなどを表す情報であり、例えば、原文の読みをカタカナ文字で表し、さらにアクセントの位置及び区切りの位置を追加した情報である。表音情報は、例えば、電子情報技術産業協会規格TT-6004(車載用音声合成記号規格)に従って表記される。また表音情報は、テキスト情報に含まれる文中でのアクセントの位置、区切り位置と、各音素の読みが分かる他の表記形式に従って記述されてもよい。
音声合成部27は、音素ごとに、目標韻律の音素長及びピッチ周波数に最も近い音声波形を、例えばパターンマッチングにより音声波形辞書に登録されている複数の音声波形の中から選択する。そのために、音声合成部27は、記憶部24から音声波形辞書を読み込む。音声波形辞書は、複数の音声波形及び各音声波形の識別番号を記録する。また音声波形は、例えば、一人以上のナレータが様々なテキストを読み上げた様々な音声を録音した音声信号から、音素単位で取り出された波形信号である。
さらに、音声合成部27は、音素ごとに選択された音声波形を目標韻律に沿って接続できるようにするため、それら選択された音声波形と目標韻律に示された対応する音素の波形パターンとのずれ量を、波形変換情報として算出してもよい。
音声合成部27は、音素ごとに選択された音声波形の識別番号を含む波形生成情報を作成する。波形生成情報は、波形変換情報をさらに含んでもよい。
音声合成部27は、合成音声信号を音声出力部22へ出力する。
さらに、提示情報にゲームなどのアプリケーションプログラムが含まれる場合、処理部25は、そのアプリケーションプログラムを実行し、その実行結果に応じた画像及び音声信号を、表示部または音声出力部へ出力してもよい。
制御部33が有するこれらの各部は、例えば、制御部33が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。なお、制御部33が有するこれらの各部は、それぞれ、別個の回路として、サーバ3に実装されてもよい。さらに、サーバ3が有するこれらの各部は、その各部の機能を実現する一つの集積回路としてサーバ3に実装されてもよい。
認識キーワード決定部34は、未検証の認識候補単語の中から、今から検証する認識候補単語を決定する(ステップS102)。その際、認識キーワード決定部34は、例えば、各認識候補単語に対して、音声認識部26により算出された尤度が高い方から順に、検証する認識候補単語を決定してもよい。
また認識キーワード決定部34は、キーワードリストに登録されたキーワードで、かつステップS102で決定された認識候補単語との類似度の検証が行われていないキーワードの中から、今から検証するキーワードを決定する(ステップS103)。
一方、未検証のキーワードが無い場合(ステップS108−No)、認識キーワード決定部34は、未検証の認識候補単語が有るか否か判定する(ステップS109)。未検証の認識候補単語がある場合(ステップS109−Yes)、認識キーワード決定部34は、ステップS102以降の処理を繰り返す。
一方、未検証の認識候補単語が無い場合(ステップS109−No)、認識キーワード決定部34は、キーワードリストを参照して、ベストスコアに対応するキーワードと関連付けられたサービス識別子及び情報識別子を特定する(ステップS110)。そして認識キーワード決定部34は、そのサービス識別子及び情報識別子を提示情報取得部35へ通知する。
タイプ識別子は、提示情報のタイプを表す。本実施形態では、提示情報のタイプには、textタイプとlinkタイプが含まれる。textタイプは、提示情報が情報本体のみを含むことを表す。一方、linkタイプは、提示情報がリンク先に存在し、そのリンク先のアドレスを含むことを表す。リンク先のアドレスは、例えば、ユニフォームリソースロケータ(Uniform Resource Locator、URL)である。
なお、提示情報のタイプには、提示情報に画像データまたはオーディオデータといった、テキスト情報以外の情報が含まれることを表すデータタイプが含まれてもよい。さらに、提示情報のタイプには、提示情報にアプリケーションプログラムが含まれることを表すプログラムタイプが含まれてもよい。提示情報がデータタイプまたはプログラムタイプであっても、本実施形態では、提示情報にはテキスト情報も含まれる。この場合のテキスト情報は、例えば、画像データまたはオーディデータのタイトル、またはアプリケーションプログラムの名称であってもよい。
また、提示情報取得部35は、追加登録された情報本体に対応する提示情報の識別番号を認識キーワード抽出部38へ通知する。
例えば、リンク先のアドレスが"http://www.tennki.jp/weather/west.html"である場合、サービス識別子として、"tennki.jp"が抽出される。また、情報識別子として、"west"が抽出される。
なお、リンク先のアドレスが、他の形式、例えば、IPアドレスを用いて表現されている場合には、サービス識別部36は、そのIPアドレスをサービス識別子として抽出してもよい。
本実施形態では、サービス変化検出部37は、サービス履歴リストから、最新の提示情報に関するサービス識別子と、その1回前に提供された提示情報に関するサービス識別子とを読み込む。そしてサービス変化検出部37は、その二つのサービス識別子が一致すれば、サービス供給源に変更は無いと判定し、一方、その二つのサービス識別子が一致しなければ、サービス供給源に変更が生じたと判定する。
一方、第1の判定結果が、最新の提示情報に関するサービス識別子と、一回前のサービスに関するサービス識別子とが一致していないことを示している「不一致」である場合は瞬間的にサービスが切り替わっていることになる。しかし、第2の判定結果が、最新のN回前に継続的に提供された提示情報に関するサービス識別子と、最新を含むM回の間に継続的に提供された提示情報に関するサービス識別子とが一致していることを示している「一致」である場合は、その第2の判定結果は、過去から現在に渡って大局的に同一サービスが提供されていることを示している。そのため、この場合には、サービス変化検出部37は、第1の判定結果が「不一致」である原因が誤ってサービスが切り替わったことによるとみなす。そしてサービス変化検出部37は、サービスの切り替わりではなく、最新のサービス識別子について「サービス変化無し」として出力する。
さらに、第1の判定結果が「不一致」であるだけでなく、第2の判定結果も、最新のN回前に継続的に提供された提示情報に関するサービス識別子と、最新を含むM回の間に継続的に提供された提示情報に関するサービス識別子とが一致していないことを示している「不一致」となることがある。この場合は、その「不一致」との第2の判定結果は大局的にもサービスが切り替わったことを示唆している。しかし、第1の判定結果が「不一致」であるため、まだ安定して継続したサービスが提供されているわけではない。従って、サービス変化検出部37は、サービス変化の可能性はあるが、確定していない状態である、「サービス変化不確定」を出力する。
ケース1: A→A→A→A→|→A
ケース2: A→A→A→A→|→B
ケース3: A→A→A→B→|→B
ケース4: A→A→A→B→|→A
ケース1の場合、最新の提示情報に関するサービス識別子がA,1回前の提示情報に関するサービス識別子もAであるので、第1の判定結果は「一致」となる。同様にしてケース2〜4についての第1の判定結果は、それぞれ、「不一致」、「一致」、「不一致」となる。
以上より、過去に継続的に提供された提示情報に関するサービス識別子と、現在継続的に提供されている提示情報に関するサービス識別子とが一致しているかどうかの第2の判定結果は、ケース1の場合、過去に継続的に提供された識別子、現在継続的に提供されている識別子は共にAであるので、「一致」となる。同様に、ケース2〜4についての第2の判定結果は、それぞれ、「不一致」、「不一致」、「一致」となる。
ケース1: A→A→A→A→|→A 第1:一致 第2:一致 → サービス変化無
ケース2: A→A→A→A→|→B 第1:不一致 第2:不一致 → サービス変化不確定
ケース3: A→A→A→B→|→B 第1:一致 第2:一致 → サービス変化無
ケース4: A→A→A→B→|→A 第1:不一致 第2:一致 → サービス変化無
このような構成により、ケース4のように、大局的にはAのサービスが継続しており、何らかの誤りでBのサービスへ切り替わっている場合において、最新と1回前のサービス識別子が異なるため一見サービス変化が生じているように見える場合でも、サービス変化検出部37は、その誤りに引きずられずに正確なサービス変化検出が行える。
次に、認識キーワード抽出部38は、各品詞を、例えば、空白、助詞または句読点などの文節の区切りとなるものが検出される度にまとめることで、文節単位にまとめ、得られた各文節をキーワードとする。また認識キーワード抽出部38は、キーワードごとに、そのキーワードに含まれる各品詞に対して、その品詞に対応した品詞の重み係数を、記憶部32に記憶された品詞重みテーブルを参照することにより決定する。
本実施形態では、重み更新部39は、提示情報のサービス供給源が変更されていない場合、新たに登録されたキーワード以外の各キーワードに対する時間重み係数に、0より大きく、かつ1未満の係数αを乗じる。これにより、キーワードがキーワードリストに登録されてからの経過時間が長くなるほど、そのキーワードに対する時間重み係数は小さくなる。その結果、キーワードリストに登録されてからの経過時間が短いキーワードほど、認識キーワードとして検出され易くなる。係数αは、例えば、0.9に設定される。
図10(a)に示されたキーワードリスト1000では、最新の提示情報から抽出された1以上のキーワードが一番下の行1001に追加登録されている。この場合、重み更新部39は、行1002以上の各行のキーワードに対応する時間重み係数に係数αとして0.9を乗じる。その結果、図10(b)に示されたキーワードリスト1010のように、行1002以上の各行の時間重み係数は、元の値に対して0.9倍された値となる。
図11(a)に示されたキーワードリスト1100では、最新の提示情報から抽出された1以上のキーワードが一番下の行1101に追加登録されている。この場合、重み更新部39は、行1101に格納されたサービス識別子"news.jp"と同一のサービス識別子が格納された各行の時間重み係数を0.9nに設定する。一方、サービス識別子"news.jp"と異なるサービス識別子が格納された各行のキーワードに対応する時間重み係数に0.5を乗じる。その結果、各キーワードに対する時間重み係数は、図11(b)に示されたキーワードリスト1110のようになる。その結果、最新の提示情報の供給元である現在のサービス供給源に関連するキーワードに対する時間重み係数の方が、現在のサービス供給源と異なるサービス供給源に関連するキーワードに対する時間重み係数よりも大きくなる。したがって、現在のサービス供給源に関連するキーワードが、認識キーワードとして選択され易くなる。
端末2の処理部25の音声認識部26は、音声入力部2を介して入力された音声信号から所定数の認識候補単語を検出する(ステップS201)。そして処理部25は、通信部23を介して認識候補単語のセットをサーバ3へ送信する。
制御部33の提示情報取得部35は、提示情報リストを参照して、認識キーワード決定部34から通知されたサービス識別子及び情報識別子に対応する提示情報を特定する(ステップS204)。そして提示情報取得部35は、提示情報のタイプはlinkタイプか否か判定する(ステップS205)。
そして制御部33の認識キーワード抽出部38は、取得した提示情報からキーワードを抽出し、抽出したキーワードを、参照時刻、その提示情報に対応するサービス識別子及び情報識別子とともにキーワードリストに追加登録する(ステップS207)。
一方、提示情報のタイプがlinkタイプでない場合(ステップS205−No)、提示情報取得部35は、提示情報リストに格納された、サービス識別子及び情報識別子と関連付けられた提示情報本体を提示情報として取得する(ステップS208)。
ステップS207またはS208の後、提示情報取得部35またはサービス識別部36は、最新の提示情報に関連するサービス識別子及び情報識別子を参照時刻とともにサービス履歴リストに登録することで、サービス履歴リストを更新する(ステップS209)。
サービス供給源に変更が有った場合(ステップS210−Yes)、制御部33の重み更新部39は、キーワードリスト中の各キーワードに対する時間重み係数を更新する。その際、重み更新部39は、最新のサービス供給源と異なるサービス供給源に関連するキーワードに対する時間重み係数を、最新のサービス供給源に関連するキーワードに対する時間重み係数よりも小さくする(ステップS211)。
一方、サービス供給源に変更が無い場合(ステップS210−No)、重み更新部39は、各キーワードに対する時間重み係数を、キーワードリストに登録されてからの経過時間が長いほど小さくなるように更新する(ステップS212)。
なお、ステップS213及びS214の手順は、ステップS209〜S212の手順と独立して実行されてもよい。
制御部40が有するこれらの各部は、例えば、制御部40が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。なお、制御部40が有するこれらの各部は、それぞれ、別個の回路として、サーバ3に実装されてもよい。さらに、サーバ3が有するこれらの各部は、その各部の機能を実現する一つの集積回路としてサーバ3に実装されてもよい。
類似度算出部41は、キーワードリストに登録された、未検証のキーワードの中から、今から検証するキーワードを決定する(ステップS302)。その際、類似度算出部41は、例えば、作成時刻が新しい方から順に、検証するキーワードを決定してもよい。
また類似度算出部41は、検証キーワードに対する類似度が算出されておらず、かつ、検証キーワードに関連付けられたサービス識別子と異なるサービス識別子に関連付けられたキーワードの中から、比較キーワードを決定する(ステップS303)。
例えば、以下の表1に示されるように、互いに異なる二つの音素の種別の組と補正係数との関係を表す参照テーブルが予めサーバ3の記憶部32に記憶される。そして類似度算出部41は、検証キーワードと比較キーワードの間で異なっている文字の組に対応する音素の組ごとに、参照テーブルを参照して補正係数を求め、求めた補正係数を一致度に乗じる。なお、参照テーブル中に該当する音素の種別の組が無い場合、類似度算出部41は、補正係数を'1'とする。すなわち、類似度算出部41は、その音素の組については、一致度を補正しない。
また、検証キーワードが「天気」であり、比較キーワードが「天使」であれば、互いに異なっている文字の組に対応する音素の組は、各キーワードの最後の音素である'キ'と'シ'を含む組だけであり、一致度は66.7%となる。この組に対応する音素の種別の組は、無声摩擦音と無声破裂音の組に相当するので、類似度算出部41は、例えば、表1に示された参照テーブルを参照することにより、補正係数を1.2とする。したがって、検証キーワード「天気」と比較キーワード「天使」間の類似度は、66.7%×1.2=80.0%となる。
一方、未比較のキーワードが無い場合(ステップS307−No)、類似度算出部41は、類似度の最大値を検証キーワードについてのキーワード間類似度として、キーワードリストを更新する(ステップS308)。
本実施形態では、重み更新部42は、キーワード間類似度が所定の閾値Ths以上であり、かつ、提示情報のサービス供給源が変更されていない場合、新たに登録されたキーワード以外の各キーワードに対する時間重み係数に、0より大きくかつ1未満の係数αを乗じる。なお、所定の閾値Thsは、例えば、二つのキーワード間に何らかの類似性が認められる類似度の最小値、例えば、0.5に設定される。また係数αは、例えば、0.8〜0.9に設定される。これにより、キーワード間類似度が他のキーワードの少なくとも一部と類似していることを表す値を持つキーワードについては、そのキーワードがキーワードリストに登録されてからの経過時間が長くなるほど、そのキーワードに対する時間重み係数は小さくなる。その結果、キーワードリストに登録されてからの経過時間が短いキーワードほど、認識キーワードとして検出され易くなる。
これにより、キーワード間類似度が小さいキーワード、すなわち、そのキーワードと関連するサービス識別子により特定される情報源に特有のキーワードについては、時間重み係数は、登録されてからの経過時間にかかわらず一定の大きな値となる。そのため、例え、そのキーワードと関連するサービス識別子により特定されるサービス供給源が前回参照されてから長期間が経過していたとしても、第2の実施形態による対話制御装置は、そのサービス供給源に遷移し難くなることを防止できる。
時間重み係数=1.0-r1×0.4
ただし、r1はキーワード間類似度である。例えば、閾値Thsが0.5であれば、時間重み係数は、キーワード間類似度に応じて0.8〜1.0の間で変動する。これにより、特定の情報源に特有のキーワードほど、時間重み係数が大きくなるので、その特有のキーワードが話者により発声されたときに、この対話制御装置は、情報を提供するサービス供給源を、正確にその特定のサービス供給源へ遷移させることができる。
これにより、第2の実施形態による対話制御装置は、前回の情報提供時から長期間が経過したサービス供給源へ遷移し難くなることを防止しつつ、最近利用したサービス供給源へ遷移し易くできる。
ステップS402またはS403の後、制御部40は、ステップS213以降の処理を実行する。
なお、第3の実施形態による対話制御装置が有する構成要素は、第2の実施形態による対話制御装置が有する構成要素と同一である。ただし、第3の実施形態による対話制御装置は、第2の実施形態と比較して、制御部の類似度算出部及び重み更新部の処理が異なる。そこで以下では、第2の実施形態と同様に、図13の機能ブロック図を参照しつつ、類似度算出部及び重み更新部について説明する。
そして類似度算出部41は、類似度の最大値を検証キーワードについてのキーワード間類似度とするとともに、対応する時刻差をキーワード時間間隔としてキーワードリストに書き込む(ステップS308’)。
本実施形態では、重み更新部42は、第2の実施形態による重み更新部42と同様に、キーワード間類似度、キーワードリストに登録されてからの経過時間、またはサービス供給源の変更の有無に基づいて、各キーワードの時間重み係数を算出する。あるいは、重み更新部42は、第1の実施形態による重み更新部39と同様に、キーワードリストに登録されてからの経過時間、またはサービス供給源の変更の有無に基づいて、各キーワードの時間重み係数を算出してもよい。
重み更新部42は、キーワード作成時間間隔及びキーワード間類似度に基づく時間重み係数の補正を、例えば、図12に示されたステップS211、S212とステップS213の間で実行する。あるいは、重み更新部42は、キーワード作成時間間隔及びキーワード間類似度に基づく時間重み係数の補正を、図16に示されたステップS402、S403とステップS213の間で実行する。
制御部50が有するこれらの各部は、例えば、制御部50が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。なお、制御部50が有するこれらの各部は、それぞれ、別個の回路として、サーバ3に実装されてもよい。さらに、サーバ3が有するこれらの各部は、その各部の機能を実現する一つの集積回路としてサーバ3に実装されてもよい。
例えば、サービス遷移履歴テーブル2000では、サービス識別子'tennki.jp'に対応するサービス供給源からは、サービス識別子'news.jp'に対応するサービス供給源へ101回遷移することが示されている。同様に、サービス識別子'tennki.jp'に対応するサービス供給源からサービス識別子'chirashi.jp'に対応するサービス供給源へ3回遷移することが示されている。さらに、サービス遷移履歴テーブル2000では、サービス識別子'tennki.jp'に対応するサービス供給源から他のサービス供給源へ遷移した回数の合計が104回であることが示されている。
なお、あるサービス供給源を遷移元とする遷移回数の合計が所定の閾値(例えば、50回)未満である場合には、サービス関連度算出部51は、そのサービス供給源と他のサービス供給源間のサービス関連度を'0'としてもよい。
本実施形態では、重み更新部53は、第2の実施形態による重み更新部42と同様に、キーワード間類似度、キーワードリストに登録されてからの経過時間、またはサービス供給源の変更の有無に基づいて、各キーワードの時間重み係数を算出する。あるいは、重み更新部52は、第1の実施形態による重み更新部39と同様に、キーワードリストに登録されてからの経過時間、またはサービス供給源の変更の有無に基づいて、各キーワードの時間重み係数を算出してもよい。
これにより、第4の実施形態による対話制御装置は、関連性が高い二つのサービス供給源間での遷移を正しく行える確率を高めることができる。
あるいは、端末の処理部が有する音声認識の機能は、通信ネットワークを介して端末及びサーバと接続された音声認識用サーバが有してもよい。この場合には、端末から音声認識用サーバへ音声信号が送られ、音声認識用サーバが認識候補単語のセットをサーバへ送信する。
(付記1)
テキスト情報を含む提示情報を識別する情報識別子と該提示情報の供給源を識別するサービス識別子との複数の組と、当該複数の組のそれぞれについて関連する1以上のキーワード及び当該キーワードについて設定された重み係数とを記憶する記憶部と、
前記各キーワードについて、音声入力部を介して入力された音声信号から検出された少なくとも一つの認識候補単語との類似度を、当該キーワード中で前記少なくとも一つの認識候補単語と一致する部分が多く、かつ、前記重み係数が大きいほど大きくなるように算出し、当該類似度が最大となるキーワードを検出するキーワード決定部と、
前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される提示情報を取得し、該提示情報をユーザに通知する出力部へ出力する提示情報取得部と、
複数の前記サービス識別子のうち、前記取得された現在の提示情報の供給源を表す第1のサービス識別子と、当該現在の提示情報よりも前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて、当該第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、当該第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する重み更新部と、
を有する対話制御装置。
(付記2)
前記重み更新部が、前記第1のサービス識別子と、前記第2のサービス識別子とが異なる場合、前記第1のサービス識別子と関連付けられたキーワードについて設定された重み係数を、前記第2のサービス識別子と関連付けられたキーワードについて設定された重み係数よりも大きくする、付記1に記載の対話制御装置。
(付記3)
現在の提示情報の取得時を含む第1の期間における提示情報の供給源の変化を表す第1の判定結果と、前記第1の期間よりも長い第2の期間における提示情報の供給源の変化を表す第2の判定結果の組み合わせに応じて、提供情報の供給源が変更されたことを表す「変化有り」、提供情報の供給源が変更されていないことを表す「変化無し」、及び提供情報の供給源が変更されたか否かが不確定であることを表す「変化不確定」の3つの変化結果のうちの何れかを出力する変化検出部をさらに有し、
前記重み更新部は、前記変化検出部から出力された変化結果に応じて、前記第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、前記第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する、付記1または2に記載の対話制御装置。
(付記4)
前記変化検出部は、前記第1のサービス識別子と、一回前の提示情報の供給源を表す第3のサービス識別子が一致しているか否かを前記第1の判定結果とする、付記3に記載の対話制御装置。
(付記5)
前記変化検出部は、最新の提示情報よりも前のN回の間に継続して提供された提示情報の供給源を表す第4のサービス識別子と、最新の提示情報を含むM回の間に継続して提供された提示情報の供給源を表す第5のサービス識別子とが一致しているか否かを前記第2の判定結果とし、該N及びMは、2以上の整数である、付記3または4に記載の対話制御装置。
(付記6)
前記変化検出部は、
前記第1の判定結果が、前記第1のサービス識別子と前記第3のサービス識別子が一致しているとの結果である場合は前記変化結果として前記「変化無し」を出力し、
前記第1の判定結果が、前記第1のサービス識別子と前記第3のサービス識別子が一致していないとの結果であり、且つ、前記第2の判定結果が、前記第4のサービス識別子と前記第5のサービス識別子が一致しているとの結果である場合は前記変化結果として前記「変化無し」を出力し、
前記第1の判定結果が、前記第1のサービス識別子と前記第3のサービス識別子が一致していないとの結果であり、且つ、前記第2の判定結果が、前記第4のサービス識別子と前記第5のサービス識別子が一致していないとの結果である場合は、前記変化結果として前記「変化不確定」を出力し、
前記第1の判定結果が、前記第1のサービス識別子と前記第3のサービス識別子が一致しているとの結果であり、且つ、前記第2の判定結果が、前記第4のサービス識別子と前記第5のサービス識別子が一致していないとの結果である場合は、前記変化結果として前記「変化有り」を出力する、
付記5に記載の対話制御装置。
(付記7)
前記重み更新部は、前記変化検出部により出力された変化結果が前記「変化有り」または前記「変化無し」である場合に、前記第1のサービス識別子と関連付けられたキーワードについて設定された重み係数を、前記第1のサービス識別子と関連付けられていないキーワードについて設定された重み係数よりも大きくし、一方、前記変化結果が前記「変化不確定」である場合に、前記第1のサービス識別子と関連付けられたキーワードについて設定された重み係数と、前記第2のサービス識別子と関連付けられたキーワードについて設定された重み係数とを同じ比率で更新する、付記5または6に記載の対話制御装置。
(付記8)
前記重み更新部は、前記第1のサービス識別子と前記第2のサービス識別子とが一致する場合、前記複数のキーワードのそれぞれに対応する前記重み係数を、前記記憶部に記憶されてからの経過時間が長いほど小さくする、付記1〜7の何れか一項に記載の対話制御装置。
(付記9)
前記提示情報取得部は、前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される情報がリンク先のアドレスを含む場合、当該アドレスで示された提示情報の供給源から前記提示情報を取得し、当該供給源を表すサービス識別子を前記第1のサービス識別子とする、付記1〜8の何れか一項に記載の対話制御装置。
(付記10)
前記アドレスで示された提示情報の供給源から取得された前記提示情報から1以上の前記キーワードを抽出し、該抽出されたキーワードに対して前記重み係数として所定の値を設定するとともに、該抽出されたキーワードと該設定された重み係数を前記記憶部に記憶させるキーワード抽出部をさらに有する、付記9に記載の対話制御装置。
(付記11)
複数の前記キーワードのそれぞれについて、当該キーワードと関連する前記サービス識別子と異なるサービス識別子と関連する他のキーワードのうち、最も類似するキーワードとの類似度合いを表すキーワード間類似度を算出する類似度算出部をさらに有し、
前記重み更新部は、複数の前記キーワードのそれぞれについて、当該キーワードについての前記キーワード間類似度に基づいて前記重み係数を決定する、付記1に記載の対話制御装置。
(付記12)
前記重み更新部は、複数の前記キーワードのうち、前記キーワード間類似度が他のキーワードと類似していないことを表す値であるキーワードに対する前記重み係数を前記記憶部に記憶されてからの経過時間にかかわらず一定値とし、一方、複数の前記キーワードのうち、前記キーワード間類似度が他のキーワードと少なくとも一部が類似していることを表す値であるキーワードに対する前記重み係数を前記記憶部に記憶されてからの経過時間が長いほど小さくする、付記11に記載の対話制御装置。
(付記13)
前記一定値は、前記キーワード間類似度が他のキーワードと少なくとも一部が類似していることを表す値であるキーワードに対する前記重み係数よりも大きい値である、付記12に記載の対話制御装置。
(付記14)
前記類似度算出部は、複数の前記キーワードのそれぞれについて、当該キーワードが前記記憶部に記憶された時刻と、当該キーワードについての前記最も類似するキーワードが前記記憶部に記憶された時刻との差をさらに求め、
前記重み更新部は、複数の前記キーワードのうち、前記キーワード間類似度が他のキーワードと少なくとも一部が類似していることを表す値であり、かつ、前記時刻の差が小さいキーワードほど、前記重み係数を小さい値とする、付記11に記載の対話制御装置。
(付記15)
複数の提示情報の供給源のうちの二つの供給源間の遷移の頻度が高いほど、当該二つの供給源間の関連度を高くするように、該関連度を算出する関連度算出部をさらに有し、
前記類似度算出部は、複数の前記キーワードのそれぞれについて、当該キーワードと関連する前記提示情報の供給源と、当該キーワードについての前記最も類似するキーワードと関連する前記提示情報の供給源間の前記関連度を、当該キーワードと対応付け、
前記重み更新部は、複数の前記キーワードのそれぞれについて、当該キーワードに対応する前記関連度が二つの提示情報の供給源間に関連性があることを表す値であれば、当該キーワードについての前記重み係数と、当該キーワードについての前記最も類似するキーワードについての重み係数と一致させる、付記11に記載の対話制御装置。
(付記16)
テキスト情報を含む提示情報を識別する情報識別子と該提示情報の供給源を識別するサービス識別子との複数の組と、当該複数の組のそれぞれについて関連する1以上のキーワード及び当該キーワードについて設定された重み係数とを記憶する記憶部と、
複数の前記キーワードのそれぞれについて、音声入力部を介して入力された音声信号から検出された少なくとも一つの認識候補単語との類似度を、当該キーワード中で前記少なくとも一つの認識候補単語と一致する部分が多く、かつ、前記重み係数が大きいほど大きくなるように算出し、当該類似度が最大となるキーワードを検出するキーワード決定部と、
前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される提示情報を取得し、該提示情報をユーザに通知する出力部へ出力する提示情報取得部と、
複数の前記キーワードのそれぞれについて、当該キーワードと関連する前記サービス識別子と異なるサービス識別子と関連する他のキーワードのうち、最も類似するキーワードとの類似度合いを表すキーワード間類似度を算出する類似度算出部と、
複数の前記キーワードのそれぞれについて、当該キーワードについての前記キーワード間類似度に基づいて前記重み係数を決定する重み更新部と、
を有する対話制御装置。
(付記17)
音声入力部を介して入力された音声信号から少なくとも一つの認識候補単語を検出し、
テキスト情報を含む提示情報を識別する情報識別子と該提示情報の供給源を識別するサービス識別子との複数の組のそれぞれに関連付けられたキーワードについて、前記少なくとも一つの認識候補単語との類似度を、当該キーワード中で前記少なくとも一つの認識候補単語と一致する部分が多く、かつ、当該キーワードについて設定された重み係数が大きいほど大きくなるように算出し、当該類似度が最大となるキーワードを検出し、
前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される提示情報を取得し、該提示情報をユーザに通知する出力部へ出力し、
複数の前記サービス識別子のうち、前記取得された現在の提示情報の供給源を表す第1のサービス識別子と、当該現在の提示情報よりも前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて、当該第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、当該第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する、
ことを含む対話制御方法。
(付記18)
音声入力部を介して入力された音声信号から少なくとも一つの認識候補単語を検出し、
テキスト情報を含む提示情報を識別する情報識別子と該提示情報の供給源を識別するサービス識別子との複数の組のそれぞれに関連付けられたキーワードについて、前記少なくとも一つの認識候補単語との類似度を、当該キーワード中で前記少なくとも一つの認識候補単語と一致する部分が多く、かつ、当該キーワードについて設定された重み係数が大きいほど大きくなるように算出し、当該類似度が最大となるキーワードを検出し、
前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される提示情報を取得し、該提示情報をユーザに通知する出力部へ出力し、
複数の前記サービス識別子のうち、前記取得された現在の提示情報の供給源を表す第1のサービス識別子と、当該現在の提示情報よりも前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて、当該第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、当該第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する、
ことをコンピュータに実行させる対話制御用コンピュータプログラム。
2 端末
3 サーバ(対話制御装置)
4 通信ネットワーク
5 外部情報源
21 音声入力部
22 音声出力部
23 通信部
24 記憶部
25 処理部
26 音声認識部
27 音声合成部
31 通信部
32 記憶部
33、40、50 制御部
34 認識キーワード決定部
35 提示情報取得部
36 サービス識別部
37 サービス変化検出部
38 認識キーワード抽出部
39、42、53 重み更新部
41、52 類似度算出部
51 サービス関連度算出部
Claims (9)
- テキスト情報を含む提示情報を識別する情報識別子と該提示情報の供給源を識別するサービス識別子との複数の組と、当該複数の組のそれぞれについて関連する1以上のキーワード及び当該キーワードについて設定された重み係数とを記憶する記憶部と、
前記各キーワードについて、音声入力部を介して入力された音声信号から検出された少なくとも一つの認識候補単語との類似度を、当該キーワード中で前記少なくとも一つの認識候補単語と一致する部分が多く、かつ、前記重み係数が大きいほど大きくなるように算出し、当該類似度が最大となるキーワードを検出するキーワード決定部と、
前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される提示情報を取得し、該提示情報をユーザに通知する出力部へ出力する提示情報取得部と、
複数の前記サービス識別子のうち、前記取得された現在の提示情報の供給源を表す第1のサービス識別子と、当該現在の提示情報よりも前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて、当該第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、当該第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する重み更新部と、
を有する対話制御装置。 - 前記重み更新部が、前記第1のサービス識別子と、前記第2のサービス識別子とが異なる場合、前記第1のサービス識別子と関連付けられたキーワードについて設定された重み係数を、前記第2のサービス識別子と関連付けられたキーワードについて設定された重み係数よりも大きくする、請求項1に記載の対話制御装置。
- 現在の提示情報の取得時を含む第1の期間における提示情報の供給源の変化を表す第1の判定結果と、前記第1の期間よりも長い第2の期間における提示情報の供給源の変化を表す第2の判定結果の組み合わせに応じて、提供情報の供給源が変更されたことを表す「変化有り」、提供情報の供給源が変更されていないことを表す「変化無し」、及び提供情報の供給源が変更されたか否かが不確定であることを表す「変化不確定」の3つの変化結果のうちの何れかを出力する変化検出部をさらに有し、
前記重み更新部は、前記変化検出部から出力された変化結果に応じて、前記第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、前記第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する、請求項1または2に記載の対話制御装置。 - 複数の前記キーワードのそれぞれについて、当該キーワードと関連する前記サービス識別子と異なるサービス識別子と関連する他のキーワードのうち、最も類似するキーワードとの類似度合いを表すキーワード間類似度を算出する類似度算出部をさらに有し、
前記重み更新部は、複数の前記キーワードのそれぞれについて、当該キーワードについての前記キーワード間類似度に基づいて前記重み係数を決定する、請求項1に記載の対話制御装置。 - 前記重み更新部は、複数の前記キーワードのうち、前記キーワード間類似度が他のキーワードと類似していないことを表す値であるキーワードに対する前記重み係数を前記記憶部に記憶されてからの経過時間にかかわらず一定値とし、一方、複数の前記キーワードのうち、前記キーワード間類似度が他のキーワードと少なくとも一部が類似していることを表す値であるキーワードに対する前記重み係数を前記記憶部に記憶されてからの経過時間が長いほど小さくする、請求項4に記載の対話制御装置。
- 前記類似度算出部は、複数の前記キーワードのそれぞれについて、当該キーワードが前記記憶部に記憶された時刻と、当該キーワードについての前記最も類似するキーワードが前記記憶部に記憶された時刻との差をさらに求め、
前記重み更新部は、複数の前記キーワードのうち、前記キーワード間類似度が他のキーワードと少なくとも一部が類似していることを表す値であり、かつ、前記時刻の差が小さいキーワードほど、前記重み係数を小さい値とする、請求項4に記載の対話制御装置。 - 複数の提示情報の供給源のうちの二つの供給源間の遷移の頻度が高いほど、当該二つの供給源間の関連度を高くするように、該関連度を算出する関連度算出部をさらに有し、
前記類似度算出部は、複数の前記キーワードのそれぞれについて、当該キーワードと関連する前記提示情報の供給源と、当該キーワードについての前記最も類似するキーワードと関連する前記提示情報の供給源間の前記関連度を、当該キーワードと対応付け、
前記重み更新部は、複数の前記キーワードのそれぞれについて、当該キーワードに対応する前記関連度が二つの提示情報の供給源間に関連性があることを表す値であれば、当該キーワードについての前記重み係数と、当該キーワードについての前記最も類似するキーワードについての重み係数と一致させる、請求項4に記載の対話制御装置。 - 音声入力部を介して入力された音声信号から少なくとも一つの認識候補単語を検出し、
テキスト情報を含む提示情報を識別する情報識別子と該提示情報の供給源を識別するサービス識別子との複数の組のそれぞれに関連付けられたキーワードについて、前記少なくとも一つの認識候補単語との類似度を、当該キーワード中で前記少なくとも一つの認識候補単語と一致する部分が多く、かつ、当該キーワードについて設定された重み係数が大きいほど大きくなるように算出し、当該類似度が最大となるキーワードを検出し、
前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される提示情報を取得し、該提示情報をユーザに通知する出力部へ出力し、
複数の前記サービス識別子のうち、前記取得された現在の提示情報の供給源を表す第1のサービス識別子と、当該現在の提示情報よりも前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて、当該第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、当該第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する、
ことを含む対話制御方法。 - 音声入力部を介して入力された音声信号から少なくとも一つの認識候補単語を検出し、
テキスト情報を含む提示情報を識別する情報識別子と該提示情報の供給源を識別するサービス識別子との複数の組のそれぞれに関連付けられたキーワードについて、前記少なくとも一つの認識候補単語との類似度を、当該キーワード中で前記少なくとも一つの認識候補単語と一致する部分が多く、かつ、当該キーワードについて設定された重み係数が大きいほど大きくなるように算出し、当該類似度が最大となるキーワードを検出し、
前記検出されたキーワードと関連する前記サービス識別子及び前記情報識別子の組により特定される提示情報を取得し、該提示情報をユーザに通知する出力部へ出力し、
複数の前記サービス識別子のうち、前記取得された現在の提示情報の供給源を表す第1のサービス識別子と、当該現在の提示情報よりも前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて、当該第1のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数と、当該第2のサービス識別子と関連付けられた前記キーワードについて設定された前記重み係数を更新する、
ことをコンピュータに実行させる対話制御用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011225261A JP5696638B2 (ja) | 2011-06-02 | 2011-10-12 | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011124277 | 2011-06-02 | ||
JP2011124277 | 2011-06-02 | ||
JP2011225261A JP5696638B2 (ja) | 2011-06-02 | 2011-10-12 | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013011843A JP2013011843A (ja) | 2013-01-17 |
JP5696638B2 true JP5696638B2 (ja) | 2015-04-08 |
Family
ID=47685740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011225261A Active JP5696638B2 (ja) | 2011-06-02 | 2011-10-12 | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5696638B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6826324B2 (ja) * | 2017-09-27 | 2021-02-03 | トヨタ自動車株式会社 | サービス提供装置及びサービス提供プログラム |
JP6927905B2 (ja) * | 2018-02-19 | 2021-09-01 | ヤフー株式会社 | 決定装置、決定方法、決定プログラム及びプログラム |
CN116089129B (zh) * | 2023-03-21 | 2023-07-14 | 深圳市微克科技有限公司 | 一种智能穿戴设备的消息提醒方法、系统及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003319070A (ja) * | 2002-04-24 | 2003-11-07 | Nippon Telegr & Teleph Corp <Ntt> | 音声応答方法及び装置 |
US7289956B2 (en) * | 2003-05-27 | 2007-10-30 | Microsoft Corporation | System and method for user modeling to enhance named entity recognition |
JP5014662B2 (ja) * | 2006-04-13 | 2012-08-29 | アルパイン株式会社 | 車載用音声認識装置及び音声認識方法 |
-
2011
- 2011-10-12 JP JP2011225261A patent/JP5696638B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013011843A (ja) | 2013-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11074909B2 (en) | Device for recognizing speech input from user and operating method thereof | |
KR100998566B1 (ko) | 음성인식을 이용한 언어 번역 방법 및 장치 | |
EP2477186B1 (en) | Information retrieving apparatus, information retrieving method and navigation system | |
EP3504709B1 (en) | Determining phonetic relationships | |
JP5610197B2 (ja) | 検索装置、検索方法、及び、プログラム | |
US20140278372A1 (en) | Ambient sound retrieving device and ambient sound retrieving method | |
KR101971513B1 (ko) | 전자 장치 및 이의 음성 인식 오류 수정 방법 | |
JP4129989B2 (ja) | テキスト音声合成を支援するシステム | |
JP2002258890A (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
JP2008209717A (ja) | 入力された音声を処理する装置、方法およびプログラム | |
JP2008275731A (ja) | テキスト発音記号変換辞書作成装置、認識語彙辞書作成装置、及び音声認識装置 | |
CN110675866B (zh) | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 | |
CN107610693B (zh) | 文本语料库的构建方法和装置 | |
CN112580340A (zh) | 逐字歌词生成方法及装置、存储介质和电子设备 | |
JP6790959B2 (ja) | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム | |
CN112562676B (zh) | 一种语音解码方法、装置、设备及存储介质 | |
JP6028556B2 (ja) | 対話制御方法及び対話制御用コンピュータプログラム | |
KR102580904B1 (ko) | 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스 | |
JP5696638B2 (ja) | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム | |
JP5152588B2 (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
JP4764203B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP2010164918A (ja) | 音声翻訳装置、および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140603 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5696638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |