Nothing Special   »   [go: up one dir, main page]

JP2000089782A - 音声認識装置と方法、ナビゲーションシステム、及び記録媒体 - Google Patents

音声認識装置と方法、ナビゲーションシステム、及び記録媒体

Info

Publication number
JP2000089782A
JP2000089782A JP10262682A JP26268298A JP2000089782A JP 2000089782 A JP2000089782 A JP 2000089782A JP 10262682 A JP10262682 A JP 10262682A JP 26268298 A JP26268298 A JP 26268298A JP 2000089782 A JP2000089782 A JP 2000089782A
Authority
JP
Japan
Prior art keywords
dictionary
recognition
input
vocabulary
hierarchy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10262682A
Other languages
English (en)
Inventor
Noriyuki Tsunashima
則幸 綱嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Priority to JP10262682A priority Critical patent/JP2000089782A/ja
Publication of JP2000089782A publication Critical patent/JP2000089782A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Navigation (AREA)

Abstract

(57)【要約】 【課題】 発声回数を削減して、簡単に検索結果を得
る。 【解決手段】 地名認識用の辞書は、都道府県、市区
郡、区町村字毎に相互に関連付けて形成される。利用頻
度の高い場所の地名の辞書を予め辞書登録部15に登録
しておく。話者は、通常、都道府県名、市区郡名、区町
村字名の順で地名を発声する。制御部14は、最初の単
語を都道府県認識辞書と比較し、特定した都道府県の市
区郡認識辞書を辞書登録部15に登録し、次の入力音声
と比較し、特定した市区郡の区町村字認識辞書を辞書登
録部15に登録し、次の入力音声と比較し、区町村字を
特定する。辞書登録部15に登録されている地名を発声
する場合には、都道府県名や市区郡名を省略できる。制
御部14は、入力音声を都道府県認識辞書で認識できな
い時は、登録されている市区郡認識辞書を用いて認識
し、認識できないときは、登録されている区町村字認識
辞書を用いて認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識に用いる
認識辞書を入れ替えて、順次認識を行って、検索対象を
特定する検索装置と検索方法に関し、特に、検索時の発
声回数、認識辞書の入れ替え回数を低減することができ
る音声認識装置と方法、及びそれらを用いたナビゲーシ
ョンシステムに関する。
【0002】
【従来の技術】認識対象の語彙を認識するための辞書
(認識辞書)を自動的に入れ替えて、入力音声を認識す
る音声認識装置が知られている。この種の音声認識装置
の認識辞書は、広分類項目の辞書の各語彙に狭分類項目
の辞書が、階層的に関連づけられて構成されている。ユ
ーザは、目的の検索事項が特定されるまで、広分類項目
から狭分類項目に複数個の語彙を順番に発声して、音声
認識装置は、辞書を順次入れ替えながら、入力音声を認
識する。
【0003】このような、音声認識装置の動作を、図6
を参照して、地名検索する場合を例に説明する。
【0004】音声認識装置は、起動されると、広分類項
目辞書である「都道府県」の辞書を認識辞書として登録
する(ステップS1)。
【0005】続いて、音声の入力を待機する(ステップ
S2)。
【0006】音声が入力されると、「都道府県」の認識
辞書を用いて、入力音声を認識し、音声に一致する語彙
を検索する(ステップS3)。認識辞書に音声と一致す
る語彙を発見すると、その語彙に関連付いた辞書を識別
し、「市区郡」の辞書と、「都道府県」の辞書とを入れ
替える(ステップS4,S5)。例えばユーザが「東
京」と発声すると、「東京の市区郡」の辞書が辞書登録
される。
【0007】以下、「都道府県」の検索と同様にして、
「市区郡」の検索(ステップS6〜S8)及び「区町村
字」(ステップS9〜S12)の検索を行う。以上3回
の全ての検索で、認識辞書にユーザの発声した地名と一
致する語彙を発見すれば、目的とする地域の地名が出力
される(ステップS13)。いずれか一回の検索で該当
する語彙が見つからないときは、都道府県の地名検索か
らやり直すこととなる(ステップS4,S8,S1
2)。
【0008】
【発明が解決しようとする課題】上述の従来技術では、
ユーザが頻繁に検索する事項も、ほとんど検索すること
のない事項と同等に扱われている。このため、頻繁に検
索する事項でも、一定の回数の発声を行わなければなら
ず、煩瑣であった。
【0009】全ての登録語彙を最初から認識処理の対象
として認識辞書を作成しておくことも可能であるが、認
識率が低下し、認識応答時間が長くかかるという欠点が
ある。また、記憶装置の容量が大きくなってしまう。
【0010】同様の問題は、広分類項目から狭分類項目
に複数個の語彙を順番に発声し、認識装置が、辞書を順
次入れ替えて、入力音声を認識するタイプの音声認識装
置に共通に存在する。
【0011】本発明は、上記実状に鑑みてなされたもの
で、簡単な処理で検索結果を得られる音声認識装置と方
法及びナビゲーションシステムを提供することを目的と
する。また、本発明は、特定の検索事項については、ユ
ーザの発声回数を削減して、簡単に検索結果を得られる
音声認識装置と方法及びナビゲーションシステムを提供
することを目的とする。
【0012】
【課題を解決するための手段】本発明の第1の観点に係
る音声認識装置は、音声を入力する入力手段と、下位の
辞書が直近の上位の辞書の各語彙に対応付けられて階層
化された音声認識用の複数の辞書の全体を格納する辞書
格納手段と、前記辞書格納手段に格納されている辞書の
うち、各階層の予め定められた少なくとも一部の辞書
を、音声認識の開始前に、音声認識の処理に使用するた
めの認識辞書として保持する辞書保持手段と、前記入力
手段が入力した音声と前記辞書保持手段の保持する辞書
が所有する語彙との比較を上位の辞書から順次行い、あ
る階層の辞書内に入力音声に該当する語彙を検出する
と、その語彙に対応付けられた1階層下位の辞書を前記
辞書保持手段にロードして、次に入力された音声をロー
ドした辞書に基づいて認識し、ある階層の辞書内に一致
する語彙を検出できないときに、その辞書よりも1階層
下位の辞書を用いて入力音声の認識処理を行う認識手段
と、前記認識手段の認識結果を出力する出力手段と、を
備えることを特徴とする。
【0013】この構成において、通常は、話者は、上位
から順に語彙を発声する。認識手段は、最初の入力音声
を、最上位の辞書と比較して認識し、入力音声と一致す
る語彙を検出すると、認識結果に対応する下位の辞書を
辞書格納手段から辞書保持手段にロードし、次の入力音
声と比較して認識する。以後、同様の動作を繰り返す。
一方、認識手段は、入力音声と一致する語彙を検出でき
ないと、順次下位の辞書を用いて認識を行う。このた
め、例えば、辞書保持手段に予め登録されている辞書に
含まれている語彙については、任意の階層の語彙を入力
すれば、対応する階層の辞書で認識される。従って、全
ての語彙を順次入力しなくても、適当な語彙を入力する
だけで、対応する認識結果を出力することができ、話者
の発話回数を低減できる。辞書保持手段に、比較的頻繁
に利用する語彙群の辞書を起動時等に、予め登録してお
くことにより、発話回数を大幅に低減できる。
【0014】前記認識手段は、ある階層の辞書内に一致
する語彙を検出できず、下位の階層の辞書を用いて入力
音声を認できた時に、ファイルの階層構造より、上位の
語彙を特定する手段を含むことが望ましい。これによ
り、上位又は下位の語彙を入力するだけで、上位の対応
する語彙をも特定することができる。
【0015】さらに、各階層の予め定められた辞書を前
記辞書保持手段に、音声認識の開始前に、ロードする事
前ロード手段をさらに備えることが望ましい。
【0016】前記事前ロード手段は、ユーザの入力に基
づいて、各階層の辞書を特定してロードする手段を備え
てもよい。この際、ユーザの下位の語彙の入力に基づい
て、上位の階層の辞書を特定してロードする手段を備え
ることが望ましい。
【0017】本発明の第2の観点に係るナビゲーション
システムは、音声入力された地名を、広域から狭域に階
層化して構成された辞書のうちロードされた辞書を用い
て認識し、認識された地名が表す地域内の地名を含む辞
書を次にロードして、ロードした辞書を次に入力された
音声の認識に使用することにより、広域から狭域に向け
て順次入力された地名を、階層化された辞書を順次ロー
ドしながら認識し、認識した地域の地図を表示するもの
であり、各階層の予め定められた辞書を、音声認識処理
の開始前に、音声認識用の辞書として保持する辞書保持
手段と、入力音声と前記辞書保持手段が保持する辞書と
を比較し、ある階層の辞書内に一致する地名を検出でき
ないときに、下位の階層の辞書を用いて入力音声を認識
し、ある階層の辞書内に一致する地名を検出したとき
に、その地名が表す地域に属す地名を格納した下位の辞
書をロードして次の入力音声の認識に使用する認識手段
と、地図データを格納する地図記憶手段と、前記認識手
段の認識結果に対応する地域の地図を前記地図記憶手段
から読み出して表示する表示手段と、を備えることを特
徴とする。
【0018】この構成において、話者は、上位(例え
ば、都道府県名)から順に地名を発声する。認識手段
は、最初の入力音声を、最上位の辞書(例えば、都道府
県名認識用の辞書)と比較して認識し、入力音声と一致
する語彙を検出すると、認識結果に対応する下位の辞書
(例えば、区市郡名認識用の辞書)を辞書格納手段から
辞書保持手段にロードし、次の入力音声と比較して認識
する。以後、同様の動作を繰り返す。一方、認識手段
は、入力音声と一致する語彙を検出できないと、順次下
位の辞書を用いて認識を行う。このため、例えば、辞書
保持手段に予め登録されている辞書に含まれている地名
については、上位から順番に発声しなくても、任意の階
層の地名を入力すれば、対応する階層の辞書で認識され
る。従って、話者の発話回数を低減できる。辞書保持手
段に、自宅の地名等の比較的頻繁に利用する地名用の辞
書を、起動時等に予め登録しておくことにより、発話回
数を大幅に低減できる。
【0019】また、前記認識手段は、ある階層の辞書内
に一致する地名を検出できず、下位の階層の辞書を用い
て入力音声を認識できた時に、ファイルの階層構造よ
り、上位の語彙を特定する手段を含むことが望ましい。
【0020】さらに、各階層の予め定められた辞書を前
記辞書保持手段に、音声認識の開始前に、ロードする事
前ロード手段をさらに備えることが望ましい。
【0021】本発明の第3の観点に係る音声認識方法
は、階層化された辞書を使用して、階層順に入力される
一連の音声により特定される情報を特定する方法であっ
て、実質的に最初の入力音声を最上位層の辞書を参照し
て認識し、該辞書内に該当する語彙を検出できなかった
時に、予め格納されている次の階層の辞書を用いて認識
処理を行い、認識できるまで辞書の階層を変更して認識
処理を行い、入力音声をいずれかの階層の辞書を参照し
て認識できたときに、認識した語彙に対応する下位の辞
書をロードして、ロードした辞書を用いて次の入力音声
の認識を行う、ことにより、階層化された一連の語彙の
全てを入力しなくても、認識を可能としたことを特徴と
する。
【0022】本発明の第4の観点に係る記録媒体はコン
ピュータを、音声を入力する入力手段、下位の辞書が直
近の上位の辞書の各語彙に対応付けられて階層化された
音声認識用の複数の辞書を格納する辞書格納手段、前記
辞書格納手段に格納されている辞書のうち、各階層の予
め定められた少なくとも1つの辞書を、音声認識の開始
前に、音声認識の処理に使用するための認識辞書として
保持する辞書保持手段、入力手段が入力した音声と辞書
保持手段の保持する辞書が所有する語彙との比較を行
い、任意の各階層の辞書内に入力音声に該当する語彙を
検出すると、その語彙に対応付けられた下位の辞書を辞
書保持手段にロードして次に入力された音声をロードし
た辞書に基づいて認識し、ある階層の辞書内に一致する
語彙を検出できないときに、1階層下位の辞書を用いて
入力音声を認識する認識手段、認識手段の認識結果を出
力する出力手段、として機能させるためのプログラムを
記録し、機械読み取りが可能であることを特徴とする。
【0023】
【発明の実施の形態】本発明の実施の形態にかかる音声
認識装置及び方法を、ナビゲーションシステムに応用し
た例を参照して、詳細に説明する。
【0024】この実施の形態のナビゲーションシステム
10は、図1に示すように、入力部11と、出力部12
と、地図格納部13と、制御部14と、辞書登録部15
と、辞書格納部16と、から構成される。
【0025】入力部11は、マイクロホン等の音声を電
気信号に変換する音声入力部と、タッチパネルディスプ
レイ等の画面への接触を感知して、電気信号を発生する
位置入力装置とから構成される。
【0026】出力部12は、スピーカ等の音声出力装置
や、液晶ディスプレイ等の表示装置から構成され、この
ナビゲーションシステム10の検索結果出力部であり、
制御部14から送られる認識結果(地名)に従って、地
図格納部13から該当する地図を検索し、索出した地図
を表示する。
【0027】地図格納部13は、磁気ディスク装置やC
D−ROM(コンパクトディスクROM)装置等から構
成され、地図データを格納し、出力部12から指示され
た地域の地図を出力部12に供給する。
【0028】制御部14は、CPU、DSPなどから構
成され、このナビゲーションシステム全体の動作を制御
及び実行するためのものであり、辞書登録部15に登録
される認識辞書をもとに認識処理を行い、結果を出力部
12に出力する。
【0029】辞書登録部15は、半導体メモリ等から構
成され、辞書格納部16に格納されている音声認識用の
複数の辞書(認識辞書)のうち、その時点で認識に使用
するものを認識辞書として登録する。辞書格納部16
は、磁気ディスク装置やCD−ROM等から構成され、
音声認識に用いる認識辞書の全てを格納している。
【0030】図2は、辞書格納部16に格納されている
認識辞書の構成を示す。図示するように、この認識辞書
は、広分類項目辞書に相当する都道府県認識辞書16a
と、中分類項目辞書に相当する市区郡認識辞書16b
と、狭分類項目辞書に相当する区町村字認識辞書16c
とから構成されている。都道府県認識辞書16aは、都
道府県名毎に、その都道府県を表す音声を認識するため
の特徴パターン(マッチングパターン)の組を記憶す
る。市区郡認識辞書16bは、各都道府県に関連付けら
れた複数の辞書から構成され、各辞書は、対応する都道
府県内の市区郡毎に、その市区郡を表す音声を認識する
ための特徴パターンの組を記憶する。区町村字認識辞書
16cは、各市区郡に関連付けられた複数の辞書から構
成され、各辞書は、対応する市区郡内の区町村字毎に、
その区町村字を表す音声を認識するための特徴パターン
の組を記憶する。
【0031】図3に、辞書登録部15の構成を示す。図
示するように、辞書登録部15は、辞書項目の階層ごと
に割り当てられた辞書登録領域15a,15b,15
c,・・・から構成される。辞書登録領域15a,15
b,15c,・・・は、それぞれ、辞書項目の各階層に属
する1つの辞書を認識辞書として登録することができ
る。都道府県認識辞書登録領域15aには、都道府県認
識辞書16aが登録され、市区郡認識辞書登録領域15
bには、市区郡認識辞書16bが登録され、区町村字認
識辞書登録領域15cには、区町村字認識辞書16cが
登録される。
【0032】以下に、図4を参照して、上述の構成を有
するナビゲーションシステム10の動作を説明する。ナ
ビゲーションシステム10は、起動時等に、比較的頻繁
に使用する地名(自宅の住所や、頻繁に訪れる地域の地
名等)を入力し、対応する認識辞書を予め登録しておく
ことにより、ユーザの発話回数の低減と高速認識を可能
とするシステムである。
【0033】ナビゲーションシステム10の制御部14
は、起動されると、図4に示すフローチャートに示す動
作を開始し、比較的頻繁に使用する地名(ここでは、自
宅の住所とする)の入力を待機する。
【0034】ユーザは、入力部11から、自宅の住所を
「都道府県」、「市区郡」、「区町村字」を含んだ形で
順次入力する(ステップS20)。住所の入力は、例え
ば、入力部11のタッチパネル等を使用して行ってもよ
く、或いは音声で入力してもよい。ここでは具体例とし
て、ユーザの住所が「東京都渋谷区道玄坂」であるとす
る。
【0035】制御部14は、辞書格納部16に指令を出
し、都道府県認識辞書16aを辞書登録部15の都道府
県認識辞書登録領域15aに登録する。次に、制御部1
4は、ユーザの入力した都道府県名「東京」に対応する
市区郡認識辞書16bを辞書登録部15の市区郡認識辞
書登録領域15bに登録する。さらに制御部14は、ユ
ーザの入力した市区町村名「渋谷」に対応する区町村字
認識辞書16cを区町村字認識辞書登録部15の区町村
字認識辞書登録領域15cに登録させる(ステップS2
1)。以上の処理により、辞書登録部15に認識辞書の
事前登録が完了する。
【0036】次に、制御部14は、入力部11からの音
声信号を待機する(ステップS22)。ここで、ユーザ
が、例えば、「愛知県岡崎市大和町」地域の地図を見た
いため、「愛知」、「岡崎」、「大和」と順次発声した
とする。
【0037】入力部11は、この音声をピックアップ
し、特徴ベクトルを抽出し、制御部14に供給する。制
御部14は、辞書登録部15の都道府県認識辞書登録領
域15aを参照し、最初に入力された「愛知」の特徴ベ
クトルに合致する特徴ベクトルを有する地名を検索する
(ステップS23)。
【0038】制御部14は、地名「愛知」を都道府県認
識辞書登録領域15aに登録されている都道府県認識辞
書16aから検出し(ステップS24)、辞書登録部1
5の市区郡認識辞書登録領域15bに、愛知県内の市区
郡名を認識するための市区郡認識辞書16bを登録する
(ロードする)(ステップS25)。制御部14は次の
音声入力を待機する(ステップS26)。
【0039】ユーザが「岡崎」と発声すると、制御部1
4は、市区郡認識辞書登録領域15bに登録されている
市区郡認識辞書16bを参照し、「岡崎」の特徴ベクト
ルに合致する特徴ベクトルを有する地名を検索する(ス
テップS27)。
【0040】制御部14は、入力された「岡崎」に対応
する地名を市区郡認識辞書登録領域15bに登録されて
いる市区郡認識辞書16bで検出し(ステップS2
8)、区町村字認識辞書16cのうちの、市名「岡崎」
に対応するものを、辞書登録部15の区町村字認識辞書
登録領域15cに登録する(ロードする)(ステップS
29)。続いて、制御部14は次の音声入力を待機する
(ステップS30)。
【0041】ユーザが「大和」と発声すると、制御部1
4は、辞書登録部15を参照し、「大和」に一致する語
彙を検索する(ステップS31)。
【0042】制御部14は、町名「大和」を区町村字認
識辞書登録領域15cに登録されている区町村字認識辞
書16cで検出する(ステップS32)。このようにし
て、制御部14は、入力された音声が都道府県「愛
知」、市区郡「岡崎」、区町村字「大和」であることを
判別すると、認識した地名を出力部12に供給する。出
力部12は、対応する地図を地図格納部13より読み出
して、表示する(ステップS33)。
【0043】その後、処理は、ステップS21にリター
ンし、辞書登録部15に登録されている辞書を元の辞書
(ステップS20で入力した地名に対応する認識辞書)
に戻して、次の音声の入力を待機する。
【0044】以上のように、目的とする地名の都道府県
名と、始めに登録した地名の都道府県名とが異なると
き、ユーザは、従来と同様、3回発声することにより、
目的の地域の地図を表示させることができる。
【0045】一方、ユーザの目的とする地域が「東京都
文京区千駄木」であるとする。この場合、ユーザは、都
道府県名「東京」から発声してもよいが、市区郡名「文
京」から発声してもよい。
【0046】ユーザが都道府県名「東京」から発声した
ときの動作は、上述の「愛知県岡崎市大和町」を目的の
地域とした場合の動作と同様である。ただし、都道府県
名「東京」に対応する「市区郡名」の辞書の入れ替えは
行われない。
【0047】ユーザが市区郡名「文京」から発声したと
きの動作を以下に説明する。
【0048】ユーザが「文京」と発声すると、都道府県
認識辞書登録領域15aを参照し、「文京」に一致する
語彙を検索する(ステップS23)。
【0049】制御部14は、語彙「文京」を都道府県認
識辞書登録領域15aで検出できず(ステップS2
4)、次に、市区郡認識辞書登録領域15bを参照し、
一致する語彙を検索する(ステップS34)。ここで、
制御部14は、市区郡認識辞書16b内に該当する地名
を検出し、入力された語彙がこれが市区郡の階層に属す
る語彙「文京」であると判別する(ステップS35)。
【0050】続いて、制御部14は、市区郡名「文京」
に対応する区町村字認識辞書16cを区町村字認識辞書
登録領域15cに登録し(ステップS29)、次の音声
入力を待つ(ステップS30)。
【0051】次に、ユーザが「千駄木」と発声すると、
制御部14は区町村字認識辞書16cを参照し、「千駄
木」に一致する語彙を検索する(ステップS31)。
【0052】制御部14は、語彙「千駄木」に一致する
語彙を区町村字認識辞書登録領域15c内に検出する
(ステップS32)。制御部14は、検出した地名が
「文京」区と「千駄木」であることから、対応する都道
府県が「東京」都であることを判別し、東京都文京区千
駄木の地名を出力部12に供給する。出力部12は、対
応する地図を地図格納部13から読み出して、出力部1
2に表示する(ステップS33)。
【0053】その後、処理は、ステップS21にリター
ンする。
【0054】以上のように、目的とする地名の都道府県
名と、初めに登録した地名の都道府県名とが同一である
とき、ユーザは、2回発声することにより、目的の地域
の地図を表示させることができる。
【0055】さらに一方、ユーザの目的とする地域が
「東京都渋谷区神宮前」であるとする。この場合、ユー
ザは、都道府県名「東京」から発声してもよいし、市区
郡名「渋谷」から発声してもよいが、区町村字名「神宮
前」から発声してもよい。
【0056】ユーザが都道府県名「東京」から発声した
ときの動作は、上述の「愛知県岡崎市大和町」を目的の
地域とする場合の動作と同様である。ただし、都道府県
名「東京」に対応する市区郡認識辞書16b、及び市区
郡「渋谷」に対応する区町村字認識辞書16cの入れ替
え(ロード)は行われない。
【0057】ユーザが市区郡名「渋谷」から発声したと
きの動作は、上述の「東京都文京区千駄木」を目的の地
域とする場合の動作である同様である。ただし、市区郡
名「渋谷」に対応する区町村字認識辞書16cの入れ替
え(ロード)は行われない。
【0058】ユーザが「神宮前」と発声すると、制御部
14は、この入力を取り込み(ステップS22)、辞書
登録部15に格納されている都道府県認識辞書16aを
参照し、「神宮前」に一致する語彙を検索する(ステッ
プS23)。
【0059】制御部14は、語彙「神宮前」を都道府県
認識辞書登録領域15aで検出できず(ステップS2
4)、市区郡認識辞書登録領域15bに登録されている
市区郡認識辞書16bを参照し、一致する語彙を検索す
る(ステップS35)。この例では、制御部14は、市
区郡認識辞書登録領域15bでも語彙「神宮前」を検出
できず(ステップS35)、区町村字認識辞書登録領域
15cに登録されている区町村字認識辞書16cを参照
し、一致する語彙を検索する(ステップS36)。制御
部14は、区町村字認識辞書登録領域15cに登録され
ている区町村字認識辞書16c内に一致する語彙「神宮
前」を検出する(ステップS37)。
【0060】制御部14は、入力語彙「神宮前」を検出
した区町村字認識辞書16cから上位にリンクを辿っ
て、市区郡名が「渋谷」区、都道府県が「東京」都であ
るこを判別し、地名を出力部12に供給する。出力部1
2は、対応する地域の地図を地図格納部13より取り出
して出力部12に表示する(ステップS33)。その
後、処理は、ステップS21にリターンし、辞書登録部
15に登録されている辞書を元の辞書(ステップS20
で入力した地名に対応する認識辞書)に戻して、次の音
声の入力を待機する。
【0061】以上のように、目的とする地名の都道府県
名と市区郡名とが、初めに登録した地名の都道府県名及
び市区郡名と同一であるとき、ユーザは、1回の発声の
みで、目的の地域の地図を表示させることができる。
【0062】上述した実施の形態により、頻繁に検索す
る検索対象を最初に入力しておけば、ユーザは1回発声
するだけで、目的とする資料を取り出すことができ、検
索が簡単になる。
【0063】なお、この発明は、上記実施の形態に限定
されず、種々の変形及び応用が可能である。例えば、上
記実施の形態では、ステップS20で、ユーザが比較的
頻繁に使用する地名を「都道府県」、「市区郡」、「区
町村字」を含んだ形で順次入力するとしたが、「市区
郡」のみの形で入力することにより検索を行うこともで
きる。この場合の動作を図5に示す。ここでは具体例と
して、ユーザが始めに入力する地名が「渋谷区」であ
り、目的とする地名が「東京都渋谷区道玄坂」であると
する。
【0064】ユーザは、入力部11から、「渋谷」と入
力する(ステップS40)。制御部14は、辞書格納部
16に指令を出し、市区郡名「渋谷」に対応する都道府
県名を検索する(ステップS41)。制御部14は、辞
書格納部16に指令を出し、都道府県認識辞書16aを
辞書登録部15の都道府県認識辞書登録領域15aに登
録する(ステップS42)。次に、制御部14は、ユー
ザの入力した市区郡名「渋谷」に対応する区町村字認識
辞書16cを辞書登録部15の区町村字認識辞書登録領
域15cに登録する(ステップS43)。以上の処理に
より、辞書登録部15には、市区郡認識辞書登録領域1
5bに登録する辞書がない形で事前登録が完了する。
【0065】ユーザが「道玄坂」と発声すると、制御部
14は、語彙「道玄坂」を都道府県認識辞書登録領域1
5aで検出できず(ステップS24)、次に、市区郡認
識辞書登録領域15bを参照せず、区町村字認識辞書登
録領域15cを参照し、一致する語彙を検索する(ステ
ップS44)。ここで、制御部14は、区町村字認識辞
書16cに該当する地名を検出し(ステップS45)、
入力された語彙が区町村字の階層に属する語彙「道玄
坂」であると判別する(ステップS45)。制御部14
は、検出した地名が「道玄坂」であり、ユーザが音声認
識による検索の前に入力した地名「渋谷」区と、それに
対応する都道府県が「東京」都であるという検索結果よ
り、東京都渋谷区道玄坂近郊の地図を、地図格納部13
から読み出して、出力部12に表示する(ステップS3
3)。
【0066】ユーザが渋谷区内にある区町村字名以外の
地名を検索する場合は、音声入力を都道府県名から始
め、以下の音声認識装置の動作は上述の実施の形態で都
道府県名から発声した場合と同様である(ステップS2
3〜ステップS33)。
【0067】ユーザが渋谷区内にある区町村字名以外の
地名を検索する場合に、音声入力を都道府県名から始め
なかったときは、制御部14は都道府県認識辞書登録領
域15aで語彙を検出できない(ステップS24)。さ
らに、制御部14は区町村字認識辞書登録領域15cで
も検出できず(ステップS45)、ステップS21にリ
ターンする。
【0068】このような構成によれば、最初に市区郡名
のみを入力しておただけでも、その市区郡内の区町村字
については、1回の発声で地図を取り出すことができ、
検索が簡単となる。
【0069】また、上記実施の形態では、システムの起
動時に、ユーザの入力に基づいて各階層の辞書を1セッ
トずつ辞書保持部15に登録したが、予め固定的に辞書
を登録しておいてもよい。また、複数セットの辞書を登
録できるようにしてもよい。さらに、さらに、最初に辞
書保持部15に登録した辞書は削除することなく保持し
てもよい。また、地名の入力方法も、特定の手法に限定
されず、任意である。例えば、GPS(グローバルポジ
ショニングシステム)を使用し、その時点の位置の地名
の辞書を登録してもよい。また、手入力でも、音声入力
でもかまわない。さらに、上記実施の形態の音声認識用
の辞書の構成も、一例であり、上記構成に限定されるも
のではない。また、地図の読み出しは、出力部12が行
うとしたが、制御部14が地図格納部13から、検索し
た地名に対応する地図を読み出して、出力部12に表示
させてもよい。
【0070】本発明は地名の検索に限定されず、様々な
認識及び検索に応用可能である。例えば、検索結果とし
て出力するものが、大学の研究室案内であるとし、「大
学名」、「学部名」、「学科名」、「研究室名」の4つ
の階層として辞書を作成して検索を行うことができる。
【0071】また、本発明の辞書登録部の構成は、音声
認識を用いない通常の検索装置にも適用でき、これによ
り、頻繁に検索する事項の検索の手間を軽減することが
できる。
【0072】また、このシステムは専用のシステムによ
らず、通常のコンピュータを用いても実現可能である。
即ち、コンピュータに、上述の各処理を実行させるため
のプログラムや音声認識用の辞書を記録媒体(フロッピ
ーディスク、CD−ROM、MO、ROM等)に格納し
て配布し、これをコンピュータにインストールしてOS
(オペレーティングシステム)上で、動作させることに
より、コンピュータを上述の音声認識システム、音声認
識検索システム、ナビゲーションシステムとして機能さ
せることが可能である。
【0073】
【発明の効果】以上の説明のように、本発明は、音声認
識装置において認識処理を行うための認識辞書の構成
を、頻繁に検索する事項に合わせた構成にすることによ
り、検索のための命令入力回数を低減することができ
る。
【図面の簡単な説明】
【図1】この発明の実施の形態にかかるナビゲーション
システムの構成を示すブロック図である。
【図2】この発明の実施の形態にかかるナビゲーション
システムの認識辞書の構成を示す図である。
【図3】この発明の実施の形態にかかるナビゲーション
システムの辞書登録部の構成を示す図である。
【図4】この発明の実施の形態にかかるナビゲーション
システムの動作を説明するためのフローチャートであ
る。
【図5】この発明の他の実施の形態にかかるナビゲーシ
ョンシステムの動作を説明するためのフローチャートで
ある。
【図6】従来の技術におけるナビゲーションシステムの
動作を説明するためのフローチャートである。
【符号の説明】
10 ナビゲーションシステム 11 入力部 12 出力部 13 地図格納部 14 制御部 15 辞書登録部 15a 都道府県認識辞書登録領域 15b 市区郡認識辞書登録領域 15c 区町村字認識辞書登録領域 16 辞書格納部 16a 都道府県認識辞書 16b 市区郡認識辞書 16c 区町村字認識辞書

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】音声を入力する入力手段と、 下位の辞書が直近の上位の辞書の各語彙に対応付けられ
    て階層化された音声認識用の複数の辞書の全体を格納す
    る辞書格納手段と、 前記辞書格納手段に格納されている辞書のうち、各階層
    の予め定められた少なくとも一部の辞書を、音声認識の
    開始前に、音声認識の処理に使用するための認識辞書と
    して保持する辞書保持手段と、 前記入力手段が入力した音声と前記辞書保持手段の保持
    する辞書が所有する語彙との比較を上位の辞書から順次
    行い、ある階層の辞書内に入力音声に該当する語彙を検
    出すると、その語彙に対応付けられた1階層下位の辞書
    を前記辞書保持手段にロードして、次に入力された音声
    をロードした辞書に基づいて認識し、ある階層の辞書内
    に一致する語彙を検出できないときに、その辞書よりも
    1階層下位の辞書を用いて入力音声の認識処理を行う認
    識手段と、 前記認識手段の認識結果を出力する出力手段と、 を備えることを特徴とする音声認識装置。
  2. 【請求項2】前記認識手段は、ある階層の辞書内に一致
    する語彙を検出できず、下位の階層の辞書を用いて入力
    音声を認できた時に、ファイルの階層構造より、上位の
    語彙を特定する手段を含む、 ことを特徴とする請求項1に記載の音声認識装置。
  3. 【請求項3】各階層の予め定められた辞書を前記辞書保
    持手段に、音声認識の開始前に、ロードする事前ロード
    手段をさらに備えることを特徴とする請求項1又は2に
    記載の音声認識装置。
  4. 【請求項4】前記事前ロード手段は、ユーザの入力に基
    づいて、各階層の辞書を特定してロードする手段を備え
    る、ことを特徴とする請求項3に記載の音声認識装置。
  5. 【請求項5】前記事前ロード手段は、ユーザの下位の語
    彙の入力に基づいて、上位の階層の辞書を特定してロー
    ドする手段を備える、ことを特徴とする請求項4に記載
    の音声認識装置。
  6. 【請求項6】音声入力された地名を、広域から狭域に階
    層化して構成された辞書のうちロードされた辞書を用い
    て認識し、認識された地名が表す地域内の地名を含む辞
    書を次にロードして、ロードした辞書を次に入力された
    音声の認識に使用することにより、広域から狭域に向け
    て順次入力された地名を、階層化された辞書を順次ロー
    ドしながら認識し、認識した地域の地図を表示するナビ
    ゲーションシステムにおいて、 各階層の予め定められた辞書を、音声認識処理の開始前
    に、音声認識用の辞書として保持する辞書保持手段と、 入力音声と前記辞書保持手段が保持する辞書とを比較
    し、ある階層の辞書内に一致する地名を検出できないと
    きに、下位の階層の辞書を用いて入力音声を認識し、あ
    る階層の辞書内に一致する地名を検出したときに、その
    地名が表す地域に属す地名を格納した下位の辞書をロー
    ドして次の入力音声の認識に使用する認識手段と、 地図データを格納する地図記憶手段と、 前記認識手段の認識結果に対応する地域の地図を前記地
    図記憶手段から読み出して表示する表示手段と、 を備えることを特徴とするナビゲーションシステム。
  7. 【請求項7】前記認識手段は、ある階層の辞書内に一致
    する地名を検出できず、下位の階層の辞書を用いて入力
    音声を認識できた時に、ファイルの階層構造より、上位
    の語彙を特定する手段を含む、 ことを特徴とする請求項6に記載のナビゲーションシス
    テム。
  8. 【請求項8】各階層の予め定められた辞書を前記辞書保
    持手段に、音声認識の開始前に、ロードする事前ロード
    手段をさらに備えることを特徴とする請求項6又は7に
    記載のナビゲーションシステム。
  9. 【請求項9】階層化された辞書を使用して、階層順に入
    力される一連の音声により特定される情報を特定する方
    法であって、 実質的に最初の入力音声を最上位層の辞書を参照して認
    識し、該辞書内に該当する語彙を検出できなかった時
    に、予め格納されている次の階層の辞書を用いて認識処
    理を行い、認識できるまで辞書の階層を変更して認識処
    理を行い、 入力音声をいずれかの階層の辞書を参照して認識できた
    ときに、認識した語彙に対応する下位の辞書をロードし
    て、ロードした辞書を用いて次の入力音声の認識を行
    う、 ことにより、階層化された一連の語彙の全てを入力しな
    くても、認識を可能としたことを特徴とする音声認識方
    法。
  10. 【請求項10】コンピュータを、 音声を入力する入力手段、 下位の辞書が直近の上位の辞書の各語彙に対応付けられ
    て階層化された音声認識用の複数の辞書を格納する辞書
    格納手段、 辞書格納手段に格納されている辞書のうち、各階層の予
    め定められた少なくとも1つの辞書を、音声認識の開始
    前に、音声認識の処理に使用するための認識辞書として
    保持する辞書保持手段、 入力手段が入力した音声と辞書保持手段の保持する辞書
    が所有する語彙との比較を行い、任意の各階層の辞書内
    に入力音声に該当する語彙を検出すると、その語彙に対
    応付けられた下位の辞書を辞書保持手段にロードして次
    に入力された音声をロードした辞書に基づいて認識し、
    ある階層の辞書内に一致する語彙を検出できないとき
    に、1階層下位の辞書を用いて入力音声を認識する認識
    手段、 認識手段の認識結果を出力する出力手段、 として機能させるためのプログラムを記録した機械読み
    取り可能な記録媒体。
JP10262682A 1998-09-17 1998-09-17 音声認識装置と方法、ナビゲーションシステム、及び記録媒体 Pending JP2000089782A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10262682A JP2000089782A (ja) 1998-09-17 1998-09-17 音声認識装置と方法、ナビゲーションシステム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10262682A JP2000089782A (ja) 1998-09-17 1998-09-17 音声認識装置と方法、ナビゲーションシステム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2000089782A true JP2000089782A (ja) 2000-03-31

Family

ID=17379135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10262682A Pending JP2000089782A (ja) 1998-09-17 1998-09-17 音声認識装置と方法、ナビゲーションシステム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2000089782A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073074A (ja) * 2000-08-31 2002-03-12 Pioneer Electronic Corp 音声による数字列認識方法ならびに装置
EP1197950A2 (en) * 2000-10-12 2002-04-17 Pioneer Corporation Hierarchized dictionaries for speech recognition
EP1505573A1 (en) * 2002-05-10 2005-02-09 Asahi Kasei Kabushiki Kaisha Speech recognition device
JP2008065202A (ja) * 2006-09-11 2008-03-21 Alpine Electronics Inc 地点探索装置及びナビゲーション装置
JP2008197338A (ja) * 2007-02-13 2008-08-28 Denso Corp 音声認識装置
US7933432B2 (en) 2005-11-24 2011-04-26 Honda Motor Co., Ltd. Information retrieval system for car navigation systems

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073074A (ja) * 2000-08-31 2002-03-12 Pioneer Electronic Corp 音声による数字列認識方法ならびに装置
JP4486235B2 (ja) * 2000-08-31 2010-06-23 パイオニア株式会社 音声認識装置
EP1197950A2 (en) * 2000-10-12 2002-04-17 Pioneer Corporation Hierarchized dictionaries for speech recognition
EP1197950A3 (en) * 2000-10-12 2003-02-12 Pioneer Corporation Hierarchized dictionaries for speech recognition
US6961706B2 (en) 2000-10-12 2005-11-01 Pioneer Corporation Speech recognition method and apparatus
EP1505573A1 (en) * 2002-05-10 2005-02-09 Asahi Kasei Kabushiki Kaisha Speech recognition device
EP1505573A4 (en) * 2002-05-10 2005-07-13 Asahi Chemical Ind VOICE RECOGNITION DEVICE
US7487091B2 (en) 2002-05-10 2009-02-03 Asahi Kasei Kabushiki Kaisha Speech recognition device for recognizing a word sequence using a switching speech model network
US7933432B2 (en) 2005-11-24 2011-04-26 Honda Motor Co., Ltd. Information retrieval system for car navigation systems
JP2008065202A (ja) * 2006-09-11 2008-03-21 Alpine Electronics Inc 地点探索装置及びナビゲーション装置
JP2008197338A (ja) * 2007-02-13 2008-08-28 Denso Corp 音声認識装置

Similar Documents

Publication Publication Date Title
JP6570651B2 (ja) 音声対話装置および音声対話方法
US8949133B2 (en) Information retrieving apparatus
US8731927B2 (en) Speech recognition on large lists using fragments
JP4116233B2 (ja) 音声認識装置ならびにその方法
US9805722B2 (en) Interactive speech recognition system
JP3990075B2 (ja) 音声認識支援方法及び音声認識システム
JP3278222B2 (ja) 情報処理方法及び装置
JP4260788B2 (ja) 音声認識機器制御装置
US12051403B2 (en) Server supported recognition of wake phrases
KR20130034630A (ko) 컨텍스트 정보를 이용한 음성 인식 복구
JP2010191400A (ja) 音声認識装置およびデータ更新方法
JP2008509431A (ja) ユーザーとの会話式対話を実行するシステムのための方法
JPH06332493A (ja) 音声対話型情報検索装置及び方法
JP2002123290A (ja) 音声認識装置ならびに音声認識方法
JP2008046260A (ja) 音声認識装置
JP2000089782A (ja) 音声認識装置と方法、ナビゲーションシステム、及び記録媒体
JP3795409B2 (ja) 音声認識装置及び方法
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP2004029354A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2000181485A (ja) 音声認識装置及び方法
KR20100126992A (ko) 명령횟수를 줄일 수 있는 음성 인식을 이용한 주소 검색 방법
JP2002062893A (ja) 車載ナビゲーション装置
JP2001154691A (ja) 音声認識装置
JPH11325946A (ja) 車載用ナビゲーション装置
JP2007193184A (ja) 音声住所認識装置