JP4289863B2 - データ入力装置、データ入力方法 - Google Patents
データ入力装置、データ入力方法 Download PDFInfo
- Publication number
- JP4289863B2 JP4289863B2 JP2002307426A JP2002307426A JP4289863B2 JP 4289863 B2 JP4289863 B2 JP 4289863B2 JP 2002307426 A JP2002307426 A JP 2002307426A JP 2002307426 A JP2002307426 A JP 2002307426A JP 4289863 B2 JP4289863 B2 JP 4289863B2
- Authority
- JP
- Japan
- Prior art keywords
- data input
- recognition
- voice
- button
- numerical value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 238000012790 confirmation Methods 0.000 description 5
- 230000005611 electricity Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
【発明の属する技術分野】
本発明は、音声によって数値データを入力するためのデータ入力装置、データ入力方法に関するものである。
【0002】
【従来の技術】
ガスや電気の検針業務、商品の棚卸し業務などに携帯端末(ハンディーターミナル)を用いる機会が増えている。携帯端末を用いることにより、現場で得た情報をリアルタイムに入力し、処理できるため業務の効率化・迅速化が実現されている。携帯端末は携帯性重視のため小型化されており、データの入力作業においてはソフトキーボードやペン入力が一般的である。一方、それに代わるデータ入力手段として、近年、音声認識が注目されている。音声認識は、両手がふさがっている状況で有力な入力手段である。既に音声認識機能を持つ携帯端末も発売されている。
【0003】
音声認識では、受理可能な単語や認識文法をあらかじめ定義しておくことが一般的である.例えば3桁の数字の認識を行なう場合には、0から999までの数字をそれぞれ単語として登録する方法や、各桁ごとに0から9までの数字が受理できるような認識文法を用意する方法などがある。この受理可能な単語数や認識文法の複雑さは認識性能に影響を与える。つまり、受理可能な単語数が少ないほど認識結果の正解率は高くなることが期待できる。このような背景から、従来では、受理すべき単語(この場合は位取りした数字など)をあらかじめユーザーが設定しておくことによって、受理可能な単語もしくは認識文法を軽減することを特徴とした発明がなされている(特許文献1参照)。
【0004】
例えば、ある品物の価格帯が100円から1000円までであり、かつ、100円刻みの価格設定である場合、受理すべき数値は、100、200、300、・・・、1000の10通りである。従来の0から1000までの整数を受理する音声認識文法を利用する場合、10単語を認識するだけであるにもかかわらず、認識文法は1000単語を受理することができる。そのため、誤認識の可能性が高くなってしまう。ところが、上記の発明によると、ユーザーがその価格帯の最小値、最大値、ステップ幅などを設定すれば、それをもとに受理単語数が軽減された認識文法を生成することが可能となり、認識率の低下を抑制することができる。
【特許文献1】
特開2001−005484号公報
【発明が解決しようとする課題】
しかしながら、上記発明では、各項目(価格、個数)ごとにその最小値や最大値、ステップ値などをあらかじめユーザーが設定する必要がある。
【0005】
本発明は上記問題に鑑みてなされたものであり、過去の履歴データをもとに信頼性の高い数値が入力可能なデータ入力装置、データ入力方法に関するものである。
【0006】
【課題を解決するための手段】
本発明の目的を達成するために、例えば本発明のデータ入力装置は以下の構成を備える。
【0007】
すなわち、音声によって数値データを入力するためのデータ入力装置であって、
過去に入力された数値データを保持する保持手段と、
前記保持手段が保持する数値データから、入力されると推定される数値の範囲を求める計算手段と、
数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識手段と、
前記音声認識手段による認識結果が示す数値が、前記計算手段により求めた範囲に含まれているか否かを判断する判断手段と、
前記音声認識手段に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示手段と
を備えることを特徴とする。
【0012】
本発明の目的を達成するために、例えば本発明のデータ入力方法は以下の構成を備える。
【0013】
すなわち、過去に入力された数値データを保持するメモリを備え、音声によって数値データを入力するためのデータ入力装置が行うデータ入力方法であって、
前記メモリが保持する数値データから、入力されると推定される数値の範囲を求める計算工程と、
数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識工程と、
前記音声認識工程による認識結果が示す数値が、前記計算工程で求めた範囲に含まれているか否かを判断する判断工程と、
前記音声認識工程に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示工程と
を備えることを特徴とする。
【0018】
【発明の実施の形態】
以下添付図面を参照して、本発明のデータ入力装置を携帯端末に適用した好適な実施形態について詳細に説明するが、本発明の適用対象は携帯端末に限定されるものではない。
【0019】
[第1の実施形態]
図1は本実施形態に係るデータ入力装置の基本構成を示すブロック図である。以下の説明ではガスや電気などの検針作業において音声を用いてメータの数値を携帯端末に入力する場合について説明するが、携帯端末に音声を用いて数値を入力することであれば、これに限定されるものではない。
【0020】
本実施形態に係るデータ入力装置は、制御メモリ(ROM)101、中央処理装置102,メモリ(RAM)103,外部記憶装置104,D/A変換器105,スピーカ106,A/D変換器107、マイク108、入力装置109、表示装置110により構成されており、制御メモリ(ROM)101、中央処理装置102,メモリ(RAM)103,外部記憶装置104,D/A変換器105,A/D変換器107、入力装置109、表示装置110の各部はバス111に接続されており、互いにデータ通信が可能である。
【0021】
ROM101にはデータ入力装置全体の制御を行うためのプログラム(例えばブートプログラム)やデータ(設定データ)などが格納されている。中央処理装置102はROM101やRAM103に格納されているプログラムやデータを用いてデータ入力装置全体の制御を行うと共に、後述の各種の処理を実行する。RAM103は中央処理装置102が各種の処理を実行するために用いる外部記憶装置104からロードされたプログラムやデータを一時的に記憶するエリアを備えると共に、中央処理装置102が各種の処理を行うために処理中のデータを一時的に記憶したりするためのワークエリアも備える。
【0022】
外部記憶装置104はハードディスクなどの大記憶容量の記憶装置であって、後述の各処理を中央処理装置102が実行するためのプログラムや、文字データ、音声データなどの各種のデータを保存する。D/A変換器105はRAM103に読み出された音声信号をD/A変換し、スピーカ106にアナログ信号として出力する機能を有し、スピーカ106はこのアナログ信号を音声として出力する。
【0023】
A/D変換器107は、マイク108から入力されたアナログ信号としての音声信号をA/D変換し、ディジタル信号としてメモリRAM103に出力する機能を有する。入力装置109はペン等のポインティングデバイスやテンキーなどにより構成されており、各種の指示を中央処理装置102に対して入力することができる。表示装置110はCRTや液晶画面などにより構成されており、画像情報や文字情報など、各種の情報を表示することができる。なお、表示装置110はタッチパネルで構成されていてもよく、その場合入力装置109は省略しても良いし、タッチパネル上を指示するペンであってもよい。
【0024】
図2は本実施形態に係るデータ入力装置において、入力された音声を認識し、認識した結果を保持するための機能構成を示すブロック図である。履歴保持部201は、過去のメータの検針結果の履歴データ(即ち過去の検針により得られたメータの値を示すデータ)を保持する。範囲予測部202は、履歴保持部201が保持する履歴データを用いて、これから行う検針により得られるメータの値の範囲(予測範囲)を求める。予測結果保持部203は、範囲予測部202が求めた予測範囲を示すデータを格納する。音声認識部204は、ユーザ(ここでは検針作業者)が発声するメータの値(数値)を表現する音声に対して音声認識を行う。なお、音声認識の技術に関しては公知の技術であるので、ここでの詳細な説明は省略する。
【0025】
認識結果保持部205は、音声認識部204が音声認識した結果を保持する。比較部206は、認識結果が予測範囲内かどうかを判定する。確認部207は、認識結果に間違いがないかをユーザに確認する。結果保存部208は、認識結果を今回の検針結果として保存する。提示部209は、音声認識の結果をユーザーに提示する。
【0026】
図3は本実施形態に係るデータ入力装置にメータの数値を発声した場合に、このデータ入力装置が行う処理のフローチャートである。同図のフローチャートに従った処理は、マイク108に音声が入力されたことを中央処理装置102が検知した場合に、実行されるものである。
【0027】
まず範囲予測部202が、入力されると推定される数値の範囲、すなわち、これから行う検針の結果(メータの数値)が取りうる範囲(予測範囲)を、履歴保持部201が保持する過去の検針履歴のデータを用いて求める(予測する)(ステップS301)。求めた予測範囲を示すデータは予測結果保持部203に格納する。
【0028】
過去のメータの検針履歴の一例としては、過去の検針時におけるメータの値や過去の月間利用量、年間の平均利用量などが考えられる。月間利用量や年間の平均利用量などは、過去のメータの値から計算することが可能なので、以下に示す予測範囲の算出方法の一例では、過去のメータの値を履歴として利用する場合について述べる。
【0029】
2か月前に検針したときに得られたメータの値(Vm2)と前月に検針したときに得られたメータの値(Vm1)の差をもとに、今回検針することで得られる今月のメータの値(Vcurr)を予測する場合を考えると、今月のメータの予測値は、
Vcurr = Vm1 + (Vm1 − Vm2) = 2 Vm1 − Vm2
となる。もちろん、予測には誤差が生じるため、予測範囲として捉えた方が現実的といえる。その場合は、前月の利用量(Vm1−Vm2)にある程度の幅を持たせ(例えば±50%)それを予測範囲とすればよい。この場合の予測範囲は、
2Vm1−Vm2−(Vm1−Vm2)/2 ≦ Vcurr ≦ 2Vm1−Vm2+ (Vm1−Vm2) / 2
すなわち、
3/2(Vm1−Vm2) ≦Vcurr≦ 5/2Vm1 − 3/2Vm2 (式1)
となる。
【0030】
上記計算により、今月のメータの値、すなわち入力されるであろう数値を予測できると共に、「通常(従来と同じ使用頻度)の使用方法を続けているのであれば、今月はこの程度のメータの値になるであろう」というように、今月のメータの値が通常程度のものであるか否かを判断することができる。もし今月のメータの値が(式1)を満たさない場合には、音声認識の結果がおかしい(もしくは入力した数値がおかしい)、もしくは今月のメータの値は異常(通常予測できるものではない値である)であると判断することができ、入力するメータの値に対する正当性のチェックを厳密に行うことができる。
【0031】
なお、本実施形態では予測範囲を線形予測的に求めているが、他の統計的手法を用いて求めても良い。
【0032】
図3に戻って、マイク108を介して入力された、メータの値を表現する音声に対して、音声認識部204は音声認識処理を行い、音声認識結果を示すデータを認識結果保持部205に格納する(ステップS302)。次に比較部206は認識結果保持部205に格納されたデータが示す今月のメータの値が予測範囲に含まれているか、例えば(式1)を満たすかどうかを判定する(ステップS303)。
【0033】
そして今月のメータの値が予測範囲内であれば(例えば今月のメータの値が(式1)を満たしていれば)、音声認識の結果、即ち今月の検針により得られたメータの値のデータを結果保持部208に格納する(ステップS306)。なお、結果保持部208に格納された値を示すデータは履歴保持部201に格納されている検針履歴データに加えられ、次回、検針を行う際に上記予測範囲を計算する際に用いられる。
【0034】
一方、今月のメータの値が予測範囲外であれば(例えば今月のメータの値が(式1)を満たしていなければ)、提示部209は認識結果をユーザに提示し(ステップS304)、確認部207は認識結果の正当性の確認を検針作業者に促し、その回答を得る(ステップS305)。認識結果をユーザに提示する目的としては、上述の通り、検針作業者に対して、検針作業者が意図した数値が入力できたか否かの確認を行わせたり、今月のメータの値が異常なものであるか否かの判断基準を与えたりすることである。
【0035】
具体的に認識結果の提示手段としては、表示装置110に、例えば認識結果を表示して「この認識結果でよいですか?」などのメッセージを表示しても良いし、スピーカ106から、このメッセージを音声として出力しても良い。なおこれらのメッセージの文字データや音声データは外部記憶装置104に保存されており、必要に応じてRAM103に読み出されて用いられる。
【0036】
なお、検針作業者がメータの値の再入力が必要であると判断し、この旨を入力装置109から入力した場合には(例えば再入力を行うためのボタンを押した場合には)、もう一度上記ステップS302以降の処理を実行する。
【0037】
また、今月のメータの値が予測範囲内であっても、認識結果を表示装置110やスピーカ106介して提示しても良い。この場合は、ステップS303とステップS304の順序を逆にすればよい。
【0038】
以上、本実施形態に係るデータ入力装置によって、入力する数値に対する正当性のチェックを行うことができ、より信頼性の高い数値を入力することができる。
【0039】
[第2の実施形態]
上記第1の実施形態では、音声認識結果が予測範囲内にあるかどうかを判定することによって、認識結果の正当性をチェックするデータ入力装置、データ入力方法について説明した。本実施形態に係るデータ入力装置、データ入力方法は、認識文法を予測範囲から動的に生成し、生成した認識文法を用いて音声認識を行う。これにより、認識対象を限定することができ、認識率の向上が期待できるので、結果として認識結果の正当性を上げることができる。
【0040】
図4は本実施形態に係るデータ入力装置の機能構成を示すブロック図である。なお図2に示す各部分と同じ部分については同じ番号を付けており、その説明を省略する。また、本実施形態に係るデータ入力装置の基本構成は第1の実施形態と同様に、図1に示す基本構成とする。
【0041】
本実施形態に係るデータ入力装置の機能構成は比較部206、確認部207の代わりに、認識文法生成部406、認識文法保持部407を備える。認識文法生成部406は予測結果保持部203が保持する予測範囲から認識文法を生成する。認識文法保持部407は、生成された認識文法を保持する。
【0042】
図5は、メータの数値を発声することで本実施形態に係るデータ入力装置にメータの値を表現する音声を入力した場合に、このデータ入力装置が行う処理のフローチャートである。
【0043】
まず範囲予測部202が、入力されると推定される数値の範囲、すなわち、これから行う検針の結果(メータの数値)が取りうる範囲(予測範囲)を、履歴保持部201が保持する過去の検針履歴のデータを用いて求める(予測する)(ステップS501)。求めた予測範囲を示すデータは予測結果保持部203に格納する。予測範囲を求める方法については第1の実施形態で説明した方法と同じでも良いし、他の手法を用いても良い。
【0044】
次に、予測結果保持部203が保持する予測範囲をもとに、認識文法生成部406が予測範囲を認識するための認識文法を生成する(ステップS502)。ここで予測範囲に基づいて認識文法を生成する処理についてより詳細に説明する。図6は、予測範囲が(式2)に示す結果となった場合の認識文法を示す図である。
【0045】
211.3 ≦ Vcurr ≦ 223.5 (式2)
図6において、211.3から223.5までの数値を認識するために必要な百の位、十の位、一の位、小数点、小数点第一位の各数値は各桁の丸で囲まれている。また各桁の丸間を繋ぐ直線は各桁間で取りうる組み合わせを示す。また同図の「skip」はその桁(もしくは小数点)をとばすことを示す。これら各桁の丸で囲まれた数値を認識可能な各位の数値として認識文法を生成する。認識可能な単語の集合については文法に記述される。
【0046】
予め認識可能な数値の範囲(予測範囲)を求めずに、音声認識を行うと、図6に記載されている各桁のすべての数字の組合せが認識可能な数値となってしまう。音声認識では入力された音声に基づいたデータが認識可能な数値のデータのいずれであるかを比較し、最も尤もらしいものを認識結果とする処理を行うので、認識可能な数値が多いとその分だけ処理時間を要する。よって上記処理により、認識可能な数値を限定することができるので、より高速に認識処理を行うことができると共に、より高精度に認識結果を得ることができる。図6では、説明を簡単にするため、数値を位取りして読む場合を想定した認識文法の一例を示したが、これに限定されるものではなく、一桁ずつ数字を読み上げる認識文法であってもよいし、それらの組合せなどでもよい。
【0047】
図5に戻って、音声認識部204はステップS502で生成された認識文法を用いて音声認識処理を行い(ステップS503)、認識結果を認識結果保持部205に格納する(ステップS504)。
【0048】
[第3の実施形態]
上記第1の実施形態では、音声認識結果が予測範囲外にある場合にのみ、音声認識結果をユーザに提示する場合について説明した。しかしながら、現在の音声認識の能力では、認識率100%を期待することはできない。そのため、音声認識の結果を常にユーザに提示することが一般的であるといえる。そこで、第3の実施形態では、音声認識結果が予測範囲内であるか予測範囲外であるかに応じて、ユーザーに提示する内容を変える場合について説明する。
【0049】
本実施形態に係るデータ入力装置の機能構成を示すブロック図は図2に示すものと同じであるが、いくつかの部分が行う処理が異なる。また、本実施形態に係るデータ入力装置の基本構成は第1の実施形態と同様に、図1に示す基本構成とする。提示部209は、認識結果が予測範囲内であるか範囲外であるかによって、提示する内容を変えて、ユーザに認識結果および確認を促すための情報を提示する。
【0050】
図7は、メータの数値を発声することで本実施形態に係るデータ入力装置にメータの値を表現する音声を入力した場合に、このデータ入力装置が行う処理のフローチャートである。
【0051】
ステップS801およびステップS802は、第1の実施形態のステップS301およびステップS302と同じであるので、説明を省略する。
【0052】
ステップS803では、比較部206は認識結果保持部205に格納されたデータが示す今月のメータの値が予測範囲に含まれているかどうかを判定し、ステップS804に移る。
【0053】
ステップS804では、比較部206が行なった比較結果(認識結果が予測範囲内であるか、範囲外であるか)に応じて、提示部209が認識結果をユーザに提示するための提示内容を生成し、表示装置110やスピーカ106を介して認識結果とともに比較結果に応じた情報を提示し、ステップS805に移る。
【0054】
ステップS805およびステップS806は、第1の実施形態のステップS305およびステップS306と同じであるので、説明を省略する。
【0055】
図8A、8Bは、比較部206が行なった比較結果に応じて、提示部209が提示する情報の一例を示す図である。提示する情報はGUIの形式で提示される。図8Aは、認識結果が予測範囲内であった場合に表示装置110に出力するGUIを示す図である。901は認識結果を表示する領域、902および903はユーザが認識結果の正当性を入力するボタンである。この場合は、認識結果の正当性が高いので、「OK」が目立つように太字で大きいフォントになっている。
【0056】
図8Bは、認識結果が予測範囲外であった場合に表示装置110に出力するGUIを示す図である。この場合は、認識結果が正しくないもしくは、通常では起こりえない異常な数値である可能性が高いので、NGが目立つようになっている。このように、認識結果が予測範囲内であるか範囲外であるかに応じて提示する内容を変えることが誤入力の防止に効果的である。文字のフォントや大きさなど以外にも、色を変えたり、予測範囲外であったときに注意を喚起するような音や画像などを提示することも有効である。
【0057】
なお、「OK」のボタンを押下することでステップS805からステップS806へ、「NG」のボタンを押下することでステップS805からステップS802へ処理は移行される。
【0058】
[第4の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では過去2ヶ月分の検針履歴を用いて認識結果の正当性を判断していた。しかし前月の検針履歴のみを用いて認識結果の正当性を判断することも可能である。
【0059】
ガスや電気などのメータは使用量に応じて累積的に値が増加する。つまり、今月のメータの値は少なくとも前月のメータの値以上であると考えてよい。この性質を利用すると、前月の検針値以下の認識結果は正当な結果ではないという判断が下せる。
【0060】
この場合、データ入力装置の機能構成としては図2に示した構成において範囲予測部202や予測結果保持部203は省略することができ、更に履歴保持部201には前月の履歴、すなわち前月の検針により得られたメータの値を示すデータを格納しておく。そして比較部206は、履歴保持部201が保持する前月のメータの値を示すデータと音声認識結果とを比較する。そして認識結果が示すメータの値が前月のメータの値よりも小さい場合は、第1の実施形態と同様に確認部207が認識結果に間違いないかをユーザに確認する。また、比較する対象は2ヶ月以上前のものでも良い。
【0061】
[第5の実施形態]
第4の実施形態で説明した前月のメータの値と今月のメータの値との関係を用いて、第2の実施形態と同様に認識文法を動的に生成することも可能である。この場合、データ入力装置の機能構成としては図4に示した構成において、範囲予測部202および予測結果保持部203は省略することができ、更に履歴保持部201には前月の履歴、すなわち前月の検針により得られたメータの値を示すデータを格納しておく。そして認識文法生成部406は、履歴保持部201が保持する前月のメータの値以上の数値を認識可能な数値として認識文法を生成する。
【0062】
[第6の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では、予測範囲を求めるために、過去2か月分のメータの値を用いて求めていたが、これに限定されるものではなく、例えば前年同月の利用量などをもとに予測範囲を求めても良い。特に、ガスや電気などの利用量は季節による変動が大きいので、この方法によってより精度の高い予測が可能になる。
【0063】
[第7の実施形態]
第1の実施形態に係る予測範囲を求める方法の説明では、前月の利用量(Vm1−Vm2)にある程度の幅を持たせており、その幅を±50%としたが、この数値に固定されるものではなく、過去の月間利用量の平均や分散などの統計値を使って予測範囲の幅を求めても良い。
【0064】
[第8の実施形態]
第2の実施形態に係る認識文法の生成方法の説明において、メータの値の取りうる範囲として小数点以上3桁、以下1桁の数値で表現したが、夫々の桁数はこれに限定されるものではない。
【0065】
[第9の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では、認識結果が予測範囲外である場合に、確認部207が認識結果を検針作業者に提示していたが、この提示処理を省略して、認識結果が予測範囲外であると判断された時点で再度音声認識処理を行うために、表示装置110やスピーカ106等を用いて音声の入力を促しても良い。
【0066】
[第10の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では、認識結果が予測範囲外である場合に再度数値を入力する手段として音声を用いていたが、この場合、入力装置109、すなわち、ペンやテンキーなどを用いて入力しても良い。これは何度も数値を発声することが困難、もしくは避けたい場合に好適な手段である。
【0067】
[第11の実施形態]
上記実施形態では図2に示した各機能構成(もしくは図4に示した各機能構成)が1つのデータ入力装置内に備わっているものとして説明したが、これに限定されるものではなく、各部が計算機などで構成されており、夫々の各部がネットワーク上に分散しており、互いにデータ通信が可能に構成されていても良い。
【0068】
[その他の実施の形態]
さらに、本発明は上記実施形態を実現するための装置及び方法のみに限定されるものではなく、上記システム又は装置内のコンピュータ(CPUあるいはMPU)に、上記実施形態を実現するためのソフトウエアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させることにより上記実施形態を実現する場合も本発明の範疇に含まれる。
【0069】
またこの場合、前記ソフトウエアのプログラムコード自体が上記実施形態の機能を実現することになり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給するための手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。
【0070】
この様なプログラムコードを格納する記憶媒体としては、例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0071】
また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施形態の機能が実現される場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているOS(オペレーティングシステム)、あるいは他のアプリケーションソフト等と共同して上記実施形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。
【0072】
更に、この供給されたプログラムコードが、コンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能格納ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上記実施形態が実現される場合も本発明の範疇に含まれる。
【0073】
【発明の効果】
以上の説明により、本発明によって、信頼性の高い数値を入力することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係るデータ入力装置の基本構成を示すブロック図である。
【図2】本発明の第1の実施形態に係る実施形態に係るデータ入力装置において、入力された音声を認識し、認識した結果を保持するための機能構成を示すブロック図である。
【図3】本発明の第1の実施形態に係るデータ入力装置にメータの数値を発声した場合に、このデータ入力装置が行う処理のフローチャートである。
【図4】本発明の第2の実施形態に係るデータ入力装置の基本構成を示すブロック図である。
【図5】メータの数値を発声することで本発明の第2の実施形態に係るデータ入力装置にメータの値を表現する音声を入力した場合に、このデータ入力装置が行う処理のフローチャートである。
【図6】本発明の第2の実施形態において、予測範囲が(式2)に示す結果となった場合の認識文法を示す図である。
【図7】本発明の第3の実施形態に係るデータ入力装置にメータの数値を発声した場合に、このデータ入力装置が行う処理のフローチャートである。
【図8A】本発明の第3の実施形態において、提示部が提示する情報の一例を示した図である。
【図8B】本発明の第3の実施形態において、提示部が提示する情報の一例を示した図である。
Claims (7)
- 音声によって数値データを入力するためのデータ入力装置であって、
過去に入力された数値データを保持する保持手段と、
前記保持手段が保持する数値データから、入力されると推定される数値の範囲を求める計算手段と、
数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識手段と、
前記音声認識手段による認識結果が示す数値が、前記計算手段により求めた範囲に含まれているか否かを判断する判断手段と、
前記音声認識手段に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示手段と
を備えることを特徴とするデータ入力装置。 - 前記判断手段は、前記音声認識手段による認識結果が示す数値が、前記計算手段により求めた範囲に含まれている場合には、当該認識結果が示す数値を入力すべき数値データとして判断することを特徴とする請求項1に記載のデータ入力装置。
- 前記数値データは、検針することで得られるメータの値を示すデータであることを特徴とする請求項1に記載のデータ入力装置。
- 前記データ入力装置は携帯端末であることを特徴とする請求項1乃至3のいずれか1項に記載のデータ入力装置。
- 過去に入力された数値データを保持するメモリを備え、音声によって数値データを入力するためのデータ入力装置が行うデータ入力方法であって、
前記メモリが保持する数値データから、入力されると推定される数値の範囲を求める計算工程と、
数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識工程と、
前記音声認識工程による認識結果が示す数値が、前記計算工程で求めた範囲に含まれているか否かを判断する判断工程と、
前記音声認識工程に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示工程と
を備えることを特徴とするデータ入力方法。 - コンピュータを請求項1乃至4の何れか1項に記載のデータ入力装置が有する各手段として機能させる為のプログラム。
- 請求項6に記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002307426A JP4289863B2 (ja) | 2002-10-22 | 2002-10-22 | データ入力装置、データ入力方法 |
US10/690,028 US7418384B2 (en) | 2002-10-22 | 2003-10-20 | Voice data input device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002307426A JP4289863B2 (ja) | 2002-10-22 | 2002-10-22 | データ入力装置、データ入力方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004144850A JP2004144850A (ja) | 2004-05-20 |
JP2004144850A5 JP2004144850A5 (ja) | 2007-03-01 |
JP4289863B2 true JP4289863B2 (ja) | 2009-07-01 |
Family
ID=32211563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002307426A Expired - Fee Related JP4289863B2 (ja) | 2002-10-22 | 2002-10-22 | データ入力装置、データ入力方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7418384B2 (ja) |
JP (1) | JP4289863B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070043849A1 (en) * | 2003-09-05 | 2007-02-22 | David Lill | Field data collection and processing system, such as for electric, gas, and water utility data |
CA2485595A1 (en) * | 2003-10-21 | 2005-04-21 | Itron, Inc. | Combined scheduling and management of work orders, such as for utility meter reading and utility servicing events |
US20050267898A1 (en) * | 2004-05-28 | 2005-12-01 | Robert Simon | Data format and method for communicating data associated with utility applications, such as for electric, gas, and water utility applications |
US7283062B2 (en) * | 2004-07-28 | 2007-10-16 | Itron, Inc. | Mapping in mobile data collection systems, such as for utility meter reading and related applications |
US7362236B2 (en) * | 2004-12-06 | 2008-04-22 | Itron, Inc. | Mobile utility data collection system with voice technology, such as for data collection relating to an electric, gas, or water utility |
US7830874B2 (en) * | 2006-02-03 | 2010-11-09 | Itron, Inc. | Versatile radio packeting for automatic meter reading systems |
JP4702081B2 (ja) * | 2006-02-08 | 2011-06-15 | 株式会社豊田中央研究所 | 文字入力装置 |
US9347975B2 (en) | 2007-08-14 | 2016-05-24 | Fluke Corporation | Auto-numbering of measurements in digital multimeter |
US8456153B2 (en) * | 2007-08-14 | 2013-06-04 | Fluke Corporation | Digital multimeter having improved recording functionality |
US8456152B2 (en) * | 2007-08-14 | 2013-06-04 | Fluke Corporation | Digital multimeter with context-sensitive explanatory information |
US8730056B2 (en) | 2008-11-11 | 2014-05-20 | Itron, Inc. | System and method of high volume import, validation and estimation of meter data |
US8436744B2 (en) * | 2009-01-29 | 2013-05-07 | Itron, Inc. | Prioritized collection of meter readings |
US20100265095A1 (en) * | 2009-04-20 | 2010-10-21 | Itron, Inc. | Endpoint classification and command processing |
CN104298452A (zh) * | 2014-11-06 | 2015-01-21 | 国家电网公司 | 电能表及其查询方法 |
CN105678513B (zh) * | 2015-12-31 | 2020-02-04 | 联想(北京)有限公司 | 信息处理方法、装置及电子设备 |
WO2019051010A1 (en) * | 2017-09-06 | 2019-03-14 | Landis+Gyr Innovations, Inc. | VOICE ENABLEMENT ENERGY MANAGEMENT SYSTEM |
CN107945804A (zh) * | 2017-12-07 | 2018-04-20 | 杭州测质成科技有限公司 | 基于语音识别的任务管理与量具数据提取系统及其方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4937763A (en) * | 1988-09-06 | 1990-06-26 | E I International, Inc. | Method of system state analysis |
US5698834A (en) * | 1993-03-16 | 1997-12-16 | Worthington Data Solutions | Voice prompt with voice recognition for portable data collection terminal |
JPH07134793A (ja) * | 1993-11-09 | 1995-05-23 | Takara Keiki Seisakusho:Kk | 検針システム |
JP3557467B2 (ja) * | 1997-06-11 | 2004-08-25 | 株式会社日立製作所 | 音声データの認識方法及びその装置 |
JP2001005484A (ja) * | 1999-06-23 | 2001-01-12 | Toshiba Tec Corp | 音声認識装置 |
US7072863B1 (en) * | 1999-09-08 | 2006-07-04 | C4Cast.Com, Inc. | Forecasting using interpolation modeling |
JP3765985B2 (ja) * | 2001-02-01 | 2006-04-12 | 横河電機株式会社 | 計器評価システム |
JP2002245090A (ja) * | 2001-02-19 | 2002-08-30 | Osaka Gas Co Ltd | データ収集システム |
JP2002288279A (ja) * | 2001-03-23 | 2002-10-04 | Idemitsu Gas & Life Co Ltd | エネルギ販売管理システム |
-
2002
- 2002-10-22 JP JP2002307426A patent/JP4289863B2/ja not_active Expired - Fee Related
-
2003
- 2003-10-20 US US10/690,028 patent/US7418384B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20040093209A1 (en) | 2004-05-13 |
US7418384B2 (en) | 2008-08-26 |
JP2004144850A (ja) | 2004-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4289863B2 (ja) | データ入力装置、データ入力方法 | |
JP3514372B2 (ja) | マルチモーダル対話装置 | |
WO2019128103A1 (zh) | 信息录入方法、装置、终端及计算机可读存储介质 | |
US20200035241A1 (en) | Method, device and computer storage medium for speech interaction | |
CN109086026B (zh) | 播报语音的确定方法、装置和设备 | |
US20080312928A1 (en) | Natural language speech recognition calculator | |
KR20020041296A (ko) | 음성인식시스템, 음성인식서버, 음성인식클라이언트 및그들의 제어방법과, 컴퓨터가독메모리 | |
CN108227565A (zh) | 一种信息处理方法、终端及计算机可读介质 | |
CN108108094A (zh) | 一种信息处理方法、终端及计算机可读介质 | |
JP5532781B2 (ja) | 接客業務用サーバ、並びに、当該サーバを用いる接客システム及び接客業務の予測終了時間算出方法 | |
CN112259090A (zh) | 基于语音交互的业务办理方法、装置和电子设备 | |
JP2012216007A (ja) | 入出力デバイス情報を考慮したマルチモーダル対話プログラム、システム及び方法 | |
JP4749437B2 (ja) | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム | |
CN110673908A (zh) | 一种界面生成方法、装置、介质和电子设备 | |
JP2001042890A (ja) | 音声認識装置 | |
TWI763663B (zh) | 數字資訊輸入處理、資料物件資源資訊處理方法及裝置、對第三方應用程式進行數字資訊輸入處理的方法及裝置、和用戶介面 | |
JP2005115773A (ja) | 入力モード選択方法、入力モード切り替え方法、入力モード選択切り替え方法、入力モード選択装置、入力モード切り替え装置、電子機器、プログラム、及び記憶媒体 | |
US20090077458A1 (en) | Time-based Programming and Computation | |
US20230419949A1 (en) | Audible transaction verification with an assistance device | |
WO2021235279A1 (ja) | 情報処理装置、情報処理方法、および記録媒体 | |
JP2003323196A (ja) | 音声認識システム、音声認識方法および音声認識用プログラム | |
WO2023084566A1 (ja) | 計算装置と計算プログラムと計算方法 | |
KR200318071Y1 (ko) | 실시간 음성출력 키패드 | |
JP2004012698A (ja) | 情報処理装置及び情報処理方法 | |
JP2001092788A (ja) | 音声入力機能付き電子卓上計算機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050610 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090319 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090331 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120410 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130410 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130410 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140410 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |