Nothing Special   »   [go: up one dir, main page]

JP4289863B2 - データ入力装置、データ入力方法 - Google Patents

データ入力装置、データ入力方法 Download PDF

Info

Publication number
JP4289863B2
JP4289863B2 JP2002307426A JP2002307426A JP4289863B2 JP 4289863 B2 JP4289863 B2 JP 4289863B2 JP 2002307426 A JP2002307426 A JP 2002307426A JP 2002307426 A JP2002307426 A JP 2002307426A JP 4289863 B2 JP4289863 B2 JP 4289863B2
Authority
JP
Japan
Prior art keywords
data input
recognition
voice
button
numerical value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002307426A
Other languages
English (en)
Other versions
JP2004144850A5 (ja
JP2004144850A (ja
Inventor
泰夫 奥谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002307426A priority Critical patent/JP4289863B2/ja
Priority to US10/690,028 priority patent/US7418384B2/en
Publication of JP2004144850A publication Critical patent/JP2004144850A/ja
Publication of JP2004144850A5 publication Critical patent/JP2004144850A5/ja
Application granted granted Critical
Publication of JP4289863B2 publication Critical patent/JP4289863B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声によって数値データを入力するためのデータ入力装置、データ入力方法に関するものである。
【0002】
【従来の技術】
ガスや電気の検針業務、商品の棚卸し業務などに携帯端末(ハンディーターミナル)を用いる機会が増えている。携帯端末を用いることにより、現場で得た情報をリアルタイムに入力し、処理できるため業務の効率化・迅速化が実現されている。携帯端末は携帯性重視のため小型化されており、データの入力作業においてはソフトキーボードやペン入力が一般的である。一方、それに代わるデータ入力手段として、近年、音声認識が注目されている。音声認識は、両手がふさがっている状況で有力な入力手段である。既に音声認識機能を持つ携帯端末も発売されている。
【0003】
音声認識では、受理可能な単語や認識文法をあらかじめ定義しておくことが一般的である.例えば3桁の数字の認識を行なう場合には、0から999までの数字をそれぞれ単語として登録する方法や、各桁ごとに0から9までの数字が受理できるような認識文法を用意する方法などがある。この受理可能な単語数や認識文法の複雑さは認識性能に影響を与える。つまり、受理可能な単語数が少ないほど認識結果の正解率は高くなることが期待できる。このような背景から、従来では、受理すべき単語(この場合は位取りした数字など)をあらかじめユーザーが設定しておくことによって、受理可能な単語もしくは認識文法を軽減することを特徴とした発明がなされている(特許文献1参照)。
【0004】
例えば、ある品物の価格帯が100円から1000円までであり、かつ、100円刻みの価格設定である場合、受理すべき数値は、100、200、300、・・・、1000の10通りである。従来の0から1000までの整数を受理する音声認識文法を利用する場合、10単語を認識するだけであるにもかかわらず、認識文法は1000単語を受理することができる。そのため、誤認識の可能性が高くなってしまう。ところが、上記の発明によると、ユーザーがその価格帯の最小値、最大値、ステップ幅などを設定すれば、それをもとに受理単語数が軽減された認識文法を生成することが可能となり、認識率の低下を抑制することができる。
【特許文献1】
特開2001−005484号公報
【発明が解決しようとする課題】
しかしながら、上記発明では、各項目(価格、個数)ごとにその最小値や最大値、ステップ値などをあらかじめユーザーが設定する必要がある。
【0005】
本発明は上記問題に鑑みてなされたものであり、過去の履歴データをもとに信頼性の高い数値が入力可能なデータ入力装置、データ入力方法に関するものである。
【0006】
【課題を解決するための手段】
本発明の目的を達成するために、例えば本発明のデータ入力装置は以下の構成を備える。
【0007】
すなわち、音声によって数値データを入力するためのデータ入力装置であって、
過去に入力された数値データを保持する保持手段と、
前記保持手段が保持する数値データから、入力されると推定される数値の範囲を求める計算手段と、
数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識手段と、
前記音声認識手段による認識結果が示す数値が、前記計算手段により求めた範囲に含まれているか否かを判断する判断手段と、
前記音声認識手段に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示手段と
を備えることを特徴とする。
【0012】
本発明の目的を達成するために、例えば本発明のデータ入力方法は以下の構成を備える。
【0013】
すなわち、過去に入力された数値データを保持するメモリを備え、音声によって数値データを入力するためのデータ入力装置が行うデータ入力方法であって、
前記メモリが保持する数値データから、入力されると推定される数値の範囲を求める計算工程と、
数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識工程と、
前記音声認識工程による認識結果が示す数値が、前記計算工程で求めた範囲に含まれているか否かを判断する判断工程と、
前記音声認識工程に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示工程と
を備えることを特徴とする。
【0018】
【発明の実施の形態】
以下添付図面を参照して、本発明のデータ入力装置を携帯端末に適用した好適な実施形態について詳細に説明するが、本発明の適用対象は携帯端末に限定されるものではない。
【0019】
[第1の実施形態]
図1は本実施形態に係るデータ入力装置の基本構成を示すブロック図である。以下の説明ではガスや電気などの検針作業において音声を用いてメータの数値を携帯端末に入力する場合について説明するが、携帯端末に音声を用いて数値を入力することであれば、これに限定されるものではない。
【0020】
本実施形態に係るデータ入力装置は、制御メモリ(ROM)101、中央処理装置102,メモリ(RAM)103,外部記憶装置104,D/A変換器105,スピーカ106,A/D変換器107、マイク108、入力装置109、表示装置110により構成されており、制御メモリ(ROM)101、中央処理装置102,メモリ(RAM)103,外部記憶装置104,D/A変換器105,A/D変換器107、入力装置109、表示装置110の各部はバス111に接続されており、互いにデータ通信が可能である。
【0021】
ROM101にはデータ入力装置全体の制御を行うためのプログラム(例えばブートプログラム)やデータ(設定データ)などが格納されている。中央処理装置102はROM101やRAM103に格納されているプログラムやデータを用いてデータ入力装置全体の制御を行うと共に、後述の各種の処理を実行する。RAM103は中央処理装置102が各種の処理を実行するために用いる外部記憶装置104からロードされたプログラムやデータを一時的に記憶するエリアを備えると共に、中央処理装置102が各種の処理を行うために処理中のデータを一時的に記憶したりするためのワークエリアも備える。
【0022】
外部記憶装置104はハードディスクなどの大記憶容量の記憶装置であって、後述の各処理を中央処理装置102が実行するためのプログラムや、文字データ、音声データなどの各種のデータを保存する。D/A変換器105はRAM103に読み出された音声信号をD/A変換し、スピーカ106にアナログ信号として出力する機能を有し、スピーカ106はこのアナログ信号を音声として出力する。
【0023】
A/D変換器107は、マイク108から入力されたアナログ信号としての音声信号をA/D変換し、ディジタル信号としてメモリRAM103に出力する機能を有する。入力装置109はペン等のポインティングデバイスやテンキーなどにより構成されており、各種の指示を中央処理装置102に対して入力することができる。表示装置110はCRTや液晶画面などにより構成されており、画像情報や文字情報など、各種の情報を表示することができる。なお、表示装置110はタッチパネルで構成されていてもよく、その場合入力装置109は省略しても良いし、タッチパネル上を指示するペンであってもよい。
【0024】
図2は本実施形態に係るデータ入力装置において、入力された音声を認識し、認識した結果を保持するための機能構成を示すブロック図である。履歴保持部201は、過去のメータの検針結果の履歴データ(即ち過去の検針により得られたメータの値を示すデータ)を保持する。範囲予測部202は、履歴保持部201が保持する履歴データを用いて、これから行う検針により得られるメータの値の範囲(予測範囲)を求める。予測結果保持部203は、範囲予測部202が求めた予測範囲を示すデータを格納する。音声認識部204は、ユーザ(ここでは検針作業者)が発声するメータの値(数値)を表現する音声に対して音声認識を行う。なお、音声認識の技術に関しては公知の技術であるので、ここでの詳細な説明は省略する。
【0025】
認識結果保持部205は、音声認識部204が音声認識した結果を保持する。比較部206は、認識結果が予測範囲内かどうかを判定する。確認部207は、認識結果に間違いがないかをユーザに確認する。結果保存部208は、認識結果を今回の検針結果として保存する。提示部209は、音声認識の結果をユーザーに提示する。
【0026】
図3は本実施形態に係るデータ入力装置にメータの数値を発声した場合に、このデータ入力装置が行う処理のフローチャートである。同図のフローチャートに従った処理は、マイク108に音声が入力されたことを中央処理装置102が検知した場合に、実行されるものである。
【0027】
まず範囲予測部202が、入力されると推定される数値の範囲、すなわち、これから行う検針の結果(メータの数値)が取りうる範囲(予測範囲)を、履歴保持部201が保持する過去の検針履歴のデータを用いて求める(予測する)(ステップS301)。求めた予測範囲を示すデータは予測結果保持部203に格納する。
【0028】
過去のメータの検針履歴の一例としては、過去の検針時におけるメータの値や過去の月間利用量、年間の平均利用量などが考えられる。月間利用量や年間の平均利用量などは、過去のメータの値から計算することが可能なので、以下に示す予測範囲の算出方法の一例では、過去のメータの値を履歴として利用する場合について述べる。
【0029】
2か月前に検針したときに得られたメータの値(Vm2)と前月に検針したときに得られたメータの値(Vm1)の差をもとに、今回検針することで得られる今月のメータの値(Vcurr)を予測する場合を考えると、今月のメータの予測値は、
Vcurr = Vm1 + (Vm1 − Vm2) = 2 Vm1 − Vm2
となる。もちろん、予測には誤差が生じるため、予測範囲として捉えた方が現実的といえる。その場合は、前月の利用量(Vm1−Vm2)にある程度の幅を持たせ(例えば±50%)それを予測範囲とすればよい。この場合の予測範囲は、
2Vm1−Vm2−(Vm1−Vm2)/2 ≦ Vcurr ≦ 2Vm1−Vm2+ (Vm1−Vm2) / 2
すなわち、
3/2(Vm1−Vm2) ≦Vcurr≦ 5/2Vm1 − 3/2Vm2 (式1)
となる。
【0030】
上記計算により、今月のメータの値、すなわち入力されるであろう数値を予測できると共に、「通常(従来と同じ使用頻度)の使用方法を続けているのであれば、今月はこの程度のメータの値になるであろう」というように、今月のメータの値が通常程度のものであるか否かを判断することができる。もし今月のメータの値が(式1)を満たさない場合には、音声認識の結果がおかしい(もしくは入力した数値がおかしい)、もしくは今月のメータの値は異常(通常予測できるものではない値である)であると判断することができ、入力するメータの値に対する正当性のチェックを厳密に行うことができる。
【0031】
なお、本実施形態では予測範囲を線形予測的に求めているが、他の統計的手法を用いて求めても良い。
【0032】
図3に戻って、マイク108を介して入力された、メータの値を表現する音声に対して、音声認識部204は音声認識処理を行い、音声認識結果を示すデータを認識結果保持部205に格納する(ステップS302)。次に比較部206は認識結果保持部205に格納されたデータが示す今月のメータの値が予測範囲に含まれているか、例えば(式1)を満たすかどうかを判定する(ステップS303)。
【0033】
そして今月のメータの値が予測範囲内であれば(例えば今月のメータの値が(式1)を満たしていれば)、音声認識の結果、即ち今月の検針により得られたメータの値のデータを結果保持部208に格納する(ステップS306)。なお、結果保持部208に格納された値を示すデータは履歴保持部201に格納されている検針履歴データに加えられ、次回、検針を行う際に上記予測範囲を計算する際に用いられる。
【0034】
一方、今月のメータの値が予測範囲外であれば(例えば今月のメータの値が(式1)を満たしていなければ)、提示部209は認識結果をユーザに提示し(ステップS304)、確認部207は認識結果の正当性の確認を検針作業者に促し、その回答を得る(ステップS305)。認識結果をユーザに提示する目的としては、上述の通り、検針作業者に対して、検針作業者が意図した数値が入力できたか否かの確認を行わせたり、今月のメータの値が異常なものであるか否かの判断基準を与えたりすることである。
【0035】
具体的に認識結果の提示手段としては、表示装置110に、例えば認識結果を表示して「この認識結果でよいですか?」などのメッセージを表示しても良いし、スピーカ106から、このメッセージを音声として出力しても良い。なおこれらのメッセージの文字データや音声データは外部記憶装置104に保存されており、必要に応じてRAM103に読み出されて用いられる。
【0036】
なお、検針作業者がメータの値の再入力が必要であると判断し、この旨を入力装置109から入力した場合には(例えば再入力を行うためのボタンを押した場合には)、もう一度上記ステップS302以降の処理を実行する。
【0037】
また、今月のメータの値が予測範囲内であっても、認識結果を表示装置110やスピーカ106介して提示しても良い。この場合は、ステップS303とステップS304の順序を逆にすればよい。
【0038】
以上、本実施形態に係るデータ入力装置によって、入力する数値に対する正当性のチェックを行うことができ、より信頼性の高い数値を入力することができる。
【0039】
[第2の実施形態]
上記第1の実施形態では、音声認識結果が予測範囲内にあるかどうかを判定することによって、認識結果の正当性をチェックするデータ入力装置、データ入力方法について説明した。本実施形態に係るデータ入力装置、データ入力方法は、認識文法を予測範囲から動的に生成し、生成した認識文法を用いて音声認識を行う。これにより、認識対象を限定することができ、認識率の向上が期待できるので、結果として認識結果の正当性を上げることができる。
【0040】
図4は本実施形態に係るデータ入力装置の機能構成を示すブロック図である。なお図2に示す各部分と同じ部分については同じ番号を付けており、その説明を省略する。また、本実施形態に係るデータ入力装置の基本構成は第1の実施形態と同様に、図1に示す基本構成とする。
【0041】
本実施形態に係るデータ入力装置の機能構成は比較部206、確認部207の代わりに、認識文法生成部406、認識文法保持部407を備える。認識文法生成部406は予測結果保持部203が保持する予測範囲から認識文法を生成する。認識文法保持部407は、生成された認識文法を保持する。
【0042】
図5は、メータの数値を発声することで本実施形態に係るデータ入力装置にメータの値を表現する音声を入力した場合に、このデータ入力装置が行う処理のフローチャートである。
【0043】
まず範囲予測部202が、入力されると推定される数値の範囲、すなわち、これから行う検針の結果(メータの数値)が取りうる範囲(予測範囲)を、履歴保持部201が保持する過去の検針履歴のデータを用いて求める(予測する)(ステップS501)。求めた予測範囲を示すデータは予測結果保持部203に格納する。予測範囲を求める方法については第1の実施形態で説明した方法と同じでも良いし、他の手法を用いても良い。
【0044】
次に、予測結果保持部203が保持する予測範囲をもとに、認識文法生成部406が予測範囲を認識するための認識文法を生成する(ステップS502)。ここで予測範囲に基づいて認識文法を生成する処理についてより詳細に説明する。図6は、予測範囲が(式2)に示す結果となった場合の認識文法を示す図である。
【0045】
211.3 ≦ Vcurr ≦ 223.5 (式2)
図6において、211.3から223.5までの数値を認識するために必要な百の位、十の位、一の位、小数点、小数点第一位の各数値は各桁の丸で囲まれている。また各桁の丸間を繋ぐ直線は各桁間で取りうる組み合わせを示す。また同図の「skip」はその桁(もしくは小数点)をとばすことを示す。これら各桁の丸で囲まれた数値を認識可能な各位の数値として認識文法を生成する。認識可能な単語の集合については文法に記述される。
【0046】
予め認識可能な数値の範囲(予測範囲)を求めずに、音声認識を行うと、図6に記載されている各桁のすべての数字の組合せが認識可能な数値となってしまう。音声認識では入力された音声に基づいたデータが認識可能な数値のデータのいずれであるかを比較し、最も尤もらしいものを認識結果とする処理を行うので、認識可能な数値が多いとその分だけ処理時間を要する。よって上記処理により、認識可能な数値を限定することができるので、より高速に認識処理を行うことができると共に、より高精度に認識結果を得ることができる。図6では、説明を簡単にするため、数値を位取りして読む場合を想定した認識文法の一例を示したが、これに限定されるものではなく、一桁ずつ数字を読み上げる認識文法であってもよいし、それらの組合せなどでもよい。
【0047】
図5に戻って、音声認識部204はステップS502で生成された認識文法を用いて音声認識処理を行い(ステップS503)、認識結果を認識結果保持部205に格納する(ステップS504)。
【0048】
[第3の実施形態]
上記第1の実施形態では、音声認識結果が予測範囲外にある場合にのみ、音声認識結果をユーザに提示する場合について説明した。しかしながら、現在の音声認識の能力では、認識率100%を期待することはできない。そのため、音声認識の結果を常にユーザに提示することが一般的であるといえる。そこで、第3の実施形態では、音声認識結果が予測範囲内であるか予測範囲外であるかに応じて、ユーザーに提示する内容を変える場合について説明する。
【0049】
本実施形態に係るデータ入力装置の機能構成を示すブロック図は図2に示すものと同じであるが、いくつかの部分が行う処理が異なる。また、本実施形態に係るデータ入力装置の基本構成は第1の実施形態と同様に、図1に示す基本構成とする。提示部209は、認識結果が予測範囲内であるか範囲外であるかによって、提示する内容を変えて、ユーザに認識結果および確認を促すための情報を提示する。
【0050】
図7は、メータの数値を発声することで本実施形態に係るデータ入力装置にメータの値を表現する音声を入力した場合に、このデータ入力装置が行う処理のフローチャートである。
【0051】
ステップS801およびステップS802は、第1の実施形態のステップS301およびステップS302と同じであるので、説明を省略する。
【0052】
ステップS803では、比較部206は認識結果保持部205に格納されたデータが示す今月のメータの値が予測範囲に含まれているかどうかを判定し、ステップS804に移る。
【0053】
ステップS804では、比較部206が行なった比較結果(認識結果が予測範囲内であるか、範囲外であるか)に応じて、提示部209が認識結果をユーザに提示するための提示内容を生成し、表示装置110やスピーカ106を介して認識結果とともに比較結果に応じた情報を提示し、ステップS805に移る。
【0054】
ステップS805およびステップS806は、第1の実施形態のステップS305およびステップS306と同じであるので、説明を省略する。
【0055】
図8A、8Bは、比較部206が行なった比較結果に応じて、提示部209が提示する情報の一例を示す図である。提示する情報はGUIの形式で提示される。図8Aは、認識結果が予測範囲内であった場合に表示装置110に出力するGUIを示す図である。901は認識結果を表示する領域、902および903はユーザが認識結果の正当性を入力するボタンである。この場合は、認識結果の正当性が高いので、「OK」が目立つように太字で大きいフォントになっている。
【0056】
図8Bは、認識結果が予測範囲外であった場合に表示装置110に出力するGUIを示す図である。この場合は、認識結果が正しくないもしくは、通常では起こりえない異常な数値である可能性が高いので、NGが目立つようになっている。このように、認識結果が予測範囲内であるか範囲外であるかに応じて提示する内容を変えることが誤入力の防止に効果的である。文字のフォントや大きさなど以外にも、色を変えたり、予測範囲外であったときに注意を喚起するような音や画像などを提示することも有効である。
【0057】
なお、「OK」のボタンを押下することでステップS805からステップS806へ、「NG」のボタンを押下することでステップS805からステップS802へ処理は移行される。
【0058】
[第4の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では過去2ヶ月分の検針履歴を用いて認識結果の正当性を判断していた。しかし前月の検針履歴のみを用いて認識結果の正当性を判断することも可能である。
【0059】
ガスや電気などのメータは使用量に応じて累積的に値が増加する。つまり、今月のメータの値は少なくとも前月のメータの値以上であると考えてよい。この性質を利用すると、前月の検針値以下の認識結果は正当な結果ではないという判断が下せる。
【0060】
この場合、データ入力装置の機能構成としては図2に示した構成において範囲予測部202や予測結果保持部203は省略することができ、更に履歴保持部201には前月の履歴、すなわち前月の検針により得られたメータの値を示すデータを格納しておく。そして比較部206は、履歴保持部201が保持する前月のメータの値を示すデータと音声認識結果とを比較する。そして認識結果が示すメータの値が前月のメータの値よりも小さい場合は、第1の実施形態と同様に確認部207が認識結果に間違いないかをユーザに確認する。また、比較する対象は2ヶ月以上前のものでも良い。
【0061】
[第5の実施形態]
第4の実施形態で説明した前月のメータの値と今月のメータの値との関係を用いて、第2の実施形態と同様に認識文法を動的に生成することも可能である。この場合、データ入力装置の機能構成としては図4に示した構成において、範囲予測部202および予測結果保持部203は省略することができ、更に履歴保持部201には前月の履歴、すなわち前月の検針により得られたメータの値を示すデータを格納しておく。そして認識文法生成部406は、履歴保持部201が保持する前月のメータの値以上の数値を認識可能な数値として認識文法を生成する。
【0062】
[第6の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では、予測範囲を求めるために、過去2か月分のメータの値を用いて求めていたが、これに限定されるものではなく、例えば前年同月の利用量などをもとに予測範囲を求めても良い。特に、ガスや電気などの利用量は季節による変動が大きいので、この方法によってより精度の高い予測が可能になる。
【0063】
[第7の実施形態]
第1の実施形態に係る予測範囲を求める方法の説明では、前月の利用量(Vm1−Vm2)にある程度の幅を持たせており、その幅を±50%としたが、この数値に固定されるものではなく、過去の月間利用量の平均や分散などの統計値を使って予測範囲の幅を求めても良い。
【0064】
[第8の実施形態]
第2の実施形態に係る認識文法の生成方法の説明において、メータの値の取りうる範囲として小数点以上3桁、以下1桁の数値で表現したが、夫々の桁数はこれに限定されるものではない。
【0065】
[第9の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では、認識結果が予測範囲外である場合に、確認部207が認識結果を検針作業者に提示していたが、この提示処理を省略して、認識結果が予測範囲外であると判断された時点で再度音声認識処理を行うために、表示装置110やスピーカ106等を用いて音声の入力を促しても良い。
【0066】
[第10の実施形態]
第1の実施形態に係るデータ入力装置、データ入力方法では、認識結果が予測範囲外である場合に再度数値を入力する手段として音声を用いていたが、この場合、入力装置109、すなわち、ペンやテンキーなどを用いて入力しても良い。これは何度も数値を発声することが困難、もしくは避けたい場合に好適な手段である。
【0067】
[第11の実施形態]
上記実施形態では図2に示した各機能構成(もしくは図4に示した各機能構成)が1つのデータ入力装置内に備わっているものとして説明したが、これに限定されるものではなく、各部が計算機などで構成されており、夫々の各部がネットワーク上に分散しており、互いにデータ通信が可能に構成されていても良い。
【0068】
[その他の実施の形態]
さらに、本発明は上記実施形態を実現するための装置及び方法のみに限定されるものではなく、上記システム又は装置内のコンピュータ(CPUあるいはMPU)に、上記実施形態を実現するためのソフトウエアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させることにより上記実施形態を実現する場合も本発明の範疇に含まれる。
【0069】
またこの場合、前記ソフトウエアのプログラムコード自体が上記実施形態の機能を実現することになり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給するための手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。
【0070】
この様なプログラムコードを格納する記憶媒体としては、例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0071】
また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施形態の機能が実現される場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているOS(オペレーティングシステム)、あるいは他のアプリケーションソフト等と共同して上記実施形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。
【0072】
更に、この供給されたプログラムコードが、コンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能格納ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上記実施形態が実現される場合も本発明の範疇に含まれる。
【0073】
【発明の効果】
以上の説明により、本発明によって、信頼性の高い数値を入力することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係るデータ入力装置の基本構成を示すブロック図である。
【図2】本発明の第1の実施形態に係る実施形態に係るデータ入力装置において、入力された音声を認識し、認識した結果を保持するための機能構成を示すブロック図である。
【図3】本発明の第1の実施形態に係るデータ入力装置にメータの数値を発声した場合に、このデータ入力装置が行う処理のフローチャートである。
【図4】本発明の第2の実施形態に係るデータ入力装置の基本構成を示すブロック図である。
【図5】メータの数値を発声することで本発明の第2の実施形態に係るデータ入力装置にメータの値を表現する音声を入力した場合に、このデータ入力装置が行う処理のフローチャートである。
【図6】本発明の第2の実施形態において、予測範囲が(式2)に示す結果となった場合の認識文法を示す図である。
【図7】本発明の第3の実施形態に係るデータ入力装置にメータの数値を発声した場合に、このデータ入力装置が行う処理のフローチャートである。
【図8A】本発明の第3の実施形態において、提示部が提示する情報の一例を示した図である。
【図8B】本発明の第3の実施形態において、提示部が提示する情報の一例を示した図である。

Claims (7)

  1. 音声によって数値データを入力するためのデータ入力装置であって、
    過去に入力された数値データを保持する保持手段と、
    前記保持手段が保持する数値データから、入力されると推定される数値の範囲を求める計算手段と、
    数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識手段と、
    前記音声認識手段による認識結果が示す数値が、前記計算手段により求めた範囲に含まれているか否かを判断する判断手段と、
    前記音声認識手段に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算手段により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示手段と
    を備えることを特徴とするデータ入力装置。
  2. 前記判断手段は、前記音声認識手段による認識結果が示す数値が、前記計算手段により求めた範囲に含まれている場合には、当該認識結果が示す数値を入力すべき数値データとして判断することを特徴とする請求項1に記載のデータ入力装置。
  3. 前記数値データは、検針することで得られるメータの値を示すデータであることを特徴とする請求項1に記載のデータ入力装置。
  4. 前記データ入力装置は携帯端末であることを特徴とする請求項1乃至のいずれか1項に記載のデータ入力装置。
  5. 過去に入力された数値データを保持するメモリを備え、音声によって数値データを入力するためのデータ入力装置が行うデータ入力方法であって、
    前記メモリが保持する数値データから、入力されると推定される数値の範囲を求める計算工程と、
    数値を表現する音声が入力されると、当該音声に基づいて音声認識を行う音声認識工程と、
    前記音声認識工程による認識結果が示す数値が、前記計算工程で求めた範囲に含まれているか否かを判断する判断工程と、
    前記音声認識工程に音声認識を再度行わせる指示を入力するための第1のボタンと、前記認識結果を示す数値を保存させる指示を入力するための第2のボタンとを含む画面を提示する場合に、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれている場合には、前記第2のボタンを前記第1のボタンよりも強調して提示し、前記認識結果が示す数値が前記計算工程により求めた範囲に含まれていない場合には、前記第1のボタンを前記第2のボタンよりも強調して提示する提示工程と
    を備えることを特徴とするデータ入力方法。
  6. コンピュータを請求項1乃至の何れか1項に記載のデータ入力装置が有する各手段として機能させる為のプログラム。
  7. 請求項に記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2002307426A 2002-10-22 2002-10-22 データ入力装置、データ入力方法 Expired - Fee Related JP4289863B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002307426A JP4289863B2 (ja) 2002-10-22 2002-10-22 データ入力装置、データ入力方法
US10/690,028 US7418384B2 (en) 2002-10-22 2003-10-20 Voice data input device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002307426A JP4289863B2 (ja) 2002-10-22 2002-10-22 データ入力装置、データ入力方法

Publications (3)

Publication Number Publication Date
JP2004144850A JP2004144850A (ja) 2004-05-20
JP2004144850A5 JP2004144850A5 (ja) 2007-03-01
JP4289863B2 true JP4289863B2 (ja) 2009-07-01

Family

ID=32211563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002307426A Expired - Fee Related JP4289863B2 (ja) 2002-10-22 2002-10-22 データ入力装置、データ入力方法

Country Status (2)

Country Link
US (1) US7418384B2 (ja)
JP (1) JP4289863B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070043849A1 (en) * 2003-09-05 2007-02-22 David Lill Field data collection and processing system, such as for electric, gas, and water utility data
CA2485595A1 (en) * 2003-10-21 2005-04-21 Itron, Inc. Combined scheduling and management of work orders, such as for utility meter reading and utility servicing events
US20050267898A1 (en) * 2004-05-28 2005-12-01 Robert Simon Data format and method for communicating data associated with utility applications, such as for electric, gas, and water utility applications
US7283062B2 (en) * 2004-07-28 2007-10-16 Itron, Inc. Mapping in mobile data collection systems, such as for utility meter reading and related applications
US7362236B2 (en) * 2004-12-06 2008-04-22 Itron, Inc. Mobile utility data collection system with voice technology, such as for data collection relating to an electric, gas, or water utility
US7830874B2 (en) * 2006-02-03 2010-11-09 Itron, Inc. Versatile radio packeting for automatic meter reading systems
JP4702081B2 (ja) * 2006-02-08 2011-06-15 株式会社豊田中央研究所 文字入力装置
US9347975B2 (en) 2007-08-14 2016-05-24 Fluke Corporation Auto-numbering of measurements in digital multimeter
US8456153B2 (en) * 2007-08-14 2013-06-04 Fluke Corporation Digital multimeter having improved recording functionality
US8456152B2 (en) * 2007-08-14 2013-06-04 Fluke Corporation Digital multimeter with context-sensitive explanatory information
US8730056B2 (en) 2008-11-11 2014-05-20 Itron, Inc. System and method of high volume import, validation and estimation of meter data
US8436744B2 (en) * 2009-01-29 2013-05-07 Itron, Inc. Prioritized collection of meter readings
US20100265095A1 (en) * 2009-04-20 2010-10-21 Itron, Inc. Endpoint classification and command processing
CN104298452A (zh) * 2014-11-06 2015-01-21 国家电网公司 电能表及其查询方法
CN105678513B (zh) * 2015-12-31 2020-02-04 联想(北京)有限公司 信息处理方法、装置及电子设备
WO2019051010A1 (en) * 2017-09-06 2019-03-14 Landis+Gyr Innovations, Inc. VOICE ENABLEMENT ENERGY MANAGEMENT SYSTEM
CN107945804A (zh) * 2017-12-07 2018-04-20 杭州测质成科技有限公司 基于语音识别的任务管理与量具数据提取系统及其方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937763A (en) * 1988-09-06 1990-06-26 E I International, Inc. Method of system state analysis
US5698834A (en) * 1993-03-16 1997-12-16 Worthington Data Solutions Voice prompt with voice recognition for portable data collection terminal
JPH07134793A (ja) * 1993-11-09 1995-05-23 Takara Keiki Seisakusho:Kk 検針システム
JP3557467B2 (ja) * 1997-06-11 2004-08-25 株式会社日立製作所 音声データの認識方法及びその装置
JP2001005484A (ja) * 1999-06-23 2001-01-12 Toshiba Tec Corp 音声認識装置
US7072863B1 (en) * 1999-09-08 2006-07-04 C4Cast.Com, Inc. Forecasting using interpolation modeling
JP3765985B2 (ja) * 2001-02-01 2006-04-12 横河電機株式会社 計器評価システム
JP2002245090A (ja) * 2001-02-19 2002-08-30 Osaka Gas Co Ltd データ収集システム
JP2002288279A (ja) * 2001-03-23 2002-10-04 Idemitsu Gas & Life Co Ltd エネルギ販売管理システム

Also Published As

Publication number Publication date
US20040093209A1 (en) 2004-05-13
US7418384B2 (en) 2008-08-26
JP2004144850A (ja) 2004-05-20

Similar Documents

Publication Publication Date Title
JP4289863B2 (ja) データ入力装置、データ入力方法
JP3514372B2 (ja) マルチモーダル対話装置
WO2019128103A1 (zh) 信息录入方法、装置、终端及计算机可读存储介质
US20200035241A1 (en) Method, device and computer storage medium for speech interaction
CN109086026B (zh) 播报语音的确定方法、装置和设备
US20080312928A1 (en) Natural language speech recognition calculator
KR20020041296A (ko) 음성인식시스템, 음성인식서버, 음성인식클라이언트 및그들의 제어방법과, 컴퓨터가독메모리
CN108227565A (zh) 一种信息处理方法、终端及计算机可读介质
CN108108094A (zh) 一种信息处理方法、终端及计算机可读介质
JP5532781B2 (ja) 接客業務用サーバ、並びに、当該サーバを用いる接客システム及び接客業務の予測終了時間算出方法
CN112259090A (zh) 基于语音交互的业务办理方法、装置和电子设备
JP2012216007A (ja) 入出力デバイス情報を考慮したマルチモーダル対話プログラム、システム及び方法
JP4749437B2 (ja) 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム
CN110673908A (zh) 一种界面生成方法、装置、介质和电子设备
JP2001042890A (ja) 音声認識装置
TWI763663B (zh) 數字資訊輸入處理、資料物件資源資訊處理方法及裝置、對第三方應用程式進行數字資訊輸入處理的方法及裝置、和用戶介面
JP2005115773A (ja) 入力モード選択方法、入力モード切り替え方法、入力モード選択切り替え方法、入力モード選択装置、入力モード切り替え装置、電子機器、プログラム、及び記憶媒体
US20090077458A1 (en) Time-based Programming and Computation
US20230419949A1 (en) Audible transaction verification with an assistance device
WO2021235279A1 (ja) 情報処理装置、情報処理方法、および記録媒体
JP2003323196A (ja) 音声認識システム、音声認識方法および音声認識用プログラム
WO2023084566A1 (ja) 計算装置と計算プログラムと計算方法
KR200318071Y1 (ko) 실시간 음성출력 키패드
JP2004012698A (ja) 情報処理装置及び情報処理方法
JP2001092788A (ja) 音声入力機能付き電子卓上計算機

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050610

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090319

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090331

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120410

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130410

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130410

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140410

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees