Nothing Special   »   [go: up one dir, main page]

JP3683502B2 - Remote control device - Google Patents

Remote control device Download PDF

Info

Publication number
JP3683502B2
JP3683502B2 JP2001030404A JP2001030404A JP3683502B2 JP 3683502 B2 JP3683502 B2 JP 3683502B2 JP 2001030404 A JP2001030404 A JP 2001030404A JP 2001030404 A JP2001030404 A JP 2001030404A JP 3683502 B2 JP3683502 B2 JP 3683502B2
Authority
JP
Japan
Prior art keywords
remote control
recognition
user
recognition target
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001030404A
Other languages
Japanese (ja)
Other versions
JP2002232973A (en
Inventor
克昌 長濱
匡 大石
秀之 山岸
卓朗 畠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahi Kasei Homes Corp
Original Assignee
Asahi Kasei Homes Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Kasei Homes Corp filed Critical Asahi Kasei Homes Corp
Priority to JP2001030404A priority Critical patent/JP3683502B2/en
Publication of JP2002232973A publication Critical patent/JP2002232973A/en
Application granted granted Critical
Publication of JP3683502B2 publication Critical patent/JP3683502B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Selective Calling Equipment (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、テレビやビデオ等の各種機器を音声でリモコン操作することができるリモコン装置に関する。
【0002】
【従来の技術】
このようなリモコン装置としては、例えば特開平05−219575号公報の請求項1に記載されているリモートコントロール装置のように、利用者の音声を1つのキーワードとして認識するようにし、そのキーワードがどのリモートコントロール信号に対応するものかを判別し、その判別結果に対応するリモートコントロール信号を送するものがある。
【0003】
また、前記公報の請求項4に記載されているリモートコントロール装置のように、利用者の音声を第1のキーワードと第2のキーワードとの2つのキーワードに分けて認識するようにし、第1のキーワードの認識時には、複数の機器のうちのどの機器に対応するものかを判別し、第2のキーワードの認識時には、前記機器のどの動作に対応するものかを判別し、それらの判別結果に対応するリモートコントロール信号を送信するものもある。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来のリモコン装置のうち、特開平05−219575号公報の請求項4に記載されているリモコン装置にあっては、利用者の音声を2つのキーワードに分けて認識するようになっているため、利用者の音声を1つのキーワードとして認識する場合に比べ、キーワードの数が多くなってしまいそれらのキーワードに対応する認識対象語を全て記憶するために高価である大容量の記憶手段が必要とされ、製造コストが高くなってしまうという恐れがあった。また、リモコン装置によって音声が誤認識されてしまう恐れもあった。
【0005】
本発明は、このような従来技術の未解決の問題点に着目してなされたものであり、リモコン装置による音声の誤認識を減らすことができるリモコン装置を提供することを課題とする。
【0007】
【課題を解決するための手段】
上記課題を解決するために、請求項1に係る発明であるリモコン装置は、利用者から発せられた音声に含まれる認識対象語を予め登録されている認識対象語と照合することで認識する音声認識手段と、その音声認識手段にて認識された認識対象語に対応するリモコン信号を送信する送信手段と、利用者を識別する利用者識別手段と、その利用者識別手段で識別された利用者毎に前記音声認識手段の認識結果に基づいて認識対象語の使用頻度を算出する使用頻度算出手段と、を備え、前記音声認識手段は、前記利用者識別手段で識別された利用者から発せられた認識対象語が、操作対象に対する認識対象語の後に動作を指示する認識対象語の場合、前記使用頻度算出手段で求められた動作を指示する認識対象語を認識し、前記送信手段は、前記動作を指示する認識対象語に対応するリモコン信号を送信するようになっていることを特徴とするものである。
請求項2に係る発明であるリモコン装置は、請求項1に記載のリモコン装置において、認識対象語を複数の操作対象のうちから所望の操作対象を指示するものと前記複数の操作対象の動作を指示するものとに分けて記憶し、その複数の操作対象の動作を指示する認識対象語を前記複数の操作対象に共通の動作を指示する認識対象語と前記複数の操作対象に固有の動作を指示する認識対象語とに分けて記憶する記憶手段を備え、前記音声認識手段は、利用者から発せられた音声に含まれる認識対象語を前記記憶手段に基づいて認識し、前記送信手段は、前記音声認識手段にて認識された所望の操作対象を指示する認識対象語と前記複数の操作対象の動作を指示する認識対象語との組み合わせに対応するリモコン信号を送信するようになっていることを特徴とするものである。
請求項3に係る発明は、請求項1又は請求項2に記載のリモコン装置において、利用者が指示できるリモコン操作に関する情報を表示する情報表示手段と、前記情報表示手段に表示されているリモコン操作に関する情報に基づいて、利用者に所望のリモコン操作を指示させる操作指示スイッチと、を備えたものである。
【0008】
請求項4に係る発明は、請求項1乃至請求項3のいずれかに記載のリモコン装置において、前記音声認識手段の動作状態を表示する動作状態表示手段を備えたものである。
【0014】
したがって、請求項に係る発明であるリモコン装置においては、利用者から発せられた音声に含まれる認識対象語をその利用者の認識対象語の使用頻度に基づいて認識する、つまり利用者から発せられた音声の認識結果の履歴に基づいて利用者毎にどの認識対象語を頻繁に使用するかといった情報を統計的に処理しておき、利用者から発せられた音声に含まれる認識対象語を、その利用者に対応して統計処理された認識対象語の使用頻度に基づいて認識するため、リモコン装置による音声の誤認識を減らすことができる。
【0015】
さらに、前記認識結果の履歴に基づいて、利用者が任意の操作対象を指示した後にどの動作を頻繁に指示するかといった情報を統計的に処理しておき、その操作対象が指示されたときに高い頻度で指示されている動作を行うリモコン信号も併せて送信するようにしてもよく、そのようにすれば、利用者の好みの状態をすぐに再現することができる。
請求項2に係る発明であるリモコン装置においては、認識対象語を複数の操作対象のうちから所望の操作対象を指示するものと前記複数の操作対象の動作を指示するものとに分けて記憶し、その複数の操作対象の動作を指示する認識対象語を前記複数の操作対象に共通して用いられる認識対象語と前記複数の操作対象に個別に用いられる認識対象語とに分けて記憶するようになっているため、例えば、「スイッチ・オン」「スイッチ・オフ」等の全ての操作対象に共通して用いられる認識対象語や「早送り」「巻き戻し」等の一部の操作対象にのみ共通して用いられる認識対象語等を、記憶手段に重複して記憶させておく必要がなく、操作対象の動作を指示する音声を認識するための認識対象語を操作対象毎に記憶させておく方法に比べ、記憶手段に記憶させておく認識対象語を少なくすることができ、必要とされる記憶手段の記憶容量を小さくすることができる。
記憶手段に記憶される認識対象語は、製造時に予め記憶させておいてもよいし、使用時に利用者に記憶させるようにしてもよい。使用時に認識対象語を記憶させるようにした場合には、利用者に認識対象語を発声させてそれを記憶するようにしてもよく、キーボード等の入力手段で認識対象語を入力させてそれを記憶するようにしてもよい。
また、音声認識手段が利用者により発声された音声から認識対象語を認識する順番は、所望の操作対象を指示する認識対象語と操作対象の動作を指示する認識対象語と、どちらが先であってもよいが、例えば、まず、操作対象を指示する認識対象語を認識するようにし、次いで、その操作対象の動作を指示する認識対象語を認識するようにする等、予め認識対象語を認識する順番を決めておけば、音声認識手段は、例えば利用者から操作対象を指示する音声が発せられたときには、前記記憶手段に記憶されている操作対象を指示する認識対象語のみを参照するだけでよく、また、利用者から操作対象の動作を指示する音声が発せられたときには、前記記憶手段に記憶されている操作対象の動作を指示する認識対象語のみを参照するだけでよいので、利用者から発せられた音声を認識するときに参照する認識対象語が少なくて済み、リモコン操作を指示する音声の誤認識を少なくすることができる。
なお、上記のようなリモコン装置においては、記憶手段に記憶されている音声やリモコン信号等を読み出したり書き換えたりすることができる手段を設けるようにしてもよく、例えば、使用していたリモコン装置の送信手段が故障等により使用できなくなったときには、使用していたリモコン装置の記憶手段に記憶されている認識対象語を読み出して、新しいリモコン装置の記憶手段を書き換えることにより、使用していたリモコン装置と同じ様に新しいリモコンをすぐに使用することができるので好ましい。前記記憶手段としては、例えば、リモコン装置に直接的に接続されるフラッシュメモリー等を用いてもよいし、遠隔地に備えられて電話線等を介してリモコン装置に間接的に接続される外部記憶装置を用いてもよい。
また、利用者の手元を離れて使用されるものであるので、確実な動作を保証するために、音声認識手段で音声を認識できる状況であるか否かといった、リモコン装置の各種状況を利用者に報知する状況報知手段を備えることが好ましい。
状況報知手段としては、リモコン装置の各種状況を報知できるものであればどのようなものでもよく、例えば、音声認識手段で音声が認識されたときにその旨を利用者に音声で報知するスピーカ等が挙げられる。
また、視覚に障害がある視覚障害者に対しては音声により操作手順をガイドするようにしてもよく、そのようにすれば、誰でも簡単にリモコン装置を扱うことができ、リモコン装置の操作性を向上することができる。
【0016】
また、さらに、前記認識結果の履歴に基づいて、最新のリモコン信号が送信される前の状態に戻すことができるようにしてもよく、そのようにすれば、利用者の音声から誤った認識対象語が認識されて利用者が思っていなかったリモコン信号が送信されたとしても、操作対象をすぐに元の状態に戻すことができる。
また、前記認識対象語の履歴として直前に送信されたリモコン信号を記憶しておき、音声認識手段が所定の認識対象語を認識した場合に、前記記憶しておいたリモコン信号を送信手段に再度送信させるようにしてもよく、そのようにすれば、同じリモコン信号で複数の状態に段階的に変化する照明等の操作を容易に行うことができるようになり、リモコン装置の操作性が向上する。
【0017】
請求項3に係る発明であるリモコン装置にあっては、利用者が指示できるリモコン操作に関する情報を表示する情報表示手段と、前記情報表示手段に表示されているリモコン操作に関する情報に基づいて、利用者に所望のリモコン操作を指示させる操作指示スイッチと、を備えるため、例えば、前記操作指示スイッチとして手動でリモコン操作を指示するスイッチ等を用いれば、風邪等で体調が悪く、利用者が声を出しにくい場合には、普通のリモコン装置として本発明のリモコン装置を利用することができる。また、身体器官に何らかの障害を生じて、利用者が呼吸器等をつけていて発話することができない場合や、単に、音声でリモコン操作を指示したくない場合等にも有効である。
【0018】
なお、操作指示スイッチとしては、利用者に所望のリモコン操作を指示させることができるものであれば、どのようなものであってもよく、例えば、押しボタン式スイッチ、息で操作する呼吸式スイッチ、ポイントタッチスイッチ、ピンタッチスイッチ、ブレスマイクスイッチ等が挙げられる。
請求項4に係る発明であるリモコン装置においては、前記音声認識手段の動作状態を表示する動作状態表示手段を備えるため、リモコン装置のさらなる操作性上を期待することができる。
【0019】
なお、動作状態表示手段として発光ダイオードを用いる場合には、リモコン操作したい操作対象を指示する認識対象語が認識たときに緑色に光らせ、その操作対象の動作を指示する音声の入力を待つ状態となったことを利用者に報知してから、さらに、その操作対象の動作を指示する音声が受信したときに赤色に光らせその受信された音声から認識対象語を認識しているときに赤点滅させる等、音声認識手段の各種状態に応じて発光ダイオードの発光パターンを変えるようにすればよい。
【0020】
また、複数の発光ダイオードを一列に配置し、リモコン操作したい操作対象を指示する音声から認識対象語が認識されたときに、全ての発光ダイオードが緑色に光って、その操作対象の動作を指示する音声の入力を待つ状態に入ったことを利用者に報知し、時間が経過するにしたがって発光ダイオードを1つずつ消していき、最後には全ての発光ダイオードを消して、リモコン操作したい操作対象を指示する音声の入力を待つ状態に入ったことを利用者に報知するようにしてもよい。
【0021】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。
図1は、本発明に係るリモコン装置の一実施形態の使用例を説明するための説明図である。
図1に示すように、本実施形態におけるリモコン装置1は、操作対象であるテレビ2、ビデオ3、エアコン4等の機器が設置された壁と対向する壁に沿って配置されている机の上に載置される。
【0022】
ここで、このリモコン装置1には、テレビ2、ビデオ3、エアコン4等の機器の赤外線によるリモコン信号と、利用者のパスワード及び機器に動作を指示する認識対象語が予め記憶されているものとする。
図2は、本発明に係るリモコン装置の一実施形態で実施される処理の概要を示すフローチャートである。
【0023】
図2に示すように、利用者が例えば「パスワード1」といった音声を発すると、図3に示すように、予め登録されている「パスワード1」「パスワード2」「パスワード3」といった認識対象語に基づいて、リモコン装置1は「パスワード1」という音声から認識対象語を認識するようになっており(ステップ201)、認識対象語が認識されなかったときには認識対象語が発声されるのを再び待つ状態に入るようになっているが(ステップ202「No」)、音声から認識対象語が認識されたときには、その音声を発した利用者を特定してから、リモコン操作したい機器を指示する認識対象語の発声を待つ状態に入るようになっている(ステップ202「Yes」)。ここで、「パスワード1」等という言葉は、各機器に対してリモコン操作を開始するために、各利用者がリモコン装置1に予め登録しておいたパスワードである。
【0024】
次に、利用者が例えば「テレビ」といった音声を発すると、図4に示すように、予め登録されている機器を指示する認識対象語とその認識対象語の前記特定された利用者による使用頻度とを参照して、その使用頻度に有意差がある認識対象語の照合計算のスコアに重み付けをし、リモコン装置1は音声から「テレビ」という認識対象語を認識する。ここで、「テレビ」という言葉は、テレビ2のリモコン操作を開始するために、利用者がリモコン装置1に予め設定しておいた認識対象語である。
【0025】
このように、テレビ2の動作を指示する音声だけを認識するようにしたことにより、続けて利用者が発する音声に含まれるテレビ2の動作を指示する音声を、他の機器の動作を指示する音声として誤認識してしまうことがなく、認識率が向上する。
また、利用者が、続けて「スイッチ・オン」と音声を発すると、予め登録されているテレビ2の動作を指示する認識対象語とその認識対象語の前記特定された利用者による使用頻度とを参照して(スイッチs1「ON」)、その使用頻度に有意差がある認識対象語の照合計算のスコアに重み付けをし、リモコン装置1は音声から「スイッチ・オン」という認識対象語を認識するようになっており(ステップ203)、音声から認識対象語が認識されなかったときには認識対象語が入力されるのを再び待つ状態に入るようになっているが(ステップ204「No」、206「Yes」)、認識対象語が認識されたときには(ステップ204「Yes」)テレビ2の電源を投入するためのリモコン信号を送信するようになっている(ステップ205)。
【0026】
このように、認識対象語の利用者による使用頻度を参照して、その使用頻度に有意差がある認識対象語の照合計算のスコアに重み付けをすることにより、使用頻度の高い認識対象語はより認識されやすくなり、認識率が向上する。
そして、テレビ2は、このリモコン信号を受信すると、専用のリモコン装置が操作された場合と同様に、自身の電源を投入するようになっている。ここで、「スイッチ・オン」という言葉は、テレビ2の動作を指示するために利用者がリモコン装置1に予め設定しておいた認識対象語である。
【0027】
ビデオ3やエアコン4に対しても同様であり、利用者が「ビデオ」或は「エアコン」と音声を発すれば、図4に示すように、予め登録されているそれぞれの機器を指示する認識対象語に基づいてその音声から認識対象語を認識するともに、続けて利用者が発した音声に含まれる認識対象語を、テレビ2の動作を指示する認識対象語に基づいて認識するようにして(スイッチs1〜snのいずれかを「ON」)、それらの機器の動作を指示する認識対象語の発声を待つ状態に入るようになっており、その後で「スイッチ・オン」といった機器の動作を指示する認識対象語が発声されれば、それに対応したリモコン操作が実行されるようになっている。
【0028】
なお、パスワードを認識してから8秒以上又は、機器の動作を指示する音声から認識対象語が認識された回数が4回以上である場合には(ステップ206「No」)、パスワードの認識(ステップ201)から上記手順を繰り返すようになっているが、パスワードを認識してから8秒以内であって、機器の動作を指示する音声から認識対象語が認識された回数が4回以下である場合には(ステップ206「Yes」)、リモコン操作したい機器を指示する音声から認識対象語を認識するところ(ステップ203)から上記手順を繰り返すようになっている。
【0029】
図5は、本発明に係るリモコン装置の一実施形態を表側から見たときの斜視図である。
図5に示すように、リモコン装置1の表側の下部には、音声送受信部5が設けられており、音声送受信部5の内部には、利用者の音声を受信するマイクロフォン及び音声での応答をするスピーカが設けられている。
【0030】
また、表側の上部には、利用者が指示できるリモコン操作を表示するLCDパネル6aと、利用者に所望のリモコン操作を指示させる外部スイッチ6bと、が横に並べて設けられており、例えば、風邪等で体調が悪く、利用者が声を出しにくい場合には、LCDパネル6aに表示されているリモコン操作のうちから、利用者が所望のリモコン操作を外部スイッチ6bから手動で指示することもできるようになっている。
【0031】
具体的には、図6(a)に示すように、LCDパネル6aは、操作対象となる機器の名前をマトリックス状に一覧表示するともに、機器の名前を個別に四角形状の枠線で囲み、それらの枠線の右端から矢印を右方へ伸ばした画像を表示するようになっている。初期状態においては、左上に位置する枠線が押しボタン状に表示されていて、利用者により外部スイッチ6bが一回押されるたびに、1つ右隣の枠線に押しボタン状表示を移動するようになっている。例えば、図6(a)に示すように、左上に「テレビ」の名前が配されて、その1つ右隣に「ビデオ」の名前が配された状態で、外部スイッチ6bが一回押されると、「ビデオ」の名前を囲む枠線が押しボタン状に表示される。
【0032】
また、外部スイッチ6bが短い間隔で2回連続して押されると、図6(b)に示すように、押しボタン状に表示されている機器の動作を指示する単語(録画、再生、停止等)やアイコン等を、機器の名前と同様に、マトリクス状に一覧表示するようになっている。初期状態においては、機器の名前を選択する場合と同様に、左上に位置する枠線が押しボタン状に表示されて、利用者により外部スイッチ6bが一回押されると、1つ右隣に枠線の押しボタン状表示を移動し、短い間隔で2回連続して押されると、押しボタン状に表示されているアイコン等に対応するリモコン操作を実行するようになっている。他の機器においても同様の手順でリモコン操作を実行するようになっている。
【0033】
なお、機器の名前等を利用者に選択させる方法としては、上記した外部スイッチ6bを押した回数で選択させる方法に限られるものではなく、外部スイッチ6bを押した時間で選択させるようにしてもよく、利用者が外部スイッチ6bを短く押したときに押しボタン表示を右隣の枠線に移し、長く押したときに押しボタン表示されている枠線で囲まれているリモコン操作を実行するようにしてもよい。
【0034】
外部スイッチ6bとしては、押しボタン式スイッチ、息で操作する呼吸式スイッチ、ポイントタッチスイッチ、ピンタッチスイッチ、ブレスマイクスイッチ等が挙げられる。
また、LCDパネル6aは、利用者が外部スイッチ6bから手動でリモコン操作を指示するときと同様の表示を、利用者が音声でリモコン操作を指示するときにも行うようになっている。
【0035】
さらに、表側の中央部には、機器の動作状態等を表示する表示部7が設けられている。表示部7は、横一列に配置された複数の発光ダイオードからなり、左端及び右端に配置されている発光ダイオードが、他の発光ダイオードから離れて設けられている。
左端に配置された発光ダイオードは、リモコン操作したい機器を指示する音声から認識対象語が認識されたときに緑色に光って、その操作対象の動作を指示する音声の入力を待つ状態に入ったことを利用者に報知し、さらに、その操作対象の動作を指示する音声が受信されると赤色に光り、受信された音声から認識対象語を認識する状態に入ったことを利用者に報知するようになっている。
【0036】
右端に配置された発光ダイオードは、受信された音声から認識対象語を認識することに失敗したときに赤色に光って、その操作対象の動作を指示する音声の入力を待つ状態に再度入ったことを利用者に報知するようになっている。
中央に配置された複数の発光ダイオードは、リモコン操作したい機器を指示する音声から認識対象語が認識されたときに、全ての発光ダイオードが橙色に光って、その機器の動作を指示する音声の入力を待つ状態に入ったことを利用者に報知し、時間が経過するに従って発光ダイオードを1つずつ緑色に変化させていき、最後には全ての発光ダイオードを緑色に変化させ、リモコン操作したい機器を指示する音声の入力を待つ状態に入ったことを利用者に報知するようになっている。
【0037】
このように、利用者が音声でリモコン操作を指示したときに、表示部7の発光ダイオードを光らせるようにしたことにより、さらにリモコン装置1の操作性が向上することが期待できる。
また、リモコン装置1の上端部には、リモコン信号送信部8及びリモコン信号受信部9が設けられており、リモコン信号送信部8の内部には赤外発光ダイオド(IRED)が、リモコン信号受信部9の内部には赤外域フォトセンサが、それぞれ配置されている。リモコン信号送信部8は赤外線によるリモコン信号を受信できる電気機器に対してリモコン信号を送信するためのものであり、リモコン信号受信部9はテレビ2等の機器に標準で付いてくる専用のリモコン装置が発するリモコン信号を受信するためのもので、リモコン装置1はここで受信した信号を学習するようになっている。
【0038】
図7は、本発明に係るリモコン装置の一実施形態の回路構成を示すブロック図である。
図7に示すように、リモコン装置1には、回路全体の制御を行う中央制御回路100が設けられており、その中央制御装置100の入力端子には、外部スイッチ6bの信号が入力されるようになっている。
【0039】
先ず、利用者のパスワード及び機器に動作を指示する音声の入力方法について説明する。
利用者により発せられたパスワードは、マイクロフォン110で受信されて電気信号に変換され、増幅器111にて増幅されるようになっている。
増幅されたパスワードの電気信号は、A/D変換器112でデジタル信号に変換され、音声パスワド認識回路103に入力されるようになっている。音声パスワ−ド認識回路103は、音声パスワド情報メモリ104に予め設定されているパスワドに関する情報を用いて、入力されたパスワードの認識を行うようになっている。そして、最も確からしいパスワ−ドを推定して中央制御回路100に報知し、RAM101に予め設定されている利用者とパスワードとの対応関係に基づいて、中央制御回路100により、そのパスワードがどの利用者のものであるかが判断される。
【0040】
リモコン操作する機器を指示する音声を利用者が発すると、音声指示認識回路113は、前記設定された音声指示情報メモリ114に予め登録されている、機器に対して動作を指示する認識対象語を用いて、入力された音声から認識対象語の認識を行うようになっている。そして、最も確からしい認識対象語を推定して、中央制御回路100に報知するようになっている。
【0041】
利用者の音声から認識対象語を認識すると、RAM101に予め設定されている認識対象語とリモコン信号との対応関係に基づいて、中央制御回路100は、その認識対象語がどのリモコン信号に関するものであるかを判断し、例えば、テレビ2のチャンネルに関するものであれば、IRED駆動・制御回路121に対してチャンネル操作の該当するリモコン信号の送信を指示するようになっている。すると、IRED駆動・制御回路121は、各機器のリモコン信号情報が予め格納されているIREDコド情報メモリ132から該当するコドを取り出して、これに基づいてIRED120を駆動し、リモコン信号を送信するようになっている。
【0042】
上記IREDコ−ド情報メモリ132に格納されているリモコン信号としては、既に発売済みのテレビ、ビデオ等のリモコン信号のコ−ド情報を固定で格納しておくのでも良いし、フォトセンサ130、フォトセンサインタフェス回路131を用いて学習するようにしても良い。
例えば、音声ガイダンスにより「操作対象は何ですか」という音声をリモコン装置1が発するようにし、図8に示すように、利用者が例えば「テレビ」といった音声を発すると、リモコン装置1はその音声を認識し(ステップ701)、「電源操作に対応する赤外線信号を入力して下さい。」という音声を発して(ステップ702)、赤外線信号の入力を待つ状態に入るようになっている。
【0043】
利用者が、そのテレビ2の専用のリモコン装置のリモコン信号送信部をフォトセンサ130(リモコン信号受信部9)に接近させて作動させると、リモコン装置1はそのリモコン信号をフォトセンサ130で受信し、これをフォトセンサインタフェス回路131を介してIREDコド情報メモリ132に入力させて、これをIREDコードとして該IREDコド情報メモリ132に記憶させるともに、RAM101に認識対象語とリモコン信号との対応関係を設定するようになっている(ステップ703)。
【0044】
同様に、リモコン装置1は「音量の増加に対応する赤外線信号を入力して下さい。」(ステップ704)等のテレビの各種操作に対応する赤外線信号の入力を求め、それらをIREDコード情報メモリ132に記憶させるともに、RAM101に認識対象語とリモコン信号との対応関係を設定することを繰り返し、図9に示すように、予めIREDコード情報メモリ131に格納されているコード情報と共に学習したコード情報をリモコン信号として使用するようになっている。
【0045】
また、電源操作に対応するリモコン信号や音量操作に対応するリモコン信号等からなるリモコン信号のセットは、例えば同様な機能を有するテレビであっても各メーカ毎に異なっており、さらに各メーカの内でも機種毎に異なっている。そのため、上記IREDコド情報メモリ132に、既に発売済みの主だったテレビ、ビデオのリモコン信号のコ−ド情報を固定で格納しておく場合には、どのリモコン信号のセットを用いるかを利用者が設定するようになっている。
【0046】
即ち、音声ガイダンスにより「操作対象は何ですか?」という音声をリモコン装置1が発し、図10に示すように、利用者が例えば「テレビ」といった音声を発すると、リモコン装置1はその音声を認識し(ステップ901)、「テレビのメーカ名は何ですか?」という音声を発して、メーカ名に対応する音声が入力されるのを待つ状態に入るようになっている。
【0047】
利用者が、例えば「メーカ1」といった音声を発すると、リモコン装置1はその音声を認識し(ステップ902)、「メーカ1」で製造されているテレビが採用している、複数あるリモコン信号のセットのうちの1つを選択して設定し、その設定したリモコン信号のセットでチャンネル変更操作、音量変更操作等の各種操作を自動的に実行するようになっている(ステップ903)。
【0048】
設定されたリモコン信号のセットではリモコン操作がうまく行われないときは、利用者が「NG」と声を発すると(ステップ904「No」)、リモコン装置1は他のリモコン信号のセットを選択して設定し、その設定したリモコン信号のセットで再び各種操作を自動的に実行するようになっている(ステップ905)。
【0049】
そして、設定されたリモコン信号のセットでリモコン操作がうまく行われたときは、利用者が「OK」と声を発すると(ステップ906「Yes」)、RAM101に認識対象語とリモコン信号との対応関係を設定し、リモコン装置1はそのリモコン信号のセットをテレビ2のリモコン信号として設定するようになっている。
【0050】
また、本実施形態のリモコン装置1は利用者の手元を離れて使用されるものであるので、確実な動作を保証するために1つ1つの動作を音声で応答させるようにすることも可能である。例えば、「テレビ」というキドを認識すると、これに対して「テレビの操作ですね」といった応答を返すようになっている。
このために、中央制御回路100は応答音声制御回路143に対して動作の度に所定の指示を出す。応答音声制御回路143はこれを受けると、応答音声用情報メモリ144に予め記憶してある音声情報を取り出し、D/A変換器142、増幅器141、スピーカ140を用いて応答音声を発するようになっている。
【0051】
スピーカ140から発される応答音声は、利用者に応じて内容を変えるようになっていて、例えば、パスワードにより判断された利用者が、視覚に障害がある視覚障害者である場合には、使用方法を説明する音声も併せて発するようになっており、リモコン装置の操作性が向上するようになっている。
図11は、本実施形態におけるリモコン装置1の音声とそれに対応する動作の一例を示す図である。
【0052】
図11に示すように、例えばリモコン操作したい機器を指示する音声から「テレビ」という認識対象語が認識されると、RAM101に予め設定されている、機器を指示する認識対象語と機器の動作を指示する認識対象語との対応関係に基づいて、音声指示情報メモリ114に登録されている認識対象語のうちから、「テレビ」という機器を指示する認識対象語に対応した「スイッチ・オン」等の動作を指示する認識対象語を選択し、リモコン装置1はテレビ2の動作を指示する音声の入力を待つ状態に入り、選択された認識対象語に基づいてこの後に発せられる音声を認識するようになっている。
【0053】
換言すると、この時点まではリモコン操作したい機器の認識しか行わず、「テレビ」という機器を指示する音声を受付けた後でなくては、「スイッチ・オン」や「チャンネル3」等のテレビ2の動作を指示する音声を認識することがなく、リモコン操作を指示する音声の誤認識を少なくすることができる。
また、例えば「ビデオ」という認識対象語が認識されたときも、テレビのときと同様に、RAM101に予め設定されている前記対応関係に基づいて、音声指示情報メモリ114に登録されている認識対象語のうちから、ビデオ3の動作を指示する認識対象語を選択するようになっている。
【0054】
そのため、機器の動作を指示する音声の内に同じ認識対象語で表されるものがある場合には、音声指示情報メモリ114に重複して記憶しておく必要がなく、動作を指示する音声として各機器毎に認識対象語を記憶させる方法に比べて、音声指示情報メモリ114に記憶させる情報を少なくすることができるので、必要とされる音声指示情報メモリ114の記憶容量が小さくて済み、高価である大容量の音声指示情報メモリ114を用いずに済むので、製造コストを抑えることができる。
【0055】
なお、上記実施の形態においては、本発明の構成要件である記憶手段は音声指示情報メモリ114及びIREDコード情報メモリ132に対応し、音声認識手段は音声指示認識回路113に対応し、利用者識別手段はパスワード認識回路103に対応し、送信手段はリモコン信号送信部8及びIRED120に対応し、情報表示手段はLCDパネル6aに対応し、操作指示スイッチは外部スイッチ6bに対応する。
【0056】
また、上記実施形態は本発明に係るリモコン装置の一例を示したものであり、リモコン装置の構成、リモコン信号の種類等を限定するものではない。
例えば、上記実施の形態においては、図12(a)に示すように、各利用者がリモコン装置1に予め登録しておいたパスワードに基づいて、そのパスワードを発した利用者を特定する例を示したが、各利用者は他の利用者がどのようなパスワードを設定したのかを知らないため、リモコン操作することを意図せずに、偶然発声した音声に他の利用者のパスワードが含まれていたときにも誤ってリモコン操作を開始してしまう恐れがあるので、例えば、図12(b)に示すように、全ての利用者で同じパスワードを用い、リモコン装置1が前記パスワードを認識したときに、そのパスワードを発声した音声に基づいて公知の話者認識技術で利用者を特定するようにして、誤操作の可能性を少なくすることが好ましい。
【0057】
また、「テレビ」といった音声を発した後に、利用者が「スイッチ・オン」といった音声を発する例を示したが、他にも、利用者が「テレビ」という音声に続けて「いつもの」という音声を発したときには、その利用者により使用されたテレビ2の動作を指示する認識対象語の使用頻度を参照して、その使用頻度に有意差がある動作を指示するリモコン信号を送信するようにしてもよく、テレビやオーディオ、エアコン等、利用者の好みによって指示される動作がほぼ決まっているものには少ない発話で目的の操作をすることができ、操作性が向上する。
【0058】
【発明の効果】
以上説明したように、本発明に係るリモコン装置においては、利用者から発せられた音声に含まれる認識対象語をその利用者の認識対象語の使用頻度に基づいて認識する、つまり利用者から発せられた音声の認識結果の履歴に基づいて利用者毎にどの認識対象語を頻繁に使用するかといった情報を統計的に処理しておき、利用者から発せられた音声に含まれる認識対象語を、その利用者に対応して統計処理された認識対象語の使用頻度に基づいて認識するため、リモコン装置による音声の誤認識を減らすことができる。
【図面の簡単な説明】
【図1】本発明に係るリモコン装置の一実施形態の使用例を説明するための説明図である。
【図2】図1のリモコン装置で実施される処理の概要を示すフローチャートである。
【図3】図2のフローチャートで実施されるパスワード認識の概要を説明するための説明図である。
【図4】図2のフローチャートで実施される音声指示認識の概要を説明するための説明図である。
【図5】図1のリモコン装置を表側から見たときの斜視図である。
【図6】図5のLCDパネルの動作を説明するための説明図である。
【図7】図1のリモコン装置の回路構成を示すブロック図である。
【図8】図7のIREDコード情報メモリにリモコン信号を学習させる手順を示すフローチャートである。
【図9】図7のIREDコード情報メモリに格納されているリモコン信号の概要を説明するための説明図である。
【図10】図7のIRED駆動・制御回路を設定する手順を示すフローチャートである。
【図11】図1のリモコン装置に対応づけられている認識対象語の格納例を説明する説明図である。
【図12】図2のフローチャートで実施されるパスワード認識処理の変形例を説明するための説明図である。
【符号の説明】
1 リモトコントロル装置
2 テレビ
3 ビデオ
4 エアコン
6a LCDパネル
6b 外部スイッチ
100 中央制御回路
103 パスワード認識回路
104 パスワード情報メモリ
113 音声指示認識回路
114 音声指示情報メモリ
120 IRED(赤外発光ダイオ−ド)
121 IRED駆動・制御回路
132 IREDコード情報メモリ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a remote control device that can remotely control various devices such as a television and a video by voice.
[0002]
[Prior art]
  As such a remote control device, for example, a remote control device described in claim 1 of Japanese Patent Laid-Open No. 05-219575,User'svoiceIs recognized as one keyword, and the keyword isCompatible with remote control signals ofTheApart from thatCorresponds to the discrimination resultRemote control signalSendTrustTo doThere is.
[0003]
  Moreover, like the remote control device described in claim 4 of the publicationThe user'sVoice firstWith keywordsWith the second keywordTwo keywordsSo that you can recognizeThe secondWhen recognizing one keyword, multiple deviceshomeDetermine which device is compatible withThe secondWhen recognizing the second keyword,SaidDetermine which device operation is supportedAnd send a remote control signal corresponding to the discrimination result.There are also things.
[0004]
[Problems to be solved by the invention]
  However, among the above-described conventional remote control devices, the remote control device described in claim 4 of Japanese Patent Laid-Open No. 05-219575 is used.In that case, the user'sVoiceTwoBecause it is designed to be divided into keywords,Compared to recognizing user's voice as one keyword, A large number of keywordsEnd,Corresponding to those keywordsTo memorize all recognition target wordsHighNeed a large-capacity storage meansIs, Manufacturing costs will be highfearwas there.In addition, there is a possibility that the voice is erroneously recognized by the remote control device.
[0005]
  The present invention has been made paying attention to such unsolved problems of the prior art,Can reduce misrecognition of voice by remote control deviceIt is an object to provide a remote control device.
[0007]
[Means for Solving the Problems]
  In order to solve the above-described problem, a remote control device according to a first aspect of the present invention provides a recognition target word included in a voice uttered by a user.By collating with recognition target words registered in advanceA voice recognition means for recognition, a transmission means for transmitting a remote control signal corresponding to the recognition target word recognized by the voice recognition means, a user identification means for identifying a user, and the user identification means. Usage frequency calculation means for calculating the usage frequency of the recognition target word based on the recognition result of the voice recognition means for each user, the voice recognition means,PreviousUsers identified by the user identification meansIf the recognition target word issued from is a recognition target word for instructing an action after the recognition target word for the operation target, the recognition target word for instructing the action obtained by the use frequency calculation means is recognized, and the transmission means Transmits a remote control signal corresponding to the recognition target word indicating the operation.It is characterized by the fact that it is adapted.
  A remote control device according to a second aspect of the present invention is the remote control device according to the first aspect, wherein the recognition target word indicates a desired operation target from a plurality of operation targets and the operations of the plurality of operation targets. The recognition target word for instructing the operations of the plurality of operation objects is stored separately from the instruction to be instructed, and the recognition target word for instructing the operation common to the plurality of operation objects and the operation specific to the plurality of operation objects. A storage unit that stores the recognition target words separately, and the voice recognition unit recognizes a recognition target word included in a voice uttered by a user based on the storage unit; and the transmission unit includes: A remote control signal corresponding to a combination of a recognition target word indicating a desired operation target recognized by the voice recognition means and a recognition target word specifying the operation of the plurality of operation targets is transmitted. And it is characterized in and.
  According to a third aspect of the present invention, in the remote control device according to the first or second aspect, information display means for displaying information relating to a remote control operation that can be instructed by a user, and a remote control operation displayed on the information display means And an operation instruction switch for instructing the user to perform a desired remote control operation based on the information on the information.
[0008]
  According to a fourth aspect of the present invention, in the remote control device according to any one of the first to third aspects, an operation state display unit that displays an operation state of the voice recognition unit is provided.Is.
[0014]
  Therefore,Claim1In the remote control device according to the present invention, the recognition target word included in the voice uttered from the user is recognized based on the frequency of use of the recognition target word of the user, that is, the voice uttered from the user is recognized. Based on the history of the results, information such as which recognition target words are frequently used for each user is statistically processed, and the recognition target words included in the speech uttered by the user are given to the user. Since recognition is performed based on the frequency of use of the recognition target words that have been statistically processed correspondingly, erroneous recognition of speech by the remote control device can be reduced.
[0015]
  Further, based on the recognition result history, information such as which operation is frequently instructed after the user has instructed an arbitrary operation target is statistically processed, and when the operation target is instructed A remote control signal for performing an operation instructed at a high frequency may be transmitted together, and in this way, the user's favorite state can be immediately reproduced.
In the remote control device according to the second aspect of the present invention, the recognition target words are stored separately for those indicating a desired operation object from among a plurality of operation objects and those indicating the operation of the plurality of operation objects. And recognizing the recognition target words for instructing the operations of the plurality of operation targets separately into recognition target words commonly used for the plurality of operation targets and recognition target words used individually for the plurality of operation targets. Therefore, for example, only recognition target words that are commonly used for all operation targets such as “switch on” and “switch off”, and only some operation targets such as “fast forward” and “rewind” It is not necessary to store commonly used recognition target words and the like in the storage means, and a recognition target word for recognizing a voice instructing the operation of the operation target is stored for each operation target. Compared to the method It is possible to reduce the recognition target word to be is stored in the unit, it is possible to reduce the storage capacity of the storage means required.
The recognition target words stored in the storage means may be stored in advance at the time of manufacture, or may be stored in the user at the time of use. If the recognition target word is stored at the time of use, the user may utter the recognition target word and store it. The input target word such as a keyboard may be used to input the recognition target word. You may make it memorize | store.
In addition, the order in which the speech recognition means recognizes the recognition target words from the speech uttered by the user is the recognition target word indicating the desired operation target or the recognition target word indicating the operation target operation. However, the recognition target word is recognized in advance, for example, by first recognizing the recognition target word indicating the operation target, and then recognizing the recognition target word indicating the operation of the operation target. If the order to be determined is determined, the voice recognition means, for example, only refers to the recognition target word indicating the operation target stored in the storage means when a voice is issued to instruct the operation target from the user. In addition, when a voice is issued to instruct the operation of the operation target from the user, it is only necessary to refer to the recognition target word instructing the operation of the operation target stored in the storage unit. In, it can be recognized word for reference when recognizing voice generated by a user fewer, to reduce erroneous recognition of voice instructing the remote control operation.
In the remote control device as described above, a means for reading or rewriting the voice, the remote control signal, etc. stored in the storage means may be provided. When the transmission means cannot be used due to a failure or the like, the recognition target word stored in the storage means of the remote control device used is read and the storage means of the new remote control device is rewritten to use the remote control device. It is preferable because a new remote control can be used immediately in the same way as. As the storage means, for example, a flash memory or the like directly connected to the remote control device may be used, or an external storage provided in a remote place and indirectly connected to the remote control device via a telephone line or the like. An apparatus may be used.
In addition, since it is used away from the user's hand, in order to ensure reliable operation, the user can check various situations of the remote control device such as whether the voice can be recognized by the voice recognition means. It is preferable to include a situation notifying unit for notifying the user.
The situation notification means may be any means as long as it can notify various situations of the remote control device. For example, a speaker or the like for notifying the user of the sound when the voice recognition means recognizes the voice. Is mentioned.
In addition, for visually impaired persons who are visually impaired, the operation procedure may be guided by voice, so that anyone can easily handle the remote control device, and the operability of the remote control device is improved. Can be improved.
[0016]
Further, based on the recognition result history, the state before the latest remote control signal is transmitted is restored.So that users can do thatEven if an incorrect recognition target word is recognized from the voice and a remote control signal that the user did not expect is transmitted, the operation target can be immediately returned to the original state.
Further, the remote control signal transmitted immediately before is stored as a history of the recognition target word, and when the voice recognition means recognizes a predetermined recognition target word, the stored remote control signal is again transmitted to the transmission means. To sendYou can do that,, You can easily perform operations such as lighting that changes step by step to the same state with the same remote control signal,Remote control deviceOperability is improved.
[0017]
In the remote control device according to the third aspect of the present invention, the information display means displays information related to the remote control operation that can be instructed by the user, and is used based on the information related to the remote control operation displayed on the information display means. An operation instruction switch for instructing the user to perform a desired remote control operation.For example, if a switch or the like for manually instructing the remote control operation is used as the operation instruction switch, the physical condition is poor due to a cold or the like. When it is difficult to take out, the remote control device of the present invention can be used as an ordinary remote control device. It is also effective in cases where the body organ is damaged and the user is unable to speak while wearing a respiratory device, or when the user does not want to instruct the remote control operation simply by voice.
[0018]
The operation instruction switch may be any switch as long as it allows the user to instruct a desired remote control operation. For example, a push button switch or a breathing switch operated with breath , Point touch switches, pin touch switches, breath microphone switches and the like.
In the remote control device according to the fourth aspect of the present invention, the remote control device further includes an operation state display unit that displays an operation state of the voice recognition unit.OperabilityofForUpExpectationTo doit can.
[0019]
Operating state display meansWhen using a light emitting diode asI want to operate the remote controlIndicates the operation targetRecognitionRecognized wordsShiLight green whenLet, Waiting for input of voice that instructs the operation of the operation targetBecameInform the user thatAfterIn addition, a voice that indicates the operation of the operation target is received.WhenLight redLet,ThatWhen the recognition target word is recognized from the received voiceRedcolorInFlashingMakeetc,Voice recognition meansWhat is necessary is just to change the light emission pattern of a light emitting diode according to these various states.
[0020]
Also, a plurality of light emitting diodes are arranged in a line, and when the recognition target word is recognized from the voice that indicates the operation target to be operated by the remote controller, all the light emitting diodes illuminate in green to instruct the operation of the operation target. The user is informed that it has entered a state of waiting for voice input, and as time elapses, the light emitting diodes are turned off one by one, and finally all the light emitting diodes are turned off. You may make it alert | report to a user that it entered into the state which waits for the input of the audio | voice to instruct | indicate.
[0021]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is an explanatory diagram for explaining an example of use of an embodiment of a remote control device according to the present invention.
As shown in FIG. 1, the remote control device 1 in the present embodiment is on a desk arranged along a wall facing a wall on which devices such as a television 2, a video 3, and an air conditioner 4 that are operation targets are installed. Placed on.
[0022]
Here, the remote control device 1 stores in advance an infrared remote control signal of a device such as a television 2, a video 3, an air conditioner 4, etc., a user password, and a recognition target word for instructing the device to operate. To do.
FIG. 2 is a flowchart showing an outline of processing performed in an embodiment of the remote control device according to the present invention.
[0023]
As shown in FIG. 2, when the user utters a voice such as “password 1”, for example, as shown in FIG. 3, the recognition target words such as “password 1”, “password 2”, and “password 3” are registered in advance. Based on this, the remote control device 1 recognizes the recognition target word from the voice of “password 1” (step 201), and waits again for the recognition target word to be uttered when the recognition target word is not recognized. In this state (step 202 “No”), when the recognition target word is recognized from the voice, the user who has issued the voice is identified, and then the recognition target is designated to indicate the device to be operated by the remote controller. A state of waiting for the utterance of the word is entered (step 202 “Yes”). Here, the term “password 1” or the like is a password registered in advance in the remote control device 1 by each user in order to start remote control operation for each device.
[0024]
Next, when the user utters a sound such as “TV”, for example, as shown in FIG. 4, a recognition target word indicating a pre-registered device and a frequency of use of the recognition target word by the specified user. With reference to the above, the score of the collation calculation of the recognition target words having a significant difference in the use frequency is weighted, and the remote control device 1 recognizes the recognition target word “TV” from the voice. Here, the term “TV” is a recognition target word that is set in advance in the remote control device 1 by the user in order to start the remote control operation of the TV 2.
[0025]
In this way, by only recognizing the sound for instructing the operation of the television 2, the sound for instructing the operation of the television 2 included in the sound uttered by the user is instructed for the operation of another device. The recognition rate is improved without being erroneously recognized as speech.
When the user continuously utters “switch-on”, the recognition target word for instructing the operation of the television 2 registered in advance and the use frequency of the recognition target word by the specified user, (Switch s1 “ON”) is weighted, and the remote calculation device 1 recognizes the recognition target word “switch on” from the voice by weighting the score of the collation calculation of the recognition target word having a significant difference in the frequency of use. (Step 203), and when the recognition target word is not recognized from the voice, it waits again for the input of the recognition target word (Step 204 "No", 206). When the recognition target word is recognized (step 204 “Yes”), a remote control signal for turning on the power of the television 2 is transmitted (step 20). ).
[0026]
In this way, by referring to the usage frequency of the recognition target word by the user and weighting the score of the collation calculation of the recognition target word having a significant difference in the usage frequency, the recognition target word having a high usage frequency is more It becomes easier to be recognized and the recognition rate is improved.
When receiving the remote control signal, the television 2 turns on its own power as in the case where the dedicated remote control device is operated. Here, the term “switch-on” is a recognition target word that is set in advance in the remote control device 1 by the user in order to instruct the operation of the television 2.
[0027]
The same applies to the video 3 and the air conditioner 4, and if the user utters “video” or “air conditioner”, as shown in FIG. The recognition target word is recognized from the voice based on the target word, and the recognition target word included in the voice uttered by the user is continuously recognized based on the recognition target word instructing the operation of the television 2. (One of the switches s1 to sn is “ON”), and enters a state of waiting for the utterance of the recognition target word instructing the operation of those devices, and thereafter the device operation such as “switch on” is performed. When the designated recognition target word is uttered, the corresponding remote control operation is executed.
[0028]
If the password is recognized for 8 seconds or more, or if the recognition target word is recognized 4 times or more from the voice instructing the operation of the device (step 206 “No”), the password recognition ( The above procedure is repeated from step 201), but within 8 seconds after the password is recognized, the number of times the recognition target word is recognized from the voice instructing the operation of the device is 4 times or less. In this case (step 206 “Yes”), the above procedure is repeated from the point where the recognition target word is recognized from the voice instructing the device to be operated by the remote control (step 203).
[0029]
FIG. 5 is a perspective view when one embodiment of the remote control device according to the present invention is viewed from the front side.
As shown in FIG. 5, a voice transmission / reception unit 5 is provided in the lower part on the front side of the remote control device 1. Inside the voice transmission / reception unit 5, a microphone for receiving a user's voice and a response by voice are received. A speaker is provided.
[0030]
Further, an LCD panel 6a for displaying a remote control operation that can be instructed by the user and an external switch 6b for instructing the user to perform a desired remote control operation are provided side by side on the upper side of the front side. If the physical condition is poor and it is difficult for the user to speak, the user can manually instruct the desired remote control operation from the external switch 6b among the remote control operations displayed on the LCD panel 6a. It is like that.
[0031]
Specifically, as shown in FIG. 6A, the LCD panel 6a displays a list of names of devices to be operated in a matrix, and individually surrounds the names of the devices with a rectangular frame, An image with an arrow extending rightward from the right end of the frame line is displayed. In the initial state, the frame line located at the upper left is displayed in the form of a push button, and each time the user presses the external switch 6b, the push button display is moved to the right frame line. It is like that. For example, as shown in FIG. 6A, the name of “TV” is arranged at the upper left, and the name of “video” is arranged to the right of the name, and the external switch 6b is pressed once. Then, a frame that surrounds the name of “video” is displayed like a push button.
[0032]
When the external switch 6b is continuously pressed twice at short intervals, as shown in FIG. 6B, a word (recording, playing, stopping, etc.) instructing the operation of the device displayed as a push button. ), Icons, and the like are displayed in a matrix in the same manner as the device names. In the initial state, as in the case of selecting the name of the device, the frame line located at the upper left is displayed in the form of a push button, and when the user presses the external switch 6b once, the frame on the right one is displayed. When the push-button display of the line is moved and pressed continuously twice at short intervals, a remote control operation corresponding to an icon or the like displayed in the push-button shape is executed. In other devices, remote control operations are executed in the same procedure.
[0033]
Note that the method of causing the user to select the device name and the like is not limited to the method of selecting the number of times the external switch 6b is pressed, and may be selected based on the time the external switch 6b is pressed. Often, when the user presses the external switch 6b for a short time, the push button display is moved to the right border line, and when the user presses the external switch 6b for a long time, the remote control operation surrounded by the push button display border line is executed. It may be.
[0034]
Examples of the external switch 6b include a push button switch, a breathing switch operated by breathing, a point touch switch, a pin touch switch, and a breath microphone switch.
The LCD panel 6a is configured to display the same display as when the user manually instructs the remote control operation from the external switch 6b when the user instructs the remote control operation by voice.
[0035]
Further, a display unit 7 for displaying the operation state of the device and the like is provided at the center on the front side. The display unit 7 includes a plurality of light emitting diodes arranged in a horizontal row, and the light emitting diodes arranged at the left end and the right end are provided apart from the other light emitting diodes.
The light-emitting diode placed at the left end glows green when the recognition target word is recognized from the voice that indicates the device you want to operate by remote control, and has entered the state of waiting for the input of the voice that indicates the operation of the operation target To the user, and further, when a voice instructing the operation of the operation target is received, it glows red, and the user is informed that the recognition target word has been recognized from the received voice. It has become.
[0036]
The light-emitting diode arranged at the right end glows red when it fails to recognize the recognition target word from the received voice, and reenters the state of waiting for the input of the voice instructing the operation of the operation target. Is notified to the user.
A plurality of light emitting diodes arranged in the center, when the recognition target word is recognized from the voice that indicates the device that you want to operate by remote control, all the light emitting diodes glow orange and the voice input that instructs the operation of that device The user is informed that the device has entered a state of waiting for the light, and as the time elapses, the light emitting diodes are changed to green one by one. The user is informed that he / she has entered a state of waiting for input of a voice to be instructed.
[0037]
As described above, it is expected that the operability of the remote control device 1 is further improved by causing the light emitting diode of the display unit 7 to emit light when the user instructs the remote control operation by voice.
A remote control signal transmission unit 8 and a remote control signal reception unit 9 are provided at the upper end of the remote control device 1, and an infrared light emitting diode is provided inside the remote control signal transmission unit 8.-In the remote control signal receiving unit 9, infrared photosensors are respectively arranged. The remote control signal transmission unit 8 is for transmitting a remote control signal to an electrical device that can receive an infrared remote control signal, and the remote control signal reception unit 9 is a dedicated remote control device that comes standard with devices such as the television 2. The remote control device 1 learns the received signal here.
[0038]
FIG. 7 is a block diagram showing a circuit configuration of an embodiment of a remote control device according to the present invention.
As shown in FIG. 7, the remote control device 1 is provided with a central control circuit 100 that controls the entire circuit, and the signal of the external switch 6 b is input to the input terminal of the central control device 100. It has become.
[0039]
First, a method for inputting a user's password and voice for instructing the device to operate will be described.
The password issued by the user is received by the microphone 110, converted into an electric signal, and amplified by the amplifier 111.
The amplified electrical signal of the password is converted into a digital signal by the A / D converter 112, and the voice password is converted.-It is input to the node recognition circuit 103. The voice password recognition circuit 103 has a voice password.-Password preset in the password information memory 104-The password entered is recognized using information about the password. Then, the most probable password is estimated and notified to the central control circuit 100. Based on the correspondence between the user and the password set in advance in the RAM 101, the central control circuit 100 determines which password is used. It is judged whether it belongs to a person.
[0040]
When a user utters a voice for instructing a device to be operated by the remote controller, the voice instruction recognition circuit 113 selects a recognition target word for instructing the device to operate, which is registered in advance in the set voice instruction information memory 114. The recognition target word is recognized from the input voice. Then, the most probable recognition target word is estimated and notified to the central control circuit 100.
[0041]
When the recognition target word is recognized from the user's voice, the central control circuit 100 relates to which remote control signal the recognition target word is based on the correspondence relationship between the recognition target word preset in the RAM 101 and the remote control signal. For example, if it relates to the channel of the television 2, the IRED drive / control circuit 121 is instructed to transmit a remote control signal corresponding to the channel operation. Then, the IRED drive / control circuit 121 stores the remote control signal information of each device in advance.-The corresponding code from the command information memory 132.-The IRED 120 is driven based on this, and a remote control signal is transmitted.
[0042]
As the remote control signal stored in the IRED code information memory 132, code information of a remote control signal such as a television or a video that has already been released may be fixedly stored, or the photosensor 130, Photo sensor interface-Fe-Learning may be performed using the circuit 131.
For example, the remote controller 1 emits a voice “What is the operation target” by voice guidance, and when the user emits a voice such as “TV” as shown in FIG. Is recognized (step 701), and a voice message "Please input an infrared signal corresponding to the power operation" is issued (step 702), and a state of waiting for the input of the infrared signal is entered.
[0043]
When the user operates the remote control signal transmission unit of the dedicated remote control device of the television 2 close to the photosensor 130 (remote control signal reception unit 9), the remote control device 1 receives the remote control signal with the photosensor 130. This is a photo sensor interface-Fe-Through the circuit 131-Input information into the memory information memory 132,CardAs the IRED-In addition, the correspondence information between the recognition target word and the remote control signal is set in the RAM 101 (step 703).
[0044]
Similarly, the remote controller 1 asks for input of infrared signals corresponding to various operations of the television such as “Please input an infrared signal corresponding to the increase in volume” (step 704), and these are input to the IRED code information memory 132. And repeatedly setting the correspondence relationship between the recognition target word and the remote control signal in the RAM 101, as shown in FIG. 9, the code information stored in the IRED code information memory 131 in advance.WithThe learned code information is used as a remote control signal.
[0045]
In addition, a set of remote control signals including a remote control signal corresponding to a power operation, a remote control signal corresponding to a volume operation, and the like is different for each manufacturer even for a television having the same function, for example. But it varies from model to model. Therefore, the above IRED-When the code information of the remote control signals of the main TV and video that have already been released is fixedly stored in the remote information memory 132, the user may set which remote control signal set to use. It has become.
[0046]
That is, when the remote controller 1 utters “What is the operation target?” By the voice guidance and the user utters a voice such as “TV” as shown in FIG. 10, the remote controller 1 utters the voice. It recognizes (step 901), emits a voice “What is the name of the TV manufacturer?”, And enters a state of waiting for the input of the voice corresponding to the name of the manufacturer.
[0047]
When the user utters a voice such as “maker 1”, for example, the remote controller 1 recognizes the voice (step 902), and a plurality of remote control signals adopted by the television manufactured by “maker 1” are used. One of the sets is selected and set, and various operations such as a channel change operation and a volume change operation are automatically executed by the set of the set remote control signals (step 903).
[0048]
When the remote control operation is not performed well with the set of set remote control signals, when the user speaks “NG” (step 904 “No”), the remote control device 1 selects another set of remote control signals. Various operations are automatically executed again with the set remote control signal set (step 905).
[0049]
When the remote control operation is successfully performed with the set of the set remote control signals, when the user speaks “OK” (step 906 “Yes”), the correspondence between the recognition target word and the remote control signal is stored in the RAM 101. The relation is set, and the remote control device 1 sets the set of the remote control signals as the remote control signal of the television 2.
[0050]
In addition, since the remote control device 1 of the present embodiment is used away from the user's hand, it is possible to respond each operation with a voice in order to ensure a reliable operation. is there. For example, the key “TV”-Wa-When it recognizes the mode, it responds with a response such as "It's a TV operation."
For this purpose, the central control circuit 100 issues a predetermined instruction to the response voice control circuit 143 every time it operates. Upon receiving this, the response voice control circuit 143 takes out voice information stored in the response voice information memory 144 in advance, and emits a response voice using the D / A converter 142, the amplifier 141, and the speaker 140. ing.
[0051]
The response voice emitted from the speaker 140 is changed depending on the user. For example, when the user determined by the password is a visually impaired person with a visual impairment, it is used. The voice explaining the method is also emitted together, and the operability of the remote control device is improved.
FIG. 11 is a diagram showing an example of the sound of the remote control device 1 and the corresponding operation in the present embodiment.
[0052]
As shown in FIG. 11, for example, when the recognition target word “TV” is recognized from the voice indicating the device to be operated by the remote controller, the recognition target word indicating the device and the operation of the device set in advance in the RAM 101 are displayed. “Switch-on” or the like corresponding to the recognition target word indicating the device “TV” from among the recognition target words registered in the voice instruction information memory 114 based on the correspondence relationship with the recognition target word to be specified. The remote control device 1 enters a state of waiting for input of a voice instructing the operation of the television 2 and recognizes a voice to be subsequently generated based on the selected recognition target word. It has become.
[0053]
In other words, until this point in time, only the device that the remote controller wants to operate is recognized, and only after the voice indicating the device “TV” is received, “switch-on”, “channel 3”, etc. It is possible to reduce misrecognition of voice instructing remote control operation without recognizing voice instructing operation.
For example, when the recognition target word “video” is recognized, the recognition target registered in the voice instruction information memory 114 based on the correspondence relationship set in advance in the RAM 101 is the same as in the television. From the words, a recognition target word for instructing the operation of the video 3 is selected.
[0054]
Therefore, in the case where there are voices instructing the operation of the device that are expressed in the same recognition target word, it is not necessary to store them in the voice instruction information memory 114 in duplicate, and the voices instructing the operation Compared with the method of storing recognition target words for each device, the information stored in the voice instruction information memory 114 can be reduced, so that the required storage capacity of the voice instruction information memory 114 can be reduced.ExpensiveTherefore, it is not necessary to use the large-capacity voice instruction information memory 114, which can reduce the manufacturing cost.
[0055]
  In the above embodiment, the storage means which is a constituent element of the present invention corresponds to the voice instruction information memory 114 and the IRED code information memory 132, the voice recognition means corresponds to the voice instruction recognition circuit 113, and user identification is performed. The means corresponds to the password recognition circuit 103, the transmission means corresponds to the remote control signal transmitter 8 and the IRED 120, the information display means corresponds to the LCD panel 6a,operationThe instruction switch corresponds to the external switch 6b.
[0056]
Further, the above embodiment shows an example of the remote control device according to the present invention, and does not limit the configuration of the remote control device, the type of the remote control signal, and the like.
For example, in the above-described embodiment, as shown in FIG. 12A, an example in which the user who issued the password is specified based on the password registered in advance in the remote control device 1 by each user. As shown, each user does not know what password the other user has set, so the password of other users is included in the voice spoken accidentally without intending to operate the remote control. Since the remote control operation may be accidentally started even when the user has been using the remote controller, for example, as shown in FIG. 12B, the same password is used by all users and the remote controller 1 recognizes the password. Sometimes, it is preferable to specify a user by a known speaker recognition technique based on the voice that utters the password to reduce the possibility of erroneous operation.
[0057]
In addition, the example in which the user utters “switch-on” after uttering “TV” is shown, but in addition to the “TV” sound, the user says “usual”. When a voice is emitted, the frequency of use of the recognition target word that instructs the operation of the television 2 used by the user is referred to, and a remote control signal that indicates an operation having a significant difference in the use frequency is transmitted. However, the target operation can be performed with a small number of utterances for operations such as televisions, audios, and air conditioners that are almost determined by the user's preference, and the operability is improved.
[0058]
【The invention's effect】
  As described above, in the remote control device according to the present invention,Recognize the recognition target words contained in the speech uttered by the user based on the usage frequency of the recognition target words of the user, that is, for each user based on the history of recognition results of the speech uttered by the user Recognize target words that have been statistically processed according to the user by statistically processing information such as which recognition target words are frequently used, and recognizing the target words contained in the speech uttered by the user. Since the recognition is performed based on the frequency of use, it is possible to reduce erroneous recognition of voice by the remote control device.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram for explaining a usage example of an embodiment of a remote control device according to the present invention.
FIG. 2 is a flowchart showing an outline of processing performed by the remote control device of FIG. 1;
FIG. 3 is an explanatory diagram for explaining an outline of password recognition performed in the flowchart of FIG. 2;
FIG. 4 is an explanatory diagram for explaining an outline of voice instruction recognition implemented in the flowchart of FIG. 2;
FIG. 5 is a perspective view of the remote control device of FIG. 1 when viewed from the front side.
6 is an explanatory diagram for explaining the operation of the LCD panel of FIG. 5; FIG.
7 is a block diagram showing a circuit configuration of the remote control device of FIG. 1. FIG.
8 is a flowchart showing a procedure for learning a remote control signal in the IRED code information memory of FIG. 7;
9 is an explanatory diagram for explaining an outline of a remote control signal stored in the IRED code information memory of FIG. 7;
10 is a flowchart showing a procedure for setting the IRED drive / control circuit of FIG. 7; FIG.
FIG. 11 is an explanatory diagram illustrating an example of storing recognition target words associated with the remote control device of FIG. 1;
FIG. 12 is an explanatory diagram for describing a modification of the password recognition process performed in the flowchart of FIG. 2;
[Explanation of symbols]
1 Rimo-Tocontro-Equipment
2 TV
3 videos
4 Air conditioner
6a LCD panel
6b External switch
100 Central control circuit
103 Password recognition circuit
104 Password information memory
113 Voice instruction recognition circuit
114 Voice instruction information memory
120 IRED (Infrared light emitting diode)
121 IRED drive / control circuit
132 IRED code information memory

Claims (4)

利用者から発せられた音声に含まれる認識対象語を予め登録されている認識対象語と照合することで認識する音声認識手段と、その音声認識手段にて認識された認識対象語に対応するリモコン信号を送信する送信手段と、利用者を識別する利用者識別手段と、その利用者識別手段で識別された利用者毎に前記音声認識手段の認識結果に基づいて認識対象語の使用頻度を算出する使用頻度算出手段と、を備え、
前記音声認識手段は、前記利用者識別手段で識別された利用者から発せられた認識対象語が、操作対象に対する認識対象語の後に動作を指示する認識対象語の場合、前記使用頻度算出手段で求められた動作を指示する認識対象語を認識し、前記送信手段は、前記動作を指示する認識対象語に対応するリモコン信号を送信するようになっていることを特徴とするリモコン装置。
Speech recognition means for recognizing a recognition target word included in speech uttered by a user by comparing with a recognition target word registered in advance, and a remote controller corresponding to the recognition target word recognized by the speech recognition means A transmission means for transmitting a signal, a user identification means for identifying a user, and a use frequency of a recognition target word is calculated based on a recognition result of the voice recognition means for each user identified by the user identification means. Use frequency calculation means to
The voice recognition means, before SL user recognition terms emitted from the identified user identification means, when the recognition target word instructing an operation after recognition terms with respect to the operating, the usage frequency calculation means A remote control device characterized by recognizing a recognition target word instructing the action obtained in step (b) and transmitting the remote control signal corresponding to the recognition target word instructing the action .
認識対象語を複数の操作対象のうちから所望の操作対象を指示するものと前記複数の操作対象の動作を指示するものとに分けて記憶し、その複数の操作対象の動作を指示する認識対象語を前記複数の操作対象に共通の動作を指示する認識対象語と前記複数の操作対象に固有の動作を指示する認識対象語とに分けて記憶する記憶手段を備え、前記音声認識手段は、利用者から発せられた音声に含まれる認識対象語を前記記憶手段に基づいて認識し、前記送信手段は、前記音声認識手段にて認識された所望の操作対象を指示する認識対象語と前記複数の操作対象の動作を指示する認識対象語との組み合わせに対応するリモコン信号を送信するようになっていることを特徴とする請求項1に記載のリモコン装置。  A recognition target word is stored separately for a plurality of operation targets that indicate a desired operation target and a plurality of operation targets that indicate an operation of the plurality of operation targets, and a recognition target that indicates the operations of the plurality of operation targets Storage means for storing a word separately into recognition target words for instructing operations common to the plurality of operation objects and recognition target words for instructing operations specific to the plurality of operation objects, and the speech recognition means, A recognition target word included in a voice uttered by a user is recognized based on the storage unit, and the transmission unit includes a recognition target word indicating a desired operation target recognized by the voice recognition unit and the plurality of recognition target words. 2. The remote control device according to claim 1, wherein a remote control signal corresponding to a combination with a recognition target word for instructing an operation of the operation target is transmitted. 利用者が指示できるリモコン操作に関する情報を表示する情報表示手段と、前記情報表示手段に表示されているリモコン操作に関する情報に基づいて、利用者に所望のリモコン操作を指示させる操作指示スイッチと、を備えた請求項1又は請求項2に記載のリモコン装置。  Information display means for displaying information related to a remote control operation that can be instructed by the user, and an operation instruction switch for instructing the user to perform a desired remote control operation based on information related to the remote control operation displayed on the information display means. The remote control device according to claim 1 or 2 provided. 前記音声認識手段の動作状態を表示する動作状態表示手段を備えた請求項1乃至請求項3のいずれかに記載のリモコン装置。  The remote control device according to claim 1, further comprising an operation state display unit that displays an operation state of the voice recognition unit.
JP2001030404A 2001-02-07 2001-02-07 Remote control device Expired - Lifetime JP3683502B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001030404A JP3683502B2 (en) 2001-02-07 2001-02-07 Remote control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001030404A JP3683502B2 (en) 2001-02-07 2001-02-07 Remote control device

Publications (2)

Publication Number Publication Date
JP2002232973A JP2002232973A (en) 2002-08-16
JP3683502B2 true JP3683502B2 (en) 2005-08-17

Family

ID=18894625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001030404A Expired - Lifetime JP3683502B2 (en) 2001-02-07 2001-02-07 Remote control device

Country Status (1)

Country Link
JP (1) JP3683502B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4413486B2 (en) * 2002-10-24 2010-02-10 株式会社ピートゥピーエー Home appliance control device, home appliance control method and program
JP2007235935A (en) * 2006-02-02 2007-09-13 Clever Planning:Kk Instrument controller
US20080091426A1 (en) * 2006-10-12 2008-04-17 Rod Rempel Adaptive context for automatic speech recognition systems
US20080169899A1 (en) * 2007-01-12 2008-07-17 Lear Corporation Voice programmable and voice activated vehicle-based appliance remote control
JP2007208981A (en) * 2007-01-30 2007-08-16 Clever Planning:Kk Infrared light emitting apparatus
JP2010055375A (en) * 2008-08-28 2010-03-11 Toshiba Corp Electronic apparatus operation instruction device and operating method thereof
KR101800201B1 (en) * 2017-07-25 2017-11-23 주식회사 탑시스템 Emote controller with speech recognition for adjusting updown and angle of television
DE102018108867A1 (en) * 2018-04-13 2019-10-17 Dewertokin Gmbh Control device for a furniture drive and method for controlling a furniture drive

Also Published As

Publication number Publication date
JP2002232973A (en) 2002-08-16

Similar Documents

Publication Publication Date Title
US6397186B1 (en) Hands-free, voice-operated remote control transmitter
US20070171091A1 (en) Environmental control system
KR100759003B1 (en) Universal remote controller and controller code setup method thereof
JP2005284492A (en) Operating device using voice
US12003804B2 (en) Information processing device, information processing method, and computer program
JP3683502B2 (en) Remote control device
KR20160026431A (en) Electronic apparatus having voice guiding function for bliend person, system having the same and voice guiding methods thereof
US20050212685A1 (en) Talking remote appliance-controller for the blind
US20080218372A1 (en) Light switch used as a communication device
JP2002247670A (en) Remote controller and mobile telephone
KR101026730B1 (en) Apparatus of operating elevator for the blind
JPH08272572A (en) Traveling object communication terminal
JPH05219575A (en) Remote controller
CN113314115B (en) Voice processing method of terminal equipment, terminal equipment and readable storage medium
JP2003219201A (en) Remote-controlled object apparatus, remote control system and image-processing apparatus
KR20140118588A (en) The voice recognition controlling system and controlling method of the same using voice recording
JP3341365B2 (en) Voice adapter
KR100877614B1 (en) Code setup method of universal remote controller
US20230223019A1 (en) Information processing device, information processing method, and program
WO2021095289A1 (en) Information processing device, information processing method, and program
JP7223423B2 (en) Remote control device and audiovisual equipment
KR100691992B1 (en) Mobile terminal outputting voice source depending on baby voice and voice source output method
KR102494051B1 (en) Electronic device for speech recognition and method thereof
JP2003228390A (en) Voice controller
JPH06233359A (en) Controller

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050525

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3683502

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080603

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term