Nothing Special   »   [go: up one dir, main page]

JP2011081541A - 入力装置及びその制御方法 - Google Patents

入力装置及びその制御方法 Download PDF

Info

Publication number
JP2011081541A
JP2011081541A JP2009232406A JP2009232406A JP2011081541A JP 2011081541 A JP2011081541 A JP 2011081541A JP 2009232406 A JP2009232406 A JP 2009232406A JP 2009232406 A JP2009232406 A JP 2009232406A JP 2011081541 A JP2011081541 A JP 2011081541A
Authority
JP
Japan
Prior art keywords
operation command
success rate
recognition
user
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009232406A
Other languages
English (en)
Other versions
JP5473520B2 (ja
JP2011081541A5 (ja
Inventor
Kazuhiro Matsubayashi
一弘 松林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009232406A priority Critical patent/JP5473520B2/ja
Publication of JP2011081541A publication Critical patent/JP2011081541A/ja
Publication of JP2011081541A5 publication Critical patent/JP2011081541A5/ja
Application granted granted Critical
Publication of JP5473520B2 publication Critical patent/JP5473520B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Details Of Television Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)
  • Position Input By Displaying (AREA)

Abstract

【課題】ユーザに対し操作コマンドの認識に成功する可能性を知らせることのできる入力装置及び入力装置の制御方法を提供する。
【解決手段】本発明の入力装置は、電子機器に接続又は内蔵される入力装置であって、ユーザの発する音及びユーザの動きのうち少なくともいずれかを認識して電子機器に対する操作コマンドへ変換する入力装置において、操作コマンドの認識成功率に影響を与える、入力装置の外部環境に関する情報を取得する環境取得手段と、外部環境ごとに、操作コマンドの認識成功率を表す情報を記憶している記憶手段と、環境取得手段により取得された情報と記憶手段に記憶された情報に基づいて、現在の外部環境における操作コマンドの認識成功率を取得する成功率取得手段と、成功率取得手段により取得された操作コマンドの認識成功率を表示部に表示する表示手段と、を有する。
【選択図】図2

Description

本発明は、ユーザの発する音及びユーザの動きのうち少なくともいずれかを認識して電子機器に対する操作コマンドへ変換する入力装置及び入力装置の制御方法に関する。
近年、ユーザの声やジェスチャ(例えば、手の形や動き)などを認識して電子機器に対する操作コマンドへ変換する技術が提案されている(例えば、特許文献1、非特許文献1参照)。このような技術を用いれば、リモコン、キーボード、タッチパネルなどを用いずに、電子機器を操作することが可能となる。
しかしながら、マイクロホンから入力される音声からユーザの声を認識して操作コマンドへ変換する場合、該入力される音声には、ユーザの声の他に、周囲の雑音(周りの人の声、自動車や電車の騒音、テレビ受信機の出力音声など)も含まれる虞がある。入力される音声にそのような雑音が含まれると、認識(音声認識)に失敗する可能性が高くなる。
また、デジタルカメラから入力される映像からジェスチャを認識して操作コマンドへ変換する場合、周囲の明るさが認識(ジェスチャ認識)に影響してしまう。例えば、暗い場所ではジェスチャ自体を認識することが困難となる。また、暗い場所でジェスチャを認識可能とするために、デジタルカメラの感度を上げると、撮影された映像中のノイズが増すため、認識に失敗する可能性が高くなる。
そのような問題に鑑みた従来技術として、例えば、特許文献2,3がある。
具体的には、特許文献2には、周囲の雑音を含む音声から音声認識が可能か否かを判定し、判定結果を文字列で表示する技術が開示されている。
特許文献3には、複数の特徴量(音声と唇の動きの特徴量)を、それぞれの信頼度(高いか低いか)に応じた重みで合成し、合成された特徴量を用いて認識処理を行う技術が開示されている。
特開昭63−209296号公報 特開平11−352995号公報 特開2006−30447号公報
入江耕太、若村直弘、梅田和昇「ジェスチャ認識を用いたインテリジェントルームの構築 ‐手のジェスチャによる家電製品の操作‐」 第21回日本ロボット学会学術講演会(2003年9月20日〜22日)2J15
ユーザがテレビを視聴していてリモコンが手元にない場合、音声認識に成功する可能性が高ければ音声で操作コマンドを入力する方が早いが、音声認識に成功する可能性が低ければリモコンを取りに行った方が早い。即ち、ユーザは、操作コマンドの入力を音声で行う手間と、リモコンを取りに行く手間とを比較して、操作手段を選択する。ジェスチャ認識についても同様であり、ユーザは、操作コマンドの入力をジェスチャで行う手間と、リモコンを取りに行く手間とを比較して、操作手段を選択する。
しかしながら、上記特許文献2,3に開示の技術では、音声認識やジェスチャ認識などに成功する可能性(操作コマンドの認識に成功する可能性)がユーザに通知されないため
、ユーザは上述したような比較をすることができない。
そこで、本発明は、ユーザに対し操作コマンドの認識に成功する可能性を知らせることのできる入力装置及び入力装置の制御方法を提供することを目的とする。
本発明の入力装置は、電子機器に接続又は内蔵される入力装置であって、ユーザの発する音及びユーザの動きのうち少なくともいずれかを認識して電子機器に対する操作コマンドへ変換する入力装置において、操作コマンドの認識成功率に影響を与える、入力装置の外部環境に関する情報を取得する環境取得手段と、外部環境ごとに、操作コマンドの認識成功率を表す情報を記憶している記憶手段と、環境取得手段により取得された情報と記憶手段に記憶された情報に基づいて、現在の外部環境における操作コマンドの認識成功率を取得する成功率取得手段と、成功率取得手段により取得された操作コマンドの認識成功率を表示部に表示する表示手段と、を有する。
本発明の入力装置の制御方法は、電子機器に接続又は内蔵される入力装置であって、ユーザの発する音及びユーザの動きのうち少なくともいずれかを認識して電子機器に対する操作コマンドへ変換する入力装置の制御方法において、操作コマンドの認識成功率に影響を与える、入力装置の外部環境に関する情報を取得する環境取得ステップと、外部環境ごとに、操作コマンドの認識成功率を表す情報を記憶している記憶手段に記憶された情報と、環境取得ステップで取得された情報とに基づいて、現在の外部環境における操作コマンドの認識成功率を取得する成功率取得ステップと、成功率取得ステップで取得された操作コマンドの認識成功率を表示部に表示する表示ステップと、を有する。
本発明によれば、ユーザに対し操作コマンドの認識に成功する可能性を知らせることのできる入力装置及び入力装置の制御方法を提供することができる。
本実施例に係るテレビ受信機の外観の一例を示す図。 実施例1に係る入力装置の機能構成の一例を示す図。 実施例1に係る入力装置の処理の流れの一例を示す図。 実施例1の認識履歴記憶部に記憶されている情報の一例を示す図。 認識成功率の表示方法の一例を示す図。 認識成功率の表示方法の一例を示す図。 実施例2に係る入力装置の機能構成の一例を示す図。 実施例2の認識履歴記憶部に記憶されている情報の一例を示す図。 認識成功率の表示方法の一例を示す図。
<実施例1>
以下、本発明の実施例1に係る入力装置及びその制御方法について説明する。本発明に係る入力装置は電子機器に接続又は内蔵されるものであり、本実施例では、入力装置を内蔵するテレビ受信機1について説明する(図1)。ユーザは、テレビ受信機1で、例えば、テレビ放送のコンテンツ、ビデオレコーダ、インターネットなどから取得されるコンテンツなどを視聴できる。メインディスプレイ2は、コンテンツの映像を表示し、スピーカ3は、コンテンツの音声を出力する。
また、ユーザは、ユーザの発する音やユーザの動きによって、テレビ受信機1を操作できる(詳細は後述する)。
人感センサ6は、人が現れたり去ったりしたことを検出する。人感センサ6は、例えば、赤外線センサによって構成される。これによって、テレビ受信機1の各デバイスの通電を必要に応じて制御することができ、消費電力を削減することができる。例えば、人(ユーザ)が去ったとき(即ち、ユーザがテレビ受信機1の周囲にいないとき)に各デバイスへの通電を絶つことにより、消費電力を削減することができる。
サブディスプレイ7は、テレビ受信機1に関する情報を必要に応じて表示する。上記情報は、メインディスプレイ2に表示しても構わないが、サブディスプレイ7に表示することでコンテンツの視聴の邪魔にならずに情報を表示することができる。また、電源スタンバイモード(メインディスプレイ2が通電されていない状態)において、サブディスプレイ7に情報を表示することができる。
図2は、本実施例に係る入力装置の機能構成を示すブロック図である。本実施例に係る入力装置は、ユーザの発する音及びユーザの動きのうち少なくともいずれかを認識して電子機器に対する操作コマンドに変換する。本実施例では、ユーザの発する音及びユーザの動きを認識して電子機器に対する操作コマンドに変換する。具体的には、ユーザの発する音としてユーザの声を認識し、ユーザの動きとしてジェスチャ(例えば、ユーザの手の形や動きなど)を認識する。
音声入力部11は、マイクロホン4から入力される音声をデジタル信号(デジタル音声信号)として音声認識部12へ出力する。
映像入力部13は、カメラ5(撮像装置)から入力される映像をデジタル信号(デジタル映像信号)としてジェスチャ認識部14へ出力する。
音声認識部12は、マイクロホン4から入力される音声からユーザの声を認識して操作コマンドに変換する(第1の認識処理;音声認識)。具体的には、音声認識部12は、デジタル音声信号から抽出した特徴データを所定の操作コマンドの特徴データとパターンマッチングすることで、入力される音声からユーザの声を認識して操作コマンドに変換する。例えば、「電源オフ」という声は、電子機器の電源をオフするための操作コマンドに変換される。また、「電源オン」という声は、電子機器の電源をオンするための操作コマンドに変換される。「音量アップ」、「音量ダウン」という声は、それぞれ、電子機器の音量をアップするための操作コマンド、電子機器の音量をダウンするための操作コマンドに変換される。「チャンネルアップ」、「チャンネルダウン」という声は、それぞれ、視聴するチャンネルをアップするための操作コマンド、視聴するチャンネルをダウンするための操作コマンドに変換される。
ジェスチャ認識部14は、カメラ5から入力される映像からジェスチャを認識して操作コマンドに変換する(第2の認識処理;ジェスチャ認識)。具体的には、ジェスチャ認識部14は、デジタル映像信号から抽出した特徴データを所定の操作コマンドの特徴データとパターンマッチングすることで、入力される映像からジェスチャを認識して操作コマンドに変換する。例えば、手を「ぐう」の形にするジェスチャは、電子機器の電源をオフするための操作コマンドに変換される。また、手を「ちょき」の形にするジェスチャは、電子機器の電源をオンするための操作コマンドに変換される。手を「上向き指差し」、「下向き指差し」の形にするジェスチャは、それぞれ、電子機器の音量をアップするための操作コマンド、電子機器の音量をダウンするための操作コマンドに変換される。手を「右向き指差し」、「左向き指差し」の形にするジェスチャは、それぞれ、視聴するチャンネルをアップするための操作コマンド、視聴するチャンネルをダウンするための操作コマンドに変換される。
ユーザの声(ユーザの発する音)を認識する構成においては、例えば、日常の会話の中で操作コマンドに対応する声(言葉)と同じ(または類似する)言葉が発せられた場合に
、その言葉が操作コマンドに誤変換されてしまう虞がある。ユーザの動きを認識する場合においても同様であり、日常の動きの中で操作コマンドに対応する動きと同じ(または類似する)動きが行われた場合に、その動きが操作コマンドに誤変換されてしまう虞がある。これを防ぐためには、入力装置が、自身の状態を、操作コマンド受け付け可能状態か操作コマンド受け付け不可能状態に切り換える機能(制御手段)を有していればよい。本実施例では、ユーザが開始操作を行うことで、後述の操作コマンド実行部15が、入力装置の状態を操作コマンド受け付け可能状態に切り換えるものとする。そして、ユーザの声やジェスチャは、入力装置の状態が操作コマンド受け付け可能状態のときにのみ操作コマンドへ変換される。開始操作は、例えば、「テレビ操作」などの声、「テレビに向かって指差し」などのジェスチャなどである。
なお、開始操作と操作コマンドの入力とは、同じ操作手段によって行われてもよいし、互いに異なる操作手段によって行われてもよい。例えば、開始操作と操作コマンドの入力の両方を音声認識で行ってもよいし、それら両方をジェスチャ認識で行ってもよい。開始操作と操作コマンドの入力の一方を音声認識で行い、他方をジェスチャ認識で行ってもよい。また、開始操作や操作コマンドの入力はリモコンを用いて行われてもよい。
操作コマンド実行部15は、認識された操作コマンドを実行することにより、テレビ受信機1を制御する。
認識結果表示部16は、サブディスプレイ7に認識された操作コマンドを表す文字列やアイコンを表示する。
ユーザは、操作コマンドの実行結果(操作コマンド実行後のテレビ受信機1の状態)や、サブディスプレイ7に表示された情報(認識された操作コマンドを表す文字列やアイコン)により、所望の操作コマンドが正しく実行されたか否かを判断することができる。所望の操作コマンドと異なる操作コマンドが実行されてしまった場合には、ユーザは、取消操作(例えば、「取り消し」などの音声、「手を横に振る」などのジェスチャなど)によって、テレビ受信機1の状態を操作コマンド実行前の状態に戻すことができる。
動作モード切換部17は、入力装置の動作モード(本実施例ではテレビ受信機1の動作モード)を、消費電力の異なる複数の動作モード(通常動作モード、省電力動作モード、電源スタンバイモード)のいずれかの動作モードに切り換える。動作モードは、ユーザ操作によって明示的に切り換えられてもよい。また、人感センサ6の検出結果、経過時間(例えば、所定の操作が行われた時点からの経過時間や所望の動作モードが選択された時点からの経過時間)、及び、時刻などに応じて自動的に切り換えられてもよい。
省電力動作モードでは、一部のセンサ(マイクロホン4やカメラ5)や回路が、低電圧や低動作クロックで動作する。それにより、通常動作モード時に比べ、センサの感度が低くなる(センサで生成される信号のレベルが小さくなったり、信号のサンプリング数が少なくなったりする)。そのため、操作コマンドの認識成功率(音声認識やジェスチャ認識に成功する可能性)が通常動作モード時よりも低くなる。
電源スタンバイモード(映像や音声を出力せず、電源オン操作を待っている状態)では、電源オン操作のみを受け付ける程度に消費電力が抑えられているため、操作コマンドの認識成功率が省電力動作モード時よりも低くなる。
即ち、上記複数の動作モードは、動作モードごとに操作コマンドの認識成功率が異なる。なお、動作モードの種類は3種類より少なくてもよいし、多くてもよい。
外部環境取得部18は、操作コマンドの認識成功率に影響を与える、入力装置の外部環境に関する情報を取得する。音声認識の認識成功率に影響を与える外部環境は、例えば、マイクロホン4から入力される音声の音量などである。ジェスチャ認識の認識成功率に影響を与える外部環境は、例えば、カメラ5で取得される映像の明るさなどである。
認識履歴記憶部19は、外部環境と動作モードの組み合わせごとに、操作コマンドの認識成功率を表す情報を記憶する。本実施例では、操作コマンドの認識成功率を表す情報と
して、操作コマンドの認識の成功及び失敗の履歴(認識成功数および認識失敗数)を記憶する。具体的には、図4に示すように、操作手段(音声認識、ジェスチャ認識)、動作モード、外部環境の組み合わせ毎に、認識成功数と認識失敗数を記憶する。認識成功数は、ユーザの声やジェスチャが正しく認識された回数であり、認識失敗数は、ユーザの声やジェスチャが正しく認識されなかった回数である。
また、本実施例では、操作コマンド実行部15が、操作コマンドの認識の成功及び失敗の履歴を、操作コマンドの認識成功率を表す情報として、外部環境と動作モードの組み合わせ毎に、認識履歴記憶部19に記録する機能(履歴記録手段)を有する。具体的には、操作コマンド実行部15は、認識成功数と認識失敗数を変更する。
認識成功率取得部20は、外部環境取得部18で取得された情報(外部環境に関する情報)、動作モードの情報、及び、認識履歴記憶部19に記憶された情報に基づいて、現在の外部環境と動作モードの組み合わせにおける操作コマンドの認識成功率を取得する。本実施例では、認識成功率取得部20は、認識履歴記憶部19に記録された認識の成功及び失敗の履歴から操作コマンドの認識成功率を算出(取得)する。具体的には、現在の外部環境と動作モードの組み合わせにおける、認識成功数/(認識成功数+認識失敗数)の値が操作コマンドの認識成功率として算出される。
ユーザの声やジェスチャを認識すればするほど、上記式の母数が増え、操作コマンドの認識成功率は或る値に収束する。しかし、母数が小さいうちは、操作コマンドの認識成功率は安定した値とならないため、工場出荷時の初期値として、複数のテストユーザの使用履歴に基づく値を認識履歴記憶部19に予め記憶しておくとよい。
認識成功率レベル表示部21は、認識成功率取得部20で取得された操作コマンドの認識成功率を表示部(サブディスプレイ7)に表示する。
本実施例では、第1の認識処理(音声認識)と第2の認識処理(ジェスチャ認識)のそれぞれについて、個別に、認識成功率を取得し、表示部に表示する。
以下、本実施例に係る入力装置の処理の流れについて、図3のフローチャートを用いて説明する。なお、以下の処理は操作手段(音声認識、ジェスチャ認識)毎に独立して行われる。
まず、認識成功率取得部20が、現在の外部環境に関する情報及び動作モードの情報を取得する(ステップS101)。本実施例では、動作モード切換部17から現在の動作モードの情報を取得するとともに、外部環境取得部18から現在の外部環境に関する情報を取得する。具体的には、動作モードの情報として、通常動作モード、省電力動作モード、電源スタンバイモードのいずれかを表す識別子を取得する。外部環境に関する情報として、マイクロホン4から入力された音声の音量や、カメラ5から入力された映像の明るさに応じた値を取得する。ただし、音量や明るさはリアルタイムに刻々と変化するため、外部環境に関する情報として、ある程度の期間(数秒間〜数分間)における音量や明るさの積分値や平均値を用いるのが好ましい。そして、外部環境に関する情報は、その値に応じて、数段階の値(例えば、図4に示すように、良、中、悪の3段階)に分類される。なお、外部環境に関する情報は2段階の値であってもよいし、4段階以上の値であってもよい。
次に、認識成功率取得部20が、現在の外部環境及び動作モードにおける操作コマンドの認識成功率を算出する(ステップS102)。
そして、認識成功率レベル表示部21が、ステップS102で算出された操作コマンドの認識成功率をサブディスプレイ7に表示する(ステップS103)。操作コマンドの認識成功率は、例えば、図1に示すように、レベルメータで表示(レベル表示)される。
ステップS104においてユーザの発声やジェスチャが行われたと判断されるまで、ステップS101〜S103の処理が繰り返される。なお、動作モードや外部環境が変化すると、ステップS102で算出される操作コマンドの認識成功率は変化し、ステップS103で表示されるレベルメータも変化する。
例えば、音声入力部11は、人間の話し声の周波数帯域の音声が所定値以上の音量で所定時間以上入力されたときに、発声が行われたと判断する。映像入力部13は、入力された映像から人物を抽出し、抽出された人物から手を検出する。そして、さらに手が動いたことが検出されたときに、ジェスチャが行われたと判断する。
ステップS104においてユーザの発声やジェスチャが行われたと判断された場合に、ステップS105へ進む。ステップS105では、音声認識部12やジェスチャ認識部14が、認識処理を行う。具体的には、ステップS104においてユーザの発声が行われたと判断された場合に、音声認識部12が認識処理(音声認識)を行い、ジェスチャが行われたと判断された場合に、ジェスチャ認識部14が認識処理(ジェスチャ認識)を行う。
次に、音声認識部12やジェスチャ認識部14が、入力装置の状態が操作コマンド受け付け可能状態か否かを判定する(ステップS106)。操作コマンド受け付け可能状態でない場合には(ステップS106:NO)、ステップS107へ進み、操作コマンド受け付け可能状態である場合には(ステップS106:YES)、ステップS109へ進む。
ステップS107では、音声認識部12やジェスチャ認識部14が、ステップS105での認識結果が開始操作を示すものか否か判定する。
開始操作を示すものであると判定された場合には(ステップS107:YES)、ステップS108へ進む。ステップS108では、操作コマンド実行部15が、入力装置の状態を操作コマンド受け付け可能状態に切り換える。操作コマンド受け付け可能状態においては、サブディスプレイ7に該状態であることを示す文字列やアイコンが表示される。
開始操作を示すものでないと判定された場合には(ステップS107:NO)、ユーザの行った発声やジェスチャが日常の会話や動きの中で行われたものであるとみなし、何も行わず、ステップS101へ戻る。
なお、本実施例では、操作コマンド受け付け可能状態において、ユーザの発声や動きが行われない時間や操作コマンドの入力、開始操作、取消操作が行われない時間が所定時間以上になった場合には、操作コマンド受け付け可能状態は解除される。
ステップS109,S110では、音声認識部12やジェスチャ認識部14が、ステップS105での認識結果が操作コマンドや取消操作を示すものか否かを判定する。
認識結果が操作コマンドを示すものであると判定された場合には(ステップS110:YES)、操作コマンド実行部15が該操作コマンドを実行する(ステップS111)。また、認識結果表示部16が、サブディスプレイ7に該操作コマンドを表す文字列やアイコンを表示する。
そして、操作コマンド実行部15が、操作コマンドを入力するために利用された操作手段と、現在の外部環境及び動作モードとの組み合わせに対応する認識成功数を1カウントアップし(ステップS112)、ステップS101へ戻る。
認識結果が操作コマンドや取消操作を示すものでないと判定された場合には(ステップS110:NO)、ステップS113へ進む。ステップS113では、操作コマンド実行部15が、利用された操作手段、現在の外部環境、及び、現在の動作モードの組み合わせに対応する認識失敗数を1カウントアップし、ステップS101へ戻る。このような構成にするのは、入力装置の状態が操作コマンド受け付け可能状態である場合に、ユーザの動きや発声はコマンド操作または取消操作を示すものである可能性が高く、そのように認識されないことは、認識に失敗した可能性が高いからである。
認識結果が取消操作を示すものであると判定された場合には(ステップS109:YES)、操作コマンド実行部15が、直前に操作コマンドが実行されたか否かを判定する(ステップS114)。
直前に操作コマンドが実行されていない場合には(ステップS114:NO)、ステッ
プS101へ戻る。なお、この場合には、認識結果が取消操作と誤認識されたものである可能性が高いため、認識失敗数を1カウントアップしてもよい。
直前に操作コマンドが実行されていた場合には(ステップS114:YES)、操作コマンド実行部15が、該直前の操作コマンドの実行を取り消す(ステップS115)。
そして、取り消された操作コマンドを入力するために利用された操作手段と、該操作コマンドの実行時の外部環境及び動作モードとの組み合わせに対応する認識成功数を1カウントダウンする(ステップS116)。即ち、取り消された操作コマンドの実行時に行ったカウントアップを取り消す。
次に、取り消された操作コマンドを入力するために利用された操作手段と、該操作コマンドの実行時の外部環境及び動作モードとの組み合わせに対応する認識失敗数を1カウントアップし(ステップS117)、ステップS101へ戻る。このような構成にするのは、取り消された操作コマンドは誤認識された操作コマンドである可能性が高いからである。
なお、取り消された操作コマンドを入力するために利用された操作手段と取消操作のために利用された操作手段は同じであってもよいし異なっていてもよい。例えば、直前の音声認識による操作コマンドを取り消すための取消操作は、音声認識、ジェスチャ認識、リモコン操作など、どの操作手段による操作であってもよい。認識処理の必要がない操作手段(例えばリモコン操作など)で取消操作を行う場合には、図3の処理は実行されないが、ステップS115〜S117の処理は同様に実行される。
以上の処理を繰り返すことにより、操作手段ごとに、現在の外部環境と動作モードの組み合わせにおける操作コマンドの認識成功率がレベルメータで表示される。それにより、ユーザは、各操作手段(音声認識、ジェスチャ認識)の認識成功率を把握することができ、各操作手段による電子機器の操作の手間を比較することが可能となる。
なお、本実施例では、操作コマンドの認識成功率を算出する構成としたが、操作コマンドの認識成功率は認識履歴記憶部19に予め記憶された固定値であってもよい。それにより、より簡易な構成で上記効果を得ることができる。
また、本実施例では外部環境の他に動作モードをさらに考慮したが、外部環境のみを考慮してもよい。外部環境のみを考慮しても上記効果を得ることができる。
なお、本実施例では認識成功率をレベルメータで表示するものとしたが、認識成功率はどのように表示してもよい。例えば、図5(A)のように数字で表示したり、図5(B)のようにアイコンの図柄(例えば、◎、○、△、×)で表示してもよい。また、ランプなどの色(例えば、青、緑、黄、橙、赤、非点灯)で表示してもよい。具体的には、図6(A)のように、音声認識(第1の認識処理)の認識成功率をランプ8の色、ジェスチャ認識(第2の認識処理)の認識成功率をランプ9の色で表示してもよい。
また、音声認識の認識成功率をマイクロホン4に近接する位置に表示し、ジェスチャ認識の認識成功率をカメラ5に近接する位置に表示してもよい。具体的には、図6(B)に示すように、マイクロホン4付近にランプ8を配置し、カメラ5付近にランプ9を配置してもよい。それにより、操作手段と認識成功率との対応を文字などで表示しなくてもユーザに直感的に理解させやすくすることができる。
なお、本実施例では認識成功率が常に表示される構成としたが、認識成功率レベル表示部21は、入力装置の状態が操作コマンド受け付け可能状態であるときのみ認識成功率を表示してもよい。それにより、ユーザは、操作コマンドの入力を行うとき以外に、コンテンツの視聴に集中することができる。
また、人感センサ6によって、人が現れたり去ったりしたことを検出して、適宜サブディスプレイ7やランプ8、ランプ9の点灯と消灯を切り換えるようにしてもよい。
なお、本実施例では、入力装置を内蔵するテレビ受信機1について説明したが、入力装置は、パーソナルコンピュータ、ハードディスクレコーダ、エアコン、冷蔵庫など、いかなる電子機器に接続または内蔵されてもよい。
なお、本実施例では、ユーザの声及びジェスチャを認識するものとしたが、いずれか一方を認識する構成であってもよいし、他の音や動き(ユーザの発する音やユーザの動き)を認識する構成であってもよい。例えば、ユーザの手叩きの音や、眼、口などの各器官の動きを検出してもよい。
なお、図3のステップS115で取り消される操作コマンドがリモコン操作によるものである可能性があるため、取り消される操作コマンドが音声認識やジェスチャ認識によるものか否かを判定してもよい。取り消された操作コマンドが、音声認識やジェスチャ認識によるものでない(リモコン操作などによるものである)場合には、認識成功数や認識失敗数を変更する必要はない。
<実施例2>
次に、本発明の実施例2に係る入力装置及びその制御方法について説明する。図7は、本実施例に係る入力装置の機能構成を示すブロック図である。本実施例に係る入力装置は、図2の構成のほかに、ユーザ識別部22とユーザ位置判定部23をさらに有する。
ユーザ識別部22は、ユーザを識別する。ユーザは、例えば、カメラ5で撮影した人物の顔を認識することにより識別されてもよいし、マイクロホン4で取得した音声の声紋を解析することにより識別されてもよい。なお、識別されるユーザは1人でもよいし、複数でもよい。
ユーザ位置判定部23は、ユーザの位置を判定する。具体的には、赤外線センサやカメラを用いて、テレビ受信機1からユーザまでの距離や角度を測定する。上記測定に用いる赤外線センサやカメラは、カメラ5や人感センサ6が兼ねてもよいし、別途設けてもよい。
以下、本実施例に係る入力装置の処理の流れについて図3のフローチャートを用いて説明する。基本的な処理の流れは実施例1と同様のため、ここでは実施例1と異なる点について説明する。
ステップS101では、認識成功率取得部20が、現在の外部環境に関する情報、動作モードの情報、ユーザの識別情報、及び、ユーザの位置情報を取得する。具体的には、実施例1と同様に、動作モード切換部17から現在の動作モードの情報を取得するとともに、外部環境取得部18から現在の外部環境に関する情報を取得する。更に、本実施例では、ユーザ識別部22から現在のユーザの識別情報を取得し、ユーザ位置判定部23から現在のユーザの位置情報を取得する。
ステップS102では、認識成功率取得部20が、現在の外部環境、動作モード、ユーザ、及び、ユーザの位置における認識成功率を算出する。本実施例の認識履歴記憶部19には、図8に示すように、操作手段、動作モード、外部環境、ユーザ、ユーザの位置の組み合わせごとに、認識成功数と認識失敗数の値がそれぞれ記憶されている。なお、図8には、ユーザが「A」と「B」の2人の例を示しているが、1人分だけ記憶されていてもよいし、3人以上について記憶されていてもよい。また、図8は、ユーザの位置が「近」と「遠」の2段階に分類される例を示しているが、3段階以上に分類されてもよい。距離と角度の組み合わせによって分類されてもよい。
ステップS103では、認識成功率レベル表示部21が、ステップS102で算出された操作コマンドの認識成功率をサブディスプレイ7に表示する。本実施例では、認識成功率レベル表示部21は、識別されたユーザに対する操作コマンドの認識成功率を表示する
。複数のユーザが識別された場合には、例えば、図9(A)に示すように、ユーザ毎の認識成功率を同時に表示する。ユーザ毎の認識成功率を同時に表示しきれない場合には、図9(B)に示すように、所定時間ごとに表示するユーザ及びそのユーザについての認識成功率を切り換えればよい。
ステップS112,S113,S116,S117においてカウントアップ、カウントダウンの対象となる操作コマンドを入力したユーザは、例えば、以下のように特定される。カウントアップ、カウントダウンの対象となる操作コマンドを入力するために利用された操作手段が音声認識の場合には、声紋の解析や撮影した顔の唇の動きを解析することで特定される。カウントアップ、カウントダウンの対象となる操作コマンドを入力するために利用された操作手段がジェスチャ認識の場合には、ジェスチャを行った人物の顔を認識することで特定される。
以上の処理を繰り返すことにより、操作手段ごとに、現在の外部環境、動作モード、ユーザ、及び、ユーザの位置の組み合わせにおける操作コマンドの認識成功率がレベルメータで表示される。それにより、ユーザは、各操作手段(音声認識、ジェスチャ認識)の認識成功率を把握することができ、各操作手段による電子機器の操作の手間を比較することが可能となる。
なお、本実施例では、実施例1に比べ、ユーザとユーザの位置をさらに考慮したが、ユーザとユーザの位置のいずれか一方をさらに考慮した構成であってもよい。また、外部環境とユーザ、または、外部環境とユーザの位置を考慮した構成であってもよい。また、上慮するパラメータはこれらに限らない。操作コマンドの認識成功率に影響を与えるパラメータであればどのようなパラメータを考慮してもよい。
18 外部環境取得部
19 認識履歴記憶部
20 認識成功率取得部
21 認識成功率レベル表示部

Claims (9)

  1. 電子機器に接続又は内蔵される入力装置であって、ユーザの発する音及びユーザの動きのうち少なくともいずれかを認識して前記電子機器に対する操作コマンドへ変換する入力装置において、
    操作コマンドの認識成功率に影響を与える、前記入力装置の外部環境に関する情報を取得する環境取得手段と、
    外部環境ごとに、操作コマンドの認識成功率を表す情報を記憶している記憶手段と、
    前記環境取得手段により取得された情報と前記記憶手段に記憶された情報に基づいて、現在の外部環境における操作コマンドの認識成功率を取得する成功率取得手段と、
    前記成功率取得手段により取得された操作コマンドの認識成功率を表示部に表示する表示手段と、
    を有することを特徴とする入力装置。
  2. 操作コマンドの認識の成功及び失敗の履歴を、前記操作コマンドの認識成功率を表す情報として、外部環境ごとに前記記憶手段に記録する履歴記録手段をさらに有し、
    前記成功率取得手段は、前記記憶手段に記録された認識の成功及び失敗の履歴から認識成功率を算出する
    ことを特徴とする請求項1に記載の入力装置。
  3. マイクロホンから入力される音声からユーザの発する音を認識して操作コマンドへ変換する第1の認識処理を行う第1の認識手段と、
    撮像装置から入力される映像からユーザの動きを認識して操作コマンドへ変換する第2の認識処理を行う第2の認識手段と、をさらに有し、
    前記第1の認識処理と第2の認識処理のそれぞれについて、個別に、現在の外部環境における認識成功率が表示される
    ことを特徴とする請求項1または2に記載の入力装置。
  4. 前記第1の認識処理の認識成功率は、前記マイクロホンに近接する位置に表示され、
    前記第2の認識処理の認識成功率は、前記撮像装置に近接する位置に表示される
    ことを特徴とする請求項3に記載の入力装置。
  5. 前記入力装置の状態を、操作コマンド受け付け可能状態か操作コマンド受け付け不可能状態に切り換える制御手段をさらに有し、
    前記表示手段は、前記入力装置の状態が前記操作コマンド受け付け可能状態であるときにのみ、前記認識成功率を表示部に表示する
    ことを特徴とする請求項1〜4のいずれか1項に記載の入力装置。
  6. 前記入力装置は、消費電力の異なる複数の動作モードを有し、動作モードごとに操作コマンドの認識成功率が異なっており、
    前記記憶手段は、さらに動作モードごとに、操作コマンドの認識成功率を表す情報を記憶しており、
    前記成功率取得手段は、現在の動作モードをさらに考慮して、現在の外部環境における操作コマンドの認識成功率を取得する
    ことを特徴とする請求項1〜5のいずれか1項に記載の入力装置。
  7. ユーザを識別するユーザ識別手段をさらに有し、
    前記記憶手段は、さらにユーザごとに、操作コマンドの認識成功率を表す情報を記憶しており、
    前記成功率取得手段は、前記ユーザ識別手段により識別された現在のユーザをさらに考
    慮して、現在の外部環境における操作コマンドの認識成功率を取得する
    ことを特徴とする請求項1〜6のいずれか1項に記載の入力装置。
  8. ユーザの位置を判定する位置判定手段をさらに有し、
    前記記憶手段は、さらにユーザの位置ごとに、操作コマンドの認識成功率を表す情報を記憶しており、
    前記成功率取得手段は、前記位置判定手段により判定された現在のユーザの位置をさらに考慮して、現在の外部環境における操作コマンドの認識成功率を取得する
    ことを特徴とする請求項1〜7のいずれか1項に記載の入力装置。
  9. 電子機器に接続又は内蔵される入力装置であって、ユーザの発する音及びユーザの動きのうち少なくともいずれかを認識して前記電子機器に対する操作コマンドへ変換する入力装置の制御方法において、
    操作コマンドの認識成功率に影響を与える、前記入力装置の外部環境に関する情報を取得する環境取得ステップと、
    外部環境ごとに、操作コマンドの認識成功率を表す情報を記憶している記憶手段に記憶された情報と、前記環境取得ステップで取得された情報とに基づいて、現在の外部環境における操作コマンドの認識成功率を取得する成功率取得ステップと、
    前記成功率取得ステップで取得された操作コマンドの認識成功率を表示部に表示する表示ステップと、
    を有することを特徴とする入力装置の制御方法。
JP2009232406A 2009-10-06 2009-10-06 入力装置及びその制御方法 Expired - Fee Related JP5473520B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009232406A JP5473520B2 (ja) 2009-10-06 2009-10-06 入力装置及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009232406A JP5473520B2 (ja) 2009-10-06 2009-10-06 入力装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2011081541A true JP2011081541A (ja) 2011-04-21
JP2011081541A5 JP2011081541A5 (ja) 2012-11-08
JP5473520B2 JP5473520B2 (ja) 2014-04-16

Family

ID=44075547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009232406A Expired - Fee Related JP5473520B2 (ja) 2009-10-06 2009-10-06 入力装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP5473520B2 (ja)

Cited By (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101228643B1 (ko) * 2011-08-24 2013-01-31 한국과학기술원 움직임 검출 장치 및 방법, 이를 이용한 음향 및 영상 장치
JP2013037689A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法
JP2013037454A (ja) * 2011-08-05 2013-02-21 Ikutoku Gakuen 姿勢判定方法、プログラム、装置、システム
JP2013037688A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法
JP2013041580A (ja) * 2011-08-05 2013-02-28 Samsung Electronics Co Ltd 電子装置及びその制御方法
JP2013080015A (ja) * 2011-09-30 2013-05-02 Toshiba Corp 音声認識装置および音声認識方法
WO2013069936A1 (en) * 2011-11-07 2013-05-16 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling thereof
WO2013122310A1 (en) * 2012-02-17 2013-08-22 Lg Electronics Inc. Method and apparatus for smart voice recognition
WO2014065254A1 (ja) * 2012-10-25 2014-05-01 京セラ株式会社 携帯端末装置および入力操作受け付け方法
WO2015097568A1 (en) * 2013-12-24 2015-07-02 Sony Corporation Alternative camera function control
WO2015118578A1 (ja) * 2014-02-10 2015-08-13 三菱電機株式会社 マルチモーダル入力装置、端末装置およびマルチモーダル入力装置のタイムアウト制御方法
JP2015194766A (ja) * 2015-06-29 2015-11-05 株式会社東芝 音声認識装置および音声認識方法
WO2016039992A1 (en) * 2014-09-12 2016-03-17 Apple Inc. Dynamic thresholds for always listening speech trigger
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
JP2017120609A (ja) * 2015-12-24 2017-07-06 カシオ計算機株式会社 感情推定装置、感情推定方法及びプログラム
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9953654B2 (en) 2014-05-20 2018-04-24 Samsung Electronics Co., Ltd. Voice command recognition apparatus and method
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
WO2021044569A1 (ja) * 2019-09-05 2021-03-11 三菱電機株式会社 音声認識補助装置および音声認識補助方法
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
CN112786036A (zh) * 2019-11-04 2021-05-11 海信视像科技股份有限公司 显示设备与内容显示方法
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US12010262B2 (en) 2013-08-06 2024-06-11 Apple Inc. Auto-activating smart responses based on activities from remote devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240291A (ja) * 1996-12-26 1998-09-11 Seiko Epson Corp 音声認識装置における音声入力可能状態報知方法及びその装置
JP2000338991A (ja) * 1999-05-25 2000-12-08 Nec Saitama Ltd 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法
WO2008069519A1 (en) * 2006-12-04 2008-06-12 Electronics And Telecommunications Research Institute Gesture/speech integrated recognition system and method
JP2009218910A (ja) * 2008-03-11 2009-09-24 Mega Chips Corp 遠隔制御可能機器
JP2010511958A (ja) * 2006-12-04 2010-04-15 韓國電子通信研究院 ジェスチャー/音声統合認識システム及び方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240291A (ja) * 1996-12-26 1998-09-11 Seiko Epson Corp 音声認識装置における音声入力可能状態報知方法及びその装置
JP2000338991A (ja) * 1999-05-25 2000-12-08 Nec Saitama Ltd 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法
WO2008069519A1 (en) * 2006-12-04 2008-06-12 Electronics And Telecommunications Research Institute Gesture/speech integrated recognition system and method
JP2010511958A (ja) * 2006-12-04 2010-04-15 韓國電子通信研究院 ジェスチャー/音声統合認識システム及び方法
JP2009218910A (ja) * 2008-03-11 2009-09-24 Mega Chips Corp 遠隔制御可能機器

Cited By (242)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US12087308B2 (en) 2010-01-18 2024-09-10 Apple Inc. Intelligent automated assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
JP2013037689A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法
US9002714B2 (en) 2011-08-05 2015-04-07 Samsung Electronics Co., Ltd. Method for controlling electronic apparatus based on voice recognition and motion recognition, and electronic apparatus applying the same
US9733895B2 (en) 2011-08-05 2017-08-15 Samsung Electronics Co., Ltd. Method for controlling electronic apparatus based on voice recognition and motion recognition, and electronic apparatus applying the same
JP2013037454A (ja) * 2011-08-05 2013-02-21 Ikutoku Gakuen 姿勢判定方法、プログラム、装置、システム
JP2013041580A (ja) * 2011-08-05 2013-02-28 Samsung Electronics Co Ltd 電子装置及びその制御方法
JP2013037688A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法
KR101228643B1 (ko) * 2011-08-24 2013-01-31 한국과학기술원 움직임 검출 장치 및 방법, 이를 이용한 음향 및 영상 장치
JP2013080015A (ja) * 2011-09-30 2013-05-02 Toshiba Corp 音声認識装置および音声認識方法
WO2013069936A1 (en) * 2011-11-07 2013-05-16 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling thereof
JP2014532933A (ja) * 2011-11-07 2014-12-08 サムスン エレクトロニクス カンパニー リミテッド 電子装置及びその制御方法
CN104169837A (zh) * 2012-02-17 2014-11-26 Lg电子株式会社 用于智能语音识别的方法和设备
WO2013122310A1 (en) * 2012-02-17 2013-08-22 Lg Electronics Inc. Method and apparatus for smart voice recognition
US8793136B2 (en) 2012-02-17 2014-07-29 Lg Electronics Inc. Method and apparatus for smart voice recognition
US9229681B2 (en) 2012-02-17 2016-01-05 Lg Electronics Inc. Method and apparatus for smart voice recognition
US8793138B2 (en) 2012-02-17 2014-07-29 Lg Electronics Inc. Method and apparatus for smart voice recognition
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9760165B2 (en) 2012-10-25 2017-09-12 Kyocera Corporation Mobile terminal device and input operation receiving method for switching input methods
JP2014085954A (ja) * 2012-10-25 2014-05-12 Kyocera Corp 携帯端末装置、プログラムおよび入力操作受け付け方法
WO2014065254A1 (ja) * 2012-10-25 2014-05-01 京セラ株式会社 携帯端末装置および入力操作受け付け方法
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US12073147B2 (en) 2013-06-09 2024-08-27 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US12010262B2 (en) 2013-08-06 2024-06-11 Apple Inc. Auto-activating smart responses based on activities from remote devices
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
WO2015097568A1 (en) * 2013-12-24 2015-07-02 Sony Corporation Alternative camera function control
WO2015118578A1 (ja) * 2014-02-10 2015-08-13 三菱電機株式会社 マルチモーダル入力装置、端末装置およびマルチモーダル入力装置のタイムアウト制御方法
US9953654B2 (en) 2014-05-20 2018-04-24 Samsung Electronics Co., Ltd. Voice command recognition apparatus and method
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US10714095B2 (en) 2014-05-30 2020-07-14 Apple Inc. Intelligent assistant for home automation
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
JP2017537361A (ja) * 2014-09-12 2017-12-14 アップル インコーポレイテッド 発語トリガを常時リッスンするための動的閾値
WO2016039992A1 (en) * 2014-09-12 2016-03-17 Apple Inc. Dynamic thresholds for always listening speech trigger
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
JP2015194766A (ja) * 2015-06-29 2015-11-05 株式会社東芝 音声認識装置および音声認識方法
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
JP2017120609A (ja) * 2015-12-24 2017-07-06 カシオ計算機株式会社 感情推定装置、感情推定方法及びプログラム
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10847142B2 (en) 2017-05-11 2020-11-24 Apple Inc. Maintaining privacy of personal information
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US12080287B2 (en) 2018-06-01 2024-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
JPWO2021044569A1 (ja) * 2019-09-05 2021-12-09 三菱電機株式会社 音声認識補助装置および音声認識補助方法
WO2021044569A1 (ja) * 2019-09-05 2021-03-11 三菱電機株式会社 音声認識補助装置および音声認識補助方法
JP7242873B2 (ja) 2019-09-05 2023-03-20 三菱電機株式会社 音声認識補助装置および音声認識補助方法
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
CN112786036A (zh) * 2019-11-04 2021-05-11 海信视像科技股份有限公司 显示设备与内容显示方法
CN112786036B (zh) * 2019-11-04 2023-08-08 海信视像科技股份有限公司 显示设备与内容显示方法
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction

Also Published As

Publication number Publication date
JP5473520B2 (ja) 2014-04-16

Similar Documents

Publication Publication Date Title
JP5473520B2 (ja) 入力装置及びその制御方法
JP7425349B2 (ja) 機器制御システム
JP6525496B2 (ja) ディスプレイ装置、ディスプレイ装置を制御する遠隔制御装置、ディスプレイ装置の制御方法、サーバーの制御方法、及び遠隔制御装置の制御方法
US6353764B1 (en) Control method
CN106463114B (zh) 信息处理设备、控制方法及程序存储单元
CN108604447B (zh) 信息处理装置、信息处理方法和程序
KR102339657B1 (ko) 전자 장치 및 이의 제어 방법
JP2005284492A (ja) 音声利用操作装置
US9824688B2 (en) Method for controlling speech-recognition text-generation system and method for controlling mobile terminal
WO2017168936A1 (ja) 情報処理装置、情報処理方法、及びプログラム
US20150279369A1 (en) Display apparatus and user interaction method thereof
JP2009229899A (ja) 音声認識装置および音声認識方法
JP2013080015A (ja) 音声認識装置および音声認識方法
WO2017141530A1 (ja) 情報処理装置、情報処理方法、及びプログラム
US20140214430A1 (en) Remote control system and device
JP2018036902A (ja) 機器操作システム、機器操作方法および機器操作プログラム
JP2009087074A (ja) 機器制御システム
JP2004303251A (ja) 制御方法
US11657821B2 (en) Information processing apparatus, information processing system, and information processing method to execute voice response corresponding to a situation of a user
US20190035420A1 (en) Information processing device, information processing method, and program
JP2004289850A (ja) 制御方法、機器制御装置、及びプログラム記録媒体
KR102729027B1 (ko) 전자 장치 및 그 동작 방법
KR20220072621A (ko) 전자장치 및 그 제어방법
JP2004282770A (ja) 制御方法
JP2014048748A (ja) 制御装置、制御装置の制御方法及び制御プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120926

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120926

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140204

R151 Written notification of patent or utility model registration

Ref document number: 5473520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees