JP2021092612A

JP2021092612A - コマンド制御装置、制御方法および制御プログラム

Info

Publication number: JP2021092612A
Application number: JP2019221573A
Authority: JP
Inventors: 知浜田; Satoru Hamada; 大高橋; Masaru Takahashi
Original assignee: TVS Regza Corp
Current assignee: TVS Regza Corp
Priority date: 2019-12-06
Filing date: 2019-12-06
Publication date: 2021-06-17
Anticipated expiration: 2039-12-06
Also published as: JP7229906B2; WO2021109839A1; CN113228166A; CN113228166B

Abstract

【課題】音声コマンドに対する音声認識を支援する。【解決手段】一実施形態に係るコマンド制御装置は、入力された音声に基づいて制御対象機器に対する制御命令を含む実行コマンドを生成するコマンド制御装置において、前記音声を音声認識して得た認識コマンドに含まれる第１の制御命令と、前記第１の制御命令と異なる第２の制御命令とのいずれかを含む実行コマンドを生成する。【選択図】図６

Description

実施形態は、コマンド制御装置、制御方法および制御プログラムに関する。

近年、音声認識を用いて音声で機器を制御する音声制御技術が検討されている。例えば、音声制御技術はテレビのリモコンの代わりに用いることができ、ユーザが制御命令であるコマンドを発声すると、コマンドの重畳した声（以降、音声コマンドと称する）がテレビに付属するマイクなどで受波され、音声認識によってコマンドがデータとして取り出される。取り出されたコマンドデータがテレビで実行されるコマンドとなる。この技術においては、周囲の騒音などの影響により、ユーザの発した音声コマンドが音声認識によって間違ったコマンドとして認識されることがあり、音声認識の性能の向上が検討されている。

特開２０１７−１６７２４７号公報

しかしながら、周囲の騒音の大きさによっては音声認識がうまく機能せず、音声制御技術を適用できる範囲が限定されることがある。また、そのため平時には動作していた音声制御技術による制御が、地震など緊急時に騒音が大きくなって正常に動作しなくなることが起こりうる。

本発明が解決しようとする課題は、音声コマンドに対する音声認識を支援するコマンド制御装置、制御方法および制御プログラムを提供することである。

一実施形態に係るコマンド制御装置は、入力された音声に基づいて制御対象機器に対する制御命令を含む実行コマンドを生成するコマンド制御装置において、前記音声を音声認識して得た認識コマンドに含まれる第１の制御命令と、前記第１の制御命令と異なる第２の制御命令とのいずれかを含む実行コマンドを生成する。

図１は、第１の実施形態に係るシステム全体の構成例を示した図である。図２は、同実施形態に係る受信装置の機能構成の一例を示すブロック図である。図３は、同実施形態に係るコマンド制御部の機能構成の一例を示すブロック図である。図４は、同実施形態において、音声コマンドにより制御できる制御対象部位と制御対象部位の状態の一例を示す図である。図５は、同実施形態において、利用可能な補助情報の一例を示す図である。図６は、同実施形態において、コマンド制御部が音声コマンドを受信して実行コマンドを送信するための処理動作例を示すフローチャートである。図７は、同実施形態において、メイン電源を制御するためにコマンド制御部に設定する実行コマンド生成条件の一例を示す図である。図８は、第２の実施形態において、音量を制御するためにコマンド制御部に設定する実行コマンド生成条件の一例を示す図である。図９は、第３の実施形態において、デジタルコンテンツ受信を制御するためにコマンド制御部に設定する実行コマンド生成条件の一例を示す図である。図１０は、第４の実施形態に係るシステム全体の構成例を示した図である。

以下、実施の形態について図面を参照して説明する。

図１は、実施形態に係るシステム全体の構成例を示した図である。

受信装置１０は、デジタルコンテンツを視聴する機器であり、例えば、２Ｋまたは４Ｋ／８Ｋといった地上波放送、衛星放送などのデジタル放送を受信し視聴可能なテレビ受信装置（テレビ装置、テレビジョン受信機、放送信号受信装置とも称される）である。また受信装置１０は、例えばインターネットなどのネットワーク５００に接続するための外部インターフェースを備え、ネットワーク５００に接続されるコンテンツサーバ装置２００（クラウドサーバとしてもよい）が提供するデジタルコンテンツを視聴することが可能である。また、受信装置１０は、録画再生機能を有していてもよく、録画再生機能により受信装置１０にて録画したデジタルコンテンツを視聴可能である。また受信装置１０に図示せぬ録画再生装置が接続されることで、図示せぬ録画再生装置が録画したデジタルコンテンツを視聴可能としてもよい。なお、図１では、１つの受信装置１０を示したが、さらに多数の受信装置１０が接続されてよい。ただし受信装置１０は、デジタルコンテンツを受信可能な機器であれば、全てが同じ機能を有する必要はない。具体的には、視聴可能なモニタのない録画のみができるレコーダや放送信号を受信可能なＳｅｔＴｏｐＢｏｘ（ＳＴＢ）などでもよい。テレビ装置やレコーダ、ＳＴＢなどを総称して受信装置１０と称する。

本実施形態においては、特にテレビ装置の例を示すが、テレビ装置をレコーダ、ＳＴＢなどの受信装置１０に置き換えてもよい。また、受信装置１０は、同様の受信機能を持つ装置として、パーソナルコンピュータやスマートフォンなどモバイル機器でもよい。

本実施形態の受信装置１０は、音声認識を用いた音声による制御が可能である。コマンド制御部１は、例えばユーザが発声した音声コマンドを音声認識し、音声認識により得たコマンド（以降、認識コマンドと称する）を用いて受信装置１０内の各機能を制御する。また、リモコン１００は受信装置１０を遠隔制御するリモートコントローラーである。

また、受信装置１０は、受信装置１０によって視聴されたデジタルコンテンツの視聴履歴（以降、視聴データと称する）を収集し記憶できる。また、受信装置１０に固有のデータ（以降、機器個別データと称する）を記憶できる。視聴データと機器個別データを含めて視聴機器データと称する。受信装置１０は、視聴機器データなどの保存データをネットワーク５００に接続される視聴解析装置３００に出力し、視聴解析装置３００が実施した視聴機器データに対する解析結果を受信することができる。

本実施形態における「視聴」とは、ユーザが実際に視聴していなくても、視聴可能な状態にデジタルコンテンツを受信する、または、受信した状態もしくは録画した状態を含む。従って、本実施形態における「視聴履歴」は、例えば、ＳＴＢなど受信装置が、単に受信してはいるが、視聴の有無を問わない「受信履歴」や、受信装置がレコーダであった場合には、受信装置で受信され、録画予約された、または、録画がされた「録画履歴」等を含む。また同様に本実施形態における「視聴時間」は、例えば、ＳＴＢなど受信装置がデジタルコンテンツを受信した時間や、受信装置がレコーダであった場合には、デジタルコンテンツを録画がされた時間等を含む。

従って、受信装置１０をレコーダ、ＳＴＢなどの受信装置に置き換えた場合に、レコーダ、ＳＴＢなどの受信装置が生成した受信ログデータや、ダウンロード履歴データ、録画データなども視聴機器データに含める。

機器個別データは、例えば、受信装置１０のリモコン１００を使ってユーザが受信装置１０に登録してもよいし、受信装置１０の固体番号のようにメーカが設定する場合もある。機器個別データは、例えば、受信装置１０のＩＰアドレスや、識別番号、また予め所有者などにより登録されるデモグラフィックデータ（以降、デモグラと称する）などが含まれる。デモグラとは、受信装置１０を視聴するユーザを分類するデータであり、例えば、ユーザの年齢、性別、家族構成、居住地域などの情報である。識別番号は、異なる受信装置１０を識別する番号、文字列などであり、例えば数字、アルファベットの組み合わせから構成されている。

コンテンツサーバ装置２００は、デジタルコンテンツを提供するネットワーク上もしくはクラウドサーバである。コンテンツサーバ装置２００は、例えば、コンテンツサービスプロバイダ（ＣＳＰ）や通信事業者、また、その他ＯｖｅｒＴｈｅＴｏｐ（ＯＴＴ）と呼ばれるデジタルコンテンツのサービス事業者などによって提供される。ＶｉｄｅｏＯｎＤｅｍａｎｄといったサービスを提供するサーバもコンテンツサーバ装置２００に含まれる。

視聴解析装置３００は、ネットワーク上もしくはクラウド上に存在し、受信装置１０が記憶する視聴機器データを収集し、記憶し、さらに記憶したデータを解析して各種の視聴解析を行い、例えば解析を要求した受信装置１０に解析結果を出力する装置である。視聴解析装置３００は、例えばＣＰＵやメモリなどを有したコンピュータに構築されてもよい。視聴解析装置３００は、パーソナルコンピュータであっても良いし、サーバ、データベースなどによるクラウドサービスであっても良い。

また、視聴解析装置３００は、受信装置１０が個別に持つ識別番号により個々の受信装置１０を識別して、受信装置１０個別の視聴解析を行うことができてもよい。

音声認識装置４００は、ネットワーク５００上に設置される。音声認識装置４００は、例えばＣＰＵやメモリなどを有したコンピュータに構築される。音声認識装置４００は、パーソナルコンピュータであっても良いし、クラウドサーバであっても良い。音声認識装置４００は、マイクロフォンなどが受波したユーザの音声に対する音声波形のデジタルデータ（以降、音声データと称する）を、ネットワーク５００を介して受信し、ユーザの発したコマンドを推定もしくは認識し、認識したコマンド（認識コマンド）をテキストデータとして出力する。音声認識装置４００においては、ユーザが制御対象に発するコマンドを予めテキストデータとしてリスト化しており、受信した音声データから得たテキストデータとリストのテキストデータとを比較して、リスト中の最も近いコマンドを選択して、選択したコマンドのテキストデータを出力することでもよい。ただし、音声認識装置４００における音声認識の方法はこの方法に限定されない。

また、音声認識装置４００は、音声データをテキスト化（文字化、言語化など）した音声テキストを生成するＳｐｅｅｃｈＴｏＴｅｘｔサーバ（以降、ＳＴＴサーバと称する）と、生成された音声テキストとリスト化されたコマンドの中から最も近いコマンドを認識コマンドとして生成するリモート認識サーバから構成されていてもよい。具体的には、リモート認識サーバが、予め図示せぬ記憶部などに登録しておいたコマンドリストを参照して、ＳＴＴサーバが生成した音声テキストと一致したコマンドもしくはリストの中で最も近いコマンドを認識コマンドとして、出力するようにしてもよい。

ネットワーク５００は、受信装置１０、コンテンツサーバ装置２００、視聴解析装置３００、視聴解析装置３００が接続されて、各装置が通信可能となるネットワークであり、例えば、インターネットである。また、ネットワーク５００はインターネットだけとは限らず、各装置が通信可能であれば複数の異なるネットワークを含むネットワークでもよい。

図２は、実施形態に係る受信装置１０の機能構成の一例を示すブロック図である。

受信装置１０は、デジタルコンテンツが重畳される信号を受信処理してデジタルコンテンツを取得して視聴する機器である。

放送信号受信処理部２０は、アンテナ１０１から受波したデジタル放送などの放送信号を、デジタル放送の規格に応じ処理し、映像、音声、文字などのコンテンツデータを取得し出力する。デジタル放送の規格は、例えば、２Ｋデジタル放送にて採用されているＭＰＥＧ２ＴＳ方式や、４Ｋ／８Ｋデジタル放送にて採用されているＭＰＥＧＭｅｄｉａＴｒａｎｐｏｒｔ方式（ＭＭＴ方式）などでもよく、複数のチューナにより双方に対応していてもよい。デジタル放送の規格に応じた処理としては、デジタルデータストリームを、映像、音声、文字などのコンテンツデータのデジタルデータストリームに分離するデマルチプレクシング処理、誤り訂正符号復号処理、暗号化されたデータを復号する暗号復号化処理、各コンテンツデータに対して施された符号化（映像符号化、音声符号化、文字符号化など）に対する復号化処理などを含む。

補助情報出力部２１は、制御部９０によって要求された情報を放送信号から抽出し、制御部９０に出力する。補助情報出力部２１は、特に放送信号に含まれる制御情報や番組関連情報などから要求された情報を抽出し、制御部９０に出力する。制御部９０に出力された情報は、必要に応じて加工が施され、補助情報としてコマンド制御部１にて使用される。

コンテンツ処理部３０は、通信部１０２から入力されるデジタルデータに対して、コンテンツサーバ装置２００が施した符号化処理に対する復号化処理などを実施し、映像、音声、文字などのコンテンツデータを出力する。具体的には、コンテンツ処理部３０は、復号化処理として、例えば、デマルチプレクシング処理（分離処理）、誤り訂正符号復号処理、符号化されたコンテンツデータ（映像、文字、音声など）に対する復号化処理などを実施する。

補助情報出力部３１は、コンテンツサーバ装置２００が出力するデータから制御部９０によって要求された情報を抽出し、制御部９０に出力する。補助情報出力部３１は、特にコンテンツサーバ装置２００が出力する制御情報などからコンテンツ番組の配信業者など関連する属性情報などを抽出し、制御部９０に出力する。制御部９０に出力された情報は、必要に応じて加工が施され、補助情報としてコマンド制御部１にて使用される。

録画再生部４０は、例えばディスクプレーヤやＨＤＤレコーダなどであり、放送信号受信処理部２０やコンテンツ処理部３０が出力するコンテンツデータなどを記憶し、再生要求に従って、記憶したコンテンツデータを出力制御部６０へ出力し、映像、文字、音声として表示部１０３やスピーカ部１０４から出力する。ユーザは、表示部１０３やスピーカ部１０４が出力する映像、文字、音声を視聴することにより、録画再生部４０に記憶されたデジタルコンテンツなどを視聴する。なお、本実施形態においては、録画再生部４０は、受信装置１０の一機能としたが、例えば、インターフェース部１０５を介した外付けの装置であってもよい。また、受信装置１０が複数のチューナ（放送信号受信処理部２０に相当）を備えているような場合には、録画再生部４０は、放送信号受信処理部２０によって受信処理したコンテンツＡを視聴しながら、録画再生部４０で別の放送信号受信処理部２０によって受信処理したコンテンツＢを録画することができるようにしてもよい。

機器データ生成部５０は、受信装置１０の各機能部（特に放送信号受信処理部２０、コンテンツ処理部、録画再生部４０）からデータを収集し、視聴機器データを生成する。視聴機器データは、機器個別データと視聴データとを含む。機器個別データは、受信装置１０に固有のデータであり、例えば、受信装置１０を設置する際に、ユーザがリモコン１００などから受信装置１０に設定することでもよい。また、視聴解析で用いられる識別番号は、例えば、受信装置１０の購入時などに予め割り振られて、機器個別データなどに設定されてもよい。

視聴データは、例えば視聴履歴であり、受信装置１０により何らかの視聴がされた場合に逐次的に生成されてもよい。具体的には、例えば、放送信号受信処理部２０やコンテンツ処理部３０、録画再生部４０が起動されたタイミングに応じて、各機能部において、デジタルコンテンツを提供するチャンネル、番組名（またはそれに準ずる番組ｉｄ）、番組を視聴した日時などを記憶し、各機能部が停止されたタイミングに応じて、各機能部は記憶したデータを視聴データとして機器データ生成部５０に出力する。機器データ生成部５０は、視聴データを必要に応じて加工し、受信装置１０の図示せぬ記憶部に記憶する。また、各機能部（特に放送信号受信処理部２０、コンテンツ処理部３０、録画再生部４０）がそれぞれ視聴データを記憶しておき、外部装置から視聴データの送信要求があった時に、各機能部が視聴データを機器データ生成部５０に出力し、機器データ生成部５０が必要に応じて視聴データに加工を施して、外部装置へ視聴機器データとして出力するようにしてもよい。

機器データ生成部５０は、生成した視聴機器データを外部装置（特に視聴解析装置３００）からの要求に応じて、通信部１０２へ出力する。視聴機器データは、通信部１０２からネットワーク５００を介して要求した視聴解析装置３００へ送信される。また、受信装置１０において、視聴機器データの変化を検知した場合に、任意のタイミングで視聴機器データを視聴解析装置３００へ送信することでもよい。

補助情報出力部５１は、機器データ生成部５０が生成した視聴機器データや、受信装置１０の各機能から収集した視聴データ、また、視聴解析装置３００が出力する各種解析結果データを受信し、制御部９０に出力する。制御部９０に出力された情報は、必要に応じて加工が施され、補助情報としてコマンド制御部１にて使用される。

出力制御部６０は、放送信号受信処理部２０やコンテンツ処理３０、録画再生部４０が出力したコンテンツデータに対して出力タイミング、表示方法などを調整し、表示部１０３やスピーカ部１０４へ出力する。

状態切替部６２は、表示部１０３の現在の表示状態（ＯＮ状態もしくはＯＦＦ状態、表示している状態もしくは表示していない状態など）やスピーカ部１０４の現在の出力状態（ＯＮ状態もしくはＯＦＦ状態、音声出力状態もしくは音声をミュートしている状態など）を制御部９０からの制御に従って切り替える。制御部９０が表示部１０３の表示状態やスピーカ１０４の出力状態を管理し、制御部９０は、リモコン１００やコマンド制御部１からの制御命令に従って状態切替部６２を制御する。

センサ部７０は、テレビ正面に設置される例えばカメラであり、テレビ装置の正面をカメラで撮影し、撮影した画像から画像認識などを用いて例えばテレビ装置の前にいるユーザを推測することでもよい。

補助情報出力部７１は、センサ部７０が推測したユーザ情報を制御部９０に出力する。制御部９０に出力された情報は、必要に応じて加工が施され、補助情報としてコマンド制御部１にて使用される。

メイン電源部８０は、受信装置１０のメイン機能の電源であり、例えば、テレビ装置の表示部１０３やスピーカ部１０４にデジタルコンテンツを出力したり、出力を止めたりする（この操作をテレビ装置のＯＮ−ＯＦＦ操作と称する）際に使われる電源である。

状態切替部８２は、メイン電源部８０の現在の状態、すなわちテレビ装置のＯＮ−ＯＦＦの状態を制御部９０からの制御に従って切り替える。制御部９０がメイン電源部８０の現在の状態を管理し、制御部９０は、リモコン１００やコマンド制御部１からの制御命令に従って状態切替部８２を制御する。

制御部９０は、受信装置１０の各機能を制御する。具体的には、制御部９０は、インターフェース部１０５から各種制御信号を受信し、受信装置１０の各機能を制御する。例えば、ユーザが放送信号によるコンテンツを視聴するか、コンテンツサーバ装置２００からのコンテンツを視聴するかをリモコン１００から指定した場合に、制御部９０は、インターフェース部１０５を介してリモコンからの制御信号を受信し、受信装置１０の機能を制御し、ユーザが指定した動作をさせる。なお、図２において、制御部９０との間で特に結線をしていない機能ブロックとの間においてもデータのやり取りを行うことにしてもよい。

また本実施形態における制御部９０は、インターフェース部１０５を介してコマンド制御部１からの実行コマンドを受信し、実行コマンドに従って受信装置１０内の各機能の制御を実施する。

補助情報管理部９１は、各機能内の補助情報出力部（補助情報出力部２１、補助情報出力部３１、補助情報出力部４１、補助情報出力部５１、補助情報出力部７１など）が出力する補助情報を受信し、図示せぬ記憶部に記憶する。補助情報管理部９１は、記憶した各機能の補助情報をインターフェース１０５からコマンド制御部１に送信する。

補助情報管理部９１において記憶する情報は、予め決められた項目を各機能内の補助情報出力部に設定しておき、各機能において補助情報が更新された時点で補助情報出力部が自発的に補助情報管理部９１に出力するようにしてもよい。また、補助情報管理部９１が必要に応じて各機能の補助情報出力部に補助情報を要求するようにしてもよい。

状態情報管理部９２は、各機能内の状態切替部（状態切替部６２、状態切替部８２など）の状態情報を図示せぬ記憶部に記憶する。状態情報管理部９２は、インターフェース１０５を介して記憶した各機能の状態情報をコマンド制御部１に送信する。本実施形態においては、制御部９０が、各機能の状態を制御するため、状態情報管理部９２の状態情報は常に最新の状態に保たれる。なお、状態情報管理部９２が記憶する情報については、予め決められた項目を各機能内の図示せぬ状態情報出力部に設定しておき、各機能において状態情報が更新された時点で状態情報出力部が自発的に状態情報管理部９１に出力するようにしてもよい。また、状態情報管理部９２が必要に応じて各機能の状態情報出力部に状態情報を要求するようにしてもよい。

時刻管理部９３は、受信装置１０の時刻を管理する。受信装置１０の内部に時計を持っていてもよいし、放送信号などから時刻を抽出して得てもよい。

通信部１０２は、ネットワーク５００に接続された各種装置と、例えばＴＣＰ／ＩＰ、ＵＤＰ／ＩＰといった予め決められた通信規約などに従ってデータの送受信処理をする。

表示部１０３は、映像や文字を表示する例えばモニタである。スピーカ部１０４は音声を出力する例えばスピーカである。表示部１０３、スピーカ部１０４は、出力制御部６０が出力したコンテンツデータを映像、文字、音声として出力する。ユーザは、表示部１０３、スピーカ部１０４が出力する映像、文字、音声を視聴することにより、放送信号やコンテンツサーバ装置２００、その他録画再生部４０によって提供されるデジタルコンテンツを視聴する。

インターフェース部１０５は、リモコン１００など外部から受信装置１０を制御するためのインターフェースであり、例えば、リモコン１００や受信装置１０に付属する図示せぬスイッチなどから制御信号を受信し、受信装置１０の制御部９０へ出力する。リモコン１００のかわりに図示せぬスマートフォンなどの端末からの制御信号を受信するインターフェースを有してもよい。また、インターフェース部１０５は外部装置と接続するためのインターフェースを有してもよい。例えば、受信装置１０と図示せぬ外付けのＨＤＤレコーダを接続するためのインターフェースであってもよい。この場合、ユーザは図示せぬ外付けのＨＤＤレコーダが出力するデジタルコンテンツを表示部１０３、スピーカ部１０４にて視聴することができる。

また、本実施形態におけるインターフェース１０５は、コマンド制御部１のインターフェース部１５と通信可能なインターフェースを有しており、例えばインターフェースは各種シリアルバスでもよい。また、インターフェース１０５は、コマンド制御部１が出力する実行コマンドを受信し、制御部９０へ実行コマンドを出力する。

図３は、同実施形態に係るコマンド制御部の機能構成の一例を示すブロック図である。

コマンド制御部１においてコマンド生成部１１は、コマンド認識部１３が音声認識によって生成する認識コマンドと、補助情報取得部１６や状態取得部１７が取得する追加情報（補助情報と状態情報）とに基づいて、実行コマンドを生成し、コマンド送信部１８からコマンド制御部１の外部に出力する。以下各機能ブロックについて説明する。

コマンド生成部１１は、記憶部１１１に認識コマンドと追加情報と実行コマンドの組み合わせ（以降、条件組合わせリストと称する）を記憶している。条件組合わせリストは、予めユーザが設定することができる。条件組合わせリストはコマンド生成部１１のコンピュータプログラムに組み込まれていてもよいし、例えばネットワーク５００を介して外部のサーバからダウンロードしてもよい。コマンド生成部１１は、認識コマンドと、追加情報とが入力されると、条件組合わせリストを参照して実行コマンドを生成し、出力する。

音声検知部１２は、例えばマイクロフォンであり、ユーザが発した音声を受波して、サンプリングなどにより受波した音声波形の音声データを得て、出力する。

コマンド認識部１３は、音声検知部１２が出力する音声データから音声認識を実施し、ユーザの発したコマンドを推定もしくは認識し、認識コマンドをテキストデータとして出力する。コマンド認識部１３は、音声認識を実行する音声データ処理部（音声認識エンジン）を自身でコマンド認識部１３内に備えることもできるが、音声認識エンジンを備えたネットワーク５００上の音声認識装置４００に音声データを送信して、認識コマンドを得ることもできる。音声認識装置４００を利用することで、コマンド認識部１３の製造コストなどを下げることができる。また音声認識装置４００が多数の受信装置１０から音声データを得て音声認識を実施することにより、音声認識装置４００は学習効果を得て音声認識の性能向上を図ることができるなどのメリットもある。ただし、音声認識装置４００を使用するためにはネットワーク５００を介するため、音声認識の処理遅延が大きいというデメリットがあり、その点、コマンド認識部１３の内部の音声認識エンジンを利用する場合は音声認識の処理遅延は小さくできるメリットがある。また、図３においては、音声検知部１２（スピーカ）を内蔵する例について示しているが、スマートスピーカなどを用いることでもよい。例えば、スマートスピーカはインターフェース１０５に接続して使用する。具体的には、音声認識エンジンを搭載したスマートスピーカが認識コマンドを生成し
コマンド制御部１（もしくはコマンド生成部１１）がスマートスピーカの生成した認識コマンドを、例えば、インターフェース１０５を介して取得することでもよい。取得した認識コマンドはコマンド生成部１１において実行コマンドの生成に用いられることでもよい。

ユーザインターフェース部１４は、例えばパソコンのキーボードなどのように文字入力できるインターフェースである。具体的にはユーザはユーザインターフェース部１４から、記憶部１１１に条件組合わせリストを設定する。なお、リモコン１００やスマートフォンなどを用いて、条件組合わせリストを記憶部１１１に設定することにしてもよい。また、コマンド生成部１１が受信装置１０の外部に設置された図示せぬ条件組合わせリストを提供するサーバから記憶部１１１に条件組合わせリストをダウンロードすることでもよい。

インターフェース部１５は、インターフェース部１０５と各種データ通信をする。具体的には、インターフェース部１５は、インターフェース部１０５から補助情報や状態情報を受信する。また、インターフェース部１５は、インターフェース部１０５に対してコマンド生成部１１の生成した実行コマンドを送信する。

補助情報取得部１６は、補助情報管理部９１からインターフェース部１５を介して補助情報を取得する。補助情報取得部１６は、例えばコマンド認識部１３から認識コマンドが出力されるタイミングに応じて、補助情報管理部９１に対して補助情報の取得要求を出力し、補助情報管理部９１から補助情報を取得してもよい。

状態取得部１７は、状態情報管理部９２からインターフェース部１５を介して状態情報を取得する。例えばコマンド認識部１３が認識コマンドを出力するタイミングもしくはコマンド生成部１１が認識コマンドを受信するタイミングに応じて、状態情報取得部１６が状態情報管理部９２に対して状態情報の取得要求を出力し、状態情報管理部９２から状態情報を取得してもよい。

コマンド送信部１８は、コマンド生成部１１が生成し、出力した実行コマンドをインターフェース部１５から制御部９０へ送信する。また、通信部１０２を介してネットワーク５００上の装置や機器に送信することもできる。

制御部１９は、コマンド制御部１内の各機能ブロックを制御する。なお、図３において、制御部１９との間で特に結線をしていない機能ブロックとの間においてもデータのやり取り（制御）を行うことにしてもよい。

音声分析部１２１は、音声検知部１２から出力される音声データに対して、例えば周波数分析（声紋分析）を実施し、大人子供、年齢、性別など音声源の属性を推測して音声源推測結果を得る。音声分析部１２１は、音声源推測結果に対して必要な加工を施して補助情報として補助情報取得部１６に出力する。また音声分析部１２１により得られる音声源推測結果は、コマンド生成部１１、コマンド認識部１３、コマンド送信部１８などの起動の可否にも利用することができる。音声源推測結果により、例えば音声を発したユーザが子供である場合に、実行コマンドを出力させないようにするために、音声分析部１２１が音声源推測結果を制御部１９に出力すると、制御部１９はコマンド生成部１１、コマンド認識部１３、コマンド送信部１８の機能を有効にしたり無効にしたりすることでもよい。

図４は、同実施形態において、音声コマンドにより制御できる制御対象部位と制御対象部位の状態の一例を示す図である。

左の列から、「ＮＯ」、「制御対象部位」、「取りうる状態値」、「音声コマンド」を示している。「制御対象部位」は、音声コマンドにより制御できる受信装置１０の部位である。「取りうる状態値」は、「制御対象部位」の取りうる状態である。「音声コマンド」は、「制御対象部位」に対して状態値を切り替える際に、ユーザが発声する制御命令である。

「ＮＯ」＝１は、受信装置１０の「制御対象部位」であるメイン電源部８０の「取りうる状態値」がＯＮとＯＦＦの２状態であることを示す。この場合、状態値を切り替えるための「音声コマンド」は、状態値をＯＮにする場合は「電源ＯＮ」であり、状態値をＯＦＦにする場合は「電源ＯＦＦ」である。すなわち、テレビ装置の電源をＯＮにするためは、ユーザは「電源ＯＮ」と発声し、テレビ装置の電源はＯＦＦにするためには、ユーザは「電源ＯＦＦ」と発声する。

「ＮＯ」＝２は、受信装置１０の「制御対象部位」である出力制御部６０の状態切替部６２の「取りうる状態値」がＯＮとＯＦＦの２状態であることを示す。すなわち、テレビ装置の音量をＯＮにしてスピーカ部１０４から音声を出力させるためには、ユーザは「音量ＯＮ」と発声し、テレビ装置の音量はＯＦＦにしてスピーカ部１０４から音声が出力されなくする（ミュートする）ためには、ユーザは「音量ＯＦＦ」と発声する。

「ＮＯ」＝３は、デジタルコンテンツを表示部１０３やスピーカ部１０４に出力している状態にあるコンテンツ出力装置である。コンテンツ出力装置は、放送信号受信処理部２０、コンテンツ処理部３０、録画再生部４０の総称である。具体的には、「取りうる状態値」の列における「チューナ」が放送信号受信処理部２０、「ネット」がコンテンツ処理部３０、「レコーダ」が録画再生部４０にそれぞれ相当する。例えば、放送信号受信処理部２０を受信状態にして放送信号によるコンテンツを表示部１０３、スピーカ部１０４に出力させるためには、ユーザは「チューナ」と発声する。コンテンツ処理部３０を受信状態にして表示部１０３、スピーカ部１０４にコンテンツサーバ装置２００からのコンテンツを出力させるためには、ユーザは「ネット」と発声する。録画再生部４０を再生状態にして表示部１０３、スピーカ部１０４に出力させるためには、ユーザは「レコーダ」と発声する。

「ＮＯ」＝４は、デジタルコンテンツを表示部１０３やスピーカ部１０４に出力している状態にあるチューナである。「取りうる状態値」のＢＳ、ＣＳ、地デジは、それぞれＢＳデジタル放送、ＣＳデジタル放送、地上デジタルテレビジョン放送（地デジ放送）のチューナを示している。例えば、ＢＳデジタル放送を受信状態にして表示部１０３、スピーカ部１０４にＢＳデジタル放送のコンテンツを出力させるためには、ユーザは「ＢＳ」と発声する。ＣＳデジタル放送を受信状態にして表示部１０３、スピーカ部１０４にＣＳデジタル放送のコンテンツを出力させるためには、ユーザは「ＣＳ」と発声する。地デジ放送を受信状態にして表示部１０３、スピーカ部１０４に地デジ放送のコンテンツを出力させるためには、ユーザは「地デジ」と発声する。

「ＮＯ」＝５は、コンテンツ出力装置が表示部１０３やスピーカ部１０４に出力しているチャネル（番組）である。「取りうる状態値」の１ｃｈ、２ｃｈ、３ｃｈはチャネル番号を示している。例えば、１ｃｈを受信状態にして表示部１０３、スピーカ部１０４に１ｃｈの番組を出力させる場合は、ユーザが「１ｃｈ」と発声する。他のチャネルについても同様である。なお、チャネルは通常、コンテンツ出力装置ごとかつチューナごとに定義されることでもよい。例えばコンテンツ出力装置を放送信号受信処理部２０とする場合は、チューナ「ＢＳ」、「ＣＳ」、「地デジ」ごとにチャネル番号が割り振ることでもよい。また、コンテンツ出力装置のすべてのチャネルに対して統一的に固有のチャネル番号を割り振ってもよい。その場合は、そのチャネル番号によって、コンテンツ出力装置の種類、チューナの種類を特定できる。

また「取りうる状態値」として、「ホーム（帰る場所）」という状態を持つことでもよい。「ホーム」は、ユーザが設定できる状態値である。

例えば、ＮＯ３の例において、制御対象部位であるコンテンツ出力装置の「ホーム」状態値として「チューナ」を設定した場合について説明する。例えば、ユーザがコンテンツ出力装置「ネット」の番組を視聴中に、すなわちコンテンツ出力装置の現状態が「ネット」である時に、ユーザが音声コマンドとして「ネット」と発声するなどして、コマンド認識部１３において認識コマンドとして「ネット」が認識、生成されたとする。コマンド生成部１１は、認識コマンドが入力されると、「ホーム」である「チューナ」に状態を切り替えるための実行コマンド「チューナ」を生成、送信し、コンテンツ出力装置を「チューナ」に切り替える。

例えば、ＮＯ４の例において、制御対象部位であるチューナの「ホーム」状態値として「地デジ」を設定した場合について説明する。例えば、ユーザが「ＢＳ」のチューナを視聴中に、すなわちチューナの現状態が「ＢＳ」である時に、ユーザが音声コマンドとして「ＢＳ」と発声するなどして、コマンド認識部１３において認識コマンドとして「ＢＳ」が認識、生成されたとする。コマンド生成部１１は、認識コマンドが入力されると、「ホーム」である「地デジ」に状態を切り替えるための実行コマンド「地デジ」を生成、送信し、チューナを「地デジ」に切り替える。

ＮＯ５の例において、制御対象部位であるチャネルの「ホーム」状態値として「１ｃｈ」を設定した場合について説明する。例えば、ユーザが「２ｃｈ」のチャネルを視聴中に、すなわちチャネルの現状態が「２ｃｈ」である時に、ユーザが音声コマンドとして「２ｃｈ」と発声するなどして、コマンド認識部１３において認識コマンドとして「２ｃｈ」が認識、生成されたとする。コマンド生成部１１は、認識コマンドが入力されると、「ホーム」である「１ｃｈ」に状態を切り替えるための実行コマンド「１ｃｈ」を生成、送信し、チャネルを「１ｃｈ」に切り替える。

なお、上記の「ホーム」状態値への設定は、ユーザが設定してもよいし、前回テレビ装置の電源をＯＦＦにする直前の状態値が自動設定されることでもよい。また、音声コマンドとして「ホーム」があってもよい。例えば、ユーザが音声コマンドを「ホーム」と発声し、「ホーム」が認識コマンドとして生成されると、「ホーム」として設定された状態値に状態が移ることでもよい。

図５は、同実施形態において、利用可能な補助情報の一例を示す図である。

左の列から、「ＮＯ」、「情報源」、「補助情報」、「情報値」を示している。「情報源」は、「補助情報」の発信源もしくは「補助情報」の抽出元（抽出した部位）である。「補助情報」は、本実施形態においてコマンド制御部１が実行コマンドを作成する場合に利用する情報である。「情報値」は「補助情報」の値である。

「ＮＯ」＝１は、「情報源」である受信装置１０の時刻管理部９３が、時刻を補助情報に含めることを示している。

「ＮＯ」＝２は、「情報源」である受信装置１０の音声分析部１２１が実施する音声分析により得られる声紋から、音声の発信源の属性を決定し、音声の発信源の属性を補助情報に含めることを示している。音声の発信源の属性は、例えば、発信源の年齢や、年齢により定義した大人子供の分類、また年齢により定義した幼児、幼稚園児、小学生、中学生、高校生、大学生、社会人などの分類であるユーザ識別情報である。

「ＮＯ」＝３は、「情報源」である受信装置１０のコマンド認識部１３が実施する音声認識により得られる音声認識結果から、ユーザ識別情報を決定し、ユーザ識別情報の属性を補助情報に含めることを示している。

「ＮＯ」＝４、５、６は、それぞれ「情報源」である受信装置１０の音声分析部１２１が実施する音声分析により得られる声の強さ、声の高さ、声の速さから、それぞれ補助情報として声の強さの強弱、声の高さの高低、声の速さの遅速を提供することを示している。

「ＮＯ」＝７は、「情報源」である受信装置１０のセンサ部７０（例えばカメラ）が、カメラで取得した画像認識結果から、ユーザ識別情報を決定し、ユーザ識別情報の属性を補助情報に含めることを示している。

「ＮＯ」＝８から１１は、それぞれ「情報源」である受信装置１０の放送信号受信処理部２０が放送信号から抽出した「放送事業者」、「番組放送時間帯」、「番組種類」、「番組名」を補助情報に含めることを示している。「放送事業者」の場合は、例えば業者Ａ、業者Ｂ、業者Ｃなどの業者の名称を補助情報の値とする。「番組放送時間帯」の場合は、放送時間帯を補助情報の値とする。「番組種類」の場合は、例えばドラマ、スポーツ、音楽、ニュース、教育、緊急情報など番組の種類を補助情報の値とする。「番組名」の場合は、例えば番組Ａ、番組Ｂ、番組Ｃなどの番組の名称を補助情報の値とする。

「ＮＯ」＝１２は、「情報源」である視聴解析装置３００が提供する解析結果により得られるデモグラを情報補助に含める。

「ＮＯ」＝１３から１６は、それぞれ「情報源」である受信装置１０の録画再生部２０（外付けのレコーダなども含めてよい）が番組を録画した際に放送波から抽出した「放送事業者」、「番組放送時間帯」、「番組種類」、「番組名」を補助情報に含めることを示している。

「ＮＯ」＝１７から２０は、それぞれ「情報源」である受信装置１０のコンテンツサーバ装置２００が送信するコンテンツに付随する情報から抽出した「配信事業者」、「番組放送時間帯」、「番組種類」、「番組名」を補助情報に含めることを示している。またデジタルコンテンツを録画したユーザ（特に録画管理者と称する）を補助情報に含めてよい。

（第１の実施形態）
本実施形態においては、ユーザが発した音声コマンドと追加情報に基づいて、受信装置のメイン電源のＯＮ−ＯＦＦを制御する場合の動作例について示す。

図６は、同実施形態において、コマンド制御部が音声コマンドを受信して実行コマンドを送信するための処理動作例を示すフローチャートである。

ユーザは、受信装置１０のメイン電源のＯＮ−ＯＦＦを制御するために、音声コマンド「電源ＯＮ」もしくは「電源ＯＦＦ」を発したとする。音声検知部が音声を検知する（ステップＳ１１のＹＥＳ）。音声検知部が音声を検知しない場合は、検知するまで待つ（ステップＳ１１のＮＯ）。音声検知部が音声を検知するまたは検知しないという判断は、例えば、入力される音声の強度に対して閾値を設定して、閾値以上であれば音声が検知されたと判断し、閾値未満であれば音声は検知されていないと判断してもよい。

音声検知部１２は、受波した音声の音声データを音声分析部１２１に出力し、音声分析部１２１は、受信した音声データに対して音声分析処理を行う（ステップＳ１２）。具体的には、音声分析部１２１は、音声データに対して周波数分析（声紋分析）を行い、音声の発信源の属性を推測する。

音声分析部１２１が推測結果を制御部１９に出力すると、制御部１９は、推測結果から認識コマンドの生成をするか否かを判断する（ステップＳ１３）。認識コマンドの生成可否の判断規則については、ユーザがユーザインターフェース部１４から、例えば記憶部１１１に設定してもよい。制御部１９は、記憶部１１１にアクセスして認識コマンドの生成の判断規則を参照する。制御部１９は、認識コマンドの生成を実施すると判断した場合、コマンド認識部１３に、音声データに対する音声認識を実行させる（ステップＳ１３のＹＥＳ）。制御部１９は、認識コマンドの生成を実施しないと判断した場合、コマンド認識部１３に、音声データに対する音声認識をさせないように制御し、コマンド認識部１３を次の音声を検知するまで待ち状態とする（ステップＳ１３のＮＯ、Ｓ１１）。制御部１９は、認識コマンドの生成を実施しないと判断した場合、例えば表示部１０３やスピーカ部１０４に「認識コマンドの生成がされませんでした」などのメッセージを出力させて、ユーザに通知することでもよい。

コマンド認識部１３は、制御部１９から認識コマンドの生成を命令されると、音声認識により、認識コマンドをテキストデータとして得る。コマンド認識部１３は、認識コマンドをコマンド生成部１１に出力する（ステップＳ１４）。ステップＳ１４においてコマンド認識部１３は、まずコマンド認識部１３内に備える音声認識エンジンで認識コマンドの取得を試みて、音声認識に失敗して取得されなかった場合に、より音声認識の認識率の高い外部の音声認識装置４００を利用して認識コマンドの取得をするようにしてもよい。

コマンド生成部１１は、コマンド認識部１３から認識コマンドを受信すると、記憶部１１１の条件組合わせリストを参照する。

図７は、同実施形態において、メイン電源を制御するためにコマンド制御部に設定する実行コマンド生成条件（組合せ条件リスト）の一例を示す図である。

組合せ条件リストの例は、左の列から、「ＮＯ」、「実行コマンド」、「認識コマンド」、「状態情報」、「補助情報」を示している。各行ごとに記載されている「認識コマンド」と、「状態情報」と、「補助情報」とを条件として、同一行に記載されている「実行コマンド」が決定されることを示している。「認識コマンド」は、コマンド認識部１３が生成し、出力する認識コマンドである。組合せ条件リストは、例えば、ユーザがユーザインターフェース部１４から記憶部１１１に設定することでもよい。図７に示した組合せ条件リストは一例であり、補助情報の数（列の数）はさらに追加することも可能である。

図６に戻り、コマンド制御部１の処理動作を説明する。コマンド生成部１１は、コマンド認識部１３から「認識コマンド」として例えば「電源ＯＮ」が入力されると、組合せ条件リストを参照し、リストの列項目である「補助情報」、「状態情報」の取得をそれぞれ補助情報取得部１６と状態情報取得部１７に命令する。補助情報取得部１６は、組合せ条件リストの補助情報の項目である「時刻」、「声の強さ」、「ユーザ識別情報」を補助情報管理部９１に要求し、取得し、コマンド生成部１１に出力する（ステップＳ１５）。状態情報取得部１７は、「認識コマンド」が「電源ＯＮ」であることから制御対象がメイン電源８０であることを把握し、状態情報管理部９２に対してメイン電源８０の状態情報を取得し、コマンド生成部１１に出力する（ステップＳ１６）。

コマンド生成部１１は、組合せ条件リストを参照して、取得した補助情報と、状態情報と、認識コマンドとが、組合せ条件リストの条件の組合せと一致する行を探す。条件の組合せが一致する行に「実行コマンド」の項目にコマンドがある場合は、「実行コマンド」の項目に記載されているコマンドを実行コマンドとして生成し、コマンド送信部１８へ出力する（ステップＳ１７，Ｓ１８のＹＥＳ，Ｓ１９）。一方、例えば、図７のＮＯ７のように、条件の組合せが一致する「実行コマンド」の項目が「送信なし」となっている場合は、実行コマンドの生成はせず、コマンド制御部１は次の音声が検知されるのを待つ（ステップＳ１７，Ｓ１８のＮＯ）。実行コマンドが「送信なし」の場合、コマンド制御部１は、「実行コマンドが送信されなかったまたは生成されなかった」という意味を含むメッセージを制御部９０に送信してもよい。メッセージを受信した制御部９０は、表示部１０３にてメッセージを表示させたり、スピーカ部１０４からメッセージ内容を含んだ音声を出力させたりして、ユーザに通知することでもよい。

また、条件の組合せが一致する「実行コマンド」の項目が「送信なし」の場合、コマンド制御部１は、「現状態を維持するための実行コマンド」を生成、送信することでもよい。例えば、音声分析部１２１による音声コマンドの声紋分析の結果、ユーザ識別情報として音声の発信源が「子供」である補助情報がコマンド生成部１１に入力された場合、認識コマンドを用いずに、補助情報のみで「現状態を維持するための実行コマンド」を生成し、送信することでもよい。この場合、コマンド生成部１１は、「その操作はできません」などという意味を含むメッセージを制御部９０に送信してもよい。その際、メッセージを受信した制御部９０は、表示部１０３にてメッセージを表示させたり、スピーカ部１０４からメッセージ内容を含んだ音声を出力させたりして、ユーザに通知することでもよい。

コマンド送信部１８は、実行コマンドが入力されたら、インターフェース部１５を介して、実行コマンドを制御部９０に送信する（ステップＳ１０１）。制御部９０は、受信した実行コマンドに従って、制御対象の機能を制御する。

コマンド制御部１は、実行コマンドを生成もしくは送信した場合に、「実行コマンドを送信した」という内容を含んだメッセージを制御部９０に送信してもよい。また、コマンド制御部１は、認識コマンドと生成した実行コマンドが異なる場合に「実行コマンドが認識コマンドと異なる」内容を含んだメッセージを制御部９０に送信することでもよい。コマンド制御部１では、表示部１０３にメッセージを表示させたり、スピーカ部１０４からメッセージ内容を含んだ音声を出力させたりして、ユーザに通知することでもよい。このようにすることで、ユーザは自身が発した音声コマンドが正しく実行されているかを確認することができる。

再び、図７を用いて、組合せ条件リストについて詳細を説明する。

「ＮＯ」＝１の場合、補助情報が全て「−」であるが、これは補助情報を用いないことを示しており、コマンド生成部１１が状態情報と認識コマンドのみで実行コマンドを生成する例である。「ＮＯ」＝１の例では、「認識コマンド」が「電源ＯＮ」であり、「状態情報」が「ＯＮ」である時に、実行コマンドは「電源ＯＦＦ」とする。「ＮＯ」＝２から４については同様であるので説明は省略する。

「ＮＯ」＝５の場合、「認識コマンド」が「電源ＯＮ」であり、「状態情報」が「ＯＮ」であり、１つ目の「補助情報」である「時刻」が「昼」であり、２つ目の「補助情報」である「声の強さ」が「強」である時に、実行コマンドは「送信なし（もしくは生成しない）」とする例である。ここで「補助情報」である「時刻」の値を「昼」としているが、例えば、補助情報取得部１６が時刻と時刻分類値（朝、昼、夜）との対応関係を持っており、補助情報取得部１６が取得した「時刻」から対応する時刻分類値を判定し、時刻分類値（ＮＯ＝５の場合、昼）をコマンド生成部１１に出力するようにしてもよい。２つ目の「補助情報」である「声の強さ」についても同様である。例えば、補助情報取得部１６が音声分析部１２１から入力される「音声の強度」と強度分類（強、弱）との対応関係を持っており、補助情報取得部１６が受信した「音声の強度」から対応する強度分類値を判定し、強度分類値（ＮＯ＝５の場合、強）をコマンド生成部１１に出力するようにしてもよい。「ＮＯ」＝６から１２については同様であるので説明は省略する。「ＮＯ」＝５から１２のように、補助情報として「時刻」と「声の強さ」とを利用することで、「昼」の時間帯には周囲の騒音が大きくなるために、音声認識エンジンの精度が劣化して認識コマンドがユーザの音声コマンドと異なってしまうといった状況を考慮して、実行コマンドを生成できる。

「ＮＯ」＝１３の場合、「認識コマンド」が「電源ＯＮ」であり、「状態情報」が「ＯＮ」であり、１つ目の「補助情報」である「時刻」が「夜」であり、２つ目の「補助情報」である「ユーザ識別情報」が「大人」である時に、実行コマンドは「電源ＯＦＦ」とする例である。「ＮＯ」＝５と同様、例えば、音声分析部１２１が声紋分析による音声コマンドの発信源の年齢を補助情報取得部１６に入力する場合、年齢と年齢分類値（大人、子供）との対応関係により、補助情報取得部１６が受信した「年齢」から対応する年齢分類値を判定し、年齢分類値（ＮＯ＝１３の場合、大人）をコマンド生成部１１に出力するようにしてもよい。「ＮＯ」＝１４から２０については同様であるので説明は省略する。「ＮＯ」＝１３から２０のように、補助情報として「時刻」と「ユーザ識別情報」とを利用することで、「夜」の時間帯には周囲の騒音が小さいために、音声認識エンジンの精度は劣化しないが、「夜」はユーザによって実行コマンドの生成や送信を制限したいといった場合に利用できる。

以上、図６のフローチャートの手順により、図７による条件組合わせリストを用いた実行コマンドの生成が可能になる。

図７による条件組合わせリストの「ＮＯ」＝１の条件を適用した場合、メイン電源の現状態（「状態情報」に相当）が「ＯＮ」である。通常このような状況においてユーザは、「電源ＯＮ」という音声コマンドを発する可能性は少なく、逆に現状態「ＯＮ」の反対である「電源ＯＦＦ」の音声コマンドを発する可能性の方が高くなると考えられる。しかし、周囲の騒音などにより、「電源ＯＦＦ」の音声コマンドがコマンド認識部１３の音声認識エンジンによって「電源ＯＮ」と認識されると、ユーザが「電源ＯＦＦ」と発声しているにも関わらず、受信装置１０のメイン電源をＯＦＦにすることができない事態が発生し、ユーザのストレスは多大なものになる。しかし本実施形態によれば、コマンド制御部１において、条件組合わせリストの「ＮＯ」＝１の条件を用いて、受信装置１０の状態情報に基づいて認識コマンドの解釈をすることでこのような事態を防ぐことが可能となる。同様にコマンド制御部１に条件組合わせリストの「ＮＯ」＝２から４を適用した場合、認識コマンドがメイン電源の現状態（「状態情報」）を切り替えるような制御命令である場合には認識コマンドと実行コマンドの制御命令を一致させる。逆に認識コマンドが「状態情報」と同じ状態への制御命令である場合は、実行コマンドの制御命令は、認識コマンドと反対のもしくは異なる制御命令となる。このように動作させる背景は、音声認識エンジンが特にＯＮとＯＦＦの音声の認識を間違える可能性が高いことにある。本実施形態においては、制御対象の現状態と制御後の状態とが同じになるようにユーザが音声コマンドを発することはあまりないという点を考慮して、音声コマンドに対する音声認識による解釈を支援することを可能にする。

本実施形態における図７の条件組合わせリストには、ＮＯ１からＮＯ２０に、実行コマンドを決定するための条件組合せが示されているが、これらに優先権をつけて、コマンド生成部１１に優先権を考慮して条件組合わせリストを参照させることもできる。優先権は、図７のように、ＮＯ１からＮＯ２０の行順に与えてもよい。この場合、コマンド生成部１１は、補助情報を取得したとしても、ＮＯ１からＮＯ４に優先権があるため、補助情報は使用しない。また図７のリストに別途優先順位を示す列項目を追加して、各行の条件組合せに優先権をユーザが設定できるようにしてもよい。

また「補助情報」が複数ある場合に、「補助情報」内で優先権を与えてもよい。例えば、図７の組合せ条件リストにおいて、補助情報に対し、例えば「時刻」、「声の強さ」、「ユーザ識別情報」の順に高い優先権を付与する。この場合、コマンド生成部１１は、例えば組合せ条件リストにおいて優先権の高い補助情報が入った条件組合せから参照する。具体的には、補助情報が「時刻」のみの条件組合せに一番高い優先権を与え、次に「時刻」と「声の強さ」のみの条件組合わせに優先権を与え、その次に「時刻」と「ユーザ識別情報」のみの条件組合わせに優先権を与えるようにユーザが設定してもよい。

また、「時刻」、「声の強さ」、「ユーザ識別情報」に優先度を示す点数をユーザが設定することで、「時刻」、「声の強さ」、「ユーザ識別情報」に付与された点数の総和をコマンド生成部１１に計算させ、点数の総和の高いものから、別途優先順位を高くするなどして各組合せ条件リストに優先権を与えることでもよい。この場合、優先順位をコマンド生成部１１が計算できるので、ユーザは「時刻」、「声の強さ」、「ユーザ識別情報」に対して優先度を示す点数を設定するだけでよい。

また基本的に組合せ条件リストに示される条件組合せは、同じ条件となる組み合わせがないように設定するのが望ましい。もし同じ条件となる組み合わせがある場合は、コマンド生成部１１は、リスト順に選択するなどの規則を予め決めておくことでもよい。

（第２の実施形態）
本実施形態においては、ユーザが発した音声コマンドと、状態情報と、補助情報として番組種類と声の強さとを利用して、受信装置１０のスピーカ部１０４が出力する音量のＯＮ−ＯＦＦを制御する場合のコマンド制御部１の動作例について示す。なお、本実施形態においては、メイン電源はＯＮの状態であることを想定している。

図８は、第２の実施形態において、音量を制御するためにコマンド制御部に設定する実行コマンド生成条件の一例を示す図である。なお、本実施形態におけるコマンド制御部１が音声コマンドを受信して実行コマンドを送信するための処理動作の例は、図６を用いて説明するが、第１の実施形態と同様の部分については説明を省略する。

ユーザは、受信装置１０のスピーカ部１０４の音量出力のＯＮ−ＯＦＦを制御するために、音声コマンド「音量ＯＮ」もしくは「音量ＯＦＦ」を発したとする。音声検知部が音声を検知する（ステップＳ１１のＹＥＳ）。音声分析処理の結果、制御部１９が、認識コマンドを生成すると判断、コマンド認識部１３に、音声データに対する音声認識を実行させる（ステップＳ１３のＹＥＳ）。コマンド認識部１３は、音声認識により、認識コマンドをテキストデータとして得て、認識コマンドをコマンド生成部１１に出力する（ステップＳ１４）。

コマンド生成部１１は、コマンド認識部１３から認識コマンドを受信すると、記憶部１１１の条件組合わせリストを参照する。コマンド生成部１１は、コマンド認識部１３から「認識コマンド」として「音量ＯＮ」が入力されると、組合せ条件リストを参照し、リストの列項目である「補助情報」、「状態情報」の取得をそれぞれ補助情報取得部１６と状態情報取得部１７に命令する。補助情報取得部１６は、組合せ条件リストの補助情報の項目である「番組種類」、「声の強さ」を補助情報管理部９１に要求し、取得し、コマンド生成部１１に出力する（ステップＳ１５）。状態情報取得部１７は、「認識コマンド」が「音量ＯＮ」であることから制御対象がメイン電源８０であることを把握し、状態情報管理部９２からスピーカ部１０４の状態情報を取得し、コマンド生成部１１に出力する（ステップＳ１６）。

コマンド生成部１１は、組合せ条件リストを参照して、取得した補助情報と、状態情報と、認識コマンドとの組み合わせが一致した行の「実行コマンド」の項目にコマンドがある場合は、「実行コマンド」の項目に記載されているコマンドを実行コマンドとして生成し、コマンド送信部１８へ出力する（ステップＳ１７，Ｓ１８のＹＥＳ，Ｓ１９）。一方、「実行コマンド」の項目が「送信なし」となっている場合は、実行コマンドの生成はせず、コマンド制御部１は次の音声が検知されるのを待つ（ステップＳ１７，Ｓ１８のＮＯ）。コマンド送信部１８は、実行コマンドが入力されたら、実行コマンドをインターフェース部１５から制御部９０に送信する（ステップＳ１０１）。

図８を用いて、組合せ条件リストについて詳細を説明する。

「ＮＯ」＝１の場合、「状態情報」が「ＯＮ」であることから、現在「音量」が出力状態であることを示す。「ＮＯ」＝１の条件組合せは、「認識コマンド」が「音量ＯＮ」であり、１つ目の「補助情報」である「番組種類」が「緊急情報」であり、２つ目の「補助情報」である「声の強さ」が「−」（条件なし）である時に、コマンド生成部１１が実行コマンドとして「送信なし（もしくは生成しない）」を生成する例である。「ＮＯ」＝２から４については同様であるので説明は省略する。「ＮＯ」＝１から４のように、補助情報として「番組種類」を利用して、「番組種類」が「緊急情報」である場合には、あらゆる状況において、音量をＯＮにしたいといった要求を考慮できる。例えば、放送信号受信処理部２０が放送信号を受信中に地震などが起きた場合、たまたま音量をＯＦＦにしていた場合に、ユーザは音量をＯＮにするためにとっさに「音量ＯＮ」の音声コマンドを出力する。しかし、地震などの緊急時には周囲の騒音が大きくなることが予想され、ユーザの発した音声コマンドが間違って認識されてしまう可能性が高い。このような場合に、補助情報取得部１６が取得した補助情報の「番組種類」として「緊急情報」を取得すると、コマンド生成部１１は、受信した「認識コマンド」や制御対象の「状態情報」によらず常に音量をＯＮにする。

「ＮＯ」＝５から１２は、補助情報として「ユーザ識別情報」を使用する例である。例えば、昼間の時間帯などに子供が受信装置１０でデジタルコンテンツを視聴することを避けたいといった場合に、「ＮＯ」＝５から１２のような条件組合せ利用することができる。

以上、本実施形態のように、ユーザが組合せ条件リストを設定することで、さまざまなユースケースを想定して、音声コマンドに対するコマンド制御が可能となる。

（第３の実施形態）
本実施形態においては、ユーザが発した音声コマンドと、状態情報と、補助情報としてユーザ識別情報と時刻とを利用して、受信装置１０が、表示部１０３やスピーカ部１０４に出力するデジタルコンテンツを制御する場合のコマンド制御部１の動作例について示す。なお、本実施形態においては、メイン電源はＯＮの状態であることを想定している。また、本実施形態においては、１つの音声コマンドに対して、２つの実行コマンドを出力する例を示す。

図９は、第３の実施形態において、デジタルコンテンツ受信を制御するためにコマンド制御部に設定する実行コマンド生成条件の一例を示す図である。

なお、本実施形態におけるコマンド制御部１が音声コマンドを受信して実行コマンドを送信するための処理動作例は、図６のフローチャートを用いて説明するが、第１の実施形態と同様の部分については説明を省略する。

ユーザは、受信装置１０の表示部１０３やスピーカ部１０４へのデジタルコンテンツの出力を制御するために、音声コマンド「ネット」、「チューナ」もしくは「レコーダ」のいずれかを発したとする。音声検知部が音声を検知する（ステップＳ１１のＹＥＳ）。ステップＳ１２、Ｓ１３を経て、コマンド認識部１３は、音声認識により、認識コマンドをテキストデータとして得て、認識コマンドをコマンド生成部１１に出力する（ステップＳ１４）。

コマンド生成部１１は、コマンド認識部１３から「認識コマンド」が入力されると、記憶部１１１の条件組合わせリストを参照し、リストの列項目である「補助情報」、「状態情報」の取得をそれぞれ補助情報取得部１６と状態情報取得部１７に命令する。補助情報取得部１６は、組合せ条件リストの補助情報の項目である「ユーザ識別情報」、「時刻」を補助情報管理部９１に要求し、取得し、コマンド生成部１１に出力する（ステップＳ１５）。状態情報取得部１７は、「認識コマンド」から制御対象がコンテンツ出力装置であることを把握し、状態情報管理部９２からスピーカ部１０４の状態情報を取得し、コマンド生成部１１に出力する（ステップＳ１６）。

コマンド生成部１１は、ステップ１７からＳ１９を経て実行コマンドを生成し、コマンド送信部１８へ出力する。コマンド送信部１８から実行コマンドを制御部９０に送信する（ステップＳ１０１）。本実施形態においては、実行コマンドは２つ生成される。コンテンツ出力装置に対する第１の実行コマンドと、番組種類に対する第２の実行コマンドである。

図９を用いて、組合せ条件リストについて詳細を説明する。

「ＮＯ」＝１の場合、コンテンツ出力装置の「状態情報」が「チューナ」であることから、現在、「チューナ」が表示部１０３、スピーカ部１０４へ出力していることを示す。「ＮＯ」＝１の条件組合せは、コマンド生成部１１が受信した認識コマンドが「ネット」であり、１つ目の補助情報であるユーザ識別情報が「大人」である時に、コマンド生成部１１はコンテンツ出力装置の１つである「ネット」から表示部１０３、スピーカ部１０４へ出力させるための実行コマンドを生成する例である。「ＮＯ」＝２、３については同様であるので説明は省略する。

「ＮＯ」＝４の場合、コンテンツ出力装置の「状態情報」が「チューナ」であることから、現在、「チューナ」が表示部１０３、スピーカ部１０４へ出力していることを示す。「ＮＯ」＝４の条件組合せは、コマンド生成部１１が受信した認識コマンドが「ネット」であり、１つ目の補助情報であるユーザ識別情報が「子供」であり、２つ目の補助情報である時刻が「昼」である時に、コマンド生成部１１はコンテンツ出力装置の１つである「ネット」から表示部１０３、スピーカ部１０４へ出力させないために実行コマンドを生成もしくは送信しない例である。「ＮＯ」＝４のケースは、例えば、昼間の時間帯などに子供が受信装置１０で「ネット」からのデジタルコンテンツを視聴することを避けたいといった場合に利用することができる。

また、「ＮＯ」＝９の場合、コンテンツ出力装置の「状態情報」が「レコーダ」であることから、現在、「レコーダ」が表示部１０３、スピーカ部１０４へ出力していることを示す。「ＮＯ」＝９の条件組合せは、コマンド生成部１１が受信した認識コマンドが「ネット」であり、１つ目の補助情報であるユーザ識別情報が「子供」であり、２つ目の補助情報である時刻が「夜」である時に、コマンド生成部１１は実行コマンドとして、「ネット」と番組種類に対する実行コマンドである「教育」との２つを生成する。生成された２つの実行コマンドは、コマンド送信部１８から制御部９０に送信され、「ネット」が配信サービスする「教育」に関する番組を表示部１０３、スピーカ部１０４へ出力させる。「ＮＯ」＝９のケースは、例えば、夜間の時間帯に子供が受信装置１０で「ネット」を見ようとした場合に、番組種類が「教育」であるデジタルコンテンツを視聴するようにしたいといった場合に利用することができる。

また、例えば、ユーザがＢＳを視聴中に、すなわち、制御対象部位「チューナ」の状態情報が「ＢＳ」である時に、ユーザが音声コマンドとして「ＢＳ」を発声するなどし、コマンド認識部１３が、認識コマンドとして「ＢＳ」を生成し、コマンド生成部１１に出力したとする。コマンド生成部１１は、認識コマンドが入力されると、制御対象部位「チューナ」の「ホーム」に設定された状態値（「地デジ」とする）に切り替える実行コマンド「地デジ」を生成、送信する。制御部９０は、実行コマンド「地デジ」を受信し、チューナを「地デジ」に切り替える。この時、表示部１０３、スピーカ１０４に出力するチャネル（番組）を、制御対象部位である「チャネル（番組）」に設定された「ホーム」の状態値を選択するようにしてもよい。すなわち、この例の場合、コマンド生成部１１は、ユーザが発した１つの制御対象部位に対する音声コマンド（もしくはそれを認識した認識コマンド）に対して、「チューナ」と「チャネル（番組）」という複数の制御対象部位に対して実行コマンドを生成する。「チャネル（番組）」に対し設定される「ホーム」は、例えば前回テレビ装置の電源をＯＦＦにする直前に視聴していたチャネルとしてもよいし、ユーザが予め設定したチャネルとしてもよい。また、異なる対象制御部位に対する実行コマンドを分けずに、１つの実行コマンドとすることでもよい。

以上、本実施形態のように、ユーザが組合せ条件リストを設定することで、１つの音声コマンドから複数の実行コマンドを生成し、送信し、実行させることができる。

（第４の実施形態）
本実施形態においては、コマンド制御部１を一つの独立した装置として利用する場合のシステムの例を示す。

図１０は、第３の実施形態に係るシステム全体の構成例を示した図である。
ネットワーク５００に、コマンド制御装置２と、ＩｏＴデバイス６００Ａ、６００Ｂとが接続されている。ＩｏＴデバイス６００Ａと６００Ｂとが同様の機能を備え、特に両者を区別しない場合は、ＩｏＴデバイス６００Ａと６００ＢとをＩｏＴデバイス６００と称する。ＩｏＴデバイス６００は図１０には２つだけ示されているが、多数あってもよい。

コマンド制御装置２は、例えばＣＰＵやメモリなどを有したコンピュータに構築される。コマンド制御装置２は、パーソナルコンピュータであっても良いし、サーバ、データベースなどを含むクラウドサービスであっても良い。コマンド制御装置２は、コマンド認識部１と、通信部１０２Ａとを含む。コマンド認識部１、通信部１０２Ａは、それぞれ図３におけるコマンド認識部１と、通信部１０２の機能に相当する。

ＩｏＴデバイス６００は、あらゆる種類のＩｏＴ機器であり、ネットワーク１００に接続され、ネットワーク１００上の装置とデータ通信を実施する。ＩｏＴデバイス６００は、例えば、温度検知センサ、水漏れ検知センサ、ドア開閉センサなどのセンサ類であってもよいし、それらのセンサを用いた検知装置でもよい。また、ＩｏＴデバイス６００は、エアコン、テレビ装置、照明、カメラなどの家電でもよい。またネットワーク１００に接続であれば、スマートフォンのようなモバイル端末でもよい。本実施形態におけるＩｏＴデバイス６００は、コマンド制御装置２に対して補助情報と、状態情報とを提供し、コマンド制御装置２の出力した実行コマンドを受信し、受信した実行コマンドによりＩｏＴデバイス６００の機能を制御する。

具体的には、ＩｏＴデバイス６００は、補助情報出力部２１Ａ、状態切替部２２Ａ、制御部９０Ａ、補助情報管理部９１Ａ、状態情報管理部９２Ａ、通信部１０２Ａ、インターフェース部１０５Ａを含む。それぞれの機能は、図２における補助情報出力部２１、状態切替部８２、制御部９０、補助情報管理部９１、状態情報管理部９２、通信部１０２、インターフェース部１０５の機能に相当する。

すなわち、図２の各機能を、コマンド制御装置２とＩｏＴデバイス６００Ａに割り振ったとも言える。第１の実施形態にて示した受信装置１０と、本実施形態に示すＩｏＴデバイス６００との大きな違いは、受信装置１０には内部にコマンド制御部１を備えているが、ＩｏＴデバイス６００にはコマンド制御部１を備えていないことにある。本実施形態においては、コマンド制御部１はコマンド制御装置２に備えられており、ＩｏＴデバイス６００は、ネットワーク５００を介してコマンド制御装置２から実行コマンドを受信する。

コマンド制御装置２が制御可能なＩｏＴデバイス６００の制御対象部位は、例えば、第１から第３の実施形態で示した電源（ＯＮ−ＯＦＦ）でもよいし、その他、機能部位の起動と停止を制御することでもよい。

コマンド制御装置２が、ＩｏＴデバイス６００に対して実行コマンドを送信する手順は図６のフローチャートを利用することができる。第１の実施形態、第２の実施形態と同様の手順についての詳細説明は省略する。

ユーザはコマンド制御装置２の近くにおり、ＩｏＴデバイス６００Ａに対してネットワーク５００を介して遠隔で制御をする。ユーザはコマンド制御装置２のコマンド制御部１に、ＩｏＴデバイス６００Ａに対する実行コマンド生成条件（組合せ条件リスト）を設定する。

ユーザは、ＩｏＴデバイス６００Ａの機能を制御するために、コマンド制御装置２の音声検知部１２に対して音声コマンドを発したとする。音声検知部１２が音声を検知し、音声分析部１２１による音声分析処理を経て、コマンド認識部１３が、認識コマンドの生成し、コマンド生成部１１に認識コマンドを出力する（ステップＳ１１のＹＥＳ、Ｓ１２、Ｓ１３のＹＥＳ、Ｓ１４）。

コマンド生成部１１は、コマンド認識部１３から認識コマンドが入力されると、組合せ条件リストを参照し、リストの列項目である「補助情報」、「状態情報」の取得をそれぞれ補助情報取得部１６と状態情報取得部１７に命令する。補助情報取得部１６は、組合せ条件リストの補助情報の諸項目を補助情報管理部９１Ａに要求し、取得し、コマンド生成部１１に出力する（ステップＳ１５）。本実施形態におけるステップＳ１５について、詳細に説明する。

補助情報取得部１６は、通信部１０２Ａを介して、ＩｏＴデバイス６００Ａに対して補助情報の要求をする。ＩｏＴデバイス６００Ａにおいては、制御部９０Ａが通信部１０２Ａ２を介して補助情報の要求を受信する。制御部９０Ａは、補助情報管理部９１Ａから補助情報を取得し、取得した補助情報をコマンド制御装置２に通信部１０２Ａ２を介して送信する。

状態情報取得部１７は、認識コマンドから制御対象を把握し、通信部１０２Ａを介して、ＩｏＴデバイス６００Ａに対して制御対象の状態情報の要求をする。ＩｏＴデバイス６００Ａにおいて、通信部１０２Ａ２を介して制御部９０Ａが状態情報の要求を受信する。制御部９０Ａは、状態情報管理部９２Ａから状態情報を取得し、取得した状態情報をコマンド制御装置２に通信部１０２Ａ２を介して送信する。コマンド制御装置２において、通信部１０２Ａ２を介してコマンド生成部１１が状態情報を受信する（ステップＳ１６）。

コマンド生成部１１は、組合せ条件リストを参照して、取得した補助情報と、状態情報と、認識コマンドとの組み合わせが一致する条件の「実行コマンド」の項目にコマンドがある場合は、「実行コマンド」の項目に記載されているコマンドを実行コマンドとして生成し、コマンド送信部１８へ出力する（ステップＳ１７，Ｓ１８のＹＥＳ，Ｓ１９）。
一方、「実行コマンド」の項目が「送信なし」となっている場合は、実行コマンドの生成はせず、コマンド制御部１は次の音声が検知されるのを待つ（ステップＳ１７，Ｓ１８のＮＯ）。この場合、コマンド制御部１は、「コマンド送信なし」など「実行コマンドが送信されなかったまたは生成されなかった」という意味を含むメッセージを、コマンド制御装置２の図示せぬ表示部にてメッセージを表示させたり、コマンド制御装置２の図示せぬスピーカ部からメッセージ内容を含んだ音声を出力させたりして、ユーザに通知することでもよい。

コマンド送信部１８は、入力された実行コマンドを、通信部１０２Ａを介して、ＩｏＴデバイス６００Ａに送信する（ステップＳ１０１）。ＩｏＴデバイス６００Ａでは、受信した実行コマンドに従って、制御の機能を制御する。コマンド制御部１は、実行コマンドを生成もしくは送信した場合に、「実行コマンドを送信した」という意味を含んだメッセージをコマンド制御装置２の図示せぬ表示部にてメッセージを表示させたり、コマンド制御装置２の図示せぬスピーカ部からメッセージ内容を含んだ音声を出力させたりして、ユーザに通知することでもよい。また、コマンド制御装置２は、認識コマンドと生成した実行コマンドが異なる場合に、「実行コマンドが認識コマンドと異なる」という内容を含んだメッセージをコマンド制御装置２の図示せぬ表示部にてメッセージを表示させたり、コマンド制御装置２の図示せぬスピーカ部からメッセージ内容を含んだ音声を出力させたりして、ユーザに通知することでもよい。このようにすることで、ユーザは自身が発した音声コマンドによる意図が正しく実行されているかどうかを確認することができる。

以上の手順により、ユーザが、ネットワーク５００に接続されたコマンド制御装置２に対して音声コマンドを発すると、ネットワーク５００に接続されたＩｏＴデバイス６００を実行コマンドにより制御することができる。

以上述べた少なくとも１つの実施形態によれば、音声コマンドに対する音声認識を支援するコマンド生成装置、生成方法および生成プログラムを提供することができる。

以上の実施形態においては、制御対象装置である受信装置１０やＩｏＴデバイス６００の上に制御部９０（補助情報管理部９１、状態情報管理部９２を含む）の機能を設置する例を示したが、制御部９０の機能の全てまたは一部を制御対象の外部の制御装置とするなどしても構わない。この場合、制御装置もネットワーク５００に接続される。コマンド制御装置についても同様に、装置内の機能と、その機能が実行されるハードウェアについてはいろいろな構成、組合せが考えられ、以上に示した実施形態の例に限定されるものではない。
（変形例）
本変形例においては、例えば、補助情報として、図５の「ユーザ識別情報」、「時間帯」を用いることで、子供の視聴制限や操作制限などのパレンタルコントロール（ＰａｒｅｎｔａｌＣｏｎｔｒｏｌ）を可能とする例を示す。テレビ装置を操作するリモコンなどは大人が管理しているものとする。

具体的には、子供が音声コマンドを発した場合に、音声分析部１２１によって声紋分析がなされ、補助情報取得部１６でユーザ識別情報として「子供」が取得され、コマンド生成部１１に入力されたとする。同時にその音声コマンドがコマンド認識部１３に入力され、認識コマンドが生成され、コマンド生成部１１に入力されたとする。コマンド生成部１１は、例えば、認識コマンド「電源ＯＦＦ」、補助情報「子供」に基づいて、実行コマンドとして「電源ＯＦＦ」を生成し、制御部９０に出力する。一方、コマンド生成部１１は、補助情報取得部１６からユーザ識別情報として「子供」を取得し、時間帯として「深夜」を取得したとする。この場合、コマンド生成部１１は、「子供」と「深夜」という補助情報のみから、例えば「現状態を維持するための実行コマンド」を生成することでもよい。

図５には図示されていないが、補助情報として「番組視聴対象」なども合わせて用いることでもパレンタルコントロールが可能である。例えば、コマンド認識部１３が、子供が発した音声コマンドにより制御対象部位が「チャネル（番組）」であることを認識したとする。コマンド認識部１３は、認識した制御対象部位を含めた認識情報を補助情報取得部１６に出力すると、補助情報取得部１６は、認識情報に含まれる制御対象部位「チャネル（番組）」に対する補助情報である「番組視聴対象」を放送信号受信処理部２０などから取得し、コマンド生成部１１に出力する。コマンド生成部１１は、音声分析部１２１から得たユーザ識別情報である「子供」と、「番組視聴対象」との２つの補助情報に基づいて、実行コマンドを生成する。例えば番組視聴対象に「子供」が含まれる場合は、認識コマンドをそのまま実行コマンドとして生成する。また、番組視聴対象に「子供」が含まれない場合は、例えば、「現状態を維持するための実行コマンド」を生成する。

以上、本変形例によれば、音声コマンドに対するパレンタルコントロールが可能となる。また本変形例によれば、認識コマンド、状態情報、補助情報のうち、認識コマンドを用いずに音声コマンドに基づいて取得した補助情報のみから実行コマンドを生成することが可能である。

以上述べた少なくとも１つの実施形態、変形例によれば、音声コマンドに対する音声認識を支援するコマンド制御装置、制御方法および制御プログラムを提供することができる。

上記した本装置は以下のように記載することもできる。
（Ａ−１）
入力された音声（音声コマンド）から動作制御情報（認識コマンド）を取得し、制御対象装置（受信装置１０）の動作状態を、第１モード、または、第１モードとは異なる第２モードのいずれかの動作状態とする動作制御手段（コマンド生成部１１）とを具備する電子装置（コマンド制御部１もしくはコマンド制御装置２）であって、
前記制御対象装置の動作状態が第１モードであり、かつ、
前記動作制御情報が前記第１モードでの動作状態に関するものであるとき、前記動作状態を、前記第２モードとする電子装置。
（Ａ−２）
前記制御対象装置の制御対象部位の状態に関する動作状態情報（状態情報）を取得する（Ａ−１）に記載の電子装置。
（Ａ−３）
前記動作制御情報および前記動作状態情報とは異なる制御条件情報（補助情報）を取得する（Ａ−１）または（Ａ−２）に記載の電子装置。
（Ａ−４）
前記制御条件情報が、時間帯、ユーザ識別情報、ユーザ属性、受信コンテンツ情報、放送事業者、配信事業者、および、録画コンテンツ管理者の群の少なくともいずれか１つに基づき設定される（Ａ−３）に記載の電子装置。
（Ａ−５）
入力された音声（音声コマンド）から動作制御情報（認識コマンド）を取得し、制御対象装置（受信装置１０）の動作状態を、第１モード、または、第１モードとは異なる第２モードのいずれかの動作状態とすることを
をコンピュータに実行させるための、プログラムであって、
前記制御対象装置の動作状態が第１モードであり、かつ、
前記動作制御情報が、前記第１モードでの動作状態に関するものであるとき、前記動作状態を、前記第２モードとする
上記のプログラム。

本発明のいくつかの実施形態を説明したが、これらの実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。さらにまた、請求項の各構成要素において、構成要素を分割して表現した場合、或いは複数を合わせて表現した場合、或いはこれらを組み合わせて表現した場合であっても本発明の範疇である。また、複数の実施形態を組み合わせてもよく、この組み合わせで構成される実施例も発明の範疇である。

また、図面は、説明をより明確にするため、実際の態様に比べて、各部の幅、厚さ、形状等について模式的に表される場合がある。ブロック図においては、結線されていないブロック間もしくは、結線されていても矢印が示されていない方向に対してもデータや信号のやり取りを行う場合もある。ブロック図に示される各機能や、フローチャート、シーケンスチャートに示す処理は、ハードウェア（ＩＣチップなど）もしくはソフトウェア（プログラムなど）もしくはハードウェアとソフトウェアの組み合わせによって実現してもよい。また請求項を制御ロジックとして表現した場合、コンピュータを実行させるインストラクションを含むプログラムとして表現した場合、及び前記インストラクションを記載したコンピュータ読み取り可能な記録媒体として表現した場合でも本発明の装置を適用したものである。また、使用している名称や用語についても限定されるものではなく、他の表現であっても実質的に同一内容、同趣旨であれば、本発明に含まれるものである。

１…コマンド制御部、２…コマンド制御装置、１０…受信装置、１１…コマンド生成部、１２…音声検知部、１３…コマンド認識部、１４…ユーザインターフェース部、１５…インターフェース部、１６…補助情報取得部、１７…状態情報取得部、１８…コマンド送信部、１９…制御部、２０…放送信号受信処理部、２１…補助情報出力部、３０…コンテンツ処理部、３１…補助情報出力部、４０…録画再生部、４１…補助情報出力部、５０…機器データ生成部、５１…補助情報出力部、６０…出力制御部、６２…状態切替部、７０…センサ部、７１…補助情報出力部、８０…メイン電源部、８２…状態切替部、９０…制御部、９１…補助情報管理部、９２…状態情報管理部、９３…時刻管理部、１００…リモコン、１０１…アンテナ、１０２…通信部、１０３…表示部、１０４…スピーカ部、１０５…インターフェース部、１１１…記憶部、１２１…音声分析部、２００…コンテンツサーバ装置、３００…視聴解析装置、４００…音声認識装置、５００…ネットワーク。

Claims

入力された音声に基づいて制御対象に対する制御命令を含む実行コマンドを生成するコマンド制御装置において、
前記音声を音声認識して得た認識コマンドに含まれる第１の制御命令と、前記第１の制御命令と異なる第２の制御命令とのいずれかを含む実行コマンドを生成することを特徴とするコマンド制御装置。
前記認識コマンドと、追加情報に基づいて前記実行コマンドを生成する請求項１に記載のコマンド制御装置。
前記認識コマンドと、前記追加情報に基づいて前記実行コマンドの生成有無を決定する請求項２に記載のコマンド制御装置。
前記認識コマンドと、前記追加情報に基づいて前記実行コマンドの送信有無を決定する請求項２に記載のコマンド制御装置。
前記追加情報は、前記実行コマンドにより制御する前記制御対象の制御状態である状態情報を含む請求項２乃至請求項４のいずれか１項に記載のコマンド制御装置。
前記追加情報は、前記制御対象の制御状態ではない補助情報を含む請求項２乃至請求項４のいずれか１項に記載のコマンド制御装置。
前記追加情報は、前記実行コマンドにより制御する前記制御対象の制御状態である状態情報と、前記制御対象の制御状態ではない補助情報を含む請求項２乃至請求項４のいずれか１項に記載のコマンド制御装置。
前記音声を認識して、前記認識コマンドを得る音声認識部と、
前記追加情報を得る追加情報取得手段と、
前記認識コマンドと、前記追加情報と、前記実行コマンドとの対応関係を記憶する記憶手段と、
前記対応関係から前記実行コマンドを生成する実行コマンド生成手段とを具備する請求項２に記載のコマンド制御装置。
入力された音声に基づいて制御対象機器に対する制御命令を含む実行コマンドを生成するコマンド制御方法において、
前記音声を認識して得た認識コマンドに含まれる第１の制御命令と、前記第１の制御命令と異なる第２の制御命令とのいずれかを含む実行コマンドを生成することを特徴とするコマンド制御方法。
コンピュータが、入力された音声に基づいて制御対象機器に対する制御命令を含む実行コマンドを生成する制御プログラムにおいて、
前記音声を認識して得た認識コマンドに含まれる第１の制御命令と、前記第１の制御命令と異なる第２の制御命令とのいずれかを含む実行コマンドを生成する制御プログラム。