JP2014071449A - 電子装置、サーバー及びその制御方法 - Google Patents
電子装置、サーバー及びその制御方法 Download PDFInfo
- Publication number
- JP2014071449A JP2014071449A JP2012272762A JP2012272762A JP2014071449A JP 2014071449 A JP2014071449 A JP 2014071449A JP 2012272762 A JP2012272762 A JP 2012272762A JP 2012272762 A JP2012272762 A JP 2012272762A JP 2014071449 A JP2014071449 A JP 2014071449A
- Authority
- JP
- Japan
- Prior art keywords
- command
- voice
- voice recognition
- user
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000004891 communication Methods 0.000 claims abstract description 25
- 238000004904 shortening Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
- H04N21/2335—Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/654—Transmission by server directed to the client
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/654—Transmission by server directed to the client
- H04N21/6543—Transmission by server directed to the client for forcing some client operations, e.g. recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/654—Transmission by server directed to the client
- H04N21/6547—Transmission by server directed to the client comprising parameters, e.g. for client setup
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6582—Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Selective Calling Equipment (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【課題】サーバーを利用してユーザの命令を認識することにおいて、ユーザの命令認識から動作の実行までの時間を短縮させる制御方法を提供する。
【解決手段】ユーザの音声命令を受信する命令受信部と、第1サーバーと通信する通信部と、保存部と、第1サーバーから音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つのユーザの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信して、保存部に保存されるようにし、音声命令が入力されれば、入力された音声命令が音声認識命令リストに含まれた音声認識命令に対応するか否かを確認して、対応する場合に音声認識命令の制御命令情報に基づいて動作するようにし、対応しない場合に入力された音声命令を第1サーバーに送信して第1サーバーから対応する制御命令情報を受信し、受信された制御命令情報に基づいて動作するように制御する制御部と、を含む。
【選択図】図1
【解決手段】ユーザの音声命令を受信する命令受信部と、第1サーバーと通信する通信部と、保存部と、第1サーバーから音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つのユーザの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信して、保存部に保存されるようにし、音声命令が入力されれば、入力された音声命令が音声認識命令リストに含まれた音声認識命令に対応するか否かを確認して、対応する場合に音声認識命令の制御命令情報に基づいて動作するようにし、対応しない場合に入力された音声命令を第1サーバーに送信して第1サーバーから対応する制御命令情報を受信し、受信された制御命令情報に基づいて動作するように制御する制御部と、を含む。
【選択図】図1
Description
本発明は、電子装置、サーバー及びその制御方法に係り、サーバーを利用してユーザの命令を認識及び動作する電子装置、サーバー及びその制御方法に関する。
一般的に、TV、セットトップボックス、DVDプレーヤー、エアコン、冷蔵庫、コンピュータ等の電子装置は、ユーザの命令に従って動作するのに、最近、製品が発展し機能が多様化されることによって、既存のリモコンを利用する入力方式を抜け出して、例えばマイクを通じる音声認識等のように多様な方式の命令に従って電子装置が制御されている。例えば、TVのような電子装置の場合、ユーザが“ボリューム20に変更せよ”と話せば、該当音声信号を受けて、音声認識技術を利用し解釈した後、TVのボリュームを20に変更する方法である。
電子装置がユーザの命令を正確に解釈するためには、命令を認識できる構成が必要なのに、電子装置の自体構成で命令を正確に認識することは限界があることもできるので、この場合には、例えば、ネットワークを通じる外部のサーバーを利用する方法がある。具体的に、音声認識の場合、電子装置は、ユーザの音声命令の内容をサーバーに送信して、サーバーに備わった音声認識構成を利用して当該音声命令に関するユーザの意図を分析して判断する。サーバーは当該音声命令に関するユーザの意図を分析した結果を電子装置に送信し、電子装置はその分析結果を利用して該当命令に対応する機能を行うことができる。
しかし、従来の技術による電子装置は、電子装置が自らユーザの命令を把握できない場合に、電子装置が必ずサーバーとの通信を通じてその分析結果を受けなければならない。したがって、電子装置がユーザの命令意図を認識し、その結果に従って動作するためには、電子装置とサーバーとの間のネットワークを利用する通信時間を必要とする。このようなユーザの命令に関する分析結果を得るための通信時間は、ネットワークの状態である。通信回数等の条件に従って変わることはできるだろうが、根本的に、このような通信時間は、ユーザの命令に対する認識から動作の実行までかかる時間を遅らせるという問題がある。
従って、本発明の目的は、ユーザの命令に対する認識から動作の実行までかかる時間を最大に短縮させることができる電子装置、サーバー及びその制御方法を提供することである。
本発明の前記目的は、ディスプレイ装置において、映像信号を処理する映像処理部と;前記映像信号に基づいて映像を表示するディスプレイ部と;ユーザの音声命令を受信する命令受信部と;第1サーバーと通信する通信部と;保存部と;前記第1サーバーから前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信して前記保存部に保存されるようにし、前記音声命令が入力されれば、前記入力された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認して、対応する場合に前記音声認識命令の制御命令情報に基づいて前記映像処理部が動作するようにし、対応しない場合に前記入力された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に基づいて前記映像処理部が動作するように制御する制御部と;を含むディスプレイ装置によって達成されることができる。
前記制御部は、前記音声命令と前記音声認識命令リストの音声認識命令の関連度に基づいて相互対応可否を判断することができる。
前記制御部は、前記第1サーバーに前記音声命令を送信した後に所定の時間以上が経過すれば、前記音声認識命令リストの音声認識命令に基づいて前記映像処理部が動作するように制御することができる。
前記制御部は、前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決めることができる。
前記制御部は、前記入力された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報とを前記第1サーバーに送信することができる。
前記制御部は、前記入力された音声命令を第2サーバーに送信し、前記第2サーバーから前記入力された音声命令を変換したテキストを受信して、前記受信されたテキストを前記第1サーバーに送信することができる。
前記制御部は、ユーザ別に発話された音声命令を前記保存部に保存し、前記保存された音声命令のリストをUI形態で表示することができる。
前記制御部は、ユーザの指示に従って前記音声命令に対応する識別記号を登録し、前記ユーザが前記登録された識別記号を発話すれば、該当音声命令が受信されたと判断することができる。
前記制御部は、ユーザが前記リスト上でいずれか一つの音声命令が配列された位置を発話すれば、該当音声命令が受信されたと判断することができる。
本発明の前記目的は、ディスプレイ装置の制御方法において、第1サーバーからユーザの音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信する段階と;前記受信された音声認識命令リストを前記ディスプレイ装置に保存する段階と;ユーザの音声命令を受信する段階と;前記受信された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認する段階と;対応する場合に前記音声認識命令の制御命令情報に従って動作する段階と;対応しない場合に前記受信された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に従って動作する段階と;を含むディスプレイ装置の制御方法によっても達成されることができる。
前記対応可否を確認する段階は、前記音声命令と、前記音声認識命令リストの音声認識命令との関連度に基づいて相互に対応可否を判断する段階を含むことができる。
ディスプレイ装置の制御方法は、前記第1サーバーに前記音声命令を送信した後に所定の時間以上に経過すれば、前記音声認識命令リストの音声認識命令に基づいて動作する段階をさらに含むことができる。
ディスプレイ装置の制御方法は、前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決める段階をさらに含むことができる。
ディスプレイ装置の制御方法は、前記受信された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報を前記第1サーバーに送信する段階をさらに含むことができる。
ディスプレイ装置の制御方法は、前記受信された音声命令を第2サーバーに送信する段階と;前記第2サーバーから前記受信された音声命令を変換したテキストを受信する段階と;をさらに含み、前記受信された制御命令情報に従って動作する段階は、前記受信されたテキストを前記第1サーバーに送信する段階をさらに含むことができる。
ディスプレイ装置の制御方法は、ユーザ別に発話された音声命令を前記ディスプレイ装置に保存する段階と;前記保存された音声命令のリストをUI形態で表示する段階と;をさらに含むことができる。
ディスプレイ装置の制御方法は、ユーザの指示に従って前記音声命令に対応する識別記号を登録する段階をさらに含み、前記音声命令を受信する段階は、前記ユーザが前記登録された識別記号を発話すれば、対応する前記音声命令が受信されたと判断する段階を含むことができる。
前記音声命令を受信する段階は、前記ユーザが前記リスト上でいずれか一つの音声命令が配列された位置を発話すれば、対応する前記音声命令が受信されたと判断する段階を含むことができる。
本発明の前記目的は、ディスプレイ装置に対するユーザの音声命令を分析するサーバーにおいて、複数のディスプレイ装置と通信する通信部と;ユーザの音声命令に関する情報を保存する保存部と;前記複数のディスプレイ装置からユーザの音声命令に対する分析要請が受信されれば、該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信し、前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを前記保存部に保存し、前記保存された音声認識命令リストを前記ディスプレイ装置に送信されるように制御する制御部と;を含むサーバーによっても達成されることができる。
前記制御部は、前記ディスプレイ装置から成功的に認識されたユーザの音声命令と、対応する制御命令情報が受信されるようにし、前記受信されたユーザの音声命令と対応する前記制御命令情報に基づいて前記音声認識命令リストと、を用意することができる。
本発明の前記目的は、ディスプレイ装置に対するユーザの音声命令を分析するサーバーの制御方法において、前記複数のディスプレイ装置からユーザの音声命令に対する分析要請を受信する段階と;該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信する段階と;前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストと、を前記保存部に保存する段階と;前記保存された音声認識命令リストを前記ディスプレイ装置に送信する段階と;を含むサーバーの制御方法によっても達成されることができる。
サーバーの制御方法は、前記ディスプレイ装置から成功的に認識されたユーザの音声命令と、対応する制御命令情報と、を受信する段階をさらに含み、前記保存する段階は、前記受信されたユーザの音声命令と対応する前記制御命令情報に基づいて前記音声認識命令リストを設ける段階を含むことができる。
前述のように、本発明によれば、サーバーを利用してユーザの命令を認識する方式において、ユーザの命令認識から動作の実行までかかる時間を最大に短縮することができる。
以下、本発明の一実施形態に対して詳しく説明する。図1は、本発明の一実施形態による電子装置及び分析サーバーを示すブロック図である。本発明の一実施形態による電子装置1と分析サーバー2は、ネットワーク3を通じて相互に連結される。電子装置1は、ユーザの命令に従って動作する機器として、例えば、TV、セットトップボックス、DVDプレーヤー、エアコン、冷蔵庫、コンピュータ、携帯電話、スマートフォン、スマートパッド等の家電機器あるいは個人端末機、プリンタ、コピー機等の事務機器等など電気/電子回路に基づいて動作する機器を含む。
本実施形態のユーザの命令は、ユーザの行為等によって電子装置1が所定の動作を行うことを決定することができるようにする情報を含む。また、本実施形態のユーザの命令は、電子装置1と分析サーバー2がその命令を把握するために命令に対する分析を行う。例えば、ユーザの命令は、ユーザの音声、ジェスチャー、特定の外観等を含む。以下、ユーザの命令は音声命令とし、電子装置1はTVのようなディスプレイ装置として、例えて説明する。
本実施形態のネットワーク3は、電子装置1と、分析サーバー2がユーザの音声命令に関する情報をやり取るために通信するのに利用される装置や、インフラを含み、有線及び/または無線のネットワークであることができる。
分析サーバー2は、ネットワーク3に連結されて、クライアントである電子装置1に対してユーザの音声命令に関するサービス、すなわち、ユーザの音声命令を分析し、その結果を電子装置1に提供する。本発明の一実施形態による分析サーバー2は、ユーザの音声命令の中で所定の回数以上に成功的に認識された少なくとも一つの音声命令(以下、‘音声認識命令’と言う)と、これに対応する制御命令情報を含む音声認識命令リストと、を電子装置1に送信する。制御命令情報は、音声認識命令を通じてユーザの意図どおり電子装置1が動作するようにする電子装置1の制御のための情報である。電子装置1は、分析サーバー2から受信した音声認識命令リストに基づいてユーザの音声命令を把握する。ユーザの音声命令が入力されれば、電子装置1は、ユーザの音声命令が受信した音声認識命令リストに含まれた音声認識命令に対応するか否かを確認し、対応すれば音声認識命令の制御命令情報に従って動作し、そうでなければユーザの音声命令を分析サーバー2に伝達する。分析サーバー2は、電子装置1から受信したユーザの音声命令を分析し、その対応する制御命令情報を電子装置1に送信する。電子装置1は、分析サーバー2から受信した制御命令情報に従って動作する。
このように、本発明の一実施形態によると、電子装置1はすべてのユーザの音声命令を分析サーバー2に送信しなく、分析サーバー2からあらかじめ受信した音声認識命令リストを優先的に利用してユーザの音声命令を把握し、保有している音声認識命令リストで把握し難い場合にだけ分析サーバー2から受信した制御命令情報に従って動作する。したがって、電子装置1と分析サーバー2との通信時間を最小化し、これによって、ユーザの音声命令の認識から動作の実行までかかる時間を最大に短縮することができる。
図2は本発明の一実施形態による電子装置1の構成を示すブロック図である。電子装置1は、動作遂行部11、命令受信部12、通信部13及び制御部14を含むことができる。電子装置1は、保存部15をさらに含むことができる。動作遂行部11は、電子装置1の固有の動作を行う。例えば、電子装置1がTVのようなディスプレイ装置である場合、動作遂行部11は、信号受信部111、映像処理部112及びディスプレイ部113を含むことができる。ただし、動作遂行部11は、電子装置1が具現された製品に固有な機能に対応することとして、図2に示す例に限定されない。
信号受信部111は、放送信号送信装置(図示せず)から送出される放送信号に含まれた映像信号を受信したり、DVDプレーヤー、BDプレーヤー等の映像機器から映像信号を受信したり、PCから映像信号を受信したり、スマートフォン、スマートパッド等のモバイル機器から映像信号を受信したり、インターネット等のネットワークを通じて映像信号を受信したり、USB保存媒体のような保存媒体に保存された映像コンテンツを映像信号として入力することができる。
映像処理部112は、信号受信部111により受信された映像信号を処理して映像が表示されるようにする。映像処理部112は、デコーディング、イメージ
エンハンシング、スケーリング等を含むことができる。ディスプレイ部113は、映像処理部112によって処理された映像信号に基づいて映像を表示する。ディスプレイ部113が映像を表示する方式は、制限されず、LCD、PDP、OLED等を含む。
エンハンシング、スケーリング等を含むことができる。ディスプレイ部113は、映像処理部112によって処理された映像信号に基づいて映像を表示する。ディスプレイ部113が映像を表示する方式は、制限されず、LCD、PDP、OLED等を含む。
命令受信部12は、ユーザの音声命令を受信する。命令受信部12は、例えば、ユーザの音声命令を受信する第1命令受信部121を含むことができる。第1命令受信部121は、受信されるユーザの音声命令を音声信号に変換するマイクを含むことができる。命令受信部12は、ユーザの操作命令を受信する第2命令受信部122をさらに含むことができる。第2命令受信部122はリモコン(図示せず)からユーザの操作命令に対応するキー入力情報を含むリモコン信号を受信するリモコン信号受信部で具現されたり、電子装置1に設けられてユーザの操作に対応してキー入力情報を生成する操作パネルで具現されることができる。
通信部13は、ネットワーク3を通じて分析サーバー2と通信する。通信部13は、制御部14の制御に従ってユーザの音声命令及びその分析結果に関する情報を分析サーバー2とやり取る。
制御部14は、ユーザの音声命令に従って動作遂行部11が動作を行うように制御する。制御部14は、通信部13を通じて分析サーバー2から音声認識命令リストが受信されれば、受信された音声認識命令リスト151を保存部15に保存する。制御部14は、命令受信部12を通じてユーザの音声命令が受信されれば、ユーザの音声命令が保存された音声認識命令リスト151に含まれた音声認識命令に対応するかを確認し、対応すれば保存された音声認識命令リスト151の音声認識命令に対応する制御命令情報に従って動作するように動作遂行部11を制御する。一方、制御部14はユーザの音声命令が保存された音声認識命令リスト151に含まれた音声認識命令に対応しなければ、ユーザの音声命令が分析サーバー2に送信されるように通信部13を制御し、分析サーバー2から該当音声命令に対応する制御命令情報が受信されれば、受信された制御命令情報に従って動作するように動作遂行部11を制御する。
制御部14は、CPUを含み、制御プログラムを実行して動作することができる。制御部14は、制御プログラムを保存するためのフラッシュメモリー等の非揮発性のメモリーと、CPUが迅速にアクセスするように保存された制御プログラムの少なくとも一部をローディングするDDRのような揮発性のメモリーと、をさらに含むことができる。制御部14の制御プログラムは、動作遂行部11の動作を制御するための内容でプログラムされる。
図3は本発明の一実施形態による分析サーバー2の構成を示すブロック図である。分析サーバー2は、通信部21、制御部22及び保存部231を含む。通信部21は、ネットワーク3を通じて電子装置1の通信部13と通信する。制御部22は、分析サーバー2の動作を制御する。保存部23は非揮発性のメモリーとしてユーザの音声命令に対応する音声認識命令リストを保存する。制御部22は保存部23に保存された音声認識命令リストが電子装置1に送信されるように通信部21を制御する。制御部22は、通信部13を通じて電子装置1からユーザの音声命令とその分析要請が受信されれば、受信されたユーザの音声命令を分析する。制御部22は、該当ユーザの音声命令の分析結果が電子装置1に送信されるように通信部21を制御する。
図4は、本発明の一実施形態による電子装置1の動作を示すフローチャートである。まず、動作S41で、電子装置1は、分析サーバー2から音声認識命令リストを受信する。受信された音声認識命令リスト151は、保存部15に保存されることができる。図5は、本発明の一実施形態による音声認識命令リスト151の構成の一例を示す。音声認識命令リスト151は、複数の音声認識命令(‘音声認識命令1’、‘音声認識命令2’、‘音声認識命令3’、…)と、これらに各々対応する複数の制御命令情報(‘制御命令情報1’、‘制御命令情報2’、‘制御命令情報3’、…)を含むことができる。複数の音声認識命令は、例えば、‘電源つけろ’、‘電源消せ’、‘ボリューム上げろ’等の命令であることができる。複数の制御命令情報は、複数の音声認識命令各々に対応して電子装置1が行うようになっている動作ないし機能に関する装置固有の制御情報を含むことができる。
電子装置1は、電子装置1の電源がターンオンされる場合に分析サーバー2に音声認識命令リストの送信を要請することができる。分析サーバー2は、電子装置1から音声認識命令リストの送信の要請があれば、音声認識命令リストを電子装置1に送信することができる。電子装置1は、分析サーバー2から受信した音声認識命令リストを保存部15に保存することができる。電子装置1は、保存部15にすでに受信して保存された音声認識命令リスト151が存在する場合に、保存された音声認識命令リスト151と現在分析サーバー2から受信した音声認識命令リストを比較して、受信した音声認識命令リストに基づいて保存された音声認識命令リスト151をアップデートすることもできる。
また、図4に示すように、動作S42で、電子装置1はユーザの音声命令を受信する。次に、動作S43で、電子装置1は受信されたユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令に対応するか否かを確認する。図6は、本発明の一実施形態によって、既に受信された音声認識命令リストに含まれた音声認識命令に音声命令の対応可否を判断する動作を示すフローチャートである。
先に、動作S61で、電子装置1はユーザの音声命令を受信する。次に、動作S62で、電子装置1は受信された音声命令と音声認識命令リストの音声認識命令との関連度を判断する。本実施形態での関連度は、例えば、受信された音声命令が音声認識命令リストに含まれた対応する音声認識命令との類似度によって決定されることができる。例えば、ユーザが‘電源を消せ’と命令した場合に、音声認識命令リストにこれと実質的に同じ‘電源を消せ’という音声認識命令が含まれていれば、該当音声命令と対応する音声認識命令リストの音声認識命令との関連度は最も高いと判断されることができる。他の例として、ユーザが‘ボリュームを高めろ’と命令した場合に、音声認識命令リストには‘ボリュームを上げろ’という音声命令が存在すれば、両者はその意味で類似性が高いとすることができる。この場合、電子装置1は該当音声命令と、対応する音声認識命令リストの音声認識命令との関連度が所定分以上であると判断することができる。また他の例として、ユーザが‘画面を明るくしろ’と命令した場合に、音声認識命令リストにこれと類似な音声認識命令が存在しないと確認されれば、該当音声命令と対応する音声認識命令リストの音声認識命令との関連度が所定分未満である場合と判断することができる。
また、図6に示すように、動作S63で、既に受信された音声認識命令リストに音声命令との関連度が所定分以上である音声認識命令が存在すると判断されれば、動作S64で、電子装置1は該当音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応すると判断する。反面、動作S63で、既に受信された音声認識命令リストに音声命令との関連度が所定分以上である音声認識命令が存在しないと判断されれば、動作S64で、電子装置1は該当音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応しないと判断する。
また、図4に示すように、万一、動作S44で、ユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令に対応すると判断されれば、動作S45で、電子装置1は音声認識命令リストの音声認識命令に対応する制御命令情報に従って動作する。例えば、電子装置1はユーザの‘電源を消せよ’、‘ボリュームを高めろ’等の音声命令に対応して、音声認識命令リストに含まれた‘電源を消せよ’、‘ボリュームを上げろ’等の音声認識命令に対応する制御命令情報を参照して該当動作を行う。
一方、動作S46で、ユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応しないと判断されれば、動作S46で、電子装置1は該当ユーザの音声命令を分析サーバー2に送信する。例えば、電子装置1は、ユーザの‘画面を明るくしろ’の音声命令が音声認識命令リストによって分析可能でなければ、’画面を明るくしろ’の音声命令の情報を分析サーバー2に送信する。次に、動作S47で、電子装置1は、分析サーバー2から該当音声命令に対応する制御命令情報を受信する。例えば、電子装置1は、‘画面を明るくしろ’の音声命令の分析結果として該当音声命令に対応する制御命令情報を受信する。次に、動作S47で、電子装置1は受信した制御命令情報に従って動作する。
図12は、本発明の一実施形態によるSTT(Speech−To−Text)サーバーの一例を示す。電子装置1は、ユーザの音声命令、ユーザが発話した音声の情報をテキストの形態で処理することができる。例えば、電子装置1は、受信されたユーザの音声命令をSTTサーバー4に送信する。STTサーバー4は、電子装置1から受信されたユーザの音声命令を対応するテキストに変換するSTT変換部41を含む。STTサーバー4は、ユーザの音声命令を変換したテキストを電子装置1に送信する。電子装置1は、STTサーバー4から受信されたテキストを利用してユーザの音声命令が保存された音声認識命令リストに含まれた音声認識命令との対応可否を判断することができる。電子装置1は、STTサーバー4から受信されたテキストをサーバー1に送信してユーザの音声命令に対する分析を要請することもできる。
図7は、本発明の一実施形態による電子装置1の動作の他の例を示すフローチャートである。本実施形態では、ユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応しないと判断される場合に対して説明する。まず、動作S71で、電子装置1は、ユーザの音声命令を分析サーバー2に送信する。次に、動作S72で、電子装置1は分析サーバー2からユーザの音声命令に対応する制御命令情報の受信可否を確認する。万一、分析サーバー2からユーザの音声命令に対応する制御命令情報が受信されると、動作S73で、電子装置1は分析サーバー2から受信された制御命令情報に従って動作する。一方、分析サーバー2からユーザの音声命令に対応する制御命令情報がまだ受信されなかったら、動作S74で、電子装置1は分析サーバー2にユーザの音声命令を送信して所定時間の経過可否を確認する。万一、まだ所定時間が経過しなかったら、動作S72がまた遂行される。しかし、所定時間が経過すれば、動作S74で、電子装置1は既に受信された音声認識命令リストの音声認識命令に基づいて動作する。
例えば、ユーザが‘画面を消せよ’と命令した場合、電子装置1は音声認識命令リストに‘画面を小さくしろ’という音声命令はあるが、その関連度が所定未満だと判断して分析サーバー2にその分析結果を要請することができる。しかし、通信条件等の問題で分析サーバー2から分析結果の受信まで時間が長くかかる場合、ユーザが、動作が行われる時までずっと待ち難いと言う問題がある。この場合、電子装置1は分析サーバー2に分析結果を要請してから所定時間が経過した場合に、その関連度が所定未満だと判断された音声認識命令を利用して迅速に動作することができるようにする。例えば、電子装置1は、ユーザの‘画面を減らせよ’の音声命令に対応して音声認識命令リストの‘画面小さくしろ’に対応する音声認識命令に従って動作する。万一、該当音声命令と関連度がある音声認識命令がいくつかある場合、電子装置1は複数の音声認識命令の中で関連度が最も高いいずれか一つを優先的に選択して動作することができる。したがって、本実施形態では、ユーザが動作を待つ時間を最小化することができるので、ユーザの便宜がさらに向上される。
追加的な実施形態として、関連度の低い音声認識命令を利用する場合にユーザの意図と合わないこともあるので、このような誤った動作を防止する必要がある。図8は、本発明の一実施形態による電子装置1の動作のまた他の例を示すフローチャートである。本実施形態では、図7の実施形態で、分析サーバー2に分析を要請してから所定時間が経過し、音声命令との関連度がある程度あると判断された音声認識命令が存在する場合を例えて説明する。まず、動作S81で、電子装置1は該当音声命令との関連度がある程度あると判断された音声認識命令に従って動作する前にあらかじめ、該当音声認識命令の内容をユーザに通知する。具体的に、電子装置1は、現在のユーザの音声命令が関連度がある程度あると判断された音声認識命令に該当可否をユーザに問い合わせして確認するようにするメッセージをディスプレイ部113に表示することができる。例えば、ユーザが‘画面減らせよ’という音声命令をした場合に、音声認識命令リストに含まれた‘画面小さくしろ’の音声認識命令がユーザの意図に該当するかを問うメッセージを例えることができる。次に、動作S82で、電子装置1は第2命令受信部122等を通して該当音声認識命令に対するユーザの意思を受信する。万一、動作S83で、ユーザが音声認識命令に同意したと判断されれば、動作S84で、電子装置1は該当音声認識命令に従って動作する。しかし、動作S84で、ユーザが音声認識命令に同意しないと判断されれば、電子装置1は該当音声認識命令に従って動作しない。したがって、本実施形態によると、ユーザの意思にさらに近づくように動作してユーザの便宜をさらに向上させることができる。
他の実施形態として、ユーザの音声命令に対応すると判断される音声認識命令リストに含まれた音声認識命令のない場合、電子装置1は音声認識命令リストに含まれた複数の音声認識命令を表示し、ユーザが複数の音声認識命令の中でユーザの音声命令の意図に合ういずれか一つを選択するようにすることもできる。複数の音声認識命令の中でユーザがいずれか一つを選択すれば、電子装置1は選択された音声認識命令に対応する制御命令情報に基づいて動作されるように制御する。
電子装置1は、保存された音声認識命令リストにユーザの音声命令に対応する音声認識命令が含まれていないと判断された状況で、ユーザの意思に従ってユーザの音声命令が成功的に認識された場合、該当音声命令を新しい音声認識命令として対応する制御命令情報とともに音声認識命令リストに追加して保存する。この場合、電子装置1は、新しく成功的に認識された音声命令と対応する制御命令情報を分析サーバー2に送信して、分析サーバー2が音声認識命令リストをアップデートすることができるようにする。
図13は本発明の一実施形態による保存された音声命令のリストを示すUIの一例を示す。電子装置1は、ユーザが発話した音声命令を貯蔵して、ユーザの要請に従って、保存された音声命令のリストをUI131の形態で表示することができる。図13に示すように、UI131を通じて表示される保存された音声命令のリストは、ユーザが既に発話した音声命令132を表示する。電子装置1は、ユーザ別に発話された音声命令を保存し、ユーザ別に(符号133参照)既に保存された音声命令132を表示することができる。音声命令のリストの音声命令132は、ユーザがしばしば発話した音声命令の順でソーティングされて表示されることができる。従って、ユーザは、UI131を通じて以前に自身が発話した音声命令を容易に見ることができるので、音声命令の発話に対する便宜性が向上される。
選択的な実施形態として、電子装置1はユーザが音声命令別に対応する識別記号を登録するようにし、後にユーザが登録された識別記号を発話すれば、対応する音声命令が受信されたと判断することができる。保存された音声命令のリストのUI131は、各音声命令に対応する識別記号134をさらに表示することができる。例えば、‘明日の天気を知らせてくれ’のような音声命令に対して、識別記号‘1’を登録しておけば、ユーザが識別記号‘1’を発話すれば、電子装置1はこれに対応する‘明日の天気を知らせてくれ’の音声命令が発話されたと判断する。従って、ユーザは長く複雑な文章のような音声命令を簡単な識別記号に変えて命令することができるので、ユーザの便宜性がさらに向上される。電子装置1はユーザの指示に従ってUI131のリストで、音声命令を削除したり新しい音声命令を追加することができる。
他の実施形態として、電子装置1は、ユーザが音声命令のリストのUI131上でいずれか一つの音声命令が配列された位置を発話する場合、該当音声命令が受信されることと判断することができる。例えば、リストのUI131が表示された状態でユーザが‘一番目’と発話すれば、電子装置1はリストのUI131で一番目に位置した‘明日の天気を知らせてくれ’の音声命令が発話されたと判断することができる。
また、電子装置1は、ユーザの指示に従って保存された音声命令のリストのUI131上の音声命令の順序を編集することができる。図14は、UI131上の音声命令の順序を編集する状況を示す。例えば、図14に示すように、電子装置1は、ユーザの指示に従って‘%%%が出る放送を切り替えろ’の命令と、‘$$$ニュース録画してくれ’の命令の順序を互いに変えることができる。この場合、対応する識別記号はそのまま維持することもできるし、二つの命令の識別記号が互いに変わることもできる。
図9は、本発明の一実施形態による電子装置1と、分析サーバー2aの構成の一例を示す。本実施形態の分析サーバー2aに対して、図1乃至図8を参照して説明した分析サーバー2と同一ないし類似な構成に対する説明は省略する。本実施形態の分析サーバー2aは、複数の電子装置1と通信を行う。分析サーバー2aは、複数の電子装置1各々からユーザの音声命令に対する分析要請があれば、これに対応して音声命令を分析し、その分析結果を該当電子装置1に送信する。また、分析サーバー2aは、複数の電子装置1から受信されるユーザの音声命令を収集し、これに基づいて音声認識命令リストを準備して、準備した音声認識命令リストを複数の電子装置1に提供する。
図10は、本発明の一実施形態による分析サーバー2aの動作を示すフローチャートである。まず、動作S101で、分析サーバー2aは、電子装置1からユーザの音声命令に対する分析要請を受信する。次に、動作S102で、分析サーバー2aは該当音声命令に対して分析し、これに対応する分析結果である対応する制御命令情報を要請した電子装置1に送信する。次に、動作S103で、分析サーバー2aは、複数の電子装置1から収集されたユーザの音声命令と、その分析結果に基づいて音声認識命令リストを用意して、用意された音声認識命令リストを保存部23に保存する。また、分析サーバー2aは、複数の電子装置1から持続的に収集されるユーザの音声命令と、その分析結果に基づいて保存部23に保存された音声認識命令リスト251をアップデートすることができる。次に、動作S103で、分析サーバー2aは、保存部23に保存された音声認識命令リスト231を複数の電子装置1に送信する。
選択的な実施形態として、電子装置1は、図8に示すように、ユーザの音声命令が音声認識命令リストの音声認識命令との関連度が低く判断されたが、ユーザが動作を許諾した(成功的に認識された)音声命令がある場合に、該当音声命令と対応する制御命令情報を分析サーバー2aに送信することができる。または、電子装置1は、新しい音声命令が成功的に認識された場合、該当音声命令と対応する制御命令情報を分析サーバー2aに送信することができる。この場合、分析サーバー2aは、受信された音声命令と対応する制御命令情報を音声認識命令リストの生成に反映することができる。
図11は、本発明の一実施形態による分析サーバー2aの動作を示すフローチャートである。まず、動作S101で、分析サーバー2aは、複数の電子装置1から収集されたユーザの音声命令に対して成功的に認識された回数を判断する。即ち、分析サーバー2aは、複数の電子装置1から収集されたユーザの音声命令の中で、どれがしばしば成功的に認識されるかを判断する。次に、動作S102で、分析サーバー2aは、収集されたどの音声命令の成功回数が所定分以上であるかを判断する。万一、該当音声命令の成功回数が所定分以上である場合には、動作S103で、分析サーバー2aは該当音声命令とその制御命令情報を新しい音声認識命令として音声認識命令リストに追加することができる。しかし、該当音声命令の成功回数が所定分未満である場合には、分析サーバー2aは、該当音声命令とその制御命令情報を音声認識命令リストに追加しない。したがって、本実施形態によれば、成功回数が所定分以上である音声命令だけで音声認識命令リストを用意することによって、音声認識命令リストの送信時間と、電子装置1が音声認識命令リストの処理に入れる動作を最小化することができる。
以上、多様な実施形態を通じて本発明に対して図示し説明したが、本発明はこれに限定されず、特許請求の範囲の内で多用に実施されることができる。
1 電子装置
2 分析サーバー
4 STTサーバー
11 動作遂行部
12 命令受信部
13 通信部
14 制御部
15 保存部
2 分析サーバー
4 STTサーバー
11 動作遂行部
12 命令受信部
13 通信部
14 制御部
15 保存部
Claims (15)
- ディスプレイ装置において、
映像信号を処理する映像処理部と;
前記映像信号に基づいて映像を表示するディスプレイ部と;
ユーザの音声命令を受信する命令受信部と;
第1サーバーと通信する通信部と;
保存部と;
前記第1サーバーから前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信して、前記保存部に保存されるようにし、前記音声命令が入力されれば、前記入力された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認して、対応する場合に前記音声認識命令の制御命令情報に基づいて前記映像処理部が動作するようにし、対応しない場合に前記入力された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に基づいて前記映像処理部が動作するように制御する制御部と;を含むことを特徴とするディスプレイ装置。 - 前記制御部は、前記音声命令と、前記音声認識命令リストの音声認識命令との関連度に基づいて相互に対応可否を判断することを特徴とする請求項1に記載のディスプレイ装置。
- 前記制御部は、前記第1サーバーに前記音声命令を送信した後に所定の時間以上に経過すれば、前記音声認識命令リストの音声認識命令に基づいて前記映像処理部が動作するように制御することを特徴とする請求項1に記載のディスプレイ装置。
- 前記制御部は、前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決めることを特徴とする請求項1に記載のディスプレイ装置。
- 前記制御部は、前記入力された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報とを前記第1サーバーに送信することを特徴とする請求項1に記載のディスプレイ装置。
- 前記制御部は、前記入力された音声命令を第2サーバーに送信し、前記第2サーバーから前記入力された音声命令を変換したテキストを受信して、前記受信されたテキストを前記第1サーバーに送信することを特徴とする請求項1に記載のディスプレイ装置。
- ディスプレイ装置の制御方法において、
第1サーバーからユーザの音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信する段階と;
前記受信された音声認識命令リストを前記ディスプレイ装置に保存する段階と;
ユーザの音声命令を受信する段階と;
前記受信された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認する段階と;
対応する場合、前記音声認識命令の制御命令情報に従って動作する段階と;
対応しない場合、前記受信された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に従って動作する段階を含むことを特徴とするディスプレイ装置の制御方法。 - 前記対応可否を確認する段階は、前記音声命令と、前記音声認識命令リストの音声認識命令との関連度に基づいて相互に対応可否を判断する段階を含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
- 前記第1サーバーに前記音声命令を送信した後に所定の時間以上に経過すれば、前記音声認識命令リストの音声認識命令に基づいて動作する段階をさらに含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
- 前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決める段階をさらに含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
- 前記受信された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報とを前記第1サーバーに送信する段階をさらに含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
- 前記受信された音声命令を第2サーバーに送信する段階と;
前記第2サーバーから前記受信された音声命令を変換したテキストを受信する段階をさらに含み、
前記受信された制御命令情報に従って動作する段階は、前記受信されたテキストを前記第1サーバーに送信する段階を含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。 - ディスプレイ装置に対するユーザの音声命令を分析するサーバーにおいて、
複数のディスプレイ装置と通信する通信部と;
ユーザの音声命令に関する情報を保存する保存部と;
前記複数のディスプレイ装置からユーザの音声命令に対する分析要請が受信されれば、該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信し、前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを前記保存部に保存し、前記保存された音声認識命令リストを前記ディスプレイ装置に送信されるように制御を行う制御部と;
を含むことを特徴とするサーバー。 - 前記制御部は、前記ディスプレイ装置から成功的に認識されたユーザの音声命令と、対応する制御命令情報が受信されるようにし、前記受信されたユーザの音声命令と対応する前記制御命令情報に基づいて前記音声認識命令リストを設けることを特徴とする請求項13に記載のサーバー。
- ディスプレイ装置に対するユーザの音声命令を分析するサーバーの制御方法において、
前記複数のディスプレイ装置からユーザの音声命令に対する分析要請を受信する段階と;
該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信する段階と;
前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを前記保存部に保存する段階と;
前記保存された音声認識命令リストを前記ディスプレイ装置に送信する段階と;
を含むことを特徴とするサーバーの制御方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2012-0109453 | 2012-09-28 | ||
KR20120109453 | 2012-09-28 | ||
KR1020120117193A KR101330671B1 (ko) | 2012-09-28 | 2012-10-22 | 전자장치, 서버 및 그 제어방법 |
KR10-2012-0117193 | 2012-10-22 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013256372A Division JP2014071457A (ja) | 2012-09-28 | 2013-12-11 | 電子装置、サーバー及びその制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014071449A true JP2014071449A (ja) | 2014-04-21 |
Family
ID=49857999
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012272762A Pending JP2014071449A (ja) | 2012-09-28 | 2012-12-13 | 電子装置、サーバー及びその制御方法 |
JP2013256372A Pending JP2014071457A (ja) | 2012-09-28 | 2013-12-11 | 電子装置、サーバー及びその制御方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013256372A Pending JP2014071457A (ja) | 2012-09-28 | 2013-12-11 | 電子装置、サーバー及びその制御方法 |
Country Status (10)
Country | Link |
---|---|
US (4) | US9582245B2 (ja) |
EP (3) | EP2750129A1 (ja) |
JP (2) | JP2014071449A (ja) |
KR (4) | KR101330671B1 (ja) |
CN (2) | CN109979465B (ja) |
AU (1) | AU2012261531A1 (ja) |
BR (1) | BR102013002468B1 (ja) |
FR (1) | FR2996343B3 (ja) |
RU (1) | RU2627117C2 (ja) |
WO (1) | WO2014051207A1 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018120202A (ja) * | 2016-11-02 | 2018-08-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及びプログラム |
CN109493851A (zh) * | 2018-11-20 | 2019-03-19 | 新视家科技(北京)有限公司 | 一种语音控制方法、相关装置及存储介质 |
CN112219235A (zh) * | 2018-05-24 | 2021-01-12 | 三星电子株式会社 | 包括处理用户语音的电子设备和控制电子设备上语音识别的方法的系统 |
JP2021176015A (ja) * | 2018-06-27 | 2021-11-04 | グーグル エルエルシーGoogle LLC | 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング |
JP2022512357A (ja) * | 2018-12-11 | 2022-02-03 | チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド | 音声制御方法、クラウドサーバおよび端末装置 |
JP2022513785A (ja) * | 2018-12-11 | 2022-02-09 | チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド | 音声制御方法、クラウドサーバおよび端末装置 |
JP2022112292A (ja) * | 2021-01-21 | 2022-08-02 | Tvs Regza株式会社 | 音声コマンド処理回路、受信装置、サーバ、システム、方法およびプログラム |
JP2022539675A (ja) * | 2019-10-15 | 2022-09-13 | グーグル エルエルシー | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
WO2023000697A1 (zh) * | 2021-07-23 | 2023-01-26 | 北京百度网讯科技有限公司 | 通过语音方式控制程序的方法、设备及程序产品 |
Families Citing this family (108)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR20130125067A (ko) * | 2012-05-08 | 2013-11-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
AU2014214676A1 (en) | 2013-02-07 | 2015-08-27 | Apple Inc. | Voice trigger for a digital assistant |
US10157618B2 (en) | 2013-05-02 | 2018-12-18 | Xappmedia, Inc. | Device, system, method, and computer-readable medium for providing interactive advertising |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
CN104517606A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(深圳)有限公司 | 语音识别测试方法及装置 |
KR102246893B1 (ko) * | 2013-12-11 | 2021-04-30 | 삼성전자주식회사 | 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법 |
US9767803B1 (en) * | 2013-12-16 | 2017-09-19 | Aftershock Services, Inc. | Dynamically selecting speech functionality on client devices |
US9674306B2 (en) * | 2013-12-20 | 2017-06-06 | The Directv Group, Inc. | Method and system for communicating from a client device to a server device in a centralized content distribution system |
CN105023575B (zh) * | 2014-04-30 | 2019-09-17 | 中兴通讯股份有限公司 | 语音识别方法、装置和系统 |
JP6551401B2 (ja) * | 2014-05-01 | 2019-07-31 | ソニー株式会社 | 通信装置又は通信方法、並びにコンピューター・プログラム |
CN103985160B (zh) * | 2014-05-12 | 2017-01-18 | 深圳市威富多媒体有限公司 | 一种基于计算机及语音控制的车牌管理方法及装置 |
JP6440513B2 (ja) * | 2014-05-13 | 2018-12-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
KR102225404B1 (ko) * | 2014-05-23 | 2021-03-09 | 삼성전자주식회사 | 디바이스 정보를 이용하는 음성인식 방법 및 장치 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9589567B2 (en) * | 2014-06-11 | 2017-03-07 | Honeywell International Inc. | Plant control system using voice as a control mechanism |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN105448293B (zh) * | 2014-08-27 | 2019-03-12 | 北京羽扇智信息科技有限公司 | 语音监听及处理方法和设备 |
KR102304052B1 (ko) * | 2014-09-05 | 2021-09-23 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 동작 방법 |
KR20160056548A (ko) * | 2014-11-12 | 2016-05-20 | 삼성전자주식회사 | 질의 응답을 위한 디스플레이 장치 및 방법 |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
KR101642918B1 (ko) * | 2015-08-03 | 2016-07-27 | 서치콘주식회사 | 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
FR3045909B1 (fr) * | 2015-12-17 | 2017-12-29 | Delta Dore | Procede et dispositif d'analyse et de repartition de commandes vocales |
CN105578240A (zh) * | 2015-12-23 | 2016-05-11 | 广州视源电子科技股份有限公司 | 电视终端交互方法和系统 |
CN105719650A (zh) * | 2016-01-30 | 2016-06-29 | 深圳市尔木科技有限责任公司 | 一种语音识别的方法及系统 |
US9898250B1 (en) * | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US9858927B2 (en) * | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
CN105913839A (zh) * | 2016-05-30 | 2016-08-31 | 合肥华凌股份有限公司 | 一种智能冰箱、服务器及语音控制系统和方法 |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10271093B1 (en) * | 2016-06-27 | 2019-04-23 | Amazon Technologies, Inc. | Systems and methods for routing content to an associated output device |
KR20180043627A (ko) * | 2016-10-20 | 2018-04-30 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 장치를 제어하는 방법 |
CN108010522A (zh) | 2016-11-02 | 2018-05-08 | 松下电器(美国)知识产权公司 | 信息处理方法以及记录介质 |
CN108010523B (zh) * | 2016-11-02 | 2023-05-09 | 松下电器(美国)知识产权公司 | 信息处理方法以及记录介质 |
US10937421B2 (en) * | 2016-12-23 | 2021-03-02 | Spectrum Brands, Inc. | Electronic faucet with smart features |
US11176932B2 (en) * | 2016-12-23 | 2021-11-16 | Spectrum Brands, Inc. | Electronic faucet with smart features |
CN107086037A (zh) * | 2017-03-17 | 2017-08-22 | 上海庆科信息技术有限公司 | 一种嵌入式设备的语音交互方法、装置及嵌入式设备 |
CN107135443B (zh) * | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
KR20180118461A (ko) | 2017-04-21 | 2018-10-31 | 엘지전자 주식회사 | 음성 인식 장치 및 음성 인식 방법 |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10475454B2 (en) * | 2017-09-18 | 2019-11-12 | Motorola Mobility Llc | Directional display and audio broadcast |
CN109559759B (zh) * | 2017-09-27 | 2021-10-08 | 华硕电脑股份有限公司 | 具备增量注册单元的电子设备及其方法 |
KR102417524B1 (ko) * | 2017-10-13 | 2022-07-07 | 현대자동차주식회사 | 음성 인식 기반의 자동차 제어 방법 |
FR3073067B1 (fr) * | 2017-10-27 | 2020-11-13 | Deepor | Procede de pilotage d'une salle notamment operatoire d'un plateau medico-technique |
KR102480728B1 (ko) * | 2017-11-10 | 2022-12-23 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
KR102517219B1 (ko) * | 2017-11-23 | 2023-04-03 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
KR102528466B1 (ko) * | 2017-12-19 | 2023-05-03 | 삼성전자주식회사 | 복수 화자의 음성 신호 처리 방법 및 그에 따른 전자 장치 |
EP4319174A3 (en) * | 2018-01-08 | 2024-04-24 | LG Electronics Inc. | Display device and system comprising same |
KR102488001B1 (ko) * | 2018-01-22 | 2023-01-13 | 삼성전자주식회사 | 오디오 신호를 이용하여 사용자를 인증하는 전자 장치 및 그 방법 |
US20190251956A1 (en) * | 2018-02-15 | 2019-08-15 | DMAI, Inc. | System and method for prediction based preemptive generation of dialogue content |
WO2019161229A1 (en) | 2018-02-15 | 2019-08-22 | DMAI, Inc. | System and method for reconstructing unoccupied 3d space |
US11455986B2 (en) * | 2018-02-15 | 2022-09-27 | DMAI, Inc. | System and method for conversational agent via adaptive caching of dialogue tree |
JP7003720B2 (ja) * | 2018-02-19 | 2022-01-21 | コニカミノルタ株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
KR102576388B1 (ko) * | 2018-02-21 | 2023-09-08 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 동작 방법 |
KR20190102509A (ko) * | 2018-02-26 | 2019-09-04 | 삼성전자주식회사 | 음성 명령을 수행하는 방법 및 시스템 |
KR102533443B1 (ko) * | 2018-05-04 | 2023-05-17 | 삼성전자 주식회사 | 콘텐츠 제공 방법 및 이를 사용하는 전자 장치 |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
KR102458336B1 (ko) | 2018-05-18 | 2022-10-25 | 삼성전자주식회사 | 공기 조화 장치 및 이의 제어 방법 |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
CN108510990A (zh) * | 2018-07-04 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、用户设备及存储介质 |
KR102527107B1 (ko) * | 2018-08-08 | 2023-05-02 | 삼성전자주식회사 | 음성에 기반하여 기능을 실행하기 위한 방법 및 이를 지원하는 사용자 전자 장치 |
KR102563314B1 (ko) * | 2018-08-30 | 2023-08-04 | 삼성전자주식회사 | 전자 장치 및 단축 명령어의 바로가기 생성 방법 |
CN110910869B (zh) * | 2018-09-14 | 2022-02-18 | 成都启英泰伦科技有限公司 | 一种语音识别方法和设备 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
KR20200042627A (ko) * | 2018-10-16 | 2020-04-24 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN109448709A (zh) * | 2018-10-16 | 2019-03-08 | 华为技术有限公司 | 一种终端投屏的控制方法和终端 |
KR20200043075A (ko) | 2018-10-17 | 2020-04-27 | 삼성전자주식회사 | 전자 장치 및 그 제어방법, 전자 장치의 음향 출력 제어 시스템 |
KR102651413B1 (ko) * | 2018-10-17 | 2024-03-27 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
CN109408024A (zh) * | 2018-10-18 | 2019-03-01 | 珠海格力电器股份有限公司 | 信息交互方法及装置、存储介质、处理器 |
US10885912B2 (en) * | 2018-11-13 | 2021-01-05 | Motorola Solutions, Inc. | Methods and systems for providing a corrected voice command |
CN109495360A (zh) * | 2018-12-18 | 2019-03-19 | 深圳国美云智科技有限公司 | 一种智能家居物联平台、离线语音控制方法及系统 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN111754996A (zh) * | 2019-03-29 | 2020-10-09 | 阿里巴巴集团控股有限公司 | 基于语音模拟遥控器的控制方法、装置及电子设备 |
JP7275795B2 (ja) * | 2019-04-15 | 2023-05-18 | コニカミノルタ株式会社 | 操作受付装置、制御方法、画像形成システム、及び、プログラム |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
JP2021004980A (ja) * | 2019-06-26 | 2021-01-14 | 株式会社アール・イー・ハヤシ | 生活支援マルチリモコン及び生活支援マルチリモコンシステム |
CN112147903A (zh) * | 2019-06-26 | 2020-12-29 | 百度在线网络技术(北京)有限公司 | 一种设备的控制方法、装置及计算机可读存储介质 |
US11508375B2 (en) | 2019-07-03 | 2022-11-22 | Samsung Electronics Co., Ltd. | Electronic apparatus including control command identification tool generated by using a control command identified by voice recognition identifying a control command corresponding to a user voice and control method thereof |
KR20210061091A (ko) * | 2019-11-19 | 2021-05-27 | 삼성전자주식회사 | 인텔리전트 어시스턴스 서비스를 제공하기 위한 전자 장치 및 그의 동작 방법 |
CN110992955A (zh) * | 2019-12-25 | 2020-04-10 | 苏州思必驰信息科技有限公司 | 一种智能设备的语音操作方法、装置、设备及存储介质 |
KR102344044B1 (ko) * | 2020-01-22 | 2021-12-27 | 주식회사 엘지유플러스 | 셋탑 단말 및 이의 동작 방법 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112002316A (zh) * | 2020-07-30 | 2020-11-27 | 珠海格力电器股份有限公司 | 一种电器控制方法、装置、存储介质及终端 |
JP7459760B2 (ja) | 2020-10-27 | 2024-04-02 | セイコーエプソン株式会社 | 表示システムの制御方法、表示システム |
CN113411722A (zh) * | 2021-06-04 | 2021-09-17 | 深圳市右转智能科技有限责任公司 | 一种智能背景音乐系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP2003114698A (ja) * | 2001-10-03 | 2003-04-18 | Denso Corp | コマンド受付装置及びプログラム |
JP2003131682A (ja) * | 2001-10-24 | 2003-05-09 | Victor Co Of Japan Ltd | 音声コマンドによる機器コントロールシステム |
JP2007033901A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 音声認識システム、音声認識方法、および音声認識用プログラム |
JP2012088370A (ja) * | 2010-10-15 | 2012-05-10 | Denso Corp | 音声認識システム、音声認識端末、およびセンター |
JP2012168349A (ja) * | 2011-02-15 | 2012-09-06 | Alpine Electronics Inc | 音声認識システムおよびこれを用いた検索システム |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL119948A (en) | 1996-12-31 | 2004-09-27 | News Datacom Ltd | Voice activated communication system and program guide |
US6188985B1 (en) * | 1997-01-06 | 2001-02-13 | Texas Instruments Incorporated | Wireless voice-activated device for control of a processor-based host system |
JPH10326176A (ja) | 1997-05-23 | 1998-12-08 | Oki Hokuriku Syst Kaihatsu:Kk | 音声対話制御方法 |
EP0911808B1 (en) | 1997-10-23 | 2002-05-08 | Sony International (Europe) GmbH | Speech interface in a home network environment |
JP2000085641A (ja) | 1998-09-16 | 2000-03-28 | Kubota Corp | クローラ走行装置 |
FR2783625B1 (fr) * | 1998-09-21 | 2000-10-13 | Thomson Multimedia Sa | Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil |
US7003463B1 (en) | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
WO2000058942A2 (en) | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
JP3873513B2 (ja) | 1999-03-29 | 2007-01-24 | ソニー株式会社 | 情報記録装置 |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US7330815B1 (en) * | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
US7006973B1 (en) | 2000-01-31 | 2006-02-28 | Intel Corporation | Providing information in response to spoken requests |
CA2413657A1 (en) | 2000-06-16 | 2001-12-20 | Healthetech, Inc. | Speech recognition capability for a personal digital assistant |
US7085716B1 (en) | 2000-10-26 | 2006-08-01 | Nuance Communications, Inc. | Speech recognition using word-in-phrase command |
US20020095294A1 (en) | 2001-01-12 | 2002-07-18 | Rick Korfin | Voice user interface for controlling a consumer media data storage and playback device |
JP3919210B2 (ja) | 2001-02-15 | 2007-05-23 | アルパイン株式会社 | 音声入力案内方法及び装置 |
US7225130B2 (en) | 2001-09-05 | 2007-05-29 | Voice Signal Technologies, Inc. | Methods, systems, and programming for performing speech recognition |
US20030120493A1 (en) | 2001-12-21 | 2003-06-26 | Gupta Sunil K. | Method and system for updating and customizing recognition vocabulary |
US9374451B2 (en) | 2002-02-04 | 2016-06-21 | Nokia Technologies Oy | System and method for multimodal short-cuts to digital services |
JP2003295893A (ja) | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20040006477A1 (en) | 2002-07-05 | 2004-01-08 | Craner Michael L. | Voice-controllable communication gateway for controlling multiple electronic and information appliances |
AU2002325930A1 (en) * | 2002-08-01 | 2004-02-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Method for automatic speech recognition |
JP2006515073A (ja) * | 2002-09-06 | 2006-05-18 | ヴォイス シグナル テクノロジーズ インコーポレーティッド | 音声認識を実行するための方法、システム、及びプログラミング |
JP2004110613A (ja) | 2002-09-20 | 2004-04-08 | Toshiba Corp | 制御装置、制御プログラム、対象装置及び制御システム |
US6889188B2 (en) | 2002-11-22 | 2005-05-03 | Intel Corporation | Methods and apparatus for controlling an electronic device |
KR20050110021A (ko) | 2003-03-17 | 2005-11-22 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 디바이스의 원격 제어 방법 |
JP2005148151A (ja) * | 2003-11-11 | 2005-06-09 | Mitsubishi Electric Corp | 音声操作装置 |
KR20050060910A (ko) * | 2003-12-17 | 2005-06-22 | 현대자동차주식회사 | 차량의 음성 명령 인식 방법 및 장치 |
JP2005249829A (ja) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | 音声認識を行うコンピュータネットワークシステム |
US20060041926A1 (en) | 2004-04-30 | 2006-02-23 | Vulcan Inc. | Voice control of multimedia content |
JP4554285B2 (ja) | 2004-06-18 | 2010-09-29 | トヨタ自動車株式会社 | 音声認識システム、音声認識方法、及び音声認識プログラム |
TWI334703B (en) | 2004-09-02 | 2010-12-11 | Inventec Multimedia & Telecom | Voice-activated remote control system |
US7283850B2 (en) * | 2004-10-12 | 2007-10-16 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement on a mobile device |
US8942985B2 (en) | 2004-11-16 | 2015-01-27 | Microsoft Corporation | Centralized method and system for clarifying voice commands |
KR100639931B1 (ko) | 2004-11-24 | 2006-11-01 | 한국전자통신연구원 | 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법 |
US7529677B1 (en) | 2005-01-21 | 2009-05-05 | Itt Manufacturing Enterprises, Inc. | Methods and apparatus for remotely processing locally generated commands to control a local device |
KR100725719B1 (ko) | 2005-02-04 | 2007-06-08 | 주식회사 유진로봇 | 음성과 태스크 오브젝트 기반의 대화시스템 |
JP4574390B2 (ja) | 2005-02-22 | 2010-11-04 | キヤノン株式会社 | 音声認識方法 |
US20060235701A1 (en) | 2005-04-13 | 2006-10-19 | Cane David A | Activity-based control of a set of electronic devices |
JP2007052397A (ja) * | 2005-07-21 | 2007-03-01 | Denso Corp | 操作装置 |
JP2007226388A (ja) * | 2006-02-22 | 2007-09-06 | Konica Minolta Medical & Graphic Inc | コマンド入力装置及びプログラム |
US20070276651A1 (en) * | 2006-05-23 | 2007-11-29 | Motorola, Inc. | Grammar adaptation through cooperative client and server based speech recognition |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8150699B2 (en) | 2007-05-17 | 2012-04-03 | Redstart Systems, Inc. | Systems and methods of a structured grammar for a speech recognition command system |
US9794348B2 (en) * | 2007-06-04 | 2017-10-17 | Todd R. Smith | Using voice commands from a mobile device to remotely access and control a computer |
US20090018830A1 (en) | 2007-07-11 | 2009-01-15 | Vandinburg Gmbh | Speech control of computing devices |
US8438024B2 (en) | 2007-10-05 | 2013-05-07 | International Business Machines Corporation | Indexing method for quick search of voice recognition results |
JP5467043B2 (ja) * | 2008-06-06 | 2014-04-09 | 株式会社レイトロン | 音声認識装置、音声認識方法および電子機器 |
JPWO2010018796A1 (ja) * | 2008-08-11 | 2012-01-26 | 旭化成株式会社 | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 |
US20100131280A1 (en) | 2008-11-25 | 2010-05-27 | General Electric Company | Voice recognition system for medical devices |
KR101513635B1 (ko) * | 2008-12-05 | 2015-04-22 | 엘지전자 주식회사 | 단말기 및 그 제어 방법 |
US8224644B2 (en) * | 2008-12-18 | 2012-07-17 | Microsoft Corporation | Utterance processing for network-based speech recognition utilizing a client-side cache |
JP5437095B2 (ja) | 2009-05-19 | 2014-03-12 | 東芝機械株式会社 | 敷ブロックの配置方法、敷ブロック移動用工具、および、その工具を備えた工作機械 |
US11012732B2 (en) | 2009-06-25 | 2021-05-18 | DISH Technologies L.L.C. | Voice enabled media presentation systems and methods |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
US20110184740A1 (en) | 2010-01-26 | 2011-07-28 | Google Inc. | Integration of Embedded and Network Speech Recognizers |
EP2586026B1 (en) * | 2010-06-24 | 2016-11-16 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
KR20120020853A (ko) | 2010-08-31 | 2012-03-08 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
KR101789619B1 (ko) | 2010-11-22 | 2017-10-25 | 엘지전자 주식회사 | 멀티미디어 장치에서 음성과 제스쳐를 이용한 제어 방법 및 그에 따른 멀티미디어 장치 |
JP5771002B2 (ja) * | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US8914287B2 (en) | 2010-12-31 | 2014-12-16 | Echostar Technologies L.L.C. | Remote control audio link |
US20120170572A1 (en) | 2011-01-03 | 2012-07-05 | Samsung Electronics Co., Ltd. | Method for Enhancing Phone Conversations |
KR20120080069A (ko) | 2011-01-06 | 2012-07-16 | 삼성전자주식회사 | 디스플레이 장치 및 그 음성 제어 방법 |
US10049669B2 (en) * | 2011-01-07 | 2018-08-14 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
KR101390823B1 (ko) | 2011-04-14 | 2014-05-09 | 삼성중공업 주식회사 | 선박용 열교환기 |
JP5916054B2 (ja) * | 2011-06-22 | 2016-05-11 | クラリオン株式会社 | 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム |
US9009041B2 (en) * | 2011-07-26 | 2015-04-14 | Nuance Communications, Inc. | Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data |
US8972263B2 (en) * | 2011-11-18 | 2015-03-03 | Soundhound, Inc. | System and method for performing dual mode speech recognition |
US9153229B2 (en) * | 2011-11-21 | 2015-10-06 | Robert Bosch Gmbh | Methods and systems for adapting grammars in hybrid speech recognition engines for enhancing local SR performance |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9031848B2 (en) | 2012-08-16 | 2015-05-12 | Nuance Communications, Inc. | User interface for searching a bundled service content data source |
-
2012
- 2012-10-22 KR KR1020120117193A patent/KR101330671B1/ko active IP Right Grant
- 2012-11-29 WO PCT/KR2012/010255 patent/WO2014051207A1/en active Application Filing
- 2012-11-29 RU RU2015111180A patent/RU2627117C2/ru active
- 2012-11-30 AU AU2012261531A patent/AU2012261531A1/en not_active Abandoned
- 2012-12-07 FR FR1261807A patent/FR2996343B3/fr not_active Expired - Lifetime
- 2012-12-11 US US13/710,524 patent/US9582245B2/en active Active
- 2012-12-13 EP EP14161308.3A patent/EP2750129A1/en not_active Ceased
- 2012-12-13 EP EP22168357.6A patent/EP4050599A1/en active Pending
- 2012-12-13 EP EP12196969.5A patent/EP2713366B1/en active Active
- 2012-12-13 JP JP2012272762A patent/JP2014071449A/ja active Pending
- 2012-12-28 CN CN201910281846.XA patent/CN109979465B/zh active Active
- 2012-12-28 CN CN201210585173.5A patent/CN103714816A/zh active Pending
-
2013
- 2013-01-31 BR BR102013002468-6A patent/BR102013002468B1/pt active IP Right Grant
- 2013-03-18 US US13/846,383 patent/US20140095174A1/en not_active Abandoned
- 2013-06-24 KR KR1020130072303A patent/KR102004872B1/ko active IP Right Grant
- 2013-06-24 KR KR1020130072275A patent/KR20140042641A/ko active Search and Examination
- 2013-08-06 US US13/960,680 patent/US10120645B2/en active Active
- 2013-12-11 JP JP2013256372A patent/JP2014071457A/ja active Pending
-
2018
- 2018-09-11 US US16/127,330 patent/US11086596B2/en active Active
-
2019
- 2019-07-19 KR KR1020190087446A patent/KR102169520B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP2003114698A (ja) * | 2001-10-03 | 2003-04-18 | Denso Corp | コマンド受付装置及びプログラム |
JP2003131682A (ja) * | 2001-10-24 | 2003-05-09 | Victor Co Of Japan Ltd | 音声コマンドによる機器コントロールシステム |
JP2007033901A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 音声認識システム、音声認識方法、および音声認識用プログラム |
JP2012088370A (ja) * | 2010-10-15 | 2012-05-10 | Denso Corp | 音声認識システム、音声認識端末、およびセンター |
JP2012168349A (ja) * | 2011-02-15 | 2012-09-06 | Alpine Electronics Inc | 音声認識システムおよびこれを用いた検索システム |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018120202A (ja) * | 2016-11-02 | 2018-08-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及びプログラム |
CN112219235A (zh) * | 2018-05-24 | 2021-01-12 | 三星电子株式会社 | 包括处理用户语音的电子设备和控制电子设备上语音识别的方法的系统 |
JP2021176015A (ja) * | 2018-06-27 | 2021-11-04 | グーグル エルエルシーGoogle LLC | 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング |
JP7256237B2 (ja) | 2018-06-27 | 2023-04-11 | グーグル エルエルシー | 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング |
CN109493851A (zh) * | 2018-11-20 | 2019-03-19 | 新视家科技(北京)有限公司 | 一种语音控制方法、相关装置及存储介质 |
JP7159476B2 (ja) | 2018-12-11 | 2022-10-24 | チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド | 音声制御方法、クラウドサーバおよび端末装置 |
JP7159475B2 (ja) | 2018-12-11 | 2022-10-24 | チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド | 音声制御方法、クラウドサーバおよび端末装置 |
JP2022513785A (ja) * | 2018-12-11 | 2022-02-09 | チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド | 音声制御方法、クラウドサーバおよび端末装置 |
JP2022512357A (ja) * | 2018-12-11 | 2022-02-03 | チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド | 音声制御方法、クラウドサーバおよび端末装置 |
JP2022539675A (ja) * | 2019-10-15 | 2022-09-13 | グーグル エルエルシー | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
JP7354301B2 (ja) | 2019-10-15 | 2023-10-02 | グーグル エルエルシー | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
US11948556B2 (en) | 2019-10-15 | 2024-04-02 | Google Llc | Detection and/or enrollment of hot commands to trigger responsive action by automated assistant |
JP2022112292A (ja) * | 2021-01-21 | 2022-08-02 | Tvs Regza株式会社 | 音声コマンド処理回路、受信装置、サーバ、システム、方法およびプログラム |
JP7536667B2 (ja) | 2021-01-21 | 2024-08-20 | Tvs Regza株式会社 | 音声コマンド処理回路、受信装置、リモコンおよびシステム |
WO2023000697A1 (zh) * | 2021-07-23 | 2023-01-26 | 北京百度网讯科技有限公司 | 通过语音方式控制程序的方法、设备及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
US9582245B2 (en) | 2017-02-28 |
KR20190088945A (ko) | 2019-07-29 |
AU2012261531A1 (en) | 2014-04-17 |
BR102013002468B1 (pt) | 2020-10-20 |
RU2015111180A (ru) | 2016-10-20 |
JP2014071457A (ja) | 2014-04-21 |
WO2014051207A1 (en) | 2014-04-03 |
FR2996343A3 (fr) | 2014-04-04 |
KR101330671B1 (ko) | 2013-11-15 |
US11086596B2 (en) | 2021-08-10 |
KR20140042641A (ko) | 2014-04-07 |
US10120645B2 (en) | 2018-11-06 |
BR102013002468A2 (pt) | 2014-10-21 |
KR102169520B1 (ko) | 2020-10-23 |
US20140095176A1 (en) | 2014-04-03 |
US20140092007A1 (en) | 2014-04-03 |
KR102004872B1 (ko) | 2019-07-29 |
CN103714816A (zh) | 2014-04-09 |
US20190026075A1 (en) | 2019-01-24 |
FR2996343B3 (fr) | 2015-05-15 |
CN109979465A (zh) | 2019-07-05 |
EP2750129A1 (en) | 2014-07-02 |
US20140095174A1 (en) | 2014-04-03 |
EP4050599A1 (en) | 2022-08-31 |
KR20140042642A (ko) | 2014-04-07 |
CN109979465B (zh) | 2024-02-20 |
EP2713366B1 (en) | 2016-08-10 |
EP2713366A1 (en) | 2014-04-02 |
RU2627117C2 (ru) | 2017-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102169520B1 (ko) | 전자장치, 서버 및 그 제어방법 | |
US11854570B2 (en) | Electronic device providing response to voice input, and method and computer readable medium thereof | |
USRE49493E1 (en) | Display apparatus, electronic device, interactive system, and controlling methods thereof | |
JP6802305B2 (ja) | 対話型サーバ、ディスプレイ装置及びその制御方法 | |
US9886952B2 (en) | Interactive system, display apparatus, and controlling method thereof | |
US9953645B2 (en) | Voice recognition device and method of controlling same | |
KR101914708B1 (ko) | 서버 및 서버의 제어 방법 | |
CN105723448A (zh) | 电子设备及其语音识别方法 | |
KR20140098525A (ko) | 음성 인식 장치 및 응답 정보 제공 방법 | |
CN103546763A (zh) | 用于提供内容信息的方法和广播接收设备 | |
KR20210025812A (ko) | 전자장치, 디스플레이장치 및 그 제어방법 | |
KR20210097428A (ko) | 전자장치 및 그 제어방법 | |
KR20200127823A (ko) | 허브 디바이스, 허브 디바이스 및 복수의 디바이스를 포함하는 멀티 디바이스 시스템 및 그 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20140214 |