Nothing Special   »   [go: up one dir, main page]

JP2014071449A - 電子装置、サーバー及びその制御方法 - Google Patents

電子装置、サーバー及びその制御方法 Download PDF

Info

Publication number
JP2014071449A
JP2014071449A JP2012272762A JP2012272762A JP2014071449A JP 2014071449 A JP2014071449 A JP 2014071449A JP 2012272762 A JP2012272762 A JP 2012272762A JP 2012272762 A JP2012272762 A JP 2012272762A JP 2014071449 A JP2014071449 A JP 2014071449A
Authority
JP
Japan
Prior art keywords
command
voice
voice recognition
user
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012272762A
Other languages
English (en)
Inventor
Do-Wan Kim
度 完 金
Oh-Yun Kwon
五 允 權
Tae Hwan Cha
泰 煥 車
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2014071449A publication Critical patent/JP2014071449A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6543Transmission by server directed to the client for forcing some client operations, e.g. recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6547Transmission by server directed to the client comprising parameters, e.g. for client setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Selective Calling Equipment (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】サーバーを利用してユーザの命令を認識することにおいて、ユーザの命令認識から動作の実行までの時間を短縮させる制御方法を提供する。
【解決手段】ユーザの音声命令を受信する命令受信部と、第1サーバーと通信する通信部と、保存部と、第1サーバーから音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つのユーザの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信して、保存部に保存されるようにし、音声命令が入力されれば、入力された音声命令が音声認識命令リストに含まれた音声認識命令に対応するか否かを確認して、対応する場合に音声認識命令の制御命令情報に基づいて動作するようにし、対応しない場合に入力された音声命令を第1サーバーに送信して第1サーバーから対応する制御命令情報を受信し、受信された制御命令情報に基づいて動作するように制御する制御部と、を含む。
【選択図】図1

Description

本発明は、電子装置、サーバー及びその制御方法に係り、サーバーを利用してユーザの命令を認識及び動作する電子装置、サーバー及びその制御方法に関する。
一般的に、TV、セットトップボックス、DVDプレーヤー、エアコン、冷蔵庫、コンピュータ等の電子装置は、ユーザの命令に従って動作するのに、最近、製品が発展し機能が多様化されることによって、既存のリモコンを利用する入力方式を抜け出して、例えばマイクを通じる音声認識等のように多様な方式の命令に従って電子装置が制御されている。例えば、TVのような電子装置の場合、ユーザが“ボリューム20に変更せよ”と話せば、該当音声信号を受けて、音声認識技術を利用し解釈した後、TVのボリュームを20に変更する方法である。
電子装置がユーザの命令を正確に解釈するためには、命令を認識できる構成が必要なのに、電子装置の自体構成で命令を正確に認識することは限界があることもできるので、この場合には、例えば、ネットワークを通じる外部のサーバーを利用する方法がある。具体的に、音声認識の場合、電子装置は、ユーザの音声命令の内容をサーバーに送信して、サーバーに備わった音声認識構成を利用して当該音声命令に関するユーザの意図を分析して判断する。サーバーは当該音声命令に関するユーザの意図を分析した結果を電子装置に送信し、電子装置はその分析結果を利用して該当命令に対応する機能を行うことができる。
しかし、従来の技術による電子装置は、電子装置が自らユーザの命令を把握できない場合に、電子装置が必ずサーバーとの通信を通じてその分析結果を受けなければならない。したがって、電子装置がユーザの命令意図を認識し、その結果に従って動作するためには、電子装置とサーバーとの間のネットワークを利用する通信時間を必要とする。このようなユーザの命令に関する分析結果を得るための通信時間は、ネットワークの状態である。通信回数等の条件に従って変わることはできるだろうが、根本的に、このような通信時間は、ユーザの命令に対する認識から動作の実行までかかる時間を遅らせるという問題がある。
従って、本発明の目的は、ユーザの命令に対する認識から動作の実行までかかる時間を最大に短縮させることができる電子装置、サーバー及びその制御方法を提供することである。
本発明の前記目的は、ディスプレイ装置において、映像信号を処理する映像処理部と;前記映像信号に基づいて映像を表示するディスプレイ部と;ユーザの音声命令を受信する命令受信部と;第1サーバーと通信する通信部と;保存部と;前記第1サーバーから前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信して前記保存部に保存されるようにし、前記音声命令が入力されれば、前記入力された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認して、対応する場合に前記音声認識命令の制御命令情報に基づいて前記映像処理部が動作するようにし、対応しない場合に前記入力された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に基づいて前記映像処理部が動作するように制御する制御部と;を含むディスプレイ装置によって達成されることができる。
前記制御部は、前記音声命令と前記音声認識命令リストの音声認識命令の関連度に基づいて相互対応可否を判断することができる。
前記制御部は、前記第1サーバーに前記音声命令を送信した後に所定の時間以上が経過すれば、前記音声認識命令リストの音声認識命令に基づいて前記映像処理部が動作するように制御することができる。
前記制御部は、前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決めることができる。
前記制御部は、前記入力された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報とを前記第1サーバーに送信することができる。
前記制御部は、前記入力された音声命令を第2サーバーに送信し、前記第2サーバーから前記入力された音声命令を変換したテキストを受信して、前記受信されたテキストを前記第1サーバーに送信することができる。
前記制御部は、ユーザ別に発話された音声命令を前記保存部に保存し、前記保存された音声命令のリストをUI形態で表示することができる。
前記制御部は、ユーザの指示に従って前記音声命令に対応する識別記号を登録し、前記ユーザが前記登録された識別記号を発話すれば、該当音声命令が受信されたと判断することができる。
前記制御部は、ユーザが前記リスト上でいずれか一つの音声命令が配列された位置を発話すれば、該当音声命令が受信されたと判断することができる。
本発明の前記目的は、ディスプレイ装置の制御方法において、第1サーバーからユーザの音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信する段階と;前記受信された音声認識命令リストを前記ディスプレイ装置に保存する段階と;ユーザの音声命令を受信する段階と;前記受信された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認する段階と;対応する場合に前記音声認識命令の制御命令情報に従って動作する段階と;対応しない場合に前記受信された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に従って動作する段階と;を含むディスプレイ装置の制御方法によっても達成されることができる。
前記対応可否を確認する段階は、前記音声命令と、前記音声認識命令リストの音声認識命令との関連度に基づいて相互に対応可否を判断する段階を含むことができる。
ディスプレイ装置の制御方法は、前記第1サーバーに前記音声命令を送信した後に所定の時間以上に経過すれば、前記音声認識命令リストの音声認識命令に基づいて動作する段階をさらに含むことができる。
ディスプレイ装置の制御方法は、前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決める段階をさらに含むことができる。
ディスプレイ装置の制御方法は、前記受信された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報を前記第1サーバーに送信する段階をさらに含むことができる。
ディスプレイ装置の制御方法は、前記受信された音声命令を第2サーバーに送信する段階と;前記第2サーバーから前記受信された音声命令を変換したテキストを受信する段階と;をさらに含み、前記受信された制御命令情報に従って動作する段階は、前記受信されたテキストを前記第1サーバーに送信する段階をさらに含むことができる。
ディスプレイ装置の制御方法は、ユーザ別に発話された音声命令を前記ディスプレイ装置に保存する段階と;前記保存された音声命令のリストをUI形態で表示する段階と;をさらに含むことができる。
ディスプレイ装置の制御方法は、ユーザの指示に従って前記音声命令に対応する識別記号を登録する段階をさらに含み、前記音声命令を受信する段階は、前記ユーザが前記登録された識別記号を発話すれば、対応する前記音声命令が受信されたと判断する段階を含むことができる。
前記音声命令を受信する段階は、前記ユーザが前記リスト上でいずれか一つの音声命令が配列された位置を発話すれば、対応する前記音声命令が受信されたと判断する段階を含むことができる。
本発明の前記目的は、ディスプレイ装置に対するユーザの音声命令を分析するサーバーにおいて、複数のディスプレイ装置と通信する通信部と;ユーザの音声命令に関する情報を保存する保存部と;前記複数のディスプレイ装置からユーザの音声命令に対する分析要請が受信されれば、該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信し、前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを前記保存部に保存し、前記保存された音声認識命令リストを前記ディスプレイ装置に送信されるように制御する制御部と;を含むサーバーによっても達成されることができる。
前記制御部は、前記ディスプレイ装置から成功的に認識されたユーザの音声命令と、対応する制御命令情報が受信されるようにし、前記受信されたユーザの音声命令と対応する前記制御命令情報に基づいて前記音声認識命令リストと、を用意することができる。
本発明の前記目的は、ディスプレイ装置に対するユーザの音声命令を分析するサーバーの制御方法において、前記複数のディスプレイ装置からユーザの音声命令に対する分析要請を受信する段階と;該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信する段階と;前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストと、を前記保存部に保存する段階と;前記保存された音声認識命令リストを前記ディスプレイ装置に送信する段階と;を含むサーバーの制御方法によっても達成されることができる。
サーバーの制御方法は、前記ディスプレイ装置から成功的に認識されたユーザの音声命令と、対応する制御命令情報と、を受信する段階をさらに含み、前記保存する段階は、前記受信されたユーザの音声命令と対応する前記制御命令情報に基づいて前記音声認識命令リストを設ける段階を含むことができる。
前述のように、本発明によれば、サーバーを利用してユーザの命令を認識する方式において、ユーザの命令認識から動作の実行までかかる時間を最大に短縮することができる。
本発明の一実施形態による電子装置及び分析サーバーを示すブロック図である。 本発明の一実施形態による電子装置の構成を示すブロック図である。 本発明の一実施形態による分析サーバーの構成を示すブロック図である。 本発明の一実施形態による電子装置の動作を示すフローチャートである。 本発明の一実施形態による音声認識命令リストの構成の一例を示す図である。 本発明の一実施形態による電子装置の分析可能可否に対する判断動作を示すフローチャートである。 本発明の一実施形態による電子装置の動作の他の例を示すフローチャートである。 本発明の一実施形態による電子装置の動作のまた他の例を示すフローチャートである。 本発明の一実施形態による電子装置と分析サーバーの構成の一例を示す図である。 本発明の一実施形態によるサーバーの動作を示すフローチャートである。 本発明の一実施形態によるサーバーの動作を示すフローチャートである。 本発明の一実施形態による電子装置、分析サーバー及びSTTサーバーを示すブロック図である。 本発明の一実施形態によるユーザ別に保存された音声命令のリストを示すUIの一例である。 本発明の一実施形態によるユーザ別に保存された音声命令のリストを示すUIの一例である。
以下、本発明の一実施形態に対して詳しく説明する。図1は、本発明の一実施形態による電子装置及び分析サーバーを示すブロック図である。本発明の一実施形態による電子装置1と分析サーバー2は、ネットワーク3を通じて相互に連結される。電子装置1は、ユーザの命令に従って動作する機器として、例えば、TV、セットトップボックス、DVDプレーヤー、エアコン、冷蔵庫、コンピュータ、携帯電話、スマートフォン、スマートパッド等の家電機器あるいは個人端末機、プリンタ、コピー機等の事務機器等など電気/電子回路に基づいて動作する機器を含む。
本実施形態のユーザの命令は、ユーザの行為等によって電子装置1が所定の動作を行うことを決定することができるようにする情報を含む。また、本実施形態のユーザの命令は、電子装置1と分析サーバー2がその命令を把握するために命令に対する分析を行う。例えば、ユーザの命令は、ユーザの音声、ジェスチャー、特定の外観等を含む。以下、ユーザの命令は音声命令とし、電子装置1はTVのようなディスプレイ装置として、例えて説明する。
本実施形態のネットワーク3は、電子装置1と、分析サーバー2がユーザの音声命令に関する情報をやり取るために通信するのに利用される装置や、インフラを含み、有線及び/または無線のネットワークであることができる。
分析サーバー2は、ネットワーク3に連結されて、クライアントである電子装置1に対してユーザの音声命令に関するサービス、すなわち、ユーザの音声命令を分析し、その結果を電子装置1に提供する。本発明の一実施形態による分析サーバー2は、ユーザの音声命令の中で所定の回数以上に成功的に認識された少なくとも一つの音声命令(以下、‘音声認識命令’と言う)と、これに対応する制御命令情報を含む音声認識命令リストと、を電子装置1に送信する。制御命令情報は、音声認識命令を通じてユーザの意図どおり電子装置1が動作するようにする電子装置1の制御のための情報である。電子装置1は、分析サーバー2から受信した音声認識命令リストに基づいてユーザの音声命令を把握する。ユーザの音声命令が入力されれば、電子装置1は、ユーザの音声命令が受信した音声認識命令リストに含まれた音声認識命令に対応するか否かを確認し、対応すれば音声認識命令の制御命令情報に従って動作し、そうでなければユーザの音声命令を分析サーバー2に伝達する。分析サーバー2は、電子装置1から受信したユーザの音声命令を分析し、その対応する制御命令情報を電子装置1に送信する。電子装置1は、分析サーバー2から受信した制御命令情報に従って動作する。
このように、本発明の一実施形態によると、電子装置1はすべてのユーザの音声命令を分析サーバー2に送信しなく、分析サーバー2からあらかじめ受信した音声認識命令リストを優先的に利用してユーザの音声命令を把握し、保有している音声認識命令リストで把握し難い場合にだけ分析サーバー2から受信した制御命令情報に従って動作する。したがって、電子装置1と分析サーバー2との通信時間を最小化し、これによって、ユーザの音声命令の認識から動作の実行までかかる時間を最大に短縮することができる。
図2は本発明の一実施形態による電子装置1の構成を示すブロック図である。電子装置1は、動作遂行部11、命令受信部12、通信部13及び制御部14を含むことができる。電子装置1は、保存部15をさらに含むことができる。動作遂行部11は、電子装置1の固有の動作を行う。例えば、電子装置1がTVのようなディスプレイ装置である場合、動作遂行部11は、信号受信部111、映像処理部112及びディスプレイ部113を含むことができる。ただし、動作遂行部11は、電子装置1が具現された製品に固有な機能に対応することとして、図2に示す例に限定されない。
信号受信部111は、放送信号送信装置(図示せず)から送出される放送信号に含まれた映像信号を受信したり、DVDプレーヤー、BDプレーヤー等の映像機器から映像信号を受信したり、PCから映像信号を受信したり、スマートフォン、スマートパッド等のモバイル機器から映像信号を受信したり、インターネット等のネットワークを通じて映像信号を受信したり、USB保存媒体のような保存媒体に保存された映像コンテンツを映像信号として入力することができる。
映像処理部112は、信号受信部111により受信された映像信号を処理して映像が表示されるようにする。映像処理部112は、デコーディング、イメージ
エンハンシング、スケーリング等を含むことができる。ディスプレイ部113は、映像処理部112によって処理された映像信号に基づいて映像を表示する。ディスプレイ部113が映像を表示する方式は、制限されず、LCD、PDP、OLED等を含む。
命令受信部12は、ユーザの音声命令を受信する。命令受信部12は、例えば、ユーザの音声命令を受信する第1命令受信部121を含むことができる。第1命令受信部121は、受信されるユーザの音声命令を音声信号に変換するマイクを含むことができる。命令受信部12は、ユーザの操作命令を受信する第2命令受信部122をさらに含むことができる。第2命令受信部122はリモコン(図示せず)からユーザの操作命令に対応するキー入力情報を含むリモコン信号を受信するリモコン信号受信部で具現されたり、電子装置1に設けられてユーザの操作に対応してキー入力情報を生成する操作パネルで具現されることができる。
通信部13は、ネットワーク3を通じて分析サーバー2と通信する。通信部13は、制御部14の制御に従ってユーザの音声命令及びその分析結果に関する情報を分析サーバー2とやり取る。
制御部14は、ユーザの音声命令に従って動作遂行部11が動作を行うように制御する。制御部14は、通信部13を通じて分析サーバー2から音声認識命令リストが受信されれば、受信された音声認識命令リスト151を保存部15に保存する。制御部14は、命令受信部12を通じてユーザの音声命令が受信されれば、ユーザの音声命令が保存された音声認識命令リスト151に含まれた音声認識命令に対応するかを確認し、対応すれば保存された音声認識命令リスト151の音声認識命令に対応する制御命令情報に従って動作するように動作遂行部11を制御する。一方、制御部14はユーザの音声命令が保存された音声認識命令リスト151に含まれた音声認識命令に対応しなければ、ユーザの音声命令が分析サーバー2に送信されるように通信部13を制御し、分析サーバー2から該当音声命令に対応する制御命令情報が受信されれば、受信された制御命令情報に従って動作するように動作遂行部11を制御する。
制御部14は、CPUを含み、制御プログラムを実行して動作することができる。制御部14は、制御プログラムを保存するためのフラッシュメモリー等の非揮発性のメモリーと、CPUが迅速にアクセスするように保存された制御プログラムの少なくとも一部をローディングするDDRのような揮発性のメモリーと、をさらに含むことができる。制御部14の制御プログラムは、動作遂行部11の動作を制御するための内容でプログラムされる。
図3は本発明の一実施形態による分析サーバー2の構成を示すブロック図である。分析サーバー2は、通信部21、制御部22及び保存部231を含む。通信部21は、ネットワーク3を通じて電子装置1の通信部13と通信する。制御部22は、分析サーバー2の動作を制御する。保存部23は非揮発性のメモリーとしてユーザの音声命令に対応する音声認識命令リストを保存する。制御部22は保存部23に保存された音声認識命令リストが電子装置1に送信されるように通信部21を制御する。制御部22は、通信部13を通じて電子装置1からユーザの音声命令とその分析要請が受信されれば、受信されたユーザの音声命令を分析する。制御部22は、該当ユーザの音声命令の分析結果が電子装置1に送信されるように通信部21を制御する。
図4は、本発明の一実施形態による電子装置1の動作を示すフローチャートである。まず、動作S41で、電子装置1は、分析サーバー2から音声認識命令リストを受信する。受信された音声認識命令リスト151は、保存部15に保存されることができる。図5は、本発明の一実施形態による音声認識命令リスト151の構成の一例を示す。音声認識命令リスト151は、複数の音声認識命令(‘音声認識命令1’、‘音声認識命令2’、‘音声認識命令3’、…)と、これらに各々対応する複数の制御命令情報(‘制御命令情報1’、‘制御命令情報2’、‘制御命令情報3’、…)を含むことができる。複数の音声認識命令は、例えば、‘電源つけろ’、‘電源消せ’、‘ボリューム上げろ’等の命令であることができる。複数の制御命令情報は、複数の音声認識命令各々に対応して電子装置1が行うようになっている動作ないし機能に関する装置固有の制御情報を含むことができる。
電子装置1は、電子装置1の電源がターンオンされる場合に分析サーバー2に音声認識命令リストの送信を要請することができる。分析サーバー2は、電子装置1から音声認識命令リストの送信の要請があれば、音声認識命令リストを電子装置1に送信することができる。電子装置1は、分析サーバー2から受信した音声認識命令リストを保存部15に保存することができる。電子装置1は、保存部15にすでに受信して保存された音声認識命令リスト151が存在する場合に、保存された音声認識命令リスト151と現在分析サーバー2から受信した音声認識命令リストを比較して、受信した音声認識命令リストに基づいて保存された音声認識命令リスト151をアップデートすることもできる。
また、図4に示すように、動作S42で、電子装置1はユーザの音声命令を受信する。次に、動作S43で、電子装置1は受信されたユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令に対応するか否かを確認する。図6は、本発明の一実施形態によって、既に受信された音声認識命令リストに含まれた音声認識命令に音声命令の対応可否を判断する動作を示すフローチャートである。
先に、動作S61で、電子装置1はユーザの音声命令を受信する。次に、動作S62で、電子装置1は受信された音声命令と音声認識命令リストの音声認識命令との関連度を判断する。本実施形態での関連度は、例えば、受信された音声命令が音声認識命令リストに含まれた対応する音声認識命令との類似度によって決定されることができる。例えば、ユーザが‘電源を消せ’と命令した場合に、音声認識命令リストにこれと実質的に同じ‘電源を消せ’という音声認識命令が含まれていれば、該当音声命令と対応する音声認識命令リストの音声認識命令との関連度は最も高いと判断されることができる。他の例として、ユーザが‘ボリュームを高めろ’と命令した場合に、音声認識命令リストには‘ボリュームを上げろ’という音声命令が存在すれば、両者はその意味で類似性が高いとすることができる。この場合、電子装置1は該当音声命令と、対応する音声認識命令リストの音声認識命令との関連度が所定分以上であると判断することができる。また他の例として、ユーザが‘画面を明るくしろ’と命令した場合に、音声認識命令リストにこれと類似な音声認識命令が存在しないと確認されれば、該当音声命令と対応する音声認識命令リストの音声認識命令との関連度が所定分未満である場合と判断することができる。
また、図6に示すように、動作S63で、既に受信された音声認識命令リストに音声命令との関連度が所定分以上である音声認識命令が存在すると判断されれば、動作S64で、電子装置1は該当音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応すると判断する。反面、動作S63で、既に受信された音声認識命令リストに音声命令との関連度が所定分以上である音声認識命令が存在しないと判断されれば、動作S64で、電子装置1は該当音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応しないと判断する。
また、図4に示すように、万一、動作S44で、ユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令に対応すると判断されれば、動作S45で、電子装置1は音声認識命令リストの音声認識命令に対応する制御命令情報に従って動作する。例えば、電子装置1はユーザの‘電源を消せよ’、‘ボリュームを高めろ’等の音声命令に対応して、音声認識命令リストに含まれた‘電源を消せよ’、‘ボリュームを上げろ’等の音声認識命令に対応する制御命令情報を参照して該当動作を行う。
一方、動作S46で、ユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応しないと判断されれば、動作S46で、電子装置1は該当ユーザの音声命令を分析サーバー2に送信する。例えば、電子装置1は、ユーザの‘画面を明るくしろ’の音声命令が音声認識命令リストによって分析可能でなければ、’画面を明るくしろ’の音声命令の情報を分析サーバー2に送信する。次に、動作S47で、電子装置1は、分析サーバー2から該当音声命令に対応する制御命令情報を受信する。例えば、電子装置1は、‘画面を明るくしろ’の音声命令の分析結果として該当音声命令に対応する制御命令情報を受信する。次に、動作S47で、電子装置1は受信した制御命令情報に従って動作する。
図12は、本発明の一実施形態によるSTT(Speech−To−Text)サーバーの一例を示す。電子装置1は、ユーザの音声命令、ユーザが発話した音声の情報をテキストの形態で処理することができる。例えば、電子装置1は、受信されたユーザの音声命令をSTTサーバー4に送信する。STTサーバー4は、電子装置1から受信されたユーザの音声命令を対応するテキストに変換するSTT変換部41を含む。STTサーバー4は、ユーザの音声命令を変換したテキストを電子装置1に送信する。電子装置1は、STTサーバー4から受信されたテキストを利用してユーザの音声命令が保存された音声認識命令リストに含まれた音声認識命令との対応可否を判断することができる。電子装置1は、STTサーバー4から受信されたテキストをサーバー1に送信してユーザの音声命令に対する分析を要請することもできる。
図7は、本発明の一実施形態による電子装置1の動作の他の例を示すフローチャートである。本実施形態では、ユーザの音声命令が既に受信された音声認識命令リストに含まれた音声認識命令と対応しないと判断される場合に対して説明する。まず、動作S71で、電子装置1は、ユーザの音声命令を分析サーバー2に送信する。次に、動作S72で、電子装置1は分析サーバー2からユーザの音声命令に対応する制御命令情報の受信可否を確認する。万一、分析サーバー2からユーザの音声命令に対応する制御命令情報が受信されると、動作S73で、電子装置1は分析サーバー2から受信された制御命令情報に従って動作する。一方、分析サーバー2からユーザの音声命令に対応する制御命令情報がまだ受信されなかったら、動作S74で、電子装置1は分析サーバー2にユーザの音声命令を送信して所定時間の経過可否を確認する。万一、まだ所定時間が経過しなかったら、動作S72がまた遂行される。しかし、所定時間が経過すれば、動作S74で、電子装置1は既に受信された音声認識命令リストの音声認識命令に基づいて動作する。
例えば、ユーザが‘画面を消せよ’と命令した場合、電子装置1は音声認識命令リストに‘画面を小さくしろ’という音声命令はあるが、その関連度が所定未満だと判断して分析サーバー2にその分析結果を要請することができる。しかし、通信条件等の問題で分析サーバー2から分析結果の受信まで時間が長くかかる場合、ユーザが、動作が行われる時までずっと待ち難いと言う問題がある。この場合、電子装置1は分析サーバー2に分析結果を要請してから所定時間が経過した場合に、その関連度が所定未満だと判断された音声認識命令を利用して迅速に動作することができるようにする。例えば、電子装置1は、ユーザの‘画面を減らせよ’の音声命令に対応して音声認識命令リストの‘画面小さくしろ’に対応する音声認識命令に従って動作する。万一、該当音声命令と関連度がある音声認識命令がいくつかある場合、電子装置1は複数の音声認識命令の中で関連度が最も高いいずれか一つを優先的に選択して動作することができる。したがって、本実施形態では、ユーザが動作を待つ時間を最小化することができるので、ユーザの便宜がさらに向上される。
追加的な実施形態として、関連度の低い音声認識命令を利用する場合にユーザの意図と合わないこともあるので、このような誤った動作を防止する必要がある。図8は、本発明の一実施形態による電子装置1の動作のまた他の例を示すフローチャートである。本実施形態では、図7の実施形態で、分析サーバー2に分析を要請してから所定時間が経過し、音声命令との関連度がある程度あると判断された音声認識命令が存在する場合を例えて説明する。まず、動作S81で、電子装置1は該当音声命令との関連度がある程度あると判断された音声認識命令に従って動作する前にあらかじめ、該当音声認識命令の内容をユーザに通知する。具体的に、電子装置1は、現在のユーザの音声命令が関連度がある程度あると判断された音声認識命令に該当可否をユーザに問い合わせして確認するようにするメッセージをディスプレイ部113に表示することができる。例えば、ユーザが‘画面減らせよ’という音声命令をした場合に、音声認識命令リストに含まれた‘画面小さくしろ’の音声認識命令がユーザの意図に該当するかを問うメッセージを例えることができる。次に、動作S82で、電子装置1は第2命令受信部122等を通して該当音声認識命令に対するユーザの意思を受信する。万一、動作S83で、ユーザが音声認識命令に同意したと判断されれば、動作S84で、電子装置1は該当音声認識命令に従って動作する。しかし、動作S84で、ユーザが音声認識命令に同意しないと判断されれば、電子装置1は該当音声認識命令に従って動作しない。したがって、本実施形態によると、ユーザの意思にさらに近づくように動作してユーザの便宜をさらに向上させることができる。
他の実施形態として、ユーザの音声命令に対応すると判断される音声認識命令リストに含まれた音声認識命令のない場合、電子装置1は音声認識命令リストに含まれた複数の音声認識命令を表示し、ユーザが複数の音声認識命令の中でユーザの音声命令の意図に合ういずれか一つを選択するようにすることもできる。複数の音声認識命令の中でユーザがいずれか一つを選択すれば、電子装置1は選択された音声認識命令に対応する制御命令情報に基づいて動作されるように制御する。
電子装置1は、保存された音声認識命令リストにユーザの音声命令に対応する音声認識命令が含まれていないと判断された状況で、ユーザの意思に従ってユーザの音声命令が成功的に認識された場合、該当音声命令を新しい音声認識命令として対応する制御命令情報とともに音声認識命令リストに追加して保存する。この場合、電子装置1は、新しく成功的に認識された音声命令と対応する制御命令情報を分析サーバー2に送信して、分析サーバー2が音声認識命令リストをアップデートすることができるようにする。
図13は本発明の一実施形態による保存された音声命令のリストを示すUIの一例を示す。電子装置1は、ユーザが発話した音声命令を貯蔵して、ユーザの要請に従って、保存された音声命令のリストをUI131の形態で表示することができる。図13に示すように、UI131を通じて表示される保存された音声命令のリストは、ユーザが既に発話した音声命令132を表示する。電子装置1は、ユーザ別に発話された音声命令を保存し、ユーザ別に(符号133参照)既に保存された音声命令132を表示することができる。音声命令のリストの音声命令132は、ユーザがしばしば発話した音声命令の順でソーティングされて表示されることができる。従って、ユーザは、UI131を通じて以前に自身が発話した音声命令を容易に見ることができるので、音声命令の発話に対する便宜性が向上される。
選択的な実施形態として、電子装置1はユーザが音声命令別に対応する識別記号を登録するようにし、後にユーザが登録された識別記号を発話すれば、対応する音声命令が受信されたと判断することができる。保存された音声命令のリストのUI131は、各音声命令に対応する識別記号134をさらに表示することができる。例えば、‘明日の天気を知らせてくれ’のような音声命令に対して、識別記号‘1’を登録しておけば、ユーザが識別記号‘1’を発話すれば、電子装置1はこれに対応する‘明日の天気を知らせてくれ’の音声命令が発話されたと判断する。従って、ユーザは長く複雑な文章のような音声命令を簡単な識別記号に変えて命令することができるので、ユーザの便宜性がさらに向上される。電子装置1はユーザの指示に従ってUI131のリストで、音声命令を削除したり新しい音声命令を追加することができる。
他の実施形態として、電子装置1は、ユーザが音声命令のリストのUI131上でいずれか一つの音声命令が配列された位置を発話する場合、該当音声命令が受信されることと判断することができる。例えば、リストのUI131が表示された状態でユーザが‘一番目’と発話すれば、電子装置1はリストのUI131で一番目に位置した‘明日の天気を知らせてくれ’の音声命令が発話されたと判断することができる。
また、電子装置1は、ユーザの指示に従って保存された音声命令のリストのUI131上の音声命令の順序を編集することができる。図14は、UI131上の音声命令の順序を編集する状況を示す。例えば、図14に示すように、電子装置1は、ユーザの指示に従って‘%%%が出る放送を切り替えろ’の命令と、‘$$$ニュース録画してくれ’の命令の順序を互いに変えることができる。この場合、対応する識別記号はそのまま維持することもできるし、二つの命令の識別記号が互いに変わることもできる。
図9は、本発明の一実施形態による電子装置1と、分析サーバー2aの構成の一例を示す。本実施形態の分析サーバー2aに対して、図1乃至図8を参照して説明した分析サーバー2と同一ないし類似な構成に対する説明は省略する。本実施形態の分析サーバー2aは、複数の電子装置1と通信を行う。分析サーバー2aは、複数の電子装置1各々からユーザの音声命令に対する分析要請があれば、これに対応して音声命令を分析し、その分析結果を該当電子装置1に送信する。また、分析サーバー2aは、複数の電子装置1から受信されるユーザの音声命令を収集し、これに基づいて音声認識命令リストを準備して、準備した音声認識命令リストを複数の電子装置1に提供する。
図10は、本発明の一実施形態による分析サーバー2aの動作を示すフローチャートである。まず、動作S101で、分析サーバー2aは、電子装置1からユーザの音声命令に対する分析要請を受信する。次に、動作S102で、分析サーバー2aは該当音声命令に対して分析し、これに対応する分析結果である対応する制御命令情報を要請した電子装置1に送信する。次に、動作S103で、分析サーバー2aは、複数の電子装置1から収集されたユーザの音声命令と、その分析結果に基づいて音声認識命令リストを用意して、用意された音声認識命令リストを保存部23に保存する。また、分析サーバー2aは、複数の電子装置1から持続的に収集されるユーザの音声命令と、その分析結果に基づいて保存部23に保存された音声認識命令リスト251をアップデートすることができる。次に、動作S103で、分析サーバー2aは、保存部23に保存された音声認識命令リスト231を複数の電子装置1に送信する。
選択的な実施形態として、電子装置1は、図8に示すように、ユーザの音声命令が音声認識命令リストの音声認識命令との関連度が低く判断されたが、ユーザが動作を許諾した(成功的に認識された)音声命令がある場合に、該当音声命令と対応する制御命令情報を分析サーバー2aに送信することができる。または、電子装置1は、新しい音声命令が成功的に認識された場合、該当音声命令と対応する制御命令情報を分析サーバー2aに送信することができる。この場合、分析サーバー2aは、受信された音声命令と対応する制御命令情報を音声認識命令リストの生成に反映することができる。
図11は、本発明の一実施形態による分析サーバー2aの動作を示すフローチャートである。まず、動作S101で、分析サーバー2aは、複数の電子装置1から収集されたユーザの音声命令に対して成功的に認識された回数を判断する。即ち、分析サーバー2aは、複数の電子装置1から収集されたユーザの音声命令の中で、どれがしばしば成功的に認識されるかを判断する。次に、動作S102で、分析サーバー2aは、収集されたどの音声命令の成功回数が所定分以上であるかを判断する。万一、該当音声命令の成功回数が所定分以上である場合には、動作S103で、分析サーバー2aは該当音声命令とその制御命令情報を新しい音声認識命令として音声認識命令リストに追加することができる。しかし、該当音声命令の成功回数が所定分未満である場合には、分析サーバー2aは、該当音声命令とその制御命令情報を音声認識命令リストに追加しない。したがって、本実施形態によれば、成功回数が所定分以上である音声命令だけで音声認識命令リストを用意することによって、音声認識命令リストの送信時間と、電子装置1が音声認識命令リストの処理に入れる動作を最小化することができる。
以上、多様な実施形態を通じて本発明に対して図示し説明したが、本発明はこれに限定されず、特許請求の範囲の内で多用に実施されることができる。
1 電子装置
2 分析サーバー
4 STTサーバー
11 動作遂行部
12 命令受信部
13 通信部
14 制御部
15 保存部

Claims (15)

  1. ディスプレイ装置において、
    映像信号を処理する映像処理部と;
    前記映像信号に基づいて映像を表示するディスプレイ部と;
    ユーザの音声命令を受信する命令受信部と;
    第1サーバーと通信する通信部と;
    保存部と;
    前記第1サーバーから前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信して、前記保存部に保存されるようにし、前記音声命令が入力されれば、前記入力された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認して、対応する場合に前記音声認識命令の制御命令情報に基づいて前記映像処理部が動作するようにし、対応しない場合に前記入力された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に基づいて前記映像処理部が動作するように制御する制御部と;を含むことを特徴とするディスプレイ装置。
  2. 前記制御部は、前記音声命令と、前記音声認識命令リストの音声認識命令との関連度に基づいて相互に対応可否を判断することを特徴とする請求項1に記載のディスプレイ装置。
  3. 前記制御部は、前記第1サーバーに前記音声命令を送信した後に所定の時間以上に経過すれば、前記音声認識命令リストの音声認識命令に基づいて前記映像処理部が動作するように制御することを特徴とする請求項1に記載のディスプレイ装置。
  4. 前記制御部は、前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決めることを特徴とする請求項1に記載のディスプレイ装置。
  5. 前記制御部は、前記入力された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報とを前記第1サーバーに送信することを特徴とする請求項1に記載のディスプレイ装置。
  6. 前記制御部は、前記入力された音声命令を第2サーバーに送信し、前記第2サーバーから前記入力された音声命令を変換したテキストを受信して、前記受信されたテキストを前記第1サーバーに送信することを特徴とする請求項1に記載のディスプレイ装置。
  7. ディスプレイ装置の制御方法において、
    第1サーバーからユーザの音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを受信する段階と;
    前記受信された音声認識命令リストを前記ディスプレイ装置に保存する段階と;
    ユーザの音声命令を受信する段階と;
    前記受信された音声命令が前記音声認識命令リストに含まれた前記音声認識命令に対応するか否かを確認する段階と;
    対応する場合、前記音声認識命令の制御命令情報に従って動作する段階と;
    対応しない場合、前記受信された音声命令を前記第1サーバーに送信して前記第1サーバーから対応する制御命令情報を受信し、受信された前記制御命令情報に従って動作する段階を含むことを特徴とするディスプレイ装置の制御方法。
  8. 前記対応可否を確認する段階は、前記音声命令と、前記音声認識命令リストの音声認識命令との関連度に基づいて相互に対応可否を判断する段階を含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
  9. 前記第1サーバーに前記音声命令を送信した後に所定の時間以上に経過すれば、前記音声認識命令リストの音声認識命令に基づいて動作する段階をさらに含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
  10. 前記音声認識命令リストの音声認識命令の内容をユーザに予め通知し、ユーザの意思に従って該当音声認識命令に基づいて動作可否を決める段階をさらに含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
  11. 前記受信された音声命令が新しく成功的に認識されれば、前記成功的に認識された音声命令と対応する制御命令情報とを前記第1サーバーに送信する段階をさらに含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
  12. 前記受信された音声命令を第2サーバーに送信する段階と;
    前記第2サーバーから前記受信された音声命令を変換したテキストを受信する段階をさらに含み、
    前記受信された制御命令情報に従って動作する段階は、前記受信されたテキストを前記第1サーバーに送信する段階を含むことを特徴とする請求項7に記載のディスプレイ装置の制御方法。
  13. ディスプレイ装置に対するユーザの音声命令を分析するサーバーにおいて、
    複数のディスプレイ装置と通信する通信部と;
    ユーザの音声命令に関する情報を保存する保存部と;
    前記複数のディスプレイ装置からユーザの音声命令に対する分析要請が受信されれば、該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信し、前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを前記保存部に保存し、前記保存された音声認識命令リストを前記ディスプレイ装置に送信されるように制御を行う制御部と;
    を含むことを特徴とするサーバー。
  14. 前記制御部は、前記ディスプレイ装置から成功的に認識されたユーザの音声命令と、対応する制御命令情報が受信されるようにし、前記受信されたユーザの音声命令と対応する前記制御命令情報に基づいて前記音声認識命令リストを設けることを特徴とする請求項13に記載のサーバー。
  15. ディスプレイ装置に対するユーザの音声命令を分析するサーバーの制御方法において、
    前記複数のディスプレイ装置からユーザの音声命令に対する分析要請を受信する段階と;
    該当音声命令に対応する制御命令情報を前記ディスプレイ装置に送信する段階と;
    前記音声命令の中で所定の回数以上に成功的に認識された音声命令である少なくとも一つの音声認識命令と、これに対応する制御命令情報を含む音声認識命令リストを前記保存部に保存する段階と;
    前記保存された音声認識命令リストを前記ディスプレイ装置に送信する段階と;
    を含むことを特徴とするサーバーの制御方法。
JP2012272762A 2012-09-28 2012-12-13 電子装置、サーバー及びその制御方法 Pending JP2014071449A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2012-0109453 2012-09-28
KR20120109453 2012-09-28
KR1020120117193A KR101330671B1 (ko) 2012-09-28 2012-10-22 전자장치, 서버 및 그 제어방법
KR10-2012-0117193 2012-10-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013256372A Division JP2014071457A (ja) 2012-09-28 2013-12-11 電子装置、サーバー及びその制御方法

Publications (1)

Publication Number Publication Date
JP2014071449A true JP2014071449A (ja) 2014-04-21

Family

ID=49857999

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012272762A Pending JP2014071449A (ja) 2012-09-28 2012-12-13 電子装置、サーバー及びその制御方法
JP2013256372A Pending JP2014071457A (ja) 2012-09-28 2013-12-11 電子装置、サーバー及びその制御方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013256372A Pending JP2014071457A (ja) 2012-09-28 2013-12-11 電子装置、サーバー及びその制御方法

Country Status (10)

Country Link
US (4) US9582245B2 (ja)
EP (3) EP2750129A1 (ja)
JP (2) JP2014071449A (ja)
KR (4) KR101330671B1 (ja)
CN (2) CN109979465B (ja)
AU (1) AU2012261531A1 (ja)
BR (1) BR102013002468B1 (ja)
FR (1) FR2996343B3 (ja)
RU (1) RU2627117C2 (ja)
WO (1) WO2014051207A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120202A (ja) * 2016-11-02 2018-08-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理方法及びプログラム
CN109493851A (zh) * 2018-11-20 2019-03-19 新视家科技(北京)有限公司 一种语音控制方法、相关装置及存储介质
CN112219235A (zh) * 2018-05-24 2021-01-12 三星电子株式会社 包括处理用户语音的电子设备和控制电子设备上语音识别的方法的系统
JP2021176015A (ja) * 2018-06-27 2021-11-04 グーグル エルエルシーGoogle LLC 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング
JP2022512357A (ja) * 2018-12-11 2022-02-03 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP2022513785A (ja) * 2018-12-11 2022-02-09 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP2022112292A (ja) * 2021-01-21 2022-08-02 Tvs Regza株式会社 音声コマンド処理回路、受信装置、サーバ、システム、方法およびプログラム
JP2022539675A (ja) * 2019-10-15 2022-09-13 グーグル エルエルシー 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録
WO2023000697A1 (zh) * 2021-07-23 2023-01-26 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品

Families Citing this family (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
KR20130125067A (ko) * 2012-05-08 2013-11-18 삼성전자주식회사 전자 장치 및 그의 제어 방법
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
AU2014214676A1 (en) 2013-02-07 2015-08-27 Apple Inc. Voice trigger for a digital assistant
US10157618B2 (en) 2013-05-02 2018-12-18 Xappmedia, Inc. Device, system, method, and computer-readable medium for providing interactive advertising
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
CN104517606A (zh) * 2013-09-30 2015-04-15 腾讯科技(深圳)有限公司 语音识别测试方法及装置
KR102246893B1 (ko) * 2013-12-11 2021-04-30 삼성전자주식회사 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법
US9767803B1 (en) * 2013-12-16 2017-09-19 Aftershock Services, Inc. Dynamically selecting speech functionality on client devices
US9674306B2 (en) * 2013-12-20 2017-06-06 The Directv Group, Inc. Method and system for communicating from a client device to a server device in a centralized content distribution system
CN105023575B (zh) * 2014-04-30 2019-09-17 中兴通讯股份有限公司 语音识别方法、装置和系统
JP6551401B2 (ja) * 2014-05-01 2019-07-31 ソニー株式会社 通信装置又は通信方法、並びにコンピューター・プログラム
CN103985160B (zh) * 2014-05-12 2017-01-18 深圳市威富多媒体有限公司 一种基于计算机及语音控制的车牌管理方法及装置
JP6440513B2 (ja) * 2014-05-13 2018-12-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識機能を用いた情報提供方法および機器の制御方法
KR102225404B1 (ko) * 2014-05-23 2021-03-09 삼성전자주식회사 디바이스 정보를 이용하는 음성인식 방법 및 장치
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9589567B2 (en) * 2014-06-11 2017-03-07 Honeywell International Inc. Plant control system using voice as a control mechanism
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
CN105448293B (zh) * 2014-08-27 2019-03-12 北京羽扇智信息科技有限公司 语音监听及处理方法和设备
KR102304052B1 (ko) * 2014-09-05 2021-09-23 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법
KR20160056548A (ko) * 2014-11-12 2016-05-20 삼성전자주식회사 질의 응답을 위한 디스플레이 장치 및 방법
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
KR101642918B1 (ko) * 2015-08-03 2016-07-27 서치콘주식회사 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
FR3045909B1 (fr) * 2015-12-17 2017-12-29 Delta Dore Procede et dispositif d'analyse et de repartition de commandes vocales
CN105578240A (zh) * 2015-12-23 2016-05-11 广州视源电子科技股份有限公司 电视终端交互方法和系统
CN105719650A (zh) * 2016-01-30 2016-06-29 深圳市尔木科技有限责任公司 一种语音识别的方法及系统
US9898250B1 (en) * 2016-02-12 2018-02-20 Amazon Technologies, Inc. Controlling distributed audio outputs to enable voice output
US9858927B2 (en) * 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
CN105913839A (zh) * 2016-05-30 2016-08-31 合肥华凌股份有限公司 一种智能冰箱、服务器及语音控制系统和方法
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10271093B1 (en) * 2016-06-27 2019-04-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
KR20180043627A (ko) * 2016-10-20 2018-04-30 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치를 제어하는 방법
CN108010522A (zh) 2016-11-02 2018-05-08 松下电器(美国)知识产权公司 信息处理方法以及记录介质
CN108010523B (zh) * 2016-11-02 2023-05-09 松下电器(美国)知识产权公司 信息处理方法以及记录介质
US10937421B2 (en) * 2016-12-23 2021-03-02 Spectrum Brands, Inc. Electronic faucet with smart features
US11176932B2 (en) * 2016-12-23 2021-11-16 Spectrum Brands, Inc. Electronic faucet with smart features
CN107086037A (zh) * 2017-03-17 2017-08-22 上海庆科信息技术有限公司 一种嵌入式设备的语音交互方法、装置及嵌入式设备
CN107135443B (zh) * 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
KR20180118461A (ko) 2017-04-21 2018-10-31 엘지전자 주식회사 음성 인식 장치 및 음성 인식 방법
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10475454B2 (en) * 2017-09-18 2019-11-12 Motorola Mobility Llc Directional display and audio broadcast
CN109559759B (zh) * 2017-09-27 2021-10-08 华硕电脑股份有限公司 具备增量注册单元的电子设备及其方法
KR102417524B1 (ko) * 2017-10-13 2022-07-07 현대자동차주식회사 음성 인식 기반의 자동차 제어 방법
FR3073067B1 (fr) * 2017-10-27 2020-11-13 Deepor Procede de pilotage d'une salle notamment operatoire d'un plateau medico-technique
KR102480728B1 (ko) * 2017-11-10 2022-12-23 삼성전자주식회사 전자장치 및 그 제어방법
KR102517219B1 (ko) * 2017-11-23 2023-04-03 삼성전자주식회사 전자장치 및 그 제어방법
KR102528466B1 (ko) * 2017-12-19 2023-05-03 삼성전자주식회사 복수 화자의 음성 신호 처리 방법 및 그에 따른 전자 장치
EP4319174A3 (en) * 2018-01-08 2024-04-24 LG Electronics Inc. Display device and system comprising same
KR102488001B1 (ko) * 2018-01-22 2023-01-13 삼성전자주식회사 오디오 신호를 이용하여 사용자를 인증하는 전자 장치 및 그 방법
US20190251956A1 (en) * 2018-02-15 2019-08-15 DMAI, Inc. System and method for prediction based preemptive generation of dialogue content
WO2019161229A1 (en) 2018-02-15 2019-08-22 DMAI, Inc. System and method for reconstructing unoccupied 3d space
US11455986B2 (en) * 2018-02-15 2022-09-27 DMAI, Inc. System and method for conversational agent via adaptive caching of dialogue tree
JP7003720B2 (ja) * 2018-02-19 2022-01-21 コニカミノルタ株式会社 画像処理装置、画像処理装置の制御方法、およびプログラム
KR102576388B1 (ko) * 2018-02-21 2023-09-08 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법
KR20190102509A (ko) * 2018-02-26 2019-09-04 삼성전자주식회사 음성 명령을 수행하는 방법 및 시스템
KR102533443B1 (ko) * 2018-05-04 2023-05-17 삼성전자 주식회사 콘텐츠 제공 방법 및 이를 사용하는 전자 장치
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
KR102458336B1 (ko) 2018-05-18 2022-10-25 삼성전자주식회사 공기 조화 장치 및 이의 제어 방법
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
CN108510990A (zh) * 2018-07-04 2018-09-07 百度在线网络技术(北京)有限公司 语音识别方法、装置、用户设备及存储介质
KR102527107B1 (ko) * 2018-08-08 2023-05-02 삼성전자주식회사 음성에 기반하여 기능을 실행하기 위한 방법 및 이를 지원하는 사용자 전자 장치
KR102563314B1 (ko) * 2018-08-30 2023-08-04 삼성전자주식회사 전자 장치 및 단축 명령어의 바로가기 생성 방법
CN110910869B (zh) * 2018-09-14 2022-02-18 成都启英泰伦科技有限公司 一种语音识别方法和设备
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
KR20200042627A (ko) * 2018-10-16 2020-04-24 삼성전자주식회사 전자 장치 및 그 제어 방법
CN109448709A (zh) * 2018-10-16 2019-03-08 华为技术有限公司 一种终端投屏的控制方法和终端
KR20200043075A (ko) 2018-10-17 2020-04-27 삼성전자주식회사 전자 장치 및 그 제어방법, 전자 장치의 음향 출력 제어 시스템
KR102651413B1 (ko) * 2018-10-17 2024-03-27 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
CN109408024A (zh) * 2018-10-18 2019-03-01 珠海格力电器股份有限公司 信息交互方法及装置、存储介质、处理器
US10885912B2 (en) * 2018-11-13 2021-01-05 Motorola Solutions, Inc. Methods and systems for providing a corrected voice command
CN109495360A (zh) * 2018-12-18 2019-03-19 深圳国美云智科技有限公司 一种智能家居物联平台、离线语音控制方法及系统
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
CN111754996A (zh) * 2019-03-29 2020-10-09 阿里巴巴集团控股有限公司 基于语音模拟遥控器的控制方法、装置及电子设备
JP7275795B2 (ja) * 2019-04-15 2023-05-18 コニカミノルタ株式会社 操作受付装置、制御方法、画像形成システム、及び、プログラム
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
JP2021004980A (ja) * 2019-06-26 2021-01-14 株式会社アール・イー・ハヤシ 生活支援マルチリモコン及び生活支援マルチリモコンシステム
CN112147903A (zh) * 2019-06-26 2020-12-29 百度在线网络技术(北京)有限公司 一种设备的控制方法、装置及计算机可读存储介质
US11508375B2 (en) 2019-07-03 2022-11-22 Samsung Electronics Co., Ltd. Electronic apparatus including control command identification tool generated by using a control command identified by voice recognition identifying a control command corresponding to a user voice and control method thereof
KR20210061091A (ko) * 2019-11-19 2021-05-27 삼성전자주식회사 인텔리전트 어시스턴스 서비스를 제공하기 위한 전자 장치 및 그의 동작 방법
CN110992955A (zh) * 2019-12-25 2020-04-10 苏州思必驰信息科技有限公司 一种智能设备的语音操作方法、装置、设备及存储介质
KR102344044B1 (ko) * 2020-01-22 2021-12-27 주식회사 엘지유플러스 셋탑 단말 및 이의 동작 방법
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN112002316A (zh) * 2020-07-30 2020-11-27 珠海格力电器股份有限公司 一种电器控制方法、装置、存储介质及终端
JP7459760B2 (ja) 2020-10-27 2024-04-02 セイコーエプソン株式会社 表示システムの制御方法、表示システム
CN113411722A (zh) * 2021-06-04 2021-09-17 深圳市右转智能科技有限责任公司 一种智能背景音乐系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000075887A (ja) * 1998-08-31 2000-03-14 Sony Corp パターン認識装置、方法及びシステム
JP2003114698A (ja) * 2001-10-03 2003-04-18 Denso Corp コマンド受付装置及びプログラム
JP2003131682A (ja) * 2001-10-24 2003-05-09 Victor Co Of Japan Ltd 音声コマンドによる機器コントロールシステム
JP2007033901A (ja) * 2005-07-27 2007-02-08 Nec Corp 音声認識システム、音声認識方法、および音声認識用プログラム
JP2012088370A (ja) * 2010-10-15 2012-05-10 Denso Corp 音声認識システム、音声認識端末、およびセンター
JP2012168349A (ja) * 2011-02-15 2012-09-06 Alpine Electronics Inc 音声認識システムおよびこれを用いた検索システム

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL119948A (en) 1996-12-31 2004-09-27 News Datacom Ltd Voice activated communication system and program guide
US6188985B1 (en) * 1997-01-06 2001-02-13 Texas Instruments Incorporated Wireless voice-activated device for control of a processor-based host system
JPH10326176A (ja) 1997-05-23 1998-12-08 Oki Hokuriku Syst Kaihatsu:Kk 音声対話制御方法
EP0911808B1 (en) 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
JP2000085641A (ja) 1998-09-16 2000-03-28 Kubota Corp クローラ走行装置
FR2783625B1 (fr) * 1998-09-21 2000-10-13 Thomson Multimedia Sa Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil
US7003463B1 (en) 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
WO2000058942A2 (en) 1999-03-26 2000-10-05 Koninklijke Philips Electronics N.V. Client-server speech recognition
JP3873513B2 (ja) 1999-03-29 2007-01-24 ソニー株式会社 情報記録装置
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
US7330815B1 (en) * 1999-10-04 2008-02-12 Globalenglish Corporation Method and system for network-based speech recognition
US7006973B1 (en) 2000-01-31 2006-02-28 Intel Corporation Providing information in response to spoken requests
CA2413657A1 (en) 2000-06-16 2001-12-20 Healthetech, Inc. Speech recognition capability for a personal digital assistant
US7085716B1 (en) 2000-10-26 2006-08-01 Nuance Communications, Inc. Speech recognition using word-in-phrase command
US20020095294A1 (en) 2001-01-12 2002-07-18 Rick Korfin Voice user interface for controlling a consumer media data storage and playback device
JP3919210B2 (ja) 2001-02-15 2007-05-23 アルパイン株式会社 音声入力案内方法及び装置
US7225130B2 (en) 2001-09-05 2007-05-29 Voice Signal Technologies, Inc. Methods, systems, and programming for performing speech recognition
US20030120493A1 (en) 2001-12-21 2003-06-26 Gupta Sunil K. Method and system for updating and customizing recognition vocabulary
US9374451B2 (en) 2002-02-04 2016-06-21 Nokia Technologies Oy System and method for multimodal short-cuts to digital services
JP2003295893A (ja) 2002-04-01 2003-10-15 Omron Corp 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US20040006477A1 (en) 2002-07-05 2004-01-08 Craner Michael L. Voice-controllable communication gateway for controlling multiple electronic and information appliances
AU2002325930A1 (en) * 2002-08-01 2004-02-25 Telefonaktiebolaget Lm Ericsson (Publ) Method for automatic speech recognition
JP2006515073A (ja) * 2002-09-06 2006-05-18 ヴォイス シグナル テクノロジーズ インコーポレーティッド 音声認識を実行するための方法、システム、及びプログラミング
JP2004110613A (ja) 2002-09-20 2004-04-08 Toshiba Corp 制御装置、制御プログラム、対象装置及び制御システム
US6889188B2 (en) 2002-11-22 2005-05-03 Intel Corporation Methods and apparatus for controlling an electronic device
KR20050110021A (ko) 2003-03-17 2005-11-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 디바이스의 원격 제어 방법
JP2005148151A (ja) * 2003-11-11 2005-06-09 Mitsubishi Electric Corp 音声操作装置
KR20050060910A (ko) * 2003-12-17 2005-06-22 현대자동차주식회사 차량의 음성 명령 인식 방법 및 장치
JP2005249829A (ja) * 2004-03-01 2005-09-15 Advanced Media Inc 音声認識を行うコンピュータネットワークシステム
US20060041926A1 (en) 2004-04-30 2006-02-23 Vulcan Inc. Voice control of multimedia content
JP4554285B2 (ja) 2004-06-18 2010-09-29 トヨタ自動車株式会社 音声認識システム、音声認識方法、及び音声認識プログラム
TWI334703B (en) 2004-09-02 2010-12-11 Inventec Multimedia & Telecom Voice-activated remote control system
US7283850B2 (en) * 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
KR100639931B1 (ko) 2004-11-24 2006-11-01 한국전자통신연구원 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법
US7529677B1 (en) 2005-01-21 2009-05-05 Itt Manufacturing Enterprises, Inc. Methods and apparatus for remotely processing locally generated commands to control a local device
KR100725719B1 (ko) 2005-02-04 2007-06-08 주식회사 유진로봇 음성과 태스크 오브젝트 기반의 대화시스템
JP4574390B2 (ja) 2005-02-22 2010-11-04 キヤノン株式会社 音声認識方法
US20060235701A1 (en) 2005-04-13 2006-10-19 Cane David A Activity-based control of a set of electronic devices
JP2007052397A (ja) * 2005-07-21 2007-03-01 Denso Corp 操作装置
JP2007226388A (ja) * 2006-02-22 2007-09-06 Konica Minolta Medical & Graphic Inc コマンド入力装置及びプログラム
US20070276651A1 (en) * 2006-05-23 2007-11-29 Motorola, Inc. Grammar adaptation through cooperative client and server based speech recognition
US8635243B2 (en) 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US8150699B2 (en) 2007-05-17 2012-04-03 Redstart Systems, Inc. Systems and methods of a structured grammar for a speech recognition command system
US9794348B2 (en) * 2007-06-04 2017-10-17 Todd R. Smith Using voice commands from a mobile device to remotely access and control a computer
US20090018830A1 (en) 2007-07-11 2009-01-15 Vandinburg Gmbh Speech control of computing devices
US8438024B2 (en) 2007-10-05 2013-05-07 International Business Machines Corporation Indexing method for quick search of voice recognition results
JP5467043B2 (ja) * 2008-06-06 2014-04-09 株式会社レイトロン 音声認識装置、音声認識方法および電子機器
JPWO2010018796A1 (ja) * 2008-08-11 2012-01-26 旭化成株式会社 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法
US20100131280A1 (en) 2008-11-25 2010-05-27 General Electric Company Voice recognition system for medical devices
KR101513635B1 (ko) * 2008-12-05 2015-04-22 엘지전자 주식회사 단말기 및 그 제어 방법
US8224644B2 (en) * 2008-12-18 2012-07-17 Microsoft Corporation Utterance processing for network-based speech recognition utilizing a client-side cache
JP5437095B2 (ja) 2009-05-19 2014-03-12 東芝機械株式会社 敷ブロックの配置方法、敷ブロック移動用工具、および、その工具を備えた工作機械
US11012732B2 (en) 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
US20110184740A1 (en) 2010-01-26 2011-07-28 Google Inc. Integration of Embedded and Network Speech Recognizers
EP2586026B1 (en) * 2010-06-24 2016-11-16 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
KR20120020853A (ko) 2010-08-31 2012-03-08 엘지전자 주식회사 이동 단말기 및 그 제어방법
US20120078635A1 (en) 2010-09-24 2012-03-29 Apple Inc. Voice control system
KR101789619B1 (ko) 2010-11-22 2017-10-25 엘지전자 주식회사 멀티미디어 장치에서 음성과 제스쳐를 이용한 제어 방법 및 그에 따른 멀티미디어 장치
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US8914287B2 (en) 2010-12-31 2014-12-16 Echostar Technologies L.L.C. Remote control audio link
US20120170572A1 (en) 2011-01-03 2012-07-05 Samsung Electronics Co., Ltd. Method for Enhancing Phone Conversations
KR20120080069A (ko) 2011-01-06 2012-07-16 삼성전자주식회사 디스플레이 장치 및 그 음성 제어 방법
US10049669B2 (en) * 2011-01-07 2018-08-14 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
KR101390823B1 (ko) 2011-04-14 2014-05-09 삼성중공업 주식회사 선박용 열교환기
JP5916054B2 (ja) * 2011-06-22 2016-05-11 クラリオン株式会社 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム
US9009041B2 (en) * 2011-07-26 2015-04-14 Nuance Communications, Inc. Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data
US8972263B2 (en) * 2011-11-18 2015-03-03 Soundhound, Inc. System and method for performing dual mode speech recognition
US9153229B2 (en) * 2011-11-21 2015-10-06 Robert Bosch Gmbh Methods and systems for adapting grammars in hybrid speech recognition engines for enhancing local SR performance
US8825020B2 (en) 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
US9031848B2 (en) 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000075887A (ja) * 1998-08-31 2000-03-14 Sony Corp パターン認識装置、方法及びシステム
JP2003114698A (ja) * 2001-10-03 2003-04-18 Denso Corp コマンド受付装置及びプログラム
JP2003131682A (ja) * 2001-10-24 2003-05-09 Victor Co Of Japan Ltd 音声コマンドによる機器コントロールシステム
JP2007033901A (ja) * 2005-07-27 2007-02-08 Nec Corp 音声認識システム、音声認識方法、および音声認識用プログラム
JP2012088370A (ja) * 2010-10-15 2012-05-10 Denso Corp 音声認識システム、音声認識端末、およびセンター
JP2012168349A (ja) * 2011-02-15 2012-09-06 Alpine Electronics Inc 音声認識システムおよびこれを用いた検索システム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120202A (ja) * 2016-11-02 2018-08-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理方法及びプログラム
CN112219235A (zh) * 2018-05-24 2021-01-12 三星电子株式会社 包括处理用户语音的电子设备和控制电子设备上语音识别的方法的系统
JP2021176015A (ja) * 2018-06-27 2021-11-04 グーグル エルエルシーGoogle LLC 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング
JP7256237B2 (ja) 2018-06-27 2023-04-11 グーグル エルエルシー 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング
CN109493851A (zh) * 2018-11-20 2019-03-19 新视家科技(北京)有限公司 一种语音控制方法、相关装置及存储介质
JP7159476B2 (ja) 2018-12-11 2022-10-24 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP7159475B2 (ja) 2018-12-11 2022-10-24 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP2022513785A (ja) * 2018-12-11 2022-02-09 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP2022512357A (ja) * 2018-12-11 2022-02-03 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP2022539675A (ja) * 2019-10-15 2022-09-13 グーグル エルエルシー 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録
JP7354301B2 (ja) 2019-10-15 2023-10-02 グーグル エルエルシー 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録
US11948556B2 (en) 2019-10-15 2024-04-02 Google Llc Detection and/or enrollment of hot commands to trigger responsive action by automated assistant
JP2022112292A (ja) * 2021-01-21 2022-08-02 Tvs Regza株式会社 音声コマンド処理回路、受信装置、サーバ、システム、方法およびプログラム
JP7536667B2 (ja) 2021-01-21 2024-08-20 Tvs Regza株式会社 音声コマンド処理回路、受信装置、リモコンおよびシステム
WO2023000697A1 (zh) * 2021-07-23 2023-01-26 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品

Also Published As

Publication number Publication date
US9582245B2 (en) 2017-02-28
KR20190088945A (ko) 2019-07-29
AU2012261531A1 (en) 2014-04-17
BR102013002468B1 (pt) 2020-10-20
RU2015111180A (ru) 2016-10-20
JP2014071457A (ja) 2014-04-21
WO2014051207A1 (en) 2014-04-03
FR2996343A3 (fr) 2014-04-04
KR101330671B1 (ko) 2013-11-15
US11086596B2 (en) 2021-08-10
KR20140042641A (ko) 2014-04-07
US10120645B2 (en) 2018-11-06
BR102013002468A2 (pt) 2014-10-21
KR102169520B1 (ko) 2020-10-23
US20140095176A1 (en) 2014-04-03
US20140092007A1 (en) 2014-04-03
KR102004872B1 (ko) 2019-07-29
CN103714816A (zh) 2014-04-09
US20190026075A1 (en) 2019-01-24
FR2996343B3 (fr) 2015-05-15
CN109979465A (zh) 2019-07-05
EP2750129A1 (en) 2014-07-02
US20140095174A1 (en) 2014-04-03
EP4050599A1 (en) 2022-08-31
KR20140042642A (ko) 2014-04-07
CN109979465B (zh) 2024-02-20
EP2713366B1 (en) 2016-08-10
EP2713366A1 (en) 2014-04-02
RU2627117C2 (ru) 2017-08-03

Similar Documents

Publication Publication Date Title
KR102169520B1 (ko) 전자장치, 서버 및 그 제어방법
US11854570B2 (en) Electronic device providing response to voice input, and method and computer readable medium thereof
USRE49493E1 (en) Display apparatus, electronic device, interactive system, and controlling methods thereof
JP6802305B2 (ja) 対話型サーバ、ディスプレイ装置及びその制御方法
US9886952B2 (en) Interactive system, display apparatus, and controlling method thereof
US9953645B2 (en) Voice recognition device and method of controlling same
KR101914708B1 (ko) 서버 및 서버의 제어 방법
CN105723448A (zh) 电子设备及其语音识别方法
KR20140098525A (ko) 음성 인식 장치 및 응답 정보 제공 방법
CN103546763A (zh) 用于提供内容信息的方法和广播接收设备
KR20210025812A (ko) 전자장치, 디스플레이장치 및 그 제어방법
KR20210097428A (ko) 전자장치 및 그 제어방법
KR20200127823A (ko) 허브 디바이스, 허브 디바이스 및 복수의 디바이스를 포함하는 멀티 디바이스 시스템 및 그 동작 방법

Legal Events

Date Code Title Description
A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20140214