CN109979465B - 电子装置、服务器及其控制方法 - Google Patents
电子装置、服务器及其控制方法 Download PDFInfo
- Publication number
- CN109979465B CN109979465B CN201910281846.XA CN201910281846A CN109979465B CN 109979465 B CN109979465 B CN 109979465B CN 201910281846 A CN201910281846 A CN 201910281846A CN 109979465 B CN109979465 B CN 109979465B
- Authority
- CN
- China
- Prior art keywords
- voice
- command
- voice command
- user
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000008569 process Effects 0.000 claims abstract description 5
- 230000004044 response Effects 0.000 claims description 12
- 230000000875 corresponding effect Effects 0.000 description 56
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
- H04N21/2335—Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/654—Transmission by server directed to the client
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/654—Transmission by server directed to the client
- H04N21/6543—Transmission by server directed to the client for forcing some client operations, e.g. recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/654—Transmission by server directed to the client
- H04N21/6547—Transmission by server directed to the client comprising parameters, e.g. for client setup
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6582—Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Selective Calling Equipment (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
Abstract
提供了一种电子装置、服务器及其控制方法。所述显示设备包括:处理器,对信号进行处理;显示器,基于处理的信号显示图像;命令接收器,接收语音命令;通信器,与第一服务器通信;存储器;控制器,从第一服务器接收包括语音识别命令以及与语音识别命令相应的控制命令信息的语音识别命令列表并存储在存储器中,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的语音命令,确定语音命令是否相应于包括在语音识别命令列表中的语音识别命令,如果是,则控制处理器基于控制命令信息进行操作,如果不是,则将语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并控制处理器基于接收的控制命令信息进行操作。
Description
本申请是申请日为2012年12月28日、申请号为201210585173.5的发明专利申请“电子装置、服务器及其控制方法”的分案申请。
技术领域
与示例性实施例一致的设备和方法涉及一种电子装置、服务器及其控制方法,更具体地,涉及一种通过使用服务器识别用户的命令并在该命令下进行操作的电子装置、服务器及其控制方法。
背景技术
诸如电视(TV)、机顶盒、数字多功能盘(DVD)播放器、空调、冰箱和计算机的电子装置在用户的命令下进行操作。根据使用遥控器的传统输入方法之外的技术的发展和功能的多样化,由各种类型的命令(诸如,通过麦克风的语音识别)来控制电子装置。在诸如TV的电子装置的情况下,如果用户说“将音量变为20”,则电子装置接收语音信号并通过语音识别技术对语音信号进行解释,从而将音量变为20。
电子装置使用命令识别配置以适当地对用户命令进行解释。然而,电子装置可能会不能准确地对命令进行解释。在这种情况下,可使用通过网络的外部服务器。更具体地,为了识别语音,电子装置将用户的语音命令的内容发送到服务器,该服务器通过使用在服务器中设置的语音识别配置来解释并确定用户的关于所述语音命令的意图。服务器将分析结果发送到电子装置,该电子装置可通过使用分析结果来执行相应的功能。
然而,如果现有技术的电子装置自身不可识别用户的命令,则电子装置与服务器进行通信并从服务器接收分析结果。因此,电子装置与服务器之间的通过网络的通信时间不能用于根据分析结果来执行功能。获得关于用户的命令的分析结果的通信时间取决于网络的状态或通信频率,但是基本上延迟了用于识别用户的命令并执行相应的功能的时间。
发明内容
因此,一个或多个示例性实施例提供了一种最小化用于识别用户的命令并执行操作的时间的电子装置、服务器及其控制方法。
根据示例性实施例的一方面,提供了一种显示设备,包括:处理器,对信号进行处理;显示器,基于处理的信号来显示图像;命令接收器,接收用户的语音命令;通信器,与第一服务器进行通信;存储器;控制器,从第一服务器接收包括语音识别命令以及相应的控制命令信息的语音识别命令列表,并将所述列表存储在存储器中,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令,响应于接收用户的语音命令,识别语音命令是否相应于包括在语音识别命令列表中的语音识别命令,如果是,则控制处理器基于相应的语音识别命令的控制命令信息进行操作,如果不是,则将语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并控制处理器基于接收的控制命令信息进行操作。
所述控制器可基于语音命令与语音识别命令列表中的语音识别命令之间的确定的相关性来确定语音命令是否相应于语音识别命令。
如果在语音命令被发送到第一服务器之后过去了预定时间或更长时间,则控制器可控制图像处理器基于语音识别命令列表中的语音识别命令进行操作。
控制器可提前向用户通知语音识别命令列表中的语音识别命令的内容,并根据用户的意图来确定是否基于语音识别命令进行操作。
如果接收的语音命令是对用户新近识别的,则控制器可将识别的语音命令以及相应的控制命令信息发送到第一服务器。
控制器可将用户的语音命令发送到第二服务器,从第二服务器接收语音命令转换的文本,并将接收的文本发送到第一服务器。
控制器可将用于每个用户的语音命令存储在存储器中,并按照用户界面(UI)的形式显示存储的语音命令的列表。
控制器可在用户的指令下注册与语音命令相应的识别符号,并响应于注册的识别符号被用户说出,确定语音符号已被接收。
如果语音命令被排列在列表中的位置被说出,则控制器可确定语音命令已被接收。
根据另一示例性实施例的一方面,提供了一种显示设备的控制方法,所述控制方法包括:从第一服务器接收包括语音识别命令以及相应的控制命令信息的语音识别命令列表,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令;将接收的语音识别命令列表存储在显示设备中;接收用户的语音命令;识别接收的语音命令是否相应于包括在存储的语音识别命令列表中的语音识别命令;如果接收的语音命令相应于语音识别命令,则根据语音识别命令的控制命令信息进行操作;如果接收的语音命令不相应于语音识别命令,则将接收的语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并根据接收的控制命令信息进行操作。
识别接收的语音命令是否相应于包括在语音识别命令列表中的语音识别命令的步骤可包括基于语音命令与语音识别命令列表中的语音识别命令之间的确定的相关性来确定语音命令是否相应于语音识别命令。
所述控制方法还可包括:如果在语音命令被发送到第一服务器之后过去了预定时间或更长时间,则基于语音识别命令列表中的语音识别命令进行操作。
所述控制方法还可包括:提前向用户通知语音识别命令列表中的语音识别命令的内容,并根据用户的意图来确定是否基于语音识别命令进行操作。
所述控制方法还可包括:如果接收的语音命令是对用户新近识别的,则将识别的语音命令以及相应的控制命令信息发送到第一服务器。
所述控制方法还可包括:将用户的语音命令发送到第二服务器;从第二服务器接收语音命令已被转换的文本;将接收的文本发送到第一服务器。
所述控制方法还可包括:将用于每个用户的语音命令存储在处理设备中;并按照用户界面(UI)的形式显示存储的语音命令的列表。
所述控制方法还可包括:在用户的指令下注册与语音命令相应的识别符号,其中,接收语音命令的步骤包括,如果用户说出注册的识别符号,则确定相应的语音符号被接收。
接收语音命令的步骤可包括:如果用户说出一个语音命令被排列在列表中的位置,则确定相应的语音命令被接收。
根据另一示例性实施例的一方面,提供了一种分析到显示设备的用户的语音命令的服务器,所述服务器包括:通信器,与显示设备进行通信;存储器,存储关于用户的语音命令的信息;控制器,响应于从显示设备接收到对用户的语音命令的分析的请求,将与语音命令相应的控制命令信息发送到处理设备,将包括语音识别命令以及相应的控制命令信息的语音识别命令列表存储在存储器中,并将存储的语音识别命令列表发送到显示设备,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令。
控制器可从显示设备接收已被成功识别的用户的语音命令以及相应的控制命令信息,并基于接收的用户的语音命令以及相应的控制命令信息来准备语音识别命令列表。
根据另一示例性实施例的一方面,提供了一种分析到显示设备的用户的语音命令的服务器的控制方法,所述控制方法包括:从显示设备接收对用户的语音命令的分析的请求;将与语音命令相应的控制命令信息发送到显示设备;存储包括语音识别命令以及相应的控制命令信息的语音识别命令列表,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令;将存储的语音识别命令列表发送到显示设备。
所述控制方法还可包括:从显示设备接收已被成功识别的用户的语音命令以及相应的控制命令信息,其中,存储的步骤包括基于接收的用户的语音命令以及相应的控制命令信息来准备语音识别命令列表。
根据另一示例性实施例的一方面,提供了一种处理设备的控制方法,所述控制方法包括:从用户接收命令;确定接收的命令是否相应于包括在存储的识别命令列表中的识别命令,所述存储的识别命令列表包括识别命令以及与识别命令相应的控制命令信息;响应于确定接收的命令相应于包括在存储的识别命令列表中的识别命令,根据包括在识别命令列表中并与识别命令相应的控制命令信息进行操作;响应于确定接收的命令不相应于包括在存储的识别命令列表中的识别命令,将接收的命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并根据接收的控制命令信息进行操作。
附图说明
通过下面结合附图对示例性实施例进行的描述,上述和/或其它方面将会变得清楚和更易于理解,其中:
图1是根据示例性实施例的电子装置和分析服务器的框图;
图2是根据示例性实施例的电子装置的框图;
图3是根据示例性实施例的分析服务器的框图;
图4是示出根据示例性实施例的电子装置的操作的流程图;
图5示出根据示例性实施例的语音识别命令列表的示例;
图6是示出根据示例性实施例的由电子装置确定分析的可能性的操作的流程图;
图7是示出根据示例性实施例的电子装置的操作的另一示例的流程图;
图8是示出根据示例性实施例的电子装置的操作的另一示例的流程图;
图9示出根据示例性实施例的电子装置和分析服务器的示例;
图10是示出根据示例性实施例的服务器的操作的流程图;
图11是示出根据示例性实施例的服务器的操作的流程图;
图12是根据示例性实施例的电子装置、分析服务器和语音到文本(STT)服务器的框图;以及
图13和图14示出根据示例性实施例的为每个用户存储的语音命令列表的示例。
具体实施方式
以下,将参照附图来详细描述示例性实施例,以使具有本领域普通知识的人员容易地实现所述示例性实施例。可以以各种形式来实施示例性实施例,而不必限制为这里阐述的示例性实施例。为了清楚而省略了已知部分的描述,并且相同标号始终表示相同部件。
图1是根据示例性实施例的电子装置1和分析服务器2的框图。根据示例性实施例的电子装置1和分析服务器2通过网络3彼此连接。电子装置1在用户的命令下进行操作,并包括例如家用电器或个人手持设备(诸如,电视(TV)、机顶盒、数字多功能盘(DVD)播放器、空调、冰箱、计算机、移动电话、智能电话、智能平板计算机等)、办公机器(诸如,打印机和复印机)以及基于电气/电子电路进行操作的任何其它装置。
根据当前示例性实施例的用户的命令包括电子装置1可基于其确定在用户的动作下执行预定操作的信息。电子装置1和分析服务器2分析用户的命令以识别用户的命令。例如,用户的命令可包括用户的语音、手势和特定外貌的至少一个。以下,为了描述方便,用户的命令将示例为语音命令,并且电子装置1包括诸如TV的显示装置。然而,将理解其它示例性实施例不限于此。
根据当前示例性实施例的网络3包括用于在电子装置1与分析服务器2之间交换关于用户的语音命令的信息的装置或基础设施,并可以是有线和/或无线网络。
分析服务器2连接到网络3,分析关于用户的语音命令的服务,即,用户的用于作为客户机的电子装置1的语音命令,并将分析结果发送到电子装置1。根据当前示例性实施例的分析服务器2将包括语音识别命令的语音识别命令列表发送到电子装置1,其中,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次并且与控制命令信息相应的的语音命令。控制命令信息用于控制电子装置1在语音识别命令下如用户所期望地进行操作。电子装置1基于由分析服务器2发送的语音识别命令列表来识别用户的语音命令。也就是,如果用户的语音命令被输入,则电子装置1识别用户的语音命令是否相应于包括在语音识别命令列表中的语音识别命令,如果是的话,则根据语音识别命令的控制命令信息进行操作。相反,如果用户的语音命令不相应于包括在语音识别命令列表中的语音识别命令,则电子装置1将用户的语音命令发送到分析服务器2。分析服务器2分析由电子装置1发送的用户的语音命令并将相应的控制命令信息发送到电子装置1。电子装置1根据由分析服务器2发送的控制命令信息来进行操作。
根据当前示例性实施例,电子装置1基于由分析服务器2提前发送的语音识别命令列表来识别用户的语音命令,而不是将所有用户的语音命令发送到分析服务器2,并且如果基于接收的语音识别命令列表,用户的语音命令的识别不可用,则根据由分析服务器2发送的控制命令信息进行操作。因此,可最小化在电子装置1与分析服务器2之间花费的通信时间,并且可最小化用于识别用户的语音命令并执行操作的时间。
图2是根据示例性实施例的电子装置1的框图。电子装置1可包括操作执行器11、命令接收器12、通信单元13(例如,诸如有线和/或无线接口、端口、卡、狗(dongle)等的通信器)以及控制器14。电子装置1可还包括存储单元15(例如,诸如RAM、ROM、闪存、硬盘驱动器等的存储器)。操作执行器11执行电子装置1的操作。例如,如果电子装置1包括诸如TV的显示设备,则操作执行器11可包括信号接收器111、图像处理器112和显示单元113(例如,诸如液晶显示面板、等离子显示面板、有机发光二极管显示器等的显示器)。然而,应理解操作执行器11相应于实现电子装置1的产品的操作,并不限于图2中示出的示例。
信号接收器111可接收包括在由广播信号发送设备(未示出)发送的广播信号中的图像信号,从视频装置(诸如,DVD播放器、蓝光盘(BD)播放器等)接收图像信号,从个人计算机(PC)接收图像信号,从移动装置(诸如,智能电话和智能平板计算机)接收图像信号,通过网络(诸如,互联网)接收图像信号,或接收作为存储在存储介质(诸如,通用串行总线(USB)存储介质)中的图像内容的图像信号。
图像处理器112处理由信号接收器111接收的图像信号以显示图像。图像处理器112可执行解码、图像增强和缩放操作。显示单元113基于由图像处理器112处理的图像信号来显示图像。显示单元113的图像显示方法不受限制。
图像处理器112接收用户的语音命令。例如,命令接收器112可包括用于接收用户的语音命令的第一命令接收器121。第一命令接收器121可包括用于将接收的用户的语音命令转换为语音信号的话筒。命令接收器12还可包括用于接收用户的操作命令的第二命令接收器122。第二命令接收器122可实现为从远程控制器(未示出)接收包括与用户的操作命令相应的键输入信息的远程控制信号的远程控制信号接收器,或者可实现为在电子装置1中设置并产生与用户的操作相应的键输入信息的操作面板。
通信单元13通过网络3与分析服务器2进行通信。通信单元13在控制器14的控制下与分析服务器2交换用户的语音命令和关于分析结果的信息。
控制器14控制操作执行器11以在用户的语音命令下执行操作。响应于通过通信单元13从分析服务器2接收语音识别命令列表151,控制器14将接收的语音识别命令列表151存储在存储单元15中。响应于通过命令接收器12接收用户的语音命令,控制器14识别用户的语音命令是否相应于包括在存储的语音识别命令列表151中的语音识别命令,如果是的话,则控制器14控制操作执行器11根据与包括在存储的语音识别命令列表151中的语音识别命令相应的控制命令信息来执行操作。如果用户的语音命令不相应于包括在存储的语音识别命令列表151中的语音识别命令,则控制器14控制通信单元13将用户的语音命令发送到分析服务器2,并且响应于从分析服务器2接收与发送的语音命令相应的控制命令信息,控制操作执行器11以根据接收的控制命令信息执行操作。
控制器14可包括中央处理单元(CPU),并可执行控制程序以用于操作。控制器14还可包括:诸如闪存的非易失性存储器,用于存储控制程序;以及诸如双数据率(DDR)存储器的易失性存储器,用于载入存储的控制程序的至少一部分以用于CPU的快速访问。控制器14的控制程序被编程为控制操作执行器11的操作。
图3是根据示例性实施例的分析服务器2的框图。分析服务器2包括通信单元21(例如,诸如有线和/或无线接口、端口、卡、狗等的通信器)、控制器22和存储单元23(例如,诸如ROM、闪存、硬盘驱动器等的存储器)。通信单元21通过网络3与电子装置1的通信单元13进行通信。控制器22控制分析服务器2的操作。作为非易失性存储器的存储单元23存储与用户的语音命令相应的语音识别命令列表231。控制器22控制通信单元21以将存储在存储单元23中的语音识别命令列表231发送到电子装置1。响应于从电子装置1接收用户的语音命令和对用户的语音命令的分析请求,控制器22分析接收的用户的语音命令。控制器22控制通信单元21将用户的语音命令的分析结果发送到电子装置1。
图4是示出根据示例性实施例的电子装置1的操作的流程图。在操作S41,电子装置1从分析服务器2接收语音识别命令列表151。接收的语音识别命令列表151可存储在存储单元15中。图5示出根据示例性实施例的语音识别命令列表151的示例。语音识别命令列表151可包括多个语音识别命令(“语音识别命令1”、“语音识别命令2”、“语音识别命令3”等)以及与所述多个语音识别命令相应的多个控制命令信息(“控制命令信息1”、“控制命令信息2”、“控制命令信息3”等)。多个语音识别命令可包括诸如“开启”、“关闭”或“提高音量”的命令。多个控制命令信息可包括关于将由电子装置1执行的与所述多个语音识别命令相应的操作或功能的固有控制信息。
如果电子装置1被开启,则电子装置1可请求分析服务器2发送语音识别命令列表231。响应于从电子装置1接收对发送语音识别命令列表231的请求,分析服务器2可将语音识别命令列表231发送到电子装置1。电子装置1可将由分析服务器2发送的语音识别命令列表231存储在存储单元15中。如果存储单元15已经具有存储在其中的语音识别命令列表151,则电子装置1可将存储的语音识别命令列表151与已由分析服务器2发送的语音识别命令列表231进行比较,并基于接收的语音识别命令列表231来更新存储的语音识别命令列表151。
参照回图4,在操作S42,电子装置1接收用户的语音命令。在操作S43,电子装置1识别接收的用户的语音命令是否相应于包括在接收的语音识别命令列表231中的语音识别命令。图6是示出确定语音命令是否相应于包括在接收的语音识别命令列表231中的语音识别命令的操作的流程图。
在操作S61,电子装置1接收用户的语音命令。在操作S62,电子装置1确定接收的语音命令是否相应于包括在语音识别命令列表151中的语音识别命令。可例如通过接收的语音命令与包括在语音识别命令列表151中的语音识别命令有多相似来确定根据当前示例性实施例的相关性。例如,如果用户说出命令“关闭”,并且语音识别命令列表151包括实质上与用户说出的命令相同或相似的语音识别命令“关闭”,则可确定该语音命令与语音识别命令列表151中的语音识别命令最相关。作为另一示例,如果用户说出命令“提高音量”,并且语音识别命令列表151包括语音命令“音量上升”,则这两个事例可以高度相关。在这种情况下,电子装置1可确定语音命令与语音识别命令列表151中的相应的语音识别命令之间的相关性至少具有预定值或更大。作为另一示例,如果用户说出命令“使屏幕更亮”,并且如果识别出语音识别命令别表151不具有任何相似的语音识别命令,则电子装置1可确定语音命令与语音识别命令列表151中的相应的语音识别命令之间的相关性小于预定值。
返回图6,在操作S63,如果确定语音识别命令列表151包括与语音命令的相关性具有预定值或更大的语音识别命令,则在操作S64,电子装置1确定语音命令相应于包括在语音识别命令列表151中的语音识别命令。相反,如果确定语音识别命令列表151不具有与语音命令的相关性具有预定值或更大的任何语音识别命令,在操作S65,电子装置1确定语音命令不相应于包括在语音识别命令列表151中的语音识别命令。
返回到图4,如果在操作S44确定用户的语音命令相应于接收的语音识别命令列表151中的语音识别命令,则在操作S45,电子装置1根据与语音识别命令列表151中的语音识别命令相应的控制命令信息进行操作。例如,电子装置1通过参照与包括在语音识别命令列表151中的语音识别命令(诸如,“关闭”和“音量上升”)相应的控制命令信息来执行操作,其中,所述语音识别命令(诸如,“关闭”和“音量上升”)相应于用户的语音命令(诸如,“关闭”和“提高音量”)。
如果在操作S44确定用户的语音命令不相应于包括在接收的语音识别命令列表151中的语音识别命令,则在操作S46,电子装置1将用户的语音命令发送到分析服务器2。例如,如果用户的语音命令“使屏幕更亮”基于语音识别命令列表151未被识别,则电子装置1将语音命令“使屏幕更亮”的信息发送到分析服务器2。在操作S47,电子装置从分析服务器2接收与语音命令相应的控制命令信息。例如,电子装置1接收与语音命令相应的控制命令信息作为语音命令“使屏幕更亮”的分析结果。在操作S48,电子装置1根据接收的控制命令信息进行操作。
图12示出根据示例性实施例的语音到文本(STT)服务器4的示例。电子装置1可将关于用户的语音命令的信息(即,用户产生的语音)处理为文本。例如,电子装置1将接收的用户的语音命令发送到STT服务器4。STT服务器4包括STT转换器41,该STT转换器41将电子装置1发送的用户的语音命令转换为相应的文本。STT服务器4将用户的语音命令转换成的文本发送到电子装置1。电子装置1可基于STT服务器4发送的文本来确定用户的语音命令是否相应于包括在存储的语音识别命令列表中的语音识别命令。电子装置1可将STT服务器4提供的文本发送到服务器1并请求服务器1分析用户的语音命令。
图7是示出根据示例性实施例的电子装置1的操作的另一示例的流程图。在当前示例性实施例中,将对用户的语音命令被确定为不相应于接收的语音识别命令列表151中的语音识别命令的情况进行解释。在操作S71,电子装置1将用户的语音命令发送到分析服务器2。在操作S72,电子装置1识别是否已从分析服务器2接收到与用户的语音命令相应的控制命令信息。如果电子装置1已经从分析服务器2接收到与用户的语音命令相应的控制命令信息,则在操作S73,电子装置1根据由分析服务器2发送的控制命令信息进行操作。如果电子装置1还未从分析服务器2接收到与用户的语音命令相应的控制命令信息,则在操作S74,电子装置1识别在用户的语音命令已被发送到分析服务器2之后是否已过去预定时间。如果未过去预定时间,则再次执行操作S72。相反,如果已过去预定时间,则在操作S75,电子装置1在接收的语音识别命令列表151中的语音识别命令下进行操作。
例如,如果用户说出命令“减小屏幕”,则电子装置1可确定语音识别命令列表具有语音命令“使屏幕更小”并且这两个命令之间的相关性小于预定值。因此,在这种情况下,电子装置1向分析服务器2请求分析结果。然而,如果由于通信状况等而从分析服务器2接收分析结果花费较长时间,则对于用户来说等待较长时间直到操作被执行可能是不方便或难以进行的。在这种情况下,如果在电子装置向分析服务器2请求分析结果之后过去了预定时间,则电子装置1可快速地在相关性小于预定值的语音识别命令下进行操作。例如,电子装置1在语音识别命令列表151中的与用户的语音命令“减小屏幕”相应的语音识别命令“使屏幕更小”下进行操作。如果存在与语音命令相关的几个语音识别命令,则电子装置1可首先选择多个语音识别命令中的最相关的语音识别命令以用于其操作。在当前示例性实施例中,可最小化用户等待操作的时间,从而提高用户的便利。
根据另一示例性实施例,使用相关性低的语音识别命令可能不会与用户的意图相一致,从而可避免这样的操作。图8是示出根据示例性实施例的电子装置1的操作的另一示例的流程图。在当前示例性实施例中,将对在电子装置向分析服务器2请求分析之后过去了预定时间并且存在被确定为与语音命令相关到一定程度的语音识别命令的情况进行解释。在操作S81,在电子装置1在被确定为与语音命令相关到一定程度的语音识别命令下进行操作之前,电子装置1向用户通知语音识别命令的内容。更具体地,电子装置1可在显示单元113上显示这样的消息:所述消息询问用户当前用户的语音命令是否落入在被确定为相关到一定程度的语音识别命令下。例如,如果用户说出语音命令“减小屏幕”,则询问用户语音识别命令列表151中的语音识别命令“使屏幕更小”是否与用户的意图相一致的消息被显示。在操作S82,电子装置1通过第二命令接收器122接收关于语音识别命令的用户的意图。如果在操作S83确定用户同意语音识别命令,则在操作S84,电子装置1在语音识别命令下进行操作。相反,如果在操作S83确定用户不同意语音识别命令,则电子装置1不根据语音识别命令进行操作。因此,在当前示例性实施例中,电子装置1与用户的意图更近似地进行操作,从而提高用户的便利。
根据另一示例性实施例,如果在语音识别命令列表151中没有语音识别命令相应于用户的语音命令,则电子装置1可显示包括在语音识别命令列表151中的多个语音识别命令,并使用户能够选择多个语音识别命令中与关于语音命令的用户的意图相一致的一个语音识别命令。如果用户选择了多个语音识别命令中的一个,则电子装置1基于与选择的语音识别命令相应的控制命令信息进行操作。
在存储的语音识别命令列表151不包括与用户的语音命令相应的语音识别命令的情况下,如果基于用户的意图确定用户的语音命令被新近和成功地识别,则电子装置1将用于与识别的语音命令相应的控制命令信息添加到语音识别命令列表151,并存储所述信息。在这种情况下,电子装置1可将识别的语音命令和相应的控制命令信息发送到分析服务器2,所述分析服务器2更新语音识别命令列表231。
图13示出根据示例性实施例的显示存储的语音命令的列表的用户接口(UI)131的示例。电子装置1存储由用户说出的语音命令,并在用户请求时,可将存储的语音命令的列表显示为UI 131。如图13所示,显示为UI 131的存储的语音命令的列表显示已由用户说出的语音命令132。电子装置1可存储按照每个用户的语音命令,并按照每个用户(标号133)地显示存储的语音命令132。电子装置1可按照语音命令132已被用户说出多少次的顺序来显示存储有语音命令132的存储的语音命令的列表。因此,用户可通过UI 131容易地观看用户之前已说出的语音命令,并便利地说出语音命令。
根据示例性实施例,用户可按照每个语音命令注册(例如,存储)识别符号,如果之后用户说出注册的识别符号,则电子装置1可确定相应的语音命令已被接收。显示存储的语音命令的列表的UI 131还可显示与每个语音命令相应的识别符号134。例如,如果识别符号1被注册用于诸如“告诉我明天的天气”的语音命令,则在用户说出识别符号“1”时,电子装置1确定语音命令“告诉我明天的天气”已被输入。因此,为了便利,用户可使用简单的识别符号来代替具有长或复杂句子的语音命令。电子装置1可在用户的指令下从UI 131的列表删除任何语音命令或将新的语音命令添加到UI 131的列表。
根据另一示例性实施例,如果用户说出一个语音命令被排列在语音命令的列表的UI 131中的位置,则电子装置1可确定语音命令已被接收。例如,如果用户在列表的UI 131被显示时说出“第一个”,则电子装置1可确定在列表的UI 131中排名顶端的语音命令“告诉我明天的天气”已被说出。
电子装置1可在用户的指令下编辑存储的语音命令的列表的UI 131中的语音命令的顺序。图14示出编辑UI 131中的语音命令的顺序的情况。例如,如图14所示,电子装置1可在用户的指令下交换命令“玩%%%”和“记录$$$新闻”的顺序。在这种情况下,可保持相应的识别符号或者可交换所述两个命令的识别符号。
图9示出根据示例性实施例的电子装置1和分析服务器2a的示例。将不重复对与已参照图1到图8解释的分析服务器2的配置相同或相似的分析服务器2a的配置的解释。根据当前示例性实施例的分析服务器2a与多个电子装置1进行通信。在从多个电子装置1接收到对用户的语音命令的分析的请求时,分析服务器2a分析语音命令并将分析结果发送到电子装置1。分析服务器2a收集由多个电子装置1发送的用户的语音命令,基于语音命令准备语音识别命令列表231,并将准备的语音识别命令列表231发送到多个电子装置1。
图10是示出根据示例性实施例的分析服务器2a的操作的流程图。在操作S101,分析服务器2a从电子装置1接收对用户的语音命令的分析的请求。在操作S102,分析服务器2a分析语音命令并将与分析结果相应的控制命令信息发送到电子装置1。在操作S103,分析服务器2a基于从多个电子装置1收集的用户的语音命令以及分析结果来准备语音识别命令列表231,并将准备的语音识别命令列表231存储在存储单元23中。分析服务器2a可基于从多个电子装置1持续收集的用户的语音命令及其分析结果来更新存储在存储单元23中的语音识别命令列表231。在操作S104,分析服务器2a将存储在存储单元23中的语音识别命令列表231发送到多个电子装置1。
根据示例性实施例,如上参照图8所解释的,如果存在已被确定为与语音识别命令列表中的语音识别命令较小地相关的语音命令但是该语音命令已被用户请求(已被新近和成功地识别)以进行操作,则电子装置1可将识别的语音命令和相应的控制命令信息发送到分析服务器2a。在这种情况下,分析服务器2a可在语音识别命令列表231中反映接收的语音命令和相应的控制命令信息。根据示例性实施例,如果分析服务器2a接收了识别的语音命令和相应的控制命令信息预定的次数或者从预定数量的电子装置1接收了识别的语音命令和相应的控制命令信息,则分析服务器2a可将语音识别命令添加到语音识别命令列表23。
图11是示出根据示例性实施例的分析服务器2a的操作的流程图。在操作S111,分析服务器2a确定从多个电子装置1收集的用户的语音命令的成功识别次数。也就是说,分析服务器2a确定从多个电子装置1收集的哪个用户的语音命令被频繁地成功识别。在操作S112,分析服务器2a确定收集的用户的语音命令的成功识别次数是否是预定值或更多。如果语音命令的成功识别次数是预定值或更多,则在操作S113,分析服务器2a可将语音命令和控制命令信息作为新的语音识别命令添加到语音识别命令列表。如果语音命令的成功识别次数小于预定值,则分析服务器2a不将语音命令和控制命令信息添加到语音识别命令列表。根据当前示例性实施例,语音识别命令列表仅添加成功识别次数是预定值或更多的语音命令,从而可最小化用于语音识别命令列表的传输时间和电子装置1的用于处理语音识别命令列表的操作。
如上所述,通过经由服务器识别用户的命令的方法,可最小化用于识别用户的命令和执行操作的时间。
虽然上述示例性实施例参照语音命令,但是应理解一个或多个其它示例性实施例不限于此。例如,另一示例性实施例可应用于任何的一种或多种类型的命令,诸如手势命令。在这种情况下,通过示例的方式,命令列表可包括手势识别命令和相应的控制命令信息。
此外,虽然上述示例性实施例参照第一服务器,但是应理解一个或多个其它示例性实施例不限于此,并可应用于多个第一服务器。
虽然不限于此,但是示例性实施例可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储其后可由计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机访问存储器(RAM)、CD-ROM、磁带、软盘和光数据存储装置。计算机可读记录介质还可分布于联网的计算机系统,从而以分布式方式存储和执行计算机可读代码。另外,示例性实施例可被编写为经由计算机可读传输介质(诸如,载波)发送、接收并在执行程序的通用或专用数字计算机中实施的计算机程序。此外,应理解在示例性实施例中,上述装置一个或多个单元、部件、元件等可包括电路、处理器、微处理器等,并可执行存储在计算机可读介质中的计算机程序。
虽然已经示出和描述了一些示例性实施例,但是本领域的这些技术人员将理解,在不脱离范围由权利要求及其等同物限定的发明构思的原理和精神的情况下,可对这些示例性实施例做出改变。
Claims (15)
1.一种显示设备,包括:
处理器,被配置为对信号进行处理;
显示器,被配置为基于处理的信号来显示图像;
语音命令接收器,被配置为从用户接收语音命令;
通信器,被配置为经由网络与外部服务器进行通信;以及
控制器,被配置为进行以下操作:
从外部服务器接收包括语音命令以及相应的控制命令的语音命令列表,并将所述列表存储在存储器中,所述语音命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令,
识别接收的语音命令是否包括在语音命令列表中,其中,语音命令列表包括多个语音命令以及与所述多个语音命令相应的控制命令,
基于识别出接收的语音命令包括在语音命令列表中,基于语音命令列表中的与接收的语音命令相应的控制命令执行操作,以及
基于识别出接收的语音命令不包括在语音命令列表中,连接到外部服务器以将接收的语音命令发送到外部服务器,从外部服务器接收与发送的语音命令相应的控制命令,并基于接收的控制命令执行操作,
其中,基于识别出与发送的语音命令相应的控制命令直到过去预定时间为止都未被接收到,控制器被配置为控制显示器显示与询问用户语音命令列表中的一个语音命令是否与用户的意图相关相应的消息,并响应于所述消息基于用户的意图执行操作。
2.如权利要求1所述的显示设备,其中,显示设备还被配置为:基于识别出接收的语音命令不包括在语音命令列表中,通过将发送到外部服务器的语音命令和从外部服务器接收的相应的控制命令添加到语音命令列表来更新语音命令列表。
3.如权利要求1所述的显示设备,其中,控制器控制按照每个用户地存储语音命令列表的所述多个语音命令并按照每个用户地显示存储的语音命令。
4.如权利要求1所述的显示设备,其中,控制器控制存储语音命令列表的所述多个语音命令,在用户的指令下注册与语音命令相应的识别符号,并基于用户说出注册的识别符号来识别相应的语音命令已被接收。
5.如权利要求1所述的显示设备,其中,控制器基于用户说出一个语音命令被排列在语音命令列表中的位置来识别所述一个语音命令已被接收。
6.如权利要求1所述的显示设备,其中,显示设备存储语音命令列表,并在用户的指令下编辑存储的语音命令列表中的语音命令的顺序。
7.如权利要求1所述的显示设备,其中,显示设备按照所述多个语音命令中的每一个先前已被识别了多少次的顺序来显示语音命令列表。
8.如权利要求1所述的显示设备,其中,所述多个语音命令从服务器被接收,并且是被确定为在被从服务器接收之前已经被识别了预定次数或更多次数的命令。
9.一种显示设备的控制方法,所述控制方法包括:
从外部服务器接收包括语音命令以及相应的控制命令的语音命令列表,并将所述列表存储在存储器中,所述语音命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令;
从用户接收语音命令;
识别接收的语音命令是否包括在语音命令列表中,其中,语音命令列表包括多个语音命令以及与所述多个语音命令相应的控制命令,
基于识别出接收的语音命令包括在语音命令列表中,基于语音命令列表中的与接收的语音命令相应的控制命令执行操作,以及
基于识别出接收的语音命令不包括在语音命令列表中,连接到外部服务器以将接收的语音命令发送到外部服务器,从外部服务器接收与发送的语音命令相应的控制命令,并基于接收的控制命令执行操作,
其中,基于识别出与发送的语音命令相应的控制命令直到过去预定时间为止都未被接收到,控制器被配置为控制显示器显示与询问用户语音命令列表中的一个语音命令是否与用户的意图相关相应的消息,并响应于所述消息基于用户的意图执行操作。
10.如权利要求9所述的控制方法,还包括:基于识别出接收的语音命令不包括在语音命令列表中,通过将发送到外部服务器的语音命令和从外部服务器接收的相应的控制命令添加到语音命令列表来更新语音命令列表。
11.如权利要求9所述的控制方法,还包括:按照每个用户地存储语音命令列表的所述多个语音命令,并按照每个用户地显示存储的语音命令。
12.如权利要求9所述的控制方法,还包括:存储语音命令列表的所述多个语音命令,在用户的指令下注册与语音命令相应的识别符号,并基于用户说出注册的识别符号来识别相应的语音命令已被接收。
13.如权利要求9所述的控制方法,还包括:基于用户说出一个语音命令被排列在语音命令列表中的位置来识别所述一个语音命令已被接收。
14.如权利要求9所述的控制方法,还包括:存储语音命令列表,并在用户的指令下编辑存储的语音命令列表中的语音命令的顺序。
15.如权利要求9所述的控制方法,其中,语音命令从服务器被接收。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910281846.XA CN109979465B (zh) | 2012-09-28 | 2012-12-28 | 电子装置、服务器及其控制方法 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2012-0109453 | 2012-09-28 | ||
KR20120109453 | 2012-09-28 | ||
KR1020120117193A KR101330671B1 (ko) | 2012-09-28 | 2012-10-22 | 전자장치, 서버 및 그 제어방법 |
KR10-2012-0117193 | 2012-10-22 | ||
CN201910281846.XA CN109979465B (zh) | 2012-09-28 | 2012-12-28 | 电子装置、服务器及其控制方法 |
CN201210585173.5A CN103714816A (zh) | 2012-09-28 | 2012-12-28 | 电子装置、服务器及其控制方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210585173.5A Division CN103714816A (zh) | 2012-09-28 | 2012-12-28 | 电子装置、服务器及其控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109979465A CN109979465A (zh) | 2019-07-05 |
CN109979465B true CN109979465B (zh) | 2024-02-20 |
Family
ID=49857999
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910281846.XA Active CN109979465B (zh) | 2012-09-28 | 2012-12-28 | 电子装置、服务器及其控制方法 |
CN201210585173.5A Pending CN103714816A (zh) | 2012-09-28 | 2012-12-28 | 电子装置、服务器及其控制方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210585173.5A Pending CN103714816A (zh) | 2012-09-28 | 2012-12-28 | 电子装置、服务器及其控制方法 |
Country Status (10)
Country | Link |
---|---|
US (4) | US9582245B2 (zh) |
EP (3) | EP2750129A1 (zh) |
JP (2) | JP2014071449A (zh) |
KR (4) | KR101330671B1 (zh) |
CN (2) | CN109979465B (zh) |
AU (1) | AU2012261531A1 (zh) |
BR (1) | BR102013002468B1 (zh) |
FR (1) | FR2996343B3 (zh) |
RU (1) | RU2627117C2 (zh) |
WO (1) | WO2014051207A1 (zh) |
Families Citing this family (117)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR20130125067A (ko) * | 2012-05-08 | 2013-11-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
AU2014214676A1 (en) | 2013-02-07 | 2015-08-27 | Apple Inc. | Voice trigger for a digital assistant |
US10157618B2 (en) | 2013-05-02 | 2018-12-18 | Xappmedia, Inc. | Device, system, method, and computer-readable medium for providing interactive advertising |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
CN104517606A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(深圳)有限公司 | 语音识别测试方法及装置 |
KR102246893B1 (ko) * | 2013-12-11 | 2021-04-30 | 삼성전자주식회사 | 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법 |
US9767803B1 (en) * | 2013-12-16 | 2017-09-19 | Aftershock Services, Inc. | Dynamically selecting speech functionality on client devices |
US9674306B2 (en) * | 2013-12-20 | 2017-06-06 | The Directv Group, Inc. | Method and system for communicating from a client device to a server device in a centralized content distribution system |
CN105023575B (zh) * | 2014-04-30 | 2019-09-17 | 中兴通讯股份有限公司 | 语音识别方法、装置和系统 |
JP6551401B2 (ja) * | 2014-05-01 | 2019-07-31 | ソニー株式会社 | 通信装置又は通信方法、並びにコンピューター・プログラム |
CN103985160B (zh) * | 2014-05-12 | 2017-01-18 | 深圳市威富多媒体有限公司 | 一种基于计算机及语音控制的车牌管理方法及装置 |
JP6440513B2 (ja) * | 2014-05-13 | 2018-12-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
KR102225404B1 (ko) * | 2014-05-23 | 2021-03-09 | 삼성전자주식회사 | 디바이스 정보를 이용하는 음성인식 방법 및 장치 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9589567B2 (en) * | 2014-06-11 | 2017-03-07 | Honeywell International Inc. | Plant control system using voice as a control mechanism |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN105448293B (zh) * | 2014-08-27 | 2019-03-12 | 北京羽扇智信息科技有限公司 | 语音监听及处理方法和设备 |
KR102304052B1 (ko) * | 2014-09-05 | 2021-09-23 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 동작 방법 |
KR20160056548A (ko) * | 2014-11-12 | 2016-05-20 | 삼성전자주식회사 | 질의 응답을 위한 디스플레이 장치 및 방법 |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
KR101642918B1 (ko) * | 2015-08-03 | 2016-07-27 | 서치콘주식회사 | 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
FR3045909B1 (fr) * | 2015-12-17 | 2017-12-29 | Delta Dore | Procede et dispositif d'analyse et de repartition de commandes vocales |
CN105578240A (zh) * | 2015-12-23 | 2016-05-11 | 广州视源电子科技股份有限公司 | 电视终端交互方法和系统 |
CN105719650A (zh) * | 2016-01-30 | 2016-06-29 | 深圳市尔木科技有限责任公司 | 一种语音识别的方法及系统 |
US9898250B1 (en) * | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US9858927B2 (en) * | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
CN105913839A (zh) * | 2016-05-30 | 2016-08-31 | 合肥华凌股份有限公司 | 一种智能冰箱、服务器及语音控制系统和方法 |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10271093B1 (en) * | 2016-06-27 | 2019-04-23 | Amazon Technologies, Inc. | Systems and methods for routing content to an associated output device |
KR20180043627A (ko) * | 2016-10-20 | 2018-04-30 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 장치를 제어하는 방법 |
CN108010522A (zh) | 2016-11-02 | 2018-05-08 | 松下电器(美国)知识产权公司 | 信息处理方法以及记录介质 |
JP6908461B2 (ja) * | 2016-11-02 | 2021-07-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及びプログラム |
CN108010523B (zh) * | 2016-11-02 | 2023-05-09 | 松下电器(美国)知识产权公司 | 信息处理方法以及记录介质 |
US10937421B2 (en) * | 2016-12-23 | 2021-03-02 | Spectrum Brands, Inc. | Electronic faucet with smart features |
US11176932B2 (en) * | 2016-12-23 | 2021-11-16 | Spectrum Brands, Inc. | Electronic faucet with smart features |
CN107086037A (zh) * | 2017-03-17 | 2017-08-22 | 上海庆科信息技术有限公司 | 一种嵌入式设备的语音交互方法、装置及嵌入式设备 |
CN107135443B (zh) * | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
KR20180118461A (ko) | 2017-04-21 | 2018-10-31 | 엘지전자 주식회사 | 음성 인식 장치 및 음성 인식 방법 |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10475454B2 (en) * | 2017-09-18 | 2019-11-12 | Motorola Mobility Llc | Directional display and audio broadcast |
CN109559759B (zh) * | 2017-09-27 | 2021-10-08 | 华硕电脑股份有限公司 | 具备增量注册单元的电子设备及其方法 |
KR102417524B1 (ko) * | 2017-10-13 | 2022-07-07 | 현대자동차주식회사 | 음성 인식 기반의 자동차 제어 방법 |
FR3073067B1 (fr) * | 2017-10-27 | 2020-11-13 | Deepor | Procede de pilotage d'une salle notamment operatoire d'un plateau medico-technique |
KR102480728B1 (ko) * | 2017-11-10 | 2022-12-23 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
KR102517219B1 (ko) * | 2017-11-23 | 2023-04-03 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
KR102528466B1 (ko) * | 2017-12-19 | 2023-05-03 | 삼성전자주식회사 | 복수 화자의 음성 신호 처리 방법 및 그에 따른 전자 장치 |
EP4319174A3 (en) * | 2018-01-08 | 2024-04-24 | LG Electronics Inc. | Display device and system comprising same |
KR102488001B1 (ko) * | 2018-01-22 | 2023-01-13 | 삼성전자주식회사 | 오디오 신호를 이용하여 사용자를 인증하는 전자 장치 및 그 방법 |
US20190251956A1 (en) * | 2018-02-15 | 2019-08-15 | DMAI, Inc. | System and method for prediction based preemptive generation of dialogue content |
WO2019161229A1 (en) | 2018-02-15 | 2019-08-22 | DMAI, Inc. | System and method for reconstructing unoccupied 3d space |
US11455986B2 (en) * | 2018-02-15 | 2022-09-27 | DMAI, Inc. | System and method for conversational agent via adaptive caching of dialogue tree |
JP7003720B2 (ja) * | 2018-02-19 | 2022-01-21 | コニカミノルタ株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
KR102576388B1 (ko) * | 2018-02-21 | 2023-09-08 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 동작 방법 |
KR20190102509A (ko) * | 2018-02-26 | 2019-09-04 | 삼성전자주식회사 | 음성 명령을 수행하는 방법 및 시스템 |
KR102533443B1 (ko) * | 2018-05-04 | 2023-05-17 | 삼성전자 주식회사 | 콘텐츠 제공 방법 및 이를 사용하는 전자 장치 |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
KR102458336B1 (ko) | 2018-05-18 | 2022-10-25 | 삼성전자주식회사 | 공기 조화 장치 및 이의 제어 방법 |
KR20190134107A (ko) * | 2018-05-24 | 2019-12-04 | 삼성전자주식회사 | 사용자의 음성을 처리하는 전자 장치를 포함하는 시스템 및 전자 장치의 음성 인식 제어 방법 |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
EP3613037B1 (en) * | 2018-06-27 | 2020-10-21 | Google LLC | Rendering responses to a spoken utterance of a user utilizing a local text-response map |
CN108510990A (zh) * | 2018-07-04 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、用户设备及存储介质 |
KR102527107B1 (ko) * | 2018-08-08 | 2023-05-02 | 삼성전자주식회사 | 음성에 기반하여 기능을 실행하기 위한 방법 및 이를 지원하는 사용자 전자 장치 |
KR102563314B1 (ko) * | 2018-08-30 | 2023-08-04 | 삼성전자주식회사 | 전자 장치 및 단축 명령어의 바로가기 생성 방법 |
CN110910869B (zh) * | 2018-09-14 | 2022-02-18 | 成都启英泰伦科技有限公司 | 一种语音识别方法和设备 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
KR20200042627A (ko) * | 2018-10-16 | 2020-04-24 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN109448709A (zh) * | 2018-10-16 | 2019-03-08 | 华为技术有限公司 | 一种终端投屏的控制方法和终端 |
KR20200043075A (ko) | 2018-10-17 | 2020-04-27 | 삼성전자주식회사 | 전자 장치 및 그 제어방법, 전자 장치의 음향 출력 제어 시스템 |
KR102651413B1 (ko) * | 2018-10-17 | 2024-03-27 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
CN109408024A (zh) * | 2018-10-18 | 2019-03-01 | 珠海格力电器股份有限公司 | 信息交互方法及装置、存储介质、处理器 |
US10885912B2 (en) * | 2018-11-13 | 2021-01-05 | Motorola Solutions, Inc. | Methods and systems for providing a corrected voice command |
CN109493851A (zh) * | 2018-11-20 | 2019-03-19 | 新视家科技(北京)有限公司 | 一种语音控制方法、相关装置及存储介质 |
CN111312234A (zh) * | 2018-12-11 | 2020-06-19 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端处理器及终端设备 |
CN111312253A (zh) * | 2018-12-11 | 2020-06-19 | 青岛海尔洗衣机有限公司 | 语音控制方法、云端服务器及终端设备 |
CN109495360A (zh) * | 2018-12-18 | 2019-03-19 | 深圳国美云智科技有限公司 | 一种智能家居物联平台、离线语音控制方法及系统 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN111754996A (zh) * | 2019-03-29 | 2020-10-09 | 阿里巴巴集团控股有限公司 | 基于语音模拟遥控器的控制方法、装置及电子设备 |
JP7275795B2 (ja) * | 2019-04-15 | 2023-05-18 | コニカミノルタ株式会社 | 操作受付装置、制御方法、画像形成システム、及び、プログラム |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
JP2021004980A (ja) * | 2019-06-26 | 2021-01-14 | 株式会社アール・イー・ハヤシ | 生活支援マルチリモコン及び生活支援マルチリモコンシステム |
CN112147903A (zh) * | 2019-06-26 | 2020-12-29 | 百度在线网络技术(北京)有限公司 | 一种设备的控制方法、装置及计算机可读存储介质 |
US11508375B2 (en) | 2019-07-03 | 2022-11-22 | Samsung Electronics Co., Ltd. | Electronic apparatus including control command identification tool generated by using a control command identified by voice recognition identifying a control command corresponding to a user voice and control method thereof |
EP3970139A1 (en) * | 2019-10-15 | 2022-03-23 | Google LLC | Detection and/or enrollment of hot commands to trigger responsive action by automated assistant |
KR20210061091A (ko) * | 2019-11-19 | 2021-05-27 | 삼성전자주식회사 | 인텔리전트 어시스턴스 서비스를 제공하기 위한 전자 장치 및 그의 동작 방법 |
CN110992955A (zh) * | 2019-12-25 | 2020-04-10 | 苏州思必驰信息科技有限公司 | 一种智能设备的语音操作方法、装置、设备及存储介质 |
KR102344044B1 (ko) * | 2020-01-22 | 2021-12-27 | 주식회사 엘지유플러스 | 셋탑 단말 및 이의 동작 방법 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112002316A (zh) * | 2020-07-30 | 2020-11-27 | 珠海格力电器股份有限公司 | 一种电器控制方法、装置、存储介质及终端 |
JP7459760B2 (ja) | 2020-10-27 | 2024-04-02 | セイコーエプソン株式会社 | 表示システムの制御方法、表示システム |
JP7536667B2 (ja) * | 2021-01-21 | 2024-08-20 | Tvs Regza株式会社 | 音声コマンド処理回路、受信装置、リモコンおよびシステム |
CN113411722A (zh) * | 2021-06-04 | 2021-09-17 | 深圳市右转智能科技有限责任公司 | 一种智能背景音乐系统 |
CN113593555A (zh) * | 2021-07-23 | 2021-11-02 | 北京百度网讯科技有限公司 | 通过语音方式控制程序的方法、设备及程序产品 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1448915A (zh) * | 2002-04-01 | 2003-10-15 | 欧姆龙株式会社 | 声音识别系统、装置、声音识别方法以及声音识别程序 |
Family Cites Families (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL119948A (en) | 1996-12-31 | 2004-09-27 | News Datacom Ltd | Voice activated communication system and program guide |
US6188985B1 (en) * | 1997-01-06 | 2001-02-13 | Texas Instruments Incorporated | Wireless voice-activated device for control of a processor-based host system |
JPH10326176A (ja) | 1997-05-23 | 1998-12-08 | Oki Hokuriku Syst Kaihatsu:Kk | 音声対話制御方法 |
EP0911808B1 (en) | 1997-10-23 | 2002-05-08 | Sony International (Europe) GmbH | Speech interface in a home network environment |
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP2000085641A (ja) | 1998-09-16 | 2000-03-28 | Kubota Corp | クローラ走行装置 |
FR2783625B1 (fr) * | 1998-09-21 | 2000-10-13 | Thomson Multimedia Sa | Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil |
US7003463B1 (en) | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
WO2000058942A2 (en) | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
JP3873513B2 (ja) | 1999-03-29 | 2007-01-24 | ソニー株式会社 | 情報記録装置 |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US7330815B1 (en) * | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
US7006973B1 (en) | 2000-01-31 | 2006-02-28 | Intel Corporation | Providing information in response to spoken requests |
CA2413657A1 (en) | 2000-06-16 | 2001-12-20 | Healthetech, Inc. | Speech recognition capability for a personal digital assistant |
US7085716B1 (en) | 2000-10-26 | 2006-08-01 | Nuance Communications, Inc. | Speech recognition using word-in-phrase command |
US20020095294A1 (en) | 2001-01-12 | 2002-07-18 | Rick Korfin | Voice user interface for controlling a consumer media data storage and playback device |
JP3919210B2 (ja) | 2001-02-15 | 2007-05-23 | アルパイン株式会社 | 音声入力案内方法及び装置 |
US7225130B2 (en) | 2001-09-05 | 2007-05-29 | Voice Signal Technologies, Inc. | Methods, systems, and programming for performing speech recognition |
JP2003114698A (ja) * | 2001-10-03 | 2003-04-18 | Denso Corp | コマンド受付装置及びプログラム |
JP2003131682A (ja) | 2001-10-24 | 2003-05-09 | Victor Co Of Japan Ltd | 音声コマンドによる機器コントロールシステム |
US20030120493A1 (en) | 2001-12-21 | 2003-06-26 | Gupta Sunil K. | Method and system for updating and customizing recognition vocabulary |
US9374451B2 (en) | 2002-02-04 | 2016-06-21 | Nokia Technologies Oy | System and method for multimodal short-cuts to digital services |
US20040006477A1 (en) | 2002-07-05 | 2004-01-08 | Craner Michael L. | Voice-controllable communication gateway for controlling multiple electronic and information appliances |
AU2002325930A1 (en) * | 2002-08-01 | 2004-02-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Method for automatic speech recognition |
JP2006515073A (ja) * | 2002-09-06 | 2006-05-18 | ヴォイス シグナル テクノロジーズ インコーポレーティッド | 音声認識を実行するための方法、システム、及びプログラミング |
JP2004110613A (ja) | 2002-09-20 | 2004-04-08 | Toshiba Corp | 制御装置、制御プログラム、対象装置及び制御システム |
US6889188B2 (en) | 2002-11-22 | 2005-05-03 | Intel Corporation | Methods and apparatus for controlling an electronic device |
KR20050110021A (ko) | 2003-03-17 | 2005-11-22 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 디바이스의 원격 제어 방법 |
JP2005148151A (ja) * | 2003-11-11 | 2005-06-09 | Mitsubishi Electric Corp | 音声操作装置 |
KR20050060910A (ko) * | 2003-12-17 | 2005-06-22 | 현대자동차주식회사 | 차량의 음성 명령 인식 방법 및 장치 |
JP2005249829A (ja) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | 音声認識を行うコンピュータネットワークシステム |
US20060041926A1 (en) | 2004-04-30 | 2006-02-23 | Vulcan Inc. | Voice control of multimedia content |
JP4554285B2 (ja) | 2004-06-18 | 2010-09-29 | トヨタ自動車株式会社 | 音声認識システム、音声認識方法、及び音声認識プログラム |
TWI334703B (en) | 2004-09-02 | 2010-12-11 | Inventec Multimedia & Telecom | Voice-activated remote control system |
US7283850B2 (en) * | 2004-10-12 | 2007-10-16 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement on a mobile device |
US8942985B2 (en) | 2004-11-16 | 2015-01-27 | Microsoft Corporation | Centralized method and system for clarifying voice commands |
KR100639931B1 (ko) | 2004-11-24 | 2006-11-01 | 한국전자통신연구원 | 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법 |
US7529677B1 (en) | 2005-01-21 | 2009-05-05 | Itt Manufacturing Enterprises, Inc. | Methods and apparatus for remotely processing locally generated commands to control a local device |
KR100725719B1 (ko) | 2005-02-04 | 2007-06-08 | 주식회사 유진로봇 | 음성과 태스크 오브젝트 기반의 대화시스템 |
JP4574390B2 (ja) | 2005-02-22 | 2010-11-04 | キヤノン株式会社 | 音声認識方法 |
US20060235701A1 (en) | 2005-04-13 | 2006-10-19 | Cane David A | Activity-based control of a set of electronic devices |
JP2007052397A (ja) * | 2005-07-21 | 2007-03-01 | Denso Corp | 操作装置 |
JP2007033901A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 音声認識システム、音声認識方法、および音声認識用プログラム |
JP2007226388A (ja) * | 2006-02-22 | 2007-09-06 | Konica Minolta Medical & Graphic Inc | コマンド入力装置及びプログラム |
US20070276651A1 (en) * | 2006-05-23 | 2007-11-29 | Motorola, Inc. | Grammar adaptation through cooperative client and server based speech recognition |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8150699B2 (en) | 2007-05-17 | 2012-04-03 | Redstart Systems, Inc. | Systems and methods of a structured grammar for a speech recognition command system |
US9794348B2 (en) * | 2007-06-04 | 2017-10-17 | Todd R. Smith | Using voice commands from a mobile device to remotely access and control a computer |
US20090018830A1 (en) | 2007-07-11 | 2009-01-15 | Vandinburg Gmbh | Speech control of computing devices |
US8438024B2 (en) | 2007-10-05 | 2013-05-07 | International Business Machines Corporation | Indexing method for quick search of voice recognition results |
JP5467043B2 (ja) * | 2008-06-06 | 2014-04-09 | 株式会社レイトロン | 音声認識装置、音声認識方法および電子機器 |
JPWO2010018796A1 (ja) * | 2008-08-11 | 2012-01-26 | 旭化成株式会社 | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 |
US20100131280A1 (en) | 2008-11-25 | 2010-05-27 | General Electric Company | Voice recognition system for medical devices |
KR101513635B1 (ko) * | 2008-12-05 | 2015-04-22 | 엘지전자 주식회사 | 단말기 및 그 제어 방법 |
US8224644B2 (en) * | 2008-12-18 | 2012-07-17 | Microsoft Corporation | Utterance processing for network-based speech recognition utilizing a client-side cache |
JP5437095B2 (ja) | 2009-05-19 | 2014-03-12 | 東芝機械株式会社 | 敷ブロックの配置方法、敷ブロック移動用工具、および、その工具を備えた工作機械 |
US11012732B2 (en) | 2009-06-25 | 2021-05-18 | DISH Technologies L.L.C. | Voice enabled media presentation systems and methods |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
US20110184740A1 (en) | 2010-01-26 | 2011-07-28 | Google Inc. | Integration of Embedded and Network Speech Recognizers |
EP2586026B1 (en) * | 2010-06-24 | 2016-11-16 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
KR20120020853A (ko) | 2010-08-31 | 2012-03-08 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
JP2012088370A (ja) | 2010-10-15 | 2012-05-10 | Denso Corp | 音声認識システム、音声認識端末、およびセンター |
KR101789619B1 (ko) | 2010-11-22 | 2017-10-25 | 엘지전자 주식회사 | 멀티미디어 장치에서 음성과 제스쳐를 이용한 제어 방법 및 그에 따른 멀티미디어 장치 |
JP5771002B2 (ja) * | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US8914287B2 (en) | 2010-12-31 | 2014-12-16 | Echostar Technologies L.L.C. | Remote control audio link |
US20120170572A1 (en) | 2011-01-03 | 2012-07-05 | Samsung Electronics Co., Ltd. | Method for Enhancing Phone Conversations |
KR20120080069A (ko) | 2011-01-06 | 2012-07-16 | 삼성전자주식회사 | 디스플레이 장치 및 그 음성 제어 방법 |
US10049669B2 (en) * | 2011-01-07 | 2018-08-14 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
JP5606951B2 (ja) | 2011-02-15 | 2014-10-15 | アルパイン株式会社 | 音声認識システムおよびこれを用いた検索システム |
KR101390823B1 (ko) | 2011-04-14 | 2014-05-09 | 삼성중공업 주식회사 | 선박용 열교환기 |
JP5916054B2 (ja) * | 2011-06-22 | 2016-05-11 | クラリオン株式会社 | 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム |
US9009041B2 (en) * | 2011-07-26 | 2015-04-14 | Nuance Communications, Inc. | Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data |
US8972263B2 (en) * | 2011-11-18 | 2015-03-03 | Soundhound, Inc. | System and method for performing dual mode speech recognition |
US9153229B2 (en) * | 2011-11-21 | 2015-10-06 | Robert Bosch Gmbh | Methods and systems for adapting grammars in hybrid speech recognition engines for enhancing local SR performance |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9031848B2 (en) | 2012-08-16 | 2015-05-12 | Nuance Communications, Inc. | User interface for searching a bundled service content data source |
-
2012
- 2012-10-22 KR KR1020120117193A patent/KR101330671B1/ko active IP Right Grant
- 2012-11-29 WO PCT/KR2012/010255 patent/WO2014051207A1/en active Application Filing
- 2012-11-29 RU RU2015111180A patent/RU2627117C2/ru active
- 2012-11-30 AU AU2012261531A patent/AU2012261531A1/en not_active Abandoned
- 2012-12-07 FR FR1261807A patent/FR2996343B3/fr not_active Expired - Lifetime
- 2012-12-11 US US13/710,524 patent/US9582245B2/en active Active
- 2012-12-13 EP EP14161308.3A patent/EP2750129A1/en not_active Ceased
- 2012-12-13 EP EP22168357.6A patent/EP4050599A1/en active Pending
- 2012-12-13 EP EP12196969.5A patent/EP2713366B1/en active Active
- 2012-12-13 JP JP2012272762A patent/JP2014071449A/ja active Pending
- 2012-12-28 CN CN201910281846.XA patent/CN109979465B/zh active Active
- 2012-12-28 CN CN201210585173.5A patent/CN103714816A/zh active Pending
-
2013
- 2013-01-31 BR BR102013002468-6A patent/BR102013002468B1/pt active IP Right Grant
- 2013-03-18 US US13/846,383 patent/US20140095174A1/en not_active Abandoned
- 2013-06-24 KR KR1020130072303A patent/KR102004872B1/ko active IP Right Grant
- 2013-06-24 KR KR1020130072275A patent/KR20140042641A/ko active Search and Examination
- 2013-08-06 US US13/960,680 patent/US10120645B2/en active Active
- 2013-12-11 JP JP2013256372A patent/JP2014071457A/ja active Pending
-
2018
- 2018-09-11 US US16/127,330 patent/US11086596B2/en active Active
-
2019
- 2019-07-19 KR KR1020190087446A patent/KR102169520B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1448915A (zh) * | 2002-04-01 | 2003-10-15 | 欧姆龙株式会社 | 声音识别系统、装置、声音识别方法以及声音识别程序 |
Also Published As
Publication number | Publication date |
---|---|
US9582245B2 (en) | 2017-02-28 |
KR20190088945A (ko) | 2019-07-29 |
AU2012261531A1 (en) | 2014-04-17 |
BR102013002468B1 (pt) | 2020-10-20 |
RU2015111180A (ru) | 2016-10-20 |
JP2014071457A (ja) | 2014-04-21 |
WO2014051207A1 (en) | 2014-04-03 |
FR2996343A3 (fr) | 2014-04-04 |
KR101330671B1 (ko) | 2013-11-15 |
US11086596B2 (en) | 2021-08-10 |
KR20140042641A (ko) | 2014-04-07 |
US10120645B2 (en) | 2018-11-06 |
BR102013002468A2 (pt) | 2014-10-21 |
KR102169520B1 (ko) | 2020-10-23 |
US20140095176A1 (en) | 2014-04-03 |
US20140092007A1 (en) | 2014-04-03 |
KR102004872B1 (ko) | 2019-07-29 |
CN103714816A (zh) | 2014-04-09 |
US20190026075A1 (en) | 2019-01-24 |
FR2996343B3 (fr) | 2015-05-15 |
CN109979465A (zh) | 2019-07-05 |
EP2750129A1 (en) | 2014-07-02 |
US20140095174A1 (en) | 2014-04-03 |
EP4050599A1 (en) | 2022-08-31 |
KR20140042642A (ko) | 2014-04-07 |
JP2014071449A (ja) | 2014-04-21 |
EP2713366B1 (en) | 2016-08-10 |
EP2713366A1 (en) | 2014-04-02 |
RU2627117C2 (ru) | 2017-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109979465B (zh) | 电子装置、服务器及其控制方法 | |
JP6952184B2 (ja) | ビューに基づく音声インタラクション方法、装置、サーバ、端末及び媒体 | |
CN109658932B (zh) | 一种设备控制方法、装置、设备及介质 | |
KR101303474B1 (ko) | 호스트 디바이스 및 액세서리에 의한 원격 제어 신호 학습 및 처리 | |
US10311877B2 (en) | Performing tasks and returning audio and visual answers based on voice command | |
US10108392B2 (en) | User terminal apparatus, display apparatus connected to user terminal apparatus, server, connected system, controller, and controlling method thereof | |
CN111385624A (zh) | 一种基于语音的数据传输控制方法、智能电视及存储介质 | |
CN116320564A (zh) | 显示设备、终端设备和设备控制方法 | |
US11930236B2 (en) | Content playback device using voice assistant service and operation method thereof | |
CN103984691A (zh) | 信息处理设备,信息处理方法以及程序 | |
CN114566144A (zh) | 一种语音识别方法、装置、服务器和电子设备 | |
CN110865853B (zh) | 云服务的智能操作方法和装置以及电子设备 | |
US20230188799A1 (en) | Display device and operation method for same | |
CN116243875A (zh) | 一种显示器的控制方法、系统、电子设备、及存储介质 | |
CN117809633A (zh) | 显示设备和意图识别方法 | |
CN114187897A (zh) | 一种用户意图的识别方法、装置和电子设备 | |
CN113132773A (zh) | 进入电视应用的方法及相关设备 | |
CN117809658A (zh) | 一种服务器、终端及语音识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |