CN105723448B - 电子设备及其语音识别方法 - Google Patents
电子设备及其语音识别方法 Download PDFInfo
- Publication number
- CN105723448B CN105723448B CN201480061513.1A CN201480061513A CN105723448B CN 105723448 B CN105723448 B CN 105723448B CN 201480061513 A CN201480061513 A CN 201480061513A CN 105723448 B CN105723448 B CN 105723448B
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- electronic device
- input
- trigger
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012545 processing Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 39
- 238000004458 analytical method Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
- Selective Calling Equipment (AREA)
- Details Of Television Systems (AREA)
Abstract
提供一种电子设备及其语音识别方法。电子设备的语音识别方法包括:接收触发语音,通过分析触发语音存储触发语音的特性以进行语音验证。当用户发出语音命令时,确定用户语音命令是否包括属于触发语音的特性,并且基于所述确定来执行与用户语音命令相对应的电子设备的功能。因此,用户可以容易地使用电子设备的语音识别功能。
Description
技术领域
根据示例性实施例的装置和方法涉及一种电子设备及其语音识别方法,更具体地,涉及一种用于使用触发语音执行语音识别的电子设备和方法。
背景技术
期望方便地使用电子设备。因此,已经不断开发了用于方便地控制电子设备的技术。用于方便地控制电子设备的技术开始于用于使用设置在电子设备上/附着于电子设备的输入单元控制电子设备的方法,并且已经发展到使用可以短距离地控制电子设备的遥控器控制电子设备的方法。随着包括具有触摸面板的显示器的电子设备的使用快速增长,已经越来越多地使用用于使用触摸输入来控制电子设备的技术。
然而,为了通过触摸控制电子设备,用户总是必须在手臂的长度距离内,以能够触摸电子设备。因此,用于在不使用外部设备(诸如遥控器)的情况下利用或不利用触摸屏在短距离处控制电子设备的需要日益增长。
因此,已经开发了语音识别技术。然而,由于语音识别技术容易被外部噪音(例如,宠物的声音、来自其他电子设备的噪音等)以及用户语音扰乱而导致语音识别技术效率低。因此,为了使用语音识别技术仅响应用户的语音,已经开发了一种按下设置在电子设备或遥控器上的按钮的方法,并且只要用户发出语音命令就使用该方法。
然而,因为每次用户发出语音命令时用户必须按下设置在电子设备或遥控器上的按钮,所以需要到电子遥控设备外壳的距离在手臂长度内仍然对用户不便。
因此,需要容易地使用即使当存在外部噪音时或当存在多个人且正在交流时也不被扰乱的语音识别功能。
发明内容
技术问题
示例性实施例克服上述缺点以及以上未描述的其他缺点。此外,实施例不需要克服以上描述的缺点,且示例性实施例可以不克服以上描述的任何问题。
不同的示例性实施例提供使得用户能够容易地使用语音识别功能的电子设备及其语音识别方法。
问题的解决方案
根据示例性实施例的一方面,一种电子设备的语音识别方法包括:接收用户语音输入,确定接收的用户语音是否是触发语音,将电子设备的操作模式改变为语音识别模式,分析接收的用户语音,并存储用户语音的至少一个特性,如果确定用户语音是触发语音,则接收语音命令输入,分析语音命令,将分析的语音命令的至少一个特性与存储的用户语音的至少一个特性进行比较,并基于比较结果执行与语音命令相对应的功能。
根据另一示例性实施例,所述存储包括存储以下中的至少一个:用户语音的能量、频率带宽、正输入用户语音时的混响时间(RT)或语音信号噪声比(SNR)。
根据另一示例性实施例,所述执行包括:如果语音命令的能量、频率带宽、正输入语音命令时的混响时间(RT)和语音信号噪声比(SNR)中的至少一个的分析数据在触发语音的能量、频率带宽、正输入触发语音时的RT和语音SNR中的至少一个的分析数据的预定范围内,则执行与语音命令相对应的功能。
根据另一示例性实施例,所述比较包括:如果输入多个用户语音,则分析所述多个用户语音,并从分析的所述多个用户语音之中,将分析的用户语音中的具有与存储的用户语音的至少一个特性匹配的至少一个特性的至少一个用户语音确定为语音命令,并且所述执行包括:执行与确定的语音命令相对应的功能。
根据另一示例性实施例,所述方法包括:如果分析的语音命令的至少一个特性不同于存储的用户语音的至少一个特性,则旁路掉语音命令。
根据另一示例性实施例,所述方法包括:如果确定用户语音是触发语音并且电子设备将其操作模式改变为语音识别模式,则显示对语音识别模式的激活加以指示的用户界面(UI)。
根据另一示例性实施例,所述显示包括:如果执行与语音命令相对应的功能,则在UI上显示指示语音命令的指示器。
根据另一示例性实施例,触发语音是设置为将电子设备的操作模式改变为语音识别模式以执行语音识别的预定语音。
根据另一示例性实施例,通过外部设备或电子设备中的至少一个中包括的麦克风接收用户语音和语音命令。
根据另一示例性实施例,所述方法包括:如果在预定时间段内没有输入语音命令,则结束语音识别模式。
根据另一示例性实施例,所述确定包括:如果用户语音是在按下外部设备上的按钮之后首先接收的语音,则确定接收的用户语音是触发语音。
根据示例性实施例的一方面,一种电子设备包括:语音接收器,被配置为接收用户语音;语音信号分析器,被配置为分析接收的用户语音;存储器,被配置为存储用户语音的至少一个特性;以及控制器,被配置为确定接收的用户语音是否是触发语音,如果确定接收的用户语音是触发语音,则将电子设备的操作模式改变为语音识别模式,分析接收的用户语音,并将用户语音的至少一个特性存储在存储器中,其中,如果输入用于控制电子设备的语音命令,则控制器还被配置为控制语音信号分析器分析语音命令,将分析的语音命令的至少一个特性与存储的用户语音的至少一个特性进行比较,并基于比较结果执行与语音命令相对应的功能。
根据另一示例性实施例,控制器还被配置为将用户语音的能量、频率带宽、正输入用户语音时的混响时间(RT)或语音信号噪声比(SNR)中的至少一个作为用户语音的所述至少一个特性存储在存储器中。
根据另一示例性实施例,如果语音命令的能量、频率带宽、正输入语音命令时的混响时间(RT)或语音信号噪声比(SNR)中的至少一个的分析数据在触发语音的能量、频率带宽、正输入触发语音时的RT和语音SNR中的至少一个的分析数据的预定范围内,则控制器执行与语音命令相对应的功能。
根据另一示例性实施例,当通过语音接收器输入多个用户语音时,控制器控制语音信号分析器分析所述多个用户语音,将所述多个用户语音中的具有与存储的用户语音的至少一个特性匹配的分析的至少一个特性的至少一个用户语音确定为语音命令,并执行与确定的语音命令相对应的功能。
根据另一示例性实施例,当分析的语音命令的至少一个特性不同于存储的用户语音的至少一个特性时,控制器旁路掉语音命令。
根据另一示例性实施例,所述电子设备还包括显示器,如果确定用户语音是触发语音并且电子设备将其操作模式改变为语音识别模式,则控制器控制显示器显示对语音识别模式的激活加以指示的用户界面(UI)。
根据另一示例性实施例,当执行与语音命令相对应的功能时,控制器控制显示器在UI上显示指示语音命令的指示器。
根据另一示例性实施例,触发语音是设置为将电子设备的操作模式改变为语音识别模式以执行语音识别的预定语音。
根据另一示例性实施例,所述电子设备还包括通信器,当通过外部设备接收到用户语音和语音命令时,控制器控制通信器接收用户语音和语音命令。
根据另一示例性实施例,当在预定时间段内没有输入语音命令时,控制器结束语音识别模式。
根据另一示例性实施例,控制器还被配置为:如果用户语音是在按下外部设备上的按钮之后首先接收的语音,则确定输入的用户语音是触发语音。
根据示例性实施例的一方面,一种电子设备的语音识别方法包括:接收第一语音输入,对接收的第一语音输入执行语音至文本识别以获得第一文本,确定第一文本是否与用于进入语音识别模式的命令相对应,并且如果确定第一文本与用于进入语音识别模式的命令相对应,则:进入语音识别模式,存储第一语音输入的第一特性,接收第二语音输入,通过将第二语音输入的第二特性与第一语音输入的第一特性进行比较来对第二语音输入执行语音验证,并且如果第二语音输入的第二特性与第一语音输入的第一特性相对应,则执行与第二语音输入相对应的功能。
根据另一示例性实施例,执行与第二语音输入相对应的功能包括:对接收的第二语音输入执行语音至文本识别以获得第二文本,确定第二文本是否与电子设备的功能相对应,并基于所述确定来执行所述功能。
根据另一示例性实施例,第一特性和第二特性包括用户语音的能量、频率带宽、正输入用户语音时的混响时间(RT)或语音信号噪声比(SNR)中的至少一个,作为用户语音的至少一个特性。
根据另一示例性实施例,如果第一语音输入的第一特性和第二语音输入的第二特性在预定范围内,则第二特性与第一特性相对应。
根据另一示例性实施例,所述方法还包括:如果在预定时间量内没有接收到第二语音输入,则退出语音识别模式。
根据另一示例性实施例,所述方法还包括:如果第二语音输入的第二特性与第一语音输入的第一特性不对应,则旁路掉第二语音输入。
发明的有益效果
根据多个示例性实施例,用户可以通过确定用户所说出的语音是否是有意的而容易地使用电子设备的语音识别功能。
在后面的描述中将部分地阐述附加和/或其他方面以及优点,这些附加和/或其他方面以及优点部分根据说明书是显而易见的,或者可以通过不同示例性实施例的实践而得以学习。
附图说明
通过参照附图描述特定示例性实施例,上述和/或其他方面将更加显然,在附图中:
图1示出了根据示例性实施例的用于将触发语音输入到电子设备的方法;
图2示出了根据示例性实施例的用于使用外部设备输入触发语音的方法;
图3是示出了根据示例性实施例的电子设备的实施例的框图;
图4是示出了根据示例性实施例的电子设备的另一实施例的框图;
图5是描述了根据示例性实施例的用于分析用户语音并执行语音识别的方法的流程图;
图6是描述了根据示例性实施例的用于分析用户语音,执行语音识别并完成语音识别过程的方法的流程图;以及
图7至图10示出了根据示例性实施例的经由语音识别控制的设备上显示的用户界面(UI)的不同示例。
具体实施方式
现在,将参照附图来更详细地描述特定示例性实施例。
在下面的描述中,即使在不同的附图中,相同的附图标记也用于相同的元件。提供在描述中定义的诸如详细结构和元件的内容以帮助全面理解。因此,显然的是,可以执行示例性实施例而不需要那些具体定义的内容。此外,由于公知的功能或构造会以不必要的细节而模糊实施例,没有对其进行详细地描述。
图1示出了根据示例性实施例的用于将触发语音输入到电子设备100的方法。在图1中,将电视用作电子设备100的实施例,但是电子设备100不限于此。本领域普通技术人员将理解,也可以使用多个不同电子设备(音乐系统、个人计算机、游戏系统等)。电子设备100可以使用具有语音识别功能的多种电子设备来实现,诸如移动电话、平板计算机、数码摄像机、摄录机、笔记本计算机和个人数字助理(PDA)。
电子设备100可以包括麦克风。因此,电子设备100可以在预定距离内从用户接收语音命令,分析接收的语音命令,并确定接收的语音命令是否是触发语音。触发语音是触发电子设备100的功能被激活的预定短词/短语,诸如“你好,电视”。
当确定接收的语音是触发语音时,电子设备100进入语音识别模式。另外,电子设备100存储记录在触发语音中的用户语音的特性。
更具体地,用户语音的特性可以包括用户语音条件和语音环境。用户语音条件可以包括用户语音的能量和用户语音的频带分布。语音环境可以包括发出语音命令时的混响时间(RT)或语音信号噪声比(SNR)。
也就是,用户语音的特性可以包括用户语音的能量、用户语音的频带分布、发出语音命令时的混响时间(RT)和/或语音信号噪声比(SNR)。
例如,当用户发出诸如“你好,电视”等语音命令时,用户语音的特性可以包括用户语音的能量、根据用户性别和/或年龄的用户语音的频带分布、根据电子设备100位置的用户语音的RT或者根据安静室内条件、存在工地、存在宠物或附近人数的语音SNR。
当输入了用户语音时,在将对触发语音的分析结果存储为用户语音的特性之后,电子设备100分析输入的用户语音,并确定输入的用户语音是否包括与属于存储的触发语音的存储的用户语音匹配的特性。也就是,电子设备100确定输入的用户语音的特性是否与属于存储的触发语音的存储的用户语音的存储特性相似。
另外,当确定输入的用户语音的特性与属于存储的触发语音的存储的用户语音的存储特性相似时,电子设备100对输入的用户语音执行语音识别。例如,当用户说出被存储为触发语音的“你好,电视”并且随后说出与属于触发语音的存储的用户语音具有相同特性的“频道13”时,电子设备100将频道改变到频道13。
图2示出了根据示例性实施例的用于使用外部设备/遥控器10输入触发语音的方法。
根据示例性实施例,为了便于电子设备100通过遥控器10接收用户语音并运行语音识别功能,用户按下遥控器10上的输入按钮20,并发出语音命令。此时,在按下输入按钮20之后首先接收的用户语音可以被存储为触发语音。也就是,即使当将诸如“你好,电视”等词语预先确定为触发语音时,在按下输入按钮20之后首先接收的用户语音也由于电子设备100接收到指示通过输入按钮20输入了语音的信号而变成触发语音。
因此,当用户按下输入按钮20并如图2的实施例中所示发出诸如“频道10”等语音命令时,电子设备100将“频道10”识别为触发语音。之后,电子设备100根据触发语音“频道10”进入语音识别模式,并执行语音识别。因此,电子设备100在图2所示的示例性实施例中改变到频道10。
相应地,用户可以通过发出触发语音命令容易地使用电子设备100的语音识别功能。稍后将描述用于使用电子设备100执行语音识别的具体方法。
图3是示出了根据示例性实施例的电子设备100的实施例的框图。参照图3,电子设备100可以包括语音接收器110、语音信号分析器120、存储器130和控制器140。电子设备100可以实现在具有语音识别功能的多种电子设备中,诸如平板计算机、数码摄像机、摄录机、笔记本计算机、PDA和移动电话。
语音接收器110接收用户语音。语音接收器110可以包括麦克风(未示出),并通过麦克风接收用户语音。麦克风可以包括在电子设备100中或者可以是外部设备的一部分。例如,外部设备可以是遥控器。遥控器可以通过麦克风接收用户语音,并将用户语音发送到电子设备100的语音接收器110。
也就是,语音接收器110可以接收通过麦克风输入的用户语音,并将用户语音处理为电音频数据。另外,语音接收器110可以将处理的音频数据发送到语音信号分析器120。
语音信号分析器120分析从语音接收器110接收的语音。例如,根据示例性实施例,语音信号分析器120分析用户语音以获得用户语音的能量、频带分布或混响时间(RT)。
当接收用户语音时,还可能接收用户周围的噪声。因此,语音信号分析器120可以分析用户语音以获得用户语音信号噪声比(SNR)。
存储器130存储语音信号分析器120的多个分析结果。更具体地,存储器130可以存储分析的用户语音的特性,即,用户语音的能量、频带分布、用户语音的RT和/或用户语音SNR。
另外,存储器130存储用于驱动电子设备100的多个软件模块和数据。例如,根据示例性实施例,存储器130可以存储软件,其中包括语音识别模块、基础模块、感测模块、通信模块、呈现模块、web浏览器模块和服务模块。
控制器140控制电子设备100的整体操作。具体地,控制器140确定通过语音接收器110输入的用户语音是否是触发语音。
触发语音是用于将电子设备100的操作模式改变为语音识别模式以执行语音识别的语音。更具体地,触发语音是存储在电子设备100中的预定短词/短语。例如,电子设备100可以将“你好,电视”初始设置为触发语音。换言之,触发语音可以是预先确定的如上所述通过语音接收器110接收的用户语音,或者可以是在用户按下设置在电子设备100的外部设备(例如,遥控器)上的输入按钮之后首先输入的用户语音。
当控制器140确定输入语音是触发语音时,控制器140控制电子设备100进入语音识别模式。另外,控制器140控制语音信号分析器120分析触发语音,并控制存储器130存储用户语音的特性。
用户语音的特性可以包括用户语音的能量、频带分布、用户语音的RT或用户语音的SNR,作为语音信号分析器120的分析结果。
另外,当输入了语音命令来控制电子设备100时,控制器140控制语音信号分析器120分析语音命令。
控制器140将分析的语音命令的特性与存储在存储器130中的用户语音的特性进行比较。之后,控制器140基于比较结果控制电子设备100执行与语音命令相对应的功能。
更具体地,当通过分析经由语音接收器110输入的语音命令的能量、频率带宽、输入语音命令期间的RT或语音SNR中的至少一个所获得的数据在通过分析存储的触发语音的能量、频率带宽、RT中的至少一个所获得的数据的预定范围内且用户语音的语音SNR对应于触发语音时,控制器140控制电子设备100执行与语音命令相对应的功能。
另外,控制器140控制存储器130将由语音信号分析器120分析的用户语音的用户语音条件或用户语音环境存储为用户语音的特性。
控制器140在预定时间段之后完成语音识别模式。更具体地,在通过语音接收器110输入的用户语音是引起电子设备100进入语音识别模式的触发语音之后,如果在预定时间段期间没有输入语音命令,则控制器140完成语音识别模式,即,控制电子设备100退出语音识别模式。
另外,当由语音信号分析器120分析的语音命令的特性与存储在存储器130中的用户语音的特性不相似时,控制器140旁路掉语音命令。
参照图4,电子设备100可以包括语音接收器110、语音信号分析器120、存储器130、控制器140、图像接收器150、图像处理器160、显示器170、音频处理器180、音频输出器190、通信器200和输入器210。图4示出了电子设备100的实施例,其中,电子设备100是具有多种功能的设备,例如语音识别功能、通信功能、视频回放功能、显示功能等。根据示例性实施例,可以省略或改变图4中示出的一些组件,并且可以添加其他组件。
语音接收器110接收用户语音。语音接收器110可以包括麦克风(未示出),并通过麦克风接收用户语音。麦克风可以包括在电子设备100或外部设备中。外部设备可以是遥控器。遥控器可以通过麦克风接收用户语音,并将用户语音发送到语音接收器110。
也就是,语音接收器110可以接收通过麦克风输入的用户语音,并可以将用户语音处理为电子音频数据。另外,语音接收器110可以将处理的音频数据发送到语音信号分析器120。
语音信号分析器120分析通过语音接收器110接收的语音。例如,语音信号分析器120分析用户语音以获得用户语音的能量、频带分布或混响时间(RT)。
当接收用户语音时,还可能接收用户周围的噪声。因此,语音信号分析器120可以分析用户语音以获得用户语音信号噪声比(SNR)。
存储器130存储语音信号分析器120的多个分析结果。更具体地,存储器130可以存储分析的用户语音的特性,即,用户语音的能量、频带分布、用户语音的RT或用户语音SNR。
另外,存储器130存储用于驱动电子设备100的多种软件模块和数据。例如,根据示例性实施例,存储器130可以存储软件,其中包括语音识别模块、基础模块、感测模块、通信模块、呈现模块、web浏览器模块和服务模块。
控制器140控制电子设备100的整体操作。具体地,控制器140确定通过语音接收器110输入的语音是否是触发语音。
触发语音是用于将电子设备100的操作模式改变为语音识别模式以执行语音识别的语音。更具体地,触发语音是存储在电子设备100中的预定短词/短语。例如,电子设备100可以将“你好,电视”初始设置为触发语音。换言之,触发语音可以是作为如上所述通过语音接收器110接收的预定词语/短语的用户语音,或者可以是在用户按下设置在电子设备100的外部设备(例如,遥控器)上的输入按钮之后首先输入的用户语音。
更具体地,如果存储在电子设备100中的所述预定词语/短语是“你好,电视”,则当通过麦克风输入了“你好,电视”时,控制器140将电子设备100的操作模式改变为语音识别模式,并控制语音信号分析器120分析输入的用户语音“你好,电视”。麦克风可以包括在电子设备100或电子设备100的外部设备(例如遥控器)中。另外,当输入了按下遥控器的输入按钮的用户命令并且随后首先输入了语音时,控制器140可以确定首先输入的语音是触发语音。
也就是,当控制器140确定输入的语音是预定的触发语音时,控制器140将电子设备100的操作模式改变为语音识别模式,控制语音信号分析器120分析触发语音,并控制存储器130存储用户语音的特性。例如,控制器140控制存储器130存储触发语音的分析结果,例如触发语音的能量、频率带宽、说出语音时的混响时间(RT)和/或语音信号噪声比(SNR)。
当在电子设备已进入语音识别模式之后通过语音接收器110输入了语音命令时,控制器140控制语音信号分析器120分析语音命令。语音命令可以包括用于控制电子设备100的功能的所有用户语音。另外,控制器140控制语音信号分析器120将具有多于预定能量的能量的用户语音识别为语音命令,并分析该用户语音。
例如,当在电子设备100已进入语音识别模式之后通过语音接收器110输入了控制语音“频道13”时,控制器140控制语音信号分析器120分析语音命令“频道13”的能量、频率带宽、输入语音命令时的RT和/或语音SNR。
根据示例性实施例,当关于控制语音“频道13”的能量、频率带宽、输入语音命令时的RT和/或语音SNR的分析结果在关于存储在存储器130中的触发语音的能量、频率带宽、输入触发语音时的RT和/或语音SNR的分析结果的预定范围内时,控制器140对语音命令执行语音识别,并将电子设备100改变到频道13。
另外,当用户按下外部设备的输入按钮并说出“频道13”时,控制器140确定“频道13”是触发语音。之后,控制器140基于前述方法分析“频道13”,将分析结果存储为用户语音的特性,并将电子设备100的操作模式改变为语音识别模式。另外,控制器140将电子设备100改变到频道13。
当在改变到频道13之后通过语音接收器110接收到语音命令“增大音量”时,控制器140使用语音信号分析器120分析接收到的语音命令,并确定分析结果是否在用户语音的特性的预定范围内。当分析结果在用户语音的特性的预定范围内时,控制器140执行语音识别并增大音量。
当在改变为语音识别模式之后接收到多个用户语音时,控制器140控制语音信号分析器120分析每个用户语音。另外,控制器140确定在这些用户语音之中具有与存储在存储器130中的用户语音的特性相似的分析结果的用户语音是语音命令。因此,控制器140根据确定的语音命令执行语音识别。
例如,如果第一用户、第二用户和第三用户正在电子设备100周围交流并且第一用户发出预定触发语音“你好,电视”,则语音接收器110接收第一用户的语音,控制器140将电子设备100的操作模式改变为语音识别模式,并控制语音信号分析器120分析第一用户的触发语音。
更具体地,语音信号分析器120可以分析第一用户语音的能量和频带分布。另外,语音信号分析器120可以分析输入第一用户语音时的RT和第一用户语音SNR。控制器140控制存储器130将第一用户的触发语音的分析结果存储为用户语音的特性。
当在存储了用户语音的特性之后第一用户、第二用户和第三用户分别说出“增大音量”、“完成”和“频道13”时,并且当语音接收器110接收到用户语音时,控制器140控制语音信号分析器120分析接收到的每个用户的语音。
语音信号分析器120分析每个用户的能量、频道分布、RT或SNR中的至少一个。另外,控制器140将关于每个用户语音的特性的分析结果与存储在存储器130中的用户语音的特性进行比较。电就是,控制器140确定由同一用户(第一用户)输入的“增大音量”语音的分析结果与存储在存储器130中的用户语音的特性最相似,并因此,根据由第一用户输入的语音命令“增大音量”来增大电子设备100的音量。
另外,控制器140旁路掉具有与存储在存储器130中的用户语音的特性不同的分析结果的第二用户语音和第三用户语音。因此,虽然电子设备100通过语音接收器110接收到“完成”和“频道13”,但是电子设备100不执行它们的对应功能。
当在执行了语音识别之后过去了预定时间段时,控制器140可以完成语音识别会话,即,控制电子设备100退出语音识别模式。换言之,根据示例性实施例,即使用户没有输入用于完成语音识别的命令,当在预定时间段期间没有通过语音接收器110接收到包括语音命令的任何用户语音时,控制器140也控制电子设备100完成语音识别会话。
另外,当由语音信号分析器120分析的语音命令的特性与存储在存储器130中的用户语音的特性不同时,控制器140旁路掉语音命令。
例如,控制器140控制语音信号分析器120分析被确定为触发语音的用户语音,并控制存储器130将用户语音的能量和语音SNR存储为用户语音的特性。
当在存储了用户语音的特性之后语音接收器110接收到语音命令时,控制器140确定由语音信号分析器120分析的语音命令的分析结果是否与存储在存储器130中的用户语音的特性相似。当确定语音命令的能量或语音SNR不同于存储在存储器130中的用户语音的特性时,控制器140旁路掉该语音命令,从而可以不根据如上所述的语音命令控制电子设备100。
图像接收器150通过多种源接收图像数据。例如,根据示例性实施例,图像接收器150可以从外部广播站接收广播数据,从外部服务器实时接收图像数据,或者接收存储在存储器130中的图像数据。
图像处理器160处理由图像接收器150接收的图像数据。根据示例性实施例,图像处理器160对图像数据执行多种图像处理,例如解码、缩放、噪声过滤、帧率转换和分辨率转换。
根据示例性实施例,显示器170显示来自图像接收器150接收的图像数据的由图像处理器160处理的视频帧以及由图形处理器143产生的多个屏幕中的至少一个屏幕。
具体地,显示器170可以显示指示语音识别模式的用户界面(UI)。例如,当“你好,但是”通过语音接收器110被输入,被语音信号分析器120分析,并因此被确定为触发语音时,显示器170显示如下UI,该UI指示已经识别出触发语音并且电子设备100已经进入语音识别模式。
更具体地,显示器170可以显示如图7所示的诸如“你可以按如下说”、“频道19”和“增大音量”的语音命令输入的示例。另外,显示器170可以显示诸如“你想说什么?”等短语,从而指示电子设备100准备接收语音命令。
另外,在语音识别模式下,当输入语音命令并且执行与语音命令相对应的功能时,显示器170可以在控制器140的控制下在UI上显示指示器。
更具体地,根据示例性实施例,在语音识别模式下,当语音命令通过语音接收器110被输入并且被语音信号分析器120分析时,显示器170可以在显示器170的一部分上显示预定颜色(例如,白色),或者显示以预定颜色(例如,白色)闪烁的指示器,从而指示语音命令正被分析。本领域普通技术人员将理解,可以在UI上显示无限不同类型的指示器,以指示如上所述的信息。显示器170可以在UI上显示指示语音识别模式的多种类型的指示器。
例如,显示器170可以如图8所示在UI上显示麦克风形状的图标的指示器。另外,根据示例性实施例,为了指示语音正被识别,显示器170可以显示诸如“语音正被识别”等短语。
可以在显示器170的一部分上显示指示语音识别模式的UI。例如,根据示例性实施例,当输入了触发语音和语音命令时,显示器170可以继续显示内容,并如图9所示在显示器170的一部分上显示指示语音识别模式的UI。
此外,根据示例性实施例,当语音命令被输入且正被分析时,显示器170可以继续显示内容,并如图10所示在显示器170的一部分上的指示语音识别模式的UI上显示指示器。
音频处理器180处理音频数据。音频处理器180可以对音频数据执行诸如解码、放大和噪声过滤等多种处理。根据示例性实施例,由音频处理器180处理的音频数据可以输出到音频输出器190。
音频输出器190输出多种通知声音和语音消息以及由音频处理器180处理的多种音频数据。根据示例性实施例,音频输出器190可以用扬声器来实现。根据另一示例性实施例,音频输出器190可以用音频端来实现。
通信器200根据多种类型的通信方法来与多种类型的外部设备进行通信。根据不同示例性实施例,通信器200可以包括多种通信模块,例如通用串行总线(USB)模块、无线保真(Wi-Fi)模块、蓝牙模块、近场通信(NFC)模块和无线通信模块。Wi-Fi模块、蓝牙模块和NFC模块分别执行基于Wi-Fi方法、蓝牙方法和NFC方法的通信。NFC模块是基于NFC方法进行操作的芯片,NFC方法使用多种射频识别(RFID)频带(例如135kHz、13.56MHz、433MHz、860-960MHz和2.45GHz)之中的13.56MHz频带。在使用Wi-Fi模块或蓝牙模块的情况下,首先发送和接收诸如子系统标识(SSID)和会话密钥的多种连接信息,接着,可以发送和接收多个信息。
另外,当通过外部设备输入了用户语音或语音命令时,通信器200接收输入的语音。例如,当通过安装在遥控器中的麦克风输入了用户语音时,电子设备100通过通信器200接收输入的语音。
输入器210接收用户命令以控制电子设备100的总体操作。根据示例性实施例,输入器210可以用遥控器来实现,其中,遥控器包括用于上、下、左和右方向的四个方向键以及确认键。输入器210可以用多种输入设备来实现,例如触摸屏、鼠标、指向设备。
另外,如果输入器210是遥控器,则遥控器可以包括用于接收语音输入的输入按钮。用户按下遥控器上的输入按钮,并输入语音命令。另外,在按下输入按钮之后首先接收的用户语音可以被视为触发语音。
如图4所示,控制器140可以包括随机存取存储器(RAM)141、只读存储器(ROM)142、图形处理器143、主中央处理单元(CPU)144、第一到第n接口145-1到145-n以及总线146。根据示例性实施例,RAM 141、ROM 142、图形处理器143、主CPU 144以及第一到第n接口145-1到145-n可以经由总线146相互连接。
ROM 142可以存储引导系统的命令集。当输入开启命令并且供电时,主CPU 144将存储在存储器130中的操作系统(OS)复制到RAM 141并根据ROM 142中存储的命令执行OS使得能够启动系统。根据示例性实施例,当启动完成时,主CPU 144将存储在存储器130中的多个应用程序复制到RAM 141,并运行复制的应用程序,以便能够执行多种操作。
图形处理器143使用操作器(未示出)和呈现器(未示出)产生包括多种对象(例如,图标、图像和文本)的屏幕。根据示例性实施例,操作器使用从输入器210接收的控制命令,根据屏幕的布局,对每个对象的属性值(例如坐标值、形状、大小和颜色)进行操作。呈现器基于操作器所操作的属性值来产生包括对象的具有多种布局的屏幕。在显示器170的显示区域上显示由渲染器产生的屏幕。具体地,根据示例性实施例,图形处理器143产生如下UI,该UI指示触发语音被识别并且用户语音可以被接收。
主CPU 144访问存储器130,并使用存储器130中存储的OS启动系统。另外,根据示例性实施例,主CPU 144使用存储在存储器130中的多种程序、内容和数据执行多种操作。
根据示例性实施例,第一至第n接口145-1至145-n经由总线146连接到前述组件。
图5是描述了根据示例性实施例的用于分析用户语音并执行语音识别的方法的流程图。
首先,电子设备100接收用户语音(S500)。电子设备100可以通过包括在电子设备100中的麦克风或者通过包括在外部设备(诸如遥控器)中的麦克风来接收用户语音。
电子设备100确定接收的用户语音是否是触发语音(S510)。触发语音可以是用于将电子设备100的操作模式改变为语音识别模式以执行语音识别的语音。另外,触发语音可以是存储在电子设备100中的预定词语/短语,或者可以是具有由用户设置的预定长度的短语。例如,当“你好,电视”是被存储为触发语音的预定短语时,电子设备100确定接收的用户语音是否是“你好,电视”。当确定接收的用户语音是“你好,电视”时(S510-是),电子设备100将其操作模式改变为语音识别模式(S520)。
另一方面,当通过诸如遥控器等外部设备接收到用户语音时,电子设备100识别在按下设置在外部设备上的输入按钮之后首先接收的用户语音是触发语音。例如,如果“你好,电视”是被存储为触发语音的预定短语,则当在按下外部设备上的输入按钮之后首先输入“频道13”时,电子设备100将“频道13”识别为触发语音。
如果确定接收的用户语音不是触发语音(S510-否),则电子设备100不将其操作模式改变为语音识别模式,并且处理返回到步骤S500。
之后,电子设备100分析被确定为触发语音的用户语音,并存储用户语音的特性(S530)。更具体地,用户语音的特性可以包括用户语音条件和语音环境。用户语音条件可以包括用户语音的能量和用户语音的频带分布。语音环境可以包括正输入用户语音时的混响时间(RT)或语音信号噪声比(SNR)。也就是,用户语音的特性可以包括用户语音的能量、用户语音的频带分布、正输入用户语音时的混响时间(RT)或语音信号噪声比(SNR)。
如果输入了用于控制电子设备100的语音命令(S540-是),则电子设备100分析语音命令,并将语音命令的特性与存储的用户语音的特性进行比较(S550)。语音命令可以包括用于控制电子设备100的功能的所有用户语音。另外,电子设备100可以将具有多于预定能量的能量的用户语音识别为语音命令,并分析该用户语音。
之后,电子设备100基于比较结果执行与语音命令相对应的功能(S560)。更具体地,当通过分析语音命令的能量、频率带宽、正输入语音命令时的RT和语音SNR中的至少一个所获得的数据在通过分析与触发语音相对应的用户语音的能量、频率带宽、正输入触发语音时的RT和语音SNR中的至少一个所获得的数据的预定范围内时,电子设备100执行与语音命令相对应的功能。
例如,如果输入的用户语音“你好,电视”被确定为触发语音,则电子设备100将其操作模式改变为语音识别模式,将“你好,电视”的能量和输入“你好,电视”时的RT存储为用户语音的特性,接着,电子设备100接收语音命令“频道13”。
电子设备100分析输入的语音命令“频道13”的能量和输入语音命令时的RT。当分析的数据在关于存储的与触发语音相对应的用户语音的特性的数据的10%的误差幅度内时,电子设备100可以确定发出触发语音的用户与发出语音命令的用户相同。另外,电子设备100可以确定输入的语音命令表示用户关于控制电子设备100的意图。因此,根据示例性实施例,电子设备100将频道改变到频道13。
用于比较数据的10%的误差幅度仅是示例性实施例。误差幅度可以根据初始设置或环境而改变。
另外,语音能量和RT仅是用户语音特性的示例。根据不同示例性实施例,根据用户或语音环境变化的任何值(例如频带分布、输入语音时的RT和语音SNR)可以被分析并被存储为用于识别用户语音的条件。
图6是描述了根据示例性实施例的用于分析用户语音,执行语音识别并完成语音识别过程的方法的流程图。
首先,电子设备100接收用户语音(S600)。电子设备100可以通过包括在电子设备100中的麦克风或者通过包括在外部设备(诸如遥控器)中的麦克风来接收用户语音。
电子设备100确定接收的用户语音是否是触发语音(S610)。触发语音可以是用于将电子设备100的操作模式改变为语音识别模式以执行语音识别的语音。另外,触发语音可以是存储在电子设备100中的预定词语/短语,或者可以是具有由用户设置的预定长度的短语。例如,当“你好,电视”是被存储为触发语音的预定短语时,电子设备100确定接收的用户语音输入是否是“你好,电视”。当确定接收的用户语音输入是你好,电视”时(S610-是),电子设备100将其操作模式改变为语音识别模式(S620)。
另一方面,当通过诸如遥控器等外部设备接收到用户语音时,电子设备100识别在按下设置在外部设备上的输入按钮之后首先接收的用户语音是触发语音。例如,如果“你好,电视”是被存储为触发语音的预定短语,则当在按下外部设备上的输入按钮之后首先输入“频道13”时,电子设备100将“频道13”识别为触发语音。
如果确定接收的用户语音不是触发语音(S610-否),则电子设备100不将其操作模式改变为语音识别模式,并且处理返回到步骤S600。
之后,电子设备100分析被确定为触发语音的用户语音,并存储用户语音的特性(S630)。更具体地,用户语音的特性可以包括用户语音条件和语音环境。用户语音条件可以包括用户语音的能量和用户语音的频带分布。语音环境可以包括被输入语音时的混响时间(RT)或语音信号噪声比(SNR)。也就是,用户语音的特性可以包括用户语音的能量、用户语音的频带分布、正输入语音时的混响时间(RT)或语音信号噪声比(SNR)。
当输入了用于控制电子设备100的语音命令时(S640-是),则电子设备100分析语音命令,并将分析的语音的特性与用户语音的特性进行比较(S650)。语音命令可以包括用于控制电子设备100的功能的所有用户语音。另外,电子设备100可以将具有多于预定能量的能量的用户语音识别为语音命令,并分析用户语音。如果没有接收到用于控制电子设备100的语音命令(S640-否),则电子设备100等待接收语音命令。
当分析的语音命令的特性在存储的用户语音特性的预定范围内时(S660-是),电子设备100执行与语音命令相对应的功能(S670)。
当分析的语音命令的特性在存储的用户语音特性的预定范围之外时(S660-否),电子设备100旁路掉语音命令(S680)。
例如,如果输入的用户语音“你好,电视”被确定为触发语音,则电子设备100将其操作模式改变为语音识别模式,将“你好,电视”的能量和输入“你好,电视”语音时的RT存储为用户语音的特性,并且电子设备100接收语音命令“频道13”。
电子设备100分析输入的语音命令“频道13”的能量和正输入该语音命令时的RT。根据示例性实施例,当分析的数据在关于存储的与触发语音相对应的用户语音的特性的数据的10%的误差幅度内时,电子设备100可以确定发出触发语音的用户与发出语音命令的用户相同。另外,电子设备100可以确定输入的语音命令与用户用于控制电子设备100的意图相对应。因此,电子设备100将频道改变到频道13。
然而,当通过分析输入的控制语音“频道13”的能量和正输入该语音命令时的RT所获得的数据在通过分析触发语音“你好,电视”的能量和正输入触发语音时的RT所获得的数据的10%的误差幅度之外时,电子设备100可以旁路掉输入的控制语音“频道13”。因此,电子设备100不改变频道。
用于比较数据的10%的误差幅度仅是示例性实施例,并不限于此。误差幅度可以根据初始设置或环境而改变。
另外,语音能量和RT仅是用户语音特性的示例。根据用户或语音环境变化的任何值(例如频带分布、正输入语音时的RT和语音SNR)可以被分析并被存储为用于识别用户语音的条件。
在过去预定时间段之后(S690-是),电子设备100通过结束语音识别模式而完成语音识别会话(S700)。也就是,当在执行了与之前语音命令相对应的功能之后在预定时间段期间没有输入其他语音命令时,电子设备100自动结束语音识别模式,而无需输入用于完成语音识别模式的用户命令。因此,在语音识别模式已经结束并且电子设备100已经结束语音识别会话之后,电子设备100不响应用户语音输入,直到用户语音被确定为触发语音为止。
然而,如果没有过去预定时间量(S690-否),则确定用户是否已经发出另一语音命令(S695)。如果用户发出了语音命令,则处理进行到步骤S650,在步骤S650,分析语音命令,并将其特性与存储的用户语音的特性进行比较,接着,进行上述其他处理。然而,如果没有发出语音命令,则处理再次进行到步骤S690,在步骤S690,确定是否经过了预定时间量。
根据前述语音识别方法,用户可以通过在没有单独操纵/输入的情况下发出语音命令,容易地、无误地控制电子设备100的功能。
根据上述多个示例性实施例的电子设备100的语音识别方法可以被编码为软件并且被存储在非暂时性计算机可读介质中。非暂时性计算机可读介质可以安装在多种不同类型的设备中。
例如,可以将用于进行以下操作的程序代码存储在非暂时性计算机可读介质中:当输入用户语音时确定输入的用户语音是否是触发语音,当确定输入的用户语音是触发语音时将电子设备的操作模式改变为语音识别模式,分析用户语音,并存储用户语音的特性,以及当输入用于控制电子设备的语音命令时,分析语音命令,将分析的语音命令的特性与存储的用户语音的特性进行比较,并基于比较结果执行与语音命令相对应的功能。
非暂时性计算机可读介质是可以半永久地存储数据的介质而不是诸如寄存器、高速缓存和存储器之类临时存储数据的介质,并且可以由设备读取。更具体地,非暂时性计算机可读介质可以是紧凑盘(CD)、数字视频盘(DVD)、硬盘、蓝光盘、通用串行总线(USB)、记忆卡和只读存储器(ROM)。
上述示例性实施例和优点仅是示例并不应视为限制。本发明的教导易于应用于其他类型的设备。此外,示例性实施例的描述意在说明性的,而不是限制权利要求的范围,并且本领域技术人员将清楚多种替代、改进和变化。
Claims (17)
1.一种电子设备的语音识别方法,所述方法包括:
基于用户语音被输入到所述电子设备的麦克风,识别所述用户语音是否对应于触发语音,基于识别到所述用户语音对应于所述触发语音,将所述电子设备的模式设置为语音识别模式,并且显示对所述电子设备在语音识别模式下加以指示的用户界面UI;以及
基于从外部设备接收到用户语音,即使从所述外部设备接收到的用户语音与所述触发语音不对应,也将所述电子设备的操作模式设置为语音识别模式,并且显示对在语音识别模式下处理所述用户语音加以指示的UI,
其中,从所述外部设备接收到的用户语音是在按压所述外部设备的按钮之后输入到所述外部设备的麦克风的用户语音。
2.根据权利要求1所述的方法,还包括:当基于被输入到所述电子设备的麦克风的用户语音所述电子设备操作在语音识别模式下时,执行与输入到所述电子设备的麦克风的后续用户语音相对应的功能;以及
当基于从所述外部设备接收到的用户语音所述电子设备操作在语音识别模式下时,执行与从所述外部设备接收到的用户语音相对应的功能。
3.根据权利要求1所述的方法,还包括:
基于从所述外部设备接收到用户语音,将所述电子设备的模式设置为语音识别模式,而不识别所述用户语音是否对应于所述触发语音。
4.根据权利要求1所述的方法,还包括:
基于在显示器上显示内容的同时与所述触发语音相对应的用户语音被输入到所述电子设备的麦克风,在所述显示器的第一区域中显示对所述电子设备在语音识别模式下加以指示的用户界面UI,并且在所述显示器的第二区域中显示所述内容。
5.根据权利要求4所述的方法,其中,基于后续用户语音被输入到所述电子设备的所述麦克风,在所述显示器的第二区域中显示内容的同时在所述显示器的第一区域中显示对正处理所述后续用户语音加以指示的UI。
6.根据权利要求1所述的方法,其中,基于在与所述触发语音相对应的用户语音被输入到所述电子设备的麦克风之后预定时间段内后续用户语音没有被输入到所述电子设备的麦克风,终止所述语音识别模式。
7.根据权利要求1所述的方法,其中,基于所述外部设备的所述按钮被按压,接收按压所述按钮由所述外部设备产生的信号,
基于接收到所述信号,将所述电子设备的模式设置为语音识别模式,并且
基于从所述外部设备接收到所述用户语音,执行与从所述外部设备接收到的用户语音相对应的功能,而无需识别所述用户语音是否与所述触发语音相对应。
8.根据权利要求1所述的方法,其中,从所述外部设备接收到的所述用户语音是在自所述外部设备的所述按钮被按压时预定时间内输入到所述外部设备的所述麦克风的用户语音。
9.一种电子设备,包括:
麦克风;
通信器;以及
处理器,被配置为:
基于用户语音被输入到所述麦克风,识别所述用户语音是否对应于触发语音,基于识别到所述用户语音对应于所述触发语音,将所述电子设备的模式设置为语音识别模式,并且控制显示对所述电子设备在语音识别模式下加以指示的用户界面UI;以及
基于通过所述通信器从外部设备接收到用户语音,即使从所述外部设备接收到的用户语音与所述触发语音不对应,也将所述电子设备的操作模式设置为语音识别模式,并且控制显示对在语音识别模式下处理所述用户语音加以指示的UI,
其中,从所述外部设备接收到的用户语音是在按压所述外部设备的按钮之后输入到所述外部设备的麦克风的用户语音。
10.根据权利要求9所述的电子设备,其中,所述处理器还被配置为:
当基于被输入到所述电子设备的麦克风的用户语音所述电子设备操作在语音识别模式下时,执行与输入到所述电子设备的麦克风的后续用户语音相对应的功能;以及
当基于从所述外部设备接收到的用户语音所述电子设备操作在语音识别模式下时,执行与从所述外部设备接收到的用户语音相对应的功能。
11.根据权利要求9所述的电子设备,其中,所述处理器还被配置为:
基于从所述外部设备接收到用户语音,将所述电子设备的模式设置为语音识别模式,而不识别所述用户语音是否对应于所述触发语音。
12.根据权利要求9所述的电子设备,还包括:
显示器,
其中,所述处理器还被配置为:
基于在所述显示器上显示内容的同时与所述触发语音相对应的用户语音被输入到所述电子设备的麦克风,控制所述显示器在所述显示器的第一区域中显示对所述电子设备在语音识别模式下加以指示的用户界面UI,并且在所述显示器的第二区域中显示所述内容。
13.根据权利要求12所述的电子设备,其中,基于后续用户语音被输入到所述电子设备的所述麦克风,控制所述显示器在所述显示器的第二区域中显示内容的同时在所述显示器的第一区域中显示对正处理所述后续用户语音加以指示的UI。
14.根据权利要求9所述的电子设备,其中,基于在与所述触发语音相对应的用户语音被输入到所述电子设备的麦克风之后预定时间段内后续用户语音没有被输入到所述电子设备的麦克风,终止所述语音识别模式。
15.根据权利要求9所述的电子设备,其中,所述处理器还被配置为:
基于所述外部设备的所述按钮被按压,通过所述通信器接收按压所述按钮由所述外部设备产生的信号,
基于接收到所述信号,将所述电子设备的模式设置为语音识别模式,并且
基于通过所述通信器从所述外部设备接收到所述用户语音,执行与从所述外部设备接收到的用户语音相对应的功能,而无需识别所述用户语音是否与所述触发语音相对应。
16.根据权利要求9所述的电子设备,其中,从所述外部设备接收到的所述用户语音是在自所述外部设备的所述按钮被按压时预定时间内输入到所述外部设备的所述麦克风的用户语音。
17.一种非暂时计算机可读记录介质,存储用于使用电子设备执行语音识别方法的程序,其中,所述电子设备的语音识别方法包括:
基于用户语音被输入到所述电子设备的麦克风,识别所述用户语音是否对应于触发语音,基于识别到所述用户语音对应于所述触发语音,将所述电子设备的模式设置为语音识别模式,并且显示对所述电子设备在语音识别模式下加以指示的用户界面UI;以及
基于从外部设备接收到用户语音,即使从所述外部设备接收到的用户语音与所述触发语音不对应,也将所述电子设备的操作模式设置为语音识别模式,并且显示对在语音识别模式下处理所述用户语音加以指示的UI,
其中,从所述外部设备接收到的用户语音是在按压所述外部设备的按钮之后输入到所述外部设备的麦克风的用户语音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011555902.3A CN112700774A (zh) | 2014-01-21 | 2014-12-18 | 电子设备及其语音识别方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140007386A KR102210433B1 (ko) | 2014-01-21 | 2014-01-21 | 전자 장치 및 이의 음성 인식 방법 |
KR10-2014-0007386 | 2014-01-21 | ||
PCT/KR2014/012507 WO2015111845A1 (en) | 2014-01-21 | 2014-12-18 | Electronic device and voice recognition method thereof |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011555902.3A Division CN112700774A (zh) | 2014-01-21 | 2014-12-18 | 电子设备及其语音识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105723448A CN105723448A (zh) | 2016-06-29 |
CN105723448B true CN105723448B (zh) | 2021-01-12 |
Family
ID=53545338
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480061513.1A Active CN105723448B (zh) | 2014-01-21 | 2014-12-18 | 电子设备及其语音识别方法 |
CN202011555902.3A Pending CN112700774A (zh) | 2014-01-21 | 2014-12-18 | 电子设备及其语音识别方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011555902.3A Pending CN112700774A (zh) | 2014-01-21 | 2014-12-18 | 电子设备及其语音识别方法 |
Country Status (5)
Country | Link |
---|---|
US (4) | US10304443B2 (zh) |
EP (2) | EP4276819A3 (zh) |
KR (1) | KR102210433B1 (zh) |
CN (2) | CN105723448B (zh) |
WO (1) | WO2015111845A1 (zh) |
Families Citing this family (98)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
AU2014214676A1 (en) | 2013-02-07 | 2015-08-27 | Apple Inc. | Voice trigger for a digital assistant |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
AU2014306221B2 (en) | 2013-08-06 | 2017-04-06 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
KR102210433B1 (ko) * | 2014-01-21 | 2021-02-01 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
US10540979B2 (en) * | 2014-04-17 | 2020-01-21 | Qualcomm Incorporated | User interface for secure access to a device using speaker verification |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
EP3480811A1 (en) | 2014-05-30 | 2019-05-08 | Apple Inc. | Multi-command single utterance input method |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886953B2 (en) * | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10770067B1 (en) * | 2015-09-08 | 2020-09-08 | Amazon Technologies, Inc. | Dynamic voice search transitioning |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
KR102476600B1 (ko) | 2015-10-21 | 2022-12-12 | 삼성전자주식회사 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
KR20170046958A (ko) * | 2015-10-22 | 2017-05-04 | 삼성전자주식회사 | 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
KR102501083B1 (ko) | 2016-02-05 | 2023-02-17 | 삼성전자 주식회사 | 음성 인식 방법 및 이를 사용하는 전자 장치 |
CN105957530B (zh) * | 2016-04-28 | 2020-01-03 | 海信集团有限公司 | 一种语音控制方法、装置和终端设备 |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
KR102575634B1 (ko) | 2016-07-26 | 2023-09-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 동작 방법 |
US11348595B2 (en) | 2017-01-04 | 2022-05-31 | Blackberry Limited | Voice interface and vocal entertainment system |
CN108509119B (zh) * | 2017-02-28 | 2023-06-02 | 三星电子株式会社 | 用于功能执行的电子设备的操作方法和支持其的电子设备 |
CN106940997B (zh) * | 2017-03-20 | 2020-04-28 | 海信集团有限公司 | 一种向语音识别系统发送语音信号的方法和装置 |
KR102398390B1 (ko) * | 2017-03-22 | 2022-05-16 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
CN106992008B (zh) * | 2017-03-30 | 2021-04-13 | 联想(北京)有限公司 | 处理方法及电子设备 |
CN107220532B (zh) * | 2017-04-08 | 2020-10-23 | 网易(杭州)网络有限公司 | 用于通过声音识别用户身份的方法及设备 |
US10965899B1 (en) * | 2017-04-17 | 2021-03-30 | Alarm.Com Incorporated | System and method for integration of a television into a connected-home monitoring system |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
KR102419597B1 (ko) * | 2017-09-29 | 2022-07-11 | 삼성전자주식회사 | 입력 디바이스와 전자 장치, 이를 포함하는 시스템 및 그 제어 방법 |
US10999733B2 (en) | 2017-11-14 | 2021-05-04 | Thomas STACHURA | Information security/privacy via a decoupled security accessory to an always listening device |
CN108259798A (zh) * | 2017-11-30 | 2018-07-06 | 苏州腾茂电子科技有限公司 | 一种智能化健康型液晶电视机及其工作方法 |
JP6962158B2 (ja) * | 2017-12-01 | 2021-11-05 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
US10685652B1 (en) * | 2018-03-22 | 2020-06-16 | Amazon Technologies, Inc. | Determining device groups |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11145299B2 (en) | 2018-04-19 | 2021-10-12 | X Development Llc | Managing voice interface devices |
EP3849177A1 (en) | 2018-05-07 | 2021-07-14 | Apple Inc. | User interfaces for viewing live video feeds and recorded video |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
CN109166580A (zh) * | 2018-09-17 | 2019-01-08 | 珠海格力电器股份有限公司 | 一种语音反馈提示控制方法、系统及空调器 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11924511B2 (en) * | 2018-10-04 | 2024-03-05 | Roku, Inc. | Smart remote control for audio responsive media device |
CN109695939A (zh) * | 2018-11-08 | 2019-04-30 | 佛山市中格威电子有限公司 | 一种基于远程终端的空调语音控制系统 |
KR102113879B1 (ko) * | 2018-12-19 | 2020-05-26 | 주식회사 공훈 | 참조 데이터베이스를 활용한 화자 음성 인식 방법 및 그 장치 |
US11211061B2 (en) | 2019-01-07 | 2021-12-28 | 2236008 Ontario Inc. | Voice control in a multi-talker and multimedia environment |
CN113728380A (zh) | 2019-02-07 | 2021-11-30 | 托马斯·斯塔胡拉 | 用于智能扬声器的隐私装置 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
KR102716781B1 (ko) | 2019-04-02 | 2024-10-15 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US10904029B2 (en) | 2019-05-31 | 2021-01-26 | Apple Inc. | User interfaces for managing controllable external devices |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11545148B2 (en) * | 2019-06-18 | 2023-01-03 | Roku, Inc. | Do not disturb functionality for voice responsive devices |
KR102246936B1 (ko) * | 2019-06-20 | 2021-04-29 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11749265B2 (en) * | 2019-10-04 | 2023-09-05 | Disney Enterprises, Inc. | Techniques for incremental computer-based natural language understanding |
KR20210123633A (ko) * | 2020-04-03 | 2021-10-14 | 삼성전자주식회사 | 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법 |
US11513667B2 (en) * | 2020-05-11 | 2022-11-29 | Apple Inc. | User interface for audio message |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US11984124B2 (en) * | 2020-11-13 | 2024-05-14 | Apple Inc. | Speculative task flow execution |
KR20230027673A (ko) * | 2021-08-19 | 2023-02-28 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080049905A1 (en) * | 2006-08-22 | 2008-02-28 | Samsung Electronics Co. Ltd. | Communication method and apparatus for phone having voice recognition function |
CN101405739A (zh) * | 2002-12-26 | 2009-04-08 | 摩托罗拉公司(在特拉华州注册的公司) | 身份识别设备和方法 |
CN101441869A (zh) * | 2007-11-21 | 2009-05-27 | 联想(北京)有限公司 | 语音识别终端用户身份的方法及终端 |
CN102054481A (zh) * | 2009-10-30 | 2011-05-11 | 大陆汽车有限责任公司 | 用于激活和/或进行语音对话的装置、系统和方法 |
US20110254846A1 (en) * | 2009-11-25 | 2011-10-20 | Juhwan Lee | User adaptive display device and method thereof |
US20120179472A1 (en) * | 2011-01-06 | 2012-07-12 | Samsung Electronics Co., Ltd. | Electronic device controlled by a motion and controlling method thereof |
CN102833634A (zh) * | 2012-09-12 | 2012-12-19 | 康佳集团股份有限公司 | 一种电视机语音识别功能的实现方法及电视机 |
CN103024530A (zh) * | 2012-12-18 | 2013-04-03 | 天津三星电子有限公司 | 智能电视语音应答系统及方法 |
CN103310788A (zh) * | 2013-05-23 | 2013-09-18 | 北京云知声信息技术有限公司 | 一种语音信息识别方法及系统 |
US20130290001A1 (en) * | 2012-04-30 | 2013-10-31 | Samsung Electronics Co., Ltd. | Image processing apparatus, voice acquiring apparatus, voice recognition method thereof and voice recognition system |
US20130289992A1 (en) * | 2012-04-27 | 2013-10-31 | Fujitsu Limited | Voice recognition method and voice recognition apparatus |
CN103456306A (zh) * | 2012-05-29 | 2013-12-18 | 三星电子株式会社 | 用于在电子装置中执行语音命令的方法和设备 |
CN103477342A (zh) * | 2011-03-21 | 2013-12-25 | 苹果公司 | 使用话音验证的装置存取 |
CN103491411A (zh) * | 2013-09-26 | 2014-01-01 | 深圳Tcl新技术有限公司 | 基于语言推荐频道的方法及其装置 |
EP2683204A1 (en) * | 2012-07-03 | 2014-01-08 | Samsung Electronics Co., Ltd | Method and apparatus for controlling sleep mode in portable terminal |
CN103516854A (zh) * | 2012-06-15 | 2014-01-15 | 三星电子株式会社 | 终端装置及其控制方法 |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
US6323911B1 (en) * | 1995-10-02 | 2001-11-27 | Starsight Telecast, Inc. | System and method for using television schedule information |
US5777571A (en) | 1996-10-02 | 1998-07-07 | Holtek Microelectronics, Inc. | Remote control device for voice recognition and user identification restrictions |
IL119948A (en) * | 1996-12-31 | 2004-09-27 | News Datacom Ltd | Voice activated communication system and program guide |
FR2783625B1 (fr) * | 1998-09-21 | 2000-10-13 | Thomson Multimedia Sa | Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil |
EP1190301A1 (en) * | 2000-03-09 | 2002-03-27 | Koninklijke Philips Electronics N.V. | Method of interacting with a consumer electronics system |
ATE342567T1 (de) * | 2000-07-28 | 2006-11-15 | Koninkl Philips Electronics Nv | System zur steuerung eines gerätes mittels sprachbefehlen |
DE60120062T2 (de) | 2000-09-19 | 2006-11-16 | Thomson Licensing | Sprachsteuerung von elektronischen Geräten |
JP2003029785A (ja) | 2001-07-18 | 2003-01-31 | Clarion Co Ltd | 音声認識装置 |
JP2003108961A (ja) * | 2001-09-28 | 2003-04-11 | Hitachi Ltd | 電子タグおよびその製造方法 |
US7023498B2 (en) * | 2001-11-19 | 2006-04-04 | Matsushita Electric Industrial Co. Ltd. | Remote-controlled apparatus, a remote control system, and a remote-controlled image-processing apparatus |
US7996232B2 (en) * | 2001-12-03 | 2011-08-09 | Rodriguez Arturo A | Recognition of voice-activated commands |
JP2003255987A (ja) * | 2002-03-04 | 2003-09-10 | Toshiba Corp | 音声認識を利用した機器の制御方法、制御装置及び制御プログラム |
KR20040061070A (ko) | 2002-12-30 | 2004-07-07 | 주식회사 케이티 | 음성인식시스템에서의 음성인식장치 및 그 방법 |
US20060074658A1 (en) * | 2004-10-01 | 2006-04-06 | Siemens Information And Communication Mobile, Llc | Systems and methods for hands-free voice-activated devices |
KR100737358B1 (ko) | 2004-12-08 | 2007-07-09 | 한국전자통신연구원 | 음성/비음성 검증 방법 및 이를 이용한 음성 인식 장치 |
KR100655491B1 (ko) | 2004-12-21 | 2006-12-11 | 한국전자통신연구원 | 음성인식 시스템에서의 2단계 발화 검증 방법 및 장치 |
JP4872241B2 (ja) * | 2005-05-31 | 2012-02-08 | 船井電機株式会社 | テレビ受像機 |
ZA200801178B (en) * | 2005-08-05 | 2009-06-24 | Microsoft Corp | Selective confirmation for execution of a voice activated user interface |
KR100819848B1 (ko) | 2005-12-08 | 2008-04-08 | 한국전자통신연구원 | 발화검증을 위한 임계치값 자동 갱신을 이용한 음성인식장치 및 방법 |
US7756710B2 (en) * | 2006-07-13 | 2010-07-13 | Sri International | Method and apparatus for error correction in speech recognition applications |
JP2008158328A (ja) | 2006-12-25 | 2008-07-10 | Ntt Docomo Inc | 端末装置及び判別方法 |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
KR101022519B1 (ko) | 2009-04-17 | 2011-03-16 | 고려대학교 산학협력단 | 모음 특징을 이용한 음성구간 검출 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법 |
US11012732B2 (en) * | 2009-06-25 | 2021-05-18 | DISH Technologies L.L.C. | Voice enabled media presentation systems and methods |
JP2011118822A (ja) * | 2009-12-07 | 2011-06-16 | Nec Casio Mobile Communications Ltd | 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム |
EP2586026B1 (en) | 2010-06-24 | 2016-11-16 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
US20120089392A1 (en) * | 2010-10-07 | 2012-04-12 | Microsoft Corporation | Speech recognition user interface |
JP5771002B2 (ja) * | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
JP5695447B2 (ja) * | 2011-03-01 | 2015-04-08 | 株式会社東芝 | テレビジョン装置及び遠隔操作装置 |
WO2013014709A1 (ja) * | 2011-07-27 | 2013-01-31 | 三菱電機株式会社 | ユーザインタフェース装置、車載用情報装置、情報処理方法および情報処理プログラム |
WO2013022218A2 (en) * | 2011-08-05 | 2013-02-14 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for providing user interface thereof |
KR20130078483A (ko) * | 2011-12-30 | 2013-07-10 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
KR101590332B1 (ko) * | 2012-01-09 | 2016-02-18 | 삼성전자주식회사 | 영상장치 및 그 제어방법 |
KR102022318B1 (ko) * | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US8793136B2 (en) * | 2012-02-17 | 2014-07-29 | Lg Electronics Inc. | Method and apparatus for smart voice recognition |
CN102710539A (zh) * | 2012-05-02 | 2012-10-03 | 中兴通讯股份有限公司 | 语音信息传送方法及装置 |
KR101992676B1 (ko) * | 2012-07-26 | 2019-06-25 | 삼성전자주식회사 | 영상 인식을 이용하여 음성 인식을 하는 방법 및 장치 |
KR101987255B1 (ko) * | 2012-08-20 | 2019-06-11 | 엘지이노텍 주식회사 | 음성 인식 장치 및 이의 음성 인식 방법 |
JP5998861B2 (ja) * | 2012-11-08 | 2016-09-28 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2014126600A (ja) * | 2012-12-25 | 2014-07-07 | Panasonic Corp | 音声認識装置、音声認識方法、およびテレビ |
US9842489B2 (en) * | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US9460715B2 (en) * | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US9928851B2 (en) * | 2013-09-12 | 2018-03-27 | Mediatek Inc. | Voice verifying system and voice verifying method which can determine if voice signal is valid or not |
KR20150040445A (ko) * | 2013-10-07 | 2015-04-15 | 삼성전자주식회사 | 사용자 음성을 입력받는 원격 제어 장치 및 그 방법 |
US20150221307A1 (en) * | 2013-12-20 | 2015-08-06 | Saurin Shah | Transition from low power always listening mode to high power speech recognition mode |
KR102210433B1 (ko) * | 2014-01-21 | 2021-02-01 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
US9430186B2 (en) * | 2014-03-17 | 2016-08-30 | Google Inc | Visual indication of a recognized voice-initiated action |
KR102147346B1 (ko) * | 2014-06-23 | 2020-08-24 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 동작 방법 |
-
2014
- 2014-01-21 KR KR1020140007386A patent/KR102210433B1/ko active IP Right Grant
- 2014-10-07 US US14/508,105 patent/US10304443B2/en active Active
- 2014-12-18 EP EP23192250.1A patent/EP4276819A3/en active Pending
- 2014-12-18 CN CN201480061513.1A patent/CN105723448B/zh active Active
- 2014-12-18 CN CN202011555902.3A patent/CN112700774A/zh active Pending
- 2014-12-18 WO PCT/KR2014/012507 patent/WO2015111845A1/en active Application Filing
- 2014-12-18 EP EP14879385.4A patent/EP3039673A4/en not_active Ceased
-
2019
- 2019-04-17 US US16/386,705 patent/US11011172B2/en active Active
-
2021
- 2021-04-22 US US17/237,269 patent/US11984119B2/en active Active
-
2024
- 2024-04-12 US US18/633,897 patent/US20240265919A1/en active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101405739A (zh) * | 2002-12-26 | 2009-04-08 | 摩托罗拉公司(在特拉华州注册的公司) | 身份识别设备和方法 |
US20080049905A1 (en) * | 2006-08-22 | 2008-02-28 | Samsung Electronics Co. Ltd. | Communication method and apparatus for phone having voice recognition function |
CN101441869A (zh) * | 2007-11-21 | 2009-05-27 | 联想(北京)有限公司 | 语音识别终端用户身份的方法及终端 |
CN102054481A (zh) * | 2009-10-30 | 2011-05-11 | 大陆汽车有限责任公司 | 用于激活和/或进行语音对话的装置、系统和方法 |
US20110254846A1 (en) * | 2009-11-25 | 2011-10-20 | Juhwan Lee | User adaptive display device and method thereof |
US20120179472A1 (en) * | 2011-01-06 | 2012-07-12 | Samsung Electronics Co., Ltd. | Electronic device controlled by a motion and controlling method thereof |
CN103477342A (zh) * | 2011-03-21 | 2013-12-25 | 苹果公司 | 使用话音验证的装置存取 |
US20130289992A1 (en) * | 2012-04-27 | 2013-10-31 | Fujitsu Limited | Voice recognition method and voice recognition apparatus |
US20130290001A1 (en) * | 2012-04-30 | 2013-10-31 | Samsung Electronics Co., Ltd. | Image processing apparatus, voice acquiring apparatus, voice recognition method thereof and voice recognition system |
CN103456306A (zh) * | 2012-05-29 | 2013-12-18 | 三星电子株式会社 | 用于在电子装置中执行语音命令的方法和设备 |
CN103516854A (zh) * | 2012-06-15 | 2014-01-15 | 三星电子株式会社 | 终端装置及其控制方法 |
EP2683204A1 (en) * | 2012-07-03 | 2014-01-08 | Samsung Electronics Co., Ltd | Method and apparatus for controlling sleep mode in portable terminal |
CN102833634A (zh) * | 2012-09-12 | 2012-12-19 | 康佳集团股份有限公司 | 一种电视机语音识别功能的实现方法及电视机 |
CN103024530A (zh) * | 2012-12-18 | 2013-04-03 | 天津三星电子有限公司 | 智能电视语音应答系统及方法 |
CN103310788A (zh) * | 2013-05-23 | 2013-09-18 | 北京云知声信息技术有限公司 | 一种语音信息识别方法及系统 |
CN103491411A (zh) * | 2013-09-26 | 2014-01-01 | 深圳Tcl新技术有限公司 | 基于语言推荐频道的方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20150087025A (ko) | 2015-07-29 |
WO2015111845A1 (en) | 2015-07-30 |
US20240265919A1 (en) | 2024-08-08 |
EP4276819A3 (en) | 2024-01-24 |
EP4276819A2 (en) | 2023-11-15 |
EP3039673A1 (en) | 2016-07-06 |
US10304443B2 (en) | 2019-05-28 |
KR102210433B1 (ko) | 2021-02-01 |
US20190244619A1 (en) | 2019-08-08 |
US11011172B2 (en) | 2021-05-18 |
EP3039673A4 (en) | 2017-04-26 |
US20150206529A1 (en) | 2015-07-23 |
US20210264914A1 (en) | 2021-08-26 |
US11984119B2 (en) | 2024-05-14 |
CN105723448A (zh) | 2016-06-29 |
CN112700774A (zh) | 2021-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105723448B (zh) | 电子设备及其语音识别方法 | |
US9484029B2 (en) | Electronic apparatus and method of speech recognition thereof | |
US9804822B2 (en) | Electronic apparatus and control method thereof | |
US11900939B2 (en) | Display apparatus and method for registration of user command | |
US9354842B2 (en) | Apparatus and method of controlling voice input in electronic device supporting voice recognition | |
EP2899719B1 (en) | Display apparatus for performing voice control and voice controlling method thereof | |
EP3142107A1 (en) | Voice recognition apparatus and controlling method thereof | |
KR20140042641A (ko) | 전자장치, 서버 및 그 제어방법 | |
KR20140111574A (ko) | 오디오 명령에 따른 동작을 수행하는 장치 및 방법 | |
KR102494051B1 (ko) | 전자 장치 및 이의 음성 인식 방법 | |
KR102359163B1 (ko) | 전자 장치 및 이의 음성 인식 방법 | |
KR102656611B1 (ko) | 보이스 어시스턴트 서비스를 이용한 컨텐츠 재생 장치 및 그 동작 방법 | |
CN114694661A (zh) | 一种第一终端设备、第二终端设备和语音唤醒方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |