CN111312214B - 空调器的语音识别方法、装置、空调器和可读存储介质 - Google Patents
空调器的语音识别方法、装置、空调器和可读存储介质 Download PDFInfo
- Publication number
- CN111312214B CN111312214B CN202010246368.1A CN202010246368A CN111312214B CN 111312214 B CN111312214 B CN 111312214B CN 202010246368 A CN202010246368 A CN 202010246368A CN 111312214 B CN111312214 B CN 111312214B
- Authority
- CN
- China
- Prior art keywords
- voice
- processing model
- air conditioner
- recognition
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000004590 computer program Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 241001672694 Citrus reticulata Species 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/50—Control or safety arrangements characterised by user interfaces or communication
- F24F11/61—Control or safety arrangements characterised by user interfaces or communication using timers
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/62—Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
- F24F11/63—Electronic processing
- F24F11/64—Electronic processing using pre-stored data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Combustion & Propulsion (AREA)
- Chemical & Material Sciences (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Artificial Intelligence (AREA)
- Air Conditioning Control Device (AREA)
Abstract
本发明提供了一种空调器的语音识别方法、装置、空调器和存储介质,其中,空调器的语音识别方法包括:在空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别;根据语音识别模块采用第一语音处理模型对语音指令的识别结果,切换至第二语音处理模型进行识别。通过本发明的技术方案,能够提高语音指令识别的效率、准确性、可靠性和多样性,有利于提升用户的使用体验。
Description
技术领域
本发明涉及电池技术领域,具体而言,涉及一种空调器的语音识别方法、一种空调器的语音识别装置、一种空调器和一种计算机可读存储介质。
背景技术
空调、电视和音响等家电设备,均开发出语音识别系统对用户的语音指令进行识别,目前大多语音识别系统仅支持普通话唤醒及识别,部分用户反馈在家中多使用方言进行沟通,如果使用语音还需要切换到普通话感觉有些别扭。
另外,现有方言识别技术方案多为单一方言唤醒识别模型方案,很难满足部分家庭存在多方言语种的情况。
另外,整个说明书对背景技术的任何讨论,并不代表该背景技术一定是所属领域技术人员所知晓的现有技术,整个说明书中的对现有技术的任何讨论并不代表认为该现有技术一定是广泛公知的或一定构成本领域的公知常识。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提供一种空调器的语音识别方法。
本发明的另一个目的在于提供一种空调器的语音识别装置。
本发明的另一个目的在于提供一种空调器。
本发明的另一个目的在于提供一种计算机可读存储介质。
为了实现上述目的,根据本发明的第一方面的实施例,提供了一种空调器的语音识别方法,包括:在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别;根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别。
在该技术方案中,通过设置在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别,语音识别模块采用第一语音处理模型可以被预设为用户设置的优先级高的语音识别模块,或空调器经过机器学习过程确定的特定用户较习惯使用的语音识别模块或较高频使用的语音识别模块,能够使空调器更快速且准确地识别特定用户的语音指令,尤其是对于习惯使用方言的用户而言,语音识别模块采用第一语音处理模型可以是用户习惯使用的方言对应的模块,有利于提升用户的语音功能的使用体验,方言可以是东北话、闽南话、河南话、四川话、山西话等,但不限于此。
另外,通过根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别,尤其是在对语音指令识别失败时,及时切换至第二语音处理模型继续对语音指令进行识别,以提高空调器识别语音指令的响应速率。
值得特别指出的是,语音识别模块采用第一语音处理模型是指任一运行时段内,默认用于进行语音指令识别的模块,而第二语音处理模型是指语音识别模块采用第一语音处理模型识别后,优先切换的用于进行语音识别指令的模块,但不限于此,空调器设置的语音识别模块也不限于语音识别模块采用第一语音处理模型和第二语音处理模型。
其中,识别结果可以是“成功”、“失败”、“是”、“否”和准确率对应的百分比。
在上述任一技术方案中,优选地,所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型。
在该技术方案中,通过设置所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型,可以在语音指令识别失败时,尽快切换至更被用户习惯使用的第二语音处理模型,以尽可能地提高语音指令的识别响应速率。
其中,使用频率可以是通过机器学习过程确定的,也可以是针对特定用户进行设定的。
在上述任一技术方案中,优选地,根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别,具体包括:判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率;判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率,切换至所述第二语音处理模型进行识别。
在该技术方案中,通过判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率,并在判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率,切换至所述第二语音处理模型进行识别,以使语音识别模块采用第一语音处理模型识别失败的语音指令能够被更快地第二语音处理模型解析,以进一步地提升用户的识别功能的使用体验。
在上述任一技术方案中,优选地,还包括:在所述空调器运行的一段预设时长内,接收到多种语音指令;确定多种所述语音指令的空间方位信息;根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别。
在该技术方案中,若在所述空调器运行的一段预设时长内,接收到多种语音指令,则需要确定多种所述语音指令的空间方位信息,通过空间方位信息可以确定语音指令的来源。
进一步地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,能够对类似方位来源的多个语音指令进行筛别,以确定能够被执行的语音指令,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,也即对多个不同方位的语音指令分别进行识别,以辨别能够被执行的语音指令,以提升空调器的语音功能的智能型和可靠性。
在上述任一技术方案中,优选地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体包括:解析所述空间方位信息,以确定多种所述语音指令的方位角;判断多个所述方位角之间的相似度是否小于预设相似度;判定多个所述方位角之间的相似度小于所述预设相似度,按照多个所述语音指令的接收顺序,依次切采用与所述方位角对应的语音识别模块进行识别。
在该技术方案中,方位角是以水平面上的一个参考线为基准确定的,空调器的一个结构点作为参考线上的一个参考点,任一发出语音指令的用户与空调器之间的连线与参考线之间的夹角记作方位角,因此,基于方位角可以确定多个语音指令是否来源于相似的空间区域,或不同的空间区域,尤其是在语音指令来源于多个不同空间区域时,说明语音指令来源于不同用户,因此,通过依次切采用与所述方位角对应的语音识别模块进行识别,能够最及时、最准确和最全面地解析全部语音指令。
在上述任一技术方案中,优选地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体还包括:解析所述空间方位信息,以确定多种所述语音指令的方位角;判断多个所述方位角之间的相似度是否大于或等于预设相似度;判定多个所述方位角之间的相似度大于或等于所述预设相似度,控制多个语音处理模型块同时对多种所述语音指令进行识别。
在该技术方案中,通过判定多个所述方位角之间的相似度大于或等于所述预设相似度,控制多个语音处理模型块同时对多种所述语音指令进行识别,也即同时区分来源于同一空间区域的语音指令,以确定多个语音指令中能够被执行的指令。
根据本发明的第二方面的技术方案,提供了一种空调器的语音识别装置,包括:存储器和处理器,所述存储器被配置为能够存储计算机程序,所述计算机程序被所述处理器执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。
根据本发明的第三方面的技术方案,提供了一种空调器,包括:存储器和处理器,所述存储器被配置为能够存储计算机程序,所述计算机程序被所述处理器执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。
根据本发明的第四方面的技术方案,提供了一种空调器,包括:如上述空调器的语音识别装置。
根据本发明的第五方面的技术方案,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被执行时实现如上述任一项技术方案限定的空调器的语音识别方法的步骤。
本发明的附加方面和优点将在下面的描述部分中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了根据本发明的一个实施例的空调器的语音识别方法的示意流程图;
图2示出了根据本发明的另一个实施例的空调器的语音识别方法的示意流程图;
图3示出了根据本发明的另一个实施例的空调器的语音识别方法的示意流程图;
图4示出了根据本发明的一个实施例的空调器的语音识别装置的示意框图;
图5示出了根据本发明的一个实施例的空调器的示意框图;
图6示出了根据本发明的另一个实施例的空调器的示意框图;
图7示出了根据本发明的一个实施例的计算机可读存储介质的示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
下面结合图1至图7对根据本发明的实施例的空调器的语音识别方法、装置、空调器和计算机可读存储介质的实施例进行具体说明。
如图1所示,根据本发明的实施例的空调器的语音识别方法,包括:步骤S102,在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别;步骤S104,根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别。
在该技术方案中,通过设置在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别,语音识别模块采用第一语音处理模型可以被预设为用户设置的优先级高的语音识别模块,或空调器经过机器学习过程确定的特定用户较习惯使用的语音识别模块或较高频使用的语音识别模块,能够使空调器更快速且准确地识别特定用户的语音指令,尤其是对于习惯使用方言的用户而言,语音识别模块采用第一语音处理模型可以是用户习惯使用的方言对应的模块,有利于提升用户的语音功能的使用体验,方言可以是东北话、闽南话、河南话、四川话、山西话等,但不限于此。
另外,通过根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别,尤其是在对语音指令识别失败时,及时切换至第二语音处理模型继续对语音指令进行识别,以提高空调器识别语音指令的响应速率。
值得特别指出的是,语音识别模块采用第一语音处理模型是指任一运行时段内,默认用于进行语音指令识别的模块,而第二语音处理模型是指语音识别模块采用第一语音处理模型识别后,优先切换的用于进行语音识别指令的模块,但不限于此,空调器设置的语音识别模块也不限于语音识别模块采用第一语音处理模型和第二语音处理模型。
其中,识别结果可以是“成功”、“失败”、“是”、“否”和准确率对应的百分比。
在上述任一技术方案中,优选地,所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型。
在该技术方案中,通过设置所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型,可以在语音指令识别失败时,尽快切换至更被用户习惯使用的第二语音处理模型,以尽可能地提高语音指令的识别响应速率。
其中,使用频率可以是通过机器学习过程确定的,也可以是针对特定用户进行设定的。
在上述任一技术方案中,优选地,根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别,具体包括:判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率;判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率,切换至所述第二语音处理模型进行识别。
在该技术方案中,通过判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率,并在判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率,切换至所述第二语音处理模型进行识别,以使语音识别模块采用第一语音处理模型识别失败的语音指令能够被更快地第二语音处理模型解析,以进一步地提升用户的识别功能的使用体验。
如图2所示,根据本发明的另一个实施例的空调器的语音识别方法,包括:步骤S202,在所述空调器运行的一段预设时长内,接收到多种语音指令;步骤S204,确定多种所述语音指令的空间方位信息;步骤S206,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别。
在该技术方案中,若在所述空调器运行的一段预设时长内,接收到多种语音指令,则需要确定多种所述语音指令的空间方位信息,通过空间方位信息可以确定语音指令的来源。
进一步地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,能够对类似方位来源的多个语音指令进行筛别,以确定能够被执行的语音指令,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,也即对多个不同方位的语音指令分别进行识别,以辨别能够被执行的语音指令,以提升空调器的语音功能的智能型和可靠性。
在上述任一技术方案中,优选地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体包括:解析所述空间方位信息,以确定多种所述语音指令的方位角;判断多个所述方位角之间的相似度是否小于预设相似度;判定多个所述方位角之间的相似度小于所述预设相似度,按照多个所述语音指令的接收顺序,依次切采用与所述方位角对应的语音识别模块进行识别。
在该技术方案中,方位角是以水平面上的一个参考线为基准确定的,空调器的一个结构点作为参考线上的一个参考点,任一发出语音指令的用户与空调器之间的连线与参考线之间的夹角记作方位角,因此,基于方位角可以确定多个语音指令是否来源于相似的空间区域,或不同的空间区域,尤其是在语音指令来源于多个不同空间区域时,说明语音指令来源于不同用户,因此,通过依次切采用与所述方位角对应的语音识别模块进行识别,能够最及时、最准确和最全面地解析全部语音指令。
在上述任一技术方案中,优选地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体还包括:解析所述空间方位信息,以确定多种所述语音指令的方位角;判断多个所述方位角之间的相似度是否大于或等于预设相似度;判定多个所述方位角之间的相似度大于或等于所述预设相似度,控制多个语音处理模型块同时对多种所述语音指令进行识别。
在该技术方案中,通过判定多个所述方位角之间的相似度大于或等于所述预设相似度,控制多个语音处理模型块同时对多种所述语音指令进行识别,也即同时区分来源于同一空间区域的语音指令,以确定多个语音指令中能够被执行的指令。
如图3所示,根据本发明的另一个实施例的空调器的语音识别方法,包括:步骤S302,APP端添加方言语种选择;步骤S304,当系统识别到多种方言模型被使用到,输出对应不同方言唤醒模型的方位角;步骤S306,系统检测到一定运行时间内使用同一方言;步骤S308,模型优先切换到该方言内,该方言模型无识别结果后,在启动其他方言模型;步骤S310,可优化系统运行内存及缩短不同方言模型切换的时间;步骤S312,不同方言唤醒方位角接近一致时;步骤S314,同时启动多种方言模型,实时系统内存加大,反馈时间较另外两种情况有延迟;步骤S316,不同方言唤醒方位角相差较大时;步骤S318,短时间内依据唤醒输出方位角,切换方言模型,固定方位角切入固定方言识别模型,系统内存优化且反馈时间缩短。
具体地,在APP端设置目前可支持方言语种,且设置为可支持两种及两种以上语种,识别语音指令的步骤如下:
(1)如果维持一定时长内,语种均不进行切换,则空调有限切入该方言模型,该方言模型不识别情况下再切入另一种方言模型进行识别,这样可提示识别速度。
(2)如果短期内在同一方位检测到有两种方言,则系统中同时启动两种方言的识别模型,保证两种模型均处于唤醒识别状态,保证不会丢失数据结果,但反馈时长会慢于(1)方案。
(3)如果短期内,在不同方位检测到两种不同的方言模型,例如家中夫妻,左侧为四川话,右侧为广东话,依据声源定位定位到不同方言模型下的方位角。
(4)当用户使用方言进行唤醒时,输出对应语种与对应方言唤醒模型的方位角,匹配到更接近的方言语种进行识别,如果方位角更接近左侧则启用广东话识别模型,如果方位角更接近右侧则启用四川话识别模型,该种定位缩短了模型切换时间或者是两个唤醒模型同时启动运行的耗时问题。
如图4所示,根据本发明的另一个实施例的空调器的语音识别装置400,包括:存储器402和处理器404,所述存储器402被配置为能够存储计算机程序,所述计算机程序被所述处理器404执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。
如图5所示,根据本发明的另一个实施例的空调器500,包括:存储器502和处理器504,所述存储器502被配置为能够存储计算机程序,所述计算机程序被所述处理器504执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。
如图6所示,根据本发明的实施例的空调器600,包括:如上述空调器的语音识别装置400。
如图7所示,根据本发明的实施例的计算机可读存储介质700,计算机可读存储介质上存储有计算机程序,计算机程序被空调器500(600)执行时,实现如上述任一项技术方案限定的空调器的语音识别方法,具体包括以下步骤:在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别;根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别。
综上,该语音识别系统支持多种方言唤醒模型及识别模型,且具备以下策略和优点:
(1)该语音识别系统可在APP端设置同时开启一种或多种方言识别系统。
(2)该语音识别系统如果识别到一段时间内只存在一种方言系统,则优先切换到该方言模型,该方言模型下无识别结果再启动其他方言系统,优化了系统内存及响应时间。
(3)如果短期内,依据唤醒模型输出方位角,判断大致在同一方位检测到有两种或两种以上方言,则系统中同时启动两多种方言的识别模型,保证多种模型均处于唤醒识别状态,保证不会丢失数据结果,但反馈时长会慢于(2)方案。
(4)如果短期内,在不同方位检测到多种不同的方言模型,当用户使用方言进行唤醒时,输出对应语种与对应方言唤醒模型的方位角,匹配到更接近的方言语种进行识别,该种定位缩短了模型切换时间或者是多个唤醒模型同时启动运行的耗时问题。
在该技术方案中,通过设置在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别,语音识别模块采用第一语音处理模型可以被预设为用户设置的优先级高的语音识别模块,或空调器经过机器学习过程确定的特定用户较习惯使用的语音识别模块或较高频使用的语音识别模块,能够使空调器更快速且准确地识别特定用户的语音指令,尤其是对于习惯使用方言的用户而言,语音识别模块采用第一语音处理模型可以是用户习惯使用的方言对应的模块,有利于提升用户的语音功能的使用体验,方言可以是东北话、闽南话、河南话、四川话、山西话等,但不限于此。
另外,通过根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别,尤其是在对语音指令识别失败时,及时切换至第二语音处理模型继续对语音指令进行识别,以提高空调器识别语音指令的响应速率。
值得特别指出的是,语音识别模块采用第一语音处理模型是指任一运行时段内,默认用于进行语音指令识别的模块,而第二语音处理模型是指语音识别模块采用第一语音处理模型识别后,优先切换的用于进行语音识别指令的模块,但不限于此,空调器设置的语音识别模块也不限于语音识别模块采用第一语音处理模型和第二语音处理模型。
其中,识别结果可以是“成功”、“失败”、“是”、“否”和准确率对应的百分比。
在上述任一技术方案中,优选地,所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型。
在该技术方案中,通过设置所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型,可以在语音指令识别失败时,尽快切换至更被用户习惯使用的第二语音处理模型,以尽可能地提高语音指令的识别响应速率。
其中,使用频率可以是通过机器学习过程确定的,也可以是针对特定用户进行设定的。
在上述任一技术方案中,优选地,根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别,具体包括:判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率;判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率,切换至所述第二语音处理模型进行识别。
在该技术方案中,通过判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率,并在判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率,切换至所述第二语音处理模型进行识别,以使语音识别模块采用第一语音处理模型识别失败的语音指令能够被更快地第二语音处理模型解析,以进一步地提升用户的识别功能的使用体验。
在上述任一技术方案中,优选地,还包括:在所述空调器运行的一段预设时长内,接收到多种语音指令;确定多种所述语音指令的空间方位信息;根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别。
在该技术方案中,若在所述空调器运行的一段预设时长内,接收到多种语音指令,则需要确定多种所述语音指令的空间方位信息,通过空间方位信息可以确定语音指令的来源。
进一步地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,能够对类似方位来源的多个语音指令进行筛别,以确定能够被执行的语音指令,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,也即对多个不同方位的语音指令分别进行识别,以辨别能够被执行的语音指令,以提升空调器的语音功能的智能型和可靠性。
在上述任一技术方案中,优选地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体包括:解析所述空间方位信息,以确定多种所述语音指令的方位角;判断多个所述方位角之间的相似度是否小于预设相似度;判定多个所述方位角之间的相似度小于所述预设相似度,按照多个所述语音指令的接收顺序,依次切采用与所述方位角对应的语音识别模块进行识别。
在该技术方案中,方位角是以水平面上的一个参考线为基准确定的,空调器的一个结构点作为参考线上的一个参考点,任一发出语音指令的用户与空调器之间的连线与参考线之间的夹角记作方位角,因此,基于方位角可以确定多个语音指令是否来源于相似的空间区域,或不同的空间区域,尤其是在语音指令来源于多个不同空间区域时,说明语音指令来源于不同用户,因此,通过依次切采用与所述方位角对应的语音识别模块进行识别,能够最及时、最准确和最全面地解析全部语音指令。
在上述任一技术方案中,优选地,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体还包括:解析所述空间方位信息,以确定多种所述语音指令的方位角;判断多个所述方位角之间的相似度是否大于或等于预设相似度;判定多个所述方位角之间的相似度大于或等于所述预设相似度,控制多个语音处理模型块同时对多种所述语音指令进行识别。
在该技术方案中,通过判定多个所述方位角之间的相似度大于或等于所述预设相似度,控制多个语音处理模型块同时对多种所述语音指令进行识别,也即同时区分来源于同一空间区域的语音指令,以确定多个语音指令中能够被执行的指令。
以上结合附图详细说明了本发明的技术方案,本发明提供了一种空调器的语音识别方法、空调器的语音识别装置、空调器和计算机可读存储介质,通过设置在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别,语音识别模块采用第一语音处理模型可以被预设为用户设置的优先级高的语音识别模块,或空调器经过机器学习过程确定的特定用户较习惯使用的语音识别模块或较高频使用的语音识别模块,能够使空调器更快速且准确地识别特定用户的语音指令,尤其是对于习惯使用方言的用户而言,语音识别模块采用第一语音处理模型可以是用户习惯使用的方言对应的模块,有利于提升用户的语音功能的使用体验,方言可以是东北话、闽南话、河南话、四川话、山西话等,但不限于此。
本发明方法中的步骤可根据实际需要进行顺序调整、合并和删减。
本发明装置中的单元可根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种空调器的语音识别方法,其特征在于,包括:
在所述空调器运行的一段预设时长内,控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别;
根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别;
所述空调器的语音识别方法还包括:
在所述空调器运行的一段预设时长内,接收到多种语音指令;
确定多种所述语音指令的空间方位信息;
根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别;
所述根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体包括:
解析所述空间方位信息,以确定多种所述语音指令的方位角;
判断多个所述方位角之间的相似度是否小于预设相似度;
判定多个所述方位角之间的相似度小于所述预设相似度,按照多个所述语音指令的接收顺序,依次切采用与所述方位角对应的语音识别模块进行识别。
2.根据权利要求1所述的空调器的语音识别方法,其特征在于,
所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型。
3.根据权利要求1或2所述的空调器的语音识别方法,其特征在于,根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果,切换至第二语音处理模型进行识别,具体包括:
判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率;
判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率,切换至所述第二语音处理模型进行识别。
4.根据权利要求1所述的空调器的语音识别方法,其特征在于,根据所述空间方位信息,控制多个语音处理模型块同时对多种所述语音指令进行识别,或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别,具体还包括:
解析所述空间方位信息,以确定多种所述语音指令的方位角;
判断多个所述方位角之间的相似度是否大于或等于预设相似度;
判定多个所述方位角之间的相似度大于或等于所述预设相似度,控制多个语音处理模型块同时对多种所述语音指令进行识别。
5.一种空调器的语音识别装置,其特征在于,包括:
存储器和处理器,所述存储器被配置为能够存储计算机程序,所述计算机程序被所述处理器执行时能够实现如权利要求1至4中任一项所述的空调器的语音识别方法的步骤。
6.一种空调器,其特征在于,包括:
存储器和处理器,所述存储器被配置为能够存储计算机程序,所述计算机程序被所述处理器执行时能够实现如权利要求1至4中任一项所述的空调器的语音识别方法的步骤。
7.一种空调器,其特征在于,包括:
如权利要求5所述的空调器的语音识别装置。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被执行时实现如权利要求1至4中任一项所述的空调器的语音识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010246368.1A CN111312214B (zh) | 2020-03-31 | 2020-03-31 | 空调器的语音识别方法、装置、空调器和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010246368.1A CN111312214B (zh) | 2020-03-31 | 2020-03-31 | 空调器的语音识别方法、装置、空调器和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111312214A CN111312214A (zh) | 2020-06-19 |
CN111312214B true CN111312214B (zh) | 2022-12-16 |
Family
ID=71151635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010246368.1A Active CN111312214B (zh) | 2020-03-31 | 2020-03-31 | 空调器的语音识别方法、装置、空调器和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111312214B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724766B (zh) * | 2020-06-29 | 2024-01-05 | 合肥讯飞数码科技有限公司 | 语种识别方法、相关设备及可读存储介质 |
CN112349276B (zh) * | 2020-12-03 | 2022-10-04 | 恒大新能源汽车投资控股集团有限公司 | 一种车载语音交互方法、装置及电子设备 |
CN116105308A (zh) * | 2021-11-11 | 2023-05-12 | 青岛海尔空调器有限总公司 | 用于语音空调的控制方法及装置、语音空调、存储介质 |
CN113959029A (zh) * | 2021-11-15 | 2022-01-21 | 王毅 | 一种语音控制雾化器及其控制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108735227A (zh) * | 2018-06-22 | 2018-11-02 | 北京三听科技有限公司 | 一种用于对麦克风阵列拾取的语音信号进行声源分离的方法及系统 |
CN109360563A (zh) * | 2018-12-10 | 2019-02-19 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN109584876A (zh) * | 2018-12-26 | 2019-04-05 | 珠海格力电器股份有限公司 | 语音数据的处理方法、装置和语音空调 |
CN110400562A (zh) * | 2019-06-24 | 2019-11-01 | 歌尔科技有限公司 | 交互处理方法、装置、设备及音频设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102476600B1 (ko) * | 2015-10-21 | 2022-12-12 | 삼성전자주식회사 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
-
2020
- 2020-03-31 CN CN202010246368.1A patent/CN111312214B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108735227A (zh) * | 2018-06-22 | 2018-11-02 | 北京三听科技有限公司 | 一种用于对麦克风阵列拾取的语音信号进行声源分离的方法及系统 |
CN109360563A (zh) * | 2018-12-10 | 2019-02-19 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN109584876A (zh) * | 2018-12-26 | 2019-04-05 | 珠海格力电器股份有限公司 | 语音数据的处理方法、装置和语音空调 |
CN110400562A (zh) * | 2019-06-24 | 2019-11-01 | 歌尔科技有限公司 | 交互处理方法、装置、设备及音频设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111312214A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111312214B (zh) | 空调器的语音识别方法、装置、空调器和可读存储介质 | |
CN108183844B (zh) | 一种智能家电语音控制方法、装置及系统 | |
CN108831469B (zh) | 语音命令定制方法、装置和设备及计算机存储介质 | |
JP4363076B2 (ja) | 音声制御装置 | |
KR102004872B1 (ko) | 전자장치, 서버 및 그 제어방법 | |
CN107644638B (zh) | 语音识别方法、装置、终端和计算机可读存储介质 | |
CN106023994B (zh) | 一种语音处理的方法、装置以及系统 | |
US20060195323A1 (en) | Distributed speech recognition system | |
US7689424B2 (en) | Distributed speech recognition method | |
CN110767232B (zh) | 语音识别控制方法及装置、计算机设备和计算机存储介质 | |
JP6675078B2 (ja) | 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム | |
CN110288990B (zh) | 一种语音控制优化方法、存储介质及智能终端 | |
US20090287488A1 (en) | Text display, text display method, and program | |
EP3640790A1 (en) | Electronic device, control method thereof, and sound output control system of the electronic device | |
CN113851124A (zh) | 用于控制家电设备的方法及装置、存储介质 | |
CN109859752A (zh) | 一种语音控制方法、装置、存储介质及语音联控系统 | |
CN110400568B (zh) | 智能语音系统的唤醒方法、智能语音系统及车辆 | |
KR102417899B1 (ko) | 차량의 음성인식 시스템 및 방법 | |
KR20170051994A (ko) | 음성인식 디바이스 및 이의 동작 방법 | |
CN113571096A (zh) | 语音情绪分类模型训练方法、装置、计算机设备及介质 | |
JP7192858B2 (ja) | 機器制御装置及び機器を制御する制御方法 | |
JP5157596B2 (ja) | 音声認識装置 | |
CN111243577B (zh) | 语音交互方法及装置 | |
CN115016301A (zh) | 用于控制智能设备的方法、装置及智能设备、存储介质 | |
CN107195298B (zh) | 根本原因分析以及校正系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |