CN111312214B

CN111312214B - 空调器的语音识别方法、装置、空调器和可读存储介质

Info

Publication number: CN111312214B
Application number: CN202010246368.1A
Authority: CN
Inventors: 席红艳
Original assignee: Midea Group Co Ltd; GD Midea Air Conditioning Equipment Co Ltd
Current assignee: Midea Group Co Ltd; GD Midea Air Conditioning Equipment Co Ltd
Priority date: 2020-03-31
Filing date: 2020-03-31
Publication date: 2022-12-16
Anticipated expiration: 2040-03-31
Also published as: CN111312214A

Abstract

本发明提供了一种空调器的语音识别方法、装置、空调器和存储介质，其中，空调器的语音识别方法包括：在空调器运行的一段预设时长内，控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别；根据语音识别模块采用第一语音处理模型对语音指令的识别结果，切换至第二语音处理模型进行识别。通过本发明的技术方案，能够提高语音指令识别的效率、准确性、可靠性和多样性，有利于提升用户的使用体验。

Description

空调器的语音识别方法、装置、空调器和可读存储介质

技术领域

本发明涉及电池技术领域，具体而言，涉及一种空调器的语音识别方法、一种空调器的语音识别装置、一种空调器和一种计算机可读存储介质。

背景技术

空调、电视和音响等家电设备，均开发出语音识别系统对用户的语音指令进行识别，目前大多语音识别系统仅支持普通话唤醒及识别，部分用户反馈在家中多使用方言进行沟通，如果使用语音还需要切换到普通话感觉有些别扭。

另外，现有方言识别技术方案多为单一方言唤醒识别模型方案，很难满足部分家庭存在多方言语种的情况。

另外，整个说明书对背景技术的任何讨论，并不代表该背景技术一定是所属领域技术人员所知晓的现有技术，整个说明书中的对现有技术的任何讨论并不代表认为该现有技术一定是广泛公知的或一定构成本领域的公知常识。

发明内容

本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

为此，本发明的一个目的在于提供一种空调器的语音识别方法。

本发明的另一个目的在于提供一种空调器的语音识别装置。

本发明的另一个目的在于提供一种空调器。

本发明的另一个目的在于提供一种计算机可读存储介质。

为了实现上述目的，根据本发明的第一方面的实施例，提供了一种空调器的语音识别方法，包括：在所述空调器运行的一段预设时长内，控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别；根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果，切换至第二语音处理模型进行识别。

在该技术方案中，通过设置在所述空调器运行的一段预设时长内，控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别，语音识别模块采用第一语音处理模型可以被预设为用户设置的优先级高的语音识别模块，或空调器经过机器学习过程确定的特定用户较习惯使用的语音识别模块或较高频使用的语音识别模块，能够使空调器更快速且准确地识别特定用户的语音指令，尤其是对于习惯使用方言的用户而言，语音识别模块采用第一语音处理模型可以是用户习惯使用的方言对应的模块，有利于提升用户的语音功能的使用体验，方言可以是东北话、闽南话、河南话、四川话、山西话等，但不限于此。

另外，通过根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果，切换至第二语音处理模型进行识别，尤其是在对语音指令识别失败时，及时切换至第二语音处理模型继续对语音指令进行识别，以提高空调器识别语音指令的响应速率。

值得特别指出的是，语音识别模块采用第一语音处理模型是指任一运行时段内，默认用于进行语音指令识别的模块，而第二语音处理模型是指语音识别模块采用第一语音处理模型识别后，优先切换的用于进行语音识别指令的模块，但不限于此，空调器设置的语音识别模块也不限于语音识别模块采用第一语音处理模型和第二语音处理模型。

其中，识别结果可以是“成功”、“失败”、“是”、“否”和准确率对应的百分比。

在上述任一技术方案中，优选地，所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型。

在该技术方案中，通过设置所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型，可以在语音指令识别失败时，尽快切换至更被用户习惯使用的第二语音处理模型，以尽可能地提高语音指令的识别响应速率。

其中，使用频率可以是通过机器学习过程确定的，也可以是针对特定用户进行设定的。

在上述任一技术方案中，优选地，根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果，切换至第二语音处理模型进行识别，具体包括：判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率；判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率，切换至所述第二语音处理模型进行识别。

在该技术方案中，通过判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率，并在判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率，切换至所述第二语音处理模型进行识别，以使语音识别模块采用第一语音处理模型识别失败的语音指令能够被更快地第二语音处理模型解析，以进一步地提升用户的识别功能的使用体验。

在上述任一技术方案中，优选地，还包括：在所述空调器运行的一段预设时长内，接收到多种语音指令；确定多种所述语音指令的空间方位信息；根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别。

在该技术方案中，若在所述空调器运行的一段预设时长内，接收到多种语音指令，则需要确定多种所述语音指令的空间方位信息，通过空间方位信息可以确定语音指令的来源。

进一步地，根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，能够对类似方位来源的多个语音指令进行筛别，以确定能够被执行的语音指令，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别，也即对多个不同方位的语音指令分别进行识别，以辨别能够被执行的语音指令，以提升空调器的语音功能的智能型和可靠性。

在上述任一技术方案中，优选地，根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别，具体包括：解析所述空间方位信息，以确定多种所述语音指令的方位角；判断多个所述方位角之间的相似度是否小于预设相似度；判定多个所述方位角之间的相似度小于所述预设相似度，按照多个所述语音指令的接收顺序，依次切采用与所述方位角对应的语音识别模块进行识别。

在该技术方案中，方位角是以水平面上的一个参考线为基准确定的，空调器的一个结构点作为参考线上的一个参考点，任一发出语音指令的用户与空调器之间的连线与参考线之间的夹角记作方位角，因此，基于方位角可以确定多个语音指令是否来源于相似的空间区域，或不同的空间区域，尤其是在语音指令来源于多个不同空间区域时，说明语音指令来源于不同用户，因此，通过依次切采用与所述方位角对应的语音识别模块进行识别，能够最及时、最准确和最全面地解析全部语音指令。

在上述任一技术方案中，优选地，根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别，具体还包括：解析所述空间方位信息，以确定多种所述语音指令的方位角；判断多个所述方位角之间的相似度是否大于或等于预设相似度；判定多个所述方位角之间的相似度大于或等于所述预设相似度，控制多个语音处理模型块同时对多种所述语音指令进行识别。

在该技术方案中，通过判定多个所述方位角之间的相似度大于或等于所述预设相似度，控制多个语音处理模型块同时对多种所述语音指令进行识别，也即同时区分来源于同一空间区域的语音指令，以确定多个语音指令中能够被执行的指令。

根据本发明的第二方面的技术方案，提供了一种空调器的语音识别装置，包括：存储器和处理器，所述存储器被配置为能够存储计算机程序，所述计算机程序被所述处理器执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。

根据本发明的第三方面的技术方案，提供了一种空调器，包括：存储器和处理器，所述存储器被配置为能够存储计算机程序，所述计算机程序被所述处理器执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。

根据本发明的第四方面的技术方案，提供了一种空调器，包括：如上述空调器的语音识别装置。

根据本发明的第五方面的技术方案，提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被执行时实现如上述任一项技术方案限定的空调器的语音识别方法的步骤。

本发明的附加方面和优点将在下面的描述部分中给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1示出了根据本发明的一个实施例的空调器的语音识别方法的示意流程图；

图2示出了根据本发明的另一个实施例的空调器的语音识别方法的示意流程图；

图3示出了根据本发明的另一个实施例的空调器的语音识别方法的示意流程图；

图4示出了根据本发明的一个实施例的空调器的语音识别装置的示意框图；

图5示出了根据本发明的一个实施例的空调器的示意框图；

图6示出了根据本发明的另一个实施例的空调器的示意框图；

图7示出了根据本发明的一个实施例的计算机可读存储介质的示意框图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

下面结合图1至图7对根据本发明的实施例的空调器的语音识别方法、装置、空调器和计算机可读存储介质的实施例进行具体说明。

如图1所示，根据本发明的实施例的空调器的语音识别方法，包括：步骤S102，在所述空调器运行的一段预设时长内，控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别；步骤S104，根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果，切换至第二语音处理模型进行识别。

如图2所示，根据本发明的另一个实施例的空调器的语音识别方法，包括：步骤S202，在所述空调器运行的一段预设时长内，接收到多种语音指令；步骤S204，确定多种所述语音指令的空间方位信息；步骤S206，根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别。

如图3所示，根据本发明的另一个实施例的空调器的语音识别方法，包括：步骤S302，APP端添加方言语种选择；步骤S304，当系统识别到多种方言模型被使用到，输出对应不同方言唤醒模型的方位角；步骤S306，系统检测到一定运行时间内使用同一方言；步骤S308，模型优先切换到该方言内，该方言模型无识别结果后，在启动其他方言模型；步骤S310，可优化系统运行内存及缩短不同方言模型切换的时间；步骤S312，不同方言唤醒方位角接近一致时；步骤S314，同时启动多种方言模型，实时系统内存加大，反馈时间较另外两种情况有延迟；步骤S316，不同方言唤醒方位角相差较大时；步骤S318，短时间内依据唤醒输出方位角，切换方言模型，固定方位角切入固定方言识别模型，系统内存优化且反馈时间缩短。

具体地，在APP端设置目前可支持方言语种，且设置为可支持两种及两种以上语种，识别语音指令的步骤如下：

(1)如果维持一定时长内，语种均不进行切换，则空调有限切入该方言模型，该方言模型不识别情况下再切入另一种方言模型进行识别，这样可提示识别速度。

(2)如果短期内在同一方位检测到有两种方言，则系统中同时启动两种方言的识别模型，保证两种模型均处于唤醒识别状态，保证不会丢失数据结果，但反馈时长会慢于(1)方案。

(3)如果短期内，在不同方位检测到两种不同的方言模型，例如家中夫妻，左侧为四川话，右侧为广东话，依据声源定位定位到不同方言模型下的方位角。

(4)当用户使用方言进行唤醒时，输出对应语种与对应方言唤醒模型的方位角，匹配到更接近的方言语种进行识别，如果方位角更接近左侧则启用广东话识别模型，如果方位角更接近右侧则启用四川话识别模型，该种定位缩短了模型切换时间或者是两个唤醒模型同时启动运行的耗时问题。

如图4所示，根据本发明的另一个实施例的空调器的语音识别装置400，包括：存储器402和处理器404，所述存储器402被配置为能够存储计算机程序，所述计算机程序被所述处理器404执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。

如图5所示，根据本发明的另一个实施例的空调器500，包括：存储器502和处理器504，所述存储器502被配置为能够存储计算机程序，所述计算机程序被所述处理器504执行时能够实现如上述任一项技术方案所述的空调器的语音识别方法的步骤。

如图6所示，根据本发明的实施例的空调器600，包括：如上述空调器的语音识别装置400。

如图7所示，根据本发明的实施例的计算机可读存储介质700，计算机可读存储介质上存储有计算机程序，计算机程序被空调器500(600)执行时，实现如上述任一项技术方案限定的空调器的语音识别方法，具体包括以下步骤：在所述空调器运行的一段预设时长内，控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别；根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果，切换至第二语音处理模型进行识别。

综上，该语音识别系统支持多种方言唤醒模型及识别模型，且具备以下策略和优点：

(1)该语音识别系统可在APP端设置同时开启一种或多种方言识别系统。

(2)该语音识别系统如果识别到一段时间内只存在一种方言系统，则优先切换到该方言模型，该方言模型下无识别结果再启动其他方言系统，优化了系统内存及响应时间。

(3)如果短期内，依据唤醒模型输出方位角，判断大致在同一方位检测到有两种或两种以上方言，则系统中同时启动两多种方言的识别模型，保证多种模型均处于唤醒识别状态，保证不会丢失数据结果，但反馈时长会慢于(2)方案。

(4)如果短期内，在不同方位检测到多种不同的方言模型，当用户使用方言进行唤醒时，输出对应语种与对应方言唤醒模型的方位角，匹配到更接近的方言语种进行识别，该种定位缩短了模型切换时间或者是多个唤醒模型同时启动运行的耗时问题。

以上结合附图详细说明了本发明的技术方案，本发明提供了一种空调器的语音识别方法、空调器的语音识别装置、空调器和计算机可读存储介质，通过设置在所述空调器运行的一段预设时长内，控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别，语音识别模块采用第一语音处理模型可以被预设为用户设置的优先级高的语音识别模块，或空调器经过机器学习过程确定的特定用户较习惯使用的语音识别模块或较高频使用的语音识别模块，能够使空调器更快速且准确地识别特定用户的语音指令，尤其是对于习惯使用方言的用户而言，语音识别模块采用第一语音处理模型可以是用户习惯使用的方言对应的模块，有利于提升用户的语音功能的使用体验，方言可以是东北话、闽南话、河南话、四川话、山西话等，但不限于此。

本发明方法中的步骤可根据实际需要进行顺序调整、合并和删减。

本发明装置中的单元可根据实际需要进行合并、划分和删减。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种空调器的语音识别方法，其特征在于，包括：

在所述空调器运行的一段预设时长内，控制语音识别模块采用第一语音处理模型对接收的语音指令进行识别；

根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果，切换至第二语音处理模型进行识别；

所述空调器的语音识别方法还包括：

在所述空调器运行的一段预设时长内，接收到多种语音指令；

确定多种所述语音指令的空间方位信息；

根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别；

所述根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别，具体包括：

解析所述空间方位信息，以确定多种所述语音指令的方位角；

判断多个所述方位角之间的相似度是否小于预设相似度；

判定多个所述方位角之间的相似度小于所述预设相似度，按照多个所述语音指令的接收顺序，依次切采用与所述方位角对应的语音识别模块进行识别。

2.根据权利要求1所述的空调器的语音识别方法，其特征在于，

所述语音识别模块采用第一语音处理模型的使用频率大于所述第二语音处理模型。

3.根据权利要求1或2所述的空调器的语音识别方法，其特征在于，根据所述语音识别模块采用第一语音处理模型对所述语音指令的识别结果，切换至第二语音处理模型进行识别，具体包括：

判断所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率是否小于或等于预设成功率；

判定所述语音识别模块采用第一语音处理模型对至少一个所述语音指令的识别成功率小于或等于所述预设成功率，切换至所述第二语音处理模型进行识别。

4.根据权利要求1所述的空调器的语音识别方法，其特征在于，根据所述空间方位信息，控制多个语音处理模型块同时对多种所述语音指令进行识别，或采用上一次所述空间方位信息对应的语音处理模型对多种所述语音指令进行识别，具体还包括：

判断多个所述方位角之间的相似度是否大于或等于预设相似度；

判定多个所述方位角之间的相似度大于或等于所述预设相似度，控制多个语音处理模型块同时对多种所述语音指令进行识别。

5.一种空调器的语音识别装置，其特征在于，包括：

存储器和处理器，所述存储器被配置为能够存储计算机程序，所述计算机程序被所述处理器执行时能够实现如权利要求1至4中任一项所述的空调器的语音识别方法的步骤。

6.一种空调器，其特征在于，包括：

7.一种空调器，其特征在于，包括：

如权利要求5所述的空调器的语音识别装置。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被执行时实现如权利要求1至4中任一项所述的空调器的语音识别方法。