CN117751585A

CN117751585A - 智能耳机的控制方法、装置、电子设备和存储介质

Info

Publication number: CN117751585A
Application number: CN202280004138.1A
Authority: CN
Inventors: 彭聪
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2022-06-20
Filing date: 2022-06-20
Publication date: 2024-03-22
Also published as: WO2023245390A1

Abstract

一种智能耳机的控制方法、装置、电子设备和存储介质，方法包括：获取终端设备上播放的音频数据(101)，对音频数据进行识别，以确定终端设备处于目标工作场景(102)，目标工作场景下智能耳机的麦克风处于语音采集状态，在目标工作场景下，获取智能耳机的模式切换指令(103)，根据模式切换指令，控制智能耳机在至少两个语音模式间切换(104)。通过在目标工作场景下，控制智能耳机在至少两种模式间切换可以帮助用户在使用智能耳机的时候，不需要频繁的摘下或带上智能耳机，提高了智能耳机使用的便利性。

Description

智能耳机的控制方法、装置、电子设备和存储介质

技术领域

本申请涉及计算机应用技术领域，尤其涉及智能耳机的控制方法、装置、电子设备和存储介质。

背景技术

终端设备在使用过程中搭配智能耳机，给人们的日常使用带来了便利，而具有降噪功能的智能耳机，可以隔绝周遭的噪音，目前的使用也越来越普及。

而用户在使用具有降噪功能的智能耳机时，通常还需要和周围的人进行沟通，此时，用户就需要频繁的摘下智能耳机以便于和周围的人进行沟通，再戴上耳机，降低了智能耳机使用的便利性。

发明内容

本申请提出一种智能耳机的控制方法、装置、电子设备和存储介质，以提高智能耳机使用的便利性。

本申请一方面实施例提出了一种智能耳机的控制方法，包括：

获取所述终端设备上播放的音频数据；

对所述音频数据进行识别，以确定所述终端设备处于目标工作场景；所述目标工作场景下所述智能耳机的麦克风处于语音采集状态

在所述目标工作场景下，获取所述智能耳机的模式切换指令；

根据所述模式切换指令，控制所述智能耳机在所述至少两个语音模式间切换。

本申请另一方面实施例提出了一种智能耳机的控制装置，包括：

获取模块，用于获取所述终端设备上播放的音频数据；

第一确定模块，用于对所述音频数据进行识别，以确定所述终端设备处于目标工作场景；所述目标工作场景下，所述智能耳机的麦克风处于语音采集状态；

所述获取模块，还用于在所述目标工作场景下，获取所述智能耳机的模式切换指令；

控制模块，用于根据所述模式切换指令，控制所述智能耳机在所述至少两个语音模式间切换。

本申请另一方面实施例提出了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如前述一方面所述的方法。

本申请另一方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如前述一方面所述的方法。

本申请另一方面实施例提出了一种计算机程序产品，其上存储有计算机程序，所述程序被处理器执行时实现如前述一方面所述的方法。

本申请提出的智能耳机的控制方法、装置、电子设备和存储介质，获取终端设备上播放的音频数据，对音频数据进行识别，以确定终端设备处于目标工作场景，目标工作场景下智能耳机的麦克风处于语音采集状态，在目标工作场景下，获取智能耳机的模式切换指令，根据模式切换指令，控制智能耳机在至少两个语音模式间切换，通过在目标工作场景下，控制智能耳机在至少两种模式间切换可以帮助用户在使用智能耳机的时候，不需要频繁的摘下或带上智能耳机，提高了智能耳机使用的便利性。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请实施例所提供的一种智能耳机的控制方法的流程示意图；

图2为本申请实施例提供的另一种智能耳机的控制方法的流程示意图；

图3为本申请实施例提供的另一种智能耳机的控制方法的流程示意图；

图4为本申请实施例提供的另一种智能耳机的控制方法的流程示意图；

图5为本申请实施例提供的一种智能耳机的控制装置的结构示意图；

图6为本申请实施例提供的一种电子设备的框图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的智能耳机的控制方法、装置、电子设备和存储介质。

图1为本申请实施例所提供的一种智能耳机的控制方法的流程示意图。

本申请实施例的智能耳机的控制方法的执行主体为智能耳机的控制装置，该装置可设置于电子设备中，电子设备可以为智能耳机，智能耳机为具有降噪功能的降噪耳机。

如图1所示，该方法可以包括以下步骤：

步骤101，获取终端设备上播放的音频数据。

其中，终端设备，可以为智能手机、掌上电脑、智能穿戴设备、电脑等，本实施例中不进行限定。

本申请实施例的一个示例中，智能耳机为具有降噪功能的蓝牙耳机，智能耳机和终端设备通过蓝牙进行连接，建立连接后，终端设备将播放的音频数据按照设定的频率发送給智能耳机，例如，实时发送，或者是每200ms发送一次，其中，音频数据可以为人的语音数据、影音娱乐数据等。

步骤102，对音频数据进行识别，以确定终端设备处于目标工作场景。

其中，目标工作场景下，智能耳机的麦克风处于语音采集状态，也就是说当终端设备处于目标工作场景时，智能耳机的麦克风处于开启状态，可用于采集环境的语音数据。

本申请实施例中，通过对音频数据进行识别，以识别出音频数据属于影音娱乐数据，还是属于人的语音数据。其中，影音娱乐数据，例如音乐、电影、短视频等，这类数据均包含背景音乐，若音频数据识别属于语音数据，例如，电话会议场景下的人的语音数据，或即时聊天软件的人的语音数据等，在这种场景下，使用智能耳机的用户的声音数据需要传送給参与电话会议或即时聊天的其它终端设备的用户，从而，智能耳机上的麦克风需要开启以采集使用智能耳机的用户的声音数据，则确定终端设备处于目标工作场景；若音频数据识别为影音娱乐数据，例如，在应用程序上收听的音乐、观看的视频等，在这种场景下，智能耳机用于将终端设备播放的音频数据通过耳机传入人耳，而智能耳机上的麦克风不开启，不需要采集使用智能耳机的用户的声音数据或环境数据。

本申请实施例的一种实现方式中，获取设定时长的音频数据，对音频数据进行识别，确定音频数据包括的语音频段，响应于语音频段中包含第一目标语音频段，且不包含第二目标语音频段和第三目标语音频段，确定终端设备处于目标工作场景。其中，第一目标语音频段的频率下限大于第二目标语音频段的频率上限，且第一目标语音频段的频率上限小于第三目标语音频段的频率下限。作为一种示例，语音频段包含低频频段、中频频段和高频频段，则第一目标语音频段为中频频段，第二目标语音频段为低频频段，第三目标语音频段为高频频段，通常获取的用户的声音数据中低频频段和高频频段较少，也就是说用户声音数据的频率主要属于中频频段，而影音娱乐数据中由于包含音乐数据，音乐数据中包含较多的低频频段的数据和高频频段的数据，因此，通过对音频数据包含的频段进行识别，可确定音频数据是人的语音数据还是影音娱乐数据，在音频数据识别为人的语音数据的情况下，确定终端设备处于目标工作场景。

本申请实施例的另一种实现方式中，通过对音频数据进行识别，若识别到音频数据中包括的第一目标音频频段在整个音频频段中占比大于设定阈值，即第二目标音频频段和/或第三目标音频频段在整个音频频段中的占比低于设定阈值，则认为该音频数据为用户的声音数据，即确定终端设备处于目标工作场景。

需要说明的是，为了提高识别的准确度，可采集多个设定时长的音频数据进行识别，在多个设定时长的音频数据包含的语音频段均满足上述要求的情况下，确定终端设备处于目标工作场景。

本申请实施例的又一种实现方式中，对音频数据携带的来源信息进行识别，确定音频数据的来源，响应于音频数据的来源为目标来源，确定终端设备处于目标工作场景，具体来说，可对音频数据携带的来源信息进行识别，其中，来源信息指示了音频数据所属的应用软件，若识别到音频数据所属的应用程序为目标应用程序，则确定终端设备处于目标工作场景。例如，若来源信息指示拼音数据所属的是影音娱乐的应用程序，不是通话类应用程序，例如，电话会议应用程序，则确定终端设备不属于目标工作场景，否则确定终端设备属于目标工作场景。

步骤103，在目标工作场景下，获取智能耳机的模式切换指令。

本申请实施例中，在目标工作场景下，智能耳机具有至少两种语音模式，至少两种语音模式可通过模式切换指令切换，目标工作场景，即为多个用户进行交流的场景，例如，电话会议场景，语音聊天场景等。

本申请实施例的一种实现方式中，在监测到终端设备处于目标工作场景下的情况下，可更改智能耳机的设定按键对应的功能模式，例如，设定按键A在非目标工作场景下，功能模式包括播放和暂停功能，而在目标工作模式下，功能模式切换为包括至少两种语音模式。从而，在目标工作模式下，响应于用户对智能耳机的设定按键的按压操作，可获取智能耳机的模式切换指令，模式切换指令用于将智能耳机切换至模式切换指令指示的语音模式。例如，智能耳机包含两种语音模式，即降噪模式和交流模式，在降噪模式下，外界声音会被降噪处理，即降噪处理后，外界声音小于设定音量；在交流模式下，外界声音不会被降噪处理，而是可以维持原来的声音或者是放大原来的声音，以使得外界声音大于设定音量。若监测到用户按压设定按键，则确定监测到用户按压设定按键前智能耳机所处的语音模式，若智能耳机处于降噪模式，则响应按键的操作，生成交流模式切换指令，同理，若智能耳机处于交流模式，则响应对按键的操作，生成降噪模式切换指令。

本申请实施例的另一种实现方式中，在监测到终端设备处于目标工作场景下的情况下，可通过获取到的语音识别对应的模式切换指令，以更改智能耳机对应的功能模式，具体来说，可对获取到的语音信号进行识别，以识别得到语音信号中包含的关键词，基于关键词确定对应的模式切换指令，其中，模式切换指令用于将智能耳机切换至模式切换指令指示的语音模式。其中，关于智能耳机的语音模式可参照前一种实现方式中的说明，此处不再赘述。

步骤104，根据模式切换指令，控制智能耳机在至少两个语音模式间切换。

进而，根据模式切换指令，控制智能耳机在至少两个语音模式间切换，实现了在佩戴智能耳机的情况下，即可在至少两个语音模式间切换，提高了语音模式切换的效率，增加了用户使用智能耳机的便利性。

本实施例中以两个语音模式即降噪模式和交流模式为例进行说明，在一种场景下，智能耳机处于降噪模式，也就是说使用智能耳机的用户通过客户端程序进行语音通话，则根据模式切换指令，切换至交流模式，在交流模式下，语音通话的声音会降低至小于设定音量，以使得用户在佩戴智能耳机的情况下，也不会因为终端上设备中播放的音频数据的声音影响外界声音的获取；在另一种场景下，智能耳机处于交流模式，则检测到模式切换指令后，智能耳机会从交流模式切换至降噪模式，在降噪模式下，外界声音会被降噪处理，使得用户听到的外界声音音量小于设定音量。通过在目标工作场景下，控制智能耳机在两种模式的切换可以帮助用户在使用智能耳机的过程中，不需要频繁的摘下或带上智能耳机即可顺畅的沟通和开会，提高了智能耳机使用的便利性。

本申请实施例的智能耳机的控制方法中，获取终端设备上播放的音频数据，对音频数据进行识别，以确定终端设备处于目标工作场景，目标工作场景下智能耳机的麦克风处于语音采集状态，在目标工作场景下，获取智能耳机的模式切换指令，根据模式切换指令，控制智能耳机在至少两个语音模式间切换，通过在目标工作场景下，控制智能耳机在至少两种模式间切换可以帮助用户在使用智能耳机的时候，不需要频繁的摘下或带上智能耳机，提高了智能耳机使用的便利性。

基于上一实施例，图2为本申请实施例提供的另一种智能耳机的控制方法的流程示意图，本实施例中，以语音模式包含降噪模式和交流模式为例进行说明，具体说明了智能耳机切换至降噪模式后，智能耳机对获取到的环境语音数据进行降噪处理，以避免人声数据对目标模式的影响，如图2所示，该方法包含以下步骤：

步骤201，获取终端设备上播放的音频数据。

步骤202，对音频数据进行识别，以确定终端设备处于目标工作场景。

其中，目标工作场景下智能耳机的麦克风处于语音采集状态。

步骤203，在目标工作场景下，获取智能耳机的模式切换指令。

步骤204，根据模式切换指令，控制智能耳机在至少两个语音模式间切换。

其中，步骤201至步骤204，可参照前述实施例中的解释说明，原理相同，此处不再赘述。

步骤205，响应于控制智能耳机切换至降噪模式，获取终端设备上播放的音频数据。

需要说明的是，步骤205至步骤208，在步骤204之后执行仅为一种示例，也就是说，步骤205至步骤208的执行时序不进行限定。

本申请实施例中，响应于根据模式切换指令控制智能耳机切换至降噪模式，获取终端设备上播放的音频数据，音频数据是其它终端设备采集的语音数据，其它终端设备的用户和该终端设备均处于目标工作场景下，该语音数据中包含人的声音数据，为了便于区别，称为第一用户的声音数据。

例如，目标工作场景为电话会议场景，在电话会议场景下，有3个用户参加电话会议，分别为用户1、用户2和用户3，其中，用户1为终端设备对应的用户，用户2和用户3则对应其它终端设备，则获取到的终端设备上播放的音频数据则包括两个第一用户的声音数据，即用户2和用户3的声音数据。

步骤206，对音频数据进行识别，以识别得到音频数据包括的第一用户的声音数据。

本申请实施例的一种实现方式中，对音频数据进行识别，以识别到音频数据中不同人声对应的声音频段，由于不同人的声音频率不同，因此，可识别出不同人的声音对应的不同声音频段或者说是不同的声音的频谱特征，即可识别得到音频数据包括的第一用户的声音数据，其中，识别得到的第一用户的声音数据可以为一个或多个，与目标工作场景下，参与的人数有关，参与的人数多，识别到的第一用户的声音数据则多。

本申请实施例的另一种实现方式中，可基于训练得到的语音识别模型，对音频数据进行音色等特征识别，以识别得到音频数据中包含的第一用户的声音数据。

例如，在一种电话会议场景下，有3个用户参加电话会议，则获取到的音频数据进行识别得到的音频数据包括两个第一用户的声音数据，可称为第一用户A的声音数据和第一用户B的声音数据。

步骤207，获取智能耳机上的麦克风采集的第一环境语音数据。

本申请实施例中，智能耳机上的麦克风处于启动状态，可实时采集环境语音数据，为了便于和其它模式下采集的环境语音数据进行区分，称为第一环境语音数据，并发送給智能耳机。

步骤208，根据第一用户的声音数据，对第一环境语音数据进行降噪处理。

本申请实施例中，可对第一环境语音数据进行识别，以识别得到第一环境语音数据中包含的人的声音数据，其中，对第一环境语音数据的识别，以得到人的声音数据的方法可参照前述步骤中的解释说明，原理相同，此处不再赘述。

作为一种实现方式，根据第一用户的声音数据的声音频段，将第一环境语音数据中不属于第一用户的声音数据的声音频段的声音频段的音量降低或者是直接删除，以对第一环境语音数据进行降噪处理，以降低环境语音数据对终端设备上播放的语音数据的影响。

作为另一种实现方式，获取使用智能耳机的第二用户的声音数据，根据第一用户的声音数据和第二用户的声音数据，对第一环境语音数据中第一用户的声音数据和第二用户的声音数据以外的声音数据进行降噪处理，其中，降噪处理的降噪级别，可以根据需求进行设置，作为一种实现方式，可将降噪设置为最高，以实现将获取到的第一环境语音数据中第一用户的声音数据和第二用户的声音数据以外的声音数据滤除，以最大限度的提高目标工作场景下通话或交流的效果，实现了对第一环境语音数据中不属于第一用户和第二用户的其它的声音数据进行降噪处理，使得在目标工作场景下，智能耳机在使用降噪模式时可以滤除环境中的声音数据，使得目标工作模式下第二用户听到的终端设备播放的音频数据更加纯净，提高了目标工作场景下的语音效果。

本申请实施例的智能耳机的控制方法中，响应于控制智能耳机切换至降噪模式，获取终端设备上播放的音频数据，对音频数据进行识别，以识别得到音频数据包括的第一用户的声音数据，获取智能耳机上的麦克风采集的环境语音数据，根据第一用户的声音数据，对环境语音数据进行降噪处理，以降低环境语音数据对终端设备上播放的语音数据的影响，提高了智能耳机使用的便利性。

基于上一实施例，图3为本申请实施例提供的另一种智能耳机的控制方法的流程示意图，本实施例中，以语音模式包含降噪模式和交流模式为例进行说明，具体说明了智能耳机切换至交流模式后，智能耳机如何获取环境语音数据中使用智能耳机的第二用户外的第三用户的声音数据，实现在不摘取智能耳机的情况下进行交流。如图3所示，该方法包含以下步骤：

步骤301，获取终端设备上播放的音频数据。

步骤302，对音频数据进行识别，以确定终端设备处于目标工作场景。

步骤303，在目标工作场景下，获取智能耳机的模式切换指令。

步骤304，根据模式切换指令，控制智能耳机在至少两个语音模式间切换。

其中，步骤301至步骤304，可参照前述实施例中的解释说明，原理相同，此处不再赘述。

步骤305，响应于根据模式切换指令控制智能耳机切换至交流模式，获取使用智能耳机的第二用户的第一声音方位。

需要说明的是，步骤305至步骤307，在步骤304之后执行仅为一种示例，对于步骤305至步骤307还可以在步骤304之前执行，也就是说步骤305至步骤307的执行时序，本实施例中不进行限定。

本申请实施例中，智能耳机在交流模式下时，使用智能耳机的第二用户会和周围的用户进行沟通交流。作为一种实现方式，在切换至交流模式的情况下，可通过智能耳机向使用智能耳机的第二用户发出语音提示，提示第二用户说出设定语句，从而确定采集第二用户说设定语句时对应的第一声音方位。作为另一种实现方式，在切换至交流模式的情况下，可获取智能耳机存储的使用智能耳机的第二用户的第一声音方位，由于第二用户在使用智能耳机时智能耳机的佩戴方式通常是固定的，从而智能耳机采集第二用户的声音数据的第一声音方位也是固定的，因此可从智能耳机的存储单元中获取第二用户的第一声音方位。

步骤306，控制麦克风在第二用户的第一声音方位以外的第二声音方位上采集环境中第三用户的声音数据。

其中，第三用户可以为环境中发出声音的用户，可以为和第二用户交流的用户，或者是未和第二用户交流，但是在说话的其它用户。其中，第二声音方位即为环境中第三用户发出声音的方位。

本申请实施例的一种实现方式中，麦克风为麦克风阵列，控制麦克风阵列中用于采集第二用户的第一声音方位的第一麦克风停止采集第二用户的声音数据，控制麦克风阵列中第一麦克风以外的第二麦克风在第二用户的第一声音方位以外的第二声音方位上采集环境中第三用户的声音数据，使得麦克风采集的声音数据中不包含使用第二用户的声音数据，提高了在交流模式下，声音采集的准确性。

可选的，若环境中第一声音方位以外的声音方位存在多个，可将声音强度最大的方位作为第二声音方位。

步骤307，采用智能耳机播放第三用户的声音数据。

本申请实施例中，将麦克风采集的第三用户的声音数据发送給智能耳机，智能耳机对第三用户的声音数据放大后，播放第三用户的声音数据，提高了第三用户的声音数据的音量大小，提高了第二用户获取交流用户的声音数据的可靠性，使得第二用户不需要摘下耳机也可以清楚的听清楚交流的第三用户的声音，提高了交流的效果。

进一步，响应于控制智能耳机切换至交流模式，关闭降噪模式，并且禁止麦克风和终端设备间进行数据传输，而禁止麦克风和终端设备间进行数据传输可以由智能耳机执行或者由终端设备执行，下面分别说明。

本申请实施例的一种实现方式中，响应于控制智能耳机切换至交流模式，关闭降噪模式，以避免对麦克风采集的环境语音数据进行降噪处理。

同时，为了避免对智能耳机所处的目标工作场景的干扰，在使用耳机的第二用户与周围的第三用户交流的过程中，禁止麦克风和终端设备间进行数据传输，也就是说禁止麦克风将采集的第三用户的声音数据发送至终端设备，从而避免终端设备将第三用户的声音数据在目标工作场景下播放，目标工作场景例如为电话会议场景，也就是避免参加电话会议的其它客户听到第二用户和第三用户的交流声音。

本申请实施例的另一种实现方式中，在根据模式切换指令将智能耳机切换至交流模式的情况下，可提示用户在终端设备的交互界面中触发禁止指令，以使得终端设备将禁止指令通过蓝牙发送至智能耳机，智能耳机根据获取到的终端设备发送的禁止指令，禁止麦克风和终端设备间进行数据传输，具体可以是禁止传输第三用户的声音数据，实现了避免将第二用户与周围的第三用户交流的语音内容传输至终端设备，从而避免终端设备将交流的语音内容在目标工作场景下播放，目标工作场景例如为电话会议场景，也就是避免参加电话会议的其它客户听到第二用户和第三用户的交流的语音内容。

本申请实施例中，响应于控制智能耳机切换至交流模式，获取使用智能耳机的第二用户的声音方位，控制麦克风在第二用户的声音方位以外的声音方位上采集第三用户的声音数据，采用智能耳机播放第三用户的声音数据，通过不采集使用智能耳机的第二用户的声音数据，而是采集和第二用户交流的第三用户的声音数据，以使得用户不摘下智能耳机也可以顺畅的和周围用户进行交流，提高了在佩戴智能耳机的情况下交流的可靠性。

基于上一实施例，图4为本申请实施例提供的另一种智能耳机的控制方法的流程示意图，具体说明了智能耳机切换至交流模式后，智能耳机如何获取环境语音数据中使用智能耳机的第二用户外的第三用户的声音数据，实现在不摘取智能耳机的情况下进行交流。如图4所示，该方法包含以下步骤：

步骤401，获取终端设备上播放的音频数据。

步骤402，对音频数据进行识别，以确定终端设备处于目标工作场景。

步骤403，在目标工作场景下，获取智能耳机的模式切换指令。

步骤404，根据模式切换指令，控制智能耳机在至少两个语音模式间切换。

其中，步骤401至步骤404，可参照前述实施例中的解释说明，原理相同，此处不再赘述。

步骤405，响应于控制智能耳机切换至交流模式，获取智能耳机上的麦克风采集的第二环境语音数据。

需要说明的是，步骤405至步骤407，在步骤404之后执行仅为一种示例，对于步骤405至407步骤的执行时序，本实施例中不进行限定。

其中，智能耳机上的麦克风采集的第二环境语音数据，和前述实施例中的第一环境语音数据的内容可以相同也可以不同，仅为区分不同模式下采集的的环境语音数据，可参照前述实施例中的第一环境语音数据的解释说明，此处不在赘述。

步骤406，根据使用智能耳机的第二用户的声音数据，确定第二环境语音数据中的第三用户的声音数据。

其中，第三用户和第二用户为不同的用户，在电话会议场景下，第三用户是和第二用户交流的用户。

步骤407，采用智能耳机播放第三用户的声音数据。

本申请实施例中，对第二用户的声音数据进行识别，以识别得到第二用户的声音数据的声音频段或音色特征信息，根据第二用户的声音数据的声音频段或音色特征信息，识别第二环境语音数据中包含的第二用户的声音数据，从而第二环境语音数据中第二用户的声音数据以外的声音数据即为第三用户的声音数据，进而，将第三用户的声音数据通过智能耳机播放，以提高第三用户的声音大小，可选定的，可将第三用户的声音数据中不属于人声的噪音数据滤除并放大后通过智能耳机播放，确保佩戴智能耳机的第二用户可以清晰的获取到第三用户的声音。

需要说明的是，第三用户的声音数据，可以为一个用户的声音数据，也可以为多个用户的声音数据。

其中，对第二用户的声音数据进行识别的方法可参照前前述实施例中的解释说明，原理相同，此处不再赘述。

同时，为了避免对智能耳机所处的目标工作场景的干扰，在使用耳机的第二用户与周围的第三用户交流的过程中，禁止麦克风和终端设备间进行数据传输，也就是说禁止麦克风将采集的第二环境语音数据发送至终端设备，从而避免终端设备将包含第三用户的声音数据的第二环境语音数据在目标工作场景下播放，目标工作场景例如为电话会议场景，也就是避免参加电话会议的其它客户听到第二用户和第三用户的交流声音。

本申请实施例的另一种实现方式中，在根据模式切换指令将智能耳机切换至交流模式的情况下，可提示用户在终端设备的交互界面中触发禁止指令，以使得终端设备将禁止指令通过蓝牙发送至智能耳机，智能耳机根据获取到的终端设备发送的禁止指令，禁止麦克风和终端设备间进行数据传输，具体可以是禁止传输麦克风采集的第二环境语音数据，实现了避免将第二用户与周围的第三用户交流的语音内容传输至终端设备，从而避免终端设备将交流的语音内容在目标工作场景下播放，目标工作场景例如为电话会议场景，也就是避免参加电话会议的其它客户听到第二用户和第三用户的交流的语音内容。

本申请实施例的智能耳机的控制方法中，响应于控制智能耳机切换至交流模式，获取智能耳机上的麦克风采集的第二环境语音数据，根据使用智能耳机的第二用户的声音数据，确定第二环境语音数据中的第三用户的声音数据，采用智能耳机播放第三用户的声音数据，通过确定环境语音数据中的第三用户的声音数据并播放第三用户的声音数据，以使得第二用户不摘下智能耳机也可以顺畅的和周围的第三用户进行交流，提高了用户在佩戴智能耳机的情况下交流的可靠性，从而不需要在智能耳机的模式切换时，频繁的摘下或戴上智能耳机，增加了智能耳机使用的便利性。

为了实现上述实施例，本申请实施例还提出一种智能耳机的控制装置。

图5为本申请实施例提供的一种智能耳机的控制装置的结构示意图。

如图5所示，该装置可以包括：

获取模块51，用于获取所述终端设备上播放的音频数据。

第一确定模块52，用于对所述音频数据进行识别，以确定所述终端设备处于目标工作场景；所述目标工作场景下，所述智能耳机的麦克风处于语音采集状态。

所述获取模块51，还用于在所述目标工作场景下，获取所述智能耳机的模式切换指令。

控制模块53，用于根据所述模式切换指令，控制所述智能耳机在所述至少两个语音模式间切换。

进一步，在本申请实施例的一种实现方式中，至少两个语音模式包括降噪模式，该装置，还包括：识别模块和处理模块。

所述获取模块51，还用于响应于控制所述智能耳机切换至所述降噪模式，获取所述终端设备上播放的音频数据；

识别模块，用于对所述音频数据进行识别，以识别得到所述音频数据包括的第一人声数据；

所述获取模块51，还用于获取所述智能耳机上的麦克风采集的第一环境语音数据；

处理模块，用于根据所述第一人声数据，对所述第一环境语音数据进行降噪处理。

在本申请实施例的一种实现方式中，上述处理模块，具体用于：

获取使用所述智能耳机的第一目标用户的第二声音数据；

根据所述第一声音数据和所述第二声音数据，对所述第一环境语音数据中所述第一用户的声音数据和所述第二用户的声音数据以外的声音数据进行降噪处理。

在本申请实施例的一种实现方式中，至少两个语音模式包括交流模式，所述装置，还包括：第二确定模块和播放模块。

所述获取模块51，还用于响应于控制所述智能耳机切换至所述交流模式，获取所述智能耳机上的麦克风采集的第二环境语音数据；

第二确定模块，用于根据使用所述智能耳机的第二用户的声音数据，确定所述第二环境语音数据中的第三用户的声音数据；其中，所述第三用户和所述第二用户为不同的用户；

播放模块，用于采用所述智能耳机播放所述第三用户的声音数据。

在本申请实施例的一种实现方式中，至少两个语音模式包括交流模式，所述装置，还包括：

所述获取模块51，用于响应于控制所述智能耳机切换至所述交流模式，获取使用所述智能耳机的第二用户的第一声音方位；

采集模块，用于控制所述麦克风在所述第二用户的第一声音方位以外的第二声音方位上采集环境中的第三用户的声音数据；其中，所述第三用户和所述第二用户为不同的用户；

所述播放模块，还用于采用所述智能耳机播放所述第三用户的声音数据。

在本申请实施例的一种实现方式中，所述装置，还包括：

第一关闭模块，用于响应于控制所述智能耳机切换至所述交流模式，关闭所述降噪模式，且禁止所述麦克风和所述终端设备间进行数据传输。

在本申请实施例的一种实现方式中，所述装置，还包括：

第二关闭模块，用于响应于控制所述智能耳机切换至所述交流模式，关闭所述降噪模式；响应于获取到所述终端设备发送的禁止指令，根据所述禁止指令，禁止所述麦克风和所述终端设备间进行数据传输。

在本申请实施例的一种实现方式中，第一确定模块52，具体用于：

对所述音频数据进行识别，确定所述音频数据包括的语音频段；

响应于所述语音频段中包含第一目标语音频段，且不包含第二目标语音频段和第三目标语音频段，确定所述终端设备处于目标工作场景；其中，所述第一目标语音频段的频率下限大于所述第二目标语音频段的频率上限，且所述第一目标语音频段的频率上限小于所述第三目标语音频段的频率下限。

对所述音频数据携带的来源信息进行识别，确定所述音频数据的来源；

响应于所述音频数据的来源为目标来源，确定所述终端设备处于目标工作场景。

需要说明的是，前述对方法实施例的解释说明也适用于该实施例的装置，此处不再赘述。

本申请实施例的智能耳机的控制装置中，获取终端设备上播放的音频数据，对音频数据进行识别，以确定终端设备处于目标工作场景，目标工作场景下智能耳机的麦克风处于语音采集状态，在目标工作场景下，获取智能耳机的模式切换指令，根据模式切换指令，控制智能耳机在至少两个语音模式间切换，通过在目标工作场景下，控制智能耳机在至少两种模式间切换可以帮助用户在使用智能耳机的时候，不需要频繁的摘下或带上智能耳机，提高了智能耳机使用的便利性。

为了实现上述实施例，本申请还提出一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如前述方法实施例所述的方法。

为了实现上述实施例，本申请还提出一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时，实现如前述方法实施例所述的方法。

为了实现上述实施例，本申请还提出一种计算机程序产品，其上存储有计算机程序，所述计算机程序被处理器执行时实现如前述方法实施例所述的方法。

图6为本申请实施例提供的一种电子设备的框图。例如，电子设备800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图6，电子设备800可以包括以下一个或多个组件：处理组件802，存储器804，电力组件806，多媒体组件808，音频组件810，输入/输出(I/O)接口812，传感器组件814，以及通信组件816。

处理组件802通常控制电子设备800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件806为电子设备800的各种组件提供电力。电力组件806可以包括电源管理系统，一个或多个电源，及其他与为电子设备800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当电子设备800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为电子设备800提供各个方面的状态评估。例如，传感器组件814可以检测到电子设备800的打开/关闭状态，组件的相对定位，例如所述组件为电子设备800的显示器和小键盘，传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变，用户与电子设备800接触的存在或不存在，电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络，如WiFi，4G或5G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由电子设备800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

一种智能耳机的控制方法，其特征在于，包括：

获取所述终端设备上播放的音频数据；

对所述音频数据进行识别，以确定所述终端设备处于目标工作场景；所述目标工作场景下所述智能耳机的麦克风处于语音采集状态

在所述目标工作场景下，获取所述智能耳机的模式切换指令；

根据所述模式切换指令，控制所述智能耳机在所述至少两个语音模式间切换。
如权利要求1所述的方法，其特征在于，所述至少两个语音模式包括降噪模式，所述方法，还包括：

响应于控制所述智能耳机切换至所述降噪模式，获取所述终端设备上播放的音频数据；

对所述音频数据进行识别，以识别得到所述音频数据包括的第一用户的声音数据；

获取所述智能耳机上的麦克风采集的第一环境语音数据；

根据所述第一用户的声音数据，对所述第一环境语音数据进行降噪处理。
如权利要求2所述的方法，其特征在于，所述根据所述第一用户的声音数据，对所述第一环境语音数据进行降噪处理，包括：

获取使用所述智能耳机的第二用户的声音数据；

根据所述第一用户的声音数据和所述第二用户的声音数据，对所述第一环境语音数据中所述第一用户的声音数据和所述第二用户的声音数据以外的声音数据进行降噪处理。
如权利要求1所述的方法，其特征在于，所述至少两个语音模式包括交流模式，所述方法，还包括：

响应于控制所述智能耳机切换至所述交流模式，获取所述智能耳机上的麦克风采集的第二环境语音数据；

根据使用所述智能耳机的第二用户的声音数据，确定所述第二环境语音数据中的第三用户的声音数据；其中，所述第三用户和所述第二用户为不同的用户；

采用所述智能耳机播放所述第三用户的声音数据。
如权利要求1所述的方法，其特征在于，所述至少两个语音模式包括交流模式，所述方法，还包括：

响应于控制所述智能耳机切换至所述交流模式，获取使用所述智能耳机的第二用户的第一声音方位；

控制所述麦克风在所述第一声音方位以外的第二声音方位上采集环境中的第三用户的声音数据；其中，所述第三用户和所述第二用户为不同的用户；采用所述智能耳机播放所述第三用户的声音数据。
如权利要求4或5所述的方法，其特征在于，所述方法，还包括：

响应于控制所述智能耳机切换至所述交流模式，关闭所述降噪模式，且禁止所述麦克风和所述终端设备间进行数据传输。
如权利要求4或5所述的方法，其特征在于，所述方法，还包括：

响应于控制所述智能耳机切换至所述交流模式，关闭所述降噪模式；

响应于获取到所述终端设备发送的禁止指令，根据所述禁止指令，禁止所述麦克风和所述终端设备间进行数据传输。
如权利要求1所述的方法，其特征在于，所述对所述音频数据进行识别，以确定所述终端设备处于目标工作场景，包括：

对所述音频数据进行识别，确定所述音频数据包括的语音频段；

响应于所述语音频段中包含第一目标语音频段，且不包含第二目标语音频段和第三目标语音频段，确定所述终端设备处于目标工作场景；其中，所述第一目标语音频段的频率下限大于所述第二目标语音频段的频率上限，且所述第一目标语音频段的频率上限小于所述第三目标语音频段的频率下限。
如权利要求1所述的方法，其特征在于，所述对所述音频数据进行识别，以确定所述终端设备处于目标工作场景，包括：

对所述音频数据携带的来源信息进行识别，确定所述音频数据的来源；

响应于所述音频数据的来源为目标来源，确定所述终端设备处于目标工作场景。
一种智能耳机的控制装置，其特征在于，包括：

获取模块，用于获取所述终端设备上播放的音频数据；

第一确定模块，用于对所述音频数据进行识别，以确定所述终端设备处于目标工作场景；所述目标工作场景下，所述智能耳机的麦克风处于语音采集状态；

所述获取模块，还用于在所述目标工作场景下，获取所述智能耳机的模式切换指令；

控制模块，用于根据所述模式切换指令，控制所述智能耳机在所述至少两个语音模式间切换。
如权利要求10所述的装置，其特征在于，所述至少两个语音模式包括降噪模式，所述装置，还包括：

所述获取模块，还用于响应于控制所述智能耳机切换至所述降噪模式，获取所述终端设备上播放的音频数据；

识别模块，用于对所述音频数据进行识别，以识别得到所述音频数据包括的第一人声数据；

所述获取模块，还用于获取所述智能耳机上的麦克风采集的第一环境语音数据；

处理模块，用于根据所述第一人声数据，对所述第一环境语音数据进行降噪处理。
如权利要求11所述的装置，其特征在于，所述处理模块，具体用于：

获取使用所述智能耳机的第一目标用户的第二声音数据；

根据所述第一声音数据和所述第二声音数据，对所述第一环境语音数据中所述第一用户的声音数据和所述第二用户的声音数据以外的声音数据进行降噪处理。
如权利要求10所述的装置，其特征在于，所述至少两个语音模式包括交流模式，所述装置，还包括：

所述获取模块，还用于响应于控制所述智能耳机切换至所述交流模式，获取所述智能耳机上的麦克风采集的第二环境语音数据；

第二确定模块，用于根据使用所述智能耳机的第二用户的声音数据，确定所述第二环境语音数据中的第三用户的声音数据；其中，所述第三用户和所述第二用户为不同的用户；

播放模块，用于采用所述智能耳机播放所述第三用户的声音数据。
如权利要求10所述的装置，其特征在于，所述至少两个语音模式包括交流模式，所述装置，还包括：

所述获取模块，还用于响应于控制所述智能耳机切换至所述交流模式，获取使用所述智能耳机的第二用户的第一声音方位；

采集模块，用于控制所述麦克风在所述第二用户的第一声音方位以外的第二声音方位上采集环境中的第三用户的声音数据；其中，所述第三用户和所述第二用户为不同的用户；

所述播放模块，用于采用所述智能耳机播放所述第三用户的声音数据。
如权利要求13或14所述的装置，其特征在于，所述装置，还包括：

第一关闭模块，用于响应于控制所述智能耳机切换至所述交流模式，关闭所述降噪模式，且禁止所述麦克风和所述终端设备间进行数据传输。
如权利要求13或14所述的装置，其特征在于，所述装置，还包括：

第二关闭模块，用于响应于控制所述智能耳机切换至所述交流模式，关闭所述降噪模式；响应于获取到所述终端设备发送的禁止指令，根据所述禁止指令，禁止所述麦克风和所述终端设备间进行数据传输。
如权利要求10所述的装置，其特征在于，所述第一确定模块，具体用于：

对所述音频数据进行识别，确定所述音频数据包括的语音频段；

响应于所述语音频段中包含第一目标语音频段，且不包含第二目标语音频段和第三目标语音频段，确定所述终端设备处于目标工作场景；其中，所述第一目标语音频段的频率下限大于所述第二目标语音频段的频率上限，且所述第一目标语音频段的频率上限小于所述第三目标语音频段的频率下限。
如权利要求10所述的装置，其特征在于，所述第一确定模块，具体用于：

对所述音频数据携带的来源信息进行识别，确定所述音频数据的来源；

响应于所述音频数据的来源为目标来源，确定所述终端设备处于目标工作场景。
一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如权利要求1-9中任一所述的方法。
一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-9中任一所述的方法。