WO2020078300A1

WO2020078300A1 - 一种终端投屏的控制方法和终端

Info

Publication number: WO2020078300A1
Application number: PCT/CN2019/110926
Authority: WO
Inventors: 夏少华
Original assignee: 华为技术有限公司
Priority date: 2018-10-16
Filing date: 2019-10-14
Publication date: 2020-04-23
Also published as: CN109448709A; US20210398527A1

Abstract

一种终端（500）投屏的控制方法和终端，用于提高在终端（500）连接大屏幕场景下的应用程序处理效率。一种终端（500）投屏的控制方法，该方法应用于终端（500），终端（500）与显示设备连接，方法包括：终端（500）采集第一语音数据（201）；终端（500）对第一语音数据进行语音识别处理（202）；终端（500）根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容（203）。

Description

一种终端投屏的控制方法和终端

本申请要求于2018年10月16日提交中国国家知识产权局，申请号为CN201811204521.3、发明名称为“一种终端投屏的控制方法和终端”的中国专利申请，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域，尤其涉及一种终端投屏的控制方法和终端。

背景技术

目前移动终端已经广泛应用，用户经常会遇到一些场景，例如想把移动终端里的照片、视频、文档等内容分享给身边的朋友。现有技术常用的方式是打开移动终端上的小屏幕来分享给别的用户，从用户体验上讲，移动终端这块“小屏幕”绝对不能令人满意。

现有技术中出现了采用移动终端投屏的方式，即为移动终端连接一个大屏幕，用户可以操作移动终端的应用程序，通过移动终端连接大屏幕来显示用户的操作内容，从而实现基于大屏幕的内容分享。

现有技术中，需要用户手持终端，或者为终端外接鼠标、键盘来对应用程序进行控制。由于现有技术中需要用户手动的控制终端在大屏幕上显示应用程序，因此无法解放用户的双手，降低了在终端连接大屏幕场景下的应用程序处理效率。

发明内容

本申请实施例提供了一种终端投屏的控制方法和终端，用于提高在终端连接大屏幕场景下的应用程序处理效率。

为解决上述技术问题，本申请实施例提供以下技术方案：

第一方面，本申请实施例提供一种终端投屏的控制方法，所述方法应用于终端，所述终端与显示设备连接，所述方法包括：所述终端采集第一语音数据；所述终端对所述第一语音数据进行语音识别处理；所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。

在本申请实施例中，终端与显示设备连接，该终端采集第一语音数据，然后终端对第一语音数据进行语音识别处理，生成语音识别处理的结果，接下来终端根据语音识别处理的结果控制终端的应用程序，最后终端在显示设备上显示应用程序的控制过程。本申请实施例中用户可以通过语音交流的方式，直接向终端下达语音的命令，终端就可以采集用户发出的第一语音数据，终端可以根据语音识别处理的结果控制应用程序，从而应用程序的执行过程可以在终端设备连接的显示设备上显示控制过程，不需要用户来手动的操作终端，因此提高了在终端连接大屏幕场景下的应用程序处理效率。

在第一方面的一种可能实现中，所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容，包括：所述终端识别出与所述语音识别处理的结果对应的应用程序接口；所述终端通过所述应用程序接口控制应用程序，并在所述显示设备上显示相关内容。其中，终端根据语音识别处理的结果来识别用户需要控制的应用程序，例如终端识别出与语音识别处理的结果对应的应用程序接口，不同的应用程序配置有不同的应用程序接口，终端在识别出应用程序接口之后，终端通过应用程序接口就可以确定出用户需要控制的应用程序。

在第一方面的一种可能实现中，所述终端识别出与所述语音识别处理的结果对应的应用程序接口，包括：所述终端对所述语音识别处理的结果进行语义解析，生成语义解析结果；所述终端从所述语义解析结果中提取出指令；所述终端根据所述指令识别出所述应用程序接口。其中，终端生成的语音识别处理的结果可以是文本信息，终端对该文本信息进行语义解析，生成语义解析结果，终端从语义解析结果中提取出指令，例如终端根据预置的指令格式生成指令，最后终端根据所提取出的指令来识别出应用程序接口。本申请实施例中，终端中可以配置语义解析功能，即终端可以学习与理解一段文本所表示的语义内容，最终转换成机器能识别的命令和参数。

在第一方面的一种可能实现中，所述终端识别出与所述语音识别处理的结果对应的应用程序接口，包括：所述终端将所述语音识别处理的结果发送给云端服务器，由所述云端服务器对所述语音识别处理的结果进行语义解析；所述终端接收所述云端服务器进行语义解析后反馈的解析结果；所述终端根据所述解析结果识别出所述应用程序接口。其中，终端生成的语音识别处理的结果可以是文本信息，终端与云端服务器建立有通信连接，例如终端可以将文本信息发送给云端服务器，由云端服务器对文本信息进行语义解析，云端服务器在语义解析完成之后生成指令，云端服务器发送指令，终端可以接收云端服务器进行语义解析后反馈的解析结果，最后终端根据所提取出的指令来识别出应用程序接口。

在第一方面的一种可能实现中，所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后，所述方法还包括：所述终端获取所述应用程序的反馈结果；所述终端将所述反馈结果转换成第二语音数据，并播放所述第二语音数据；或者，所述终端在所述显示设备上显示所述反馈结果。其中，终端在执行应用程序时，应用程序还可以生成反馈结果，该反馈结果可以指示应用程序成功响应用户的语音命令，也可以指示应用程序响应该语音命令失败。终端在获取到该反馈结果之后，终端可以将反馈结果转换成第二语音数据，并播放第二语音数据，例如终端内配置有播放器，终端可以通过该播放器播放第二语音数据，从而用户可以听到该第二语音数据。终端除了使用语音的方式播放反馈结果对应的第二语音数据之外，终端还可以在显示设备上显示反馈结果，使得用户可以从终端连接显示设备上确定出语音命令执行成功或者失败。

在第一方面的一种可能实现中，所述终端采集第一语音数据，包括:所述终端通过免唤醒词的方式调起语音助手，由所述语音助手对所述第一语音数据进行语音采集。其中，终端中可以配置语音助手，通过该语音助手可以进行语音采集，为了提高语音采集的效率，终端可以使用免唤醒词的方式来调起语音助手，免唤醒词是相对于语音助手而言的，不需要先打开语音助手这个应用，用户可以直接对着终端说某句话，终端就可以自动的调起语音助手，并执行语音命令。

第二方面，本申请实施例提供一种终端，所述终端与显示设备连接，所述终端包括：语音采集器、处理器；所述处理器和所述语音采集器之间进行相互的通信；所述语音采集器，用于采集第一语音数据；所述处理器，用于对所述第一语音数据进行语音识别处理；根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。

在第二方面的一种可能实现中，所述处理器，还用于识别出与所述语音识别处理的结果对应的应用程序接口；通过所述应用程序接口控制所述应用程序，并在所述显示设备上显示相关内容。

在第二方面的一种可能实现中，所述处理器，还用于通过所述应用程序接口调用管理服务功能模块；通过所述管理服务功能模块对所述应用程序进行控制。

在第二方面的一种可能实现中，所述处理器，还用于对所述语音识别处理的结果进行语义解析，生成语义解析结果；从所述语义解析结果中提取出指令；根据所述指令识别出所述应用程序接口。

在第二方面的一种可能实现中，所述处理器，还用于将所述语音识别处理的结果发送给云端服务器，由所述云端服务器对所述语音识别处理的结果进行语义解析；接收所述云端服务器进行语义解析后反馈的解析结果；根据所述解析结果识别出所述应用程序接口。

在第二方面的一种可能实现中，所述终端还包括：播放器，所述播放器和所述处理器相连接；所述处理器，还用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后，获取所述应用程序的反馈结果；将所述反馈结果转换成第二语音数据，控制所述播放器播放所述第二语音数据；或者，控制所述显示设备显示所述反馈结果。

在第二方面的一种可能实现中，所述处理器，还用于通过免唤醒词的方式调起语音助手；所述语音采集器，用于在所述语音助手的控制下对所述第一语音数据进行语音采集。

在本申请的第二方面中，终端的组成模块还可以执行前述第一方面以及各种可能的实现方式中所描述的步骤，详见前述对第一方面以及各种可能的实现方式中的说明。

第三方面，本申请实施例还提供一种终端，所述终端与显示设备连接，所述终端包括：

采集模块，用于采集第一语音数据；

语音识别模块，用于对所述第一语音数据进行语音识别处理；

显示模块，用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。

在第三方面的一种可能的实现方式中，所述显示模块，包括：接口识别单元，用于识别出与所述语音识别处理的结果对应的应用程序接口；控制单元，用于通过所述应用程序接口控制应用程序，并在所述显示设备上显示相关内容。

在第三方面的一种可能的实现方式中，所述接口识别单元，用于对所述语音识别处理的结果进行语义解析，生成语义解析结果；从所述语义解析结果中提取出指令；根据所述指令识别出所述应用程序接口。

在第三方面的一种可能的实现方式中，所述接口识别单元，用于将所述语音识别处理的结果发送给云端服务器，由所述云端服务器对所述语音识别处理的结果进行语义解析；接收所述云端服务器进行语义解析后反馈的解析结果；根据所述解析结果识别出所述应用程序接口。

在第三方面的一种可能的实现方式中，所述终端，还包括：获取模块和播放模块，其中，所述获取模块，用于所述显示模块在根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后，获取所述应用程序的反馈结果；所述播放模块，用于将所述反馈结果转换成第二语音数据，并播放所述第二语音数据；或者，所述显示模块，还用于在所述显示设备上显示所述反馈结果。

在第三方面的一种可能的实现方式中，所述采集模块，还用于通过免唤醒词的方式调起语音助手，由所述语音助手对所述第一语音数据进行语音采集。

第三方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的方法。

第四方面，本申请实施例提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面所述的方法。

第五方面，本申请实施例提供一种通信装置，该通信装置可以包括终端或者芯片等实体，所述通信装置包括：处理器、存储器；所述存储器用于存储指令；所述处理器用于执行所述存储器中的所述指令，使得所述通信装置执行如前述第一方面中任一项所述的方法。

第六方面，本申请提供了一种芯片系统，该芯片系统包括处理器，用于支持终端实现上述方面中所涉及的功能，例如，发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中，所述芯片系统还包括存储器，所述存储器，用于保存终端必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包括芯片和其他分立器件。

附图说明

图1为本申请实施例提供的一种终端投屏的控制方法应用的通信系统的组成结构示意图；

图2为本申请实施例提供的一种终端投屏的控制方法的流程方框示意图；

图3为本申请实施例提供的对文档应用程序进行终端投屏控制的实现架构示意图；

图4为本申请实施例提供的对文档应用程序进行语音控制的流程示意图；

图5为本申请实施例提供的一种终端的组成结构示意图；

图6-a为本申请实施例提供的另一种终端的组成结构示意图；

图6-b为本申请实施例提供的一种显示模块的组成结构示意图；

图6-c为本申请实施例提供的另一种终端的组成结构示意图；

图7为本申请实施例提供的另一种终端的组成结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

本申请实施例的技术方案可以应用于各种数据处理的通信系统，如图1所示，该通信系统中包括有终端，该终端与显示设备连接，该显示设备可以是一个用于显示的大屏幕，终端可以通过有线或者无线的方式连接该显示设备，例如终端通过高清晰度多媒体接口(high definition multimedia interface，HDMI)和显示设备连接，或者终端通过type-c接口和显示设备连接。其中，终端又称之为用户设备(user equipment，UE)、移动台(mobile station，MS)、移动终端(mobile terminal，MT)等，是一种向用户提供语音和/或数据连通性的设备，或，设置于该设备内的芯片，例如，具有无线连接功允许的手持式设备、车载设备等。目前，一些终端的举例为：手机(mobile phone)、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device，MID)、可穿戴设备，虚拟现实(virtual reality，VR)设备、增强现实(augmented reality，AR)设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。本申请实施例提供的终端只需要连接一显示设备，就可以执行本申请实施例提供的终端投屏的控制方法。

本申请实施例提出终端投屏的控制方法，该方法应用于终端，该终端与显示设备连接，请参阅图2所示，为本申请实施例提供的终端投屏的控制方法，主要包括如下步骤：

201、终端采集第一语音数据。

在本申请实施例中，用户可以通过终端来操作应用程序，应用程序的类型不做限定，例如该应用程序可以是文档应用程序，也可以是游戏应用程序，或者音视频应用程序等。在该终端连接显示设备上显示该应用程序，当用户需要操作该应用程序时采用语音控制的方式，即用户发出语音命令，终端中内置有语音采集器，终端通过该语音采集器来采集用户发出的语音命令。例如终端在一段时间内采集到第一语音数据。后续实施例中以对第一语音数据的终端投屏控制过程为例说明，终端采集到的其它语音数据，也可以按照该第一语音数据的处理过程进行终端投屏控制，此处仅作说明。

在本申请的一些实施例中，步骤201终端采集第一语音数据，包括:

终端通过免唤醒词的方式调起语音助手，由语音助手对第一语音数据进行语音采集。

其中，终端中可以配置语音助手，通过该语音助手可以进行语音采集，为了提高语音采集的效率，终端可以使用免唤醒词的方式来调起语音助手，免唤醒词是相对于语音助手而言的，不需要先打开语音助手这个应用，用户可以直接对着终端说某句话，终端就可以自动的调起语音助手，并执行语音命令。

202、终端对第一语音数据进行语音识别处理。

在本申请实施例中，终端在采集到第一语音数据之后，终端对该第一语音数据进行语音识别处理，以识别出该第一语音数据对应的文本信息，终端生成的语音识别处理的结果可以包括该文本信息。

本申请实施例中，终端可以通过自然语音理解(natural language understanding，NLU)工具对第一语音数据进行语音识别处理，其中，语音识别是指让机器通过识别和理解过程把第一语音数据转变为相应的文本信息的过程，终端生成的语音识别处理的结果可以用于控制终端的应用程序。

203、终端根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容。

在本申请实施例中，终端在对第一语音数据进行语音识别处理之后，终端可以使用该语音识别处理的结果进行应用程序的控制，终端可以直接以该语音识别处理的结果作为命令来控制应用程序，终端也可以获取语音识别处理的结果对应的指令，根据该指令来控制应用程序。其中，对应用程序进行控制的方式取决于终端生成的语音识别处理的结果。以应用程序为文档应用程序为例，若用户发出打开文档A的语音命令，则终端可以控制文档应用程序打开该文档A。

在本申请的一些实施例中，步骤203终端根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容，包括：

终端识别出与语音识别处理的结果对应的应用程序接口；

终端通过应用程序接口控制应用程序，并在显示设备上显示相关内容。

其中，终端根据语音识别处理的结果来识别用户需要控制的应用程序。例如终端识别出与语音识别处理的结果对应的应用程序接口，不同的应用程序配置有不同的应用程序接口，终端在识别出应用程序接口之后，终端通过应用程序接口就可以确定出用户需要控制的应用程序。在实际应用中，终端中可以设置管理服务功能模块，通过管理服务功能模块对所述应用程序进行控制，例如该管理服务功能模块具体可以是个人电脑(personal computer，PC)管理服务模块，通过PC管理服务模块来识别出应用程序接口，通过应用程序接口来控制用户需要控制的应用程序。

进一步的，在本申请的一些实施例中，终端识别出与语音识别处理的结果对应的应用程序接口，包括：

终端对语音识别处理的结果进行语义解析，生成语义解析结果；

终端从语义解析结果中提取出指令；

终端根据指令识别出应用程序接口。

其中，终端生成的语音识别处理的结果可以是文本信息，终端对该文本信息进行语义解析，生成语义解析结果，终端从语义解析结果中提取出指令，例如终端根据预置的指令格式生成指令，最后终端根据所提取出的指令来识别出应用程序接口。本申请实施例中，终端中可以配置语义解析功能，即终端可以学习与理解一段文本所表示的语义内容，最终转换成机器能识别的命令和参数。

在本申请的另一些实施例中，终端识别出与语音识别处理的结果对应的应用程序接口，包括：

终端将语音识别处理的结果发送给云端服务器，由云端服务器对语音识别处理的结果进行语义解析；

终端接收云端服务器进行语义解析后反馈的解析结果；

终端根据解析结果识别出应用程序接口

其中，终端生成的语音识别处理的结果可以是文本信息，终端与云端服务器建立有通信连接，例如终端可以将文本信息发送给云端服务器，由云端服务器对文本信息进行语义解析，云端服务器在语义解析完成之后生成指令，云端服务器发送指令，终端可以接收云端服务器进行语义解析后反馈的解析结果，最后终端根据所提取出的指令来识别出应用程序接口。

在本申请实施例中，根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容，终端在控制应用程序时，终端生成与第一语音数据关联的内容，基于该相关内容在终端连接的显示设备上显示应用程序的控制过程，由于用户使用语音来下发应用程序的语音命令，因此用户不需要手持终端进行触摸操作，也不需要使用鼠标键盘来操作应用程序，提高了在终端连接大屏幕场景下的应用程序处理效率。

在本申请的一些实施例中，步骤203终端根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容之后，本申请实施例提供的终端投屏的控制方法除了执行前述步骤之外，终端还可以执行如下步骤：

终端获取应用程序的反馈结果；

终端将反馈结果转换成第二语音数据，并播放第二语音数据；或者，

终端在显示设备上显示反馈结果。

其中，终端在执行应用程序时，应用程序还可以生成反馈结果，该反馈结果可以指示应用程序成功响应用户的语音命令，也可以指示应用程序响应该语音命令失败。举说明如下，以应用程序为文档应用程序为例，若用户发出打开文档A的语音命令，则终端可以控制文档应用程序打开该文档A，文档应用程序可以根据文档A的执行情况生成反馈结果，该反馈结果可以是文档A打开成功或者打开失败。终端在获取到该反馈结果之后，终端可以将反馈结果转换成第二语音数据，并播放第二语音数据，例如终端内配置有播放器，终端可以通过该播放器播放第二语音数据，从而用户可以听到该第二语音数据。终端除了使用语音的方式播放反馈结果对应的第二语音数据之外，终端还可以在显示设备上显示反馈结果，使得用户可以从终端连接显示设备上确定出语音命令执行成功或者失败。

在本申请的一些实施例中，应用程序还可以只在执行失败的情况下生成反馈结果，并向用户提示执行失败，而在执行成功的情况下应用程序可以不生成反馈结果，从而减少了终端对用户的打扰。

通过前述实施例对本申请的举例说明可知，终端与显示设备连接，该终端采集第一语音数据，然后终端对第一语音数据进行语音识别处理，生成语音识别处理的结果，接下来终端根据语音识别处理的结果控制终端的应用程序，最后终端在显示设备上显示应用程序的控制过程。本申请实施例中用户可以通过语音交流的方式，直接向终端下达语音的命令，终端就可以采集用户发出的第一语音数据，终端可以根据语音识别处理的结果控制应用程序，从而应用程序的执行过程可以在终端设备连接显示设备上显示控制过程，不需要用户来手动的操作终端，因此提高了在终端连接大屏幕场景下的应用程序处理效率。

为便于更好的理解和实施本申请实施例的上述方案，下面举例相应的应用场景来进行具体说明。

本申请实施例提供的终端投屏的控制方法中，终端连接有一个大屏幕(简称为大屏)。终端首先进行语音识别，用户发出指令后终端把采集到用户的声音转换成文本，然后终端发送文本给云端服务器，由云端服务器进行语义解析，即云端服务器将识别到的文本进行解析，转换成机器能识别的指令和参数。终端最后进行命令的执行，即终端可以根据指令和参数，在大屏上执行识别后的各种命令。其中，在大屏上执行各种命令是指用户感觉是在大屏上操作应用程序，但实际执行中，应用程序还是运行在终端上，只是将这终端的控制过程投射到大屏上，而且大屏上显示的东西与终端不一样，即终端执行的是异源模式。

如图3所示，为本申请实施例提供的对文档应用程序进行终端投屏控制的实现架构示意图。以应用程序为文档应用程序、终端为手机为例，该文档应用程序可以是WPS文档，也可以是DOC文档。在一种实际应用场景中，讲师在进行文档(例如PPT)讲解，使用手机进行投屏，并且手机处于异源模式，如果讲师离手机较远，那么按照现有技术中采用鼠标点击的方式是无法控制大屏上的应用程序。本申请实施例中，讲师可以通过语音的方式来控制文档应用程序。

采用本申请实施例的操作流程如下：

步骤1、讲师可以向手机发出事先训练好的“免唤醒词”命令调起语音助手，比如通过对手机发送“小艺小艺”的语音，就可以调起语音助手并进入聆听状态。

步骤2、讲师说“打开WPS”。

语音助手会录音，剩下的过程由语音控制模块执行，语音助手的作用就是将采集的用户语音数据转化成文本。

例如，语音助手接收到命令之后，会把录音数据发给NLU模块，对语音进行识别，成为文本信息。然后语音助手会把文本信息发给云端服务器的语义解析模块，例如语音助手发送命令语料给云端服务器，云端服务器解析文本，云端服务器解析出文本后，形成手机能识别的指令和参数，发送命令语义给语音助手。然后语音助手发给手机。手机执行对应的命令，WPS被打开，手机连接显示器或者电视上显示手机投射过去文档应用程序的操作过程。接下来手机向语音助手发送命令的反馈。最后语音助手播报反馈给讲师。

接下来，讲师可以继续说下面的命令，进行一次完整的PPT讲解。例如，讲师可以发出如下语音命令：“打开第二个文档”、“播放”、“下一页”、“上一页”、“退出”、“关闭”。当然，讲师还可以说“最大化”、“最小化”、“全屏”等，对WPS或者其它应用的窗口进行相应控制。

接下来对本申请实施例提供的系统架构进行说明，以Android系统为例。该系统架构由如下典型模块组成：

首先对语音助手进行说明，该语音助手可以接收用户语音输入，然后通过NLU进行语音识别成文本，再发给云端服务器进行语义识别。云端服务器识别后通过手机上的语音助手发给手机的PC管理服务模块(例如PC Service)执行，PC Service是手机中新加的一个系统服务，是手机上的管理异源模式投射的服务端。语音助手还可以播报由PC Service发送执行的结果的反馈。

云端服务器解析文本，形成PC Service可以识别的命令和参数。

手机中的窗口管理系统对窗口大小进行控制，例如，窗口管理系统可以包括：动态管理服务模块(ActivityManagerService)，还可以包括窗口管理服务(WindowManagerService)模块，例如使用动态管理服务模块控制窗口大小，如最大化、最小化、全屏、关闭等。其中，ActivityManagerService和WindowManagerService都是手机上的android的应用、窗口管理模块。PC Service调用这两个服务的应用程序编程接口(application programming interface，API)对窗口进行控制。

接下来对管理服务的实现过程进行说明，PC Service、ActivityManagerService、WindowManagerService都在Android系统服务里，PC Service可以调用ActivityManagerService、WindowManagerService。PC Service对于所有命令进行映射，然后选择合适对象模块的接口运行。根据命令执行的结果，形成反馈发给语音助手。举例说明如下，窗口最大化、最小化，这些是ActivityManagerService、WindowManagerService能做的，那么PC Service就调用它们的API。但是打开WPS中的第N个文档，那就需要PC Service和WPS模块进行合作，PC Service给WPS模块发命令，然后它们执行，执行完通知结果。

最后说明本申请实施例中的应用程序，该应用程序可以是文档应用程序(例如WPS应用程序)，或者游戏应用程序，或者音视频应用程序等。

如图4所示，为本申请实施例提供的对文档应用程序进行语音控制的流程示意图。用户在使用一段时间大屏时，可能需要解放双手，期望通过语音交流的方式，本申请实施例中用户可以直接向手机下达命令，在大屏上执行指令，必要的时候进行适当的反馈。比如说：用户要打开一个PPT文档进行浏览，浏览后关闭。用户可以手机发送一系列命令。手机中的语音助手将语音命令转换成文本，然后发给云端服务器，云端服务器在进行语义解析后生成格式化的命令和参数，然后发送给手机的PC管理服务模块，然后PC管理服务模块将命令和参数发送给手机的窗口管理系统，窗口管理系统对文档等应用程序进行最大化、最小化等控制，窗口管理系统还可以生成执行结果发送给PC管理服务模块，PC管理服务模块发送执行结果给语音助手，由语音助手进行播报反馈。

例如，该命令可以在手机上打开语音助手，手机通过免唤醒词打开语音助手，并自动进入聆听状态。例如用户需要在大屏上打开办公应用，用户发出如下语音命令：打开WPS，则手机在大屏上打开WPS，进入文档列表。例如用户需要打开文档列表某个PPT文档，用户发出如下语音命令：打开第二个文档，则手机打开列表上第二个PPT。例如用户需要播放PPT，用户发出如下语音命令：播放，则手机大屏上的PPT进入播放状态。例如用户需要进入下一页，用户发出如下语音命令：下一页，则手机将PPT翻到下一页。例如用户需要回看上一页，用户发出如下的语音命令：上一页，则手机将PPT翻到上一页。例如用户需要结束播放，用户发出如下的语音命令：退出，则手机将PPT返回到未播放状态。例如用户需要关闭PPT，用户发出如下的语音命令：关闭WPS，则手机将WPS应用关闭。

通过本申请实施例提供的终端投屏的控制方法，可以通过语音控制大屏进行移动办公。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

为便于更好的实施本申请实施例的上述方案，下面还提供用于实施上述方案的相关装置。

请参阅如图5所示，为本申请实施例中终端的组成结构示意图，所述终端与显示设备连接，终端500可以包括：语音采集器501、处理器502；所述处理器502和所述语音采集器501之间进行相互的通信；

所述语音采集器501，用于采集第一语音数据；

所述处理器502，用于对所述第一语音数据进行语音识别处理；根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。

在本申请的一些实施例中，所述处理器502，还用于识别出与所述语音识别处理的结果对应的应用程序接口；通过所述应用程序接口控制所述应用程序，并在所述显示设备上显示相关内容。

在本申请的一些实施例中，所述处理器502，还用于通过所述应用程序接口调用管理服务功能模块；通过所述管理服务功能模块对所述应用程序进行控制。

在本申请的一些实施例中，所述处理器502，还用于对所述语音识别处理的结果进行语义解析，生成语义解析结果；从所述语义解析结果中提取出指令；根据所述指令识别出所述应用程序接口。

在本申请的一些实施例中，所述处理器502，还用于将所述语音识别处理的结果发送给云端服务器，由所述云端服务器对所述语音识别处理的结果进行语义解析；接收所述云端服务器进行语义解析后反馈的解析结果；根据所述解析结果识别出所述应用程序接口。

在本申请的一些实施例中，如图5所示，所述终端500还包括：播放器503，所述播放器503和所述处理器502相连接；

所述处理器502，还用于在所述显示设备上显示所述应用程序的控制过程之后，获取所述应用程序的反馈结果；将所述反馈结果转换成第二语音数据，控制所述播放器503播放所述第二语音数据；或者，控制所述显示设备显示所述反馈结果。

在本申请的一些实施例中，所述处理器502，还用于通过免唤醒词的方式调起语音助手；

所述语音采集器501，用于在所述语音助手的控制下对所述第一语音数据进行语音采集。

在本申请实施例中，终端与显示设备连接，该终端采集第一语音数据，然后终端对第一语音数据进行语音识别处理，生成语音识别处理的结果，接下来终端根据语音识别处理的结果控制终端的应用程序，最后终端在显示设备上显示应用程序的控制过程。本申请实施例中用户可以通过语音交流的方式，直接向终端下达语音的命令，终端就可以采集用户发出的第一语音数据，终端可以根据语音识别处理的结果控制应用程序，从而应用程序的执行过程可以在终端设备连接显示设备上显示控制过程，不需要用户来手动的操作终端，因此提高了在终端连接大屏幕场景下的应用程序处理效率。

如图6-a所示，本申请实施例还提供一种终端600，所述终端600与显示设备连接，所述终端600包括：

采集模块601，用于采集第一语音数据；

语音识别模块602，用于对所述第一语音数据进行语音识别处理；

显示模块603，用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。

在本申请的一些实施例中，如图6-b所示，所述显示模块603，包括：

接口识别单元6031，用于识别出与所述语音识别处理的结果对应的应用程序接口；

控制单元6032，用于通过所述应用程序接口控制所述应用程序，并在所述显示设备上显示相关内容。

在本申请的一些实施例中，所述接口识别单元6031，用于对所述语音识别处理的结果进行语义解析，生成语义解析结果；从所述语义解析结果中提取出指令；根据所述指令识别出所述应用程序接口。

在本申请的一些实施例中，所述接口识别单元6031，用于将所述语音识别处理的结果发送给云端服务器，由所述云端服务器对所述语音识别处理的结果进行语义解析；接收所述云端服务器进行语义解析后反馈的解析结果；根据所述解析结果识别出所述应用程序接口。

在本申请的一些实施例中，如图6-c所示，所述终端600，还包括：获取模块604和播放模块605，其中，

所述获取模块604，用于所述显示模块603在所述显示设备上显示所述应用程序的控制过程之后，获取所述应用程序的反馈结果；

所述播放模块605，用于将所述反馈结果转换成第二语音数据，并播放所述第二语音数据；或者，

所述显示模块603，还用于在所述显示设备上显示所述反馈结果。

需要说明的是，上述装置各模块/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其带来的技术效果与本申请方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储有程序，该程序执行包括上述方法实施例中记载的部分或全部步骤。

如图7所示，为本申请实施例的又一种终端的结构示意图，该终端可以包括：处理器131(例如CPU)、存储器132、发送器134和接收器133；发送器134和接收器133耦合至处理器131，处理器131控制发送器134的发送动作和接收器133的接收动作。存储器132可能包含高速RAM存储器，也可能还包括非易失性存储器NVM，例如至少一个磁盘存储器，存储器132中可以存储各种指令，以用于完成各种处理功能以及实现本申请实施例的方法步骤。可选的，本申请实施例涉及的终端还可以包括：电源135、通信总线136以及通信端口137中的一个或多个。接收器133和发送器134可以集成在终端的收发器中，也可以为终端上分别独立的收、发天线。通信总线136用于实现元件之间的通信连接。上述通信端口137用于实现终端与其他外设之间进行连接通信。

在本申请实施例中，上述存储器132用于存储计算机可执行程序代码，程序代码包括指令；当处理器131执行指令时，指令使处理器131执行上述方法实施例中终端的处理动作，使发送器134执行上述方法实施例中终端的发送动作，其实现原理和技术效果类似，在此不再赘述。

在另一种可能的设计中，当该终端为芯片时，芯片包括：处理单元和通信单元，所述处理单元例如可以是处理器，所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令，以使该终端内的芯片执行上述第一方面任意一项的无线通信方法。可选地，所述存储单元为所述芯片内的存储单元，如寄存器、缓存等，所述存储单元还可以是所述终端内的位于所述芯片外部的存储单元，如只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

其中，上述任一处提到的处理器，可以是一个通用中央处理器(CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制上述第一方面无线通信方法的程序执行的集成电路。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

Claims

一种终端投屏的控制方法，其特征在于，所述方法应用于终端，所述终端与显示设备连接，所述方法包括：

所述终端采集第一语音数据；

所述终端对所述第一语音数据进行语音识别处理；

所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
根据权利要求1所述的方法，其特征在于，所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容，包括：

所述终端识别出与所述语音识别处理的结果对应的应用程序接口；

所述终端通过所述应用程序接口控制应用程序，并在所述显示设备上显示相关内容。
根据权利要求2所述的方法，其特征在于，所述终端识别出与所述语音识别处理的结果对应的应用程序接口，包括：

所述终端对所述语音识别处理的结果进行语义解析，生成语义解析结果；

所述终端根据所述语义解析结果识别出所述应用程序接口。
根据权利要求2所述的方法，其特征在于，所述终端识别出与所述语音识别处理的结果对应的应用程序接口，包括：

所述终端将所述语音识别处理的结果发送给云端服务器，由所述云端服务器对所述语音识别处理的结果进行语义解析；

所述终端接收所述云端服务器进行语义解析后反馈的解析结果；

所述终端根据所述解析结果识别出所述应用程序接口。
根据权利要求1至4中任一项所述的方法，其特征在于，所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后，所述方法还包括：

所述终端获取所述应用程序的反馈结果；

所述终端将所述反馈结果转换成第二语音数据，并播放所述第二语音数据；或者，

所述终端在所述显示设备上显示所述反馈结果。
根据权利要求1至5中任一项所述的方法，其特征在于，所述终端采集第一语音数据，包括:

所述终端通过免唤醒词的方式调起语音助手，由所述语音助手对所述第一语音数据进行语音采集。
一种终端，其特征在于，所述终端与显示设备连接，所述终端包括：语音采集器、处理器；所述处理器和所述语音采集器之间进行相互的通信；

所述语音采集器，用于采集第一语音数据；

所述处理器，用于对所述第一语音数据进行语音识别处理；根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
根据权利要求7所述的终端，其特征在于，所述处理器，还用于识别出与所述语音识别处理的结果对应的应用程序接口；通过所述应用程序接口控制所述应用程序，并在所述显示设备上显示相关内容。
根据权利要求8所述的终端，其特征在于，所述处理器，还用于通过所述应用程序接口调用管理服务功能模块；通过所述管理服务功能模块对所述应用程序进行控制。
根据权利要求8或9所述的终端，其特征在于，所述处理器，还用于对所述语音识别处理的结果进行语义解析，生成语义解析结果；根据所述语义解析结果识别出所述应用程序接口。
根据权利要求8或9所述的终端，其特征在于，所述处理器，还用于将所述语音识别处理的结果发送给云端服务器，由所述云端服务器对所述语音识别处理的结果进行语义解析；接收所述云端服务器进行语义解析后反馈的解析结果；根据所述解析结果识别出所述应用程序接口。
根据权利要求7至11中任一项所述的终端，其特征在于，所述终端还包括：播放器，所述播放器和所述处理器相连接；

所述处理器，还用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后，获取所述应用程序的反馈结果；将所述反馈结果转换成第二语音数据，控制所述播放器播放所述第二语音数据；或者，控制所述显示设备显示所述反馈结果。
根据权利要求7至12中任一项所述的终端，其特征在于，所述处理器，还用于通过免唤醒词的方式调起语音助手；

所述语音采集器，用于在所述语音助手的控制下对所述第一语音数据进行语音采集。
一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1-6任意一项所述的方法。
一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行如权利要求1-6任意一项所述的方法。