WO2013189430A2

WO2013189430A2 - 一种自动语音识别业务的实现方法、系统和媒体服务器

Info

Publication number: WO2013189430A2
Application number: PCT/CN2013/082219
Authority: WO
Inventors: 张伟; 程佳佳; 崔飞
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-01-28
Filing date: 2013-08-23
Publication date: 2013-12-27
Also published as: CN103151041A; CN103151041B; WO2013189430A3

Abstract

本发明公开了一种ASR业务的实现方法，包括：媒体服务器收到APP服务器的访问请求后，确定自身支持的音频编解码类型集；媒体服务器收到APP服务器发送的ASR业务请求后，根据ASR业务类型向ASR服务器申请ASR业务资源；媒体服务器根据所述音频编解码类型集与ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给ASR服务器。本发明还同时公开了一种ASR业务的实现系统和媒体服务器，本发明可解决媒体服务器与终端协商的音频编解码能力无法满足ASR服务器时，ASR服务器无法访问媒体业务数据包数据的问题，保证ASR业务的实现。

Description

一种自动语音识别业务的实现方法、系统和媒体服务器技术领域

本发明涉及通信领域中的自动语音识别（ASR )技术，尤其涉及一种 ASR业务的实现方法、系统和媒体服务器。背景技术

媒体服务器（ Media Server, MS )是软交换体系中提供专用媒体资源功能的独立设备，也是分组网络中的重要设备，提供基本、增强业务中的媒体处理功能，并配置为所有与音视频相关的媒体处理操作，所述媒体处理操作包括：视频和音频实时传输协议（RTP )的数据与视、音频文件的相互转换。同时，媒体服务器也配置为接收用户通过终端双音多频（DTMF )的输入、播放业务的引导语音以及显示动态的引导画面。媒体服务器具有的会话初始协议（SIP )和 MSML/MOML协议能力，使得媒体服务器能在应用服务器（APP Server ) 的控制下完成整个会话过程，实现与用户的交互。

媒体控制模块（ MSCU )是媒体服务器中的一个重要模块，主要配置为与其他实体进行能力协商，提供资源本身的管理、维护，以及控制其他业务资源模块执行复杂的业务。

媒体存储传输音频模块（ MSTU )是媒体服务器中的业务资源模块，配置为存储海量的音频数据，并实现音频文件的播放功能。媒体存储传输音频模块上设置有对外网口，可以直接通过所述对外网口收发音频数据。

现有技术中，媒体服务器的应用范围很广，主要可以归纳为音视频播放、收号和会议等功能。

ASR功能是对输入的音频信息进行识别，转化为文字，并将文字信息通过消息上 4艮给用户。目前，在电信领域中， ASR应用通常是通过专门配置的 ASR服务器来实现的，通过信令指定 ASR服务器将文字发送到用户端，如发送到用户的终端来完成一次 ASR业务。

图 1为现有技术中实现 ASR业务的系统结构示意图，如图 1所示，该系统包括：终端 11、 APP服务器 12、媒体服务器 13和 ASR服务器 14。基于图 1所述系统的方法实现流程包括如下步驟：

步驟 101 : 终端 11发起一次呼叫，触发 APP服务器 12以激活 APP业务；

步驟 102: APP服务器 12通过 SIP信令向媒体服务器 13请求 ASR业务；

步驟 103: 媒体服务器 13通过 SIP信令向 ASR服务器 14请求 ASR资源，并通过媒体资源控制协议（MRCP )控制 ASR服务器 14执行相应业务；步驟 104: 终端 11向 ASR服务器 14发送媒体业务数据包，并且 ASR 服务器 14将识别出的文本信息上报给媒体服务器 13。

以上便是目前典型的 ASR业务组网结构图和业务实现流程。其中， ASR 服务器为媒体服务器的外置装置。 APP服务器在请求 ASR业务时只是向媒体服务器发起请求，媒体服务器判断当前业务类型，当业务类型为 ASR应用时，媒体服务器再向 ASR服务器发起请求，申请资源，并控制 ASR服务器的行为， ASR服务器在收到信令后等待媒体信息的输入，并自动将媒体信息识别成文字，通过 MRCP发送给媒体服务器。

但是，随着业务应用的扩展，上述现有实现方法存在一定缺陷，比如： ASR服务器的音频能力集与终端的音频能力集不匹配，将导致 ASR业务失败。因为 APP服务器在同媒体服务器进行会话描述协议 ( SDP )协商时，媒体服务器并不知道当前的业务类型是否为 ASR, 所以会按照自身的能力范围同终端协商音频参数。当 APP服务器向媒体服务器下发信息（INFO ) 指令时，媒体服务器才能识别出 ASR业务类型，此时，媒体服务器通过终端 SDP信息向 ASR服务器申请资源。但是，如果 ASR服务器的音频编解码能力范围与媒体服务器同终端协商的结果不相同时，比如：媒体服务器同终端协商的音频编解码类型为 AMR格式，但 ASR服务器只支持 G711 的音频格式时，将导致 ASR服务器访问媒体业务数据包的数据失败，最终导致 ASR业务失败。发明内容

有鉴于此，本发明实施例的主要目的在于提供一种 ASR业务的实现方法、系统和媒体服务器，可解决媒体服务器与终端协商的音频编解码能力无法满足 ASR服务器时， ASR服务器无法访问媒体业务数据包数据的问题，保证 ASR业务的实现。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供了一种自动语音识别 ASR业务的实现方法，该方法包括：

媒体服务器收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；

媒体服务器收到 APP服务器发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；

媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器。

其中，所述媒体服务器与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器，为：

媒体服务器中的媒体控制模块 MSCU向 ASR服务器发送会话初始协议 SIP信令进行协商，并指定媒体服务器与 ASR服务器匹配的音频编解码类型；

媒体服务器中的语音中心交互模块 MRU接收终端所发的媒体业务数据包，并将所述媒体业务数据包按所述协商的音频编解码类型进行转码，并将转码后的媒体业务数据包发送到媒体服务器中的媒体存储传输音频模块 MSTU;

MSCU控制 MSTU将转码后的媒体业务数据包发送至 ASR服务器。其中，所述媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商得到音频编解码类型，为：

媒体服务器向 ASR服务器发送 SIP信令， ASR服务器收到 SIP信令后，判断自身支持的音频编解码类型是否存在于媒体服务器支持的音频编解码能力集中，如果存在匹配的音频编解码类型，则通知媒体服务器，双方指定所述匹配的音频编解码类型作为后续对媒体业务数据包进行转码的音频编解码类型；如果不存在匹配的音频编解码类型，则结束当前 ASR业务流程。

上述方案中，所述媒体服务器收到 APP服务器的访问请求之后，该方法还包括：

终端向 APP服务器发送媒体业务数据包请求； APP服务器根据所述媒体业务数据包请求向媒体服务器发送访问请求的信令，之后媒体服务器指定自身与终端进行交互的地址。

其中，所述媒体服务器对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器，为：

媒体服务器中的 MSCU通知 MSTU打开 NAT通道；

媒体服务器中的 MSCU向 MRU下发转码命令；

媒体服务器中的 MSCU同 ASR服务器建立链接，并通知 ASR服务器等待音频输入，并进行音频识别；媒体服务器中的 MRU将终端所发的媒体业务数据包中的数据进行转码，并将转码后的媒体业务数据包通过 MRU内口发送到 MSTU的接收端口；

媒体服务器中的 MSTU对转码后的媒体业务数据包进行 NAT, 并发送到 ASR服务器。

本发明实施例还提供了一种 ASR业务的实现系统，该系统包括：媒体服务器、 APP服务器和 ASR服务器；其中，

所述媒体服务器，配置为收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；收到 APP服务器发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器；所述 APP服务器，配置为向媒体服务器发送访问请求和 ASR业务请求；

所述 ASR服务器，配置为与媒体服务器进行协商，并接收媒体服务器所发的转码后的媒体业务数据包。

优选地，该系统还包括终端，配置为媒体服务器收到 APP服务器的访问请求之后，向 APP服务器发送媒体业务数据包请求；相应的，

所述 APP服务器，还配置为根据所述媒体业务数据包请求向媒体服务器发送访问请求的信令；

所述媒体服务器，还配置为收到所述访问请求的信令后，指定自身与终端进行交互的地址。

其中，所述媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器，为：媒体服务器中的 MSCU向 ASR服务器发送 SIP信令进行协商，并指定媒体服务器与 ASR服务器匹配的音频编解码类型；

媒体服务器中的 MRU接收终端所发的媒体业务数据包，并将所述媒体业务数据包按所述协商的音频编解码类型进行转码，并将转码后的媒体业务数据包发送到媒体服务器中的 MSTU;

MSCU控制 MSTU将转码后的媒体业务数据包发送至 ASR服务器。优选地，所述媒体服务器还包括： MSCU、 MRU和 MSTU; 其中，所述 MSCU, 配置为向 ASR服务器发送 SIP信令进行协商，并指定媒体服务器与 ASR服务器匹配的音频编解码类型；控制 MSTU发送转码后的媒体业务数据包；

所述 MRU, 配置为接收终端所发的媒体业务数据包，并将所述媒体业务数据包按所述协商的音频编解码类型进行转码，并将转码后的媒体业务数据包发送到媒体服务器中的 MSTU;

所述 MSTU, 配置为在 MSCU的控制下将转码后的媒体业务数据包发送至 ASR服务器。

本发明实施例还提供了一种媒体服务器，所述媒体服务器，配置为收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；收到 APP服务器发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器。

本发明实施例提供的 ASR业务的实现方法、系统和媒体服务器，媒体服务器收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；媒体服务器收到 APP服务器发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器。本发明实施例通过媒体服务器与 ASR服务器的协商，可确定两者匹配的音频编解码类型，通过协商所得的音频编解码类型进行编码后的媒体业务数据包被发送到 ASR服务器。在所述协商过程中，媒体服务器不是以终端支持的音频编解码类型作为协商所依据的音频编解码能力集，而以媒体服务器支持的所有音频编解码类型作为协商所依据的音频编解码能力集。因此，本发明实施例可解决媒体服务器的音频编解码能力集无法满足 ASR服务器时， ASR服务器访问媒体业务数据包失败的问题，进而达到了提高 ASR服务器访问媒体业务数据包成功率的效果，可保证 ASR业务的实现。附图说明

图 1为现有技术中实现 ASR业务的系统结构示意图；

图 2为本发明实施例 ASR业务实施例的实现方法流程示意图；图 3为本发明实施例媒体服务器与 ASR服务器进行协商，媒体服务器通过协商的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器的方法实施例的实现流程示意图；

图 4为本发明实施例实现 ASR业务的系统结构示意图；

图 5为本发明实施例所述媒体服务器实施例的结构示意图。具体实施方式

本发明的实施例中：媒体服务器收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；媒体服务器收到 APP服务器发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器。

下面结合附图及具体实施例对本发明作进一步详细说明。

图 2为本发明实施例 ASR业务实施例的实现方法流程示意图，如图 2 所示，包括如下步驟：

步驟 201: 媒体服务器收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；

具体为： APP服务器向媒体服务器发送邀请 ( INVITE )信令进行媒体协商，媒体服务器从自身支持的音频编解码能力集中选定与终端相同的音频编解码类型集，用于与终端进行媒体业务数据包的有效传输。该步驟可采用现有技术实现，此处不再详述。

在一个实施例中，该步驟中所述媒体服务器收到 APP服务器的访问请求之后，该方法还包括：终端向 APP服务器发送媒体业务数据包请求； APP 服务器根据所述媒体业务数据包请求向媒体服务器发送访问请求的信令，之后媒体服务器指定自身与终端进行交互的地址。所述交互地址为： MSTU 的外口地址。

步驟 202: 媒体服务器收到 APP服务器发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；

具体为： APP服务器向媒体服务器发送 INFO指令，媒体服务器根据所述 INFO指令确定 APP服务器向自身申请的业务类型为 ASR, 之后根据 ASR业务类型向 ASR服务器申请 ASR业务资源。

步驟 203: 媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器；

具体的，媒体服务器中的 MSCU向 ASR服务器发送 SIP信令进行协商并指定媒体服务器与 ASR服务器匹配的音频编解码类型；媒体服务器中的 MRU接收终端所发的媒体业务数据包，并将所述媒体业务数据包按所述协商的音频编解码类型进行转码，并将转码后的媒体业务数据包发送到媒体服务器中的 MSTU; MSCU控制 MSTU将转码后的媒体业务数据包发送至 ASR服务器。

在实际运行过程中，如图 3所示，步驟 203 中所述方法的实现可包括如下步驟：

步驟 301: 媒体服务器中的 MSCU向 ASR服务器发送 SIP信令，与 ASR服务器协商音频编解码类型；

这里，所述 SIP信令中携带媒体服务器支持的音频编解码能力集，即： SIP信令中携带媒体服务器中所述语音中心交互模块（MRU ) 支持的所有音频编解码类型。 ASR服务器收到 SIP信令后，判断自身支持的音频编解码类型是否存在于媒体服务器支持的音频编解码能力集中，如果存在匹配的音频编解码类型，则通知媒体服务器，双方指定所述匹配的音频编解码类型作为后续对媒体业务数据包进行转码的音频编解码类型，这里，如果存在两种以上匹配的音频编解码类型，则从中人选一种作为后续对媒体业务数据包进行转码的音频编解码类型；如果不存在匹配的音频编解码类型，则结束当前 ASR业务流程。

本发明所述实施例中，媒体服务器不以终端支持的音频编解码类型作为协商所依据的音频编解码能力集，而以媒体服务器支持的所有音频编解码类型作为协商所依据的音频编解码能力集。

步驟 302:媒体服务器中的 MSCU通知 MSTU打开网络地址转换（ NAT ) 通道；

这里， MSCU向 MSTU下发打开 NAT通道的命令。

步驟 303: 媒体服务器中的 MSCU向 MRU下发转码命令；

具体的，媒体服务器中的 MSCU通知 MRU接收终端所发的媒体业务数据包，并指定 MRU同 ASR服务器相连的端口的音频编解码类型为步驟 301中已协商的音频编解码类型，并指定 MRU转码所依据的音频编解码类型为步驟 301中已协商的音频编解码类型。

步驟 304: 媒体服务器中的 MSCU 同 ASR服务器建立链接，并通知 ASR服务器等待音频输入，并进行音频识别；

这里， MSCU同 ASR服务器建立 TCP/IP链接， MSCU通过 MRCP向 ASR服务器发送 MRCP指令来通知 ASR服务器等待音频输入，并进行音频识别。

步驟 305: 媒体服务器中的 MRU将终端所发的媒体业务数据包中的数据进行转码，并将转码后的媒体业务数据包，也就是将音频媒体业务数据通过 MRU内口发送到 MSTU的接收端口；

步驟 306:媒体服务器中的 MSTU收到 MRU发送的转码后的媒体业务数据包后进行 NAT, 并发送到 ASR服务器。

在一个实施例中，所述步驟 203之后，该方法还包括： ASR服务器将收到的媒体业务数据包解析成文字，并通过 MRCP将所述文字发送到媒体服务器；媒体服务器向 APP服务器上报 INFO执行结果，同时， APP服务器向媒体服务器发送 BYE信令，以释放资源；媒体服务器向 ASR服务器请求释放资源，之后向 APP服务器返回结果， ASR业务结束。

本发明实施例还提供了一种 ASR业务的实现系统，如图 4所示，该系统包括：媒体服务器 43、 APP服务器 42和 ASR服务器 44; 其中，

所述媒体服务器 43, 配置为收到 APP服务器 42的访问请求后，确定自身支持的音频编解码类型集；收到 APP服务器 42发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器 44申请 ASR业务资源；根据所述音频编解码类型集与 ASR服务器 44进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器 44;

所述 APP服务器 42,配置为向媒体服务器 43发送访问请求和 ASR业务请求；

所述 ASR服务器 44, 配置为与媒体服务器 43进行协商，并接收媒体服务器 42所发的转码后的媒体业务数据包。

进一步地，该系统还包括终端 41 , 配置为媒体服务器 43收到 APP服务器 42的访问请求之后，向 APP服务器 42发送媒体业务数据包请求；相应的，

所述 APP服务器 42,还配置为根据所述媒体业务数据包请求向媒体服务器 43发送访问请求的信令；

所述媒体服务器 43 , 还配置为收到所述访问请求的信令后，指定自身与终端进行交互的地址。

其中，所述媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器，为：

媒体服务器中的 MSCU向 ASR服务器发送 SIP信令进行协商，并指定媒体服务器与 ASR服务器匹配的音频编解码类型；

MSCU控制 MSTU将转码后的媒体业务数据包发送至 ASR服务器。相应的，如图 5所示，所述媒体服务器 43还包括： MSCU 51、 MRU 52 和 MSTU 53; 其中，

所述 MSCU 51 , 配置为向 ASR服务器 44发送 SIP信令进行协商，并指定媒体服务器与 ASR服务器 44匹配的音频编解码类型；控制 MSTU 53 发送转码后的媒体业务数据包；

所述 MRU 52, 配置为接收终端所发的媒体业务数据包，并将所述媒体业务数据包按所述协商的音频编解码类型进行转码，并将转码后的媒体业务数据包发送到媒体服务器中的 MSTU 53;

所述 MSTU 53,配置为在 MSCU 51的控制下将转码后的媒体业务数据包发送至 ASR服务器 44。

本发明实施例还提供了一种媒体服务器，配置为收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；收到 APP服务器发送的 ASR 业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

权利要求书

1、一种自动语音识别 ASR业务的实现方法，该方法包括：

媒体服务器收到所述 APP服务器发送的 ASR业务请求后，根据 ASR 业务类型向 ASR服务器申请 ASR业务资源；

媒体服务器根据所述音频编解码类型集与所述 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给所述 ASR服务器。

2、根据权利要求 1所述的 ASR业务的实现方法，其中，所述媒体服务器与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器，为：媒体服务器中的媒体控制模块 MSCU向所述 ASR服务器发送会话初始协议 SIP信令进行协商，并指定媒体服务器与所述 ASR服务器匹配的音频编解码类型；

MSCU控制 MSTU将转码后的媒体业务数据包发送至所述 ASR服务器。

3、根据权利要求 1所述的 ASR业务的实现方法，其中，所述媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商得到音频编解码类型，为：

媒体服务器向 ASR服务器发送 SIP信令, ASR服务器收到 SIP信令后，判断自身支持的音频编解码类型是否存在于媒体服务器支持的音频编解码能力集中，如果存在匹配的音频编解码类型，则通知媒体服务器，双方指定所述匹配的音频编解码类型作为后续对媒体业务数据包进行转码的音频编解码类型；如果不存在匹配的音频编解码类型，则结束当前 ASR业务流程。

4、根据权利要求 1、 2或 3所述的 ASR业务的实现方法，其中，所述媒体服务器收到 APP服务器的访问请求之后，该方法还包括：

终端向所述 APP服务器发送媒体业务数据包请求；所述 APP服务器根据所述媒体业务数据包请求向媒体服务器发送访问请求的信令，之后媒体服务器指定自身与终端进行交互的地址。

5、根据权利要求 2所述的 ASR业务的实现方法，其中，所述媒体服务器对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR月良务器，为：

媒体服务器中的 MSCU通知 MSTU打开 NAT通道；

媒体服务器中的所述 MSCU向 MRU下发转码命令；

媒体服务器中的所述 MSCU同所述 ASR服务器建立链接，并通知所述

ASR服务器等待音频输入，并进行音频识别；

媒体服务器中的所述 MRU将终端所发的媒体业务数据包中的数据进行转码，并将转码后的媒体业务数据包通过所述 MRU 内口发送到所述

MSTU的接收端口；

6、一种 ASR业务的实现系统，该系统包括：媒体服务器、 APP服务器和 ASR服务器；其中，

7、根据权利要求 6所述的 ASR业务的实现系统，其中，该系统还包括终端，配置为媒体服务器收到 APP服务器的访问请求之后，向 APP服务器发送媒体业务数据包请求；

相应的，所述 APP服务器，还配置为根据所述媒体业务数据包请求向媒体服务器发送访问请求的信令；

8、根据权利要求 6或 7所述的 ASR业务的实现系统，其中，所述媒体服务器根据所述音频编解码类型集与 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给 ASR服务器，为：

媒体服务器中的 MSCU向所述 ASR服务器发送 SIP信令进行协商，并指定媒体服务器与所述 ASR服务器匹配的音频编解码类型；

MSCU控制 MSTU将转码后的媒体业务数据包发送至 ASR服务器。

9、根据权利要求 8所述的 ASR业务的实现系统，其中，所述媒体服务器还包括： MSCU、 MRU和 MSTU; 其中，

所述 MSCU, 配置为向 ASR服务器发送 SIP信令进行协商，并指定媒体服务器与 ASR服务器匹配的音频编解码类型；控制 MSTU发送转码后的媒体业务数据包；

所述 MSTU, 配置为在 MSCU的控制下将转码后的媒体业务数据包发送至所述 ASR服务器。

10、一种媒体服务器，所述媒体服务器，配置为收到 APP服务器的访问请求后，确定自身支持的音频编解码类型集；收到所述 APP服务器发送的 ASR业务请求后，根据 ASR业务类型向 ASR服务器申请 ASR业务资源；根据所述音频编解码类型集与所述 ASR服务器进行协商，通过协商所得的音频编解码类型对媒体业务数据包进行转码，并将转码后的媒体业务数据包发送给所述 ASR服务器。