CN114863906B

CN114863906B - 一种文本转语音处理的别名标记方法及装置

Info

Publication number: CN114863906B
Application number: CN202210791135.9A
Authority: CN
Inventors: 刘丹; 汤跃忠; 田野; 杨静波; 陈龙
Original assignee: Third Research Institute Of China Electronics Technology Group Corp; Beijing Zhongdian Huisheng Technology Co ltd
Current assignee: Third Research Institute Of China Electronics Technology Group Corp; Beijing Zhongdian Huisheng Technology Co ltd
Priority date: 2022-07-07
Filing date: 2022-07-07
Publication date: 2022-10-28
Anticipated expiration: 2042-07-07
Also published as: CN114863906A

Abstract

本发明公开了一种文本转语音处理的别名标记方法及装置，包括：提供多个标记菜单项，每一个标记菜单项具有一类功能的标记工具，且多个标记菜单项至少包括用于别名标记的第一菜单项；在选中第一目标文本后，基于第一菜单项为第一目标文本添加别名信息，且别名信息以文本形式与第一目标文本进行关联呈现；在别名信息不符合要求的情况下，从别名信息对应的文本中选取第二目标文本，并基于选择的标记菜单项为第二目标文本添加标记信息。本发明实施例的别名标记方法，通过将添加的别名信息以文本形式与第一目标文本进行关联呈现，由此可以进一步对别名信息进行二次修正，提高了别名标记的可用性和易用性，提高了文本合成语音的准确率。

Description

一种文本转语音处理的别名标记方法及装置

技术领域

本发明涉及语音转录技术领域，尤其涉及一种文本转语音处理的别名标记方法及装置。

背景技术

在文本合成语音音频软件中，可通过添加文本读音和韵律标记提高合成语音的准确率和自然度。

当原文本的部分内容与期望合成的语音发音内容不一致（口语、方言、通假字、缩略语等），同时又需要保留原文本不变的情况下，用户需要以标记的形式将期望的发音文字替换语音合成的内容。如果将发音替换文本直接在原文本上进行修改，容易造成文章中出现错别字或语意不通等情况，破坏合成文本的可读性、降低易懂度，降低语音合成效率，不利于原文本的保留追溯和二次语音合成使用。

现有技术中没有便于用户使用的别名添加方式，例如若通过标记的形式来添加别名，标记作为一个整体图形符号，显示标记的内容或类型，可以点击进行内容修改或删除，但该种方式不可对内容再次进行韵律或发音修正。

发明内容

本发明实施例提供一种文本转语音处理的别名标记方法及装置，用以提出一种别名添加方法，并且用户可以进一步对别名进行修正，解决了对文本标记的再处理问题。

本发明实施例提供一种文本转语音处理的别名标记方法，包括：

提供多个标记菜单项，每一个标记菜单项具有一类功能的标记工具，且多个标记菜单项至少包括用于别名标记的第一菜单项；

在选中第一目标文本后，基于所述第一菜单项为所述第一目标文本添加别名信息，且所述别名信息以文本形式与第一目标文本进行关联呈现；

在所述别名信息不符合要求的情况下，从所述别名信息对应的文本中选取第二目标文本，并基于选择的标记菜单项为所述第二目标文本添加标记信息。

可选的，在所述别名信息不符合要求的情况下，直接修改所述别名信息对应的文本，以实现修改所述别名信息。

可选的，在删除第一目标文本的情况下，同时删除关联的别名信息。

可选的，还包括：在文本转语音过程中，基于所述别名信息合成所需的音频。

可选的，所述别名信息对应的原文本不发音，且所述别名信息对应的原文本与所述别名信息同时显示。

可选的，为所述第一目标文本添加的别名信息与第一目标文本以不同的颜色呈现。

本发明实施例还提供一种文本转语音处理的别名标记装置，包括处理器和存储器，所述存储器存储有计算机程序，所述计算机程序被处理器执行时实现前述的文本转语音处理的别名标记方法的步骤。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现前述的文本转语音处理的别名标记方法的步骤。

本发明实施例的别名标记方法，通过将添加的别名信息以文本形式与第一目标文本进行关联呈现，由此可以进一步对别名信息进行二次修正，提高了别名标记的可用性和易用性，提高了文本合成语音的准确率。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本申请实施例的别名标记方法的基本流程图；

图2为本申请实施例的标记菜单项；

图3为本申请实施例别名添加示例；

图4为本申请实施例对添加的别名信息进行二次标记的示例。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请实施例的方案主要解决在添加别名的过程中，如果添加的别名在两个字以上，在替换后的文本中很容易出现机器合成语音韵律不自然的情况，而竞品软件的普遍标记设计方法均不能解决此问题。在保留标记图标的基础上，将别名的替换文本以文本形式加入原文本中，可以实现标记之内添加标记的功能。很好的解决了对文本标记的再处理问题。同时删除别名标记，可同时删除标记内的所有标记和内容。

具体的，本发明实施例提供一种文本转语音处理的别名标记方法，如图1所示，包括如下步骤：

在步骤S101中，提供多个标记菜单项，每一个标记菜单项具有一类功能的标记工具，且多个标记菜单项至少包括用于别名标记的第一菜单项。具体的参见图2所示，在一些示例中，多个标记菜单项至少包括：停顿标记、连读标记、多音字标记、局部音量标记、重读标记、别名标记。

在步骤S102中，在选中第一目标文本后，基于所述第一菜单项为所述第一目标文本添加别名信息，且所述别名信息以文本形式与第一目标文本进行关联呈现。如图3所示，文本段“在中国境外的期货交易和衍生品交易及相关活动”其中“中国”的别名信息为“中华人民共和国”，本示例中将别名信息“中华人民共和国”以文本形式与第一目标文本“中国”关联显示。

在步骤S103中，在所述别名信息不符合要求的情况下，从所述别名信息对应的文本中选取第二目标文本，并基于选择的标记菜单项为所述第二目标文本添加标记信息。在一些实施例中，所述别名信息对应的原文本不发音，且所述别名信息对应的原文本与所述别名信息同时显示。在一些实施例中，还包括：在文本转语音过程中，基于所述别名信息合成所需的音频。在语音合成过程中以别名信息“中华人民共和国”来合成所需的音频，而第一目标文本“中国”不发音。在一些示例中，在用户发现“中华人民共和国”存在发音或韵律问题的情况下，基于别名信息对应的文本添加标记，如图4所示，可以在别名信息的文本段“中华人民”添加停顿标记“无停顿”，来进一步改善语音合成的别名信息的韵律，提高语音合成的准确度。

在一些实施例中，在所述别名信息不符合要求的情况下，直接修改所述别名信息对应的文本，以实现修改所述别名信息。进一步参考前述示例，本申请中别名信息是以文本形式与第一目标文本进行关联呈现，若用户发现程序提供的别名信息与期望的别名信息不一致的情况下，可以手动修改别名信息对应的文本信息，由此进一步提高别名添加的效率。

在一些实施例中，在删除第一目标文本的情况下，同时删除关联的别名信息。在一些应用场景中，例如若用户删除了第一目标文本，则对应的别名信息也同时删除，由此避免了用户需要二次操作去删除别名信息，提高了别名添加的效率。

在一些实施例中，为所述第一目标文本添加的别名信息与第一目标文本以不同的颜色呈现。通过不同的颜色进行呈现，能够便于用户审阅所添加的别名信息。

本申请的方案在保留别名标记图标的基础上，将别名的替换文本以文本形式加入原文本中，可以实现标记之内二次添加新的标记的功能。很好的解决了对文本标记的再处理问题。同时删除别名标记，可同时删除标记内的所有标记和内容，极大提高了文本添加别名的效率。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端（可以是手机，计算机，服务器，空调器，或者网络设备等）执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种文本转语音处理的别名标记方法，其特征在于，包括：

在所述别名信息不符合要求的情况下，从所述别名信息对应的文本中选取第二目标文本，并基于选择的标记菜单项为所述第二目标文本添加标记信息；在所述别名信息不符合要求的情况下，直接修改所述别名信息对应的文本，以实现修改所述别名信息；

在文本转语音过程中，基于所述别名信息合成所需的音频；

所述别名信息对应的原文本不发音，且所述别名信息对应的原文本与所述别名信息同时显示。

2.如权利要求1所述的文本转语音处理的别名标记方法，其特征在于，在删除第一目标文本的情况下，同时删除关联的别名信息。

3.如权利要求1所述的文本转语音处理的别名标记方法，其特征在于，为所述第一目标文本添加的别名信息与第一目标文本以不同的颜色呈现。

4.一种文本转语音处理的别名标记装置，其特征在于，包括处理器和存储器，所述存储器存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的文本转语音处理的别名标记方法的步骤。

5.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的文本转语音处理的别名标记方法的步骤。