JP3540984B2 - 音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体 - Google Patents
音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体 Download PDFInfo
- Publication number
- JP3540984B2 JP3540984B2 JP2000190466A JP2000190466A JP3540984B2 JP 3540984 B2 JP3540984 B2 JP 3540984B2 JP 2000190466 A JP2000190466 A JP 2000190466A JP 2000190466 A JP2000190466 A JP 2000190466A JP 3540984 B2 JP3540984 B2 JP 3540984B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- time
- translation
- start time
- end time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
【発明の属する技術分野】
この発明は、音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体に関し、特に、同時通訳において言語間に存在する語順の相違により生ずる無音区間を適切なポーズ時間に設定して原言語から翻訳された目的言語の合成音声の自然性を向上させるが如き、音声合成されるべき目的言語の文間の無音区間を適切なポーズ時間に設定して音声合成する音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体に関する。
【0002】
【従来の技術】
同時通訳音声が聞き手にとって、違和感なく自然で、内容が理解し易いものか否かを検証する方法およびこれを実施する装置は今のところ特に開発されていない。
同時通訳をした際に、意味のまとまりのある原言語の発話文を翻訳した翻訳音声が、長い無音区間により区切られていると、聞き手にとって違和感を感ずることがある。この現象は、原言語が1文発話された後に訳し始める逐次翻訳の場合に、原言語の1文が長いときに起こり得る。また、原言語が1文節発話される度毎に訳し始める漸進的翻訳の場合においても、例えば日英通訳の場合、日本語は英語とは語順が異なって、目的語が動詞に先行するところから、日本語で最後の動詞が発話されるまで、英語に翻訳することができず、発話タイミングが結局逐次翻訳と同等になる。この漸進的翻訳においても、日本語の目的語が長い場合に無音区間が長くなり、違和感を感ずることがある。この様な場合に、通訳者が人間であると、主語、目的語の最初の方の文節、或いは動詞に到る文脈から、動詞を予測して翻訳することがある。
【0003】
【発明が解決しようとする課題】
この発明は、同時通訳において言語間に存在する語順の相違により生ずる無音区間を適切なポーズ時間に設定して原言語から翻訳された目的言語の合成音声の自然性を向上させるが如き、音声合成されるべき目的言語の文間の無音区間を適切なポーズ時間に設定して音声合成する場合に使用される音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体を提供することを目的とするものである。
【0004】
【課題を解決するための手段】
請求項1:原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース11を具備し、原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース21を具備し、目的言語データベース21内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベース11から取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与する発話開始時刻付与部31を具備し、目的言語データベース21内の各翻訳文を発話開始時刻付与部31で得られた発話開始時刻に応答して動作せしめられる音声合成部51を具備する音声合成装置を構成した。
【0005】
そして、請求項2:原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース11を具備し、原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース21を具備し、目的言語データベース21内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベース11から取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与する発話開始時刻付与部31を具備し、目的言語データベース21内の各翻訳文の発話時間を算出し、当該発話時間と発話開始時刻付与部31で得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、当該翻訳文に付与する発話終了時刻付与部32を具備し、目的言語データベース21内の各翻訳文を、発話開始時刻付与部31或は発話終了時刻付与部32で得られた発話開始時刻に応答して動作せしめられる音声合成部51を具備する音声合成装置を構成した。
【0006】
また、請求項3:請求項2に記載される音声合成装置において、発話終了時刻付与部32は直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延する遅延処理部を有するものである音声合成装置を構成した。
更に、請求項4:原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース11を具備し、原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース21を具備し、目的言語データベース21内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベース11から取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与する発話開始時刻付与部31を具備し、目的言語データベース21内の各翻訳文の発話時間を算出し、当該発話時間と発話開始時刻付与部31で得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、当該翻訳文に付与する発話終了時刻付与部32を具備し、発話開始時刻付与部31と発話終了時刻付与部32で得られた時刻情報に基づいて目的言語データベース21内の各発話文間の無音区間の長さを算出し、その長さが或る値を超えている場合、後の翻訳文に対してその発話開始時刻および発話終了時刻をより前に修正した値を付与する修正発話時刻付与部41を具備し、目的言語データベース21内の各翻訳文を、発話開始時刻付与部31、発話終了時刻付与部32或いは修正発話時刻付与部41で得られた発話開始時刻に応答して動作せしめられる音声合成部51を具備する音声合成装置を構成した。
【0007】
また、請求項5:請求項4に記載される音声合成装置において、発話終了時刻付与部32は直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延する遅延処理部を有するものである音声合成装置を構成した。
ここで、請求項6:原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース11と原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース21を使用し、目的言語データベース21内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベース11から取得し当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与し、目的言語データベース21内の各翻訳文を得られた発話開始時刻から音声合成する音声合成方法を構成した。
【0008】
そして、請求項7:原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース11と原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース21を使用し、目的言語データベース21内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベース11から取得して当該発話終了時刻に或る時間を加算し得られた時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与し、目的言語データベース21内の各翻訳文の発話時間を算出し、当該発話時間と先に得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延せしめ、目的言語データベース21内の各翻訳文を、先に得られた発話開始時刻或いは遅延せしめられた発話開始時刻から音声合成する音声合成方法を構成した。
【0009】
また、請求項8:原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース11と原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース21を使用し、目的言語データベース21内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベース11から取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与し、目的言語データベース21内の各翻訳文の発話時間を算出し、当該発話時間と先に得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延せしめ、目的言語データベース21内の各発話文間の無音区間の長さを算出し、その長さが或る値を超えている場合、後の翻訳文に対してその発話開始時刻および発話終了時刻をより前に修正し、目的言語データベース21内の各翻訳文を、先に得られた発話開始時刻、遅延せしめられた発話開始時刻、或いはより前に修正せしめられた発話開始時刻から音声合成する音声合成方法を構成した。
【0010】
ここで、請求項9:原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース11と、原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース21と、目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻に或る時間を加算して当該翻訳文の発話開始時刻を求めるプロセスと、目的言語データベース21内の各翻訳文の発話時間を算出するプロセスと、発話時間と当該翻訳文に付与された発話開始時刻に基づいて当該翻訳文の発話終了時刻を求めるプロセスと、求められた各翻訳文の発話開始時刻および発話終了時刻情報に基づいて目的言語データベース21内の各発話文間の無音区間の長さを算出するプロセスと、算出された無音区間の長さが或る値を超えている場合後の翻訳文に対してその発話開始時刻および発話終了時刻をより前に修正するプロセスと、目的言語データベース21内の各翻訳文を修正された発話開始時刻から音声合成するプロセスと、より成る音声合成プログラムを記憶した記憶媒体を構成した。
【0011】
【発明の実施の形態】
この発明の実施の形態を、先ず、図1および図2を参照して説明する。
図1の実施例において、11は原言語データベース、21は目的言語データベース、31は発話開始時刻付与部、32は発話終了時刻付与部、41は修正発話時刻付与部、51は音声合成部を示す。図2は原言語と目的言語との間の発話時刻の関係を示す図である。以下、図3ないし図5をも参照し具体的に説明する。
【0012】
原言語データベース11には、原言語の各発話文とその発話開始時刻および発話終了時刻の情報が記憶されている。図3は原言語データベース11の一例を示す図であり、原言語の発話文と、その発話開始時刻、発話終了時刻の情報が記憶されている。原言語の発話文は、テキストデータの場合もあれば、音声データの場合もある。
目的言語データベース21には、原言語の各発話文に対応する翻訳文とその発話開始時刻および発話終了時刻の情報とが記憶されている。図4は目的言語データベースの一例を示す図であり、翻訳文と、その発話開始時刻、発話終了時刻の情報が記憶されている。翻訳文は、テキストデータの場合もあれば、音声データの場合もある。目的言語データベース21には、翻訳文として、(a)直訳表現の翻訳文の他に(b)意訳等の修正処理を施した翻訳文を記憶しておき、また、(c)通常の口調で翻訳した音声データ、更に、(d)喜び、悲しみ、怒りなどの感情を込めた原言語の発話内容を反映した口調で翻訳した音声データを記憶しておくこともできる。
【0013】
発話開始時刻付与部31は、目的言語データベース21内の各翻訳文に対して対応する原言語の発話文の発話終了時刻を原言語データベース11から取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として付与する。図4においては、各翻訳文の発話開始時刻として対応する原言語の発話文の発話終了時刻に或る時間、一例として1msecを加算した値が表示されている。
【0014】
発話終了時刻付与部32は、目的言語データベース21内の各翻訳文の発話時間を算出し、当該発話時間と発話開始時刻付与部31で得られた発話開始時刻とから、当該翻訳文の発話終了時刻を算出して付与する。ところで、翻訳文の発話時間は、翻訳文がテキストデータの場合、翻訳文を音声合成部51により音声合成し、その音声の再生時間を測定することにより求めることができる。また、テキストデータの場合、音声合成部51において、テキストを音素に分解し、予め音声合成部51に記憶されている各音素長の情報を使用して音声を再生することなしに発話時間の推定値を算出することによっても得られる。翻訳文が音声データの場合、予め発話時間の情報が組み込まれていることがある。また、発話時間は、音声データを音声合成部51により再生して、この再生時間を測定することによっても求めることができる。図4においては、以上の通りにして算出した発話時間を発話開始時刻に加算することにより得られた値を、発話終了時刻として示している。
【0015】
ここで、発話終了時刻付与部32により発話終了時刻を付与する際に、或る翻訳文の発話終了時刻が、次の翻訳文の発話開始時刻よりも後になる場合が起こり得る。この場合、発話の重なりを認めて特に時刻の修正をしない方法と、発話の重なりを認めずに時刻を修正する方法とがある。以下の方法は、後の翻訳文の発話開始を前の翻訳文の発話終了の直後とするものである。即ち、発話終了時刻付与部32は、直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延する遅延処理部を有する。
【0016】
Nを文の総数としたとき、次のルーチンで発話時刻を修正する。
ルーチンの内容
(1)i=1とする。
(2)i<Nならば(3)に進む。i=Nならば終了する。
(3)(i+1)番目の翻訳文の発話開始時刻がfで、i番目の翻訳文の発話終了時刻が(f+e)(e>0)の場合、(i+1)番目の翻訳文の発話開始時刻と発話終了時刻をeだけ遅らせる。
(4)i=i+1とする。(2)に進む。
【0017】
図2を参照するに、修正発話時刻付与部41は、発話開始時刻付与部31と発話終了時刻付与部32で得られた時刻情報に基づいて、目的言語データベース21内の各翻訳文間の無音区間の長さを算出し、この長さが或る値を超えている場合、後の文に対してその発話開始時刻および発話終了時刻をより前に修正した値を付与する。実線は各文の発話区間を示しており、実線に添えられた番号iおよび(i+1)が対応する原言語文と目的言語文を示している。mは、発話開始時刻付与部31において原言語の発話文の発話終了時刻に加算する時間を表わす。但し、修正発話時刻付与部41において目的言語文の発話開始、終了時刻を修正した場合、このmの値は一定とは限らない。
【0018】
Nを文の総数としたとき、修正発話時刻付与部41における時刻修正は、以下のルーチンで行う。
ルーチンの内容
(1)i=1とする。
(2)i<Nならば(3)に進む。i=Nならば終了する。
(3)目的言語文i、(i+1)間の無音時間から原言語文i、(i+1)間の無音時間xを除いたyの長さが或る閾値k以上の場合、目的言語文(i+1)の発話開始、終了時刻を、yの値がkになる様に、同一時間だけ前方へずらす。但し、この結果、目的言語文(i+1)の発話開始時刻が原言語文(i+1)の発話開始時刻よりも前になれば、目的言語文(i+1)の発話開始時刻が原言語文(i+1)の発話開始時刻と等しくなる様に、目的言語文(i+1)の発話開始、終了時刻を同一時間だけ前方へずらす。
(4)i=i+1とする。(2)に進む。
【0019】
以上の通り、発話開始時刻付与部31と発話終了時刻付与部32で得られた時刻情報に基づいて、目的言語データベース21内の各発話文間の無音区間の長さを算出し、その長さが或る値を超えている場合、後の文に対してその発話開始時刻および発話終了時刻をより前に修正した値を付与する構成を具備することにより、音声合成されるべき目的言語の文間の無音区間を適切なポーズ時間に設定して音声合成することができる。
【0020】
図5は、目的言語データベース21において、発話開始時刻付与部31と発話終了時刻付与部32により付与された発話開始、終了時刻とは別に、修正発話時刻付与部41で付与された修正時刻を示している。4番目の原言語である日本語文は、目的語が長いところから、最後の動詞が発話されるに到るまで時間がかかる。従って、目的言語である英語文の3番目と4番目の間の無音区間が長くなるので、4番目の文の発話開始、終了時刻が前方に修正されている。この場合、x=5秒、y=40秒、k=10秒である。
【0021】
ここで、音声合成部51について説明するに、音声合成部51は目的言語データベース21内の各翻訳文を発話開始時刻付与部31或いは発話終了時刻付与部32で得られた発話開始時刻から音声合成し、或は修正発話時刻付与部41で得られた発話開始時刻から音声合成する構成を有する。音声合成部51は、また、原言語データベース11内の各発話文をその発話開始時刻から音声合成し、原言語文と目的言語文を同時に音声合成する構成を有するものとすることもできる。
【0022】
以上の音声合成部51は、目的言語データベース21内の各翻訳文を発話開始時刻付与部31或いは発話終了時刻付与部32で得られた発話開始時刻から音声合成することにより、逐次翻訳音声が得られる。そして、原言語のある一文が長かった場合、逐次翻訳によっては、その翻訳文とその一つ前の翻訳文との間の無音区間が長くなるので、その無音区間を短くした翻訳音声は予測翻訳を取り入れた漸進的翻訳と考えられる。従って、目的言語データベース21内の各文を、修正発話時刻付与部41で得られた発話開始時刻から音声合成させることにより、予測翻訳を取り入れた漸進的翻訳音声が得られる。
【0023】
ところで、この実施例の動作は、音声合成プログラムを記憶した記憶媒体を準備し、図示されている訳ではないが、CPUにより音声合成プログラムをこの記憶媒体からインストールし、原言語データベース11および目的言語データベース21を参照して実施する。この音声合成プログラムは、請求項9に規定される通り原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース、原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベース、目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻に或る時間を加算して当該翻訳文の発話開始時刻を求めるプロセス、目的言語データベース内の各翻訳文の発話時間を算出するプロセス、発話時間と当該翻訳文に付与された発話開始時刻に基づいて当該翻訳文の発話終了時刻を求めるプロセス、求められた各翻訳文の発話開始時刻および発話終了時刻情報に基づいて目的言語データベース内の各発話文間の無音区間の長さを算出するプロセス、算出された無音区間の長さが或る値を超えている場合後の翻訳文に対してその発話開始時刻および発話終了時刻をより前に修正するプロセス、目的言語データベース内の各翻訳文を修正された発話開始時刻から音声合成するプロセスより成るものである。
【0024】
ここで、原言語文の或る発話文が、「どうしてこういうギャップができたかと申しますと。」であったとする。これに対応する翻訳文として、目的言語データベース21内に、次に示す直訳表現の翻訳文と、意訳その他の修正処理を施した翻訳文を記憶しておく。
原言語の発話文 :どうしてこういうギャップができたかと申しますと。
直訳表現の翻訳文 :What is the reason of this gap ?
意訳等を施した翻訳文:How can we have this large gap between the foreigners and Japanese understanding ?
以上の意訳その他の処理を施した翻訳文は、それまでの発話内容の文脈に鑑みて翻訳したものである。以上の直訳表現の翻訳文と意訳その他の処理を施した翻訳文を音声合成部51により音声合成する。
【0025】
【発明の効果】
以上の通りであって、この発明は、逐次翻訳音声或いは漸進的翻訳音声を再生する構成を採用することにより、より自然な目的言語の音声合成をすることができる。そして、逐次翻訳音声と予測翻訳を取り入れた漸進的翻訳音声との間の違和感の違いを検証することができる。また、直訳表現の翻訳音声と意訳表現の翻訳音声の間の内容理解の容易性の違いを検証することができる。更に、この発明は、通訳者を志向する者が同時通訳の学習教材として使用することができる。また、同時通訳および機械翻訳の研究者が研究手段として使用することができる。
【図面の簡単な説明】
【図1】実施例を説明する図。
【図2】原言語と目的言語の発話時刻の相互関係を示す図。
【図3】原言語データベースの一例を示す図。
【図4】目的言語データベースの一例を示す図。
【図5】付与された修正時刻を示す図。
【符号の説明】
11 原言語データベース
21 目的言語データベース
31 発話開始時刻付与部
32 発話終了時刻付与部
41 修正発話時刻付与部
51 音声合成部
Claims (9)
- 原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベースを具備し、
原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベースを具備し、
目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベースから取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与する発話開始時刻付与部を具備し、
目的言語データベース内の各翻訳文を、発話開始時刻付与部で得られた発話開始時刻に応答して動作せしめられる音声合成部を具備することを特徴とする音声合成装置。 - 原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベースを具備し、
原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベースを具備し、
目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベースから取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与する発話開始時刻付与部を具備し、
目的言語データベース内の各翻訳文の発話時間を算出し、当該発話時間と発話開始時刻付与部で得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、当該翻訳文に付与する発話終了時刻付与部を具備し、
目的言語データベース内の各翻訳文を、発話開始時刻付与部或いは発話終了時刻付与部で得られた発話開始時刻に応答して動作せしめられる音声合成部を具備することを特徴とする音声合成装置。 - 請求項2に記載される音声合成装置において、
発話終了時刻付与部は直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延する遅延処理部を有するものであることを特徴とする音声合成装置。 - 原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベースを具備し、
原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベースを具備し、
目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベースから取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与する発話開始時刻付与部を具備し、
目的言語データベース内の各翻訳文の発話時間を算出し、当該発話時間と発話開始時刻付与部で得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、当該翻訳文に付与する発話終了時刻付与部を具備し、
発話開始時刻付与部と発話終了時刻付与部で得られた時刻情報に基づいて目的言語データベース内の各発話文間の無音区間の長さを算出し、その長さが或る値を超えている場合、後の翻訳文に対してその発話開始時刻および発話終了時刻をより前に修正した値を付与する修正発話時刻付与部を具備し、
目的言語データベース内の各翻訳文を、発話開始時刻付与部、発話終了時刻付与部或いは修正発話時刻付与部で得られた発話開始時刻に応答して動作せしめられる音声合成部を具備することを特徴とする音声合成装置。 - 請求項4に記載される音声合成装置において、
発話終了時刻付与部は直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延する遅延処理部を有するものであることを特徴とする音声合成装置。 - 原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース、および原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベースを使用し、
目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベースから取得して当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与し、
目的言語データベース内の各翻訳文を得られた発話開始時刻から音声合成することを特徴とする音声合成方法。 - 原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース、および原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベースを使用し、
目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベースから取得して当該発話終了時刻に或る時間を加算して得られた時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与し、
目的言語データベース内の各翻訳文の発話時間を算出し、当該発話時間と先に得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、
直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延せしめ、
目的言語データベース内の各翻訳文を、先に得られた発話開始時刻或いは遅延せしめられた発話開始時刻から音声合成することを特徴とする音声合成方法。 - 原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベース、および原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベースを使用し、
目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻を原言語データベースから取得し、当該発話終了時刻に或る時間を加算して得られる時刻を当該翻訳文の発話開始時刻として当該翻訳文に付与し、
目的言語データベース内の各翻訳文の発話時間を算出し、当該発話時間と先に得られた発話開始時刻とから当該翻訳文の発話終了時刻を算出し、
直前の翻訳文の発話終了時刻と後の翻訳文の発話開始時刻の間の前後逆転に対応して後の翻訳文の発話開始時刻と発話終了時刻を遅延せしめ、
目的言語データベース内の各発話文間の無音区間の長さを算出し、その長さが或る値を超えている場合、後の翻訳文に対してその発話開始時刻および発話終了時刻をより前に修正し、
目的言語データベース内の各翻訳文を、先に得られた発話開始時刻、遅延せしめられた発話開始時刻、或いはより前に修正せしめられた発話開始時刻から音声合成することを特徴とする音声合成方法。 - 原言語の各発話文の発話開始時刻および発話終了時刻の情報を記憶した原言語データベースと、
原言語の各発話文の翻訳文と翻訳文の発話開始時刻および発話終了時刻の情報とを記憶した目的言語データベースと、
目的言語データベース内の各翻訳文に対応する原言語の発話文の発話終了時刻に或る時間を加算し当該翻訳文の発話開始時刻を求めるプロセスと、
目的言語データベース内の各翻訳文の発話時間を算出するプロセスと、
発話時間と当該翻訳文に付与された発話開始時刻に基づいて当該翻訳文の発話終了時刻を求めるプロセスと、
求められた各翻訳文の発話開始時刻および発話終了時刻情報に基づいて目的言語データベース内の各発話文間の無音区間の長さを算出するプロセスと、
算出された無音区間の長さが或る値を超えている場合後の翻訳文に対してその発話開始時刻および発話終了時刻をより前に修正するプロセスと、
目的言語データベース内の各翻訳文を修正された発話開始時刻から音声合成するプロセスより成ることを特徴とする音声合成プログラムを記憶した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000190466A JP3540984B2 (ja) | 2000-06-26 | 2000-06-26 | 音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000190466A JP3540984B2 (ja) | 2000-06-26 | 2000-06-26 | 音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002006876A JP2002006876A (ja) | 2002-01-11 |
JP3540984B2 true JP3540984B2 (ja) | 2004-07-07 |
Family
ID=18689930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000190466A Expired - Fee Related JP3540984B2 (ja) | 2000-06-26 | 2000-06-26 | 音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3540984B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3955881B2 (ja) * | 2004-12-28 | 2007-08-08 | 松下電器産業株式会社 | 音声合成方法および情報提供装置 |
CN110970013A (zh) * | 2019-12-23 | 2020-04-07 | 出门问问信息科技有限公司 | 一种语音合成方法、装置以及计算机可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3059398B2 (ja) * | 1997-03-04 | 2000-07-04 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 自動通訳装置 |
JP3009642B2 (ja) * | 1997-10-22 | 2000-02-14 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 音声言語処理単位変換装置 |
JP2001117920A (ja) * | 1999-10-15 | 2001-04-27 | Sony Corp | 翻訳装置および翻訳方法、並びに記録媒体 |
-
2000
- 2000-06-26 JP JP2000190466A patent/JP3540984B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002006876A (ja) | 2002-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6859778B1 (en) | Method and apparatus for translating natural-language speech using multiple output phrases | |
JPH0833744B2 (ja) | 音声合成装置 | |
JPH1091389A (ja) | テキストを音声に変換するシンセサイザ | |
JPWO2006123539A1 (ja) | 音声合成装置 | |
JP4473193B2 (ja) | 混合言語テキスト音声合成方法および音声合成装置 | |
JP2002221980A (ja) | テキスト音声変換装置 | |
JPH0335296A (ja) | テキスト音声合成装置 | |
JPH05165486A (ja) | テキスト音声変換装置 | |
Arai | A case study of spontaneous speech in Japanese | |
Huckvale et al. | Spoken language conversion with accent morphing | |
JP3540984B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体 | |
JP2758851B2 (ja) | 自動翻訳装置及び自動通訳装置 | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
JP4056647B2 (ja) | 波形接続型音声合成装置および方法 | |
JP4260071B2 (ja) | 音声合成方法、音声合成プログラム及び音声合成装置 | |
JP3603008B2 (ja) | 音声合成処理装置 | |
JP3357796B2 (ja) | 音声合成装置及び同装置における韻律情報生成方法 | |
JP3034554B2 (ja) | 日本語文章読上げ装置及び方法 | |
JP3308402B2 (ja) | 音声出力装置 | |
JPH09160582A (ja) | 音声合成装置 | |
JP2001350490A (ja) | テキスト音声変換装置及び方法 | |
JPH09292897A (ja) | 音声合成装置 | |
JPH11327594A (ja) | 音声合成辞書作成システム | |
Yanagisawa et al. | Accent morphing as a technique to improve the intelligibility of foreign-accented speech | |
JPH0323500A (ja) | テキスト音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040302 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040326 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090402 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100402 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110402 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |