JPS58215700A - Voice synthesizer - Google Patents
Voice synthesizerInfo
- Publication number
- JPS58215700A JPS58215700A JP9880782A JP9880782A JPS58215700A JP S58215700 A JPS58215700 A JP S58215700A JP 9880782 A JP9880782 A JP 9880782A JP 9880782 A JP9880782 A JP 9880782A JP S58215700 A JPS58215700 A JP S58215700A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- amplitude value
- value
- parameter
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Reciprocating, Oscillating Or Vibrating Motors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
本発明は音声合成装置に関し、特に、その音源振幅デー
タを合成パラメータとして必要とする合成装置に関する
ものである。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a speech synthesis device, and particularly to a synthesis device that requires sound source amplitude data as a synthesis parameter.
一般に、パラメータ合成型の音声合成装置において合成
の初期値を設足するために用いられる所定区間毎の音源
振幅パラメータとしては、例えば、第1因に示すような
自然音声波形aよシ、次式で求めることが出来る平均振
幅値が用いられる。In general, the sound source amplitude parameter for each predetermined section used to set the initial value for synthesis in a parameter synthesis type speech synthesizer is, for example, a natural speech waveform a as shown in the first factor, and the following formula: The average amplitude value that can be determined by is used.
ここで、Aは平均振幅値、nは一定区間での標本数e
”(りは時刻iでの振幅値を示す。Here, A is the average amplitude value, n is the number of samples in a certain interval e
”(ri indicates the amplitude value at time i.
かかる平均振幅値を用いて音声を合成する場合、例えば
従来のフォルマント合成では合成装置の特性2例えば、
他の音声パラメータの適合性やそれらの量子化時におけ
る誤差等を全く考慮に入れることなく上記の式から導き
出された自然音声(原音声)の平均振幅データをそのま
ま用いていたため、再生された合成音声が異常な振幅値
を示し、音品の低下を来たし71音声レベルの制御が困
難である等の欠点があった。When synthesizing speech using such an average amplitude value, for example, in conventional formant synthesis, the characteristics 2 of the synthesizer, for example,
Because the average amplitude data of natural speech (original speech) derived from the above formula was used as is, without taking into account the suitability of other speech parameters or errors during their quantization, the reproduced synthesized There were drawbacks such as the sound exhibiting an abnormal amplitude value, deterioration of the sound quality, and difficulty in controlling the sound level.
本発明は音品の低下やレベル変動を来たさない合成装置
′1に提供することを目的とする。An object of the present invention is to provide a synthesizer '1 that does not cause deterioration of sound quality or level fluctuation.
本発明の音声合成装置は原音声から抽出した振幅平均値
を合成装置に見あうように補正する手段を有し、これに
よって補正された振幅平均値を用いて音声を合成するよ
うにしたことを特徴とする。The speech synthesis device of the present invention has means for correcting the amplitude average value extracted from the original speech so as to be suitable for the synthesis device, and the speech is synthesized using the corrected amplitude average value. Features.
本発明によれば、あらかじめ定められた値を音源振幅値
として用いて音声を合成する手段と、合成された音声の
平均振幅値を抽出する手段と、自然音声の平均振幅値と
合成された音声の平均振幅値を比較する手段と、比較さ
れた結果の出力に応じて、前記あらかじめ定められた値
全補正する手段とを有し、これによシ補正された値を音
声合成装置の音源振幅値として用いることを特徴とする
。According to the present invention, there is provided a means for synthesizing speech using a predetermined value as a sound source amplitude value, a means for extracting an average amplitude value of the synthesized speech, and a speech synthesized with the average amplitude value of natural speech. and means for correcting all of the predetermined values according to the output of the compared results, and the corrected value is thereby calculated as the sound source amplitude of the speech synthesizer. It is characterized by being used as a value.
本発明によれば、音声を合成する際自然音声(原音声)
から抽出した振幅平均値をそのまま音源振幅値として用
いるのではなく、これを合成装置に見合うように補正し
てから使用、するようにしているので、原音声を分析し
て抽出した振幅平均値以外の他の音声パラメータ(例え
ば有無声パラメータやピッチパラメータ)やパラメータ
に量子化する時の誤差、もしくは使用する合成装置自体
のもつ特性誤差等によって生じる音品の劣化やレベルの
変動を前記補正によって補償できる。従って、合成され
た音声には振幅の異常や音品の劣化は見られない。また
、同様のパラメータ合成方式を用いる合成装置であれば
、装置自体が有している振幅平均値を変動せしめるよう
な特性誤差があっても、これ全有効に補償して音声を合
成することができる。According to the present invention, when synthesizing speech, natural speech (original speech)
Rather than using the average amplitude value extracted from the source as the source amplitude value as it is, we correct it to suit the synthesizer before using it. The above correction compensates for deterioration of sound quality and fluctuations in level caused by other audio parameters (for example, voicing parameters and pitch parameters), errors in quantizing the parameters, or characteristic errors of the synthesizer itself used. can. Therefore, no abnormal amplitude or deterioration of sound quality is observed in the synthesized speech. Furthermore, if a synthesizer uses a similar parameter synthesis method, even if there is a characteristic error that causes the amplitude average value of the device itself to fluctuate, it will be possible to effectively compensate for all of these errors and synthesize speech. can.
以下に、本発明の一実施例を第2図を参照して、よシ詳
細に説明する。Hereinafter, one embodiment of the present invention will be described in detail with reference to FIG. 2.
第2図は本発明をフォルマント合成装置に適用した一実
施例の機能プロ、り図である。同図におちて、1は音声
分析装置、2と4は平均振幅値抽出装置、3と6は音声
合成装置、5は比較器である。又、7は自然音声の入力
、8は自然音声より分析された音源振幅以外のパラメー
タ(音声パラメータ、有無声パラメータ、及びピッチ・
パラメータ)9は原音声より得られた平均振幅値、10
はあらかじめ定められた値を持つ音源振幅パラメータ(
なおこれは自然音声より得られた平均撮幅値全そのまま
使用してもよい)、11は合成音声。FIG. 2 is a functional diagram of an embodiment in which the present invention is applied to a formant synthesis device. In the figure, 1 is a speech analysis device, 2 and 4 are average amplitude value extraction devices, 3 and 6 are speech synthesis devices, and 5 is a comparator. In addition, 7 is a natural voice input, and 8 is a parameter other than the sound source amplitude analyzed from the natural voice (voice parameter, voice presence/absence parameter, and pitch/voice parameter).
Parameter) 9 is the average amplitude value obtained from the original voice, 10
is a sound source amplitude parameter with a predetermined value (
(Note that all the average field of view values obtained from natural voices may be used as they are.) 11 is a synthesized voice.
12は合成音声11の平均振幅値、13は9.10゜1
2の平均摂幅値を比較して得られた音源振幅パラメータ
、14は目的とする合成音声である。12 is the average amplitude value of the synthesized speech 11, 13 is 9.10°1
The sound source amplitude parameter 14 obtained by comparing the average amplitude values of 2 is the target synthesized speech.
但し、平均振幅抽出装置12と4.又は音声合成装#:
、3と6は、まったく同一のものを共用してもよいが、
説明を理解しやすくするために別々のブロック図で示し
た。However, the average amplitude extraction devices 12 and 4. Or speech synthesizer #:
, 3 and 6 may share exactly the same thing, but
They are shown in separate block diagrams to make the explanation easier to understand.
以下にこの構成にもとづく動作を説明する。まず、自然
音声7が平均振幅値抽出装置12を具備した音声分析装
R1に入力され、その出力として、平均振幅値9とその
他のパラメータ(音声パラメータなど)8が得られる。The operation based on this configuration will be explained below. First, natural speech 7 is input to a speech analysis device R1 equipped with an average amplitude value extraction device 12, and an average amplitude value 9 and other parameters (speech parameters, etc.) 8 are obtained as output.
その各種パラメータ8゜9を直接最終的な音声合成に使
用せずに、その前に予め音源振幅パラメータの調整を行
なう。調整においては、各棟パラメータ8.9の内、音
源振幅パラメータ10を、仮にある定められた他の値を
用いて、音声合成装置6と同じ音声合成装置3に入力し
て音声を合成してみる。而して得られたその出力の合成
音声11の平均振幅値12を平均振幅値抽出装置4よシ
得、上記の平均振幅値9゜10.12に用いて比較器5
で比較してこの音声合成装置6に最適な音源振幅パラメ
ータ13を求める。その結果、この最適な音源振幅パラ
メータ13とその他の各種パラメータ8で、音声合成装
置6によフ自然音声7の振幅値に忠実な振幅値を持つ合
成音声14を得られる。The various parameters 8.9 are not directly used for final speech synthesis, but the sound source amplitude parameters are adjusted in advance. In the adjustment, the sound source amplitude parameter 10 of each building parameter 8.9 is temporarily input to the same speech synthesizer 3 as the speech synthesizer 6 using a certain other predetermined value to synthesize speech. View. The average amplitude value 12 of the output synthesized speech 11 thus obtained is obtained by the average amplitude value extraction device 4, and is used as the average amplitude value 9°10.12 to be used in the comparator 5.
The optimum sound source amplitude parameter 13 for this speech synthesizer 6 is determined by comparison. As a result, by using this optimum sound source amplitude parameter 13 and other various parameters 8, the synthesized speech 14 having an amplitude value faithful to the amplitude value of the natural speech 7 can be obtained by the speech synthesizer 6.
次に、この比較器5の説明をする。音声合成装置6で得
られる合成音声14の平均振幅値を原音声7の平均振幅
値9と同じにさせたいわけであるが、ここで音源振幅パ
ラメータ以外のパラメータは同一とすると、いま、音声
合成装置3にあらかじめ定まった値の平均振幅パラメー
タを入力した時、その合成された合成音声−11の平均
振幅値12を得ることができる。従って、自然音声7の
平均振幅値9と同じ合成音声14を得るためには、音声
合成装置6の入力として、比較器5からは次のような音
源振幅パラメータ13を出力すればよい。Next, this comparator 5 will be explained. We want the average amplitude value of the synthesized speech 14 obtained by the speech synthesizer 6 to be the same as the average amplitude value 9 of the original speech 7, but if we assume that the parameters other than the sound source amplitude parameter are the same, now the speech synthesis When an average amplitude parameter having a predetermined value is input to the device 3, an average amplitude value 12 of the synthesized synthesized speech-11 can be obtained. Therefore, in order to obtain the synthesized speech 14 that is the same as the average amplitude value 9 of the natural speech 7, the following sound source amplitude parameter 13 may be outputted from the comparator 5 as an input to the speech synthesizer 6.
即ち、この音声合成装置の利得全考えて、あらかじめ定
まった値を持つ音源振幅パラメータ10をEとし、Ei
用いて合成した音声11の平均振幅値12’kDとし、
自然音声の平均振幅値’ID’とし、又、上記の比較器
5が出力すべき値(っまCD/ と同じ平均振幅値にな
る合成音声14を出力するために音声合成装置6に入力
すべき値)13+ E / とすると、以下の式が成り
立つ。That is, considering all the gains of this speech synthesizer, let the sound source amplitude parameter 10 having a predetermined value be E, and Ei
The average amplitude value of the voice 11 synthesized using
The average amplitude value of the natural voice is 'ID', and the value that the comparator 5 should output (CD/ When the exponent value is 13+E/, the following formula holds true.
D/E=D’ /E’ 故に E’ =D’ xE/D 即ち、比較器5は、この式に基づいて、D’ 、 E。D/E=D'/E' Therefore E' = D' x E/D That is, the comparator 5 calculates D' and E based on this formula.
Dの入力を得て、E′を出力するように構成すればよい
。It may be configured to receive input of D and output E'.
以上説明したように、本発明は音声分析装置によって抽
出した音源振幅パラメータとその他のパラメータの適合
性や音声合成装置の特性を考慮に入れて、最適な音源振
幅パラメータに補正しているので、自然音声の振幅値を
忠実に再生できるという大きな効果がある。As explained above, the present invention takes into account the compatibility of the sound source amplitude parameter extracted by the speech analysis device with other parameters and the characteristics of the speech synthesizer, and corrects the sound source amplitude parameter to the optimal one. This has the great effect of faithfully reproducing the amplitude value of the audio.
第1図はある一定区間の音声の波形図である。
a:音声波形
nニー足区間の標本数
a(0)、 a(1)・・・・・・:時刻0.1・・
・・・での振幅値第2図は本発明の一実施例を示す機能
プロ、り図である。
1・・・・・音声分析装置、2.4・・・・・・平均振
幅値抽出装置、3.6・・・・・・音声合成装置、5・
・・・・・比較器、7・・・・・・自然音声入力端子、
8・・・・・・音源振幅以外のパラメータ、9・・・・
・・自然音声より得られた平均振幅値、10・・・・・
・あらかじめ定まった値(自然音声より得られた平均振
幅値を使用してもよい)を持つ音源振幅パラメータ、1
1・・・・・・合成音声、12・・パ・・・11の合成
音声の平均振幅値、13・・・・・9゜10.12の平
均振幅値を比較して得られた音源振幅パラメータ、14
・・・・・・合成音声出力端子。FIG. 1 is a waveform diagram of audio in a certain period. a: Number of samples of audio waveform n knee section a(0), a(1)...: Time 0.1...
. . . Amplitude values FIG. 2 is a functional diagram showing an embodiment of the present invention. 1... Speech analysis device, 2.4... Average amplitude value extraction device, 3.6... Speech synthesis device, 5.
...Comparator, 7...Natural voice input terminal,
8... Parameters other than sound source amplitude, 9...
...Average amplitude value obtained from natural speech, 10...
・Sound source amplitude parameter with a predetermined value (an average amplitude value obtained from natural speech may be used), 1
1... Synthesized speech, 12... Pa... Average amplitude value of synthesized speech of 11, 13... Sound source amplitude obtained by comparing the average amplitude value of 9° 10.12. Parameter, 14
...Synthesized audio output terminal.
Claims (1)
定められた音源振幅値パラメータとを用いて音声を合成
する手段と、合成された音声の平均振幅値を抽出する手
段と、前記自然音声の平均振幅値と合成された音声の平
均振幅値を比較しそれに応じて前記あらかじめ定められ
た値を補正する手段と、補正された値を音源振幅値とし
、これと前記音声パラメータとを用いて目的の音声を合
成する手段とを有することを特徴とする音声合成装置。means for synthesizing speech using speech parameters extracted from natural speech and predetermined sound source amplitude value parameters; means for extracting an average amplitude value of the synthesized speech; and an average amplitude value of the natural speech. and a means for comparing the average amplitude value of the synthesized voice and correcting the predetermined value accordingly, and using the corrected value as a sound source amplitude value and using this and the voice parameter to generate the target voice. 1. A speech synthesis device comprising: means for synthesizing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9880782A JPS58215700A (en) | 1982-06-09 | 1982-06-09 | Voice synthesizer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9880782A JPS58215700A (en) | 1982-06-09 | 1982-06-09 | Voice synthesizer |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58215700A true JPS58215700A (en) | 1983-12-15 |
Family
ID=14229604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9880782A Pending JPS58215700A (en) | 1982-06-09 | 1982-06-09 | Voice synthesizer |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58215700A (en) |
-
1982
- 1982-06-09 JP JP9880782A patent/JPS58215700A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7394908B2 (en) | Apparatus and method for generating harmonics in an audio signal | |
US6996240B1 (en) | Loudspeaker unit adapted to environment | |
US5877446A (en) | Data compression of sound data | |
JPS58215700A (en) | Voice synthesizer | |
CN101422054A (en) | Sound image localization apparatus | |
US6909924B2 (en) | Method and apparatus for shifting pitch of acoustic signals | |
CN108305635A (en) | Method for the frequency distortion for making audio signal | |
US7151215B2 (en) | Waveform adjusting system for music file | |
JPS58186800A (en) | Voice synthesizer | |
JPS5898793A (en) | Voice synthesizer | |
JPS63147200A (en) | Voice parameter correction system | |
JPS5919359B2 (en) | Pacor type speech synthesizer | |
JP2560277B2 (en) | Speech synthesis method | |
US20040234078A1 (en) | Method for automatically testing output audio signals | |
JP2001125582A (en) | Method and device for voice data conversion and voice data recording medium | |
JP2003273671A (en) | Analog pwm signal generating circuit | |
JPS6022198A (en) | Determination of amplitude parameter | |
JP2624958B2 (en) | Speech synthesizer | |
JPS59102297A (en) | Voice synthesizer | |
JPS603000A (en) | Voice synthesization system | |
JPS61278900A (en) | Voice synthesizer | |
JPS5855519B2 (en) | speech synthesizer | |
JPH03216871A (en) | Read data correcting system | |
JPS61123898A (en) | Tone maker | |
JPH0736491A (en) | Pitch extracting device |