DE3050742C2 - Tonsyntheseverfahren - Google Patents
TonsyntheseverfahrenInfo
- Publication number
- DE3050742C2 DE3050742C2 DE19803050742 DE3050742A DE3050742C2 DE 3050742 C2 DE3050742 C2 DE 3050742C2 DE 19803050742 DE19803050742 DE 19803050742 DE 3050742 A DE3050742 A DE 3050742A DE 3050742 C2 DE3050742 C2 DE 3050742C2
- Authority
- DE
- Germany
- Prior art keywords
- parameters
- filter
- udf54
- adder
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 42
- 238000003786 synthesis reaction Methods 0.000 title claims description 42
- 238000000034 method Methods 0.000 title claims description 10
- 230000008569 process Effects 0.000 title description 3
- 238000012546 transfer Methods 0.000 claims description 25
- 238000001228 spectrum Methods 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 4
- 238000001308 synthesis method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 25
- 230000003595 spectral effect Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 19
- 238000013139 quantization Methods 0.000 description 17
- 238000005070 sampling Methods 0.000 description 13
- 230000003111 delayed effect Effects 0.000 description 9
- 238000009826 distribution Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Electrophonic Musical Instruments (AREA)
- Stereophonic System (AREA)
Description
- Die Erfindung betrifft ein Tonsyntheseverfahren nach dem Oberbegriff des Anspruchs 1.
- Bei Verfahren zum Bilden von sogenannter Kunstsprache, kurz Sprachsyntheseverfahren genannt, steht das Bestreben im Hintergrund, bei der Speicherung und/oder Übertragung von Sprachinformation mit möglichst geringen Informationsmengen auszukommen, ohne daß beim Zusammensetzen der Sprache (oder allgemein: von Tönen) eine einen gegebenen Pegel übersteigende Verzerrung eintritt. Anstelle der Ton- oder Sprachwelleninformation selbst verwendet man daher zum Beispiel sogenannte Prädiktorkoeffizienten oder PARCOR-Koeffizienten (partielle Autokorrelationskoeffizienten). Diese Koeffizienten werden als Steuerparameter auf ein durch ein Tonquellensignal angeregtes Tonsynthesefilter gegeben, um die Filtereigenschaften nach Maßgabe der Parameter zu variieren.
- Zur Speicherung und/oder Übertragung von Toninformation ist man also bestrebt, mit möglichst wenig Information auszukommen. Verringert man nun die Anzahl der Quantisierungsbits für die erwähnten Koeffizientenparameter unter einen gewissen Wert, so ist ein stabiler Betrieb des Tonsynthesefilters nicht mehr gewährleistet.
- Ein Verfahren der im Oberbegriff des Anspruchs 1 genannten Art ist bekannt aus "Speech Analysis and Synthesis by Linear Prediction" von Atal u. a. sowie "The Journal of the Acoustic Society of America", Seiten 637-655. Bei diesem bekannten Verfahren wird ein Satz von Prädiktorkoeffizienten (α i ) in einen äquivalenten Satz von Parametern umgesetzt, die die Stabilität des Synthesefilters gewährleisten. Als Beispiel für solche Parameter sind die Pole einer Übertragungsfunktion genannt. Einer der Vorteile der Verwendung von Polparametern besteht darin, daß ein Polparameter die Lage des Pols in der komplexen Ebene darstellt und man deshalb leicht entscheiden kann, ob die Pole innerhalb des Einheitskreises liegen oder nicht. Anhand der Polparameter kann man also ersehen, ob die Stabilität des Synthesefilters gewährleistet ist oder nicht. Ein weiterer Vorteil der Polparameter besteht darin, daß man die Anzahl der Quantisierungsbits für die Pole im Vergleich zu der Anzahl von Quantisierungsbits für die Prädiktorkoeffizienten reduzieren kann, so daß die für die Übertragung und/ oder die Speicherung erforderliche Informationsmenge kleingehalten werden kann. Wie in der oben angegebenen Druckschrift ausgeführt ist, läßt sich innerhalb eines gegebenen Analyserahmens die Anzahl der Quantisierungsbits für die Pole auf 60 Bits, das entspricht 5 Bits pro Parameter, reduzieren, ohne daß eine spürbare Tonverzerrung erfolgt.
- Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren der im Oberbegriff des Anspruchs 1 angegebenen Art derart weiterzubilden, daß eine Tonsynthese mit einer noch kleineren Informationsmenge möglich ist, ohne daß hierdurch eine spürbare Verzerrung des zusammengesetzten Tons in Kauf genommen werden muß.
- Diese Aufgabe wird durch die im Kennzeichnungsteil des Anspruchs 1 angegebene Erfindung gelöst.
- Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
- Nimmt man als spürbaren Verzerrungspegel des zusammengesetzten Tonsignals den Wert von 1 dB an, so errechnet sich im Vergleich zum Stand der Technik, wo in einem Analyseintervall 60 Bits an Information benötigt werden, für die Quantisierung sämtlicher LSP-Parameter eines Analyserahmens ein Wert von 40 Bits. Dies bedeutet eine spürbare Verringerung der benötigten Informationsmenge im Vergleich zum Stand der Technik. Ein weiterer Vorteil der Erfindung gegenüber dem Stand der Technik ist darin zu sehen, daß beim Stand der Technik Polynome p-ter Ordnung gelöst werden müssen, während bei der Erfindung die LSP-Parameter ω und R durch Lösen der Polynome p/2-ter gewonnen werden können.
- Bei einer linearen prädiktiven Analyse wird die Sprachspektralumhüllende durch eine Übertragungsfunktion eines Allpolfilters angenähert, die durch folgende Gleichung (1) gegeben ist: °=c:30&udf54;&udf53;vu10&udf54;&udf53;vz2&udf54; &udf53;vu10&udf54;wobei Z = e -j ω , ω eine normierte Kreisfrequenz 2π f Δ T, Δ T eine Abtastperiode, f eine Abtastfrequenz, p der Analysegrad, α i (i = 1, 2, . . . p) Prädiktorkoeffizienten, die Parameter zur Steuerung der Resonanzeigenschaften des Filters darstellen, und σ die Verstärkung des Filters sind. A p (Z) wird durch die Summe von zwei Polynomen dargestellt, was wie folgt ausgedrückt werden kann: °=c:60&udf54;&udf53;vu10&udf54;°KA°k°T°Kp°k°t°K(Z)°k¤=¤£/ÊÄ°KP(Z)°k¤+¤°KQ(Z)°kÀ@,(2)&udf53;zl10&udf54;@0°KP(Z)°k¤=¤°KA°k°T°Kp°k°t°K(Z)°k¤^¤°KZ°k¤´¤°KZ°k°H°Kp°k°h°KA°k°T°Kp°k°t°K(Z°k°H^1°h)@,(3)&udf53;zl10&udf54;@0°KQ(Z)°k¤=¤°KA°k°T°Kp°k°t°K(Z)°k¤+¤°KZ°k¤´¤°KZ°k°H°Kp°k°h°KA°k°T°Kp°k°t°K(Z°k°H^1°h)@,(4)&udf53;zl&udf54;@0&udf53;vu10&udf54;
- (a) Wenn der Analysegrad p gerade ist, können die Gleichungen (3) und (4) wie folgt in Faktoren zerlegt werden: °=c:80&udf54;&udf53;vu10&udf54;&udf53;vz7&udf54; &udf53;vu10&udf54;
- (b) Wenn der Analysegrad p ungerade ist, werden Gleichungen (3) und (4) wie folgt in Faktoren zerlegt: °=c:80&udf54;&udf53;vu10&udf54;&udf53;vz7&udf54; &udf53;vu10&udf54;ω i und R i in den Ausdrücken (5) und (6) werden ein Linienspektrumpaar (nachfolgend als LSP bezeichnet) genannt und bei der Erfindung als Parameter zur Darstellung der Spektralumhüllenden- Information verwendet.
- Durch Umschreiben von Gleichung (1) und Ersetzen von A p (Z) gemäß Gleichung (2) ergibt sich die Übertragungsfunktion H(Z) wie folgt: °=c:70&udf54;&udf53;vu10&udf54;&udf53;vz6&udf54; &udf53;vu10&udf54;
- Wie man aus (7) ersieht, wird die Übertragungsfunktion H(Z) auch als Filter mit zwei Rückkopplungskreisen gebildet, deren Übertragungsfunktionen P(Z) - 1 bzw. Q(Z) - 1 sind. Die Übertragungsfunktionen P(Z) und Q(Z) sind die von Antiresonanzkreisen, deren Ausgangssignal bei R i bzw. ω i Null wird. Die Frequenzkennlinie von A p (Z) wird wie folgt: °=c:80&udf54;&udf53;vu10&udf54;&udf53;vz7&udf54; &udf53;vu10&udf54;wobei Z = e-j ω . Nach Gleichung (8) scheint, daß in einem Bereich, in dem benachbarte Linienspektralfrequenzen dicht beieinanderliegen, &udf53;sa10&udf54;L&udf53;sa21&udf54;°KA°k°T°Kp°k°t°K(Z)°k&udf53;sa10&udf54;L&udf53;sa21&udf54;¥ klein ist und die Übertragungsfunktion H(Z) eine starke Resonanzcharakteristik zeigt. Durch Ändern der Werte der LSP-Parameter ω i und R i , die die Resonanzcharakteristik der Übertragungsfunktionen beschreiben, kann eine willkürliche Sprachspektralumhüllende erhalten werden.
- Die Prozedur zur Gewinnung der LSP-Parameter ist folgende: In einem ersten Schritt erhält man Autokorrelationskoeffizienten einer Sprachwelle in Intervallen von beispielsweise 10 bis 20 ms. Im zweiten Schritt erhält man von den Autokorrelationskoeffizienten Prädiktorkoeffizienten α i der Übertragungsfunktion H(Z). Im dritten Schritt erhält man von den Prädiktorkoeffizienten auf der Basis der Beziehung der Gleichung (2) die Lösungen der beiden Polynome P(Z) und Q(Z), und auf diese Weise die LSP-Parameter ω i und R i . Durch Steuerung der Koeffizienten des Synthesefilters unter Verwendung der Parameter, die die Information über die Sprachspektralumhüllende darstellen, kann man ein Filter erhalten, dessen Übertragungsfunktion H(Z) der Sprachspektralumhüllenden äquivalent ist. Die Übertragungsfunktion der Rückkopplungsschleife im Synthesefilter ist in Form einer Kaskadenschaltung von Filtern zweiter Ordnung vorgesehen, deren Nullstellen auf einem Einheitskreis in einer Ebene Z liegen, wie durch die Ausdrücke (5) und (6) angegeben. Da diese beiden Filter zweiter Ordnung im Aufbau identisch sind, kann man den Aufbau auch durch Mehrfachverwendung von einem Filter zweiter Ordnung unter Einsatz eines Zweitteilungsbetriebs oder einen sog. Pipeline-Operation vereinfachen. Es ist auch möglich, den Filterbetrieb durch Verarbeitung eines elektronischen Rechners ohne Ausbildung der Filter zweiter Ordnung als Schaltungskreise durchzuführen.
- Wie oben beschrieben, werden bei der vorliegenden Erfindung die Eigenschaften oder Kennwerte des Synthesefilters durch die vorgenannten Parameter R i und ω i gesteuert. Zusätzlich zu diesen LSP-Parametern R i und ω i werden aber ein Grundfrequenzparameter und ein Amplitudenparameter eingesetzt, wie dies auch bei bislang benutzten Sprachsynthesizern der Fall ist. Durch den Grundfrequenzparameter wird eine stimmhafte Tonquelle gesteuert, einen Impuls oder eine Gruppe von Impulsen der durch den Parameter angezeigten Frequenz zu erzeugen. Das Ausgangssignal dieser stimmhaften Tonquelle oder das Ausgangssignal von einer Rauschquelle wird abhängig davon ausgewählt, ob der zu rekonstruierende Ton bzw. Laut stimmhaft oder stimmlos ist. Das ausgewählte Ausgangssignal wird an das Tonsynthesefilter angelegt. Die Größe eines Signals am Eingang oder am Ausgang des Synthesefilters wird mittels des Amplitudenparameters gesteuert. Die LSP-Parameter R i und ω i werden mittels einer Parametertransformierungseinrichtung einer Kosinustransformation zu -2 cos ω i und -2 cos R i unterworfen, und diese transformierten Parameter als Steuerparameter zur Steuerung der Koeffizienten der den jeweiligen Parametern entsprechenden Filter zweiter Ordnung des Tonsynthesefilters verwendet. Die Steuerparameter werden mittels einer Interpolationseinrichtung in der Form von kosinustransformierten LSP-Parametern -2 cos R i und -2 cos ω i interpoliert. Die Interpolationseinrichtung kann auch für die Interpolation des Amplitudenparameters eingesetzt werden. Die LSP- Parameter R i und ω i sind sehr gut interpolationsfähig, und die Interpolation wird in Zeitintervallen, die gleich oder zwei mal so groß wie die Abtastperiode des zur Erzeugung der Parameter dienenden Originaltons sind, durchgeführt. Beispielsweise werden die LSP-Parameter R i und ω i nach jeder Blockzeit von 20 ms erneuert und die Parameter in jedem Block bei einer 8 kHz-Abtastung alle 125 µs interpoliert. Es ist auch möglich, die Interpolation im Stadium der LSP-Parameter R i und ω i durchzuführen und diese dann in die Steuerparameter umzusetzen.
- Die Informationsmenge pro Block ist bei den LSP-Parametern R i und ω i gering im Vergleich zu den Steuerparametern für das Synthesefilter zur Sprachsynthese in der Vergangenheit. Sie sind ferner ausgezeichnet interpolationsfähig. Demzufolge ist es möglich, die LSP-Parameter R i und ω i zu übertragen oder zu speichern, wie sie sind, und ebenfalls möglich, die empfangenen oder rekonstruierten LSP-Parameter R i und ω i in die Steuerparameter für das Synthesefilter, das bei anderen Sprachsynthesesystemen verwendet wird, d. h. die PARCOR-Koeffizienten oder lineare Prädiktorkoeffizienten, umzusetzen. Auf diese Weise können die LSP-Parameter R i und ω i auch bei vorhandenen Sprachsynthesizern verwendet werden. Der Tonsynthesizer der vorliegenden Erfindung eignet sich nicht nur zur Synthese gewöhnlicher Sprache, sondern auch solcher von Tönen eines Zeitsignaltons, eines Alarmtons, eines Musikinstrumenttons usw..
- Die Erfindung wird nachfolgend unter bezug auf die beiliegenden Zeichnungen an Ausführungsbeispielen näher erläutert. Es zeigt
- Fig. 1 ein Blockschaltbild des grundsätzlichen Aufbaus einer Ausführungsform eines Tonsynthesizers, der nach dem erfindungsgemäßen Tonsyntheseverfahren arbeitet,
- Fig. 2 ein Blockschaltbild eines speziellen Betriebsbeispiels des Tonsynthesizers,
- Fig. 3 ein Schaltbild eines Beispiels eines Filters erster Ordnung oder zweiter Ordnung, die das Tonsynthesefilter (den Synthesefilterschaltungsteil) bilden,
- Fig. 4A ein Schaltbild zur Erläuterung eines Beispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad gerade ist,
- Fig. 4B ein Schaltbild zur Erläuterung eines Beispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad ungerade ist,
- Fig. 5 ein Diagramm des Verhältnisses zwischen den LSP- Parametern R i und ω i und der Sprachspektralumhüllenden,
- Fig. 6 ein Schaltbild eines speziellen Betriebsbeispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad 4 ist,
- Fig. 7 ein Schaltbild eines speziellen Betriebsbeispiels des Synthesefilterschaltungsteils, das sich durch eine äquivalente Umwandlung der in Fig. 6 gezeigten Schaltung ergibt,
- Fig. 8 ein Schaltbild eines speziellen Beispiels des Synthesefilterschaltungsteils für den Fall, daß der Analysegrad 5 ist,
- Fig. 9 ein Schaltbild eines speziellen Betriebsbeispiels des Synthesefilterschaltungsteils, das sich durch eine äquivalente Umwandlung der in Fig. 8 gezeigten Schaltung ergibt,
- Fig. 10 ein Blockschaltbild eines Beispiels des Synthesefilterschaltungsteils, das von einem Pipeline-Rechensystem Gebrauch macht,
- Fig. 11A bis 11I Zeittafeln, die die Änderungen von Signalen an jeweiligen Stellen beim Betrieb des in Fig. 10 gezeigten Synthesefilterschaltungsteils wiedergeben,
- Fig. 12 ein Schaltbild, das den Fall zeigt, bei dem die durch den in Fig. 11 gezeigten Betrieb erreichte Filterarbeitsweise durch eine Reihenschaltung von Filtern erzielt wird,
- Fig. 13 ein Blockschaltbild eines Beispiels des einen Mikrocomputer verwendenden Synthesefilters,
- Fig. 14A ein Diagramm, das die Änderungen der Stärke mit der Zeit für den Fall einer Lautfolge "ba ku o N ga" wiedergibt,
- Fig. 14B ein Diagramm, das die Schwankungen der LSP- Parameter R i und ω i mit der Zeit für den Fall dieser Lautfolge zeigt,
- Fig. 15 ein Diagramm, das die Verteilungen der relativen Frequenz der LSP-Parameter R i und ω i über der Frequenz zeigt,
- Fig. 16 ein Diagramm, das die Beziehung zwischen der Anzahl von Quantisierungsbits pro Block und der Spektralverzerrung durch die Quantisierung zeigt,
- Fig. 17 ein Diagramm, daß die Beziehung der Spektralverzerrung durch Interpolation über der Blocklänge für den Fall zeigt, daß die Parameter interpoliert wurden, und
- Fig. 18 ein Diagramm, das ein Beispiel zur Sprachsynthese durch Umwandlung der LSP-Parameter R i und ω i zu α-Parametern zeigt.
- Es wird zunächst auf Fig. 1 bezug genommen, bei der die charakteristischen Parameter von synthetisch zu bildender Sprache (Kunstsprache) von einem Eingangsanschluß 11 nach jeweils einer konstanten Zeitperiode (die nachfolgend als Blockperiode bezeichnet werden soll) von beispielsweise jeweils 20 ms an einen Interface-Schaltungsteil 12 angelegt und dort festgehalten werden. Von diesen so eingegebenen Parametern werden die LSP-Parameter R i und ω i , die eine Information über die Spektralumhüllende darstellen, an einen Parametertransformierungs-Schaltungsteil (PT- Schaltungsteil) 13 geliefert. Von den Parametern, die eine Tonquelleninformation darstellen, wird die Amplitudeninformation an einen Parameterinterpolations-Schaltungsteil (PI-Schaltungsteil) 14 geliefert, während die anderen Parameter, d. h. die die Grundperiode (Tonhöhe) der Sprache angebende Information und die Information, die angibt, ob es sich um einen stimmhaften oder stimmlosen Laut handelt, an einen Tonquellensignalgenerator- Schaltungsteil (TQSG-Schaltungsteil) 15 geliefert werden.
- In dem PT-Schaltungsteil 13 werden die eingegebenen LSP- Parameter R i und ω i in Steuerparameter -2 cos R i und -2 cos ω i für ein Tonsynthesefilter (einen Synthesefilter-Schaltungsteil, SF-Schaltungsteil) 16 transformiert und dieser Parameter dem PI- Schaltungsteil 14 geliefert. Im PI-Schaltungsteil 14 werden in regelmäßigen Zeitintervallen die jeweiligen Interpolationswerte für die Steuerparameter und den Tonquellenamplitudenparameter errechnet, so daß die Spektralumhüllende einer stetigen Änderung unterliegen kann. Die so interpolierten Steuerparameter werden dem SF-Schaltungsteil 16 geliefert, während der Tonquellenamplitudenparameter an den TQSG-Schaltungsteil 15 angelegt wird. Im TQSG-Schaltungsteil 15 wird abhängig von den Eigenheiten der Sprache ein Tonquellensignal auf der Basis der Tonhöheninformation und der Information, ob der Laut stimmhaft oder stimmlos ist, erzeugt und dieses Tonquellensignal zusammen mit dem interpolierten Tonquellenamplitudenparameter an den SF-Schaltungsteil 6 angelegt. Im SF-Schaltungsteil 16 wird aus dem Tonquellensignal und den Steuerparametern Kunstsprache erzeugt. Das Ausgangssignal vom SF-Schaltungsteil 16 wird zu einem Digital/Analog-Umsetzschaltungsteil (DAU-Schaltungsteil) 17 geliefert und an dessen Ausgangsanschluß 18 als Analogsignal abgenommen. Ein Steuerschaltungsteil 19 erzeugt verschiedene Taktsignale zur richtigen Aktivierung des Sprachsynthesizers und liefert diese den jeweiligen Schaltungsteilen.
- Fig. 2 zeigt in etwas konkreter Form die einzelnen Schaltungsteile von Fig. 1. Nach jeder Blockperiode wird die Information darüber, ob der Sprachlauf stimmhaft oder stimmlos ist, vom Interface-Schaltungsteil 12 an ein Stimmhaft-Register 23 und ein Stimmlos-Register 24 angelegt, während ein Sprachfrequenzparameter, der die Sprachtonhöhe angibt, in einem Tonhöhenregister 25 gespeichert wird. Ein Abwärtszähler 27 wird auf den Inhalt des Tonhöhenregisters 25 voreingestellt. Der Abwärtszähler 27 zählt in Abwärtsrichtung Impulse einer Abtastfrequenz, die an einem Anschluß 26 anstehen. Jedesmal, wenn der Zählerinhalt Null wird, liefert er einen Impuls an ein Tor oder Verknüpfungsglied 31 und wird gleichzeitig auf den Inhalt des Tonhöhenregisters 25 voreingestellt. An das Verknüpfungsglied 31 werden der Ausgang vom Stimmhaft-Register 23 und ein Ausgangsimpuls oder Ausgangsimpulse von einem Impulsgenerator 28 angelegt, und, wenn diese Eingangssignale übereinstimmen, der Inhalt eines Tonquellenamplitudenregisters (nachfolgend einfach als Amplitudenregister bezeichnet) 34 über das Verknüpfungsglied 31 an einen Addierer 32 angelegt. Mit anderen Worten wird die Amplitudeninformation vom Amplitudenregister 34 nach jeweils einer Periode entsprechend der Sprachgrundfrequenz im Tonhöhenregister 25 an den Addierer 32 angelegt, wenn der zu erzeugende Kunstsprachlauf stimmhaft ist. Die Amplitudeninformation vom Amplitudenregister 34 wird in diesem vom PI-Schaltungsteil 14 voreingestellt.
- Handelt es sich bei dem zu erzeugenden Kunstsprachlaut um einen stimmlosen Laut, werden das Ausgangssignal vom Stimmlosregister 24 und ein Pseudozufallsserienimpuls von einem Pseudozufallssignal-(PZS-)Generator 36 an ein Tor oder Verknüpfungsglied 37 geliefert. Bei jedem Zusammenfallen beider Eingangssignale wird die Amplitudeninformation aus dem Amplitudenregister 34 über das Verknüpfungsglied 37 an den Addierer 32 geliefert. Das in dieser Weise vom Addierer 32 abgeleitete Tonquellensignal wird, falls nötig, von einem Verstärker 39 verstärkt und dann an den SF-Schaltungsteil 16 angelegt.
- Im PT-Schaltungsteil 13 werden die LSP-Parameter R i und ω i und der Amplitudenparameter von dem Interface-Schaltungsteil 12 nach jeder Blockperiode in ein Register 21 eingegeben. Die LSP-Parameter R i und ω i werden einem Parameterumsetzer 22 geliefert, in welchem sie zu den Steuerparametern -2 cos R i und -2 cos ω i transformiert werden. Der Parameterumsetzer 22 ist beispielsweise durch eine Umsetzungstabelle eines Festwertspeichers (ROM) gebildet, der bei Zugriff mit Adressen, die R i und ω i entsprechen, -2 cos R i bzw. -2 cos ω i ausgibt. Ein Schieberegister 20 erhält abwechselnd das Ausgangssignal vom Parameterumsetzer 22 und den im Register 21 gespeicherten Amplitudenparameter und setzt diese in ein serielles Signal um, das an den PI-Schaltungsteil 14 angelegt wird.
- Beim dargestellten Ausführungsbeispiel führt der PI- Schaltungsteil 14 eine lineare Interpolation durch. Nach Einschalten eines Schalters 29 werden die Parameter eines Blocks einem Subtrahierer 30 geliefert, der eine Differenz zwischen diesem Parameter und demjenigen des vorigen Blocks von einem Addierer 33 ermittelt. Diese Differenz wird in einem Differenzwertregister 38 über einen Schalter 91 gespeichert. Danach wird der Schalter 91 auf die Ausgangsseite des Differenzwertregisters 38 umgeschaltet und dessen Inhalt in Umlauf gebracht. Hierbei wird der Inhalt des Differenzwertregisters 38 für Bitstellen, die höher als eine vorgegebene Bitstelle sind, herausgezogen und dem Addierer 33 geliefert, wo er zum Inhalt eines Interpolationsergebnisregisters 92 hinzuaddiert wird. Wenn beispielsweise die Parameterauffrischungsperiode oder Blockperiode 16 ms ist und Interpolationsparameter 128 mal während einer Blockperiode geliefert werden sollen, dann ist die Interpolationsschrittbreite ein Wert, der sich aus der Division des Differenzwerts durch 128 ergibt. Diesen Wert erhält man durch Verschieben des Differenzwerts im Differenzwertregister 38 um 7 Bits zur Seite des niedrigeren Stellenwerts hin. Das Ergebnis der vom Addierer 33 durchgeführten Addition wird dem Interpolationsergebnisregister 92 geliefert und gleichzeitig als Ausgangsgröße des PI-Schaltungsteils 14 verwendet. Auf diese Weise werden vom Addierer 33 die Werte abgeleitet, die dadurch erhalten werden, daß sequentiell mit jedem Umlauf des Differenzwertregisters 38 einmal, zweimal, dreimal . . . der verschobene Wert des Differenzwertregisters 38 zum Parameter des vorigen Blocks im Interpolationsergebnisregister 92 addiert wird.
- Bei diesem Beispiel wird der PI-Schaltungsteil 14 für den Steuerparameter und den Amplitudenparameter auf einer Zeitteilungsbasis verwendet, so daß, obwohl nicht gezeigt, der Steuerparameter und der Amplitudenparameter abwechselnd interpoliert werden und das Interpolationsergebnisregister 92 für beide Parameter gemeinsam genutzt wird. Der im PI-Schaltungsteil 14 interpolierte Amplitudenparameter wird dem Amplitudenregister 34 im TQSG-Schaltungsteil 15 zugeführt, während der in oben erwähnter Weise interpolierte Steuerparameter als Information zur Steuerung des Filterkoeffizienten des SF-Schaltungsteils 16 diesem zugeführt wird. Die Blockperiode, d. h. die Zeitspanne, nach der die Parameter erneuert werden, wird so ausgewählt, daß sie im Bereich von 10 bis 20 ms liegt, während die Interpolationsperiode so ausgewählt wird, daß sie im Bereich von 1 bis 2 Abtastintervallen liegt. Die Art der Interpolation ist nicht speziell auf die lineare Interpolation beschränkt, es können auch andere Interpolationsarten sein. Wichtig ist, daß stetige Änderungen der interpolierten Parameter sichergestellt sind.
- Der SF-Schaltungsteil 16 ist mit einer Rückkopplungsschleife zur Rückführung des Ausgangssignals über zueinander parallelgeschaltete Filterschaltungen 41 und 42 versehen. Die Filterschaltungen 41 und 42 werden über einen Eingangsanschluß 44 mit dem interpolierten Steuerparameter versorgt, während ihre Ausgangssignale mit Hilfe eines Addierers 43 addiert werden, dessen Ausgangssignal seinerseits in einem Addierer 45 dem Eingangssignal des SF-Schaltungsteils hinzuaddiert wird. Das addierte Ausgangssignal vom Addierer 45 wird über die Filterschaltungen 41 und 42 zurückgeführt und gleichzeitig an einem Ausgangsanschluß 55 abgenommen.
- Für beide Filterschaltungen 41 und 42 wird von einem Schaltungskreis Gebrauch gemacht, der in Kaskade geschaltete Filter zweiter Ordnung mit jeweils Nullstellen auf dem Einheitskreis in der komplexen Ebene aufweist. Beide Filterschaltungen 41 und 42 können durch eine mehrstufige Kaskadenverbindung von Filtern erster Ordnung und/oder zweiter Ordnung gebildet sein. Bei Ausbildung der Filterschaltungen als Digitalfilter kann von einem Filter erster Ordnung Gebrauch gemacht werden, wie es als Beispiel in Fig. 3A gezeigt ist, von einem Filter zweiter Ordnung, wie es in Fig. 3B gezeigt ist, und von einem Filter zweiter Ordnung, wie es in Fig. 3C gezeigt ist. Das Filter gemäß Fig. 3A ist aus einer Verzögerungsschaltung 51 mit einer Verzögerung von einer Abtastperiode und einem Addierer 52 zusammengesetzt, der das verzögerte Ausgangssignal und ein unverzögertes Eingangssignal addiert. Das Filter gemäß Fig. 3B besteht aus zwei Stufen von Verzögerungsschaltungen 51 und einem Addierer 52, der das verzögerte Ausgangssignal und das nicht verzögerte Eingangssignal addiert. Das Filter gemäß Fig. 3C enthält einen Multiplizierer 53, der das verzögerte Ausgangssignal von einer Stufe einer Verzögerungsschaltung 51 mit -2 cos ω i multipliziert, sowie einen Addierer 52, der das verzögerte Ausgangssignal von zwei Stufen von Verzögerungsschaltungen 51, das nicht verzögerte Eingangssignal und das Ausgangssignal des Multiplizierers 53 addiert. Die Übertragungsfunktionen der in den Fig. 3A, 3B und 3C gezeigten Filter sind 1±Z, 1-Z² bzw. 1-2 cos ω i Z+Z². Es ist auch möglich, Filter höherer Ordnung einzusetzen.
- Die Kombination und die Anzahl solcher Filter hängt vom Grad der Analyse ab und wird gemäß Fig. 4A oder 4B in Abhängigkeit davon ausgewählt, ob der Analysegrad gerade oder ungerade ist. In Fig. 4A ist der Analysegrad 10, d. h. eine gerade Zahl, und die Filterschaltung 41 ist gebildet von einer Reihenschaltung aus einem Filter 56 erster Ordnung mit der Übertragungsfunktion 1-Z und Filtern 57 bis 61 zweiter Ordnung, deren jeweilige Übertragungsfunktion 1-2 cos ω i Z+Z² ist. Das Ausgangssignal am Ausgangsanschluß 55 wird in einem Multiplizierer 63 mit +½ multipliziert und an die Reihenschaltung 56-61 angelegt. Das Ausgangssignal des Filters 61 der letzten Stufe und das Ausgangssignal vom Multiplizierer 63 werden mittels eines Addierers 62 addiert und dessen Additionsausgangssignal zum Addierer 43 geliefert. In der Filterschaltung 42 wird das Ausgangssignal vom Multiplizierer 63 einer Reihenschaltung aus einem Filter 64 erster Ordnung mit der Übertragungsfunktion 1+Z und Filtern 65 bis 69 zweiter Ordnung, die jeweils die Übertragungsfunktion 1-2 cos R i Z+Z² besitzen, zugeführt. Das Ausgangssignal der Reihenschaltung 65-73 und das Ausgangssignal vom Multiplizierer 63 werden in einem Addierer 71 addiert und dessen Additionsausgangssignal dem Addierer 43 zugeführt. Den Multiplizierern 53 (vergl. Fig. 3C) der Filter 57 bis 61 zweiter Ordnung werden jeweils Steuerparameter a&sub1; = 2 cos ω&sub1; bis a&sub5; = -2 cos ω&sub5; eingegeben, während den Multiplizierern 53 der Filter 65 bis 69 zweiter Ordnung jeweils Steuerparameter b&sub1; = -2 cos R&sub1; bis b&sub5; = -2 cos R&sub5; eingegeben werden.
- Fig. 4B zeigt den Fall, daß der Analysegrad 11, d. h. eine ungerade Zahl ist. In der Filterschaltung 41 ist das Filter 56 erster Ordnung, das im Fall von Fig. 4A verwendet wird, weggelassen und stattdessen wird ein Filter 72 zweiter Ordnung mit einer Übertragungsfunktion 1-Z² verwendet. In der Filterschaltung 42 ist das Filter 64 erster Ordnung weggelassen und stattdessen ein Filter 73 zweiter Ordnung verwendet, dem ein Parameter b&sub6; = -2 cos R&sub6; eingegeben wird.
- In den Filterschaltungen 41 und 42 stellen die Steuerparameter ω i und R i Antiresonanzfrequenzen dar, bei denen die Ausgangswerte der Filterschaltungen 41 und 42 0,5 werden. Für den Fall, daß die den Filterschaltungen 41 und 42 zugeführten Antiresonanzfrequenzen nahe beieinanderliegen, kommt der Ausgangswert des Addierers 43 nahe an 1, so daß sich auch die Verstärkung der Rückkopplungsschleife dem Wert 1 annähert. Als Folge tritt am Ausgangsanschluß 55 eine hohe Resonanzcharakteristik auf. ω&sub1; bis ω&sub5; und R&sub1; bis R&sub5; sind hier Antiresonanzfrequenzen, die charakteristisch für die Sprachspektralumhüllungsinformation sind. Diese Parameter und die Sprachumhüllungscharakteristik besitzen ein Verhältnis, wie es in Fig. 5 wiedergegeben ist. Aus Fig. 5 ist ersichtlich, daß die Resonanzcharakteristik des Spektrums durch den Abstand zwischen benachbarten Parametern ausgedrückt werden kann. Diese Parameter stehen der Reihe nach in folgender Beziehung zueinander: °=c:20&udf54;&udf53;vu10&udf54;0¤<¤&udf57;°KV&udf56;ɤ<¤&udf57;°Kw&udf56;ɤ<¤&udf57;°KV&udf56;ʤ<¤&udf57;°Kw&udf56;Ê .¤.¤. <¤&udf57;°KV&udf56;°T°Ki°k°t¤<¤&udf57;°Kw&udf56;°T°Ki°k°t¤<¤&udf57;°Kp&udf56;-@,(8&dlowbar;)&udf53;zl&udf54;@0&udf53;vu10&udf54;
- Eigenart des Synthesefilters ist, daß es stabil ist, wenn diese Voraussetzung erfüllt ist.
- Als nächstes soll ein spezielles Beispiel des SF-Schaltungsteils 16 beschrieben werden. Entsprechend dem in Klammern gesetzten Term im Nenner von Gleichung (7) erhält man die folgenden identischen Gleichungen aus Gleichung (5): °=c:120&udf54;&udf53;vu10&udf54;&udf53;vz11&udf54; &udf53;vu10&udf54;°=c:80&udf54;&udf53;vz7&udf54; &udf53;vu10&udf54;°=c:50&udf54;&udf53;vz4&udf54; &udf53;vu10&udf54;
- Es wird ein Digitalfilter gebildet, das eine Allpolübertragungsfunktion besitzt, die die Sprachspektralumhüllende annähert und unter Verwendung der durch die Gleichungen (7), (9) und (10) gegebenen Beziehungen durch Gleichung (1) gegeben ist. Fig. 6 zeigt den Fall für p = 4. In Fig. 6 sind Teile, die solchen in Fig. 4A entsprechen, mit denselben Bezugszahlen bezeichnet. Das Eingangssignal bzw. der Eingangswert vom Anschluß 54 wird mit Hilfe des Addierers 45 zum Ausgangssignal bzw. Ausgangswert vom Addierer 43 hinzuaddiert. Das Additionsergebnis wird an den Ausgangsanschluß 55 geliefert und gleichzeitig im Multiplizierer 63 mit +½ multipliziert. Diese Multiplikation mit ½ entspricht derjenigen im Nenner von Gleichung (7). Das Ausgangssignal vom Multiplizierer 63 wird an eine Verzögerungsschaltung 74 angelegt, deren Verzögerungszeit eine Abtastperiode, d. h. gleich der Zeiteinheit ist. Das verzögerte Ausgangssignal wird als Eingangssignal an die beiden Filter 57 und 65 zweiter Ordnung angelegt, in denen es den Verzögerungsschaltungen 51, den Multiplizierern 53 und den Addierern 52 zugeführt wird. In beiden Multiplizierern 53 werden die jeweiligen Eingangssignale mit a&sub1; bzw. b&sub1; multipliziert und die multiplizierten Ausgangssignale in beiden Filtern 57 und 65 jeweils an einen Addierer 94 zur Addition mit dem Ausgangssignal der zugehörigen Verzögerungsschaltung 51 angelegt. Die Ausgangssignale beider Addierer 94 werden an einen gemeinsamen Addierer 81 angelegt und gleichzeitig in beiden Filtern 57 und 65 über eine jeweilige Verzögerungsschaltung 95 mit einer Verzögerungszeit gleich einer Abtastperiode an den Addierer 52 angelegt. Die Ausgangssignale von beiden Addierern 52 werden als jeweilige Ausgangssignale der Filter 57 und 65 den Filtern 58 und 66 zweiter Ordnung der nächsten Stufe zugeführt. Die Filter 58 und 66 stimmen im Aufbau mit den Filtern 57 und 65 überein, nur sind hier die Koeffizienten für die Multiplizierer 53 a&sub2; bzw. b&sub2;. Das Ausgangssignal vom Addierer 94 jedes dieser Filter 58 und 66 wird an einen Addierer 82 zur Addition mit dem Ausgangssignal vom Addierer 81angelegt. Die Ausgangssignale von den Addierern 52 der beiden Filter 58 und 66 werden dem Addierer 43 zugeführt, um voneinander subtrahiert zu werden. Der Addierer 43 erhält ferner das Ausgangssignal vom Addierer 82.
- Die Verzögerungsschaltung 74 entspricht Z außerhalb der Klammern in den Gleichungen (9) und (10), und die Filter 57 und 58 stellen je ein Filter zweiter Ordnung mit einer Übertragungsfunktion 1 + Z(a j + Z) dar. In ähnlicher Weise stellen die Filter 65 und 66 je ein Filter zweiter Ordnung mit einer Übertragungsfunktion 1 + Z(b j + Z) dar. Demzufolge wird mittels der Reihenschaltung der Filter 57 und 58 der dritte Term in der Klammer in Gleichung (9) realisiert, während die Verzögerungsschaltung 51, der Multiplizierer 53 und der Addierer 94 im Filter 58 (a i+1 + Z) realisieren. Folglich wird durch diese Schaltung und das Filter 57 der zweite Term in der Klammer in Gleichung (9) realisiert, wobei das Ausgangssignal über den Addierer 82 zum Addierer 83 geliefert wird. Die Verzögerungsschaltung 51, der Multiplizierer 53 und der Addierer 94 im Filter 57 realisieren (a i+1 + Z), und das Ausgangssignal wird dem Addierer 43 über die Addierer 81 und 82 geliefert. Auf diese Weise werden die Terme in den Klammern in Gleichung (9) durch die Filter 57 und 58 zweiter Ordnung und die Addierer 43, 81 und 82 realisiert. In ähnlicher Weise werden die Terme in den Klammern in Gleichung (10) durch die Filter 65 und 66 zweiter Ordnung und die Addierer 43, 81 und 82 realisiert. Die Gleichungen (9) und (10) unterscheiden sich formal nur dadurch, daß die Vorzeichen der dritten Terme in den Klammern unterschiedlich sind und daß deshalb das Vorzeichen des Eingangssignals zum Addierer 43 sich unterscheidet. Demzufolge realisieren der Addierer 43, die Filter 57, 58, 65 und 66, der Multiplizierer 63 und die Verzögerungsschaltung 74 die Gleichung (2), während die Schaltungsanordnung von Fig. 6 als Ganzes der Anzapfung 97 zum Addierer 43 dem zweiten Term in den Klammern in Gleichung (9) entspricht. Die Filter 65 und 66 zweiter Ordnung der Filterschaltung 41 sind in ähnlicher Weise ausgebildet. In Verbindung mit der Filterschaltung 41 wird das Ausgangssignal von der Verzögerungsschaltung 74 in einem Multiplizierer 98 mit -1 multipliziert, um das Minuszeichen für den dritten Term in den Klammern der Gleichung (9) zu verwirklichen.
- Für den Fall, daß p ungerade ist, erhält man aus Gleichung (8) die folgende identische Gleichung, die dem Term in den Klammern im Nenner der Gleichung (7) entspricht: °=c:80&udf54;&udf53;vu10&udf54;&udf53;vz7&udf54; &udf53;vu10&udf54;°=c:80&udf54;&udf53;vz7&udf54; &udf53;vu10&udf54;°=c:50&udf54;&udf53;vz4&udf54; &udf53;vu10&udf54;
- Wie in dem oben beschriebenen Fall, daß p gerade ist, lassen sich, wenn p ungerade ist, zwei Arten von Digitalfiltern, die als Anzapfungsausgangstyp und als Anzapfungseingangstyp bezeichnet werden können, aus den Verhältnissen der Gleichungen (7), (12) und (13) in den in den Fig. 8 und 9 gezeigten Formen realisieren. In den Fig. 8 und 9 ist angenommen, daß p = 5 ist. In den Fig. 8 und 9 entspricht das Filter 72 erster Ordnung Z im dritten Term in den Klammern in Gleichung (13), während das Filter 73 zweiter Ordnung zur Erzielung einer solchen Charakteristik dient, daß die Produkte der Übertragungsfunktionen (1 + b&sub1;Z + Z²) und (1 + b&sub2;Z + Z²) der Filter 65 und 66 mit (b&sub3; + Z) multipliziert werden.
- Wie man den Fig. 6 bis 9 entnehmen kann, können der Multiplizierer 63 zur Multiplikation mit ½ und die Verzögerungsschaltung 74 an irgendwelchen Stellen in der Rückkopplungsschleife angeordnet werden. Da die Filter zweiter Ordnung von gleichem Typ sind, ist es möglich, die Hardware dadurch zu vereinfachen, daß die Schaltungsanordnung so ausgebildet wird, daß ein sog. Pipelinebetrieb unter Verwendung eines Multiplizierers 53, der Vielzahl von Addierern 53 und 94 und der Vielzahl von Verzögerungsschaltungen 51 und 95, die ein Filter zweiter Ordnung ausmachen, auf einer Zeitmultiplexbasis durchgeführt wird. Fig. 10 zeigt den Fall, daß das Beispiel des in Fig. 12 gezeigten Filters zur Durchführung des Pipelinebetriebs angeordnet ist. Bei diesem Beispiel ist p = 10, und die Verarbeitung eines Satzes von Parametern, die vom PI-Schaltungsteil angelegt werden, ist innerhalb einer Periode von 176 Takten beendet. In Fig. 10 sind Teile, die solchen von Fig. 12 entsprechen, mit denselben Bezugszahlen bezeichnet. Die Eingangsseite eines statischen 16-Bit-Schieberegisters 74, das die Funktion der Verzögerungsschaltung 74 ausführt, wird mit Hilfe eines Schalters S&sub1; zwischen der Ausgangsseite des Schieberegisters selbst und der Ausgangsseite des Addierers 45 umgeschaltet. Die Multiplikanden-Eingangsseite des Multiplizierers 53 und die Eingangsseite des Addierers 52 werden mittels eines Schalters S&sub2; zwischen der Ausgangsseite des Schieberegisters 74, der Ausgangsseite einer (27-d)-ten Stufe des Schieberegisters (vom Eingang des Schieberegisters 74 an gezählt) und der Ausgangsseite eines 31-Bit-Schieberegisters 101 umgeschaltet, wobei d eine Betriebsverzögerung des Multiplizierers 53 ist. Der Multiplizierer 53 ist an einem Ende mit dem Ausgangsanschluß 55 und der Eingangsseite des Addierers 94 verbunden und leitet am anderen Ausgangsende das um Takte verzögerte Multiplikanden-Eingangssignal ab, das dem (154 + d)-Bit-Schieberegister 51 geliefert wird. Das Ausgangssignal vom Addierer 81 wird über ein Verknüpfungsglied 102 und ein 16-Bit-Schieberegister 103 zu seiner Eingangsseite zurückgeführt, wodurch mittels der Addierer 81 und 82 in Fig. 10 eine kumulative Addition durchgeführt wird. Ein Verknüpfungsglied 102 ist nur während des Zeitintervalls zwischen d + 2 und 145 + d durchgeschaltet. Eine Eingangsseite des Addierers 43 wird mittels eines Umschalters S&sub3; zwischen den Ausgangsseiten der Addierer 52 und 81 umgeschaltet, während die andere Eingangsseite des Addierers 43 mittels eines Schalters S&sub4; zwischen den Ausgangsseiten einer 16. und einer (d + 1)-ten Stufe des Schieberegisters 101 umgeschaltet wird. Die Eingangsstufe des Schieberegisters 101 wird mittels eines Schalters S&sub5; zwischen den Ausgangsseiten der Addierer 43 und 52 umgeschaltet.
- Die Schalter S&sub1; bis S&sub2; sind während einer Arbeitsperiode, d. h. 176 Takten, während einer bei den jeweiligen Kontakten angegebenen Taktperiode mit diesen verbunden. Die Schieberegister 51, 95, 101 und 103 sind (154 + d)-Bit, (175-d)-Bit, 31-Bit bzw. 16-Bit dynamische Schieberegister, die ständig mit Schiebetaktimpulsen versorgt werden. Die jeweilige gestrichelte Eingangsleitung zu den Addierern 43, 45, 52 und 81 gibt die Zeitsteuerung der Betriebsgrenze für die einzelnen Parameter an. Beispielsweise kennzeichnet Φ&sub0; eine Wiederholung nach jeweils 16 Takten. Die Betriebsverzögerung der einzelnen Addierer ist zu einem Takt gewählt. Fig. 11 ist eine Zeittafel des Betriebs der einzelnen Teile in Fig. 10. Fig. 11A zeigt die Taktzeitpunkte, Fig. 11B die Zeitpunkte der Eingabe der interpolierten Koeffizienten a i , b i und A in die Multiplizierer 53 vom Eingangsanschluß 44, Fig. 11C die der Eingabe des Multiplikanden des Multiplizierers 53, Fig. 11D die eines Eingangssignals zum Addierer 94 vom Multiplizierer 53, Fig. 11E die des anderen Eingangssignals zum Addierer 94, Fig. 11F die des Ausgangssignals vom Addierer 94, Fig. 11G die des Ausgangssignals vom Addierer 81 und folglich des Inhalts des Registers 103, Fig. 11H die des Eingangssignals zum Addierer 52 vom Schieberegister 95 und Fig. 11I die des Ausgangssignals vom Addierer 52. Fig. 12 zeigt diese Eingangssignale und Ausgangssignale in Form von an den jeweiligen Baugliedern auftretenden Signalen für den Fall einer Kaskadenschaltung der Filter zweiter Ordnung.
- Wie aus Fig. 11 ersichtlich, werden in der Zeitspanne zwischen den Takten 0 und 16 ein Koeffizient a&sub1;(t) und ein Multiplikand x&sub1;(t) im Multiplizierer 53 miteinander multipliziert, um die Multiplikation im Filter zweiter Ordnung 57 in Fig. 12 zu bewirken. Das Ergebnis dieser Multiplikation erhält man beim d-ten Takt. Wie in den Fig. 11B und 11C gezeigt, werden in der Zeitspanne zwischen den Takten 16 und 32 ein Koeffizient b&sub1;(t) und ein Multiplikand y&sub1;(t) multipliziert, um die Multiplikation im Filter 65 zweiter Ordnung auszuführen. Der Multiplikand x&sub1;(t) wird durch das Schieberegister 51 zusammen mit 22 Bits des Multiplizierers 53 um (176 + d) Takte verzögert, so daß, wie Fig. 11E zeigt, ein Multiplikand x&sub1;(t-1) beim d-ten Takt an den Addierer 94 angelegt und zu dem zu diesem Zeitpunkt vom Multiplizierer 53 abgeleiteten Ausgangssignal a&sub1;x&sub1; addiert wird. Das addierte Ausgangssignal x&sub1;&min;(t) wird über den Addierer 81 zwecks Akkumulation an das Schieberegister 103 geliefert. Das heißt, das Ausgangssignal vom Addierer 81 wird dem Signalsystem der Addierer 81, 82 . . . in Fig. 12 zugeführt.
- Wie Fig. 11H zeigt, wird das Ausgangssignal vom Addierer 94 auch dem (175-d)-Bit-Schieberegister 95 geliefert. Demgemäß ist in der Zeitspanne zwischen den Takten 0 und 16 das Ausgangssignal vom Schieberegister x&sub1;&min;(t-1), wie dies in Fig. 11H gezeigt ist, und wird im Addierer 52 zum Multiplikanden x&sub1;(t) addiert. Das Ausgangssignal x&sub2;(t) des Addierers 52 wird dem Filter zweiter Ordnung 58 in Fig. 12 als Eingangssignal geliefert. Das Ausgangssignal x&sub2;(t) vom Addierer 52 wird über das Schieberegister 101 dem Multiplizierer 53 zugeführt. Wie in Fig. 11C gezeigt, wird das Ausgangssignal x&sub2;(t) in der Zeitspanne zwischen den Takten 32 und 48 im Multiplizierer 53 mit dem Koeffizienten a&sub2;(t) multipliziert. Vor dieser Multiplikation werden b&sub1;(t) und y&sub1;(t), wie zuvor beschrieben, multipliziert und das multiplizierte Ausgangssignal in ähnlicher Weise verarbeitet, um hierdurch in der Zeitspanne zwischen den Takten 48 und 64 vom Filter zweiter Ordnung 65 das Ausgangssignal y&sub2;(t) zu erhalten. Auf diese Weise werden die Multiplikation des Koeffizienten a und des Multiplikanden x und die Multiplikation des Koeffizienten b und des Multiplikanden y abwechselnd alle 16 Takte ausgeführt und die Produkte an das Schieberegister 51 angelegt, wie dies durch a&sub1;x&sub1;, b&sub1;y&sub1;, a&sub2;x&sub2;, b&sub2;y&sub2;, . . . in Fig. 11D angedeutet ist. Ferner leiten die Filter zweiter Ordnung 57, 58, 59, 60 und 61 x&sub1;&min;(t), x&sub2;&min;(t), x&sub3;&min;(t), x&sub4;&min;(t) bzw. x&sub5;&min;(t) und x&sub2;(t), x&sub3;(t), x&sub4;(t), x&sub5;(t) bzw. x&sub6;(t), die den Schieberegistern 95 und 101 geliefert werden, von den Produkten ab. In ähnlicher Weise werden y&sub1;&min;(t) bis y&sub5;&min;(t) bzw. y&sub2;(t) bis y&sub6;(t) von den Filtern zweiter Ordnung 65 bis 69 erhalten und diese Ausgangssignale abwechselnd mit x&min;(t) bzw. x(t) an die Schieberegister 95 und 101 angelegt. In der Zeitspanne zwischen den Takten 145 und 161 wird das zu einem Zeitpunkt vom Addierer 52 abgeleitete Ausgangssignal y&sub6; und das vorher im Schieberegister vorgesehene x&sub6; im Addierer 43 voneinander subtrahiert und (x&sub6;-y&sub6;) über den Schalter S&sub5; dem Schieberegister 101 geliefert, wo diese Differenz um (d + 1) Takte verzögert wird. Das verzögerte Ausgangssignal wird vom Schalter S&sub4; abgenommen und in der Zeitspanne zwischen den Takten 147 + d und 163 + d in den Addierer 43 eingegeben. Das zu diesem Zeitpunkt vom Schieberegister 103 gewonnene Ausgangssignal wird dem Addierer 43 über den Addierer 81 und den Schalter S&sub3; geliefert. Das Ausgangssignal vom Addierer 43 zu diesem Zeitpunkt wird das Ausgangssignal vom Addierer in Fig. 12. Dieses Ausgangssignal wird an den Addierer 45 angelegt, wo es zur Bildung von Z(t) zum Eingangssignal am Anschluß 54 addiert wird. Das addierte Ausgangssignal Z(t) wird an das Register 74 geliefert, das die Verzögerung der Verzögerungsschaltung 74 von Fig. 12 ausführt. Das verzögerte Ausgangssignal wird an den Multiplizierer 53 angelegt und zu diesem Zeitpunkt der Koeffizient A als Amplitudeninterpolations- Ausgangssignal am Anschluß 44 bereitgestellt, so daß vom Multiplizierer 53 am Ausgangsanschluß 55 A · Z(t) abgenommen werden kann. Diese Multiplikation wird in dem Fall ausgeführt, daß das Ausgangssignal vom SF-Schaltungsteil 16 in einem Multiplizierer 104 in Fig. 12 mit der Amplitudeninformation A multipliziert wird. Vom Schieberegister 74 wird ein Ausgangssignal Z(t)/2 abgenommen, das um 1 Bit nach unten verschoben wurde. Dieses Ausgangssignal wird in der nächstfolgenden Arbeitsperiode für einen neuen Satz von Parametern über den Schalter S&sub2; dem Multiplizierer 53 als Z(t-1)/2, d. h. als x(t) und y(t) zugeführt. Das Ausgangssignal am Ausgangsanschluß 55 kann auch über einen Ausgangspuffer 105 eines statischen Schieberegisters als Parallelsignal erhalten werden.
- Der voranstehend beschriebene Pipelinebetrieb ist auf andere Arten von SF-Schaltungsteilen 16 anwendbar. Es dürfte aus dem Aufbau von Fig. 10 ferner entnehmbar sein, daß die Filterfunktion durch Addition, Multiplikation und Verzögerung erreicht wird, so daß diese Filterverarbeitung auch unter Verwendung eines Mikrocomputers durchgeführt werden könnte. In Fig. 13 beispielsweise werden durch aufeinanderfolgendes Auslesen, Interpretieren und Durchführen von Programmen in einem Programmspeicher 107 von einem Eingangstor 111 ein Tonquellensignal bzw. Steuerparameter eingegeben, die von dem TQSG-Schaltungsteil 15 und dem PI-Schaltungsteil 14 an Anschlüsse 108 und 109 angelegt werden. Die Zentraleinheit 106 führt daraufhin nacheinander die zuvor auf Fig. 11 beschriebenen Operationen aus. Ein Schreib-Lese-Speicher 112 wird anstelle der Register 51, 74, 95, 101, 103 und 105 in Fig. 10 verwendet. Die Ergebnisse der Operationen werden in den Speicher 112 eingeschrieben und zum geeigneten Zeitpunkt aus ihm ausgelesen, um Operationen auszuführen. Das so erzielte Ausgangssignal wird von einem Ausgangstor 113 an den Ausgangsanschluß 55 angelegt. Die Zentraleinheit 6, die Speicher 107 und 112 und die Tor 111 und 113 sind mit einem Bus 114 verbunden.
- Das Ausgangssignal vom SF-Schaltungsteil, d. h. vom Synthesefilterschaltungsteil 16 läßt sich auf irgendeine der oben erwähnten Weisen erzielen. Das Ausgangssignal wird in Fig. 2 mit Hilfe des DAU-Schaltungsteils 17 in ein analoges Signal umgesetzt, um ein Sprachausgangssignal zu erhalten. Wenn das Eingangssignal zum DAU-Schaltungsteil 17 ein serielles Signal ist, dann wird es an ein Schieberegister 115 angelegt und der Inhalt des Schieberegisters 115 mittels eines DA-Umsetzers 116 in analoge Form umgesetzt.
- Wie zuvor beschrieben, können die LSP-Parameter ω i und R i in den charakteristischen Sprachparametern, die bei der Erfindung verwendet werden, durch Lösen der Gleichungen (5) und (6) erhalten werden. In den Fig. 14A und 14B sind die Ergebnisse einer Analyse der Lautfolge "bakuoNga" unter Verwendung der LSP-Parameter ω i und R i gezeigt. In den Fig. 14A und 14B ist auf der Abszisse die Zeit t, in Fig. 14A auf der Ordinate die Stärke und in Fig. 14B auf der Ordinate die normierte Kreisfrequenz aufgetragen. Betrachtet man Momentanpunkte in Fig. 14B, dann steigt die Frequenz in der Reihenfolge der Parameter R&sub1;, ω&sub1;, R&sub2;, ω&sub2; . . . R&sub5;, ω&sub5;. Diese Reihenfolge ändert sich nicht, und R i und ω i fallen innerhalb eines Blocks nicht zusammen. Es ist demzufolge garantiert, daß der SF-Schaltungsteil 16 ständig stabil ist. Die Frequenzverteilungen der LSP-Parameter R i und ω i sind in Fig. 15 gezeigt, in der auf der Abszisse die normierte Kreisfrequenz f und auf der Ordinate die relative Frequenz D aufgetragen sind. Wie in Fig. 15 gezeigt, sind die einzelnen Parameter nicht über ein breites Frequenzband verteilt, sondern auf ein relativ schmales Frequenzband beschränkt, so daß die LSP-Parameter ω i und R i in Verbindung mit dem Frequenzbereich, über den sie sich erstrecken, quantisiert werden können.
- Die LSP-Parameter ω i und R i sind gering bezüglich Quantisierungsverzerrung. Fig. 16 zeigt eine Spektralverzerrung D S einer Kunstsprache, wenn verschiedene Parameter verschieden quantisiert werden. Die Abszisse stellt die Anzahl von Quantisierungsbits B per Block und die Ordinate die Spektralverzerrung D S dar. Die Linie 117 zeigt den Fall, wo unter Berücksichtigung allein der Parameterverteilung der PARCOR- Koeffizient linear quanitisiert ist, nur im Koeffizient war verteilt. Die Linie 118 zeigt den Fall, daß die Anzahl von Quantisierungsbits für den PARCOR-Koeffizient unter Berücksichtigung der Spektralempfindlichkeit zusätzlich zur Parameterverteilung im Fall von Linie 117, speziell im Fall einer merklichen Beeinflussung des Spektrums, vergrößert wurde. Die Linie 119 zeigt den Fall, daß die LSP-Parameter ω i und R i unter Berücksichtigung nur der Parameterverteilung quantisiert wurden. Die Linie 121 zeigt den Fall, daß die LSP-Parameter ω i und R i unter Berücksichtigung der Parameterverteilung und der Spektralempfindlichkeit quantisiert wurden. Man kann Fig. 16 entnehmen, daß im Fall der Verwendung der gleichen Anzahl von Quantisierungsbits die Spektralverzerrung in der Reihenfolge der Linien 117, 118, 119 und 121 kleiner wird. Da die Linien 119 und 121 nahe beieinanderliegen, werden die LSP-Parameter ω i und R i bezüglich der Spektralverzerrung nicht so sehr beeinflußt, auch wenn die Spektralempfindlichkeit nicht in Betracht gezogen wird. Da es also ausreicht, die Quantisierung unter Berücksichtigung des Parameterverteilungsbereichs allein durchzuführen, ist diese Quantisierung einfach. Teilt man die Anzahl von Quantisierungsbits pro Block, bei der die Spektralverzerrung im Fall der Linie 119 ein dB ist durch die Anzahl der Quantisierungsbits im Fall der Linie 117, ergibt sich ein Wert 0,7. In ähnlicher Weise wird das Verhältnis der Anzahl von Quantisierungsbits pro Block, bei der die Spektralverzerrung 1 dB ist, zwischen den Linien 118 und 121, 0,8. Hieraus geht hervor, daß die LSP-Parameter ω i und R i ausgezeichnet sind. Ein dB ist eine Differenzempfindungsgrenze der Spektralverzerrung von Kunstsprache.
- Fig. 17 zeigt Interpolationseigenschaften, wobei die Abszisse eine Blocklänge T f und die Ordinate die Spektralverzerrung D S darstellen. Fig. 17 zeigt die Spektralverzerrung von Kunstsprache für den Fall, daß ein Block, in dem Originalsprachlaute in 10 ms analysiert wurden, als Bezug verwendet wurde, die Blocklänge auf 20 bis 70 ms erhöht wurde und die Parameter alle 10 ms interpoliert wurden. Die Linie 122 zeigt den Fall, wo die PARCOR-Koeffizienten verwendet wurden, während die Linie 123 den Fall zeigt, daß die LSP-Parameter ω i und R i verwendet wurden. Wie aus Fig. 17 erkennbar, kann bei derselben Verzerrung die Blocklänge T f bei Verwendung der LSP-Parameter länger als die Blocklänge T f bei Verwendung der PARCOR-Koeffizienten gemacht werden, d. h. die Periode zur Erneuerung der Parameter kann verlängert werden, so daß die Gesamt- Informationsmenge hierdurch verringert werden kann. Da ferner die Anzahl von Bits pro Block bei den LSP-Parametern geringer als bei den PARCOR-Koeffizienten ist, wie man aus Fig. 16 entnimmt, wird die Informationsmenge bei derselben Verzerrung um das Produkt der Verminderungsverhältnisse in den Fig. 16 und 17 geringer. Das heißt im Fall der LSP-Parameter kann die Informationsmenge etwa 60% derjenigen im Fall der PARCOR-Koeffizienten betragen.
- Bei Einsatz der LSP-Parameter ist es wie im Fall anderer Parameter ohne Bedeutung, daß sie mit einer kürzeren Periode als der Abtastperiode der Originalsprache, die zur Gewinnung der Parameter verwendet wird, interpoliert werden. Experimente ergaben, daß die Interpolationsperiode etwa zweimal so groß oder weniger als die Abtastperiode der Originalsprache sein kann, daß jedoch, wenn die erstere etwa zweimal so groß wie die letztere ist, Störungen oder Rauschen eingeführt wird, das die Kunstsprache undeutlich macht. Es ist daher vorzuziehen, daß die Interpolationsperiode gleich der oder zweimal so groß wie die Abtastperiode der Originalsprache ist.
- Wie im Vorangehenden beschrieben, ist es relativ leicht, die LSP-Parameter automatisch herauszuziehen, so daß dies auf Echtzeitbasis erfolgen kann. Ferner sind die LSP-Parameter ausgezeichnet bezüglich der Interpolationseigenschaft, haben geringe Abweichung bezüglich der Quantisierungseigenschaft und erlauben Übertragung und Speicherung von Sprache mit geringer Informationsmenge. Bei der Sprachsynthese kann Sprache hoher Qualität wiedergewonnen und mit einer geringen Informationsmenge künstlich aufgebaut werden, wobei die Stabilität des Synthetisierungsfilters garantiert ist, solange das Verhältnis von Gleichung (8&min;) gilt.
- Bei der Anordnung gemäß Fig. 2 ist es auch möglich, das Spektrum dadurch auszuweiten, daß vom Impulsgenerator 28 eine Kette von Impulsgruppen, wie etwa die Barker-Folge, anstelle der Impulskette erzeugt wird. Der PI-Schaltungsteil 14 kann auch in der dem PT-Schaltungsteil 13 vorangehenden Stufe vorgesehen werden. Das heißt, die LSP-Parameter vom Interface- Schaltungsteil 12 können auch nach ihrer Interpolation der Kosinustransformation im PT-Schaltungsabschnitt 13 unterzogen werden. In diesem Fall ist die Verwendung eines Festspeichers unwirtschaftlich, da seine Speicherkapazität enorm sein müßte. Demzufolge ist es vorzuziehen, die Parameterumsetzung unter Verwendung einer Näherungsfunktion des Kosinus durchzuführen, statt den in Verbindung mit dem Beispiel von Fig. 2 beschriebenen Festspeicher zu verwenden. In Fig. 2 wird die Information, die angibt, ob es sich um einen stimmhaften oder stimmlosen Sprachlaut handelt, in das Stimmhaftregister 23 und das Stimmlosregister 24 eingespeichert. Diese Information muß jedoch nicht immer vorgesehen werden. Das heißt, es wird eine Detektorschaltung vorgesehen, die ermittelt, ob der an das Tonhöhenregister 25 angelegte Grundperiodenparameter Null ist oder nicht. Wird festgestellt, daß dieser Parameter Null ist, dann gilt dies als Entscheidung, daß der Laut stimmlos ist, so daß das Verknüpfungsglied 37 durchgeschaltet wird. Im Fall von von Null abweichenden Werten wird der Laut als stimmhaft betrachtet und das Verknüpfungsglied 31 durchgeschaltet. Die Steuerung durch den Amplitudenparameter kann auch in Verbindung mit dem Ausgang des SF- Schaltungsteils 16 durchgeführt werden, wie dies vorangehend unter Bezug auf die Ausführungsform von Fig. 12 erläutert wurde.
- Bei der vorangehenden Beschreibung wurde als Synthesefilter ein Filter verwendet, das im Rückkopplungskreis Mittel enthält, um eine Vielzahl von Filtern erster Ordnung und zweiter Ordnung unterschiedlicher Koeffizienten in Reihe zu schalten, die die Nullstelle auf einem Einheitskreis besitzen. Dies erfolgte unter Benutzung der LSP-Parameter. Das Synthesefilter muß jedoch nicht immer speziell auf solch ein Filter beschränkt sein. Vielmehr kann die Sprachsynthese auch durchgeführt werden, indem die LSP-Parameter in andere Parametertypen transformiert werden und andere Filter verwendet werden. In Fig. 18 z. B., in der Teile, die solchen von Fig. 1 entsprechen, mit gleicher Bezugszahl bezeichnet sind, wird der Grundperiodenparameter in den charakteristischen Parametern, die dem Interface- Schaltungsabschnitt 12 zugeführt werden, dem TQSG- Schaltungsteil 15 zugeführt, während der Amplitudenparameter dem PI-Schaltungsteil 14 geliefert wird. Der auf diese Weise interpolierte Amplitudenparameter wird an den TQSG-Schaltungsteil 15 angelegt und in diesem in der zuvor unter Bezug auf Fig. 2 erläuterten Weise verarbeitet, wobei an den SF-Schaltungsteil 16 ein Tonquellensignal geliefert wird. Die LSP-Parameter werden einem LSP-Parametertransformierungs-Schaltungsteil 124 geliefert, in welchem sie zu anderen Parametertypen, etwa einem α-Parameter, PARCOR-Parameter oder andere transformiert werden. Beispielsweise werden von den LSP-Parametern unter Verwendung der Gleichung (5) oder (6) Polynome P(Z) und Q(Z) gewonnen und von den Polymeren unter Verwendung der Gleichungen (1) und (2) die Prädiktorkoeffizienten α i der Übertragungsfunktion H(Z). Durch Interpolation der so erhaltenen Prädiktorkoeffizienten α i im PI-Schaltungsteil 14 in der erforderlichen Weise werden die Eigenschaften des SF-Schaltungsteils 16 gesteuert. Der SF-Schaltungsteil 16 ist beispielsweise als ein zyklisches Filter ausgebildet, in dem, wie in Fig. 18 gezeigt, das Tonquellensignal vom TQSG-Schaltungsteil 15 mittels eines Multiplizierers 125 um σ vervielfacht und zur Subtraktion vom Ausgangssignal eines Addierers 127 an einen Addierer 126 angelegt wird. Das Ausgangssignal vom Addierer 126 wird dem Ausgangsanschluß 55 geliefert. Das so gewonnene Ausgangssignal am Ausgangsanschluß 55 wird an eine Reihenschaltung von Verzögerungsschaltungen D&sub1; bis D p angelegt, von denen jede eine Verzögerungszeit gleich einer Abtastperiode besitzt. Die Ausgangssignale von den Verzögerungsschaltungen D&sub1; bis D p werden mit jeweiligen Koeffizienten α&sub1; bis α p vom PI-Schaltungsteil 14 in Multiplizierern M&sub1; bis M p multipliziert. Die multiplizierten Ausgangssignale werden der Reihe nach addiert und dann im Addierer 127 zusammenaddiert.
Claims (5)
1. Tonsyntheseverfahren, umfassend die Schritte:
- Erzeugen von ersten Steuerparametern, die eine Übertragungsfunktion °=c:30&udf54;&udf53;vu10&udf54;&udf53;vz2&udf54; &udf53;vu10&udf54;bestimmen,
- Senden und/oder Speichern der ersten Steuerparameter,
- Transformieren der ersten Steuerparameter in von diesen verschiedene zweite Steuerparameter,
- Erzeugen eines Tonquellensignals, und
- Steuern der Filtereigenschaften eines Tonsynthesefilters mit den zweiten Steuerparametern, während das Tonsynthesefilter durch das Tonquellensignal angeregt wird, um dadurch einen Ton zusammenzusetzen,
dadurch gekennzeichnet, daß die ersten Steuerparameter LSP-(Linienspektrumpaar-)Parameter ω i und R i sind, die ausgedrückt werden durch Kreisfrequenzen, bei denen die Wurzeln der Polynome P(Z) und Q(Z) Null werden können, mit
P(Z) = A p (Z) - Z p + 1 A p (Z -1)
Q(Z) = A p (Z) + Z p + 1 A p (Z -1)
und daß die LSP-Parameter in die zweiten Steuerparameter transformiert werden.
P(Z) = A p (Z) - Z p + 1 A p (Z -1)
Q(Z) = A p (Z) + Z p + 1 A p (Z -1)
und daß die LSP-Parameter in die zweiten Steuerparameter transformiert werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß beim Transformieren der LSP-Parameter in die zweiten Steuerparameter die LSP-Parameter in Prädiktorkoeffizienten α i transformiert werden, die die Übertragungsfunktion H(Z) definieren, und daß das Tonsynthesefilter mit den Prädiktorkoeffizienten α i gesteuert wird.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die LSP-Parameter in PARCOR-Koeffizienten transformiert werden, die die Übertragungsfunktion H(Z) definieren, und daß das als PARCOR-Filter ausgebildete Tonsynthesefilter mit den PARCOR-Koeffizienten gesteuert wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die zweiten Steuerparameter interpoliert werden.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP54128365A JPS5853352B2 (ja) | 1979-10-03 | 1979-10-03 | 音声合成器 |
JP12836679A JPS5651116A (en) | 1979-10-03 | 1979-10-03 | All pole type digital filter |
Publications (1)
Publication Number | Publication Date |
---|---|
DE3050742C2 true DE3050742C2 (de) | 1987-01-15 |
Family
ID=26464060
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19803037276 Expired DE3037276C2 (de) | 1979-10-03 | 1980-10-02 | Tonsynthesizer |
DE19803050742 Expired DE3050742C2 (de) | 1979-10-03 | 1980-10-02 | Tonsyntheseverfahren |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19803037276 Expired DE3037276C2 (de) | 1979-10-03 | 1980-10-02 | Tonsynthesizer |
Country Status (5)
Country | Link |
---|---|
DE (2) | DE3037276C2 (de) |
FR (1) | FR2466826A1 (de) |
GB (2) | GB2131659B (de) |
NL (1) | NL189320C (de) |
SE (1) | SE444730B (de) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5814898A (ja) * | 1981-07-20 | 1983-01-27 | ヤマハ株式会社 | 反射残響音付加装置 |
US4660163A (en) * | 1983-01-17 | 1987-04-21 | OKI Electric Co. Ltd | Adaptive digital filter |
US4731835A (en) * | 1984-11-19 | 1988-03-15 | Nippon Gakki Seizo Kabushiki Kaisha | Reverberation tone generating apparatus |
BE1007428A3 (nl) * | 1993-08-02 | 1995-06-13 | Philips Electronics Nv | Transmissiesysteem met reconstructie van ontbrekende signaalmonsters. |
US5704001A (en) * | 1994-08-04 | 1997-12-30 | Qualcomm Incorporated | Sensitivity weighted vector quantization of line spectral pair frequencies |
JPH09230896A (ja) * | 1996-02-28 | 1997-09-05 | Sony Corp | 音声合成装置 |
DK3136384T3 (en) * | 2014-04-25 | 2019-04-15 | Ntt Docomo Inc | DEVICE FOR CONVERTING A LINEAR FORECAST COFFEE AND PROCEDURE FOR CONVERTING A LINEAR FORECAST COFFEE |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3624302A (en) * | 1969-10-29 | 1971-11-30 | Bell Telephone Labor Inc | Speech analysis and synthesis by the use of the linear prediction of a speech wave |
FR2199427A5 (de) * | 1972-09-12 | 1974-04-05 | Ibm France | |
GB1603993A (en) * | 1977-06-17 | 1981-12-02 | Texas Instruments Inc | Lattice filter for waveform or speech synthesis circuits using digital logic |
-
1980
- 1980-09-24 GB GB8318893A patent/GB2131659B/en not_active Expired
- 1980-09-24 GB GB8030747A patent/GB2059726B/en not_active Expired
- 1980-10-01 NL NL8005449A patent/NL189320C/xx not_active IP Right Cessation
- 1980-10-01 SE SE8006850A patent/SE444730B/sv not_active IP Right Cessation
- 1980-10-02 DE DE19803037276 patent/DE3037276C2/de not_active Expired
- 1980-10-02 FR FR8021110A patent/FR2466826A1/fr active Granted
- 1980-10-02 DE DE19803050742 patent/DE3050742C2/de not_active Expired
Non-Patent Citations (1)
Title |
---|
US-The Journal of the Acoustical Society of America, Vol. 50, 1971, No. 2 (Part 2), Seiten 637 bis 655 * |
Also Published As
Publication number | Publication date |
---|---|
NL189320B (nl) | 1992-10-01 |
GB8318893D0 (en) | 1983-08-17 |
DE3037276A1 (de) | 1981-04-09 |
GB2059726B (en) | 1984-06-27 |
SE444730B (sv) | 1986-04-28 |
DE3037276C2 (de) | 1985-08-01 |
GB2059726A (en) | 1981-04-23 |
FR2466826B1 (de) | 1984-09-14 |
FR2466826A1 (fr) | 1981-04-10 |
NL8005449A (nl) | 1981-04-07 |
GB2131659B (en) | 1984-12-12 |
SE8006850L (sv) | 1981-04-04 |
NL189320C (nl) | 1993-03-01 |
GB2131659A (en) | 1984-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3883034T2 (de) | System zur Sprachsynthese. | |
DE3485792T2 (de) | Digitale signalverarbeitungseinrichtungen. | |
DE3688600T2 (de) | Musikinstrument mit digitalem Filter mit programmierten variablen Koeffizienten. | |
DE3587423T2 (de) | Tonerzeugende Vorrichtung für ein elektronisches Musikinstrument. | |
DE2362050C3 (de) | Elektronisches Musikinstrument | |
DE3788010T2 (de) | Mehrstufiges Multiplizier- und Addiergerät für Digitalsignale. | |
DE3587655T2 (de) | ÜBERTRAGUNGSANORDNUNG FüR DIGITALSIGNALEN. | |
DE2524497A1 (de) | Phasenvocoder-sprachsynthesesystem | |
DE2431161C2 (de) | Tonerzeugungseinrichtung für ein elektronisches Musikinstrument | |
DE2708006C2 (de) | Tonsignal-Hüllkurven-Generatorschaltung für ein elektronisches Musikinstrument | |
DE2229149A1 (de) | Verfahren zur Übertragung von Sprache | |
DE2920298A1 (de) | Binaere interpolatorschaltung fuer ein elektronisches musikinstrument | |
DE69423240T2 (de) | Verfahren und vorrichtung für quadratische interpolation | |
DE2706045A1 (de) | Elektronisches musikinstrument | |
DE2730662A1 (de) | Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors | |
DE3050742C2 (de) | Tonsyntheseverfahren | |
DE3586366T2 (de) | Verfahren und schaltung zur erzeugung eines zeitvariablen signals. | |
DE69018687T2 (de) | Musiksynthesizer. | |
DE3226619C2 (de) | ||
DE69932673T2 (de) | Digitaler Signalsynthetisierer | |
DE2724347A1 (de) | Deltamodulator mit einem quantisierenden vergleicher | |
DE69603360T2 (de) | Verfahren und vorrichtung zur synthetisierung von musiktönen durch frequenzmodulation und mittels eines filters | |
DE2513127C2 (de) | Verfahren zum künstlichen Erzeugen eines musikalischen Klangs | |
DE3226538A1 (de) | Stimm-synthesizer | |
EP0036074A1 (de) | Syntheseschaltung für periodische Signale, insbesondere als Teil eines Musikinstruments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
Q172 | Divided out of (supplement): |
Ref country code: DE Ref document number: 3037276 |
|
8181 | Inventor (new situation) |
Free format text: ITAKURA, FUMITADA, HOUYA, TOKYO, JP SUGAMURA, NOBORU, IRUMA, SAITAMA, JP |
|
8110 | Request for examination paragraph 44 | ||
8127 | New person/name/address of the applicant |
Owner name: NIPPON TELEGRAPH AND TELEPHONE CORP., TOKIO/TOKYO, |
|
AC | Divided out of |
Ref country code: DE Ref document number: 3037276 Format of ref document f/p: P |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8328 | Change in the person/name/address of the agent |
Free format text: HOFFMANN, E., DIPL.-ING., PAT.-ANW., 82166 GRAEFELFING |