DE3510660C2 - - Google Patents
Info
- Publication number
- DE3510660C2 DE3510660C2 DE3510660A DE3510660A DE3510660C2 DE 3510660 C2 DE3510660 C2 DE 3510660C2 DE 3510660 A DE3510660 A DE 3510660A DE 3510660 A DE3510660 A DE 3510660A DE 3510660 C2 DE3510660 C2 DE 3510660C2
- Authority
- DE
- Germany
- Prior art keywords
- frequency
- signal
- changing component
- output
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000000737 periodic effect Effects 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/06—Non-recursive filters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Electrophonic Musical Instruments (AREA)
- Complex Calculations (AREA)
Description
Die Erfindung betrifft ein Verfahren zum Verarbeiten eines
Sprachsignals nach dem Oberbegriff des Anspruchs 1 sowie
eine Einrichtung zur Durchführung dieses Verfahrens nach dem
Oberbegriff des Anspruchs 5.
Ein derartiges Verfahren zum Verarbeiten eines Sprachsignals
ist aus der DE-AS 25 36 640 bekannt. Auch bei diesem bekannten
Verfahren wird ein Sprachsignal verarbeitet, welches sich
über einen gewissen Frequenzbereich erstreckt und sowohl
eine sich verhältnismäßig langsam ändernde Komponente als
auch eine sich verhältnismäßig schnell ändernde Komponente
aufweisen kann, was vom jeweiligen Sprachsignal abhängig ist.
Gemäß diesem bekannten Verfahren wird das Spachsignal wiederholt
von dem einen zu dem anderen Ende des Frequenzbereichs
des Sprachsignals in einem vorbestimmten Zeitintervall
abgefragt, um dadurch eine periodische Wellenform zu bilden,
deren Periode zweimal der Frequenzbereich des zu verarbeitenden
Sprachsignals ist. Die Einrichtung zur Durchführung dieses
bekannten Verfahrens enthält einen Frequenzanalysator bzw.
eine Filterbank, um das eingegebene Signal in eine Anzahl
aneinander grenzender Frequenzbereiche oder spektraler
Komponenten zu zerlegen.
Im folgenden wird anhand von Fig. 1 ein herkömmliches
Verfahren nach der
näher erläutert.
Ein in Fig. 1 dargestelltes Signal A weist eine Häufigkeitsverteilungskurve
für ein Sprachsignal auf und, wie dargestellt,
hat die Kurve A einen sich verhältnismäßig langsam
ändernden (Schwingungs-)Anteil, in welchem deren Ausgangspegel
abnimmt, wenn die Frequenz ansteigt, und auch einen
sich verhältnismäßig schnell ändernden (Schwingungs-)
Bereich, welcher durch drei örtliche Maxima B₁ bis B₃
angezeigt ist, welche eine phonetische Information darstellen.
Bei einem Verfahren zur Erkennung eines Sprachsignals
wird die phonetische Information B₁ bis B₃ aus dem Sprachsignal
A extrahiert, das zur Erkennung des Sprachsignals
verwendet wird. Wenn jedoch phonetische Informationen aus
einem Sprachsignal extrahiert wird, kommt es in diesem
Fall zu einer Verschlechterung der hochfrequenten Komponenten,
was von der Klangerzeugungscharakteristik einer
Klang- oder Schallquelle abhängt.
Um das Gewinnen bzw. Extrahieren von phonetischer Information
durchzuführen, während gleichzeitig eine hohe Genauigkeit
bis zu höheren Frequenzen erhalten bleibt, ist vorgeschlagen
worden, eine Korrekturhilfe einer annähernd geraden
Linie durchzuführen, welche mittels der Methode des kleinsten
Quadrats erhalten worden ist. Gemäß diesem vorgeschlagenen
Verfahren wird die spektrale Sprachverteilung X i , wobei i
die Kanalzahl ist, durch eine Gerade angenähert, welche
durch y = ai + b festgelegt ist, wobei X i - (ai + b) als ein
neuer Kennlinienparameter der neuen spektralen Sprachverteilung
festgelegt ist. In diesem Fall sind a und b festgesetzt
durch:
Jedoch ist die Berechnung von a und b ziemlich kompliziert,
zeitaufwendig und teuer.
Die der Erfindung zugrunde liegende Aufgabe besteht darin,
ein Verfahren zum Verarbeiten eines Sprachsignals der angegebenen
Gattung und eine Einrichtung zur Durchführung dieses
Verfahrens zu schaffen, durch welches bzw. durch die aus
dem Sprachsignal ohne eine Verzerrung des verarbeiteten
Signals eine bestimmte sich verhältnismäßig schnell ändernde
Komponente gewonnen werden kann.
Diese Aufgabe wird erfindungsgemäß durch die im Kennzeichnungsteil
des Anspruchs 1 aufgeführten Merkmale gelöst.
Eine Einrichtung zur Durchführung des erfindungsgemäßen
Verfahrens ergibt sich aus dem Kennzeichnungsteil des
Anspruchs 5.
Besonders vorteilhafte Ausgestaltungen des erfindungsgemäßen
Verfahrens ergeben sich aus den Ansprüchen 2 bis
4, während vorteilhafte Ausführungsformen der Einrichtung
zur Durchführung des erfindungsgemäßen Verfahrens aus den
Ansprüchen 6 bis 9 hervorgehen.
Im folgenden wird die Erfindung anhand von Ausführungsbeispielen
unter Hinweis auf die Zeichnung näher erläutert.
Es zeigt
Fig. 1 einen Graphen, in welchem die übliche
spektrale Häufigkeitsverteilung eines
Sprachsignals wiedergegeben ist, wobei
fünfzehn Kanäle auf der Abszisse und
auf der Ordinate die Pegel des jeweiligen
Frequenzspektrums aufgetragen sind,
Fig. 2 und 3 schematische Darstellungen, welche zur
Erläuterung des Grundgedankens der Erfindung
verwendbar sind,
Fig. 4 ein Blockdiagramm einer Einrichtung zum
Extrahieren
der sich verhältnismäßig schnell ändernden
Komponente (phonetische Information) des Sprachsignals,
Fig. 5 ein Blockdiagramm des Gesamtaufbaus
eines Filters mit linearer Phasenkennlinie,
welches insbesondere für eine
Verwendung in der Einrichtung der Fig. 4
geeignet ist,
Fig. 6 ein Blockdiagramm einer weiteren Ausführungsform
eines Linearphasenfilters,
Fig. 7 und 8 Blockdiagramme, die jeweils übliche,
herkömmliche Linearphasenfilter mit
Digitaltechnologie darstellen, und
Fig. 9 und 10 Blockdiagramme von Beispielen analoger
Linearphasenfilter mit Merkmalen nach der Erfindung.
Wenn, wie in Fig. 1 dargestellt,
der frequenzanalysierte Ausgang einer Filteranordnung
u. ä. (15 Kanäle in dem dargestellten Beispiel) als
Funktion der Frequenz aufgetragen wird, wird ein Signal A
mit einer sich verhältnismäßig langsam ändernden Komponente,
was durch ein allmähliches Abnehmen im Pegel von
dem Kanal 1 bis zum Kanal 15 angezeigt ist, und einer sich
verhältnismäßig schnell ändernden Komponente erhalten, was
durch drei Maxima B₁ bis B₃ angezeigt ist. Die Frequenz-
bzw. Häufigkeitsverteilungskurve A, welche durch Verarbeiten
eines bestimmten Sprachsignals erhalten worden
ist, ist durch die sich verhältnismäßig schnell ändernde
Komponente oder durch Scheitelwerte und Täler charakterisiert,
welche eine phonetische Information darstellen, welche
einen Formanten u. ä. festlegt. Sofern eine Stimmerkennung
betroffen ist, ist es somit erwünscht, die sich verhältnismäßig
schnell ändernde Komponente aus der Häufigkeits- bzw.
Frequenzverteilungskurve A zu extrahieren.
Gemäß der Erfindung wird dann das in Fig. 1 dargestellte
Verteilungsmuster wiederholt durchlaufen, nämlich zuerst
vom Kanal 1 zum Kanal 15, dann vom Kanal 15 zum Kanal 1
und dann wieder vom Kanal 1 zum Kanal 15, um dadurch eine
periodische Wellenform auszubilden, welche sich bezüglich
der Zeit ändert, wie in Fig. 2 dargestellt ist. Dann wird
die niederfrequente Komponente, welche durch den sich verhältnismäßig
langsam ändernden Anteil des Signals A festgelegt
ist, wie durch die gestrichelte Linie angezeigt ist,
durch ein Hochpaßfilter mit einer linearen Phasencharakteristik
entfernt, so daß dadurch eine phonetische Information
B₁ bis B₃ ohne Phasenverzerrung erzeugt wird, wie in Fig. 3
dargestellt ist.
Folglich wird gemäß der Erfindung, statt eine Korrektur mit
Hilfe einer angenäherten Geraden durchzuführen, welche nach
der Methode des kleinsten Quadrats erhalten worden ist, das
Frequenzverteilungsmuster eines bestimmten Bereichs,
welches als Ergebnis einer Frequenzanalyse eines Sprachsignals
erhalten worden ist, abwechselnd entlang
einer Zeitachse wiederholt, um eine periodische Wellenform
zu bilden, welche dann gefiltert wird, um so die phonetische
Information extrahiert erhalten zu können. Folglich
kann gemäß der Erfindung das äquivalente Ergebnis erhalten
werden, ohne daß eine nach der Methode des kleinsten Quadrats
erhaltene, angenäherte Gerade verwendet wird.
In Fig. 4 ist in Blockform eine Einrichtung nach dem Anspruch 5
gemäß einer Ausführungsform der Erfindung wiedergegeben.
Wie dargestellt, weist die Einrichtung
einen Eingangsanschluß 1 zum Empfangen
eines Tonsignals, wie einer Stimme, einen Frequenzanalysator
2 mit einer vorbestimmten Anzahl von Kanälen, um
die Frequenz des Tonsignals über dem durch die Kanäle festgelegten
Frequenzbereich zu analysieren, einen Selektor 3
zum Auswählen der Ausgangskanäle des Frequenzanalysators 2,
eine Steuerschaltung 4 zum Steuern des Betriebs des Selektors
3, um die Ausgangskanäle des Frequenzanalysators 2
abzutasten, ein Hochpaßfilter 5 zum Entfernen der niederfrequenten
Komponente und einen Ausgangsanschluß 6 auf, an
welchem die extrahierte phonetische Information anliegt.
Wenn bei diesem Aufbau ein Tonsignal über den Eingangsanschluß
1 in den Frequenzanalysator 2 eingegeben wird, welcher
beispielsweise aus einer Filteranordnung
gebildet sein kann, wird eine spektrale Frequenz- oder
Häufigkeitsverteilung erhalten, wie sie in Fig. 1 wiedergegeben
ist. In der dargestellten Ausführungsform hat der
Frequenzanalysator 2 fünfzehn Ausgangskanäle, und der Ausgangsselektor
3 tastet die Ausgangskanäle in der ersten
Folge von Kanal 1 bis Kanal 15, in der anschließenden,
zweiten Folge von Kanal 15 zu Kanal 1 in der weiteren,
dritten Folge von Kanal 1 zu Kanal 15 usw. gesteuert durch
die Steuerschaltung 4 ab. Folglich wird ein zeitlich gesteuertes
Folgesignal erhalten, wie es in Fig. 2 dargestellt
ist. Die Steuerschaltung 4 mit einer solchen Steuerfunktion
kann ohne Schwierigkeiten beispielsweise aus einem Auf-/Abwärtszähler
gebildet sein. Das auf diese Weise erhaltene
sequentielle Signal über der Zeit, wie es in Fig. 2 dargestellt
ist, wird durch das Hochpaßfilter 5 mit einer linearen
Phasencharakteristik geschickt, wobei die niederfrequente
Komponente, welche durch die gestrichelten Linien in Fig. 2
angezeigt ist, entfernt wird, so daß die hochfrequente Komponente
am Ausgangsanschluß extrahiert erhalten wird.
In Fig. 5 ist in Blockform ein Beispiel des Hochpaßfilters
mit einer linearen Phasencharakteristik dargestellt, welches
sich insbesondere für eine Verwendung in der Einrichtung der
Fig. 4 eignet. Wie dargestellt, ist in dem wiedergegebenen
linearen Phasenfilter ein Kammfilter, welches durch eine
geschlossene Schleife mit einem Verzögerungselement Z -8
festgelegt ist, und ein Allpolfilter vorgesehen, welches
durch eine geschlossene Schleife mit einem Verzögerungselement
Z -1 festgelegt und in Reihe mit dem Kammfilter geschaltet
ist. Das Allpolfilter ist ein Filter, welches nur Pole
und keine Nullen erzeugt. Folglich wird im Falle eines Allpolfilters
mit einem Verzögerungselement Z -p eine Anzahl
p Pole erzeugt. In der in Fig. 5 dargestellten Ausführung
ist eine Reihenschaltung 8 aus Kamm- und Allpolfiltern in
Reihe mit einer weiteren Reihenschaltung 8′ aus Kamm- und
Allpolfiltern geschaffen, wodurch ein Tiefpaßfilter festgelegt
ist. Ein Phasenkorrektor 13 ist über ein Subtrahierglied
14 parallel zu dem Tiefpaßfilter aus den zwei Stufen
8 und 8′ geschaltet, wodurch ein Hochpaßfilter festgelegt
ist.
In dem in Fig. 5 dargestellten Aufbau sind die Elemente,
welche mit Z -p bezeichnet wird, wie beispielsweise die
Elemente 11, 11′, 13, 9 und 9′, alles Verzögerungselemente,
wobei Z -1, Z -7 und Z -8 anzeigen, daß sie die Verzögerung
von einer Grundzeitperiode, von sieben Grundzeitperioden
bzw. von acht Grundzeitperioden schaffen. In den beiden
Stufen 8 und 8′ wird der Ausgang jedes der Verzögerungselemente
9 und 9′, welche acht Grundzeitperioden schaffen,
in einem der entsprechenden Addierer 10 bzw. 10′ zu dem
Eingang addiert. Da die Verzögerungselemente 11 und 11′ zu
den entsprechenden Addierern 10 und 10′ in einem Rückkopplungszweig
geschaltet sind, wird der Ausgang des Addierers
10 oder 10′ mit einer Verzögerung von einer Grundzeitperiode
zurück zu dem Addierer 10 oder 10′ addiert. Der auf
diese Weise addierte Ausgang wird dann in einer Multipliziereinheit
12 oder 12′ mit einem Koeffizienten k multipliziert.
Wenn nunmehr k = 1/8 ist, ist die Übertragungsfunktion H(z)
des Systems folgende:
Folglich ist ein Hochpaßfilter festgelegt. Eine derartige
Schaltung kann beispielsweise ohne Schwierigkeit durch einen
Mikroprozessor gebildet werden. Die vorstehende Gleichung
(1) kann folgendermaßen umgeschrieben werden:
H(Z) = Z -7 (1 - (1/64) (1 + Z -1 + Z -2 + . . . + Z -7)²) (2)
In Fig. 6 ist in Blockform ein Beispiel der Schaltung dargestellt,
welche gemäß der vorstehenden Gleichung (2) ausgeführt
ist. In Fig. 6 sind Verzögerungselemente 9₁ bis 9₇
und 9₁′ bis 9₇′ vorgesehen; deren Ausgänge werden in Addierern
12 bzw. 12′ addiert und mit einem Koeffizienten k multipliziert
(wobei k = 1/8 ist). Andererseits wird mit der Verzögerung
des Elements Z -7 von dem Ausgang des Elements 9₇
der Ausgang des Addierers 12′ in einem Subtrahierglied 14
subtrahiert, um ein Ausgangssignal an dem Ausgangsanschluß
15 zu schaffen, so daß dadurch verständlich wird, daß dadurch
ein Hochpaßfilter geschaffen ist. Jedes der Verzögerungselemente
kann ohne weiteres durch ein analoges Schieberegister
wie beispielsweise eine BBD- oder Eimerketten-
Schaltung, oder durch eine Abfrage- und Halteschaltung ausgeführt
sein.
Wie oben beschrieben, kann mit der Erfindung eine gewünschte
spektrale Ton- oder Stimmfrequenzverteilung mit einem
einfachen Schaltungsaufbau aus einem Sprachsignal
ohne eine Phasenverzerrung extrahiert oder gewonnen werden,
und die auf diese Weise erhaltene spektrale Verteilung
ist in der Qualität im wesentlichen der Information äquivalent,
welche durch eine Korrektur mit Hilfe einer angenäherten
Geraden durch die Methode des kleinsten (Fehler-)
Quadrats erhalten worden ist.
Ein weiterer Gesichtspunkt der Erfindung wird nunmehr anhand
der Fig. 7 bis 10 beschrieben. Dieser Gesichtspunkt der Erfindung
betrifft die Technologie beim Ausführen des digitalen
Linearphasenfilters mit endlichem Impulsansprechverhalten
in
analoger Form. Im allgemeinen ist es
erwünscht, ein einfaches Verfahren
zu schaffen, um eine Information in dem Frequenzband
außerhalb des interessierenden Bereichs zu entfernen,
ohne daß eine Verzerrung in der Wellenform verursacht wird.
Aus diesem Grund ist vorgeschlagen worden, ein sogenanntes
Linearphasenfilter zu verwenden, bei welchem die digitale
Technologie angewendet ist.
In Fig. 7 ist in Blockform ein solches Linearphasenfilter
dargestellt, bei welchem die digitale Technologie angewendet
ist; es weist einen Eingangsanschluß 21, ein Mehrfach-Verzögerungselement
22, um eine P-fache Grundzeitverzögerung
zu schaffen, einen Addierer 23, ein Verzögerungselement
24 zum Erzeugen einer Grundzeitverzögerung, eine
Multipliziereinheit 25 und einen Ausgangsanschluß 26 auf.
Wie vorstehend beschrieben, ist das in Fig. 7 dargestellte
Linearphasenfilter eine Reihenschaltung aus einem Kammfilter
und einem Allpolfilter, so daß dessen Übertragungsfunktion
folgendermaßen ausgedrückt werden kann:
Folglich ist durch den in Fig. 7 dargestellten Aufbau wirksam
ein Tiefpaßfilter festgelegt.
Fig. 8 zeigt ein Hochpaßfilter, welches dadurch gebildet
wird, daß ein Verzögerungselement 28 hinzugefügt wird, um
eine Zeitverzögerung von (P-1)/2 bezüglich des in Fig. 7
wiedergegebenen Aufbaus zu schaffen, wobei das Verzögerungselement
28 über einen Addierer 29 zwischen die Eingangs-
und Ausgangsanschlüsse des in Fig. 7 wiedergegebenen Aufbaus
geschaltet ist. Folglich wird bei der Anordnung der
Fig. 8 nach einer Phaseneinstellung durch das Verzögerungselement
28 das verzögerte Eingangssignal einer Subtrahiereinheit 29
zugeführt, in welchen die niederfrequente Komponente von
dem Tiefpaßfilter 27 von dem verzögerten Eingangssignal subtrahiert
wird, wodurch dann die hochfrequente Komponente an
einem Ausgangsanschluß 30 geschaffen wird. Folglich kann die
Übertragungsfunktion in diesem Fall folgendermaßen ausgedrückt
werden:
Wie vorstehend beschrieben, zeigen die Elemente Z -1 und Z -p
die Zeitverzögerung über eine Grundzeitperiode bzw. über
das P-fache einer Grundzeitperiode an, und k ist ein Multiplikator,
welcher üblicherweise gleich 1/P ist. Ganz offensichtlich
kann ein solches digitales Filter in dem Fall
nicht verwendet werden, wo das Signal in analoger Form wie
in der vorstehend beschriebenen Anwendung verarbeitet wird.
Mit der vorstehenden Voraussetzung ist es daher
möglich, ein digitales Linearphasenfilter in
analoger Form zu schaffen, um dadurch das analoge Signal
ohne Schwierigkeit verarbeiten zu können.
Die vorstehende Gleichung (3) kann modifiziert werden, um
dann die folgende Gleichung zu erhalten:
H L (Z) = k (1 + Z -1 + Z -2 + . . . + Z -(P-1)) (3′)
Diese Funktion kann ausgeführt werden, indem eine Anzahl
(P-1) von Grundverzögerungselementen, welche eine Grundzeitverzögerung
schaffen, in Reihe geschaltet werden, und
indem die Ausgänge dieser Verzögerungselemente nach einem
Multiplizieren mit dem Koeffizienten k addiert werden.
In Fig. 9 ist in Blockform ein Beispiel eines Tiefpaßfilters
dargestellt, das gemäß der vorstehenden Gleichung
3′ ausgeführt ist. Wie dargestellt, weist das Filter einen
Eingangsanschluß 21 und eine Anzahl (P-1) Verzögerungselemente
31₁ bis 31 P-1 auf, welche ohne weiteres aus Abfrage-
und Halteschaltungen oder Ladungstransfereinrichtungen, wie
BB-Schaltungen bzw. Eimerketten-Schaltungen gebildet werden
können, welche analoge Schieberegister in dem Fall sind,
daß ein analoges (Schieberegister-)Signal zu behandeln
ist. Auch sind Multipliziereinheiten 32₁ bis 32 p vorgesehen,
welche das Signal mit dem Faktor k multiplizieren, welcher
üblicherweise gleich 1/P ist. In der Ausführungsform der
Fig. 10 sind auch ein Addierer 33, um die Ausgänge von den
Multipliziereinheiten 32₁ bis 32 P-1 zu addieren, und ein
Aussgangsanschluß 30 vorgesehen. Selbstverständlich kann die
in Fig. 10 dargestellte Ausführungsform auch in Kaskade geschaltet
werden.
Als nächstes kann die vorstehende Gleichung (5) modifiziert
werden, um daraus die folgende Gleichung zu erhalten:
H H (Z) = Z -(P-1)/2 (1 - k (1 + Z -1 + Z -2 + . . . + Z -(P-1))) (5′)
In Fig. 10 ist ein Beispiel eines Hochpaßfilters dargestellt,
das gemäß der vorstehenden Gleichung (5′) ausgeführt ist.
In diesem Fall braucht, wie in Fig. 8 dargestellt ist, nur
das Phaseneinstellelement 28 vorgesehen zu werden, das
parallel zu dem Tiefpaßfilter 27 geschaltet ist, damit eine
Subtraktion durchgeführt werden kann; das Tiefpaßfilter 27
kann mit Hilfe des in Fig. 9 dargestellten Aufbaus ausgeführt
werden. In der in Fig. 8 dargestellten Ausführungsform
ist das Phaseneinstellelement 28 als ein gesondertes Element
vorgesehen. Wenn jedoch der Ausgang von dem Verzögerungselement
31 (P-1)/2 des in Fig. 9 dargestellten Tiefpaßfilters
verwendet wird, wird ein Signal von dem Element
Z -(P-1)/2 erhalten. Folglich kann ein solches diskretes
Phaseneinstellelement 28 entfallen, wenn der Ausgang von dem
Verzögerungselement 31 (P-1)/2 des Tiefpaßfilters 27 verwendet
wird, wie in Fig. 10 dargestellt ist. In der in Fig. 10
dargestellten Ausführungsform wird die algebraische Differenz
zwischen dem Ausgang des Verzögerungselements 31 (P-1)/2
und dem Ausgang des Addierers 33 des Tiefpaßfilters 27 an
der Subtrahiereinheit 29 erhalten, wodurch dann ein hochpaßgefiltertes
Ausgangssignal an dem Ausgangsanschluß 30 erzeugt werden
kann. Selbstverständlich kann der Tiefpaßfilterteil in der
Ausführungsform der Fig. 10 oder die Ausführungsform der
Fig. 10 selbst auch in Form einer Kaskade geschaltet werden.
Die vorstehende Beschreibung gibt den Fall wieder, bei welchem
ein lineares Phasenfilter gebildet ist, in dem diskrete
Signale in analoger Form benutzt werden können; ein derartiger
Aufbau kann jedoch auch durch eine Software in digitaler
Form ausgeführt werden. Bei Berücksichtigung dieses
Gesichtspunkts kann ein Linearphasenfilter,
welches keine Phasenverschiebung erzeugt, durch einen einfachen
Aufbau realisiert werden, was insbesondere dann vorteilhaft
ist, wenn es in dem Fall angewendet wird, wo eine Belastung
der Wellenforminformation zu vermeiden ist.
Claims (9)
1. Verfahren zum Verarbeiten eines Sprach-Signals, das sich über einen
gewissen Frequenz-Bereich erstreckt und sowohl eine sich verhältnismäßig
langsam ändernde Komponente als auch eine sich verhältnismäßig
schnell ändernde Komponente aufweist, wobei das Sprach-Signal wiederholt
von dem einen zu dem anderen Ende des Frequenz-Bereichs in einem
vorherbestimmten Zeitintervall abgefragt wird, um dadurch zwangsläufig
eine periodische Wellenform zu bilden, deren Periode zweimal der
Frequenz-Bereich des zu verarbeitenden Signals ist,
dadurch gekennzeichnet,
daß das Ergebnis der Frequenzanalyse des Sprach-Signals erhaltene
Frequenzverteilungsmuster des bestimmten Frequenzbereichs, abwechselnd
entlang einer Zeitachse wiederholt wird, um eine periodische
Wellenform zu bilden, und diese dann gefiltert wird, um so die sich
verhältnismäßig schnell ändernde Komponente zu extrahieren.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß die sich
verhältnismäßig langsam ändernde Komponente des zu
verarbeitenden Signals sich im Pegel gleichmäßig von
dem einen Ende des Bereichs zu dessen anderen Ende
hin ändert.
3. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß die sich
verhältnismäßig schnell ändernde Komponente eine
phonetische Information des Sprachsignals festlegt.
4. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß das Entfernen
mittels eines Hochpaßfilters durchgeführt wird.
5. Einrichtung zur Durchführung des Verfahrens nach einem
der Ansprüche 1 bis 4, mit einer Eingabeeinrichtung zum
Empfangen eines Signals, und mit einem Frequenzanalysator,
um das empfangene Signal in eine Anzahl aneinandergrenzender
Frequenzbereiche zu zerlegen,
dadurch gekennzeichnet, daß an den
Ausgang des Frequenzanalysators (2) ein Ausgangsselektor
(3) mit einer Steuerschaltung (4) angeschaltet
ist, um die aneinandergrenzenden Frequenzbereiche
abwechselnd von einem Ende zu anderen Ende und vom
anderen Ende zum einen Ende auszulesen, und daß an den
Ausgang des Ausgangsselektors (3) ein Hochpaßfilter (5)
mit einer linearen Phasencharakteristik angeschaltet
ist, welches die niederfrequente Komponente aus dem
Eingangssignal entfernt.
6. Einrichtung nach Anspruch 5,
dadurch gekennzeichnet, daß die Steuerschaltung
(4) aus einem Auf/Abwärtszähler gebildet ist.
7. Einrichtung nach Anspruch 5 oder 6,
dadurch gekennzeichnet, daß das Hochpaßfilter
(5) mit linearer Phasencharakteristik eine Reihenschaltung
aus einem Kammfilter und einem Allpolfilter
(Fig. 7) aufweist, welche nur Pole erzeugt.
8. Einrichtung nach einem der Ansprüche 5 bis 7,
gekennzeichnet durch eine Anzahl (P -1) von
Verzögerungseinheiten (22; 31₁ bis 31 P -1), welche zueinander
in Reihe und in Reihe mit der Eingabeeinrichtung (3)
geschaltet sind, und von denen jede eine Grundzeitverzögerung
schafft, wobei P eine positive ganze Zahl ist;
durch eine Anzahl (P -1) von Multipliziereinheiten (32₁- 32 P),
welche entsprechend geschaltet sind, um die jeweiligen
Ausgänge von den entsprechenden Verzögerungseinheiten
(22; 31₁ bis 31 P -1) mit einem Faktor k zu multiplizieren,
wobei k eine reelle Zahl ist, und durch eine weitere
Multipliziereinheit (25), welche vorgesehen ist, um das
von der Eingabeeinrichtung empfangene Signal mit demselben
Faktor k zu multiplizieren, und durch eine Addiereinheit
(33), um die Ausgänge von der Anzahl von P Multipliziereinheiten
(32₁ bis 32 P) zu addieren und um einen
addierten Wert an einen Ausgangsanschluß (26) zu liefern.
9. Einrichtung nach Anspruch 8,
gekennzeichnet durch eine Subtrahiereinheit
(29), um den addierten Wert, der von der Addiereinheit (33)
zugeführt worden ist, von einem Ausgang der ((P -1)/2)-ten
Verzögerungseinheit zu subtrahieren.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59057161A JPS60200177A (ja) | 1984-03-23 | 1984-03-23 | 信号処理方法 |
JP5908484A JPS60203013A (ja) | 1984-03-27 | 1984-03-27 | 直線位相フイルタ |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3510660A1 DE3510660A1 (de) | 1985-10-31 |
DE3510660C2 true DE3510660C2 (de) | 1990-05-17 |
Family
ID=26398186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19853510660 Granted DE3510660A1 (de) | 1984-03-23 | 1985-03-23 | Verfahren und einrichtung zum verarbeiten eines signals |
Country Status (4)
Country | Link |
---|---|
US (1) | US5150413A (de) |
DE (1) | DE3510660A1 (de) |
FR (1) | FR2580876A1 (de) |
GB (2) | GB2158980B (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004008225A1 (de) * | 2004-02-19 | 2005-09-15 | Infineon Technologies Ag | Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2187585B (en) * | 1985-11-21 | 1989-12-20 | Ricoh Kk | Voice spectrum analyzing system and method |
US6993480B1 (en) | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
AT407584B (de) * | 1999-06-21 | 2001-04-25 | Bernhard Hans Peter Dipl Ing D | Verfahren zur dynamischen und statischen darstellung von sprachsignalen |
JP2002032770A (ja) * | 2000-06-23 | 2002-01-31 | Internatl Business Mach Corp <Ibm> | 文書処理方法、文書処理システムおよび媒体 |
US20050228518A1 (en) * | 2002-02-13 | 2005-10-13 | Applied Neurosystems Corporation | Filter set for frequency analysis |
JP4649859B2 (ja) * | 2004-03-25 | 2011-03-16 | ソニー株式会社 | 信号処理装置および方法、記録媒体、並びにプログラム |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8194880B2 (en) * | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8744844B2 (en) * | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US8934641B2 (en) | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8150065B2 (en) * | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8050434B1 (en) | 2006-12-21 | 2011-11-01 | Srs Labs, Inc. | Multi-channel audio enhancement system |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
WO2014168777A1 (en) | 2013-04-10 | 2014-10-16 | Dolby Laboratories Licensing Corporation | Speech dereverberation methods, devices and systems |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
WO2016033364A1 (en) | 2014-08-28 | 2016-03-03 | Audience, Inc. | Multi-sourced noise suppression |
KR102689087B1 (ko) * | 2017-01-26 | 2024-07-29 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2938079A (en) * | 1957-01-29 | 1960-05-24 | James L Flanagan | Spectrum segmentation system for the automatic extraction of formant frequencies from human speech |
US3639691A (en) * | 1969-05-09 | 1972-02-01 | Perception Technology Corp | Characterizing audio signals |
US3786188A (en) * | 1972-12-07 | 1974-01-15 | Bell Telephone Labor Inc | Synthesis of pure speech from a reverberant signal |
FR2273419B1 (de) * | 1973-01-25 | 1976-09-10 | Trt Telecom Radio Electr | |
US3894190A (en) * | 1973-02-28 | 1975-07-08 | Int Standard Electric Corp | System for transferring wide-band sound signals |
GB1436878A (en) * | 1973-08-23 | 1976-05-26 | Standard Telephones Cables Ltd | Pulse density modulation to pcm modulation translation |
DE2536640C3 (de) * | 1975-08-16 | 1979-10-11 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur Erkennung von Geräuschen |
US4038495A (en) * | 1975-11-14 | 1977-07-26 | Rockwell International Corporation | Speech analyzer/synthesizer using recursive filters |
DE3121310A1 (de) * | 1981-05-29 | 1982-12-16 | Robert Bosch Gmbh, 7000 Stuttgart | Digitales filter |
US4430721A (en) * | 1981-08-06 | 1984-02-07 | Rca Corporation | Arithmetic circuits for digital filters |
US4524423A (en) * | 1981-11-06 | 1985-06-18 | Rca Corporation | Digital signal separation filters |
JPS58196595A (ja) * | 1982-05-12 | 1983-11-16 | 日本電気株式会社 | パタ−ン特徴抽出装置 |
US4674125A (en) * | 1983-06-27 | 1987-06-16 | Rca Corporation | Real-time hierarchal pyramid signal processing apparatus |
-
1985
- 1985-03-19 GB GB08507023A patent/GB2158980B/en not_active Expired
- 1985-03-23 DE DE19853510660 patent/DE3510660A1/de active Granted
-
1986
- 1986-03-27 FR FR8604478A patent/FR2580876A1/fr active Granted
-
1987
- 1987-01-12 GB GB08700623A patent/GB2184312B/en not_active Expired
-
1989
- 1989-10-02 US US07/415,481 patent/US5150413A/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004008225A1 (de) * | 2004-02-19 | 2005-09-15 | Infineon Technologies Ag | Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien |
DE102004008225B4 (de) * | 2004-02-19 | 2006-02-16 | Infineon Technologies Ag | Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien |
Also Published As
Publication number | Publication date |
---|---|
GB2158980A (en) | 1985-11-20 |
FR2580876A1 (fr) | 1986-10-24 |
GB8507023D0 (en) | 1985-04-24 |
GB2158980B (en) | 1989-01-05 |
GB8700623D0 (en) | 1987-02-18 |
DE3510660A1 (de) | 1985-10-31 |
US5150413A (en) | 1992-09-22 |
GB2184312B (en) | 1989-01-05 |
FR2580876B1 (de) | 1995-03-17 |
GB2184312A (en) | 1987-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3510660C2 (de) | ||
EP0052847B1 (de) | Verfahren und Schaltungsanordnung zur Umsetzung der Abtastfrequenz einer Abtastfolge unter Umgehung der Konversion in ein kontinuierliches Signal | |
DE3856269T2 (de) | Digitales Entzerrungsgerät mit Möglichkeit zur getrennten Modifikation der Phasen- und Amplitudencharakteristik | |
DE3485792T2 (de) | Digitale signalverarbeitungseinrichtungen. | |
DE4316297C1 (de) | Frequenzanalyseverfahren | |
DE2818204C2 (de) | Signalverarbeitungsanlage zur Ableitung eines störverringerten Ausgangssignals | |
DE3124924A1 (de) | Rekursives digitales tiefpassfilter | |
DE3018508A1 (de) | Sprachanalysiervorrichtung | |
WO2004013839A1 (de) | Vorrichtung und verfahren zum erzeugen einer komplexen spektraldarstellung eines zeitdiskreten signals | |
DE2616660A1 (de) | Arithmetische einheit | |
DE68907098T2 (de) | Differentieller Kodierer mit auto-adaptivem Prädiktorfilter und dazugehörigem Dekodierer. | |
DE2839229C2 (de) | Frequenzweiche mit einem Transversalfilter | |
EP0554494B1 (de) | Adaptives nichtrekursives Digitalfilter | |
EP1755110A2 (de) | Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System | |
DE2523625A1 (de) | Digitalfilter | |
EP0135066B1 (de) | Übertragungsanordnung für digitale Signale | |
DE3922469C2 (de) | ||
DE3702215C2 (de) | ||
DE3621446A1 (de) | Geraet zum digitalen verarbeiten von kontinuierlichen bitstroemen | |
DE3836504A1 (de) | Verfahren und vorrichtung zur digital-analog-wandlung | |
DE3037276C2 (de) | Tonsynthesizer | |
DE4022381C2 (de) | Verwendung langer Digitalfilter bei Vorkommnis von Abrundungsfehlern | |
EP0402519B1 (de) | Verfahren und Anordnung zur Verbesserung des Dynamikbereichs eines adaptiven rekursiven Netzwerks zur Verarbeitung zeitdiskreter Signale | |
EP0158055A1 (de) | Verfahren zur Ueberblendung digitaler Audiosignale, sowie Vorrichtung zur Durchfahrung des Verfahrens | |
DE69028793T2 (de) | Filter und Verfahren zur digitalen Erzeugung von weissem Rauschen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |