DE3852615T2 - Digitales system zum reduzieren und uebertragen von bilddaten, das visuell gewichtete transformationskoeffizienten verwendet. - Google Patents
Digitales system zum reduzieren und uebertragen von bilddaten, das visuell gewichtete transformationskoeffizienten verwendet.Info
- Publication number
- DE3852615T2 DE3852615T2 DE3852615T DE3852615T DE3852615T2 DE 3852615 T2 DE3852615 T2 DE 3852615T2 DE 3852615 T DE3852615 T DE 3852615T DE 3852615 T DE3852615 T DE 3852615T DE 3852615 T2 DE3852615 T2 DE 3852615T2
- Authority
- DE
- Germany
- Prior art keywords
- coefficients
- transformation
- dimensional
- human vision
- digital image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000009466 transformation Effects 0.000 title claims description 35
- 238000010606 normalization Methods 0.000 claims description 36
- 230000035945 sensitivity Effects 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 8
- 230000000007 visual effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 2
- 230000003287 optical effect Effects 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000006835 compression Effects 0.000 description 17
- 238000007906 compression Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 4
- 239000011295 pitch Substances 0.000 description 4
- 230000004043 responsiveness Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf eine digitale Bildkomprimierung und -übertragung über einen Kommunikationskanal mit begrenzter Bandbreite und insbesondere auf die digitale Bildkomprimierung mit Ortsfrequenztransformationskodierung und visueller Gewichtung der Transformationskoeffizienten.
- Die Transformationskodierung digitaler Bilder zum Zwecke der Bandbreitenkomprimierung vor der Übertragung über einen Kommunikationskanal mit begrenzter Bandbreite ist wohlbekannt. In einer nach dem vorherigen Stand der Technik typischen Komprimierung eines digitalen Bildes wird das digitale Bild in Blöcke formatiert (z.B. 16 x 16 Pixel), und es wird eine Ortsfrequenztransformation, etwa eine diskrete Kosinustranformation, DCT, für jedem Block ausgeführt, um Transformationskoeffizientenblöcke von 16 x 16 zu erzeugen. Theoretische Untersuchungen und Simulationsuntersuchungen haben ergeben, daß die DCT für die Verringerung der Redundanz von Markowschen Bildmodellen erster Ordnung nahezu optimal ist. Es hat sich gezeigt, daß sie sehr dicht an der Karhumen- Loewschen Transformation liegt, die zwar in der Redundanzverringerung optimal ist, aber nicht zu einer klaren Berechnung wie die DCT führt. Jeder Block von Transformationskoeffizienten ist auf einem eindimensionalen Vektor angeordnet, so daß die mittlere Energie jedes Koeffizienten allgemein entlang dieses Vektors abnimmt. Die Transformationskoeffizienten, mit Ausnahme der Nullkoeffizienten, werden quantisiert und anhand einer minimalen Redundanzkodierungsschemas, etwa der Huffman- Kodierung, kodiert; Lauflängenkodierung wird benutzt, um Läufe von Koeffizienten mit Nullgröße zu kodieren. Die kodierten Transformationskoeffizienten werden über den Kanal mit begrenzter Bandbreite übertragen. Siehe US-A-4,302,775 als Beispiel für ein solches Komprimierungsschema in einem Videobildkomprimierungssytem.
- Am Empfänger wird das Bildsignal anhand von Operationen dekodiert, die zur Kodierung des digitalen Bildes invers sind. Dies Technik ist in der Lage, vorteilhafte hohe Bildkomprimierungsverhältnisse zu erzeugen und damit eine niedrige Bitratentransformation digitaler Bilder über Kanäle mit begrenzter Bandbreite zu ermöglichen.
- Es wurde weiterhin vorgeschlagen, daß ein in eine Bildkomprimierungstechnik aufgenommenes Modell des menschlichen Sehvermögens dessen Leistung weiter verbessern sollte (siehe beispielsweise "Visual Model Weighted Cosine Transform for Image Compression and Quality Assessment" von Norman B. Nill IEEE Transactions on Communications, Band COM- 33, Nr. 6, Juni 1985 und "A Visually Weighted Quantization Scheme for Image Bandwidth Compression at Long Data Rates", von Eggerton et al in IEEE Transactions on Communications, Band COM-34, Nr. 8, 1986.
- Es ist die Aufgabe der vorliegenden Erfindung, eine verbesserte Bildkomprimierungstechnik mit Einbeziehung eines Modells für das menschliche Sehvermögen bereitzustellen.
- Die Aufgabe der vorliegenden Erfindung wird in einem Bildkomprimierungssystem der in Ansprüchen 1, 6, 11 und 12 beschriebenen Art erreicht, indem in dem Modell des menschlichen Sehvermögens die Tatsache berücksichtigt wird, daß das menschliche Sehvermögen weniger empfindlich gegenüber diagonal angeordneten Ortsfrequenzen als gegenüber horizontal oder vertikal angeordneten Ortsfrequenzen ist. Entsprechend beinhaltet ein Sender oder ein Sender-/Empfänger in einem System für die Übertragung eines digitalen Bildsignals über ein Kommunikationssystem mit begrenzter Bandbreite Mittel zur Quantisierung der Ortsfrequenztransformationskoeffizienten eines digitalen Bildes entsprechend eines zweidimensionalen Modells des menschlichen Sehvermögens gegenüber Ortsfrequenzen. Das Modell umfaßt das Merkmal, daß das menschliche Sehvermögen weniger gegenüber diagonal ausgerichteten Ortsfrequenzen empfindlich ist als gegenüber horizontal oder vertikal ausgerichteten Ortsfrequenzen.
- In einer bevorzugten Ausführungsform der Erfindung umfassen die Quantisierungsmittel Mittel zur Normierung der Transformationskoeffizienten gemäß dem Modell des menschlichen Sehvermögens, und einen einheitlichen Quantisierer zur Quantisierung der normierten Koeffizienten.
- In einem System, in dem die Ortsfrequenztransformation auf ein digitales Bild in Blöcken oder Unterbereichen des Bildes durchgeführt wird, wird das zweidimensionale Modell des menschlichen Sehvermögens so modifiziert, daß es eine fronstante maximale Ansprechempfindlichkeit gegenüber niedrigen Frequenzen aufweist, statt der verringerten Ansprechempfindlichkeit bei niedrigen Frequenzen in den Standardmodellen des menschlichen Sehvermögens.
- Die Erfindung wird im folgenden anhand eines in der Zeichnung dargestellten Ausführungsbeispiels näher erläutert.
- Es zeigen
- Fig. 1 ein Ablaufdiagramm des Systems zur erfindungsgemäßen Komprimierung und Übertragung digitaler Bilder;
- Fig. 2 ein Ablaufdiagramm der Erzeugung der Normalisierungsanordnung eines Modells des menschlichen Sehvermögens entsprechend der vorliegenden Erfindung;
- Fig. 3 ein Ablaufdiagramm einer vereinfachten Technik zur Schätzung der durch diskrete Kosinustransformationskoeffizienten dargestellten Raumfrequenzen;
- Fig. 4 ein Ablaufdiagramm der Erzeugung eines zweidimensionalen Modells des menschlichen Sehvermögens entsprechend der vorliegenden Erfindung;
- Fig. 5 eine Kurve eines eindimensionalen Modells des menschlichen Sehvermögens;
- Fig. 6 eine Grafik eines nach dem vorherigen Stand der Technik typischen zweidimensionalen Modells des menschlichen Sehvermögens, das aus dem eindimensionalen Modell aus Fig. 5 entwickelt wurde;
- Fig. 7 eine Grafik eines zweidimensionalen Modells des menschlichen Sehvermögens, entwickelt entsprechend der vorliegenden Erfindung;
- Fig. 8 eine Grafik des zweidimensionalen Modells des menschlichen Sehvermögens aus Fig. 7 mit entfernter Niederfrequenzunterdrückung;
- Fig. 9 eine Grafik des Unterschieds zwischen dem in Fig. 8 gezeigten Modell des menschlichen Sehvermögens und dem in Fig. 6 gezeigten Modell nach dem vorherigen Stand der Technik, das das mit der vorliegenden Erfindung erzielbare größere Bildkomprimierungspotential zeigt; und
- Fig. 10 eine schematische Darstellung einer bevorzugten Ausführungsform der Erfindung in Form eines Kommunikationssystems mit Sendern/Empfängern.
- Ein Ablaufdiagramm eines Systems zur erfindungsgemäßen Komprimierung und Übertragung eines digitalen Bildes wird in Fig. 1 gezeigt. Ein Sender 10 erfaßt ein digitales Bild von einer (nicht gezeigten) Quelle, etwa ein Bildsensor, Filmabtaster oder ein digitaler Bildrecorder. Das digitale Bild umfaßt beispielsweise 512 x 512 8-Bit-Pixel. Der Sender 10 komprimiert und kodiert das digitale Bild und liefert das kodierte Signal des digitalen Bildes an einen Kommunikationskanal 12 mit begrenzter Bandbreite, etwa eine Telefonleitung mit der Standardbandbreite von 3,3 kHz. Das kodierte Signal des digitalen Bildes wird über Kanal 12 von einem Empfänger 14 empfangen, der das komprimierte Signal des digitalen Bildes dekodiert und das digitale Bild rekonstruiert.
- Der Sender 10 empfängt das digitale Bild I und formatiert (16) das Bild in Blöcke I(x,y). Die derzeit bevorzugte Blockgröße beträgt 16 x 16 Pixel. Eine diskrete Kosinustransformation wird für jeden Block durchgeführt (18), um den entsprechenden Block T(i,j) der Transformationskoeffizienten zu erzeugen. Die Transformationskoeffizienten für jeden Block werden in einer eindimensionalen Anordnung T(k) geordnet (20), um die Ortsfrequenz zu erhöhen, beispielsweise durch Verwendung einer Zickzack-Abtastung entlang Diagonalen eines Koeffizientenblocks.
- Als nächstes werden die Koeffizienten gemäß der Empfindlichkeit des menschlichen Sehvermögens auf Ortsfrequenzen normiert (24). Eine Normierungsanordnung N(k) wird wie nachfolgend beschrieben erzeugt und im Sender 10 gespeichert. Die Transformationskoeffizienten T(k) werden durch Teilung jedes Transformationskoeffizienten durch seinen entsprechenden Normierungswert wie folgt normiert:
- TN(k) T(k)/N(k) (1)
- wobei TN(k) der normierte Transformationskoeffizientenwert ist. Die normierten Koeffizienten TN(k) werden quantisiert (26), um quantisierte Koeffizienten N(k) zu bilden. Die quantisierten Koeffizienten werden anhand eines minimalen Redundanzkodierungsschemas zur Erzeugung von Kodewerten CV(k) kodiert (28). Ein derzeit bevorzugtes Kodierungsschema ist ein Huffman-Code mit Lauflängenkodierung für Zeichenfolgen von Koeffizienten der Größe null. Da die diskrete Kosinustranformation (DCT) sowie die Huffman- und Lauflängenkodierung wohl bekannt sind (siehe vorheriger Verweis auf US-A-4,302,775), werden die Einzelheiten dieses Prozesses hierin nicht weiter erläutert. Die kodierten Koeffizienten werden über den Kanal 12 an Empfänger 14 übertragen.
- Empfänger 14 führt zur Wiederherstellung des digitalen Bildes die umgekehrten Operationen wie Empfänger 10 aus. Die Kodewerte CV(k) werden dekodiert (30), um normierte Koeffizienten N(k) zu erzeugen. Die normierten Koeffizienten N(k) werden anhand einer Denormierungsanordnung N&supmin;¹(k) denormiert (32), bei der es sich um die Umkehrung der zur Erzeugung denormierter Koeffizienten T(k) im Sender verwendeten Normierungsanordnung N(k) handelt. Alternativ hierzu werden die Transformationkoeffizienten durch Multiplizierung mit den Normierungskoeffizienten denormiert. Die eindimensionale Zeichenfolge rekonstruierter Koeffizientenwerte T(k) wird in zweidimensionalen Blöcken (36) reformatiert, und die Koeffizientenblöcke werden invers in Bildwerte (38) I(x,y) transformiert. Schließlich werden die Blöcke der Bildwerte in das digitale Bild I neuformatiert (40).
- Die auf dem menschlichen Sehvermögen basierende Normierungsanordnung N(k) und dessen Invertierung N&supmin;¹(k) wird in einem separaten Computer 42 erzeugt. Diese Funktion kann durch einen programmierten Mikroprozessor im Sender und Empfänger durchgeführt werden. Vorzugsweise wird sie allerdings in einem separat programmierten digitalen Computer durchgeführt, und die resultierenden Normierungstabellen werden dauerhaft in den Sender und Empfänger zur Herstellungszeit geladen. Die Erzeugung der erfindungsgemäßen Normierungsanordnung wird jetzt mit Bezug auf Fig. 2 beschrieben. Fig. 2 ist ein Gesamtablaufplan, der die Schritte zur Erzeugung der Normierungsanordnung zeigt. Erstens werden die entsprechenden zweidimensionalen Ortsfrequenzen der DCT-Basisfunktionen in Zyklen pro Grad der Sichtsehne geschätzt (44). Die Schätzung der entsprechenden Ortsfrequenzen erfordert Eingaben, die die Größe Bx, By in der x- bzw. y-Richtung definieren, den Pixelabstand Px, Py des vorgesehenen Ausgabeanzeigemediums in der x- und y- Richtung sowie der vorgesehene Sichtabstand V des Ausgabebildes.
- Ein zweidimensionales Modell des menschlichen Sehvermögens wird wie nachfolgend beschrieben erzeugt (46). Gemäß einem Merkmal der vorliegenden Erfindung berücksichtigt das Modell des menschlichen Sehvermögens die verringerte Empfindlichkeit gegenüber diagonalen Ortsfrequenzinformationen im menschlichen Sehvermögen. Das zweidimensionale Modell des menschlichen Sehvermögens und die Schätzung der durch die DCT-Basisfunktionen dargestellten Ortsfrequenzen werden kombiniert, um eine die zweidimensionale Empfindlichkeit des menschlichen Sehvermögens gegenüber den BCT-Basisfunktionen darstellende Anordnung zu erzeugen (48). Die Empfindlichkeitsanordnung wird um einen Bitratenfaktor n eingestellt (eine Gesamtnormierungskonstante), um die Normierungsanordnung N(k) zu erzeugen (50). Schließlich wird die Normierungsanordnung N(k) in Nachschlagetabellen im Sender/Empfänger geladen. Die Schätzung der durch die DGT- Basisfunktionen dargestellten zweidimensionalen Ortsfrequenzen wird jetzt mit Bezug auf Fig. 3 beschrieben. Erstens werden blockweise Zyklen von dem Index der weidimensionalen Transformationsbasisfunktionen wie folgt geschätzt (54):
- CB(i) (i-1)/2 (2)
- CB(j) (j-1)/2
- wobei CB(i), CB(j) blockweise Zyklen in horizontaler bzw. vertikaler Richtung sind und i und j die Indizes der Basisfunktionen in horizontaler bzw. vertikaler Richtung.
- Als nächstes werden die Zyklen pro Block unter Verwendung der Blockgröße für die BCT (Bx, By) in Zyklen pro Pixel wie folgt konvertiert (56):
- CPx(i) = CB(i)/Bx (3)
- CPy(j) = CB(j)/By
- wobei CPx(i) und CPy(j) Zyklen pro Pixel in horizontaler bzw. vertikaler Richtung sind. Unter Verwendung von Pixelabständen Px, Py in mm des Ausgabemediums werden die Zyklen pro Pixel in Zyklen pro mm im Ausgabebild konvertiert (58), und zwar wie folgt:
- CMx(i) = CPx(i)/Px (4)
- CMy(j) = CPy(j)/Py
- wobei CMx(i) und CMy(j) Zyklen pro mm in horizontaler bzw. vertikaler Richtung darstellen.
- Schließlich werden unter Verwendung des vorgesehenen Sichtabstands V in denselben Einheiten wie dem Pixelabstand (z.B. mm) die Zyklen pro mm in Zyklen pro Grad der Sichtsehne konvertiert (60), und zwar wie folgt:
- wobei CDx(i) und CDy(j) Zyklen pro Grad in horizontaler bzw. vertikaler Richtung sind.
- Die Erzeugung des zweidimensionalen Modells des menschlichen Sehvermögens gemäß der vorliegenden Erfindung wird jetzt mit Bezug auf Fig. 4-8 beschrieben. Mit Bezug auf zunächst Fig. 4 wird das eindimensionale Modell für das Ansprechen des menschlichen Sehvermögens auf horizontale und vertikale Ortsfrequenzinformationen verwendet (62). Das Modell wird wie folgt dargestellt:
- H(r) = HA . (HB + HC . r) . exp (-(HC . r)HD) (6)
- wobei H(r) die auf 1,0 der Ortsfrequenz normierte Empfindlichkeit des menschlichen Sehvermögens ist, bei der das menschliche Sehvermögen am empfindlichsten ist, r ist die radiale Ortsfrequenz in Zyklen pro Grad der Sichtsehne, HA 2,2, HB = 0,192, HC = 0,114 und HD = 1,1. Eine Kurve dieser Funktion wird in Fig. 5 gezeigt. Fig. 6 zeigt eine zweidimensionale Darstellung eines rotationssymmetrischen Modells des menschlichen Sehvermögens für einen aus der in Fig. 5 gezeigten Funktion entwickelten Quadranten.
- Es ist aus psycho-physischen Untersuchungen bekannt, daß die Bandbreite des Ansprechens des menschlichen Sehvermögens wesentlich kleiner (ca. 30%) für diagonal ausgerichtete Ortsfrequenzinformationen ist als für horizontal oder vertikal ausgerichtete Informationen. Die Erfinder haben entdeckt, daß, bei Berücksichtigung des verringerten diagonalen Ansprechens im Modell des menschlichen Sehvermögens, eine wesentlich weitere Bildkomprimierung ohne Einführung sichtbarer Fehler erzielt werden kann. Das zweidimensionale Modell des menschlichen Sehvermögens mit der verringerten Ansprechempfindlichkeit wird wie folgt erzeugt. Die kartesischen Koordinaten für Ortsfrequenzen werden wie folgt in Polarkoordinaten konvertiert:
- wobei CR(i,j) die radiale Ortsfrequenz der Koeffizientenlage (i,j) und Theta(i,j) der Winkelversatz der Koeffizientenausrichtung von der nächstgelegenen kartesischen Koordinatenachse ist. Da psycho-physische Untersuchungen darauf hinweisen, daß das menschliche Sehvermögen gegenüber diagonalen Ortsfrequenzeinzelheiten, auf die Bandbreite bezogen, siebenmal empfindlicher ist als gegenüber horizontalen und vertikalen Einzelheiten, wurde eine Kosinusfunktion, die einen Wert nahe 0,7 bis 45º aufweist, verwendet, um die nicht orthogonalen, radialen Ortsfrequenzen auf höhere Werte vor Einfügung in das eindimensionale Modell des menschlichen Sehvermögens zu verschieben, das eine Funktion der zweidimensionalen radialen Frequenz benutzt, um das Modell aus Gleichung (7) folgendermaßen zu erzeugen (64 in Fig. 4)
- H(i,j) = HA . (HB + HC . (CR(i,j)/cos Theta(i,j))). (9)
- exp-(HC . (CR(i,j)/cos Theta(i,j)))HD.
- Eine zweidimensionale Grafik dieses Modells wird in Fig. 7 gezeigt. Darüber hinaus wurde durch die vorliegende Erfindung entdeckt, daß die Dämpfung der Sehempfindlichkeit bei niedrigen Frequenzen, wie dem in Fig. 7 gezeigten Modell zu entnehmen, für Blocktransformationsbilder ungeeignet ist. Dieser Unterdrückungseffekt wird aus dem Modell entfernt (66 in Fig. 4), was das Modellantwortverhalten von der maximalen Ansprechempfindlichkeit von ca. 6,5 Zyklen pro Grad bis null Zyklen pro Grad konstant macht. Das schließlich resultierende Modell des menschlichen Sehvermögens wird in der zweidimensionalen Grafik von Fig. 8 für einen Quadranten gezeigt. Unterschiede zwischen dem in Fig. 6 gezeigten rotationssymmetrischen Modell des menschlichen Sehvermögens und dem Modell, das die verringerte Ansprechempfindlichkeit auf diagonale Einzelheiten, wie in Fig. 8 gezeigt, beinhaltet, werden in Fig. 9 gezeigt, wo positive Bereiche das Maß anzeigen, in dem das radialsymmetrische Modell eine höhere Empfindlichkeit gegenüber Ortsfrequenzen darstellt und negative Bereiche das Gegenteil. Da eine höhere Empfindlichkeit in der Ortsfrequenzeinzelheit kleinere Quantisierungsschritte im DCT-Komprimierungsschema erfordert, wird die zur Übertragung dieser Frequenzen benötigte Bitrate größer sein. Dementsprechend zeigen die positiven Bereiche in der Grafik von Fig. 9 ein Potential zur Senkung der Bitraten, während dieselbe visuelle Qualität beibehalten wird. Typische Bitratenverringerungen unter Verwendung des Modells des menschlichen Sehvermögens mit verringerter Empfindlichkeit gegenüber diagonalen Einzelheiten wurden im Bereich von 8 bis 10% höher als mit dem rotationssymmetrischen Modell ermittelt, und zwar ohne sichtbare Änderung in der Erscheinung des reproduzierten Bildes.
- Mit erneutem Bezug auf Fig. 2 wird die Normierungsanordnung N(k) von dem Modell des menschlichen Sehvermögens wie folgt erzeugt (50).
- N(i,j) = (n/Hi,j)) - (n-Nmin) (10)
- wobei N(i,j) die zweidimensionale Normierungsanordnung vor der Konvertierung in eine eindimensionale Anordnung von Werten N(k) entsprechend der Konvertierung der Transformationskoeffizienten in eine eindimensionale Anordnung ist. "n" ist ein Skalierungsfaktor, der die gesamte mittlere Normierung steuert und zur Einstellung der mittleren Bitrate des komprimierten Bildes dienen kann, und Nmin ist der kleinste Normierungswert, der bei H(i,j) = 1,0 auftritt. Da das wie oben entwickelte Modell des menschlichen Sehvermögens einen Maximalwert von 1,0 hat, nimmt der kleinste Normierungswert den Wert von n an. Abhängig von der Bittiefe der Anzeige und dem gewünschten Grad der gesamten Normierung n kann es erforderlich sein, den kleinsten Normierungswert Nmin auf einen anderen Wert als n einzustellen.
- Mit Bezug auf Fig. 10 wird eine bevorzugte Ausführung der vorliegenden Erfindung in einem Stehbildvideo- Kommunikationssystem beschrieben. Das System umfaßt zwei oder mehr Empfänger/Sender 68, die an eine Telefonübertragungsleitung 70 angeschlossen sind. Jeder der Empfänger/Sender 68 ist mit einer Videosignalquelle verbunden, etwa einer Videokamera 72, und mit einem Videobildschirm, etwa einem Videomonitor 74. Jeder Empfänger/Sender 68 enthält eine Standardvideoschnittstelle 76, die Videosignale von der Videoquelle empfängt, die Signale digitalisiert und die digitalen Bildsignale an einen digitalen Bildfeldspeicher 78 liefert. Die Standardvideoschnittstelle 76 empfängt auch digitale Bildsignale vom digitalen Bildfeldspeicher 78 und erzeugt ein Standardvideosignal für die Anzeige am Videomonitor 74.
- Jeder Empfänger/Sender wird über einen Intel 80186 Mikroprozessor 80 mit konventionellem ROM 82 und RAM 84 zur Speicherung der Steuerprogramme bzw. zum temporären Speichern der Daten gesteuert. Der Mikroprozessor 80 führt die Lauflängen- und Huffman-Kodierung und Dekodierung durch sowie die auf dem menschlichen Sehvermögen basierende Normierung und Denormierung der DCT-Koeffizienten. Die kodierten DCT- Koeffizienten werden über eine Telefonleitung 70 per R96 FT/SC Modem 86 gesendet. Die in Vorwärtsrichtung diskrete Kosinustransformation DCT (im Übertragungsmodus) und die rückwärtige Transformation (im Empfangsmodus) wird durch einen digitalen Signalprozessor 88 des Typs TMS 32020 mit konventionellem RAM 90 zur Speicherung des DCT- Transformationsprogramms durchgeführt.
- Im Sendemodus greift der Mikroprozessor 80 jeweils auf einen 16 x 16 Block digitaler Bilddaten aus einem Bildpuffer 92 im digitalen Bildfeldspeicher 78 zurück. Der 16 x 16 Block der digitalen Bilddaten wird temporär in einem Dual-Port-SRAM 94 gespeichert, auf das sowohl der Mikroprozessor 80 als auch der digitale Signalprozessor 88 zugreifen kann. Der digitale Signalprozessor 88 führt die diskrete Kosinustransformation durch und gibt den 16 x 16 Block von Transformationskoeffizienten an das Dual-Port-SRAM 94 zurück. Der Block der Transformationskoeffizienten wird dann von Mikroprozessor 80 normalisiert und komprimiert (Huffman- und lauflängenkodiert). Das komprimierte Signal wird in einem komprimierten Bildpuffer 96 im digitalen Bildfeldspeicher 78 gespeichert und über die Telefonleitung 70 per Modem 86 gesendet. Dieser Zyklus wird für jeden Block wiederholt, bis das gesamte Bild komprimiert und übertragen ist.
- Im Empfangsmodus wird ein komprimiertes digitales Bild über Modem 86 empfangen und im komprimierten Bildspeicher 96 gespeichert. Ein Block komprimierter DCT-Koeffizienten wird jeweils vom komprimierten Bildspeicher 96 abgerufen und vom Mikroprozessor 80 denormiert und expandiert. Der expandierte Block von DCT-Koeffizienten wird an das Dual-Port-SRAM 94 übergeben. Der digitale Signalprozessor 88 nimmt die inverse Transformation der Koeffizienten vor, um einen 16 x 16 Block von digitalen Bildwerten zu erzeugen, die dann temporar im Dual-Port-SRAM 94 gespeichert werden. Mikroprozessor 80 überträgt den Block der digitalen Bildwerte vom Dual-Port- SRAM 94 an dem Bildpuffer 92. Dieser Zyklus wird wiederholt, bis das gesamte Bild empfangen, dekomprimiert und in Bildpuffer 92 gespeichert ist. Das Bild wird dann am Videomonitor 74 über Standardvideoschnittstelle 76 angezeigt.
- Eine auf dem menschlichen Sehvermögen basierende Normierungsanordnung (Denormierungsanordnung) für eine 16 x 16 Blockgröße (d.h. Bx = 16, By = 16) und einen Pixelabstand von Px = 0,535 mal Py = 0,535 mm und einen Sichtabstand von V = 1,25 m und n = 1 wurde wie zuvor auf einem VAX 785 Mainframe-Computer erzeugt. Die vor der Konvertierung in eine eindimensionale Anordnung N(k) resultierende Normierungsanordnung N(i,j) wird in Anhang A gezeigt.
- Die Benormierung einer dekodierten Koeffiziente wird durch Multiplizierung mit dem Reziprokwert des Normierungswertes oder durch Teilung durch den Normierungswert selbst durchgeführt. Die Normierungs-/Denormierungsanordnung N (k) wird in dem mit Mikroprozessor 80 verbundenen RAM 84 gespeichert. Durch Anwendung auf dem menschlichen Sehvermögen basierender Normierung gemäß der vorliegenden Erfindung wurden Bitratenreduzierungen von 8 bis 10% ohne sichtbare Verschlechterung der Bildqualität erzielt.
- Obwohl die vorliegende Erfindung mit Bezug auf ein einfarbiges digitales Bild beschrieben wurde, ist leicht ersichtlich, daß die beschriebene Technik ebenso auf ein farbiges digitales Bild angewandt werden kann, beispielsweise durch Trennung des Bildes in eine Luminanzkomponente und eine Chromianzkomponente und Anwendung der Normierung nach dem System des menschlichen Sehvermögens auf die Luminanzkomponente. Da die Chrominanzkomponente eines farbigen digitalen Bildes eine geringere Auflösung als die Luminanzkomponente aufweist, rechtfertigen die Gewinne, die durch Anwendung der erfindungsgemäßen komplexeren Komprimierungstechnik auf die Chrominanzkomponente erzielt werden, allgemein nicht die zusätzliche Komplexität, allerdings haben die Erfinder exzellente Ergebnisse in der Komprimierung farbiger digitaler Bilder durch Trennung der Bilder in eine Luminanzkomponente und zwei Komponenten mit geringerer Auflösung und Anwendung der Blocktransformationskodierung mit der Normierung nach dem System des menschlichen Sehvermögens auf die Luminanzkomponenten und Anwendung der Blocktransformationskodierung mit konstanter Normierung auf die Chromianzkomponenten erzielt.
- Die vorliegende Erfindung ist in Systemen zur Übertragung digitaler Bilder über einen Kommunikationskanal mit begrenzter Bandbreite hilfreich. Sie ist vorteilhaft in der Bereitstellung einer höheren Bildkomprimierung ohne erkennbare Bildverschlechterung und verkürzt damit Übertragungszeiten oder den Einsatz einen Kanals mit geringerer Bandbreite.
Claims (14)
1. Vorrichtung zum Komprimieren und Übermitteln eines
Digitalbildes über einen Übertragungskanal begrenzter
Bandbreite mit
a) Mitteln (16, 18, 20) zum Durchführen einer
zweidimensionalen Ortsfrequenztransformation an dem
Digitalbild zur Erzeugung von Transformationskoeffizienten
{T(i,j)} in Blockform und deren eindimensionaler
Anordnung {T(k)};
b) Mitteln (24) zum Normieren der in eindimensionaler
Anordnung befindlichen Transformationskoeffizienten
entsprechend einem rotationssymmetrischen,
zweidimensionalen Empfindlichkeitsmodell des menschlichen
Sehvermögens bezüglich Ortsfrequenzen;
c) Mitteln (36) zum Quantisieren der verarbeiteten
Transformationskoeffizienten {T(k)};
d) Mitteln (28) zum Kodieren der quantisierten
Koeffizienten {TN(k)} für die Übertragung,
dadurch gekennzeichnet, daß die Mittel (24) zum
Normieren der Transformationskoeffizienten - ausgehend von
dem rotationssymmetrischen zweidimensionalen Modell und
dessen Verändern in der Weise, daß es gegenüber
Horizontalen oder Vertikalen bei diagonal verlaufender Richtung
verringert anspricht - Mittel (42) aufweisen, die das
zweidimensionale Empfindlichkeitsmodell des menschlichen
Sehvermögens gegenüber Ortsfrequenzen andern, um ein
Ansprechen in diagonal er Richtung gegenüber der
Horizontalen oder Vertikalen zu vermindern, so daß das
zweidimensionale Modell die Tatsache berücksichtigt, daß das
menschliche Sehvermögen bezüglich diagonal verlaufender
Ortsfrequenzen geringer empfindlich ist als für solche,
die in horizontaler oder vertikaler Richtung verlaufen.
2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß
die Mittel zum Normieren der
Transformationskoeffizienten eine Normierungskoeffizienten enthaltende
Transformationstabelle und Mittel zum Multiplizieren der
Transformationskoeffizienten mit den entsprechenden
Normierungskoeffizienten aufweisen.
3. Vorrichtung nach Anspruch 1 oder 2, dadurch
gekennzeichnet, daß die Mittel zum Durchführen einer
Ortsfrequenztransformation diese an Teilbereichen des
Digitalbildes ausführen, und daß das zweidimensinale
Empfindlichkeitsmodell dahingehend verändert wird, daß es auf
Ortsfrequenzen, die zwischen einer Frequenz, bei der
sich das Maximum des menschlichen Sehvermögens befindet,
und einer Nullfrequenz pro Winkelgrad liegen, konstant
maximal anspricht.
4. Vorrichtung nach einem der Anspruche 1 - 3, dadurch
gekennzeichnet, daß die Mittel zum Durchführen einer
Ortsfrequenztransformation eine diskrete
Cosinus-Transformation durchführen.
5. Vorrichtung nach einem der Anspruche 1 - 4, dadurch
gekennzeichnet, daß die Mittel zum Quantisiern der
Transformationskoeffizienten einen gleichbleibenden
Quantisierer aufweisen, der die normierten Koeffizienten
quantisiert.
6. Vorrichtung zum Empfangen und Dekodieren eines über
einen Übertragungskanal begrenzter Bandbreite
übermittelten und entsprechend Anspruch 1 kodierten
Digitalbildes, gekennzeichnet durch
a) Mittel zum Empfangen des kodierten
Digitalbildsignals, das quantisierte
Transformationskoeffizienten einer Ortsfrequenztransformation eines
Digitalbildes darstellende Codewörter aufweist, wobei die
Transformationskoeffizienten entsprechend dem
zweidimensionalen Empfindlichkeitsmodell des menschlichen
Sehvermögens normiert und dann quantisiert werden,
wobei das menschliche Sehvermögen bezüglich diagonal
verlaufender Ortsfrequenzen geringerempfindlich ist
als für solche, die horizontal oder vertikal
verlaufen,
b) Mittel (30) zum Dekodieren des Digitalbildsignals,
wobei die Dekodiermittel folgende Mittel umfassen:
i) Mittel zum Dekodieren der empfangenen Codewörter
und Bereitstellen eindimensional angeordneter
Transformationskoeffizienten,
ii) Mittel (32) zum Denormieren der
Transformationskoeffizientenwerte, wobei die Mittel (32) Mittel
(42) aufweisen, welche die Tatsache
berücksichtigen, daß das menschliche Sehvermögen bezüglich
diagonal verlaufender Ortsfrequenzen
geringerempfindlich ist als für solche, die horizontal
oder vertikal verlaufen, und
iii) Mittel (38) zum invertierten Transformieren der
denormierten Koeffizienten, um das
Digitalbildsignal rückzugewinnen.
7. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, daß
die Mittel zum Normieren der
Transformationskoeffizienten eine Normierungskoeffizienten enthalende
Transformationstabelle sowie Mittel zum Multiplizieren
der Transformationskoeffizienten mit den entsprechenden
Normierungskoeffizienten aufweisen.
8. Vorrichtung nach Anspruch 6 oder 7, dadurch
gekennzeichnet, daß die Mittel zur Durchführung einer
Ortsfrequenztransformation diese an Teilbereichen des
Digitalbildes durchführen, und daß das zweidimensionale
Empfindlichkeitsmodell dahingehend verändert wird, daß
es auf Ortsfrequenzen, die zwischen einer Frequenz, bei
der sich das Maximum des menschlichen Sehvermögens
befindet und einer Nullfrequenz pro Winkelgrad liegen,
konstant maximal anspricht.
9. Vorrichtung nach einem der Ansprüche 6 - 8, dadurch
gekennzeichnet, daß die Mittel zur Durchführung einer
Ortsfrequenzfransformation eine diskrete
Cosinus-Transformation durchführen.
10. Vorrichtung nach einem der Ansprüche 6 - 9, dadurch
gekennzeichnet, daß die Mittel zum Quantisieren der
Transformationskoeffizienten einen gleichbleibenden
Quantisierer aufweisen, der die normierten Koeffizienten
quantisiert.
11. Vorrichtung zum Komprimieren, Übermitteln und Empfangen
eines Digitalbildes über einen Übertragungskanal
begrenzter Bandbreite, gekennzeichnet durch
a) Mittel (16, 18, 20) zum Durchführen einer
zweidimensionalen Ortsfrequenztransformation an dem
Digitalbild
zur Erzeugung eindimensional angeordneter
Transformationskoeffizienten;
b) Mittel (24) zum Normieren der in eindimensionaler
Anordnung befindlichen Transformationskoeffizenten
entsprechend einem rotationssymmetrischen,
zweidimensionalen Empfindlichkeitsmodell des menschlichen
Sehvermögens bezüglich Ortsfrequenzen, wobei die Mittel
(24) zum Normieren der Transformationskoeffizienten
- ausgehend von dem rotationssymmetrischen
zweidimensionalen Modell und dessen Verändern in der Weise,
daß es gegenüber Horizontalen oder Vertikalen bei
diagonal verlaufender Richtung verringert anspricht
- Mittel (42) aufweisen, die das zweidimensionale
Empfindlichkeitsmodell des menschlichen Sehvermögens
gegenüber Ortsfrequenzen ändern, um ein Ansprechen in
diagonal er Richtung gegenüber Horizontalen oder
Vertikalen zu vermindern, so daß das zweidimensionale
Modell die Tatsache berücksichtigt, daß das
menschliche Sehvermögen bezüglich diagonal verlaufender
Ortsfrequenzen geringer empfindlich ist als für
solche, die in horizontaler oder vertikaler Richtung
verlaufen.
c) Mittel (32) zum Denormieren der normierten
Transformationskoeffizienten, um denormierte
Transformationskoeffizienten zu erhalten, wobei die Mittel (32)
Mittel (42) aufweisen, welche die Tatsache
berücksichtigen, daß das menschliche Sehvermögen bezüglich
diagonal verlaufender Ortsfrequenzen geringer
empfindlich ist als für solche, die in horizontaler
oder vertikaler Richtung verlaufen.
d) Mittel (36, 38, 40) zum Durchführen der invertierten
zweidimensionalen Ortsfrequenztransformation der
denormierten Transformationskoeffizienten, um ein
Digitalbildsignal zu erzeugen.
12. System zum Komprimieren und Übermitteln eines
digitalisierten Bildsignals über einen Übertragungskanal
begrenzter Bandbreite und zum Empfangen und Wiedergeben
des Digitalbildes, gekennzeichnet durch
- optische Wiedergabemittel mit typischen Pixel- und
Betrachtungsabständen,
- eine Übermittlungs- und eine Empfangsvorrichtung nach
den Ansprüchen 2 bzw. 7, und
- Mittel zum Erzeugen der Transformationstabelle der
Normierungskonstanten, wobei diese Mittel folgende
Mittel aufweisen:
a) Mittel zum Festlegen der zweidimensionalen
Ortsfrequenzkomponenten jedes der
Transformationskoeffizienten,
b) Mittel zum Erzeugen des zweidimensionalen
Empfindlichkeitsmodells des menschlichen sehvermögens
bezüglich Ortsfrequenzen unter Berücksichtigung der
Tatsache, daß das menschliche Sehvermögen bezüglich
diagonal verlaufender Ortsfrequenzen
geringerempfindlich ist als für solche, die horizontal oder
vertikal verlaufen, wobei die Mittel zum Erzeugen
des Modells Skalierungsmittel zum Empfangen von
Signaleingaben für typische Pixel- und
Betrachtungsabstände aufweisen, die das Modell bezüglich
des Winkels, unter welchem der zwei benachbarte
Pixel trennende Abstand betrachtet wird, skalieren,
und
c) Mittel zum Kennzeichnen eines visuellen
Empfindlichkeitswerts für jeden
Transformationskoeffizienten, um die Normierungskonstanten zu erzeugen.
13. System nach Anspruch 12, dadurch gekennzeichnet, daß die
Mittel zum Durchführen einr zweidimensionalen
Ortsfrequenztransformation eine diskrete Cosinus-Transformation
durchführen.
14. System nach Anspruch 13, dadurch gekennzeichnet, daß die
Mittel zum Durchführen einer zweidimensionalen
Ortsfrequenztransformation diese an Teilbereichen des
Digitalbildes ausführen, wobei die Mittel zum Erzeugen des
zweidimensionalen Empfindlichkeitsmodells des
menschlichen Sehvermögens ein bei niedrigen Freuquenzen
konstant maximal ansprechendes Modell erzeugen, und
wobei die Mittel zum Empfangen von Signaleingaben auch
Eingaben bezüglich der Größe des Teilbereichs des
Digitalbildes empfangen.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/057,413 US4780761A (en) | 1987-06-02 | 1987-06-02 | Digital image compression and transmission system visually weighted transform coefficients |
PCT/US1988/001610 WO1988010050A1 (en) | 1987-06-02 | 1988-05-20 | Digital image compression and transmission system employing visually weighted transform coefficients |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3852615D1 DE3852615D1 (de) | 1995-02-09 |
DE3852615T2 true DE3852615T2 (de) | 1995-08-17 |
Family
ID=22010440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE3852615T Expired - Fee Related DE3852615T2 (de) | 1987-06-02 | 1988-05-20 | Digitales system zum reduzieren und uebertragen von bilddaten, das visuell gewichtete transformationskoeffizienten verwendet. |
Country Status (5)
Country | Link |
---|---|
US (1) | US4780761A (de) |
EP (1) | EP0316419B1 (de) |
JP (1) | JPH01503588A (de) |
DE (1) | DE3852615T2 (de) |
WO (1) | WO1988010050A1 (de) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6336180B1 (en) | 1997-04-30 | 2002-01-01 | Canon Kabushiki Kaisha | Method, apparatus and system for managing virtual memory with virtual-physical mapping |
FR2621194B1 (fr) * | 1987-09-29 | 1989-12-29 | Labo Electronique Physique | Dispositif de codage de signaux video numeriques |
US6563875B2 (en) * | 1987-12-30 | 2003-05-13 | Thomson Licensing S.A. | Adaptive method of encoding and decoding a series of pictures by transformation, and devices for implementing this method |
US5162923A (en) * | 1988-02-22 | 1992-11-10 | Canon Kabushiki Kaisha | Method and apparatus for encoding frequency components of image information |
JPH0671237B2 (ja) * | 1988-09-16 | 1994-09-07 | 日本ビクター株式会社 | 高能率符号化方式 |
US5691777A (en) * | 1988-10-17 | 1997-11-25 | Kassatly; Lord Samuel Anthony | Method and apparatus for simultaneous compression of video, audio and data signals |
JPH0810935B2 (ja) * | 1988-12-09 | 1996-01-31 | 富士写真フイルム株式会社 | 画像信号圧縮符号化装置および伸長再生装置 |
US5184229A (en) * | 1988-12-09 | 1993-02-02 | Fuji Photo Film Co., Ltd. | Compression coding device and expansion decoding device for picture signal |
US5170264A (en) * | 1988-12-10 | 1992-12-08 | Fuji Photo Film Co., Ltd. | Compression coding device and expansion decoding device for a picture signal |
JP2625012B2 (ja) * | 1989-02-16 | 1997-06-25 | 富士写真フイルム株式会社 | 画像信号圧縮符号化装置 |
JP2827259B2 (ja) * | 1989-03-08 | 1998-11-25 | キヤノン株式会社 | 固体カメラ |
FR2644962A1 (fr) * | 1989-03-24 | 1990-09-28 | Labo Electronique Physique | Dispositif de codage de signaux video numeriques |
US5060285A (en) * | 1989-05-19 | 1991-10-22 | Gte Laboratories Incorporated | Hierarchical variable block size address-vector quantization using inter-block correlation |
US5068723A (en) * | 1989-05-19 | 1991-11-26 | Gte Laboratories Incorporated | Frame or sub-frame rate adaptive vector quantizer for moving images |
US4994927A (en) * | 1989-06-19 | 1991-02-19 | Gte Laboratories Inc | Self-adaptive neural net based vector quantizer for image compression |
JP3085465B2 (ja) * | 1989-10-31 | 2000-09-11 | オリンパス光学工業株式会社 | 画像データの符号化装置および符号化方法 |
US5063608A (en) * | 1989-11-03 | 1991-11-05 | Datacube Inc. | Adaptive zonal coder |
US4974078A (en) * | 1989-11-13 | 1990-11-27 | Eastman Kodak Company | Digital compression method and system with improved coding efficiency |
US5150433A (en) * | 1989-12-01 | 1992-09-22 | Eastman Kodak Company | Histogram/variance mechanism for detecting presence of an edge within block of image data |
US5422675A (en) * | 1990-01-29 | 1995-06-06 | Massachusetts Institute Of Technology | Adaptive modulation/demodulation signal processing |
US5128754A (en) * | 1990-03-30 | 1992-07-07 | New York Institute Of Technology | Apparatus and method for encoding and decoding video |
US5159453A (en) * | 1990-09-07 | 1992-10-27 | New York Institute Of Technology | Video processing method and apparatus |
US5136374A (en) * | 1990-04-03 | 1992-08-04 | At&T Bell Laboratories | Geometric vector quantization |
US5291282A (en) * | 1990-04-19 | 1994-03-01 | Olympus Optical Co., Ltd. | Image data coding apparatus and method capable of controlling amount of codes |
US5079621A (en) * | 1990-06-29 | 1992-01-07 | Eastman Kodak Company | Dct transform compression, transmission and recovery of digital color using virtual filtering mechanism |
US5172227A (en) * | 1990-12-10 | 1992-12-15 | Eastman Kodak Company | Image compression with color interpolation for a single sensor image system |
US5128756A (en) * | 1990-12-11 | 1992-07-07 | At&T Bell Laboratories | High definition television coding arrangement with graceful degradation |
US5161015A (en) * | 1990-12-31 | 1992-11-03 | Zenith Electronics Corporation | System for peaking a video signal with a control signal representative of the perceptual nature of blocks of video pixels |
GB2252001B (en) * | 1991-01-11 | 1995-01-04 | Sony Broadcast & Communication | Storage of video signals |
GB2251756B (en) * | 1991-01-11 | 1995-01-04 | Sony Broadcast & Communication | Compression of video signals |
JP3012698B2 (ja) * | 1991-01-29 | 2000-02-28 | オリンパス光学工業株式会社 | 画像データの符号化装置および符号化方法 |
US5113256A (en) * | 1991-02-08 | 1992-05-12 | Zenith Electronics Corporation | Method of perceptually modeling a video image signal |
US5282049A (en) * | 1991-02-08 | 1994-01-25 | Olympus Optical Co., Ltd. | Moving-picture data digital recording and reproducing apparatuses |
JPH05167863A (ja) * | 1991-04-15 | 1993-07-02 | Canon Inc | 画像処理方法及び装置 |
JP2670201B2 (ja) * | 1991-08-30 | 1997-10-29 | 富士写真フイルム株式会社 | 画像データ圧縮符号化装置および方法 |
US5214507A (en) * | 1991-11-08 | 1993-05-25 | At&T Bell Laboratories | Video signal quantization for an mpeg like coding environment |
US5252819A (en) * | 1991-11-13 | 1993-10-12 | The Boeing Company | Scanning sensor processing apparatus and method for providing correction of output signal distortion |
US5371544A (en) * | 1992-02-07 | 1994-12-06 | At&T Corp. | Geometric vector quantization |
US5754311A (en) * | 1992-03-10 | 1998-05-19 | Eastman Kodak Company | Method and apparatus for generating simultaneously derived correlated digital halftone patterns |
JP2940304B2 (ja) * | 1992-06-15 | 1999-08-25 | 松下電器産業株式会社 | 高能率符号化装置および高能率符号化方法および高能率符号化装置の復号装置 |
US5392223A (en) * | 1992-07-29 | 1995-02-21 | International Business Machines Corp. | Audio/video communications processor |
GB2270811B (en) * | 1992-09-17 | 1996-02-07 | Sony Broadcast & Communication | Video data compression |
US5684534A (en) * | 1993-05-26 | 1997-11-04 | Intel Corporation | Task-splitting dual-processor system for motion estimation processing |
US5438374A (en) * | 1993-12-10 | 1995-08-01 | At&T Corp. | System and method for filtering video signals |
US5426512A (en) * | 1994-01-25 | 1995-06-20 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
US5574798A (en) * | 1994-08-03 | 1996-11-12 | International Business Machines Corporation | Visual presentation system which determines length of time to present each slide or transparency |
US5717468A (en) * | 1994-12-02 | 1998-02-10 | International Business Machines Corporation | System and method for dynamically recording and displaying comments for a video movie |
US5629780A (en) * | 1994-12-19 | 1997-05-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
JP3703195B2 (ja) * | 1995-03-27 | 2005-10-05 | ヒューレット・パッカード・カンパニー | カラー画像伝送装置 |
KR0159434B1 (ko) * | 1995-04-19 | 1999-01-15 | 김광호 | 휴먼 비쥬얼 시스템 모델링을 이용한 웨이블렛 영상 압축/복원장치 및 방법 |
KR0175732B1 (ko) * | 1995-08-09 | 1999-04-01 | 조백제 | 다채널 오디오 디코더의 역정규화장치 및 그의 역정규화방법 |
US6091767A (en) * | 1997-02-03 | 2000-07-18 | Westerman; Larry Alan | System for improving efficiency of video encoders |
AUPO648397A0 (en) | 1997-04-30 | 1997-05-22 | Canon Information Systems Research Australia Pty Ltd | Improvements in multiprocessor architecture operation |
US6507898B1 (en) | 1997-04-30 | 2003-01-14 | Canon Kabushiki Kaisha | Reconfigurable data cache controller |
US6707463B1 (en) | 1997-04-30 | 2004-03-16 | Canon Kabushiki Kaisha | Data normalization technique |
AUPO647997A0 (en) * | 1997-04-30 | 1997-05-22 | Canon Information Systems Research Australia Pty Ltd | Memory controller architecture |
US6289138B1 (en) | 1997-04-30 | 2001-09-11 | Canon Kabushiki Kaisha | General image processor |
US6414687B1 (en) | 1997-04-30 | 2002-07-02 | Canon Kabushiki Kaisha | Register setting-micro programming system |
US6674536B2 (en) | 1997-04-30 | 2004-01-06 | Canon Kabushiki Kaisha | Multi-instruction stream processor |
US6115423A (en) * | 1997-11-19 | 2000-09-05 | Rockwell Science Center, Llc | Image coding for liquid crystal displays |
US6327392B1 (en) * | 1999-01-28 | 2001-12-04 | Sharp Laboratories Of America, Inc. | Method of visual progressive coding |
JP4131052B2 (ja) | 1998-07-17 | 2008-08-13 | ソニー株式会社 | 撮像装置 |
US6356668B1 (en) | 1998-12-29 | 2002-03-12 | Eastman Kodak Company | Method for efficient rate control |
US6349151B1 (en) * | 1998-12-29 | 2002-02-19 | Eastman Kodak Company | Method and apparatus for visually optimized compression parameters |
US6212302B1 (en) * | 1998-12-29 | 2001-04-03 | Eastman Kodak Company | Method and apparatus for visually optimized rate control |
US6687412B1 (en) * | 1999-10-22 | 2004-02-03 | Texas Instruments Incorporated | Method and system for generating image compression quantization matrices |
US6597473B1 (en) * | 1999-11-29 | 2003-07-22 | Xerox Corporation | Method to obtain consistent image quality measurements from different image input devices |
US7312816B2 (en) | 2002-07-24 | 2007-12-25 | Freestone Systems, Inc. | Digital observation system |
US7298397B2 (en) * | 2002-07-24 | 2007-11-20 | Freestone Systems, Inc. | Digital transmission system |
KR100501933B1 (ko) * | 2002-11-21 | 2005-07-18 | 삼성전자주식회사 | 멀티미디어 데이터 암호화 압축방법 및 장치 |
US7657110B2 (en) * | 2003-01-21 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Image compression using a color visual model |
US8049741B2 (en) * | 2006-01-11 | 2011-11-01 | Dell Products L.P. | Video optimized LCD response time compensation |
US7729551B2 (en) * | 2006-09-08 | 2010-06-01 | Eastman Kodak Company | Method for controlling the amount of compressed data |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4068265A (en) * | 1974-11-25 | 1978-01-10 | Eli S. Jacobs | Method and apparatus for sampling and reproducing television information |
US4179709A (en) * | 1978-01-10 | 1979-12-18 | Bell & Howell Company | Video information bandwidth compression |
US4196448A (en) * | 1978-05-15 | 1980-04-01 | The United States Of America As Represented By The Secretary Of The Navy | TV bandwidth reduction system using a hybrid discrete cosine DPCM |
US4302775A (en) * | 1978-12-15 | 1981-11-24 | Compression Labs, Inc. | Digital video compression system and methods utilizing scene adaptive coding with rate buffer feedback |
US4394774A (en) * | 1978-12-15 | 1983-07-19 | Compression Labs, Inc. | Digital video compression system and methods utilizing scene adaptive coding with rate buffer feedback |
US4541012A (en) * | 1982-01-04 | 1985-09-10 | Compression Labs, Inc. | Video bandwidth reduction system employing interframe block differencing and transform domain coding |
US4520391A (en) * | 1982-12-20 | 1985-05-28 | International Business Machines Corporation | Diagonal grid image communication and display |
GB2150388B (en) * | 1983-11-22 | 1987-04-23 | English Electric Valve Co Ltd | Display systems |
DE3626916A1 (de) * | 1986-08-08 | 1988-02-11 | Thomson Brandt Gmbh | Verfahren zur uebertragung eines videosignales |
-
1987
- 1987-06-02 US US07/057,413 patent/US4780761A/en not_active Expired - Lifetime
-
1988
- 1988-05-20 DE DE3852615T patent/DE3852615T2/de not_active Expired - Fee Related
- 1988-05-20 EP EP88905099A patent/EP0316419B1/de not_active Expired - Lifetime
- 1988-05-20 WO PCT/US1988/001610 patent/WO1988010050A1/en active IP Right Grant
- 1988-05-20 JP JP63504652A patent/JPH01503588A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP0316419A1 (de) | 1989-05-24 |
EP0316419B1 (de) | 1994-12-28 |
US4780761A (en) | 1988-10-25 |
DE3852615D1 (de) | 1995-02-09 |
JPH01503588A (ja) | 1989-11-30 |
WO1988010050A1 (en) | 1988-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3852615T2 (de) | Digitales system zum reduzieren und uebertragen von bilddaten, das visuell gewichtete transformationskoeffizienten verwendet. | |
DE3884802T3 (de) | Verfahren und vorrichtung zur adaptiven blocktransformationscodierung von bildern. | |
DE3851468T2 (de) | Kodierungsverfahren von Bildsignalen. | |
DE3856536T2 (de) | Kodierung von Daten, die wie eine multidimensionale Matrix dargestellt sind | |
DE69324743T2 (de) | Vorrichtung und Verfahren zur Bildsignalkodierung | |
DE69130214T2 (de) | Bilddatenkompression mit adaptiver Blockgrössenauswahl | |
DE69326990T2 (de) | Kodierungssystem und -verfahren | |
DE69015695T2 (de) | Einrichtung zur Transformationskodierung. | |
DE69428979T2 (de) | Einrichtung und verfahren zur kodierung von bilddaten | |
DE69320117T2 (de) | Kompression und Wiederaufbau von radiologischen Bildern | |
DE69425179T2 (de) | Kodierungsvorrichtung und -verfahren | |
DE69533870T2 (de) | Vorrichtung zur Bilddekodierung | |
DE69022623T2 (de) | Gegenständlich adaptiertes Bildkodiersystem. | |
DE69511390T2 (de) | Quellencodierer mit voreingestellter qualität | |
DE69222766T2 (de) | System zur adaptiven kompression der blockgrössen eines bildes | |
EP0309669B1 (de) | Verfahren zur szenenmodellgestützten Bilddatenreduktion für digitale Fernsehsignale | |
DE3789273T2 (de) | Kodierungssystem zur Reduktion der Redundanz. | |
DE69623330T2 (de) | Merkmalbasiertes videokompressionsverfahren | |
DE68923875T2 (de) | Entropie-Kodierer/Dekodierer mit einem Kontextextrahierer. | |
DE69424591T2 (de) | Verfahren zur Kontrolle der Datenmenge und Kodierer zur Durchführung desselben. | |
DE69221191T2 (de) | Verfahren und Vorrichtung zur Prädiktiven Kodierung eines Bildsignals mit Bewegungskompensation | |
DE4343211B4 (de) | Adaptives Bildkompressionsverfahren und adaptive Bildkompressionsvorrichtung | |
EP0421186B1 (de) | Verfahren zur Codierung beliebig geformter Bildsegmente | |
EP0201679A1 (de) | Verfahren zur Bilddatenreduktion für digitale Fernsehsignale | |
DE69421795T2 (de) | Vorrichtung und verfahren zur kodierung von bildern |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: EASTMAN KODAK CO., ROCHESTER, N.Y., US |
|
8339 | Ceased/non-payment of the annual fee |