FR2929797A1 - METHOD AND DEVICE FOR ENCODING AN IMAGE SEQUENCE - Google Patents
METHOD AND DEVICE FOR ENCODING AN IMAGE SEQUENCE Download PDFInfo
- Publication number
- FR2929797A1 FR2929797A1 FR0852237A FR0852237A FR2929797A1 FR 2929797 A1 FR2929797 A1 FR 2929797A1 FR 0852237 A FR0852237 A FR 0852237A FR 0852237 A FR0852237 A FR 0852237A FR 2929797 A1 FR2929797 A1 FR 2929797A1
- Authority
- FR
- France
- Prior art keywords
- image
- sequence
- clipping window
- window
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
L'invention concerne un procédé de codage d'une séquence d'images sous la forme d'un flux scalable comprenant une couche de base et une couche d'amélioration. Le procédé comprend les étapes suivantes :- déterminer (E101, E102) dans chaque image de la séquence, dite première séquence d'images, une fenêtre de découpage (W1);- sous-échantillonner (E103), pour chaque image de la première séquence, la partie d'image délimitée par la fenêtre de découpage (W1) de telle sorte à construire une seconde séquence d'images ; et- coder (E12, E14, E16) la seconde séquence d'images comme couche de base du flux scalable et la première séquence d'images comme couche d'amélioration du flux scalable.Selon l'invention, la fenêtre de découpage (W1) est déterminée dans une image de la première séquence selon les étapes suivantes :- déterminer (E101) dans l'image une première fenêtre de découpage (W0); et- déterminer (E102) une seconde fenêtre de découpage entourant la première fenêtre de découpage (W0) de telle sorte que la seconde fenêtre de découpage soit conforme à au moins une contrainte prédéfinie imposée par l'étape de codage (E12, E14, E16), la fenêtre de découpage (W1) de l'image étant la seconde fenêtre de découpage.The invention relates to a method of encoding an image sequence in the form of a scalable stream comprising a base layer and an enhancement layer. The method comprises the following steps: determining (E101, E102) in each image of the sequence, called the first image sequence, a cutting window (W1); subsampling (E103), for each image of the first sequence, the image portion delimited by the clipping window (W1) so as to construct a second sequence of images; and- coding (E12, E14, E16) the second image sequence as a base layer of the scalable flow and the first image sequence as a scalable flux enhancement layer.According to the invention, the clipping window (W1 ) is determined in an image of the first sequence according to the following steps: - determining (E101) in the image a first cutting window (W0); anddetermining (E102) a second clipping window surrounding the first clipping window (W0) so that the second clipping window conforms to at least one predefined constraint imposed by the coding step (E12, E14, E16 ), the clipping window (W1) of the image being the second clipping window.
Description
PROCEDE ET DISPOSITIF DE CODAGE D'UNE SEQUENCE D'IMAGES METHOD AND DEVICE FOR ENCODING AN IMAGE SEQUENCE
1. Domaine de l'invention L'invention se rapporte au domaine général du codage de séquences d'images. L'invention concerne plus particulièrement un procédé de codage d'une séquence d'images sous la forme d'un flux scalable et un dispositif de codage implémentant le procédé de codage. FIELD OF THE INVENTION The invention relates to the general field of coding image sequences. The invention more particularly relates to a method of coding an image sequence in the form of a scalable stream and a coding device implementing the coding method.
2. Etat de l'art Le codage scalable permet de représenter une même séquence d'images dans un unique flux sous la forme de plusieurs format chacun d'eux étant adapté à des terminaux différents ayant des capacités différentes en termes d'affichage et/ou de puissance de calcul et/ou de mémoire et/ou d'interfaces réseaux. 2. State of the Art Scalable coding makes it possible to represent the same sequence of images in a single stream in the form of several formats, each of them being adapted to different terminals having different capacities in terms of display and / or or computing power and / or memory and / or network interfaces.
En référence aux figures 1 et 2, il est connu un dispositif de codage 1 apte à coder une séquence SO d'images initiales IO sous la forme d'un flux scalable F comprenant une couche de base et au moins une couche d'amélioration. II est connu qu'un tel dispositif de codage 1 comprend une entrée 8 pour recevoir une séquence SO d'images initiales IO et un module de sous-échantillonnage 10 apte à sous échantillonner chaque image IO de ladite séquence SO pour générer une séquence S1 d'images modifiées 11 de résolution inférieure à celle des images initiales 10. Le dispositif de codage 1 comprend en outre un premier module de codage 12 apte à coder les images 11 de la séquence modifiée S1 en un premier flux F1 connu sous le nom de couche de base et un second module de codage 14 apte à coder les images de la séquence initiale SO en un second flux FO connu sous le nom de couche d'amélioration à partir notamment de données de codage (p.ex. données de mouvement, données résiduelles, données de texture ...) issues du codage des images de la séquence modifiée S1. Le dispositif de codage 1 comprend en outre relié aux sorties des premier et second modules de codage 12 et 14, un module de multiplexage 16 apte à multiplexer la couche de base F1 et la couche d'amélioration FO en un uniquement flux F transmis via la sortie 18. Selon une variante connue, illustrée par la figure 3, le module 10 de sous échantillonnage des images IO de séquence d'images initiale SO est adapté pour sous échantillonner une partie seulement de chaque image IO de ladite séquence SO afin de générer la séquence S1 d'images modifiées 11, laquelle partie est délimitée dans l'image IO par une fenêtre de découpage W0. With reference to FIGS. 1 and 2, there is known a coding device 1 capable of coding a sequence SO of initial images I0 in the form of a scalable flow F comprising a base layer and at least one enhancement layer. It is known that such a coding device 1 comprises an input 8 for receiving a sequence SO of initial images I0 and a sub-sampling module 10 able to sub-sample each IO image of said sequence SO to generate a sequence S1 of modified images 11 of lower resolution than that of the initial images 10. The coding device 1 further comprises a first coding module 12 able to encode the images 11 of the modified sequence S1 into a first stream F1 known as a layer base and a second coding module 14 capable of coding the images of the initial sequence SO into a second FO stream known as an enhancement layer from, in particular, coding data (eg motion data, data). residuals, texture data ...) resulting from the coding of the images of the modified sequence S1. The coding device 1 further comprises connected to the outputs of the first and second coding modules 12 and 14, a multiplexing module 16 able to multiplex the base layer F1 and the enhancement layer FO in a single stream F transmitted via the According to a known variant, illustrated in FIG. 3, the sub-sampling module 10 of the initial image sequence images SO 10 is adapted to sub-sample only a part of each image 10 of said sequence SO in order to generate the sequence S1 of modified images 11, which part is delimited in the image IO by a cutting window W0.
Il est courant que les modules de codage 12 et 14 imposent des contraintes au module de sous-échantillonnage 10 pour définir la fenêtre de découpage W0. Les images IO étant découpées en blocs de pixels ne se recouvrant pas, une contrainte est par exemple que le coin en haut à gauche de la fenêtre de découpage WO soit aligné sur la grille de blocs dans 10. Un autre exemple de contrainte impose que le coin en haut à gauche de la fenêtre de découpage WO soit déplacé entre deux images consécutives IO de la séquence initiale SO d'un multiple de 2 pixels selon l'axe horizontal et l'axe vertical. Dans ces cas, la fenêtre de découpage WO ne peut pas être positionnée n'importe où dans les images IO et notamment pas de manière optimale au regard du contenu visuel de ces images 10. Par ailleurs, de telles contraintes diminuent le confort visuel d'un utilisateur visualisant les images modifiées 11 générées à partir des images IO et de la fenêtre W0. It is common for the coding modules 12 and 14 to impose constraints on the subsampling module 10 to define the clipping window W0. Since the IO images are cut into blocks of pixels that do not overlap, a constraint is for example that the top left corner of the clipping window WO is aligned with the block grid in 10. Another example of a constraint imposes that the the top left corner of the cutting window WO is moved between two consecutive images IO of the initial sequence SO by a multiple of 2 pixels along the horizontal axis and the vertical axis. In these cases, the clipping window WO can not be positioned anywhere in the IO images and in particular not optimally with respect to the visual content of these images 10. Moreover, such constraints reduce the visual comfort of the images. a user viewing the modified images 11 generated from the IO images and the window W0.
3. Résumé de l'invention L'invention a pour but de pallier au moins un des inconvénients de l'art antérieur. A cet effet, l'invention concerne un procédé de codage d'une séquence d'images sous la forme d'un flux scalable comprenant une couche de base et une couche d'amélioration. Le procédé comprend les étapes suivantes : - déterminer dans chaque image de la séquence, dite première séquence d'images, une fenêtre de découpage; - sous-échantillonner, pour chaque image de la première séquence, la partie d'image délimitée par la fenêtre de découpage de telle sorte à construire une seconde séquence d'images ; et - coder la seconde séquence d'images comme couche de base du flux scalable et la première séquence d'images comme couche d'amélioration du flux scalable. SUMMARY OF THE INVENTION The object of the invention is to overcome at least one of the drawbacks of the prior art. To this end, the invention relates to a method of encoding an image sequence in the form of a scalable stream comprising a base layer and an enhancement layer. The method comprises the following steps: determining in each image of the sequence, called the first sequence of images, a cutting window; downsampling, for each image of the first sequence, the image portion delimited by the clipping window so as to construct a second sequence of images; and - encoding the second image sequence as the scalable flow base layer and the first image sequence as the scalable flow enhancement layer.
Selon un premier aspect de l'invention, la fenêtre de découpage est déterminée dans une image de la première séquence selon les étapes suivantes : - déterminer dans l'image une première fenêtre de découpage; - déterminer une seconde fenêtre de découpage entourant la première fenêtre de découpage de telle sorte que la seconde fenêtre de découpage soit conforme à au moins une contrainte prédéfinie imposée par l'étape de codage, la fenêtre de découpage étant la seconde fenêtre de découpage. Selon un autre aspect avantageux de l'invention, la seconde fenêtre de découpage est la plus petite fenêtre de découpage entourant la première fenêtre de découpage et conforme à la au moins une contrainte prédéfinie imposée par l'étape de codage. Selon un troisième aspect avantageux de l'invention, le procédé de codage comprend en outre une étape de codage, dans la couche de base, de données représentatives de la distance de chacun des bords de la première fenêtre de découpage par rapport à chacun des bords correspondant de la fenêtre de découpage entourant la première fenêtre de découpage . L'invention concerne également, un dispositif de codage d'une séquence d'images sous la forme d'un flux scalable comprenant une couche de base et une couche d'amélioration. Le dispositif de codage selon l'invention comprend: - des moyens de recadrage pour déterminer dans chaque image de la séquence, dite première séquence d'images, une fenêtre de découpage; - des moyens de sous-échantillonnage pour sous-échantillonner, pour chaque image de la première séquence, la partie d'image délimitée par la fenêtre de découpage de telle sorte à construire une seconde séquence d'images ; et - des moyens de codage pour coder la seconde séquence d'images comme couche de base du flux scalable et la première séquence d'images comme couche d'amélioration du flux scalable. According to a first aspect of the invention, the clipping window is determined in an image of the first sequence according to the following steps: determining in the image a first clipping window; determining a second clipping window surrounding the first clipping window so that the second clipping window conforms to at least one predefined constraint imposed by the coding step, the clipping window being the second clipping window. According to another advantageous aspect of the invention, the second clipping window is the smallest clipping window surrounding the first clipping window and conforms to the at least one predefined constraint imposed by the coding step. According to a third advantageous aspect of the invention, the coding method further comprises a step of encoding, in the base layer, data representative of the distance of each of the edges of the first cutting window with respect to each of the edges. corresponding to the clipping window surrounding the first clipping window. The invention also relates to a device for encoding an image sequence in the form of a scalable stream comprising a base layer and an enhancement layer. The coding device according to the invention comprises: - cropping means for determining in each image of the sequence, called the first sequence of images, a cutting window; subsampling means for downsampling, for each image of the first sequence, the image portion delimited by the clipping window so as to construct a second sequence of images; and coding means for coding the second image sequence as a base layer of the scalable flow and the first image sequence as a scalable flux enhancement layer.
Préférentiellement, les moyens de recadrage du dispositif de codage comprennent : - des premiers moyens pour déterminer dans une image de la première séquence une première fenêtre de découpage; et - des seconds moyens pour déterminer une seconde fenêtre de découpage entourant la première fenêtre de découpage de telle sorte que la seconde fenêtre de découpage soit conforme à au moins une contrainte prédéfinie imposée par les moyens de codage, la fenêtre de découpage étant la seconde fenêtre de découpage. Preferably, the means for reframing the coding device comprise: first means for determining in an image of the first sequence a first clipping window; and second means for determining a second clipping window surrounding the first clipping window so that the second clipping window conforms to at least one predefined constraint imposed by the coding means, the clipping window being the second window cutting.
4. Listes des fiqures L'invention sera mieux comprise et illustrée au moyen d'exemples de modes de réalisation et de mise en oeuvre avantageux, nullement limitatifs, 10 en référence aux figures annexées sur lesquelles : û la figure 1 est une représentation schématique d'un dispositif de codage selon l'état de l'art; - la figure 2 représente une image initiale IO et une image 11 générée à partir de l'image IO par un procédé de sous échantillonnage selon l'état de l'art; 15 û la figure 3 représente une image initiale IO et une image 11 générée à partir de l'image IO par un procédé de sous échantillonnage selon une variante du procédé de sous échantillonnage de l'état de l'art; - la figure 4 est une représentation schématique d'un dispositif de codage selon l'invention; 20 û la figure 5 est un diagramme d'un procédé de codage selon l'invention ; - la figure 6 est un schéma illustrant le procédé de codage selon l'invention; - la figure 7 représente une image de la couche de base générée selon l'invention et une fenêtre de découpage dans ladite image; - la figure 8 est une représentation schématique d'un dispositif d'affichage 25 selon l'invention; et - la figure 9 est un diagramme d'un procédé d'affichage selon l'invention. 4. LIST OF FILES The invention will be better understood and illustrated by means of examples of advantageous embodiments and implementations, in no way limiting, with reference to the appended figures in which: FIG. 1 is a diagrammatic representation of FIG. a coding device according to the state of the art; FIG. 2 represents an initial image 10 and an image 11 generated from the image 10 by a subsampling method according to the state of the art; FIG. 3 represents an initial image 10 and an image 11 generated from the image 10 by a subsampling method according to a variant of the sub-sampling method of the state of the art; FIG. 4 is a schematic representation of a coding device according to the invention; Figure 5 is a diagram of a coding method according to the invention; FIG. 6 is a diagram illustrating the coding method according to the invention; FIG. 7 represents an image of the base layer generated according to the invention and a cutting window in said image; FIG. 8 is a schematic representation of a display device 25 according to the invention; and FIG. 9 is a diagram of a display method according to the invention.
5. Description détaillée de l'invention En référence à la figure 4, l'invention concerne un dispositif de codage 30 2 apte à coder une séquence SO d'images initiales IO sous la forme d'un flux scalable F comprenant une couche de base et au moins une couche d'amélioration. Une séquence d'images comprend deux images ou plus de deux images. Les modules du dispositif de codage 2 selon l'invention identiques à ceux du dispositif de codage 1 selon l'état de l'art sont identifiés sur la figure 4 avec les mêmes références numériques que celles utilisées en lien avec la figure 1. Sur la figure 4, les modules représentés sont des unités fonctionnelles, qui peuvent ou non correspondre à des unités physiquement distinguables. Par exemple, ces modules ou certains d'entre eux peuvent être regroupés dans un unique composant, ou constituer des fonctionnalités d'un même logiciel. A contrario, certains modules peuvent éventuellement être composés d'entités physiques séparées. Le dispositif de codage 2 selon l'invention comprend l'entrée 8 pour recevoir une séquence SO d'images initiales IO et un module de sous-échantillonnage 20 apte à sous échantillonner une partie de chaque image IO de ladite séquence initiale SO pour générer une séquence S1 d'images modifiées 11 de résolution inférieure à celle des images initiales 10. La partie d'image IO en question est préalablement déterminée par le module de sous- échantillonnage 20 avant le sous-échantillonnage proprement dit. Le dispositif de codage 2 comprend en outre le premier module de codage 12 apte à coder les images de la séquence modifiée S1 en un premier flux F1 connu sous le nom de couche de base et le second module de codage 14 apte à coder les images de la séquence initiale SO en un second flux FO connu sous le nom de couche d'amélioration à partir notamment de données de codage issues du codage des images de la séquence modifiée S1. Le dispositif de codage 2 comprend en outre reliés aux sorties des premier et second modules de codage 12 et 14, le module de multiplexage 16 apte à multiplexer la couche de base F1 et la couche d'amélioration FO en un uniquement flux F. 5. DETAILED DESCRIPTION OF THE INVENTION With reference to FIG. 4, the invention relates to a coding device 30 capable of coding a sequence SO of initial images I0 in the form of a scalable flow F comprising a base layer. and at least one enhancement layer. An image sequence includes two or more images of two images. The modules of the coding device 2 according to the invention identical to those of the coding device 1 according to the state of the art are identified in FIG. 4 with the same reference numerals as those used in connection with FIG. In Figure 4, the represented modules are functional units, which may or may not correspond to physically distinguishable units. For example, these modules or some of them may be grouped into a single component, or be functionalities of the same software. On the other hand, some modules may be composed of separate physical entities. The coding device 2 according to the invention comprises the input 8 for receiving a sequence SO of initial images I0 and a sub-sampling module 20 able to sub-sample a part of each image 10 of said initial sequence SO to generate a S1 sequence of modified images 11 of lower resolution than that of the initial images 10. The portion of IO image in question is predetermined by the subsampling module 20 before the subsampling itself. The coding device 2 furthermore comprises the first coding module 12 capable of coding the images of the modified sequence S1 into a first stream F1 known as the base layer and the second coding module 14 able to encode the images of the initial sequence SO into a second FO stream known as an enhancement layer from, in particular, coding data derived from the coding of the images of the modified sequence S1. The coding device 2 furthermore comprises connected to the outputs of the first and second coding modules 12 and 14, the multiplexing module 16 able to multiplex the base layer F1 and the enhancement layer FO in a single stream F.
Le module de sous-échantillonnage 20 est adapté par rapport au module 10 correspondant du dispositif de codage 1 selon l'état de l'art. Le module de sous-échantillonnage 20 est apte à mettre en oeuvre les étapes E10 et E16 du procédé de codage selon l'invention décrit ci-après en lien avec la figure 5. The subsampling module 20 is adapted relative to the corresponding module 10 of the coding device 1 according to the state of the art. The subsampling module 20 is able to implement the steps E10 and E16 of the coding method according to the invention described hereinafter with reference to FIG. 5.
A l'étape E10, chaque image initiale IO de la séquence SO est sous- échantillonnée par le module 20 du dispositif de codage 2. A cet effet, l'étape E10 est elle-même divisée en une série d'étapes numérotées E101 à E103. A 1"étape El 01, une première fenêtre de découpage WO est déterminée dans chaque image 10. Une telle fenêtre, représentée sur la figure 6, est préférentiellement déterminée par un procédé de recadrage automatique tel que connu dans l'état de l'art. Un exemple simple d'un tel procédé de recadrage automatique consiste à calculer pour une image donnée une carte de saillance représentative de l'intérêt perceptuel de chacun des zones de l'image en question. Il positionne ensuite une fenêtre de taille prédéfinie inférieure à la taille de l'image initiale de telle sorte quelle soit centrée sur le point de l'image le plus saillant. Un exemple de procédé de recadrage automatique plus complexe est décrit dans la demande de brevet EP 06117768.9 publiée le 31.01.2007 sous le numéro 1748385. L'invention n'est toutefois aucunement limitée à tel ou tel procédé de recadrage automatique. Selon une variante, la première fenêtre de découpage WO est déterminée dans une première image de la séquence selon un procédé de recadrage automatique. Selon cette variante, la première fenêtre de découpage WO est déterminée, dans chacune des autres images de la séquence, comme étant celle qui a la même position que celle de la première fenêtre de découpage WO dans la première image. Selon une autre variante, la première fenêtre de découpage WO est déterminée selon un procédé de recadrage automatique dans une première image et une seconde image de la séquence distante de la première image. Selon cette variante, la première fenêtre de découpage WO est déterminée dans chaque image intermédiaire, i.e. chaque image de la séquence entre la première et la seconde image, par un procédé d'interpolation de la position de la fenêtre de découpage. L'étape E101 permet de définir une fenêtre de découpage WO pertinente d'un point de vue contenu visuel, i.e. comprenant les informations de l'image IO les plus pertinentes visuellement pour l'utilisateur. La fenêtre ainsi définie est optimale visuellement, mais ne répond pas nécessairement à des contraintes imposées par les modules de codage 12 et 14. A l'étape E102, la première fenêtre de découpage WO est étendue de telle sorte à former une seconde fenêtre de découpage W1 laquelle entoure la première fenêtre de découpage WO et de telle sorte à répondre aux contraintes imposées par les modules de codage 12 et 14. Préférentiellement, la seconde fenêtre de découpage W1 est la plus petite fenêtre répondant aux critères définis précédemment à savoir la plus petite fenêtre qui entoure la première fenêtre de découpage WO et qui répond aux contraintes imposées par les modules de codage 12 et 14. La figure 6 illustre un exemple particulier de réalisation. Sur cette figure, la seconde fenêtre de découpage W1 est la plus petite fenêtre qui entoure la première fenêtre de découpage WO et qui est alignée sur la grille de blocs de pixels de l'image IO contrainte imposée par les modules de codage 12 et 14. A l'étape E103, une image modifiée 11 est générée par sous-échantillonnage de la partie d'image IO comprise dans la seconde fenêtre de découpage W1. Cette étape est réitérée pour toutes les images de la séquence SO. Tout procédé de sous-échantillonnage de l'état de l'art peut être utilisé à cet effet comme par exemple un procédé basé sur un filtrage bilinéaire ou encore sur un filtrage par un filtre MPEG4 de coefficients {-1,0,9,16}. A l'étape E12, les images modifiées 11 sont codées en un flux F1, i.e. la couche de base. Selon un exemple particulier de réalisation, les images modifiées 11 sont codées conformément à la norme de codage vidéo H.264/ MEPG-4 AVC telle que définie dans le document ISO/IEC 14496-10. Cette étape de codage connue de l'homme du métier des codeurs vidéo n'est pas décrite davantage. A l'étape E14, les images initiales IO sont codées à partir de données de codage générées par l'étape de codage E12 en un flux F0, i.e. la couche d'amélioration. En effet, les données images des pixels des images IO situées dans la fenêtre de découpage WO sont très corrélées aux données images des pixels des images correspondantes 11. Il est donc particulièrement avantageux de coder les images initiales IO à partir de données de codage générées par l'étape de codage E12. Selon un exemple particulier de réalisation, les images initiales IO sont codées conformément à la norme de codage vidéo SVC, extension scalable de MPEG-4 AVC, telle que définie dans le document ISO/IEC 14496-10 amendement 3. Cette extension scalable a également été publiée sous la référence JVT-X201 lors de la réunion du groupe de travail JVT commun à l'ISO/IEC MPEG et à l'ITU-T VCEG qui a eu lieu à Genève du 29 juin au 5 juillet 2007. Cette étape de codage connue de l'homme du métier des codeurs vidéo n'est pas décrite davantage. A l'étape E16, les flux FO et F1 sont multiplexés de telle sorte à former un unique flux F scalable transmis via la sortie 18. Une telle étape de multiplexage est connue de l'homme du métier des codeurs vidéo n'est pas décrite davantage. On peut se référer notamment au document JVTX201.Selon une variante particulièrement avantageuse, les distances dl, d2, d3 et d4 de chacun des bords de la version sous-échantillonnée de la première fenêtre de découpage dans l'image 11 à chacun des bords de l'image 11 sont également codées dans la couche de base F1 à l'étape E12. Ces distances sont représentées sur la figure 7 à l'aide de flèches. Selon un exemple particulier de réalisation le flux scalable F est conforme à la norme SVC. Dans ce cas, les images modifiées 11 sont codées à l'étape E12 conformément au standard MPEG 4 AVC et les images initiales IO sont codées à l'étape E14 conformément à la norme SVC. Dans ce cas particulier, les distances dl, d2, d3 et d4 définies précédemment sont codées dans la couche de base à l'aide des outils de découpage définis au point 7.4.2.1 de ISO/IEC 14496-10 :2004 ou encore dans le document JVT-X201 dans la section 7.4.2.1.1 intitulée Sequence parameter set semantics à savoir : - frame_cropping_flag ; - frame_crop_left_offset, frame_crop_right_offset, frame_crop_top_offset et fram e_crop_bottom_offset. In step E10, each initial image I0 of the sequence SO is subsampled by the module 20 of the coding device 2. For this purpose, the step E10 is itself divided into a series of steps numbered E101 to E103. At step El 01, a first clipping window WO is determined in each image 10. Such a window, represented in FIG. 6, is preferably determined by an automatic reframing method as known in the state of the art. A simple example of such an automatic cropping method consists in calculating, for a given image, a saliency map representative of the perceptual interest of each of the zones of the image in question, it then positions a window of predefined size smaller than the size of the initial image so that it is centered on the point of the most salient image An example of a more complex automatic reframing method is described in the patent application EP 06117768.9 published on 31.01.2007 under the number The invention is however in no way limited to one or another automatic cropping method According to one variant, the first cutting window WO is determined by ns a first frame of the sequence according to an automatic cropping process. According to this variant, the first clipping window WO is determined, in each of the other images of the sequence, as being that which has the same position as that of the first clipping window WO in the first image. According to another variant, the first clipping window WO is determined according to an automatic cropping method in a first image and a second image of the remote sequence of the first image. According to this variant, the first clipping window WO is determined in each intermediate image, i.e. each image of the sequence between the first and the second image, by a method of interpolation of the position of the clipping window. Step E101 makes it possible to define a relevant WO cutting window from a visual content point of view, i.e. comprising the information of the IO image most visually relevant to the user. The window thus defined is visually optimal, but does not necessarily respond to constraints imposed by coding modules 12 and 14. In step E102, the first clipping window WO is extended to form a second clipping window. W1 which surrounds the first clipping window WO and in such a way as to respond to the constraints imposed by the coding modules 12 and 14. Preferably, the second clipping window W1 is the smallest window satisfying the criteria defined above, namely the smallest window which surrounds the first cutting window WO and which responds to the constraints imposed by the coding modules 12 and 14. FIG. 6 illustrates a particular embodiment. In this figure, the second clipping window W1 is the smallest window that surrounds the first clipping window WO and which is aligned with the grid of blocks of pixels of the constrained IO image imposed by the coding modules 12 and 14. In step E103, a modified image 11 is generated by downsampling the image portion I0 included in the second clipping window W1. This step is repeated for all the images of the SO sequence. Any subsampling method of the state of the art can be used for this purpose, for example a method based on bilinear filtering or on filtering by an MPEG4 filter with coefficients {-1,0,9,16 }. In step E12, the modified images 11 are encoded into a stream F1, i.e. the base layer. According to a particular embodiment, the modified images 11 are coded in accordance with the H.264 / MEPG-4 AVC video coding standard as defined in ISO / IEC 14496-10. This encoding step known to those skilled in the art of video encoders is not described further. In step E14, the initial images I0 are encoded from encoding data generated by the encoding step E12 into a stream F0, i.e. the enhancement layer. Indeed, the image data of the pixels of the images I0 located in the clipping window WO are highly correlated with the image data of the pixels of the corresponding images 11. It is therefore particularly advantageous to code the initial images I0 from coding data generated by the coding step E12. According to a particular exemplary embodiment, the initial IO images are coded in accordance with the video coding standard SVC, scalable extension of MPEG-4 AVC, as defined in the document ISO / IEC 14496-10 amendment 3. This scalable extension also was published as JVT-X201 at the joint ISO / IEC MPEG JVT working group meeting and ITU-T VCEG held in Geneva from June 29 to July 5, 2007. coding known to those skilled in the art of video encoders is not described further. In step E16, the streams FO and F1 are multiplexed so as to form a single scalable stream F transmitted via the output 18. Such multiplexing step is known to those skilled in the art of video encoders is not described more. We can refer in particular to the document JVTX201. According to a particularly advantageous variant, the distances d1, d2, d3 and d4 of each of the edges of the subsampled version of the first cutting window in the image 11 at each of the edges of image 11 are also encoded in the base layer F1 at step E12. These distances are shown in Figure 7 using arrows. According to a particular embodiment, the scalable flow F is in accordance with the SVC standard. In this case, the modified images 11 are encoded in step E12 according to the MPEG 4 AVC standard and the initial images I0 are encoded in step E14 according to the SVC standard. In this particular case, the distances d1, d2, d3 and d4 defined previously are coded in the base layer using the cutting tools defined in point 7.4.2.1 of ISO / IEC 14496-10: 2004 or in the document JVT-X201 in section 7.4.2.1.1 entitled Sequence parameter set semantics namely: - frame_cropping_flag; - frame_crop_left_offset, frame_crop_right_offset, frame_crop_top_offset and fram e_crop_bottom_offset.
En lien avec la figure 8, l'invention concerne également un dispositif d'affichage 3 apte à une version de taille réduite de la séquence initiale SO d'images 10. Sur la figure 8, les modules représentés sont des unités fonctionnelles, qui peuvent ou non correspondre à des unités physiquement distinguables. Par exemple, ces modules ou certains d'entre eux peuvent être regroupés dans un unique composant, ou constituer des fonctionnalités d'un même logiciel. A contrario, certains modules peuvent éventuellement être composés d'entités physiques séparées. A cet effet, le dispositif d'affichage selon l'invention comprend une entrée 30 sur laquelle il reçoit le flux scalable F. II comprend en outre un module 32 apte à extraire du flux scalable F la couche de base F1, un module de décodage 34 apte à décoder la couche de base F1 pour reconstruire des images Ir1 et également les distances d1, d2, d3 et d4. II comprend en outre un module d'affichage 36 relié à un écran 38 apte à sélectionner dans chacune des images Ir1 reconstruites la partie d'image délimitée par la fenêtre de découpage WO qui aura été préalablement définie à l'aide des distances dl, d2, d3 et d4. In connection with FIG. 8, the invention also relates to a display device 3 adapted to a reduced version of the initial sequence SO of images 10. In FIG. 8, the modules represented are functional units, which can or not correspond to physically distinguishable units. For example, these modules or some of them may be grouped into a single component, or be functionalities of the same software. On the other hand, some modules may be composed of separate physical entities. For this purpose, the display device according to the invention comprises an input 30 on which it receives the scalable flow F. It further comprises a module 32 able to extract from the scalable flow F the base layer F1, a decoding module 34 able to decode the base layer F1 to reconstruct images Ir1 and also distances d1, d2, d3 and d4. It further comprises a display module 36 connected to a screen 38 capable of selecting in each of the reconstructed images Ir1 the image portion delimited by the cutting window WO which will have been previously defined using the distances d1, d2 , d3 and d4.
En lien avec la figure 9, l'invention concerne également un procédé 5 d'affichage. A l'étape E20 du procédé d'affichage, la couche de base F1 est extraite du flux scalable F par le module 32 du dispositif d'affichage 3. A l'étape E22, la couche de base F1 est décodée et les images Ir1 sont reconstruites par le module de décodage 34. Lors de cette même étape les 10 distances d1, d2, d3 et d4 sont également décodées. A l'étape E24, dans chacune des images Ir1 reconstruites une fenêtre de découpage WO est définie par le module d'affichage 36 à l'aide des distances d1, d2, d3 et d4 décodées à l'étape E22. A l'étape E26, la partie I'1 de chacune des images Ir1 délimitée par la 15 fenêtre de découpage WO est affichée sur l'écran 38 en lieu et place des images Ir1 reconstruites. In connection with FIG. 9, the invention also relates to a display method. In step E20 of the display method, the base layer F1 is extracted from the scalable flow F by the module 32 of the display device 3. In step E22, the base layer F1 is decoded and the images Ir1 are reconstructed by the decoding module 34. During this same step the distances d1, d2, d3 and d4 are also decoded. In step E24, in each of the reconstructed images Ir1, a clipping window WO is defined by the display module 36 using the distances d1, d2, d3 and d4 decoded in step E22. In step E26, the portion I'1 of each of the images Ir1 delimited by the clipping window WO is displayed on the screen 38 in place of the reconstructed images Ir1.
Claims (4)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0852237A FR2929797A1 (en) | 2008-04-03 | 2008-04-03 | METHOD AND DEVICE FOR ENCODING AN IMAGE SEQUENCE |
PCT/EP2009/053321 WO2009132896A1 (en) | 2008-04-03 | 2009-03-20 | Method and device for coding a sequence of pictures |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0852237A FR2929797A1 (en) | 2008-04-03 | 2008-04-03 | METHOD AND DEVICE FOR ENCODING AN IMAGE SEQUENCE |
Publications (1)
Publication Number | Publication Date |
---|---|
FR2929797A1 true FR2929797A1 (en) | 2009-10-09 |
Family
ID=40202865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR0852237A Pending FR2929797A1 (en) | 2008-04-03 | 2008-04-03 | METHOD AND DEVICE FOR ENCODING AN IMAGE SEQUENCE |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR2929797A1 (en) |
WO (1) | WO2009132896A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2530642A1 (en) | 2011-05-31 | 2012-12-05 | Thomson Licensing | Method of cropping a 3D content |
US9584808B2 (en) | 2013-02-22 | 2017-02-28 | Qualcomm Incorporated | Device and method for scalable coding of video information |
US10284842B2 (en) * | 2013-03-05 | 2019-05-07 | Qualcomm Incorporated | Inter-layer reference picture construction for spatial scalability with different aspect ratios |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060093033A1 (en) * | 2002-01-05 | 2006-05-04 | Samsung Electronics Co., Ltd. | Image coding and decoding method and apparatus considering human visual characteristics |
-
2008
- 2008-04-03 FR FR0852237A patent/FR2929797A1/en active Pending
-
2009
- 2009-03-20 WO PCT/EP2009/053321 patent/WO2009132896A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060093033A1 (en) * | 2002-01-05 | 2006-05-04 | Samsung Electronics Co., Ltd. | Image coding and decoding method and apparatus considering human visual characteristics |
Non-Patent Citations (4)
Title |
---|
"Joint Scalable Video Model (JSVM) 8", VIDEO STANDARDS AND DRAFTS, no. JVT-U202, 13 December 2006 (2006-12-13), XP030006799 * |
ATUL PURI ET AL: "MPEG-4: An object-based multimedia coding standard supporting mobile applications", MOBILE NETWORKS AND APPLICATIONS, KLUWER ACADEMIC PUBLISHERS, BO, vol. 3, no. 1, 1 March 1998 (1998-03-01), pages 5 - 32, XP019213744, ISSN: 1572-8153 * |
EDOUARD FRANCOIS ET AL: "Extended Spatial Scalability : A Generalization of Spatial Scalability for Non Dyadic Configurations", IMAGE PROCESSING, 2006 IEEE INTERNATIONAL CONFERENCE ON, IEEE, PI, 1 October 2006 (2006-10-01), pages 169 - 172, XP031048600, ISBN: 978-1-4244-0480-3 * |
NOEL BRADY: "MPEG-4 Standardized Methods for the Compression of Arbitrarily Shaped Video Objects", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 9, no. 8, 1 December 1999 (1999-12-01), XP011014632, ISSN: 1051-8215 * |
Also Published As
Publication number | Publication date |
---|---|
WO2009132896A1 (en) | 2009-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102274319B1 (en) | Method and apparatus for encoding and decoding image and recording medium thereof and system for processing image | |
KR102161017B1 (en) | Image processing device and at least one computer readable storage medium | |
US10448057B2 (en) | Image processing device and method | |
TWI545939B (en) | The image coding method, image decoding method, image encoding apparatus and image decoding apparatus | |
US20200221090A1 (en) | Decoding device, decoding method, encoding device, and encoding method | |
JP5810700B2 (en) | Image processing apparatus and image processing method | |
CN103202019A (en) | Encoding device and encoding method, and decoding device and decoding method | |
HUE029831T2 (en) | Image processing device and image processing method | |
KR20150010903A (en) | Method And Apparatus For Generating 3K Resolution Display Image for Mobile Terminal screen | |
US8451890B2 (en) | Coding method, decoding method, coding apparatus, decoding apparatus, program, and integrated circuit | |
TR201901751T4 (en) | Method and apparatus for encoding an hdr video together with an ldr video, method and device for reconstructing one of a co-encoded hdr video and an ldr video, and non-volatile storage medium. | |
EP1913781A2 (en) | Method of encoding and decoding video images with spatial scalability | |
KR20150014453A (en) | Native three-color images and high dynamic range images | |
US20160241882A1 (en) | Image processing apparatus and image processing method | |
WO2019211541A2 (en) | Method and device for multi-view video decoding and method and device for image processing | |
FR2929797A1 (en) | METHOD AND DEVICE FOR ENCODING AN IMAGE SEQUENCE | |
EP3649778B1 (en) | Method for encoding and decoding images, encoding and decoding device, and corresponding computer programs | |
WO2015053112A1 (en) | Decoding device and decoding method, and encoding device and encoding method | |
WO2020188172A1 (en) | Methods and devices for coding and decoding a multi-view video sequence | |
US20070140343A1 (en) | Image encoding method, and image decoding method | |
WO2020070409A1 (en) | Coding and decoding of an omnidirectional video | |
WO2019008253A1 (en) | Method for encoding and decoding images, encoding and decoding device, and corresponding computer programs | |
WO2010086562A1 (en) | Method and device for encoding images using separate encoding modes, decoding method and device, and corresponding computer programs | |
WO2022269163A1 (en) | Method for constructing a depth image from a multiview video, method for decoding a data stream representative of a multiview video, encoding method, devices, system, terminal equipment, signal and computer programs corresponding thereto | |
FR2916931A1 (en) | METHOD OF SELECTING ENCODING DATA AND ENCODING DEVICE IMPLEMENTING SAID METHOD |