TD 3 Compression Video

TD SUR LA COMPRESSION VIDEO
Exercice 1 QCM
 Dans la structure 4:2:2, on prélève deux fois plus d’échantillons de luminance que
d’échantillons de chrominance. Vrai - Faux
 On peut reconstituer sans perte un bloc de pixels partir de ses coefficients DCT. Vrai - Faux
 Un codeur utilisant un fort taux de réduction fournit une vidéo de moins bonne qualité qu’un
codeur employant un faible taux de compression. Vrai - Faux
 Deux codeurs de même taux de réduction peuvent fournir une qualité de vidéo différente.
Vrai - Faux
 A qualité donnée, le meilleur codeur est celui qui a le plus grand taux de réduction. Vrai -
Faux
 Dans la norme MPEG, la matrice d’erreur de prédiction est calculée dans le domaine
fréquentiel. Vrai - Faux
 La norme MPEG1 permet le balayage entrelacé et le balayage progressif. Vrai - Faux
 La norme MPEG2 permet le balayage entrelacé et le balayage progressif. Vrai - Faux
 Dans la norme MPEG, le calcul des erreurs de prédiction est réalisé sur un macrobloc. Vrai -
Faux
 Dans le format MJPEG, toutes les images sont codées en intra. Vrai – Faux
 On peut réaliser un montage sur une séquence codée selon le GOP(3,12). Vrai – Faux
 Quel type de trames MPEG-2 entraînera un degré de propagation d'erreur plus élevé si des
erreurs se produisent ?
 Pourquoi MPEG-1 et MPEG-2 utilisent-ils la structure de groupe d'images avec des images-I
périodiques? Pour les applications de visioconférence ou visiophonie, l'encodeur peut-il
insérer des images I périodiquement ? Quel peut être le problème ?
Exercice 2 : .
1. Dans les applications de télévision numérique, décrivez les avantages et les inconvénients du format
entrelacé et le format progressif. Expliquer pourquoi l'industrie informatique favorise format
progressif et les fabricants de télévision comme le format entrelacé.
2. Tous les formats de télévision numérique ont-ils un format de pixel carré ? Pourquoi le format de
pixel carré est-il important pour la télévision numérique ?
3. La mise à l'échelle du train de bits est un type de transcodage : décrivez, à votre connaissance,
plusieurs autres types de transcodage (tels que MPEG-1 en JPEG) et proposez une Solution pour
répondre aux exigences de transcodage.
4. Quel type de trames MPEG-2 entraînera un degré de propagation d'erreur plus élevé si des erreurs
se produisent ?
Exercice 3 : On considère le film défini par les caractéristiques audio-vidéos suivantes :
• Le film dure 1h 53min 30s
• La partie vidéo est définie par une séquence d’images couleurs (en RVB), en qualité DVD standard
(720 x 576 pixels), avec une fréquence d’affichage correspondant à celui de la télévision américaine
(30 Images/s).
1. Déterminez le nombre N d’images contenues dans la vidéo
2. Déterminez la taille en multiple d’octet d’une image non compressée de la vidéo.
3. Déterminez la taille en multiple d’octet de la vidéo non compressée.
4. Donnez les différentes étapes de compression au format MPEG, en expliquant succinctement
en quoi consistent les différentes étapes de compression MPEG, ainsi de la signification des
paramètres M et N concernant le GOP
5. Déterminez la structure du GOP 3-15.
6. Déterminez la structure du GOP 4 – 16
7. Déterminer le nombre NI d’images I contenues dans la vidéo avec un GOP de la 5 ème question.
8. Faites de même pour le nombre NP d’images P, et le nombre NB d’images B
Exercice 4:
Considérant que chaque bloc est constitué de 8x8 pixels, on pourra aisément calculer le nombre de
blocs contenus dans une image de 1024 x 768 pixels.
A taux de compression équivalent, quel GOP (4 ou 12) permet d’obtenir un volume de données plus
réduit ?
Lors de la lecture d’une séquence vidéo enregistrée sur un DVD, l’image intra d’un GOP (de 12
images) comporte de nombreuses erreurs. Que peut-on observer sur l’écran du téléviseur ?
Quel avantage peut-il y avoir à travailler avec des GOP de 1 image ?
Comme rappel vous avez le schéma de principe, présenté ci-dessous, des traitements effectués sur
chaque image d’un GOP
Exercice 5:
Pourquoi balaie-t-on en zig-zag les coefficients de la matrice DCT avant d’effectuer le codage de
Huffman ?
On balaie en zig-zag les coefficients de la matrice DCT pour faire apparaître une longue suite de zéros
afin d’optimiser le codage qui sera condenser, en faisant figurer des couples.
2) En réalité, on ne code pas telle quelle la composante DC de la matrice des coefficients DCT, mais
en mode différentiel. Ainsi, pour chaque image de la vidéo compressée en MPEG, on code le
coefficient DC du premier bloc directement, puis pour les blocs i suivants, on code la différence
DC(i)-DC(i-1).
a) Pourquoi procéder à un codage différentiel sur les coefficients DC des autres blocs ?
On procède un codage différentiel sur les coefficients DC des autres blocs afin de réduire de le
nombre de bits dans un bloc, en effet un nombre rare sera coder sur un plus grand nombre de bits
alors que qu’un nombre qu’on retrouve souvent sera coder sur un plus petit nombre de bits.
b) Pourquoi code-t-on directement les coefficients AC ?
Les coefficients AC sont des petites valeurs donc elles seront directement codées par un petit
nombre de bits, il n’est donc pas nécessaire d’effectuer un codage différentiel.
3) La notation B(n) désigne un bloc de l’image n ; B(n+1) désigne « ce même bloc » sur l’image
(n+1) après mouvement.
La norme MPEG préconise que pour coder B(n+1) en forward prediction, il faut transmettre la
matrice de l’erreur calculée entre « B(n) compressé puis décompressé », et B(n+1). Expliquez
pourquoi.
4) Considérons un GOP(M, N).
a) Pour améliorer la qualité de la vidéo, comment choisir N (petit ou grand) ?
b) Sachant que normalisation de la télévision numérique a dû tenir compte de la propension du
téléspectateur au zapping, pensez-vous que la valeur de N soit petite ou grande pour la TNT ?
c) Pour améliorer la qualité de la vidéo, comment choisir M (petit ou grand) ?
d) Quelle est l’influence de la taille de M sur les délais de codage/décodage ? Expliquez.
5) On compresse une image constituée d’un dégradé horizontal de vert avec l’algorithme JPEG.
Expliquez les résultats visualisés.
Compression à 1% Compression à 99%
Un dégradé est un ensemble de détails donc, en supprimant les hautes fréquences, nous
supprimons aussi les détails, on verra donc un effet de bloc qui se créera, on crée donc une valeur
moyenne.
Exercice 6
On considère le film défini par les caractéristiques audio-vidéo suivantes:

•Le film dure 1h 53min 30s
• La partie vidéo est définie par une séquence d’images couleurs (en RVB), en qualité DVD
standard, avec une fréquence d’affichage correspondant à 30 images/s.
Déterminez le nombre N d’images contenues dans la vidéo
Déterminez le poids P image d’une image non compressée de la vidéo.
Déterminez le poids Pvidéo de la vidéo non compressée.
Les réglages du codage vidéo utilisé ici permettent de spécifier les paramètres suivants:
• Utilisation d’un GOP 3-15
• Taux de compression JPEG moyen pour les images I, P et B sont respectivement :
8:1, 15:1 et 21:1, en Mode YUV 4:2:0
 Combien y’a-t-il d’images I ?
 Déterminez la taille moyenne des images I après compression
 Combien y’a-t-il d’images P ?
 Déterminez la taille moyenne des images P après compression
 Combien y’a-t-il d’images B ?
 Déterminez la taille moyenne des images B après compression
 Quelle est la taille de la vidéo compressée ?
Exercice 7 :
1. Expliquez brièvement à quoi sert la compensation de mouvement dans la compression vidéo

MPEG.
2. Supposons que le macrobloc 2 × 2 est utilisé pour la compensation de mouvement. Pour le
macrobloc suivant :
Les intensités correspondantes dans le référentiel sont données comme suit:
En utilisant le critère SAD (Sum of absolute differences) Calculez le vecteur de mouvement, avec une
recherche complète dans une fenêtre de recherche de ± 1 pixel. Dressez la liste des étapes pour obtenir
le résultat. Après avoir calculé le vecteur de mouvement, déterminez le macrobloc à coder après
compensation de mouvement.
Rappel : Pour évaluer le meilleur vecteur de mouvement pour un bloc, plusieurs critères d'évaluation
existent pour les méthodes directes:
 Erreur quadratique moyenne ou MSE pour Mean square error.
 Somme des différences absolues ou SAD pour Sum of Absolute Differences
 Différence absolue moyenne ou MAD pour Mean Absolute Difference
 Somme des carrés des résidus ou SSE pour Sum of Squared Errors
 Somme des différences absolues transformées ou SATD pour Sum of Absolute Transformed
Differences
Définition : La Somme des différences absolues ou SAD pour Sum of absolute differences est un
algorithme simple, utilisé dans la compression vidéo afin de trouver une corrélation entre les blocs ou
macroblocs d'une image. Elle est déterminée en calculant la différence absolue entre chaque pixel
dans le bloc d'origine et le pixel correspondant du bloc ciblé.
3. Même question que (2) avec
4. Quelle est la principale différence entre les cadres I, P-Frames et B-Frames?

5. Expliquez brièvement pourquoi la compression JPEG n'est pas toujours adaptée à la
compression d'images contenant des bords nets ou des changements brusques d'intensité
(comme du texte noir sur fond blanc).
6. Considérez le bloc suivant de valeurs de domaine fréquentiel à partir d'une image vidéo
produite pendant la compression MPEG:
Appliquer successivement à ce bloc:

(1) Quantification MPEG en utilisant une valeur de quantification constante de 64.
(2) Balayage en zig-zag.
(3) Codage Run Length encoding (RLE).
Exercice 8
1. Pourquoi les images I sont-elles insérées relativement fréquemment dans le flux de sortie
compressé?
2. Étant donné les schémas de codage suivants pour un groupe de trames séquentielles dans
codeur vidéo :
Quelles sont les valeurs de N et M respectivement la taille du GOP et la distance en nombre d’images
entre deux images de référence ?
Quel est l'ordre de codage des trames ?
3. Même question avec cette structure
Exercice 4 : Étant donné les deux images suivantes d'une vidéo d'entrée, montrez comment MPEG
estimerait le mouvement du macrobloc, mis en évidence dans la première image, jusqu'à l'image
suivante.
Pour faciliter le calcul de votre solution: vous pouvez supposer que tous les calculs de macroblocs
peuvent être effectués sur des fenêtres 4x4. Vous pouvez également limiter votre recherche à ± 2
pixels dans le sens horizontal et vertical autour du macrobloc d'origine.
Exercice 9 : Lorsque la taille de bloc est 8, connaissant la formule de la DCT.
(a) Si une image en niveaux de gris 8 × 8 est comprise entre 0 et 255, quelle est la valeur la
plus élevée qu'un coefficient DCT pourrait être, et pour quelle image d'entrée? (Indiquez
également toutes les valeurs de coefficient DCT pour cette image.)
(b) Si nous soustrayons d'abord la valeur 128 de l'image entière puis effectuons le DCT, quel
est l'effet exact sur la valeur DCT F [2, 3]?
(c) Pourquoi ferions-nous cette soustraction? La soustraction affecte-t-elle le nombre de bits
dont nous avons besoin pour coder l'image?
(d) Serait-il possible d'inverser cette soustraction dans l'IDCT? Si c'est le cas, comment?
Exercice 10 :
1. JPEG utilise la transformation discrète en cosinus (DCT) pour la compression d'image.

je. Quelle est la valeur de F (0, 0) si l'image f (i, j) est comme ci-dessous?
ii. Quel coefficient AC | F (u, v) | est le plus grand pour ce f (i, j)? Pourquoi? Est-ce que F (u,
v) est positif ou négatif? Pourquoi?
(b) Montrez en détail comment un JPEG hiérarchique à trois niveaux codera l'image ci-dessus, en
supposant que
i. L'encodeur et le décodeur aux trois niveaux utilisent le JPEG sans perte.
ii. La réduction fait simplement la moyenne de chaque bloc 2 × 2 en une seule valeur de pixel.
iii. L'extension duplique la valeur d'un seul pixel quatre fois.
Exercice 11 : Déterminez en détail le problème suivant de la recherche logarithmique 2D de vecteurs

de mouvement (voir Fig. ci dessous).
La trame cible (actuelle) est une trame P. La taille des macroblocs est de 4 × 4. Le vecteur mouvement
est MV (x, y), dans lequel x ∈ [−p, p], y ∈ [−p, p]. Dans cette question, supposons p ≡ 5.
Le macrobloc en question (assombri) dans le cadre a son coin supérieur gauche à (x t, yt). Il contient 9
pixels sombres, chacun avec une valeur d'intensité 10; les 7 autres pixels font partie de l'arrière-plan,
qui a une valeur d'intensité uniforme de 100. Le cadre de référence (précédent) a 8 pixels sombres.
(a) Quelle est la meilleure erreur absolue x, y et moyenne (MAE) pour ce macrobloc?
(b) Montrer étape par étape comment la recherche logarithmique 2D est effectuée, inclure les
emplacements et les passes de la recherche et tous les x, y et MAEs intermédiaires.
Exercice 12
1. Déterminez en détail le problème suivant de la recherche logarithmique 2D (2D Logarithmic
Search) de vecteurs de mouvement (voir Fig. 10.14).
La trame cible (actuelle) est une trame de type P. La taille des macroblocs est de 4 × 4. Le vecteur
mouvement est MV (x, y), dans lequel x ∈ [−p, p], y ∈ [−p, p]. Dans cette question, supposons p
≡ 5.
Le macrobloc en question (foncé) dans le cadre a son coin supérieur gauche à (x t, yt). Il contient 9
pixels sombres, chacun avec une valeur d'intensité 10; les 7 autres pixels font partie de l'arrière-plan,
qui ont une valeur d'intensité uniforme de 100. La trame de référence (précédente) a 8 pixels sombres.
(a) Quelle est la meilleure erreur absolue x, y et moyenne (MAE) pour ce macrobloc?
(b) Montrer étape par étape comment la recherche logarithmique 2D est effectuée, inclure les
emplacements et les passes de la recherche et tous les intermédiaires, x, y et MAE.
2. La méthode de recherche logarithmique MV est sous-optimale, en ce qu'elle repose sur la continuité

dans la trame résiduelle.
a) Expliquez pourquoi cette hypothèse est nécessaire et justifiez-la.
(b) Donnez un exemple où cette hypothèse échoue.
(c) La méthode de recherche hiérarchique souffre-t-elle également de la sous-optimalité ?
Exercice 13 :
Une séquence vidéo est donnée pour être codée en utilisant H.263 en mode PB, ayant une taille
d'image de 4CIF, une fréquence d'images de 30 ips et une durée vidéo de 90 minutes. Les paramètres
de compression sont connus comme suit : en moyenne, deux images I sont codées par seconde. La
vidéo à la qualité requise a un taux de compression moyen de I-frame de 10 : 1, un taux de
compression moyen de P-frame deux fois meilleur que I-frame et un taux de compression moyen de
B-frame deux fois plus bon que P-frame. En supposant que les paramètres de compression incluent
tous les en-têtes nécessaires, calculez la taille de la vidéo encodée.
Rappels
Définitions des formats dérivés

Utilis
Abréviati
Définition (en pixels) é
on
pour
SQCIF
(Sous-
128 × 96
Quart de
CIF)
QCIF
H.26
(Quart de 176 × 144
1
CIF)
H.26
CIF 352 × 288
1
4CIF (4 ×
704 × 576
CIF)
9CIF (9 ×
1056 × 864
CIF)
16CIF (16 1408
× CIF) 152
Exercice 14 : Les transformations entières sont utilisées en H.264 et H.265.

a) Quelle est la relation entre le DCT et Integer Transform?
(b) Quels sont les principaux avantages de l'utilisation d'Integer Transform au lieu de DCT?
Exercice 15: H.264 et H.265 prennent en charge le filtrage de déblocage en boucle.

(a) Pourquoi le déblocage est-il une bonne idée? Quels sont ses inconvénients ?
(b) Quelles sont les principales différences dans ses implémentations H.264 et H.265?
(c) Outre le filtrage de déblocage, que fait H.265 pour améliorer la qualité visuelle ?
Exercice 16 : Le codage de trame P dans H.264 utilise la transformation entière. Pour cet exercice,
supposez :
Exercice 17:
(a) Quels sont les deux avantages de l'utilisation d'Integer Transform?

(b) Supposons que la trame cible ci-dessous est une trame P. Pour simplifier, supposons que la
taille du macrobloc est 4 × 4. Pour le macrobloc affiché dans le cadre cible:
(i) Quel devrait être le vecteur de mouvement?
(ii) Quelles sont les valeurs de f (i, j) dans ce cas? (iii) Afficher toutes les valeurs de F (u, v).

TD 3 Compression Video

Transféré par

Droits d'auteur :

Formats disponibles

TD 3 Compression Video

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

TD 3 Compression Video

Transféré par

Droits d'auteur :

Formats disponibles

TD SUR LA COMPRESSION VIDEO

Compression à 1% Compression à 99%

On considère le film défini par les caractéristiques audio-vidéo suivantes:

1. Expliquez brièvement à quoi sert la compensation de mouvement dans la compression vidéo

Les intensités correspondantes dans le référentiel sont données comme suit:

3. Même question que (2) avec

4. Quelle est la principale différence entre les cadres I, P-Frames et B-Frames?

Appliquer successivement à ce bloc:

3. Même question avec cette structure

Exercice 9 : Lorsque la taille de bloc est 8, connaissant la formule de la DCT.

1. JPEG utilise la transformation discrète en cosinus (DCT) pour la compression d'image.

Exercice 11 : Déterminez en détail le problème suivant de la recherche logarithmique 2D de vecteurs

2. La méthode de recherche logarithmique MV est sous-optimale, en ce qu'elle repose sur la continuité

Définitions des formats dérivés

Exercice 14 : Les transformations entières sont utilisées en H.264 et H.265.

Exercice 15: H.264 et H.265 prennent en charge le filtrage de déblocage en boucle.

(a) Quels sont les deux avantages de l'utilisation d'Integer Transform?

Vous aimerez peut-être aussi