JP2003528475A

JP2003528475A - ビデオシーケンス内の冗長画像を検出するシステム

Info

Publication number: JP2003528475A
Application number: JP2000552841A
Authority: JP
Inventors: チャラパリキラン; チェンイングウェイ
Original assignee: Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 1998-06-04
Filing date: 1999-05-31
Publication date: 2003-09-24
Also published as: WO1999063747A3; EP1040646A2; US6298090B1; WO1999063747A2

Abstract

(57)【要約】ビデオシーケンス内の冗長画像を検出するシステムにおいて、ビデオシーケンス内のターゲット画像を複数の領域に分割し、複数の領域の各々について、各領域の各画素とビデオシーケンス内の少なくとも１つの他の画像内の対応する画素との差の和を含むローカル値を決定し、次に複数の領域の各々について、ローカル値を第１の所定の閾値と比較する。このシステムでは更にターゲット画像内のほぼ全画素と前記少なくとも１つの他の画像内の対応する画素との差の和を含むグローバル値を決定し、グローバル値を第２の所定の閾値と比較し、ローカル値が全ての領域について第１の所定の閾値を越えないとともにグローバル値が第２の所定の閾値を越えない場合にターゲット画像を冗長である指示を出力する。

Description

【発明の詳細な説明】

【０００１】発明の背景発明の技術分野本発明は、ビデオシーケンス内の冗長画像を検出するシステムに関するもので
ある。特に、本発明はビデオシーケンス内のターゲット画像が冗長であるか否か
を、２つの所定の閾値をターゲット画像内の画素とビデオシーケンス内の少なく
とも１つの他の画像内の対応する画素との差の和と比較することにより決定する
システムに関するものである。

【０００２】関連技術の説明テレシネはフィルム画像からビデオデータを生成するのに使用される公知の装
置である。これらの装置はテレビジョン業界において動画をテレビジョンディス
プレイ用のビデオシーケンスに変換するのに一般に使用されている。しかし、フ
ィルムとビデオとの間の本質的な差異のためにこの変換処理により問題が生ずる
。

【０００３】特に、動画のようなフィルムシーケンスは２４フレーム／秒のフレームレート
を有する。これに対し、ビデオシーケンスは２４フレーム／秒より高いフレーム
レートを有する。例えば、インタレース（飛越し走査）ビデオ画像からなるビデ
オシーケンス、即ち１フレーム内に２つの異なるフィールドがインタレースされ
たビデオ画像は３０フレーム／秒のフレームレートを有する。他方、プログレッ
シブ（順次走査）ビデオ画像からなるビデオシーケンスは６０フィールド／秒の
もっと高いフレームレートを有する。これらの異なるフレームレートを補償し、
フィルムシーケンスとビデオシーケンスとの間の一致を維持するために、テレシ
ネ装置はビデオシーケンスに追加の冗長画像(即ちフィールド及び／又はフレー
ム)を挿入する。これらの冗長画像は本質的にビデオシーケンス内の先行画像の
反復であり、ビデオシーケンス内の適切な位置に挿入される。

【０００４】早くから、これらの冗長画像は符号化する必要がないことが認識されていた。
その理由は、このような画像はデコーダにおいてビデオシーケンス内の他の画像
を複写するだけで再現し得るためである。従って、エンコーダ内に冗長画像を検
出する回路を含めるのが標準的技法になっている。このタイプの慣例の回路は、
ビデオシーケンスの１フィールド及び／又はフレーム全体内の画素を該シーケン
ス内の他のフィールド及び／又はフレームの対応する画素と比較することにより
冗長性を決定している(例えば、米国特許第５，４５２，０１１号,同第５，４０
６，３３３号,同第５，４９１，５１６号及び同第５，４２６，４６４号参照)。
特に、慣例の回路は前記画素の差の和を閾値と比較し、この比較に基づいてター
ゲット画像の内容がビデオシーケンス内の他の画像（通常直前の画像）の内容と
同一であるか確かめる。

【０００５】テレシネ装置により導入されるノイズを考慮するために、上述したタイプの冗
長検出回路はその閾値を高ノイズテレシネ装置に対し高く、低ノイズテレシネ装
置に対し低くセットする。しかし、画像内容の変化及びテレシネノイズの両方を
考慮するために同一の閾値を使用すると、特に両画像の小さい局部領域のみの内
容が変化する場合にエラーが発生し得る。即ち、このような場合には、慣例の回
路はしばしばこれらの内容変化をテレシネノイズと解釈し、その結果として誤っ
た冗長決定を発生し得る。

【０００６】従って、テレシネノイズ及び画像内容の変化の両方を正確に検出し得るエンコ
ーダシステム等用の冗長画像検出回路が要求されている。

【０００７】発明の概要本発明は上述の要求を満足するビデオシーケンス内の冗長画像を検出する装置
を提供する。特に、本発明では、ビデオシーケンス内のターゲット画像が冗長で
あるか否かを、２つの閾値をターゲット画像内の画素とビデオシーケンス内の少
なくとも１つの他の画像内の対応する画素との差の和と比較することにより決定
する。第１の閾値はターゲット画像と少なくとも１つの他の画像との間の内容の
差に基づいて設定し、第２の閾値はビデオシーケンスを生成するのに使用するテ
レシネ装置によりビデオシーケンスに導入されるノイズに基づいて設定するのが
好ましい。その結果として、本発明によれば、テレシネノイズと画像内容の変化
の両方を上述した慣例の装置より精密に検出することができる。

【０００８】従って、本発明は、一つの態様では、ビデオシーケンス内の冗長画像を検出す
る装置である。この装置はプロセッサと、コンピュータ実行可能プロセスステッ
プを記憶するメモリとを含む。プロセッサがメモリ内に記憶されたプロセスステ
ップを実行して、(i)ビデオシーケンス内のターゲット画像を複数の領域に分割
し、(ii)複数の領域の各々について、各領域の各画素とビデオシーケンス内の少
なくとも１つの他の画像内の対応する画素との差の和からなるローカル値を決定
し、(iii)複数の領域の各々について、ローカル値を第１の所定の閾値と比較し
、(iv)ターゲット画像内のほぼ全画素と少なくとも１つの他の画像内の対応する
画素との差の和からなるグローバル値を決定し、(v)グローバル値を第２の所定
の閾値と比較し、(vi)(a)ローカル値が全ての領域について第１の所定の閾値を
越えないとともに(b)グローバル値が第２の所定の閾値を越えない場合にターゲ
ット画像を冗長画像と指示する。

【０００９】本発明の好適実施例では、プロセッサが更にビデオシーケンスを構成するビデ
オ画像の「タイプ」を決定し、前記少なくとも１つの他の画像を前記ビデオ画像の
決定されたタイプに従って選択する。例えば、プロセッサがビデオ画像のタイプ
は３０フレーム／秒のインタレースビデオであると決定する場合には、プロセッ
サはビデオシーケンス内のターゲット画像の直前のフィールドを選択する。他方
、ビデオ画像のタイプが６０フレーム／秒のプログレッシブビデオである場合に
は、プロセッサはビデオシーケンス内のターゲット画像の直前の２つのフレーム
を選択する。この特徴のおかげで、本発明は種々のタイプのビデオ内の冗長画像
を検出するのに使用し得るとともに、あるタイプのビデオにおいて、２以上の冗
長画像を検出するのに使用することができる。

【００１０】本発明は、他の態様では、ビデオシーケンス内の冗長画像を検出する方法であ
る。この方法は、ビデオシーケンス内のターゲット画像を複数の領域に分割する
ステップと、複数の領域の各々について、各領域の各画素とビデオシーケンス内
の少なくとも１つの他の画像内の対応する画素との差の和を含むローカル値を決
定するステップを具える。この方法は、更に、複数の領域の各々について、ロー
カル値を第１の所定の閾値と比較するステップと、ターゲット画像内のほぼ全画
素と少なくとも１つの他の画像内の対応する画素との差の和を含むグローバル値
を決定するステップとを具える。次にグローバル値を第２の所定の閾値と比較し
、(i)ローカル値が全ての領域について第１の所定の閾値を越えないとともに(ii
)グローバル値が第２の所定の閾値を越えない場合にターゲット画像が冗長画像
である指示を出力する。

【００１１】本発明は、他の態様では、ターゲット画像と少なくとも１つの他の画像を含む
ビデオシーケンス内のビデオデータを符号化する符号化装置である。この符号化
装置は、２つの閾値をターゲット画像内の各画素と前記少なくとも１つの他の画
像内の対応する画素との差の和と比較することによりターゲット画像が冗長であ
るか否かを決定するフィルムモード検出回路を含む。本発明では、第１の閾値を
ターゲット画像と少なくとも１つの他の画像との間の内容の差に基づいて設定し
、第２の閾値をビデオシーケンスを生成するのに使用するテレシネ装置によりビ
デオシーケンスに導入されるノイズに基づいて設定する。この符号化装置は、更
に、フィルムモード検出回路がターゲット画像が冗長でないことを決定する場合
に、ターゲット画像に対するビデオデータを符号化する符号化回路を具える。

【００１２】本発明の上述した特徴によれば、テレシネノイズと２つの画像間の内容の差を
正確に検出することができる。この冗長画像検出精度の増大は符号化装置の効率
を増大する。その理由は、符号化装置が冗長フィールド及びフレームの符号化に
ビットを浪費しなくなるからである。

【００１３】本発明は、他の態様では、ターゲット画像と少なくとも１つの他の画像とから
なるビデオシーケンスを伝送するシステムである。このシステムは、入力フィル
ム画像に基づいてビデオシーケンス用のビデオデータを生成し、出力するテレシ
ネ装置と、伝送前にビデオデータを符号化する符号化装置とを具える。この符号
化装置は、２つの閾値をターゲット画像内の各画素と前記少なくとも１つの他の
画像内の対応する画素との差の和と比較することによりターゲット画像が冗長で
あるか否かを決定するフィルムモード検出回路を含む。本発明では、第１の閾値
をターゲット画像と少なくとも１つの他の画像との間の内容の差に基づいて設定
し、第２の閾値をビデオシーケンスを生成するのに使用するテレシネ装置により
ビデオシーケンスに導入されるノイズに基づいて設定する。この符号化装置は、
更に、フィルムモード検出回路がターゲット画像が冗長でないことを決定する場
合に、ターゲット画像に対するビデオデータを符号化する符号化回路を具える。
最後に、このシステムは、符号化装置からの符号化ビデオデータを受信し、この
ビデオデータを復号する復号装置を具える。

【００１４】この簡潔な概要から本発明の特徴を直ちに理解することができるはずである。
本発明のもっと完全な理解は図面と関連して以下に記載する好適実施例の詳細な
説明を参照すれば得られる。

【００１５】好適実施例の詳細な説明本発明の好適実施例を符号化システム、即ち図１に示す符号化システム１に関
連して以下に説明する。図１に示すように、符号化システム１は、テレシネ装置
２、エンコーダ４、デコーダ５、及びデータを伝送する種々の伝送媒体を含む。
テレシネ装置２は当業者に周知の慣例の構造を有するものとするのが好ましい。
動作時に、テレシネ装置２にフィルムシーケンス６を入力する。このフィルムシ
ーケンス６は３５ミリフィルム上の動画のような複数のフィルム画像を含むもの
とすることができる。テレシネ装置２はフィルムシーケンス６をビデオシーケン
ス７に変換し、ビデオシーケンス７の符号化されてないビデオデータを伝送媒体
９を経てエンコーダ４に出力する。この点に関し、伝送媒体９は専用ライン、Ｒ
Ｆリンク、又は両者の組合せとすることができる。

【００１６】本発明では、テレシネ装置２はフィルムシーケンス６を３０フレーム／秒のフ
レームレートを有するインタレースビデオ画像からなるビデオシーケンスに変換
することができるものとする。或いは又、テレシネ装置２はフィルムシーケンス
６を６０フレーム／秒のフレームレートを有するプログレッシブビデオ画像から
なるビデオシーケンスに変換することができるものとする。何れの場合にも、フ
ィルムシーケンス６とビデオシーケンス７との間のフレームレートの差を補償す
るために、テレシネ装置２は追加の冗長画像(即ちフィールド及び／又はフレー
ム)をビデオシーケンス７に挿入する。上述したように、これらの冗長画像はビ
デオシーケンス７内の先行画像の反復であり、これらをビデオシーケンス内に適
切な位置に挿入する。

【００１７】エンコーダ４はテレシネ装置２から受信された符号化されてないビデオデータ
を符号化し、符号化データを伝送媒体１０を経てデコーダ５に伝送する。伝送媒
体１０は専用ライン、ＲＦリンク又は両者の組合せにすることができる。本発明
の好適実施例では、エンコーダ４はビデオデータをＭＰＥＧ２を用いて符号化す
る。しかし、ＭＰＥＧ２の代わりに他の符号化技術、例えばＤＶＢ等を用いるこ
ともできる点に注意されたい。

【００１８】背景として説明すると、ＭＰＥＧ２符号化は、画像を１６×１６画素のマクロ
ブロックに分割して実行され、各ブロックは関連する個別の量子化スケール値を
有する。マクロブロックは次に８×８画素の個々のブロックに分割される。これ
らの８×８画素ブロックの各々に離散コサイン変換(以後「ＤＣＴ」という)を施
し、各ブロック内の６４画素の各々に対しＤＣＴ係数を発生させる。次に８×８
画素ブロックに対するＤＣＴ係数を対応する符号化パラメータ、即ち量子化重み
で割算する。その後に、特に量子化スケール値を考慮に入れるために追加の計算
がＤＣＴ係数に実行され、これでＭＰＥＧ２符号化は完了する。

【００１９】以下に詳細に説明するように、エンコーダ４はフィルムモード検出回路（図２
参照）も含み、この回路はビデオシーケンス７内のターゲット画像が冗長画像で
あるか否かを決定するハードウエア及びソフトウエアを含んでいる。簡単に説明
すると、フィルムモード検出回路は、ターゲット画像が冗長画像であるか否かを
、２つの所定の閾値をビデオシーケンス７内のターゲット画像内の画素と少なく
とも１つの他の画像内の対応する画素との差の和と比較することにより決定する
。これらの閾値の第１の閾値はビデオシーケンス７内のターゲット画像と前記少
なくとも１つの他の画像との間の内容の差（例えば小物体の動き）に基づいて設
定され、第２の閾値はテレシネ装置２によりビデオシーケンス７に導入されるノ
イズに基づいて設定される。上述したように、このような閾値をこのように使用
することにより従来より高精度の冗長画像検出が得られる。

【００２０】デコーダ５は符号化データを受信し、復号し得る任意の慣例のデコーダとする
ことができる。その動作の一部として、デコーダ５は符号化ビデオデータ内のフ
ラグを読み取り、フラグに従って冗長画像（即ちフィールド及び／又はフレーム
）も発生する。この点に関し、フィルムモード検出回路が冗長フィールド又はフ
レームを検出する場合には、フィルムモード検出回路はフラグをビデオシーケン
ス７に付加し、そのターゲット画像は符号化する必要がないことを指示するとと
もにデコーダ５はフラグに対応するフィールド又はフレームを再現する必要があ
ることを指示する。このプロセスは以下に詳細に説明する。デコーダ５による復
号に続いて、復号ビデオデータが例えばテレビジョン、ビデオモニタ等に出力さ
れる。

【００２１】図２は本発明によるエンコーダ４の好適設計例のブロック図である。図２に示
すように、エンコーダ４は前処理回路１２、フィルムモード検出回路１４、及び
符号化回路１５を具える。符号化回路１５はブロック変換回路１６、ＤＣＴ回路
１７、可変長コーダ回路（以後「ＶＬＣ」回路という）１９、レートバッファ２
０、レートコントローラ２１、及びマクロブロック複雑さ分析器２２を含む。こ
れらの構成素子の動作は、フィルムモード検出回路１４を除いて、当業者に周知
であるが、完全を期すためにそれらの簡単な説明を以下に記す。

【００２２】特に、前処理回路１２はテレシネ装置２からビデオシーケンス７のビデオデー
タを受信する。このデータは種々の媒体、例えばローカルエリアネットワーク（
「ＲＡＮ」）、インターネット等を経て受信することができる。前処理回路１２
は受信ビデオデータ内の雑音を低減するとともに伝送中にデータに導入され得る
エラーを補正するために種々のタイプの信号処理を実行する。この目的のために
、前処理回路１２はビデオデータに低域通過又は他のタイプのフィルタ処置を実
行することができる。更に、前処理回路１２はビデオデータに任意の所要の変換
、例えばビデオデータの「４：２：２」フォーマットから「４:２:０」フォーマ
ットへの変換を実行することもできる。

【００２３】前処理回路１２の処理に続いて、処理されたビデオデータはフィルムモード検
出回路１４に伝送される。図２に示すように、フィルムモード検出回路１４はプ
ロセッサ２７（マイクロプロセッサ、マイクロコントローラ等にすることができ
る）及びコンピュータ実行プロセスステップを記憶する１以上のメモリ２９を含
む。動作時に、プロセッサ２７は１以上のメモリ２９に記憶されたプロセスステ
ップを実行してビデオシーケンス７内の各ターゲット画像において冗長画像（即
ちフィールド及び／又はフレーム）を検出し、符号化回路１５がターゲット画像
を符号化すべきか符号化すべきでないかを指示するフラグを出力する。フィルム
モード検出回路１４の動作のこれらの特徴を以下に詳細に説明する。

【００２４】フィルムモード検出回路１４がビデオデータを上述のように処理すると、ビデ
オデータは符号化回路１５に伝送される。次に符号化回路１５がビデオデータを
符号化する。この点に関し、符号化回路１５は冗長でない画像のビデオデータの
みを符号化する。符号化回路１５はフィルムモード検出回路１４から出力される
フラグに基づいて、どの画像を符号化すべきか、どの画像を符号化すべきでない
かを知ることができる。例えば、「１」のフラグ値と一緒に出力される画像、即
ち冗長画像は符号化されず、従って事実上ビデオデータから除去される。他方、
「０」のフラグ値と一緒に出力される画像、即ち非冗長画像は符号化される。こ
の目的のために、図２に示す制御回路１５はビデオデータをＭＰＥＧ２符号化を
用いて符号化するよう構成されているものとする。従って、以下の説明は、ビデ
オデータがＭＰＥＧ２符号化により符号化されるものとするが、上述したように
本発明では他の符号化方法を使用することもできる。

【００２５】ブロック変換回路１６はどの画像を符号化すべきか、どの画像を符号化すべき
でないかについての上述した決定を行う。符号化すべき画像に対して、ブロック
変換回路１６はそのビデオデータのラスタラインをマクロブロック（即ち１６×
１６画素ブロック）に変換し、次いで個々の８×８画素ブロックに変換する。そ
の後に、ＤＣＴ回路１７がこれらの個々の８×８画素ブロックにＤＣＴを施して
各ブロック内の６４画素の各々に対するＤＣＴ係数を対応する量子化ステップサ
イズで発生する。ＤＣＴ回路１７は次に８×８画素ブロック内のＤＣＴ係数を対
応する量子化重みで割算する。その後に、ＤＣＴ回路１７からの出力はＶＬＣ回
路１９に供給され、この回路がＤＣＴ係数に可変長符号化を実行し、可変長符号
化ビットをレートバッファ２０に出力する。レートバッファ２０はこの可変長符
号化ビットストリームをバッファして符号化ビットをエンコーダ４から一定のレ
ートで出力させる。

【００２６】この点に関し、ＤＣＴ回路１７はレートバッファ２０で使用可能な記憶容量に
基づいて上述の機能を実行する。即ち、レートコントローラ２１が、レートバッ
ファ２０の使用可能スペースの量に部分的に基づいて、ＤＣＴ回路１７に対する
量子化ステップサイズを選択する。これにより、レートコントローラ２１はレー
トバッファ２０から出力されるビットストリームをほぼ一定のレートで出力させ
ることができる。図２に示すように、レートコントローラ２１は量子化ステップ
サイズの決定においてマクロブロック複雑さ分析器２２からの情報も考慮に入れ
る。この点に関し、マクロブロック複雑さ分析器２２が各マクロブロックの複雑
さ、例えばビット数、を決定し、この情報をレートコントローラ２１に供給する
。次にこの情報がレートバッファ２０内の使用可能スペースの量に関する情報と
一緒に、ＤＣＴ回路１７で使用する量子化ステップサイズの決定に使用される。

【００２７】この点において、本発明は種々の異なるアーキテクチャを有するエンコーダを
用いて実現することができ、図２に示すエンコーダアーキテクチャで実現される
ものに限定されない点に注意されたい。この点に関し、本発明を実現し得るエン
コーダアーキテクチャの他の例は、米国特許出願第号、発明の名
称「System For Extracting coding Parameters From Video Data」（譲受人：
フィリップスエレクトロニクスノースアメリカンコーポレーション；譲受
人識別番号15-700011；発明者：Yingwei Chen, Kiran Challapli）に記載されて
おり、その内容が本願明細書に十分に含まれているものとする。特に、本発明は
この米国特許出願に記載されているエンコーダの冗長フィールド／フレーム検出
回路に実施することができる。

【００２８】図３はフィルムモード検出回路１４内のプロセッサ２７により実行される冗長
画像検出用プロセスステップを詳細に示すフローチャートである。始めに、ステ
ップＳ３０１がビデオシーケンス７内のターゲット画像の「タイプ」を決定する
。例えば、ステップＳ３０１は、ターゲット画像が３０フレーム／秒のフレーム
レートを有するインタレースビデオであるのか、６０フレーム／秒のフレームレ
ートを有するプログレッシブビデオであるのか決定する。その後に、ステップＳ
３０２がステップＳ３０１で決定されたターゲット画像のタイプに基づいてビデ
オシーケンス７内の１以上の他の画像を選択する。即ち、ターゲット画像が３０
フレーム／秒のフレームレートを有するインタレースビデオである場合には、ス
テップＳ３０２はビデオシーケンス内のターゲット画像の直前のフレーム内の１
つのフィールドを選択する。特に、ステップＳ３０２はターゲット画像と同一の
極性を有するフィールドを選択する。

【００２９】背景として説明すると、インタレースビデオは複数のフレームからなり、各フ
レームは２フィールドを有する。これらのフィールドはフレーム内に、例えば第
１フィールドがフレームのライン１、３、５、７．．．を占め、第２フィールド
がフレームのライン２、４、６、８．．．を占めるように配置される。上記の極
性は当該フィールドがどちらのラインセットを占めるかを示す。従って、ビデオ
シーケンス７がインタレースビデオを含む場合には、ターゲット画像はビデオシ
ーケンスの１フレーム内の１フィールドであり、ステップＳ３０２で選択される
他の画像は直前のフレーム内のターゲット画像と同一の極性を有するフィールド
である。更に、ビデオシーケンス７がインタレースビデオを含む場合には、イン
タレースビデオ（即ち３０フレーム／秒）とフィルム（２４フレーム／秒）との
間のフレーム数の差が比較的小さいために、ステップＳ３０２は１フィールドの
みを選択する。即ち、この場合には、フィルムからビデオへの変換中に、テレシ
ネ装置２は同一フレームを３度以上繰り返さない。従って、冗長画像を検出する
には、一度に２つのフレームを調べるだけでよい。プログレッシブビデオに対し
ては以下に記載するようにそうではない。

【００３０】この点に関し、ステップＳ３０１においてターゲット画像が６０フレーム／秒
のフレームレートを有するプログレッシブビデオであることが検出される場合に
は、ステップＳ３０２がビデオシーケンス７内のターゲット画像の直前の２フレ
ームを選択する。即ち、プログレッシブビデオ（即ち６０フレーム／秒）とフィ
ルム（２４フレーム／秒）との間のフレーム数の差が比較的大きいために、ビデ
オシーケンス７の発生中に、テレシネ装置２はいくつかのフレームを２回、他の
フレームを３回繰り返す。従って、従って、プログレッシブビデオでは、同一フ
レームが３回現われ得る。その結果として、ビデオシーケンス７内に２つの連続
する冗長画像が存在する可能性がある。この偶発事態を解決するために、ターゲ
ット画像がプログレッシブビデオである場合には、ステップＳ３０２はターゲッ
ト画像の直前の２フレームを選択する。

【００３１】ステップＳ３０２に続いて、プロセスはステップＳ３０３に進む。ステップＳ
３０３はターゲット画像を複数、即ちＮ（Ｎ＞１）個の領域に分割し、各領域は
実際上連続する画素を有するものとする。ターゲット画像３１内のこのような領
域３０の一例を図４に示す。本発明の好適実施例では、Ｎは５０にし、ターゲッ
ト画像を５０個の領域に分割する。しかし、本発明の実施に当たっては任意の領
域数を使用することができる。

【００３２】ターゲット画像をステップＳ３０３で複数の領域に分割した後、ステップＳ３
０４でこれらの領域の１つの領域内の画素をステップＳ３０２で選択された１以
上の画像内の対応する画素と比較する。この点に関し、明瞭及び簡単のために、
以下の説明はインタレースビデオに関連するものとし、直前の１フィールドのみ
が選択されるものとする。しかし、本発明の以下のステップはプログレッシブビ
デオに対しても実質的に同一であり、主な相違は、各ステップを２回、即ちステ
ップＳ３０２で選択されたプログレッシブビデオの２つのフレームの各フレーム
に１回づつ実行する必要があるだけである。

【００３３】従って、ステップＳ３０４はターゲット画像の第１領域内の画素をステップＳ
３０２で選択された他の画像内の対応する画素と比較する。インタレースビデオ
の場合には、この比較は同一の極性を有する画素間で行われること勿論である。
次にステップＳ３０５がターゲット画像の当該領域内の画素とステップＳ３０２
で選択された他の画像の対応する画素との差を決定する。例えば、ステップＳ３
０５はこれらの画素の２進データ値を比較し、これらの２進データ値の差を決定
する。その後に、ステップＳ３０６が当該領域内の画素とステップＳ３０２で選
択された他の画像の対応する画素との差を加算してターゲット画像の当該領域に
対するローカル値を決定する。次にステップＳ３０７がステップＳ３０６で決定
されたこのローカル値を第１の所定の閾値Ｔ１と比較する。この点に関し、第１
の所定の閾値はターゲット画像と他の画像との間の内容の差に基づくものとする
のが好ましく、本発明の好適例では２．０ｄＢの値にする。しかし、第１の所定
の閾値は他の因子も考慮することができ、また環鏡に応じて任意の数の異なる値
を使用することもできる。

【００３４】ステップＳ３０７において当該領域に対するローカル値が第１の所定の閾値よ
り大きいことが決定される場合には、これはターゲット画像とステップＳ３０２
で選択された他の画像との間に有意な差が存在することを意味し、従ってターゲ
ット画像は冗長画像でないことを意味する。この場合には、プロセスはステップ
Ｓ３１１に進み、このステップでターゲット画像は冗長画像でないことを示すフ
ラグをセットするとともにこのフラグをターゲット画像のビデオデータと一緒に
出力する。他方、ステップＳ３０７において当該領域に対するローカル値が第１
の所定の閾値以下であることが決定される場合には、プロセスはステップＳ３０
８に進み、ここでターゲット画像内にまだ検査してない領域が残っているか決定
する。ステップＳ３０８において検査すべき領域が残っていることが決定される
場合にはプロセスはステップＳ３０４に戻る。他方、ステップＳ３０８がターゲ
ット画像内に検査すべき領域が残っていないことを決定する場合には、プロセス
はステップＳ３０９に進む。この時点においてもまだターゲット画像とステップ
Ｓ３０２で選択された他の画像との間に有意な「ローカル」差が識別されないこ
とは、ターゲット画像は潜在的に冗長画像（即ち冗長フィールド又はフレーム）
であることを意味する。これを確かめるために、以下に記載する「グローバル」
処理を実行する必要がある。

【００３５】もっと具体的に説明すると、ステップＳ３０９はターゲット画像内のほぼ全画
素とステップＳ３０２で選択されたターゲットの画像内の対応する画素との差を
加算してターゲット画像に対するグローバル値を決定する。次にステップＳ３１
０がこのグローバル値を第２の所定の閾値Ｔ２と比較する。この点に関し、第２
の所定の閾値はターゲット画像と他の画像との間の雑音の差に基づくものとする
のが好ましく、本発明の好適実施例では１．５ｄＢの値にする。しかし、第２の
所定の閾値は他の因子、例えば信号伝送中に導入される雑音等も考慮することが
できる。更に、第２の所定の閾値は環鏡に応じて他の値にすることもできる。

【００３６】ステップＳ３１０がグローバル値が第２の所定の閾値より大きいことを決定す
る場合には、これはターゲット画像とステップＳ３０２で選択された画像との間
に十分な差が存在することを意味し、従ってターゲット画像は冗長画像でないこ
とを意味する。他方、ステップＳ３１０がグローバル値が第２の所定の閾値より
小さいことを決定する場合には、本発明ではこのターゲット画像は冗長画像であ
ると決定する。何れの場合にも、プロセスはステップＳ３１１に進む。

【００３７】ステップＳ３１１は、ターゲット画像が冗長画像であるか否かを示すフラグ（
例えば「１」は冗長画像を示し、「０」は非冗長画像を示す）をビデオシーケン
スにセットし、これらのフラグをビデオシーケンスのビデオデータと一緒に出力
する。上述したように、エンコーダ４及びデコーダ５がこれらのフラグを読み取
り、これらのフラグに応答して適切な処理を実行する。エンコーダ４では、この
処理はターゲット画像を符号化するかしないかを決定する処理を含む。デコーダ
５では、この処理は、殆どの場合、フラグに対応する画像を復号データ内で反復
させる処理を含む。この点に関し、インタレースビデオに対しては、ＭＰＥＧ２
シンタックスにおけるリピートファーストフィールドフラグを用いてデコ
ーダ５に、リピートファーストフィールドフラグに対応するフィールドを
反復させることによって消去フィールドを再現すべきことを指示することができ
る。プログレッシブビデオに対しては、２つの連続するフレームが冗長であるこ
とが潜在的にあり得るので、ＭＰＥＧ２シンタックスにおけるリピートファー
ストフィールドフラグ及びトップフィールドファーストフラグを用い
てデコーダ５に、リピートファーストフィールドフラグ及び／又はリピー
トファーストフィールドフラグに対応するフレームを反復させることによ
って消去フレームを再現すべきことを指示することができる。上述の如きフラグ
をビデオデータ内にセットしたら、プロセスは終了する。斯かる後に、ビデオデ
ータがフィルムモード検出回路１４から符号化回路１５に出力され、上述したよ
うに処理される。

【００３８】本発明を特定の説明用の実施例について説明した。本発明は上述の実施例及び
その変形例に限定されず、当業者であれば本発明の範囲を逸脱することなく種々
の変形及び変更を加えることができること明かである。

【図面の簡単な説明】

【図１】本発明を実施することができる符号化システムを示すブロック図であ
る。

【図２】本発明による冗長画像検出回路を具える符号化装置のブロック図であ
る。

【図３】本発明による符号化プロセスを示すフローチャートである。

【図４】本発明に従って複数の領域に分割された画像を示す。

───────────────────────────────────────────────────── フロントページの続き (72)発明者イングウェイチェンオランダ国 5656 アーアーアインドーフェンプロフホルストラーン６Ｆターム(参考） 5C059 KK00 PP11 TA07 TB04 TB05 TB08 TC02 TD12 5C063 CA05 CA11 CA23

Claims

【特許請求の範囲】

【請求項１】ビデオシーケンス内の冗長画像を検出する装置であって、コンピュータ実行可能プロセスステップを記憶するメモリと、メモリ内に記憶されたプロセスステップを実行して、(i)ビデオシーケンス内
のターゲット画像を複数の領域に分割し、(ii)複数の領域の各々について、各領
域の各画素とビデオシーケンス内の少なくとも１つの他の画像内の対応する画素
との差の和からなるローカル値を決定し、(iii)複数の領域の各々について、ロ
ーカル値を第１の所定の閾値と比較し、(iv)ターゲット画像内のほぼ全画素と前
記少なくとも１つの他の画像内の対応する画素との差の和からなるグローバル値
を決定し、(v)グローバル値を第２の所定の閾値と比較し、(vi)(a)ローカル値が
全ての領域について第１の所定の閾値を越えないとともに(b)グローバル値が第
２の所定の閾値を越えない場合にターゲット画像を冗長であると指示するプロセ
ッサと、を具えることを特徴とする冗長画像検出装置。
【請求項２】前記プロセッサが更にビデオシーケンスを構成するビデオ画像の
タイプを決定し、前記少なくとも１つの他の画像を前記ビデオ画像の決定された
タイプに従って選択することを特徴とする請求項１記載の装置。
【請求項３】前記プロセッサがビデオ画像のタイプは３０フレーム／秒のイン
タレースビデオであること決定する場合には、前記少なくとも１つの他の画像を
ビデオシーケンスのターゲット画像の直前の１フィールドとすることを特徴とす
る請求項２記載の装置。
【請求項４】ターゲット画像をビデオシーケンスの１フィールドとし、且つビ
デオシーケンスのターゲット画像の直前の１フィールドをターゲット画像である
前記フィールドと同一の極性を有するものとすることを特徴とする請求項３記載
の装置。
【請求項５】前記プロセッサがビデオ画像のタイプが６０フレーム／秒のプロ
グレッシブビデオであることを決定する場合には、前記少なくとも１つのターゲ
ットの画像をビデオシーケンスのターゲット画像の直前の２フレームを選択する
ことを特徴とする請求項２記載の装置。
【請求項６】第１の閾値はターゲット画像と前記少なくとも１つの他の画像と
の間の内容の差に基づいて設定し、第２の閾値はビデオシーケンスの生成に使用
される装置によりターゲット画像のビデオデータに導入されるノイズに基づいて
設定することを特徴とする請求項１記載の装置。
【請求項７】ビデオシーケンス内の冗長画像を検出する方法であって、ビデオシーケンス内のターゲット画像を複数の領域に分割するステップと、複数の領域の各々について、各領域の各画素とビデオシーケンス内の少なくと
も１つの他の画像内の対応する画素との差の和からなるローカル値を決定するス
テップと、複数の領域の各々について、ローカル値を第１の所定の閾値と比較するステッ
プと、ターゲット画像内のほぼ全画素と前記少なくとも１つの他の画像内の対応する
画素との差の和からなるグローバル値を決定するステップと、グローバル値を第２の所定の閾値と比較し、(i)ローカル値が全ての領域につ
いて第１の所定の閾値を越えないとともに(ii)グローバル値が第２の所定の閾値
を越えない場合にターゲット画像が冗長画像であることを指示するステップと、を具えることを特徴とする冗長画像検出方法。
【請求項８】ビデオシーケンスを構成するビデオ画像のタイプを決定するステ
ップと、前記少なくとも１つの他の画像を前記ビデオ画像の決定されたタイプに従って
選択するステップと、を更に具えることを特徴とする請求項７記載の方法。
【請求項９】ビデオ画像のタイプが３０フレーム／秒のインタレースビデオで
ある場合には、前記少なくとも１つの他の画像をビデオシーケンスのターゲット
画像の直前の１フィールドとすることを特徴とする請求項８記載の方法。
【請求項１０】ターゲット画像をビデオシーケンスの１フィールドとし、且つ
ビデオシーケンスのターゲット画像の直前の１フィールドをターゲット画像であ
る前記フィールドと同一の極性を有するものとすることを特徴とする請求項９記
載の方法。
【請求項１１】ビデオ画像のタイプが６０フレーム／秒のプログレッシブビデ
オである場合には、前記少なくとも１つのターゲットの画像をビデオシーケンス
のターゲット画像の直前の２フレームとすることを特徴とする請求項８記載の方
法。
【請求項１２】第１の閾値はターゲット画像と前記少なくとも１つの他の画像
との間の内容の差に基づいて設定し、第２の閾値はビデオシーケンスの生成に使
用される装置によりターゲット画像のビデオデータに導入されるノイズに基づい
て設定することを特徴とする請求項７記載の方法。
【請求項１３】ターゲット画像と少なくとも１つの他の画像を含むビデオシー
ケンスのビデオデータを符号化する符号化装置であって、２つの閾値をターゲット画像内の各画素と前記少なくとも１つの他の画像内の
対応する画素との差の和と比較することによりターゲット画像が冗長であるか否
かを決定するフィルムモード検出回路を具え、その第１の閾値がターゲット画像
と前記少なくとも１つの他の画像との間の内容の差に基づいて設定され、さの第
２の閾値がビデオシーケンスを生成するのに使用される装置によりビデオシーケ
ンスに導入されるノイズに基づいて設定され、且つフィルムモード検出回路がターゲット画像が冗長でないことを決定する場合に
、ターゲット画像のビデオデータを符号化する符号化回路を具えることを特徴と
する符号化装置。
【請求項１４】前記フィルムモード検出回路が、コンピュータ実行可能プロセスステップを記憶するメモリと、メモリ内に記憶されたプロセスステップを実行して、(i)ビデオシーケンス内
のターゲット画像を複数の領域に分割し、(ii)複数の領域の各々について、各領
域の各画素とビデオシーケンス内の少なくとも１つの他の画像内の対応する画素
との差の和からなるローカル値を決定し、(iii)複数の領域の各々について、ロ
ーカル値を第１の所定の閾値と比較し、(iv)ターゲット画像内のほぼ全画素と前
記少なくとも１つの他の画像内の対応する画素との差の和からなるグローバル値
を決定し、(v)グローバル値を第２の所定の閾値と比較し、(vi)(a)ローカル値が
全ての領域について第１の所定の閾値を越えないとともに(b)グローバル値が第
２の所定の閾値を越えない場合にターゲット画像を冗長であると指示するプロセ
ッサと、を具えることを特徴とする請求項１３記載の符号化装置。