Nothing Special   »   [go: up one dir, main page]

JP2003528475A - ビデオシーケンス内の冗長画像を検出するシステム - Google Patents

ビデオシーケンス内の冗長画像を検出するシステム

Info

Publication number
JP2003528475A
JP2003528475A JP2000552841A JP2000552841A JP2003528475A JP 2003528475 A JP2003528475 A JP 2003528475A JP 2000552841 A JP2000552841 A JP 2000552841A JP 2000552841 A JP2000552841 A JP 2000552841A JP 2003528475 A JP2003528475 A JP 2003528475A
Authority
JP
Japan
Prior art keywords
image
target image
video
video sequence
redundant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2000552841A
Other languages
English (en)
Inventor
チャラパリ キラン
チェン イングウェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003528475A publication Critical patent/JP2003528475A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 ビデオシーケンス内の冗長画像を検出するシステムにおいて、ビデオシーケンス内のターゲット画像を複数の領域に分割し、複数の領域の各々について、各領域の各画素とビデオシーケンス内の少なくとも1つの他の画像内の対応する画素との差の和を含むローカル値を決定し、次に複数の領域の各々について、ローカル値を第1の所定の閾値と比較する。このシステムでは更にターゲット画像内のほぼ全画素と前記少なくとも1つの他の画像内の対応する画素との差の和を含むグローバル値を決定し、グローバル値を第2の所定の閾値と比較し、ローカル値が全ての領域について第1の所定の閾値を越えないとともにグローバル値が第2の所定の閾値を越えない場合にターゲット画像を冗長である指示を出力する。

Description

【発明の詳細な説明】
【0001】発明の背景 発明の技術分野 本発明は、ビデオシーケンス内の冗長画像を検出するシステムに関するもので
ある。特に、本発明はビデオシーケンス内のターゲット画像が冗長であるか否か
を、2つの所定の閾値をターゲット画像内の画素とビデオシーケンス内の少なく
とも1つの他の画像内の対応する画素との差の和と比較することにより決定する
システムに関するものである。
【0002】関連技術の説明 テレシネはフィルム画像からビデオデータを生成するのに使用される公知の装
置である。これらの装置はテレビジョン業界において動画をテレビジョンディス
プレイ用のビデオシーケンスに変換するのに一般に使用されている。しかし、フ
ィルムとビデオとの間の本質的な差異のためにこの変換処理により問題が生ずる
【0003】 特に、動画のようなフィルムシーケンスは24フレーム/秒のフレームレート
を有する。これに対し、ビデオシーケンスは24フレーム/秒より高いフレーム
レートを有する。例えば、インタレース(飛越し走査)ビデオ画像からなるビデ
オシーケンス、即ち1フレーム内に2つの異なるフィールドがインタレースされ
たビデオ画像は30フレーム/秒のフレームレートを有する。他方、プログレッ
シブ(順次走査)ビデオ画像からなるビデオシーケンスは60フィールド/秒の
もっと高いフレームレートを有する。これらの異なるフレームレートを補償し、
フィルムシーケンスとビデオシーケンスとの間の一致を維持するために、テレシ
ネ装置はビデオシーケンスに追加の冗長画像(即ちフィールド及び/又はフレー
ム)を挿入する。これらの冗長画像は本質的にビデオシーケンス内の先行画像の
反復であり、ビデオシーケンス内の適切な位置に挿入される。
【0004】 早くから、これらの冗長画像は符号化する必要がないことが認識されていた。
その理由は、このような画像はデコーダにおいてビデオシーケンス内の他の画像
を複写するだけで再現し得るためである。従って、エンコーダ内に冗長画像を検
出する回路を含めるのが標準的技法になっている。このタイプの慣例の回路は、
ビデオシーケンスの1フィールド及び/又はフレーム全体内の画素を該シーケン
ス内の他のフィールド及び/又はフレームの対応する画素と比較することにより
冗長性を決定している(例えば、米国特許第5,452,011号,同第5,40
6,333号,同第5,491,516号及び同第5,426,464号参照)。
特に、慣例の回路は前記画素の差の和を閾値と比較し、この比較に基づいてター
ゲット画像の内容がビデオシーケンス内の他の画像(通常直前の画像)の内容と
同一であるか確かめる。
【0005】 テレシネ装置により導入されるノイズを考慮するために、上述したタイプの冗
長検出回路はその閾値を高ノイズテレシネ装置に対し高く、低ノイズテレシネ装
置に対し低くセットする。しかし、画像内容の変化及びテレシネノイズの両方を
考慮するために同一の閾値を使用すると、特に両画像の小さい局部領域のみの内
容が変化する場合にエラーが発生し得る。即ち、このような場合には、慣例の回
路はしばしばこれらの内容変化をテレシネノイズと解釈し、その結果として誤っ
た冗長決定を発生し得る。
【0006】 従って、テレシネノイズ及び画像内容の変化の両方を正確に検出し得るエンコ
ーダシステム等用の冗長画像検出回路が要求されている。
【0007】発明の概要 本発明は上述の要求を満足するビデオシーケンス内の冗長画像を検出する装置
を提供する。特に、本発明では、ビデオシーケンス内のターゲット画像が冗長で
あるか否かを、2つの閾値をターゲット画像内の画素とビデオシーケンス内の少
なくとも1つの他の画像内の対応する画素との差の和と比較することにより決定
する。第1の閾値はターゲット画像と少なくとも1つの他の画像との間の内容の
差に基づいて設定し、第2の閾値はビデオシーケンスを生成するのに使用するテ
レシネ装置によりビデオシーケンスに導入されるノイズに基づいて設定するのが
好ましい。その結果として、本発明によれば、テレシネノイズと画像内容の変化
の両方を上述した慣例の装置より精密に検出することができる。
【0008】 従って、本発明は、一つの態様では、ビデオシーケンス内の冗長画像を検出す
る装置である。この装置はプロセッサと、コンピュータ実行可能プロセスステッ
プを記憶するメモリとを含む。プロセッサがメモリ内に記憶されたプロセスステ
ップを実行して、(i)ビデオシーケンス内のターゲット画像を複数の領域に分割
し、(ii)複数の領域の各々について、各領域の各画素とビデオシーケンス内の少
なくとも1つの他の画像内の対応する画素との差の和からなるローカル値を決定
し、(iii)複数の領域の各々について、ローカル値を第1の所定の閾値と比較し
、(iv)ターゲット画像内のほぼ全画素と少なくとも1つの他の画像内の対応する
画素との差の和からなるグローバル値を決定し、(v)グローバル値を第2の所定
の閾値と比較し、(vi)(a)ローカル値が全ての領域について第1の所定の閾値を
越えないとともに(b)グローバル値が第2の所定の閾値を越えない場合にターゲ
ット画像を冗長画像と指示する。
【0009】 本発明の好適実施例では、プロセッサが更にビデオシーケンスを構成するビデ
オ画像の「タイプ」を決定し、前記少なくとも1つの他の画像を前記ビデオ画像の
決定されたタイプに従って選択する。例えば、プロセッサがビデオ画像のタイプ
は30フレーム/秒のインタレースビデオであると決定する場合には、プロセッ
サはビデオシーケンス内のターゲット画像の直前のフィールドを選択する。他方
、ビデオ画像のタイプが60フレーム/秒のプログレッシブビデオである場合に
は、プロセッサはビデオシーケンス内のターゲット画像の直前の2つのフレーム
を選択する。この特徴のおかげで、本発明は種々のタイプのビデオ内の冗長画像
を検出するのに使用し得るとともに、あるタイプのビデオにおいて、2以上の冗
長画像を検出するのに使用することができる。
【0010】 本発明は、他の態様では、ビデオシーケンス内の冗長画像を検出する方法であ
る。この方法は、ビデオシーケンス内のターゲット画像を複数の領域に分割する
ステップと、複数の領域の各々について、各領域の各画素とビデオシーケンス内
の少なくとも1つの他の画像内の対応する画素との差の和を含むローカル値を決
定するステップを具える。この方法は、更に、複数の領域の各々について、ロー
カル値を第1の所定の閾値と比較するステップと、ターゲット画像内のほぼ全画
素と少なくとも1つの他の画像内の対応する画素との差の和を含むグローバル値
を決定するステップとを具える。次にグローバル値を第2の所定の閾値と比較し
、(i)ローカル値が全ての領域について第1の所定の閾値を越えないとともに(ii
)グローバル値が第2の所定の閾値を越えない場合にターゲット画像が冗長画像
である指示を出力する。
【0011】 本発明は、他の態様では、ターゲット画像と少なくとも1つの他の画像を含む
ビデオシーケンス内のビデオデータを符号化する符号化装置である。この符号化
装置は、2つの閾値をターゲット画像内の各画素と前記少なくとも1つの他の画
像内の対応する画素との差の和と比較することによりターゲット画像が冗長であ
るか否かを決定するフィルムモード検出回路を含む。本発明では、第1の閾値を
ターゲット画像と少なくとも1つの他の画像との間の内容の差に基づいて設定し
、第2の閾値をビデオシーケンスを生成するのに使用するテレシネ装置によりビ
デオシーケンスに導入されるノイズに基づいて設定する。この符号化装置は、更
に、フィルムモード検出回路がターゲット画像が冗長でないことを決定する場合
に、ターゲット画像に対するビデオデータを符号化する符号化回路を具える。
【0012】 本発明の上述した特徴によれば、テレシネノイズと2つの画像間の内容の差を
正確に検出することができる。この冗長画像検出精度の増大は符号化装置の効率
を増大する。その理由は、符号化装置が冗長フィールド及びフレームの符号化に
ビットを浪費しなくなるからである。
【0013】 本発明は、他の態様では、ターゲット画像と少なくとも1つの他の画像とから
なるビデオシーケンスを伝送するシステムである。このシステムは、入力フィル
ム画像に基づいてビデオシーケンス用のビデオデータを生成し、出力するテレシ
ネ装置と、伝送前にビデオデータを符号化する符号化装置とを具える。この符号
化装置は、2つの閾値をターゲット画像内の各画素と前記少なくとも1つの他の
画像内の対応する画素との差の和と比較することによりターゲット画像が冗長で
あるか否かを決定するフィルムモード検出回路を含む。本発明では、第1の閾値
をターゲット画像と少なくとも1つの他の画像との間の内容の差に基づいて設定
し、第2の閾値をビデオシーケンスを生成するのに使用するテレシネ装置により
ビデオシーケンスに導入されるノイズに基づいて設定する。この符号化装置は、
更に、フィルムモード検出回路がターゲット画像が冗長でないことを決定する場
合に、ターゲット画像に対するビデオデータを符号化する符号化回路を具える。
最後に、このシステムは、符号化装置からの符号化ビデオデータを受信し、この
ビデオデータを復号する復号装置を具える。
【0014】 この簡潔な概要から本発明の特徴を直ちに理解することができるはずである。
本発明のもっと完全な理解は図面と関連して以下に記載する好適実施例の詳細な
説明を参照すれば得られる。
【0015】好適実施例の詳細な説明 本発明の好適実施例を符号化システム、即ち図1に示す符号化システム1に関
連して以下に説明する。図1に示すように、符号化システム1は、テレシネ装置
2、エンコーダ4、デコーダ5、及びデータを伝送する種々の伝送媒体を含む。
テレシネ装置2は当業者に周知の慣例の構造を有するものとするのが好ましい。
動作時に、テレシネ装置2にフィルムシーケンス6を入力する。このフィルムシ
ーケンス6は35ミリフィルム上の動画のような複数のフィルム画像を含むもの
とすることができる。テレシネ装置2はフィルムシーケンス6をビデオシーケン
ス7に変換し、ビデオシーケンス7の符号化されてないビデオデータを伝送媒体
9を経てエンコーダ4に出力する。この点に関し、伝送媒体9は専用ライン、R
Fリンク、又は両者の組合せとすることができる。
【0016】 本発明では、テレシネ装置2はフィルムシーケンス6を30フレーム/秒のフ
レームレートを有するインタレースビデオ画像からなるビデオシーケンスに変換
することができるものとする。或いは又、テレシネ装置2はフィルムシーケンス
6を60フレーム/秒のフレームレートを有するプログレッシブビデオ画像から
なるビデオシーケンスに変換することができるものとする。何れの場合にも、フ
ィルムシーケンス6とビデオシーケンス7との間のフレームレートの差を補償す
るために、テレシネ装置2は追加の冗長画像(即ちフィールド及び/又はフレー
ム)をビデオシーケンス7に挿入する。上述したように、これらの冗長画像はビ
デオシーケンス7内の先行画像の反復であり、これらをビデオシーケンス内に適
切な位置に挿入する。
【0017】 エンコーダ4はテレシネ装置2から受信された符号化されてないビデオデータ
を符号化し、符号化データを伝送媒体10を経てデコーダ5に伝送する。伝送媒
体10は専用ライン、RFリンク又は両者の組合せにすることができる。本発明
の好適実施例では、エンコーダ4はビデオデータをMPEG2を用いて符号化す
る。しかし、MPEG2の代わりに他の符号化技術、例えばDVB等を用いるこ
ともできる点に注意されたい。
【0018】 背景として説明すると、MPEG2符号化は、画像を16×16画素のマクロ
ブロックに分割して実行され、各ブロックは関連する個別の量子化スケール値を
有する。マクロブロックは次に8×8画素の個々のブロックに分割される。これ
らの8×8画素ブロックの各々に離散コサイン変換(以後「DCT」という)を施
し、各ブロック内の64画素の各々に対しDCT係数を発生させる。次に8×8
画素ブロックに対するDCT係数を対応する符号化パラメータ、即ち量子化重み
で割算する。その後に、特に量子化スケール値を考慮に入れるために追加の計算
がDCT係数に実行され、これでMPEG2符号化は完了する。
【0019】 以下に詳細に説明するように、エンコーダ4はフィルムモード検出回路(図2
参照)も含み、この回路はビデオシーケンス7内のターゲット画像が冗長画像で
あるか否かを決定するハードウエア及びソフトウエアを含んでいる。簡単に説明
すると、フィルムモード検出回路は、ターゲット画像が冗長画像であるか否かを
、2つの所定の閾値をビデオシーケンス7内のターゲット画像内の画素と少なく
とも1つの他の画像内の対応する画素との差の和と比較することにより決定する
。これらの閾値の第1の閾値はビデオシーケンス7内のターゲット画像と前記少
なくとも1つの他の画像との間の内容の差(例えば小物体の動き)に基づいて設
定され、第2の閾値はテレシネ装置2によりビデオシーケンス7に導入されるノ
イズに基づいて設定される。上述したように、このような閾値をこのように使用
することにより従来より高精度の冗長画像検出が得られる。
【0020】 デコーダ5は符号化データを受信し、復号し得る任意の慣例のデコーダとする
ことができる。その動作の一部として、デコーダ5は符号化ビデオデータ内のフ
ラグを読み取り、フラグに従って冗長画像(即ちフィールド及び/又はフレーム
)も発生する。この点に関し、フィルムモード検出回路が冗長フィールド又はフ
レームを検出する場合には、フィルムモード検出回路はフラグをビデオシーケン
ス7に付加し、そのターゲット画像は符号化する必要がないことを指示するとと
もにデコーダ5はフラグに対応するフィールド又はフレームを再現する必要があ
ることを指示する。このプロセスは以下に詳細に説明する。デコーダ5による復
号に続いて、復号ビデオデータが例えばテレビジョン、ビデオモニタ等に出力さ
れる。
【0021】 図2は本発明によるエンコーダ4の好適設計例のブロック図である。図2に示
すように、エンコーダ4は前処理回路12、フィルムモード検出回路14、及び
符号化回路15を具える。符号化回路15はブロック変換回路16、DCT回路
17、可変長コーダ回路(以後「VLC」回路という)19、レートバッファ2
0、レートコントローラ21、及びマクロブロック複雑さ分析器22を含む。こ
れらの構成素子の動作は、フィルムモード検出回路14を除いて、当業者に周知
であるが、完全を期すためにそれらの簡単な説明を以下に記す。
【0022】 特に、前処理回路12はテレシネ装置2からビデオシーケンス7のビデオデー
タを受信する。このデータは種々の媒体、例えばローカルエリアネットワーク(
「RAN」)、インターネット等を経て受信することができる。前処理回路12
は受信ビデオデータ内の雑音を低減するとともに伝送中にデータに導入され得る
エラーを補正するために種々のタイプの信号処理を実行する。この目的のために
、前処理回路12はビデオデータに低域通過又は他のタイプのフィルタ処置を実
行することができる。更に、前処理回路12はビデオデータに任意の所要の変換
、例えばビデオデータの「4:2:2」フォーマットから「4:2:0」フォーマ
ットへの変換を実行することもできる。
【0023】 前処理回路12の処理に続いて、処理されたビデオデータはフィルムモード検
出回路14に伝送される。図2に示すように、フィルムモード検出回路14はプ
ロセッサ27(マイクロプロセッサ、マイクロコントローラ等にすることができ
る)及びコンピュータ実行プロセスステップを記憶する1以上のメモリ29を含
む。動作時に、プロセッサ27は1以上のメモリ29に記憶されたプロセスステ
ップを実行してビデオシーケンス7内の各ターゲット画像において冗長画像(即
ちフィールド及び/又はフレーム)を検出し、符号化回路15がターゲット画像
を符号化すべきか符号化すべきでないかを指示するフラグを出力する。フィルム
モード検出回路14の動作のこれらの特徴を以下に詳細に説明する。
【0024】 フィルムモード検出回路14がビデオデータを上述のように処理すると、ビデ
オデータは符号化回路15に伝送される。次に符号化回路15がビデオデータを
符号化する。この点に関し、符号化回路15は冗長でない画像のビデオデータの
みを符号化する。符号化回路15はフィルムモード検出回路14から出力される
フラグに基づいて、どの画像を符号化すべきか、どの画像を符号化すべきでない
かを知ることができる。例えば、「1」のフラグ値と一緒に出力される画像、即
ち冗長画像は符号化されず、従って事実上ビデオデータから除去される。他方、
「0」のフラグ値と一緒に出力される画像、即ち非冗長画像は符号化される。こ
の目的のために、図2に示す制御回路15はビデオデータをMPEG2符号化を
用いて符号化するよう構成されているものとする。従って、以下の説明は、ビデ
オデータがMPEG2符号化により符号化されるものとするが、上述したように
本発明では他の符号化方法を使用することもできる。
【0025】 ブロック変換回路16はどの画像を符号化すべきか、どの画像を符号化すべき
でないかについての上述した決定を行う。符号化すべき画像に対して、ブロック
変換回路16はそのビデオデータのラスタラインをマクロブロック(即ち16×
16画素ブロック)に変換し、次いで個々の8×8画素ブロックに変換する。そ
の後に、DCT回路17がこれらの個々の8×8画素ブロックにDCTを施して
各ブロック内の64画素の各々に対するDCT係数を対応する量子化ステップサ
イズで発生する。DCT回路17は次に8×8画素ブロック内のDCT係数を対
応する量子化重みで割算する。その後に、DCT回路17からの出力はVLC回
路19に供給され、この回路がDCT係数に可変長符号化を実行し、可変長符号
化ビットをレートバッファ20に出力する。レートバッファ20はこの可変長符
号化ビットストリームをバッファして符号化ビットをエンコーダ4から一定のレ
ートで出力させる。
【0026】 この点に関し、DCT回路17はレートバッファ20で使用可能な記憶容量に
基づいて上述の機能を実行する。即ち、レートコントローラ21が、レートバッ
ファ20の使用可能スペースの量に部分的に基づいて、DCT回路17に対する
量子化ステップサイズを選択する。これにより、レートコントローラ21はレー
トバッファ20から出力されるビットストリームをほぼ一定のレートで出力させ
ることができる。図2に示すように、レートコントローラ21は量子化ステップ
サイズの決定においてマクロブロック複雑さ分析器22からの情報も考慮に入れ
る。この点に関し、マクロブロック複雑さ分析器22が各マクロブロックの複雑
さ、例えばビット数、を決定し、この情報をレートコントローラ21に供給する
。次にこの情報がレートバッファ20内の使用可能スペースの量に関する情報と
一緒に、DCT回路17で使用する量子化ステップサイズの決定に使用される。
【0027】 この点において、本発明は種々の異なるアーキテクチャを有するエンコーダを
用いて実現することができ、図2に示すエンコーダアーキテクチャで実現される
ものに限定されない点に注意されたい。この点に関し、本発明を実現し得るエン
コーダアーキテクチャの他の例は、米国特許出願第 号、発明の名
称「System For Extracting coding Parameters From Video Data」(譲受人:
フィリップス エレクトロニクス ノースアメリカン コーポレーション;譲受
人識別番号15-700011;発明者:Yingwei Chen, Kiran Challapli)に記載されて
おり、その内容が本願明細書に十分に含まれているものとする。特に、本発明は
この米国特許出願に記載されているエンコーダの冗長フィールド/フレーム検出
回路に実施することができる。
【0028】 図3はフィルムモード検出回路14内のプロセッサ27により実行される冗長
画像検出用プロセスステップを詳細に示すフローチャートである。始めに、ステ
ップS301がビデオシーケンス7内のターゲット画像の「タイプ」を決定する
。例えば、ステップS301は、ターゲット画像が30フレーム/秒のフレーム
レートを有するインタレースビデオであるのか、60フレーム/秒のフレームレ
ートを有するプログレッシブビデオであるのか決定する。その後に、ステップS
302がステップS301で決定されたターゲット画像のタイプに基づいてビデ
オシーケンス7内の1以上の他の画像を選択する。即ち、ターゲット画像が30
フレーム/秒のフレームレートを有するインタレースビデオである場合には、ス
テップS302はビデオシーケンス内のターゲット画像の直前のフレーム内の1
つのフィールドを選択する。特に、ステップS302はターゲット画像と同一の
極性を有するフィールドを選択する。
【0029】 背景として説明すると、インタレースビデオは複数のフレームからなり、各フ
レームは2フィールドを有する。これらのフィールドはフレーム内に、例えば第
1フィールドがフレームのライン1、3、5、7...を占め、第2フィールド
がフレームのライン2、4、6、8...を占めるように配置される。上記の極
性は当該フィールドがどちらのラインセットを占めるかを示す。従って、ビデオ
シーケンス7がインタレースビデオを含む場合には、ターゲット画像はビデオシ
ーケンスの1フレーム内の1フィールドであり、ステップS302で選択される
他の画像は直前のフレーム内のターゲット画像と同一の極性を有するフィールド
である。更に、ビデオシーケンス7がインタレースビデオを含む場合には、イン
タレースビデオ(即ち30フレーム/秒)とフィルム(24フレーム/秒)との
間のフレーム数の差が比較的小さいために、ステップS302は1フィールドの
みを選択する。即ち、この場合には、フィルムからビデオへの変換中に、テレシ
ネ装置2は同一フレームを3度以上繰り返さない。従って、冗長画像を検出する
には、一度に2つのフレームを調べるだけでよい。プログレッシブビデオに対し
ては以下に記載するようにそうではない。
【0030】 この点に関し、ステップS301においてターゲット画像が60フレーム/秒
のフレームレートを有するプログレッシブビデオであることが検出される場合に
は、ステップS302がビデオシーケンス7内のターゲット画像の直前の2フレ
ームを選択する。即ち、プログレッシブビデオ(即ち60フレーム/秒)とフィ
ルム(24フレーム/秒)との間のフレーム数の差が比較的大きいために、ビデ
オシーケンス7の発生中に、テレシネ装置2はいくつかのフレームを2回、他の
フレームを3回繰り返す。従って、従って、プログレッシブビデオでは、同一フ
レームが3回現われ得る。その結果として、ビデオシーケンス7内に2つの連続
する冗長画像が存在する可能性がある。この偶発事態を解決するために、ターゲ
ット画像がプログレッシブビデオである場合には、ステップS302はターゲッ
ト画像の直前の2フレームを選択する。
【0031】 ステップS302に続いて、プロセスはステップS303に進む。ステップS
303はターゲット画像を複数、即ちN(N>1)個の領域に分割し、各領域は
実際上連続する画素を有するものとする。ターゲット画像31内のこのような領
域30の一例を図4に示す。本発明の好適実施例では、Nは50にし、ターゲッ
ト画像を50個の領域に分割する。しかし、本発明の実施に当たっては任意の領
域数を使用することができる。
【0032】 ターゲット画像をステップS303で複数の領域に分割した後、ステップS3
04でこれらの領域の1つの領域内の画素をステップS302で選択された1以
上の画像内の対応する画素と比較する。この点に関し、明瞭及び簡単のために、
以下の説明はインタレースビデオに関連するものとし、直前の1フィールドのみ
が選択されるものとする。しかし、本発明の以下のステップはプログレッシブビ
デオに対しても実質的に同一であり、主な相違は、各ステップを2回、即ちステ
ップS302で選択されたプログレッシブビデオの2つのフレームの各フレーム
に1回づつ実行する必要があるだけである。
【0033】 従って、ステップS304はターゲット画像の第1領域内の画素をステップS
302で選択された他の画像内の対応する画素と比較する。インタレースビデオ
の場合には、この比較は同一の極性を有する画素間で行われること勿論である。
次にステップS305がターゲット画像の当該領域内の画素とステップS302
で選択された他の画像の対応する画素との差を決定する。例えば、ステップS3
05はこれらの画素の2進データ値を比較し、これらの2進データ値の差を決定
する。その後に、ステップS306が当該領域内の画素とステップS302で選
択された他の画像の対応する画素との差を加算してターゲット画像の当該領域に
対するローカル値を決定する。次にステップS307がステップS306で決定
されたこのローカル値を第1の所定の閾値T1と比較する。この点に関し、第1
の所定の閾値はターゲット画像と他の画像との間の内容の差に基づくものとする
のが好ましく、本発明の好適例では2.0dBの値にする。しかし、第1の所定
の閾値は他の因子も考慮することができ、また環鏡に応じて任意の数の異なる値
を使用することもできる。
【0034】 ステップS307において当該領域に対するローカル値が第1の所定の閾値よ
り大きいことが決定される場合には、これはターゲット画像とステップS302
で選択された他の画像との間に有意な差が存在することを意味し、従ってターゲ
ット画像は冗長画像でないことを意味する。この場合には、プロセスはステップ
S311に進み、このステップでターゲット画像は冗長画像でないことを示すフ
ラグをセットするとともにこのフラグをターゲット画像のビデオデータと一緒に
出力する。他方、ステップS307において当該領域に対するローカル値が第1
の所定の閾値以下であることが決定される場合には、プロセスはステップS30
8に進み、ここでターゲット画像内にまだ検査してない領域が残っているか決定
する。ステップS308において検査すべき領域が残っていることが決定される
場合にはプロセスはステップS304に戻る。他方、ステップS308がターゲ
ット画像内に検査すべき領域が残っていないことを決定する場合には、プロセス
はステップS309に進む。この時点においてもまだターゲット画像とステップ
S302で選択された他の画像との間に有意な「ローカル」差が識別されないこ
とは、ターゲット画像は潜在的に冗長画像(即ち冗長フィールド又はフレーム)
であることを意味する。これを確かめるために、以下に記載する「グローバル」
処理を実行する必要がある。
【0035】 もっと具体的に説明すると、ステップS309はターゲット画像内のほぼ全画
素とステップS302で選択されたターゲットの画像内の対応する画素との差を
加算してターゲット画像に対するグローバル値を決定する。次にステップS31
0がこのグローバル値を第2の所定の閾値T2と比較する。この点に関し、第2
の所定の閾値はターゲット画像と他の画像との間の雑音の差に基づくものとする
のが好ましく、本発明の好適実施例では1.5dBの値にする。しかし、第2の
所定の閾値は他の因子、例えば信号伝送中に導入される雑音等も考慮することが
できる。更に、第2の所定の閾値は環鏡に応じて他の値にすることもできる。
【0036】 ステップS310がグローバル値が第2の所定の閾値より大きいことを決定す
る場合には、これはターゲット画像とステップS302で選択された画像との間
に十分な差が存在することを意味し、従ってターゲット画像は冗長画像でないこ
とを意味する。他方、ステップS310がグローバル値が第2の所定の閾値より
小さいことを決定する場合には、本発明ではこのターゲット画像は冗長画像であ
ると決定する。何れの場合にも、プロセスはステップS311に進む。
【0037】 ステップS311は、ターゲット画像が冗長画像であるか否かを示すフラグ(
例えば「1」は冗長画像を示し、「0」は非冗長画像を示す)をビデオシーケン
スにセットし、これらのフラグをビデオシーケンスのビデオデータと一緒に出力
する。上述したように、エンコーダ4及びデコーダ5がこれらのフラグを読み取
り、これらのフラグに応答して適切な処理を実行する。エンコーダ4では、この
処理はターゲット画像を符号化するかしないかを決定する処理を含む。デコーダ
5では、この処理は、殆どの場合、フラグに対応する画像を復号データ内で反復
させる処理を含む。この点に関し、インタレースビデオに対しては、MPEG2
シンタックスにおけるリピート ファースト フィールド フラグを用いてデコ
ーダ5に、リピート ファースト フィールド フラグに対応するフィールドを
反復させることによって消去フィールドを再現すべきことを指示することができ
る。プログレッシブビデオに対しては、2つの連続するフレームが冗長であるこ
とが潜在的にあり得るので、MPEG2シンタックスにおけるリピート ファー
スト フィールド フラグ及びトップ フィールド ファースト フラグを用い
てデコーダ5に、リピート ファースト フィールド フラグ及び/又はリピー
ト ファースト フィールド フラグに対応するフレームを反復させることによ
って消去フレームを再現すべきことを指示することができる。上述の如きフラグ
をビデオデータ内にセットしたら、プロセスは終了する。斯かる後に、ビデオデ
ータがフィルムモード検出回路14から符号化回路15に出力され、上述したよ
うに処理される。
【0038】 本発明を特定の説明用の実施例について説明した。本発明は上述の実施例及び
その変形例に限定されず、当業者であれば本発明の範囲を逸脱することなく種々
の変形及び変更を加えることができること明かである。
【図面の簡単な説明】
【図1】 本発明を実施することができる符号化システムを示すブロック図であ
る。
【図2】 本発明による冗長画像検出回路を具える符号化装置のブロック図であ
る。
【図3】 本発明による符号化プロセスを示すフローチャートである。
【図4】 本発明に従って複数の領域に分割された画像を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 イングウェイ チェン オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 Fターム(参考) 5C059 KK00 PP11 TA07 TB04 TB05 TB08 TC02 TD12 5C063 CA05 CA11 CA23

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 ビデオシーケンス内の冗長画像を検出する装置であって、 コンピュータ実行可能プロセスステップを記憶するメモリと、 メモリ内に記憶されたプロセスステップを実行して、(i)ビデオシーケンス内
    のターゲット画像を複数の領域に分割し、(ii)複数の領域の各々について、各領
    域の各画素とビデオシーケンス内の少なくとも1つの他の画像内の対応する画素
    との差の和からなるローカル値を決定し、(iii)複数の領域の各々について、ロ
    ーカル値を第1の所定の閾値と比較し、(iv)ターゲット画像内のほぼ全画素と前
    記少なくとも1つの他の画像内の対応する画素との差の和からなるグローバル値
    を決定し、(v)グローバル値を第2の所定の閾値と比較し、(vi)(a)ローカル値が
    全ての領域について第1の所定の閾値を越えないとともに(b)グローバル値が第
    2の所定の閾値を越えない場合にターゲット画像を冗長であると指示するプロセ
    ッサと、 を具えることを特徴とする冗長画像検出装置。
  2. 【請求項2】 前記プロセッサが更にビデオシーケンスを構成するビデオ画像の
    タイプを決定し、前記少なくとも1つの他の画像を前記ビデオ画像の決定された
    タイプに従って選択することを特徴とする請求項1記載の装置。
  3. 【請求項3】 前記プロセッサがビデオ画像のタイプは30フレーム/秒のイン
    タレースビデオであること決定する場合には、前記少なくとも1つの他の画像を
    ビデオシーケンスのターゲット画像の直前の1フィールドとすることを特徴とす
    る請求項2記載の装置。
  4. 【請求項4】 ターゲット画像をビデオシーケンスの1フィールドとし、且つビ
    デオシーケンスのターゲット画像の直前の1フィールドをターゲット画像である
    前記フィールドと同一の極性を有するものとすることを特徴とする請求項3記載
    の装置。
  5. 【請求項5】 前記プロセッサがビデオ画像のタイプが60フレーム/秒のプロ
    グレッシブビデオであることを決定する場合には、前記少なくとも1つのターゲ
    ットの画像をビデオシーケンスのターゲット画像の直前の2フレームを選択する
    ことを特徴とする請求項2記載の装置。
  6. 【請求項6】 第1の閾値はターゲット画像と前記少なくとも1つの他の画像と
    の間の内容の差に基づいて設定し、第2の閾値はビデオシーケンスの生成に使用
    される装置によりターゲット画像のビデオデータに導入されるノイズに基づいて
    設定することを特徴とする請求項1記載の装置。
  7. 【請求項7】 ビデオシーケンス内の冗長画像を検出する方法であって、 ビデオシーケンス内のターゲット画像を複数の領域に分割するステップと、 複数の領域の各々について、各領域の各画素とビデオシーケンス内の少なくと
    も1つの他の画像内の対応する画素との差の和からなるローカル値を決定するス
    テップと、 複数の領域の各々について、ローカル値を第1の所定の閾値と比較するステッ
    プと、 ターゲット画像内のほぼ全画素と前記少なくとも1つの他の画像内の対応する
    画素との差の和からなるグローバル値を決定するステップと、 グローバル値を第2の所定の閾値と比較し、(i)ローカル値が全ての領域につ
    いて第1の所定の閾値を越えないとともに(ii)グローバル値が第2の所定の閾値
    を越えない場合にターゲット画像が冗長画像であることを指示するステップと、 を具えることを特徴とする冗長画像検出方法。
  8. 【請求項8】 ビデオシーケンスを構成するビデオ画像のタイプを決定するステ
    ップと、 前記少なくとも1つの他の画像を前記ビデオ画像の決定されたタイプに従って
    選択するステップと、 を更に具えることを特徴とする請求項7記載の方法。
  9. 【請求項9】 ビデオ画像のタイプが30フレーム/秒のインタレースビデオで
    ある場合には、前記少なくとも1つの他の画像をビデオシーケンスのターゲット
    画像の直前の1フィールドとすることを特徴とする請求項8記載の方法。
  10. 【請求項10】 ターゲット画像をビデオシーケンスの1フィールドとし、且つ
    ビデオシーケンスのターゲット画像の直前の1フィールドをターゲット画像であ
    る前記フィールドと同一の極性を有するものとすることを特徴とする請求項9記
    載の方法。
  11. 【請求項11】 ビデオ画像のタイプが60フレーム/秒のプログレッシブビデ
    オである場合には、前記少なくとも1つのターゲットの画像をビデオシーケンス
    のターゲット画像の直前の2フレームとすることを特徴とする請求項8記載の方
    法。
  12. 【請求項12】 第1の閾値はターゲット画像と前記少なくとも1つの他の画像
    との間の内容の差に基づいて設定し、第2の閾値はビデオシーケンスの生成に使
    用される装置によりターゲット画像のビデオデータに導入されるノイズに基づい
    て設定することを特徴とする請求項7記載の方法。
  13. 【請求項13】 ターゲット画像と少なくとも1つの他の画像を含むビデオシー
    ケンスのビデオデータを符号化する符号化装置であって、 2つの閾値をターゲット画像内の各画素と前記少なくとも1つの他の画像内の
    対応する画素との差の和と比較することによりターゲット画像が冗長であるか否
    かを決定するフィルムモード検出回路を具え、その第1の閾値がターゲット画像
    と前記少なくとも1つの他の画像との間の内容の差に基づいて設定され、さの第
    2の閾値がビデオシーケンスを生成するのに使用される装置によりビデオシーケ
    ンスに導入されるノイズに基づいて設定され、且つ フィルムモード検出回路がターゲット画像が冗長でないことを決定する場合に
    、ターゲット画像のビデオデータを符号化する符号化回路を具えることを特徴と
    する符号化装置。
  14. 【請求項14】 前記フィルムモード検出回路が、 コンピュータ実行可能プロセスステップを記憶するメモリと、 メモリ内に記憶されたプロセスステップを実行して、(i)ビデオシーケンス内
    のターゲット画像を複数の領域に分割し、(ii)複数の領域の各々について、各領
    域の各画素とビデオシーケンス内の少なくとも1つの他の画像内の対応する画素
    との差の和からなるローカル値を決定し、(iii)複数の領域の各々について、ロ
    ーカル値を第1の所定の閾値と比較し、(iv)ターゲット画像内のほぼ全画素と前
    記少なくとも1つの他の画像内の対応する画素との差の和からなるグローバル値
    を決定し、(v)グローバル値を第2の所定の閾値と比較し、(vi)(a)ローカル値が
    全ての領域について第1の所定の閾値を越えないとともに(b)グローバル値が第
    2の所定の閾値を越えない場合にターゲット画像を冗長であると指示するプロセ
    ッサと、 を具えることを特徴とする請求項13記載の符号化装置。
JP2000552841A 1998-06-04 1999-05-31 ビデオシーケンス内の冗長画像を検出するシステム Abandoned JP2003528475A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/090,594 US6298090B1 (en) 1998-06-04 1998-06-04 System for detecting redundant images in a video sequence by comparing two predetermined threshold values
US09/090,594 1998-06-04
PCT/IB1999/000995 WO1999063747A2 (en) 1998-06-04 1999-05-31 System for detecting redundant images in a video sequence

Publications (1)

Publication Number Publication Date
JP2003528475A true JP2003528475A (ja) 2003-09-24

Family

ID=22223467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000552841A Abandoned JP2003528475A (ja) 1998-06-04 1999-05-31 ビデオシーケンス内の冗長画像を検出するシステム

Country Status (4)

Country Link
US (1) US6298090B1 (ja)
EP (1) EP1040646A2 (ja)
JP (1) JP2003528475A (ja)
WO (1) WO1999063747A2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100319152B1 (ko) * 1999-12-02 2002-01-09 구자홍 필름 모드 검출 방법
US6670996B2 (en) * 1998-08-20 2003-12-30 Intel Corporation Apparatus and method for display of progressive and interland video content
GB9824061D0 (en) 1998-11-03 1998-12-30 Snell & Wilcox Ltd Film sequence detection (nt4)
US6542199B1 (en) * 1999-08-20 2003-04-01 Mti Film Llc Cadence editing
GB2358309A (en) * 2000-01-11 2001-07-18 Snell & Wilcox Ltd Analysing motion between adjacent fields using weighted field difference
US7039115B1 (en) * 2000-09-20 2006-05-02 General Instrument Corporation Processor allocation for channels in a video multi-processor system
US7856055B2 (en) * 2002-03-13 2010-12-21 Imax Corporation Systems and methods for digitally re-mastering or otherwise modifying motion pictures or other image sequences data
US7310442B2 (en) * 2003-07-02 2007-12-18 Lockheed Martin Corporation Scene analysis surveillance system
US20050094899A1 (en) * 2003-10-29 2005-05-05 Changick Kim Adaptive image upscaling method and apparatus
US8446964B2 (en) * 2005-07-18 2013-05-21 Broadcom Corporation Method and system for noise reduction with a motion compensated temporal filter
US8098256B2 (en) * 2005-09-29 2012-01-17 Apple Inc. Video acquisition with integrated GPU processing
US7711200B2 (en) * 2005-09-29 2010-05-04 Apple Inc. Video acquisition with integrated GPU processing
US7787541B2 (en) * 2005-10-05 2010-08-31 Texas Instruments Incorporated Dynamic pre-filter control with subjective noise detector for video compression
EP1977395B1 (en) 2006-01-27 2018-10-24 Imax Corporation Methods and systems for digitally re-mastering of 2d and 3d motion pictures for exhibition with enhanced visual quality
CA2884702C (en) 2006-06-23 2018-06-05 Samuel Zhou Methods and systems for converting 2d motion pictures for stereoscopic 3d exhibition
US7865030B2 (en) * 2006-09-13 2011-01-04 Broadcom Corporation Method and system for motion compensated temporal filtering using both FIR and IIR filtering
US8356331B2 (en) * 2007-05-08 2013-01-15 Qualcomm Incorporated Packet structure for a mobile display digital interface
KR101651027B1 (ko) * 2011-12-23 2016-08-24 인텔 코포레이션 콘텐츠 적응적 고정밀 매크로블록 레이트 제어

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3443880B2 (ja) * 1992-09-18 2003-09-08 ソニー株式会社 ビデオ信号符号化方法及び復号化方法
US5491516A (en) 1993-01-14 1996-02-13 Rca Thomson Licensing Corporation Field elimination apparatus for a video compression/decompression system
US5828786A (en) * 1993-12-02 1998-10-27 General Instrument Corporation Analyzer and methods for detecting and processing video data types in a video data stream
US5452011A (en) 1994-03-14 1995-09-19 Thomson Consumer Electronics, Inc. Method and device for film-mode detection and field elimination
US5406333A (en) 1994-03-14 1995-04-11 Thomson Consumer Electronics, Inc. Method and device for film-mode detection
US5606373A (en) * 1995-04-04 1997-02-25 International Business Machines Corporation Methods for repeated field detection
US5911008A (en) * 1996-04-30 1999-06-08 Nippon Telegraph And Telephone Corporation Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding
US6037986A (en) * 1996-07-16 2000-03-14 Divicom Inc. Video preprocessing method and apparatus with selective filtering based on motion detection

Also Published As

Publication number Publication date
WO1999063747A3 (en) 2000-04-06
EP1040646A2 (en) 2000-10-04
US6298090B1 (en) 2001-10-02
WO1999063747A2 (en) 1999-12-09

Similar Documents

Publication Publication Date Title
JP2003528475A (ja) ビデオシーケンス内の冗長画像を検出するシステム
EP0744869B1 (en) Image processing apparatus
EP0095560B1 (en) Method for processing image data
US8625675B2 (en) Block error compensating apparatus of image frame and method thereof
EP0582122A1 (en) Scramble apparatus and descramble apparatus
KR100391994B1 (ko) 동화상정보의압축신장방법및영상신호처리장치
KR100704313B1 (ko) 인코딩 된 도메인에서 압축 상수의 복구를 위한 장치 및 방법, 및 컴퓨터 판독가능 매체
US6819715B2 (en) Image decoding method, image decoding apparatus, and data storage medium
JP2001519988A (ja) ビデオデータから符号化パラメータを抽出するシステム
US6473465B1 (en) Method and apparatus for video coding at high efficiency
JP3231800B2 (ja) 画像符号化装置及び画像符号化方法
JP2001189844A (ja) 情報挿入/検出方式
JP2678066B2 (ja) ディジタル信号処理装置
JPH11275590A (ja) 画像間圧縮符号化装置および符号化方法
EP0699001A2 (en) Image data signal compression/transmission method and image data signal compression/transmission system
JP4154772B2 (ja) 画像情報変換装置および変換方法
JPH06233266A (ja) 映像符号化装置および映像復号化装置
JP3270861B2 (ja) ブロック変換符号の復号装置
JPS6154313B2 (ja)
JP2637976B2 (ja) ブロツク符号化の復号装置
KR900004962B1 (ko) 화상 송신 시스템
KR0178744B1 (ko) 가변장 복호기 제어회로
JPH03227189A (ja) 画像データ符号化方法及び復号化方法
JPH07222153A (ja) ディジタル画像受信装置
JPH02211785A (ja) 復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060529

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20061005