Nothing Special   »   [go: up one dir, main page]

JP2012023632A - 符号化装置および符号化方法、並びに、復号装置および復号方法 - Google Patents

符号化装置および符号化方法、並びに、復号装置および復号方法 Download PDF

Info

Publication number
JP2012023632A
JP2012023632A JP2010160952A JP2010160952A JP2012023632A JP 2012023632 A JP2012023632 A JP 2012023632A JP 2010160952 A JP2010160952 A JP 2010160952A JP 2010160952 A JP2010160952 A JP 2010160952A JP 2012023632 A JP2012023632 A JP 2012023632A
Authority
JP
Japan
Prior art keywords
unit
orthogonal transform
image
intra prediction
inverse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010160952A
Other languages
English (en)
Inventor
Kenji Kondo
健治 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010160952A priority Critical patent/JP2012023632A/ja
Priority to CN201180033755.6A priority patent/CN102986222B/zh
Priority to KR1020137000138A priority patent/KR20130088119A/ko
Priority to EP11806718.0A priority patent/EP2595383A1/en
Priority to US13/805,428 priority patent/US9918084B2/en
Priority to PCT/JP2011/065734 priority patent/WO2012008388A1/ja
Publication of JP2012023632A publication Critical patent/JP2012023632A/ja
Priority to US15/886,252 priority patent/US10728544B2/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/439Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using cascaded computational arrangements for performing a single operation, e.g. filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】直交変換処理または逆直交変換処理の演算量を削減する。
【解決手段】DWT部91は、残差情報に対して、KLTより演算量の少ないDWTを行う。KLT部92−0乃至92−8は、それぞれ、対応するイントラ予測モードのKLTの基底で、DWTの結果得られる残差情報の低周波数成分に対して、分離型のKLTを行う。KLTの結果得られる係数と、DWTの結果得られる残差情報の高周波数成分は可逆符号化される。本発明は、例えば、画像符号化装置に適用することができる。
【選択図】図3

Description

本発明は、符号化装置および符号化方法、並びに、復号装置および復号方法に関し、特に、直交変換処理または逆直交変換処理の演算量を削減することができるようにした符号化装置および符号化方法、並びに、復号装置および復号方法に関する。
AVC(Advanced Video Coding)方式において、イントラ予測符号化を改善するMDDT(Mode dependent directional transform)が提案されている(例えば、特許文献1および2参照)。MDDTは、イントラ予測画像と入力画像との残差を直交変換する際に、従来の離散コサイン変換(DCT(Discrete Cosine Transform))を用いるのではなく、イントラ予測モードに応じてカルーネン・レーベ変換(KLT)を用いることで符号化効率を改善する技術である。
KLTは、変換後の係数が互いに無相関になる変換であり、第1主成分の分散が最大になる変換である。このような変換によって得られる分散の大きい係数にビットを多く配分し、分散の小さい係数にビットを少なく配分することで、符号化効率を改善することができる。
また、特許文献1に記載されているように、イントラ予測画像と入力画像の残差はイントラ予測モードに依存する。従って、MDDTでは、予めイントラ予測モードに応じてKLTの基底を学習しておき、イントラ予測モードごとに異なるKLTの基底を用いることで、残差を効率的に変換することを可能にしている。
しかしながら、KLTは、DCTに比べて演算量が多い。そこで、特許文献2では、イントラ予測画像と入力画像の残差に対して、一般性のある非分離型(Non-separable)のKLTではなく、演算量が比較的少ない分離型(Separable)のKLTを行うことにより、乗算の回数を削減することが提案されている。
Marta Karczewicz,"Improved Intra Coding",VCEG(Video Coding Experts Group)-AF15,USA,April,2007 Yan Ye,Marta Karczewicz,"Improved Intra Coding",VCEG(Video Coding Experts Group)-AG11r1,China,October,2007
しかしながら、特許文献2に記載されているように、分離型のKLTが行われる場合であっても、ブロックサイズが大きい場合、演算量は大きくなる。具体的には、ブロックサイズがN×N画素であるとすると、高速アルゴリズムを用いたDCTの演算量のオーダはNlog|N|であるが、分離型のKLTの演算量のオーダはNである。従って、ブロックサイズが大きいほど、分離型のKLTの演算量は、高速アルゴリズムを用いたDCTの演算量に比べて大きくなる。
その結果、分離型のKLTがハードウェアで実現される場合、LSI(Large Scale Integration)の回路規模が大きくなり、製造コストが増加する。また、分離型のKLTがソフトウェアで実現される場合、処理量が増加し、実時間での画像の再生が困難になる。
本発明は、このような状況に鑑みてなされたものであり、直交変換処理または逆直交変換処理の演算量を削減することができるようにするものである。
本発明の第1の側面の符号化装置は、画像に対して、第1の直交変換より演算量の少ない第2の直交変換を行う前直交変換手段と、前記第2の直交変換の結果得られる前記画像の低周波数成分に対して、前記第1の直交変換を行う後直交変換手段と、前記第1の直交変換後の前記低周波数成分と、前記第2の直交変換の結果得られる前記画像の高周波数成分とを符号化する符号化手段とを備える符号化装置である。
本発明の第1の側面の符号化方法は、本発明の第1の側面の符号化装置に対応する。
本発明の第1の側面においては、画像に対して、第1の直交変換より演算量の少ない第2の直交変換が行われ、前記第2の直交変換の結果得られる前記画像の低周波数成分に対して、前記第1の直交変換が行われ、前記第1の直交変換後の前記低周波数成分と、前記第2の直交変換の結果得られる前記画像の高周波数成分とが符号化される。
本発明の第2の側面の復号装置は、画像の符号化結果として、前記画像に対して第1の直交変換より演算量の少ない第2の直交変換を行った結果得られた前記画像の低周波数成分の前記第1の直交変換後の係数と、前記第2の直交変換を行った結果得られた前記画像の高周波数成分の符号化結果を取得し、前記画像の符号化結果を復号する復号手段と、前記復号の結果得られる前記低周波数成分の前記第1の直交変換後の係数に対して、前記第1の直交変換に対応する第1の逆直交変換を行う前逆直交変換手段と、前記第1の逆直交変換の結果得られる前記低周波数成分と、前記復号の結果得られる前記高周波数成分に対して、前記第2の直交変換に対応する第2の逆直交変換を行い、前記画像を得る後逆直交変換手段とを備える復号装置である。
本発明の第2の側面の復号方法は、本発明の第2の側面の復号装置に対応する。
本発明の第2の側面においては、画像の符号化結果として、前記画像に対して第1の直交変換より演算量の少ない第2の直交変換を行った結果得られた前記画像の低周波数成分の前記第1の直交変換後の係数と、前記第2の直交変換を行った結果得られた前記画像の高周波数成分の符号化結果が取得され、前記画像の符号化結果が復号され、前記復号の結果得られる前記低周波数成分の前記第1の直交変換後の係数に対して、前記第1の直交変換に対応する第1の逆直交変換が行われ、前記第1の逆直交変換の結果得られる前記低周波数成分と、前記復号の結果得られる前記高周波数成分に対して、前記第2の直交変換に対応する第2の逆直交変換が行われ、前記画像が得られる。
第1の側面の符号化装置および第2の側面の復号装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
本発明の第1の側面によれば、直交変換処理の演算量を削減することができる。
また、本発明の第2の側面によれば、逆直交変換処理の演算量を削減することができる。
本発明を適用した画像符号化装置の第1実施の形態の構成例を示すブロック図である。 各イントラ予測モードの予測方向の例を示す図である。 図1のイントラ予測用直交変換部の詳細構成例を示すブロック図である。 DWT部によるDWTを説明する図である。 図1のイントラ予測用逆直交変換部の詳細構成例を示すブロック図である。 図1の可逆符号化部による可逆符号化の順序の説明をする図である。 図1の画像符号化装置の符号化処理を説明するフローチャートである。 直交変換処理を説明するフローチャートである。 逆直交変換処理を説明するフローチャートである。 イントラ予測コスト関数値算出処理を説明するフローチャートである。 コスト関数値算出処理を説明するフローチャートである。 本発明を適用した画像復号装置の第1実施の形態の構成例を示すブロック図である。 画像復号装置による復号処理を説明するフローチャートである。 可逆復号処理を説明するフローチャートである。 本発明を適用した画像符号化装置の第2実施の形態の構成例を示すブロック図である。 図15のイントラ予測用直交変換部の詳細構成例を示すブロック図である。 DWT部によるDWTを説明する図である。 図15のイントラ予測用逆直交変換部の詳細構成例を示すブロック図である。 直交変換処理を説明するフローチャートである。 逆直交変換処理を説明するフローチャートである。 本発明を適用した画像復号装置の第2実施の形態の構成例を示すブロック図である。 マクロブロックのサイズの例を示す図である。 コンピュータの一実施の形態の構成例を示している。 テレビジョン受像機の主な構成例を示すブロック図である。 携帯電話機の主な構成例を示すブロック図である。 ハードディスクレコーダの主な構成例を示すブロック図である。 カメラの主な構成例を示すブロック図である。
<第1実施の形態>
[画像符号化装置の構成例]
図1は、本発明を適用した画像符号化装置の第1実施の形態の構成例を示すブロック図である。
図1の画像符号化装置51は、A/D変換部61、画面並べ替えバッファ62、演算部63、直交変換部64、量子化部65、可逆符号化部66、蓄積バッファ67、逆量子化部68、逆直交変換部69、演算部70、デブロックフィルタ71、フレームメモリ72、スイッチ73、イントラ予測部74、動き予測・補償部75、予測画像選択部76、およびレート制御部77により構成される。画像符号化装置51は、入力された画像をAVC方式で圧縮符号化する。
具体的には、画像符号化装置51のA/D変換部61は、入力されたフレーム単位の画像をA/D変換し、画面並べ替えバッファ62に出力し、記憶させる。画面並べ替えバッファ62は、記憶した表示の順番のフレームの画像を、GOP(Group of Picture)構造に応じて、符号化のための順番に並べ替える。
演算部63は、必要に応じて、画面並べ替えバッファ62から読み出された画像から、予測画像選択部76から供給される予測画像を減算する。演算部63は、減算の結果得られる画像、または、画面並べ替えバッファ62から読みされた画像そのものを、残差情報として直交変換部64に出力する。演算部63は、予測画像選択部76から予測画像が供給されない場合、画面並べ替えバッファ62から読み出された画像をそのまま残差情報として直交変換部64に出力する。
直交変換部64は、インター予測用直交変換部64Aとイントラ予測用直交変換部64Bにより構成される。インター予測用直交変換部64Aは、予測画像選択部76から最適インター予測モードを示す情報(以下、インター予測モード情報という)が供給される場合、演算部63からの残差情報に対して、DCTやKLT等の直交変換の処理を直交変換処理として行う。そして、直交変換部64は、その結果得られる係数を変換係数として量子化部65に供給する。
イントラ予測用直交変換部64Bは、予測画像選択部76から最適イントラ予測モードを示す情報(以下、イントラ予測モード情報という)が供給される場合、演算部63からの残差情報に対して直交変換処理を行う。
具体的には、イントラ予測用直交変換部64Bは、残差情報に対して、KLTより演算量の少ないDWT(discrete wavelet transform)を行い、低周波数成分および高周波数成分を抽出する。そして、イントラ予測用直交変換部64Bは、低周波数成分に対して、イントラ予測モードごとの分離型のKLTを施す。イントラ予測用直交変換部64Bは、イントラ予測モード情報が示す最適イントラ予測モードの分離型のKLTの結果得られる係数と高周波数成分を、変換係数として量子化部65に供給する。
量子化部65は、直交変換部64から供給される変換係数を量子化する。量子化された変換係数は、可逆符号化部66に入力される。
可逆符号化部66は、イントラ予測モード情報をイントラ予測部74から取得し、インター予測モード情報、動きベクトルの情報などを動き予測・補償部75から取得する。
可逆符号化部66(符号化手段)は、量子化部65から供給される量子化された変換係数に対して、可変長符号化(例えば、CAVLC(Context-Adaptive Variable Length Coding)など)、算術符号化(例えば、CABAC(Context-Adaptive Binary Arithmetic Coding)など)などの可逆符号化を行い、その結果得られる情報を圧縮画像とする。また、可逆符号化部66は、イントラ予測モード情報、インター予測モード情報、動きベクトルの情報などを可逆符号化し、その結果得られる情報を圧縮画像に付加されるヘッダ情報とする。
なお、可逆符号化部66は、変換係数の最適予測モードが最適イントラ予測モードである場合、その最適イントラ予測モードに応じた順序で、変換係数を可逆符号化する。可逆符号化部66は、可逆符号化の結果得られるヘッダ情報が付加された圧縮画像を圧縮情報として蓄積バッファ67に供給し、蓄積させる。
蓄積バッファ67は、可逆符号化部66から供給される圧縮情報を、一時的に記憶し、例えば、後段の図示せぬ記録装置や伝送路などに出力する。
また、量子化部65より出力された、量子化された変換係数は、逆量子化部68にも入力され、逆量子化された後、逆直交変換部69に供給される。
逆直交変換部69は、インター予測用逆直交変換部69Aとイントラ予測用逆直交変換部69Bにより構成される。インター予測用逆直交変換部69Aは、予測画像選択部76からインター予測モード情報が供給される場合、逆量子化部68から供給される変換係数に対して、逆DCTや逆KLT等の逆直交変換の処理を逆直交変換処理として行う。インター予測用逆直交変換部69Aは、その結果得られる残差情報を演算部70に供給する。
イントラ予測用逆直交変換部69Bは、予測画像選択部76からイントラ予測モード情報が供給される場合、逆量子化部68から供給される変換係数に対して、逆直交変換処理を行う。具体的には、イントラ予測用逆直交変換部69Bは、変換係数のうちの低周波数成分の係数に対してイントラ予測モードごとの逆KLTを行う。また、イントラ予測用逆直交変換部69Bは、イントラ予測モード情報が示す最適イントラ予測モードの逆KLTの結果得られる低周波数成分と、変換係数のうちの高周波数成分に対して、逆DWTを行い、残差情報を得る。イントラ予測用逆直交変換部69Bは、残差情報を演算部70に供給する。
演算部70は、逆直交変換部69から供給される残差情報を、必要に応じて、予測画像選択部76から供給される予測画像と加算し、局部的に復号された画像を得る。演算部70は、得られた画像をデブロックフィルタ71に供給する。
デブロックフィルタ71は、演算部70から供給される局部的に復号された画像をフィルタリングすることにより、ブロック歪を除去する。デブロックフィルタ71は、その結果得られる画像をフレームメモリ72に供給し、蓄積させる。フレームメモリ72には、デブロックフィルタ71によりデブロックフィルタ処理される前の画像も供給され、蓄積される。
スイッチ73は、フレームメモリ72に蓄積された画像を参照画像として動き予測・補償部75またはイントラ予測部74に出力する。
イントラ予測部74は、画面並べ替えバッファ62から読み出された画像と、スイッチ73を介して供給された参照画像とに基づいて、候補となる全てのイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。なお、ここでは、ブロックサイズの異なるイントラ予測モードは、同一の予測方向のイントラ予測モードであっても、異なるイントラ予測モードとして説明する。また、ブロックサイズとしては、4×4画素と8×8画素の2種類が扱われるものとする。
また、イントラ予測部74は、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。そして、イントラ予測部74は、コスト関数値が最小値となるようなイントラ予測モードを最適イントラ予測モードとして選択する。
このコスト関数値は、RD(Rate Distortion)コストともいい、例えば、AVC方式における参照ソフトウェアであるJM(Joint Model)で定められているような、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて算出される。
具体的には、コスト関数値の算出手法としてHigh Complexity モードが採用される場合、候補となる全てのイントラ予測モードに対して、仮に可逆符号化までが行われ、次の式(1)で表わされるコスト関数値が各イントラ予測モードに対して算出される。
Cost(Mode)=D+λ・R ・・・(1)
Dは、原画像と復号画像の差分(歪)、Rは、変換係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ乗数である。
一方、コスト関数値の算出手法としてLow Complexity モードが採用される場合、候補となる全てのイントラ予測モードに対して、復号画像の生成、および、イントラ予測モード情報などのヘッダビットの算出が行われ、次の式(2)で表わされるコスト関数が各イントラ予測モードに対して算出される。
Cost(Mode)=D+QPtoQuant(QP)・Header_Bit ・・・(2)
Dは、原画像と復号画像の差分(歪)、Header_Bitは、イントラ予測モードに対するヘッダビット、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。
Low Complexity モードにおいては、全てのイントラ予測モードに対して、復号画像を生成するだけでよく、可逆符号化を行う必要がないため、演算量が少なくて済む。なお、ここでは、コスト関数値の算出手法としてHigh Complexity モードが採用されるものとする。
イントラ予測部74は、イントラ予測モード情報、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、予測画像選択部76に供給する。イントラ予測部74は、予測画像選択部76から最適イントラ予測モードで生成された予測画像の選択が通知された場合、イントラ予測モード情報を可逆符号化部66に供給する。
動き予測・補償部75は、画面並べ替えバッファ62から供給される画像と、スイッチ73を介して供給される参照画像とに基づいて、候補となる全てのインター予測モードの動き予測行い、動きベクトルを生成する。そして、動き予測・補償部75は、動きベクトルに基づいて参照画像に対して補償処理を行い、予測画像を生成する。このとき、動き予測・補償部75は、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。
そして、動き予測・補償部75は、インター予測モード情報、最適インター予測モードで生成された予測画像、および、対応するコスト関数値を予測画像選択部76に供給する。動き予測・補償部75は、予測画像選択部76から最適インター予測モードの予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトルの情報などを可逆符号化部66に出力する。
予測画像選択部76は、イントラ予測部74および動き予測・補償部75から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのいずれかを、最適予測モードに決定する。そして、予測画像選択部76は、最適予測モードの予測画像を、演算部63および演算部70に供給する。また、予測画像選択部76は、最適予測モードの予測画像の選択をイントラ予測部74または動き予測・補償部75に通知する。また、予測画像選択部76は、最適予測モードを示すインター予測モード情報またはイントラ予測モード情報を、直交変換部64と逆直交変換部69に供給する。
レート制御部77は、蓄積バッファ67に蓄積された圧縮情報に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部65の量子化動作のレートを制御する。
[イントラ予測モードの説明]
図2は、各イントラ予測モードの予測方向の例を示す図である。
図2に示すように、AVC方式におけるイントラ予測モードには、8方向の予測を行うモードとDC予測を行うモードがある。図2に記載されている番号は、イントラ予測モードの番号であり、その番号が付与された矢印は、その番号のイントラ予測モードの予測方向を示している。
具体的には、図2に示すように、0番のイントラ予測モードの予測方向は、垂直方向であり、1番のイントラ予測モードの予測方向は、水平方向である。図示されていない2番のイントラ予測モードは、DC予測を行うモードである。また、図2に示すように、3乃至8番のイントラ予測モードの予測方向は、斜め方向である。
[イントラ予測用直交変換部の詳細構成例]
図3は、図1のイントラ予測用直交変換部64Bの詳細構成例を示すブロック図である。
図3のイントラ予測用直交変換部64Bは、DWT部91、KLT部92−0乃至92−8、およびセレクタ93により構成される。
DWT部91(前直行変換手段)は、必要に応じて、図1の演算部63から供給される残差情報に対してDWTを行い、低周波数成分と高周波成分を得る。DWT部91は、低周波数成分をKLT部92−0乃至92−8に供給し、高周波数成分をセレクタ93に供給する。DWT部91は、KLTを行う必要がない場合、残差情報をそのままKLT部92−0乃至92−8に供給する。
KLT部92−0乃至92−8(後直交変換手段)は、それぞれ、0番乃至8番のイントラ予測モードのKLTの基底で、DWT部91から供給される低周波数成分または残差情報に対して分離型のKLTを行う。なお、各イントラ予測モードのKLTの基底は、予め学習により求められた最適値である。KLT部92−0乃至92−8は、分離型のKLTの結果得られる係数をセレクタ93に供給する。
セレクタ93には、予測画像選択部76から供給されるイントラ予測モード情報が供給される。セレクタ93は、イントラ予測モード情報に基づいて、KLT部92−0乃至92−8から供給される係数のうちの、最適イントラ予測モードに対応するKLT部92−0乃至92−8から供給される係数を選択する。そして、セレクタ93は、選択された残差情報の係数を変換係数として量子化部65(図1)に供給するか、または、低周波数成分の係数と、DWT部91から供給される高周波数成分を変換係数として量子化部65に供給する。
なお、図3のイントラ予測用直交変換部64Bでは、セレクタ93がKLT部92−0乃至92−8の後に設けられたが、セレクタが、KLT部92−0乃至92−8の前に設けられるようにしてもよい。この場合、DWT部91から出力される低周波数成分または残差情報が、最適イントラ予測モードに対応するKLT部92−0乃至92−8のいずれかにのみ供給される。
[DWTの説明]
図4は、DWT部91によるDWTを説明する図である。
図4Aに示す残差情報に対して水平方向および垂直方向にDWTが行われると、図4Bに示すように、水平成分および垂直成分が、それぞれ、高周波数成分と低周波数成分に分割される。なお、図4において、Lは、低周波数成分を表し、Hは高周波数成分を表している。また、水平成分と垂直成分は、連続して表記されている。これらのことは、後述する図17においても同様である。
図4Bに示すように、残差情報に対して水平方向および垂直方向にDWTが行われると、残差情報は、水平成分および垂直成分が低周波数成分である成分(LL成分)、水平成分が高周波数成分で、垂直成分が低周波数成分である成分(HL成分)、水平成分が低周波数成分で、垂直成分が高周波数成分である成分(LH成分)、および、水平成分および垂直成分が高周波数成分である成分(HH成分)に分割される。
また、LL成分に対して水平方向および垂直方向にDWTが再度行われると、図4Cに示すように、LL成分の水平成分および垂直成分が、さらに、それぞれ、高周波数成分と低周波数成分に分割される。その結果、LL成分は、水平成分および垂直成分が低周波数成分である成分(LLLL成分)、水平成分が高周波数成分で、垂直成分が低周波数成分である成分(LLHL成分)、水平成分が低周波数成分で、垂直成分が高周波数成分である成分(LLLH成分)、および、水平成分および垂直成分が高周波数成分である成分(LLHH成分)に分割される。なお、残差情報のLL成分以外の成分であるHL成分、LH成分、およびHH成分は、そのままである。
そして、例えば、DWT部91によるDWTの回数が2回である場合、最も低周波数の水平成分および垂直成分からなるLLLL成分が低周波数成分としてKLT部92−0乃至92−8(図3)に出力される。これにより、分離型のKLTの対象となるデータのサイズを、残差情報のデータサイズの1/16にすることができる。例えば、イントラ予測のブロックサイズが4×4画素である場合、即ち残差情報が4×4画素である場合、分離型のKLTの対象となるデータのサイズは1×1画素となる。また、イントラ予測のブロックサイズが8×8画素である場合、分離型のKLTの対象となるデータのサイズは2×2画素となる。
その結果、イントラ予測による予測画像を用いた残差情報に対する直交変換処理の演算量を削減することができる。具体的には、ブロックサイズがN×N画素であるとすると、DWT部91の演算量のオーダは、NからNlog|N|程度であり、KLT部92−0乃至92−8の演算量のオーダは、(N/4)である。従って、直交変換処理の演算量のオーダは、(N/4)+Nlog|N|程度になり、ブロックサイズがN×N画素である場合の分離型のKLTの演算量のオーダであるNに比べて十分に小さくなる。
LLLL成分以外の成分は、高周波数成分としてそのまま量子化部65(図1)に出力される。
なお、DWTの回数は、2回に限定されず、DWTは、最も低周波数の水平成分および垂直成分からなる成分のサイズが、KLT部92−0乃至92−8で処理可能なサイズ以下になるまで繰り返される。KLT部92−0乃至92−8で処理可能なサイズは、小さいほど、直交変換処理の演算量が少なくなり、製造コストや実時間再生の面で有利になるが、DWTの回数が多くなるため、符号化効率は低下する。従って、KLT部92−0乃至92−8で処理可能なサイズは、符号化効率と直交変換処理の演算量の許容範囲を考慮して決定される。
[イントラ予測用逆直交変換部の詳細構成例]
図5は、図1のイントラ予測用逆直交変換部69Bの詳細構成例を示すブロック図である。
図5のイントラ予測用逆直交変換部69Bは、逆KLT部101−0乃至101−8、セレクタ102、および逆DWT部103により構成される。
逆KLT部101−0乃至101−8は、それぞれ、0番乃至8番のイントラ予測モードの逆KLTの基底で、図1の逆量子化部68から供給される変換係数のうちの係数に対して分離型の逆KLTを行う。
セレクタ102には、予測画像選択部76から供給されるイントラ予測モード情報が供給される。セレクタ102は、イントラ予測モード情報に基づいて、逆KLT部101−0乃至101−8から供給される逆KLT後の成分のうちの、最適イントラ予測モードに対応する逆KLT部101−0乃至101−8から供給される逆KLT後の成分を選択する。そして、セレクタ102は、選択された逆KLT後の成分を逆DWT部103に供給する。
逆DWT部103は、セレクタ102から供給される成分を残差情報として演算部70(図1)に供給する。または、逆DWT部103は、セレクタ102から供給される成分と逆量子化部68から供給される変換係数のうちの高周波数成分とに対して、DWT部91によるDWTに対応する逆DWTを行い、その結果得られる成分を残差情報として演算部70に供給する。
なお、図5のイントラ予測用逆直交変換部69Bでは、セレクタ102が逆KLT部101−0乃至101−8の後に設けられたが、セレクタが、逆KLT部101−0乃至101−8の前に設けられるようにしてもよい。この場合、逆量子化部68から供給される変換係数のうちの係数が、最適イントラ予測モードに対応する逆KLT部101−0乃至101−8のいずれかにのみ供給される。
[可逆符号化の順序の説明]
図6は、図1の可逆符号化部66による可逆符号化の順序の説明をする図である。
可逆符号化では、0が連続する数が符号化されるため、可逆符号化の順序は、0が連続する順序であることが望ましい。
そこで、可逆符号化部66では、量子化後の変換係数の0が連続するように、符号化順序をイントラ予測モードに応じて切り換える。
具体的には、図6Aに示す残差情報に対してDWTが行われると、残差情報は、図6Bに示すように、LL成分、HL成分、LH成分、およびHH成分の4つの成分に帯域分割される。このとき、図6Bに示すように、LL成分は、残差情報の特徴を有する。また、HL成分は、垂直方向の線を表し、LH成分は、水平方向の線を表し、HH成分は、斜め方向の線を表す。即ち、HL成分は、垂直方向の相関が強く、LH成分は、水平方向の相関が強く、HH成分は、斜め方向の相関が強い。
そして、予測方向が垂直方向である0番のイントラ予測モードでは、残差情報の垂直方向の相関が強くなる。即ち、残差情報の高周波数成分は、水平方向に多くなる。従って、0番のイントラ予測モードでは、HL成分が多くなることが多い。
また、予測方向が水平方向である1番のイントラ予測モードでは、残差情報の水平方向の相関が強くなる。即ち、残差情報の高周波数成分は、垂直方向に多くなる。従って、1番のイントラ予測モードでは、LH成分が多くなることが多い。
さらに、予測方向が斜め方向である3乃至8番のイントラ予測モードでは、残差情報の斜め方向の相関が強くなる。即ち、残差情報の高周波数成分は、斜め方向に多くなる。従って、3乃至8番のイントラ予測モードでは、HH成分が多くなることが多い。
ここで、可逆符号化対象として量子化後の変換係数の0を連続させるためには、DWT後の値が多いと推定される成分の量子化後の変換係数から、DWT後の値がより少なくなると推定される順に各成分の量子化後の変換係数を可逆符号化対象とする必要がある。
従って、可逆符号化部66では、最適予測モードが0番のイントラ予測モードである場合、例えば、LL成分、HL成分、HH成分、LH成分の順に可逆符号化対象とする。また、最適予測モードが1番のイントラ予測モードである場合、例えば、LL成分、LH成分、HH成分、HL成分の順に可逆符号化対象とする。さらに、最適予測モードが3乃至8番のイントラ予測モードである場合、例えば、LL成分、HH成分、HL成分、LH成分の順に可逆符号化対象とする。なお、最適予測モードが2番のイントラ予測モードである場合には、予め決められた所定の順に、各成分が可逆符号化対象とされる。
また、LH成分、HL成分、およびHH成分内においても、DWT後の値が多いと推定されるブロックから、より少なくなると推定される順に各ブロックが可逆符号化対象とされる。具体的には、LH成分は、水平方向の相関が強いので、LH成分内では、水平方向に並ぶ順に各ブロックが可逆符号化対象とされる。また、HL成分は、垂直方向の相関が強いので、HL成分内では、垂直方向に並ぶ順に各ブロックが可逆符号化対象とされる。さらに、HH成分では、斜め方向の相関が強いので、HH成分内では、斜め方向に並ぶ順に各ブロックが可逆符号化対象とされる。
なお、LL成分内においては、予め決められた所定の順に、各ブロックが可逆符号化対象とされる。LL成分内の順序は、イントラ予測モードごとに異なるようにしてもよい。
[画像符号化装置の符号化処理の説明]
図7は、図1の画像符号化装置51の符号化処理を説明するフローチャートである。
ステップS11において、A/D変換部61は、入力されたフレーム単位の画像をA/D変換し、画面並べ替えバッファ62に供給する。ステップS12において、画面並べ替えバッファ62は、A/D変換部61より供給された画像を記憶し、記憶している表示の順番のフレームの画像の、符号化のための順番への並べ替えを行い、演算部63に供給する。
ステップS13において、演算部63は、画面並べ替えバッファ62から読み出された画像から、必要に応じて、予測画像選択部76から供給される予測画像を減算し、残差情報を求める。そして、演算部63は、その残差情報を直交変換部64に出力する。
ステップS14において、直交変換部64は、演算部63から供給される残差情報に対して直交変換処理を行う。具体的には、直交変換部64のインター予測用直交変換部64Aは、予測画像選択部76からインター予測モード情報が供給される場合、演算部63からの残差情報に対して直交変換処理を行い、その結果得られる係数を変換係数として量子化部65に供給する。
また、イントラ予測用直交変換部64Bは、予測画像選択部76からイントラ予測モード情報が供給される場合、演算部63からの残差情報に対して直交変換処理を行う。この直交変換処理の詳細は、後述する図8を参照して説明する。
ステップS15において、量子化部65は、直交変換処理の結果得られる変換係数を量子化する。この量子化に際しては、後述するステップS30の処理で説明されるように、レートが制御される。
以上のようにして量子化された変換係数は、次のようにして局部的に復号される。即ち、ステップS16において、逆量子化部68は、量子化部65により量子化された変換係数を、量子化部65の特性に対応する特性で逆量子化する。ステップS17において、逆直交変換部69は、逆量子化部68により逆量子化された変換係数に対して、直交変換部64による直交変換処理に対応する逆直交変換処理を行う。
具体的には、逆直交変換部69のインター予測用逆直交変換部69Aは、予測画像選択部76からインター予測モード情報が供給される場合、逆量子化部68から供給される変換係数に対して逆直交変換処理を行う。インター予測用逆直交変換部69Aは、その結果得られる残差情報を演算部70に供給する。
また、イントラ予測用逆直交変換部69Bは、予測画像選択部76からイントラ予測モード情報が供給される場合、逆量子化部68から供給される変換係数に対して逆直交変換処理を行う。この逆直交変換処理の詳細は、後述する図9を参照して説明する。
ステップS18において、演算部70は、逆直交変換部69から供給される残差情報を予測画像選択部76から供給される予測画像に加算し、局部的に復号された画像を生成する。そして、演算部70は、局部的に復号された画像を演算部70およびフレームメモリ72に供給する。
ステップS19において、デブロックフィルタ71は、演算部70から供給される局部的に復号された画像をフィルタリングすることにより、ブロック歪みを除去する。そして、デブロックフィルタ71は、その結果得られる画像をフレームメモリ72に供給する。
ステップS20において、フレームメモリ72は、デブロックフィルタ71から供給される画像、および、演算部70から供給されるデブロックフィルタ71によりフィルタリングされていない画像を、記憶する。
ステップS21において、イントラ予測部74は、イントラ予測処理を行う。具体的には、イントラ予測部74は、画面並べ替えバッファ62から読み出された画像と、スイッチ73を介してフレームメモリ72から供給された参照画像とに基づいて、候補となる全てのイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。
ステップS22において、イントラ予測部74は、候補となる全てのイントラ予測モードのコスト関数値を算出するイントラ予測コスト関数値算出処理を行う。このイントラ予測コスト関数値算出処理の詳細は、後述する図10を参照して説明する。
ステップS23において、動き予測・補償部75は、動き予測・補償処理を行う。具体的には、動き予測・補償部75は、画面並べ替えバッファ62から供給される画像とスイッチ73を介して供給される参照画像とに基づいて、候補となる全てのインター予測モードの動き予測行い、動きベクトルを生成する。そして、動き予測・補償部75は、動きベクトルに基づいて参照画像に対して補償処理を行い、予測画像を生成する。
ステップS24において、動き予測・補償部75は、候補となる全てのインター予測モードのコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測・補償部75は、インター予測モード情報、最適インター予測モードで生成された予測画像、および、対応するコスト関数値を予測画像選択部76に供給する。
ステップS25において、予測画像選択部76は、イントラ予測部74から供給される最適イントラ予測モードのコスト関数値が、動き予測・補償部75から供給される最適インター予測モードのコスト関数値より大きいかどうかを判定する。
ステップS25で最適イントラ予測モードのコスト関数値が最適インター予測モードのコスト関数値より大きいと判定された場合、処理はステップS26に進む。ステップS26において、予測画像選択部76は、最適イントラ予測モードを最適予測モードに決定し、最適イントラ予測モードの予測画像を選択する。そして、予測画像選択部76は、最適イントラ予測モードの予測画像を、演算部63および演算部70に供給する。この予測画像は、上述したステップS13およびS18の処理に利用される。また、予測画像選択部76は、イントラ予測モード情報を、直交変換部64と逆直交変換部69に供給し、最適イントラ予測モードの予測画像の選択をイントラ予測部74に通知する。イントラ予測部74は、この通知に応じて、イントラ予測モード情報を可逆符号化部66に供給する。そして、処理はステップS28に進む。
一方、ステップS25で最適イントラ予測モードのコスト関数値が最適インター予測モードのコスト関数値より大きくはないと判定された場合、処理はステップS27に進む。ステップS27において、予測画像選択部76は、最適インター予測モードを最適予測モードに決定し、最適インター予測モードの予測画像を選択する。そして、予測画像選択部76は、最適インター予測モードの予測画像を、演算部63および演算部70に供給する。この予測画像は、上述したステップS13およびS18の処理に利用される。また、予測画像選択部76は、インター予測モード情報を、直交変換部64と逆直交変換部69に供給し、インター予測モードの予測画像の選択を動き予測・補償部75に通知する。動き予測・補償部75は、この通知に応じて、インター予測モード情報、対応する動きベクトルの情報などを、可逆符号化部66に供給する。そして、処理はステップS28に進む。
ステップS28において、可逆符号化部66は、量子化部65から供給される量子化された変換係数を可逆符号化して圧縮画像を得る。なお、可逆符号化対象の変換係数の最適予測モードが最適イントラ予測モードである場合、可逆符号化は、図6で説明したような最適イントラ予測モードに応じた順序で行われる。また、可逆符号化部66は、イントラ予測モード情報、インター予測モード情報、動きベクトルの情報などを可逆符号化し、その結果得られる情報を圧縮画像に付加されるヘッダ情報とする。可逆符号化部66は、可逆符号化の結果得られるヘッダ情報が付加された圧縮画像を圧縮情報として蓄積バッファ67に供給する。
ステップS29において、蓄積バッファ67は、可逆符号化部66から供給される圧縮情報を蓄積する。蓄積バッファ67に蓄積された圧縮情報は適宜読み出され、伝送路を介して復号側に伝送される。
ステップS30において、レート制御部77は、蓄積バッファ67に蓄積された圧縮情報に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部65の量子化動作のレートを制御する。
図8は、図7のステップS14のイントラ予測用直交変換部64Bによる直交変換処理を説明するフローチャートである。
ステップS41において、イントラ予測用直交変換部64BのDWT部91(図3)は、演算部63(図1)から供給される残差情報のサイズが、KLT部92−0乃至92−8で処理可能なサイズであるかどうかを判定する。
ステップS41で、残差情報のサイズがKLT部92−0乃至92−8で処理可能なサイズではないと判定された場合、ステップS42において、DWT部91は、残差情報に対してDWTを行う。
ステップS43において、DWT部91は、ステップS42の処理の結果得られる低周波数成分のサイズが、KLT部92−0乃至92−8で処理可能なサイズであるかどうかを判定する。ステップS43で、DWTの結果得られる低周波数成分のサイズが、KLT部92−0乃至92−8で処理可能なサイズではないと判定された場合、ステップS44において、DWT部91は、ステップS42の処理の結果得られる低周波数成分に対してDWTを行う。そして、処理はステップS43に戻り、低周波数成分のサイズがKLT部92−0乃至92−8で処理可能なサイズになるまで、ステップS43およびS44の処理が繰り返される。
ステップS43で、DWTの結果得られる低周波数成分のサイズが、KLT部92−0乃至92−8で処理可能なサイズであると判定された場合、DWT部91は、DWTの結果得られる低周波数成分をKLT部92−0乃至92−8に供給し、高周波数成分をセレクタ93に供給する。
そして、ステップS45において、KLT部92−0乃至92−8は、それぞれ、対応するイントラ予測モードのKLTの基底で、低周波数成分に対して分離型のKLTを行う。
ステップS46において、セレクタ93は、イントラ予測モード情報に基づいて、KLT部92−0乃至92−8から供給される係数のうちの、最適イントラ予測モードに対応するKLT部92−0乃至92−8から供給される係数を選択し、量子化部65(図1)に出力する。
ステップS47において、セレクタ93は、DWT部91から供給される高周波数成分を量子化部65に出力する。
一方、ステップS41で残差情報のサイズが、KLT部92−0乃至92−8で処理可能なサイズであると判定された場合、DWT部91は、残差情報をそのままKLT部92−0乃至92−8に供給する。そして、ステップS48において、KLT部92−0乃至92−8は、それぞれ、対応するイントラ予測モードのKLTの基底で、残差情報に対して分離型のKLTを行う。
ステップS49において、セレクタ93は、イントラ予測モード情報に基づいて、KLT部92−0乃至92−8から供給される係数のうちの、最適イントラ予測モードに対応するKLT部92−0乃至92−8から供給される係数を選択し、量子化部65に出力する。
図9は、図7のステップS17のイントラ予測用逆直交変換部69Bの逆直交変換処理を説明するフローチャートである。
ステップS61において、イントラ予測用逆直交変換部69Bの逆KLT部101−0乃至101−8(図5)は、それぞれ、対応するイントラ予測モードのKLTの基底で、逆量子化部68(図1)から供給される変換係数のうちの係数に対して分離型の逆KLTを行う。
ステップS62において、セレクタ102は、予測画像選択部76からのイントラ予測モード情報に基づいて、逆KLT部101−0乃至101−8から供給される逆KLT後の成分のうちの、最適イントラ予測モードに対応する逆KLT部101−0乃至101−8から供給される逆KLT後の成分を選択する。そして、セレクタ102は、選択された逆KLT後の成分を逆DWT部103に供給する。
ステップS63において、逆DWT部103は、セレクタ102から供給される逆KLT後の成分のサイズがブロックサイズであるかどうかを判定する。ステップS63で逆KLT後の成分のサイズがブロックサイズではないと判定された場合、処理はステップS64に進む。ステップS64において、逆DWT部103は、逆KLT後の成分と逆量子化部68から供給される変換係数のうちの高周波数成分に対して逆DWTを行う。
ステップS65において、逆DWT部103は、ステップS64の処理の結果得られる逆DWT後の成分のサイズがブロックサイズであるかどうかを判定する。ステップS65で、逆DWT後の成分のサイズがブロックサイズではないと判定された場合、処理はステップS64に戻り、逆DWT後の成分のサイズがブロックサイズになるまで、ステップS64およびS65の処理が繰り返される。
ステップS65で逆DWT後の成分のサイズがブロックサイズであると判定された場合、処理はステップS66に進む。
一方、ステップS63で逆KLT後の成分のサイズがブロックサイズであると判定された場合、処理はステップS66に進む。
ステップS66において、逆DWT部103は、逆DWT後の成分または逆KLT後の成分を残差情報として演算部70(図1)に供給する。
図10は、図7のステップS22のイントラ予測コスト関数値算出処理を説明するフローチャートである。
ステップS81において、イントラ予測部74は、まだ処理の対象のブロックのブロックサイズ(以下、対象ブロックサイズという)に設定されていない、候補となるブロックサイズを対象ブロックサイズに設定する。ここで、候補となるブロックサイズは、4×4画素と8×8画素である。
ステップS82において、イントラ予測部74は、対象ブロックサイズのブロックIDXのうちの、また処理の対象のブロックのブロックIDX(以下、対象ブロックIDXという)に設定されていないブロックIDXを対象ブロックIDXに設定する。なお、ブロックIDXとは、ブロックサイズに応じてマクロブロックをブロックに分割したときの各ブロックを特定する情報である。例えば、マクロブロックが128×128であり、ブロックサイズが8×8である場合、ブロックIDXは、0乃至15の16個となる。
ステップS83において、イントラ予測部74は、イントラ予測モードの番号modeを0に設定する。
ステップS84において、イントラ予測部74は、番号modeのイントラ予測モードのコスト関数値を算出するコスト関数値算出処理を行う。このコスト関数値算出処理の詳細は、後述する図11で説明する。
ステップS85において、イントラ予測部74は、番号modeが、候補となるイントラ予測モードの数9より小さいかどうかを判定する。ステップS85で番号modeが9より小さいと判定された場合、即ちまだ対象ブロックIDXのブロックの全イントラ予測モードのコスト関数値が算出されていない場合、処理はステップS86に進む。
ステップS86において、イントラ予測部74は、番号modeを1だけインクリメントして、処理をステップS84に戻し、番号modeが9以上になるまで、ステップS84乃至S86の処理を繰り返す。
ステップS85で番号modeが9より小さくはないと判定された場合、即ち、対象ブロックIDXのブロックの全イントラ予測モードのコスト関数値が算出された場合、処理はステップS87に進む。ステップS87において、イントラ予測部74は、対象ブロックIDXのブロックの全イントラ予測モードのコスト関数値のうちの最小値に対応するイントラ予測モードを、対象ブロックIDXのブロックの最適イントラ予測モードに決定する。
ステップS88において、イントラ予測部74は、対象ブロックサイズの全てのブロックIDXが対象ブロックIDXとされたかどうかを判定する。ステップS88でまだ対象ブロックサイズの全てのブロックIDXが対象ブロックIDXとされていないと判定された場合、処理はステップS82に戻る。そして、対象ブロックサイズの全てのブロックIDXが対象ブロックIDXとされるまで、ステップS82乃至S88の処理が繰り返される。
ステップS88で対象ブロックサイズの全てのブロックIDXが対象ブロックIDXとされた場合、ステップS89において、イントラ予測部74は、全てのブロックサイズが対象ブロックサイズとされたかどうかを判定する。
ステップS89で全てのブロックサイズがまだ対象ブロックサイズとされたと判定されていない場合、処理はステップS81に戻り、全てのブロックサイズが対象ブロックサイズとされるまで、ステップS81乃至S89の処理が繰り返される。
ステップS89で全てのブロックサイズが対象ブロックサイズとされたと判定された場合、即ち、全ブロックサイズの全ブロックの最適イントラ予測モードが決定された場合、処理はステップS90に進む。
ステップS90において、イントラ予測部74は、全ブロックサイズの全ブロックの最適イントラ予測モードのコスト関数値に基づいて、マクロブロック単位でコスト関数値が最小となるイントラ予測モードを、最終的な最適イントラ予測モードに決定する。そして、イントラ予測部74は、その最適イントラ予測モードを示すイントラ予測モード情報、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を予測画像選択部76に供給する。そして、処理は図7のステップS22に戻り、ステップS23に進む。
図11は、図10のステップS84のコスト関数値算出処理を説明するフローチャートである。
ステップS111において、イントラ予測部74は、画面並べ替えバッファ62から供給される対象ブロックIDXに対応する画像から、対象ブロックIDXに対応する番号modeのイントラ予測モードの予測画像を減算し、残差情報を求める。
ステップS112において、イントラ予測部74は、残差情報に対して図8の直交変換処理を行う。
ステップS113において、イントラ予測部74は、直交変換処理の結果得られる変換係数を量子化する。
ステップS114において、イントラ予測部74は、量子化された変換係数のうちの係数を所定の順序で可逆符号化する。
ステップS115において、イントラ予測部74は、量子化された変換係数のうちの各高周波数成分(例えば、LH成分、HL成分、HH成分)を、番号modeのイントラ予測モードに応じた順序で可逆符号化する。なお、ステップS112の直交変換処理においてDWTが行われていない場合には、ステップS115の処理は省略される。
ステップS116において、イントラ予測部74は、ステップS113で得られた量子化された変換係数を逆量子化する。
ステップS117において、イントラ予測部74は、ステップS116で逆量子化された変換係数に対して、図9の逆直交変換処理を行う。
ステップS118において、イントラ予測部74は、ステップS117の処理の結果得られる残差情報を、対象ブロックIDXに対応する番号modeのイントラ予測モードの予測画像と加算する。
ステップS119において、イントラ予測部74は、ステップS118の処理の結果得られる復号画像、画面並べ替えバッファ62から供給される画像、およびステップS115の処理の発生符号量を用いて、上述した式(1)によりコスト関数値を算出する。このコスト関数値は、対象ブロックIDXのブロックの番号modeのイントラ予測モードのコスト関数値とされる。
以上のように、画像符号化装置51では、イントラ予測用直交変換部64Bが、分散型のKLTより演算量の少ないDWTを、分散型のKLTより前に行い、DWTの結果得られる低周波数成分に対してのみ分散型のKLTを行う。その結果、イントラ予測時の直交変換処理の演算量を削減し、ブロックサイズが大きい場合であっても、その演算量を少なくすることができる。また、逆直交変換処理時に、低周波数成分に対してのみ分散型の逆KLTを行い、逆KLTより演算量の少ない逆DWTを行えばよいので、逆直交変換処理の演算量も同様に削減することができる。
現在のAVC方式では、イントラ予測の最大ブロックサイズは16x16であるが、次世代規格においては、16x16 を超えるブロックサイズが採用される可能性が高い。従って、イントラ予測時の直交変換処理の演算量を削減することは、非常に有用である。直交変換処理の演算量の削減により、イントラ予測用直交変換部64Bがハードウェアで実現される場合、LSIの回路規模を削減し、製造コストを削減することができる。また、イントラ予測用直交変換部64Bがソフトウェアで実現される場合には、処理量を削減し、実時間での画像の再生をより確実に行うことができる。
[画像復号装置の構成例]
図12は、本発明を適用した画像復号装置の第1実施の形態の構成例を示すブロック図である。
画像復号装置151は、蓄積バッファ161、可逆復号部162、逆量子化部163、逆直交変換部164、演算部165、デブロックフィルタ166、画面並べ替えバッファ167、D/A変換部168、フレームメモリ169、スイッチ170、イントラ予測部171、動き補償部172、およびスイッチ173により構成されている。
蓄積バッファ161は、画像符号化装置51より伝送されてきた圧縮情報を蓄積する。可逆復号部162(復号手段)は、蓄積バッファ161から圧縮情報を読み出して取得し、その圧縮情報を図1の可逆符号化部66の可逆符号化方式に対応する方式で可逆復号する。
具体的には、可逆復号部162は、圧縮情報のうちのヘッダ情報を可逆復号し、イントラ予測モード情報、インター予測モード情報、動きベクトル情報などを取得する。また、可逆復号部162は、圧縮情報のうちの圧縮画像を可逆復号する。なお、イントラ予測モード情報が取得された場合、可逆復号部162は、そのイントラ予測モード情報が示す最適イントラ予測モードに応じた順序で、圧縮画像を可逆復号する。
また、可逆復号部162は、圧縮画像を可逆復号した結果得られる量子化された変換係数を逆量子化部163に供給する。可逆復号部162は、可逆復号の結果得られるイントラ予測モード情報を逆直交変換部164とイントラ予測部171に供給し、インター予測モード情報、動きベクトル情報などを動き補償部172に供給する。また、可逆復号部162は、インター予測モード情報を逆直交変換部164に供給する。
逆量子化部163は、図1の逆量子化部68と同様に構成され、可逆復号部16から供給される量子化された変換係数を、図1の逆量子化部65の量子化方式に対応する方式で逆量子化する。逆量子化部163は、逆量子化の結果得られる変換係数を逆直交変換部164に供給する。
逆直交変換部164は、図1の逆直交変換部69と同様に構成される。逆直交変換部164は、可逆復号部162から供給されるインター予測モード情報またはイントラ予測モード情報に応じて、逆量子化部163から供給される変換係数に対して逆直交変換処理を行う。逆直交変換部164は、逆直交変換処理の結果得られる残差情報を演算部165に供給する。
演算部165は、逆直交変換部164から供給される残差情報を、必要に応じて、スイッチ173から供給される予測画像と加算し、復号する。演算部165は、復号された画像をデブロックフィルタ166に供給する。
デブロックフィルタ166は、演算部165から供給される復号された画像をフィルタリングすることによりブロック歪を除去する。デブロックフィルタ166は、その結果得られる画像をフレームメモリ169に供給し、蓄積させるとともに、画面並べ替えバッファ167に出力する。
画面並べ替えバッファ167は、デブロックフィルタ166から供給される画像の並べ替えを行う。具体的には、図1の画面並べ替えバッファ62により符号化するための順番に並べ替えられた画像の順番が、元の表示の順番に並べ替えられる。D/A変換部168は、画面並べ替えバッファ167により並べ替えられた画像をD/A変換し、図示せぬディスプレイに出力し、表示させる。
スイッチ170は、フレームメモリ169に記憶されている画像を参照画像として読み出し、動き補償部172に出力するとともに、イントラ予測部171に供給する。
イントラ予測部171は、可逆復号部162から供給されるイントラ予測モード情報に基づいて、そのイントラ予測モード情報が示す最適イントラ予測モードのイントラ予測処理を行い、予測画像を生成する。イントラ予測部171は、予測画像をスイッチ173に出力する。
動き補償部172は、可逆復号部162から供給されるインター予測モード情報、動きベクトル情報などに基づいて、スイッチ170を介して供給される参照画像に動き補償処理を行い、予測画像を生成する。動き補償部172は、予測画像をスイッチ173に供給する。
スイッチ173は、動き補償部172またはイントラ予測部171により生成された予測画像を選択し、演算部165に供給する。
[画像復号装置の処理の説明]
図13は、画像復号装置151による復号処理を説明するフローチャートである。
ステップS131において、蓄積バッファ161は、画像符号化装置51より伝送されてきた圧縮情報を蓄積する。ステップS132において、可逆復号部162は、蓄積バッファ161から圧縮情報を読み出し、その圧縮情報に対して可逆復号処理を行う。イントラ予測モード情報が取得された場合の可逆復号処理の詳細は、後述する図14を参照して説明する。
また、可逆復号部162は、可逆復号処理の結果得られる量子化された変換係数を逆量子化部163に供給する。可逆復号部162は、可逆復号処理の結果得られるイントラ予測モード情報を逆直交変換部164とイントラ予測部171に供給し、インター予測モード情報、動きベクトル情報などを動き補償部172に供給する。また、可逆復号部162は、インター予測モード情報を逆直交変換部164に供給する。
ステップS133において、逆量子化部163は、可逆復号部162から供給される量子化された変換係数を、図1の量子化部65の特性に対応する特性で逆量子化する。逆量子化部163は、逆量子化の結果得られる変換係数を逆直交変換部164に供給する。
ステップS134において、逆直交変換部164は、逆量子化部163から供給される変換係数に対して、図7のステップS17の逆直交変換処理と同様の逆直交変換処理を行う。逆直交変換部164は、逆直交変換処理の結果得られる残差情報を、演算部165に供給する。
ステップS135において、演算部165は、後述するステップS141の処理により入力される予測画像を、必要に応じて、逆直交変換部164から供給される残差情報と加算し、復号する。演算部165は、復号された画像をデブロックフィルタ166に供給する。
ステップS136において、デブロックフィルタ166は、演算部165から供給される復号された画像をフィルタリングすることにより、ブロック歪みを除去する。デブロックフィルタ166は、その結果得られる画像をフレームメモリ169と画面並べ替えバッファ167に供給する。
ステップS137において、フレームメモリ169は、デブロックフィルタ166から供給される画像を記憶する。
ステップS138において、可逆復号部162は、圧縮情報に含まれる圧縮画像がインター予測された画像であるかどうか、即ち、インター予測モード情報が取得されたかどうかを判定する。
ステップS138で圧縮情報に含まれる圧縮画像がインター予測された画像であると判定された場合、可逆復号部162は、インター予測モード情報、動きベクトル情報などを動き補償部172に供給する。
そして、ステップS139において、動き補償部172は、可逆復号部162から供給されるインター予測モード情報、動きベクトル情報などに基づいて、スイッチ170を介して供給される参照画像に動き補償処理を行い、予測画像を生成する。動き補償部172は、予測画像をスイッチ173に供給する。
一方、ステップS138で圧縮情報に含まれる圧縮画像がインター予測された画像ではないと判定された場合、即ち、イントラ予測モード情報が取得されたと判定された場合、可逆復号部162は、イントラ予測モード情報をイントラ予測部171に供給する。
そして、ステップS140において、イントラ予測部171は、可逆復号部162から供給されるイントラ予測モード情報に基づいて、そのイントラ予測モード情報が示す最適イントラ予測モードのイントラ予測処理を行い、予測画像を生成する。イントラ予測部171は、予測画像をスイッチ173に出力する。
ステップS141において、スイッチ173は、動き補償部172またはイントラ予測部171から供給される予測画像を選択し、演算部165に出力する。この予測画像は、上述したように、ステップS135において逆直交変換部164の出力と加算される。
ステップS142において、画面並べ替えバッファ167は、デブロックフィルタ166から供給される画像の並べ替えを行う。
ステップS143において、D/A変換部168は、画面並べ替えバッファ167により並べ替えられた画像をD/A変換して、図示せぬディスプレイに出力し、表示させる。
図14は、図13のステップS132における、イントラ予測モード情報が取得された場合の可逆復号処理を説明するフローチャートである。
ステップS151において、可逆復号部162は、蓄積バッファ161から供給される圧縮情報のうちの、量子化され、可逆符号化された係数を可逆復号し、逆量子化部163に供給する。
ステップS152において、可逆復号部162は、圧縮情報のうちの、量子化され、可逆復号された各高周波数成分を、イントラ予測情報が示す最適イントラ予測モードに応じた順序で可逆復号し、逆量子化部163に供給する。なお、圧縮情報に高周波数成分が含まれていない場合には、ステップS152の処理は省略される。
以上のように、画像復号装置151は、符号化装置51により得られた圧縮情報を復号するので、低周波数成分に対してのみ分散型の逆KLTを行い、逆KLTより演算量の少ない逆DWTを行うことにより、逆直交変換処理を行うことができる。その結果、逆直交変換処理の演算量を削減し、ブロックサイズが大きい場合であっても、その演算量を少なくすることができる。
<第2実施の形態>
[画像符号化装置の構成例]
図15は、本発明を適用した画像符号化装置の第2実施の形態の構成例を示すブロック図である。
図15に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図15の画像符号化装置200の構成は、主に、直交変換部64の代わりに直交変換部201が設けられている点、逆直交変換部69の代わりに逆直交変換部202が設けられている点が図1の構成と異なる。画像符号化装置200は、イントラ予測用の直交変換処理において、全てのイントラ予測モードで分離型のKLTを行うのではなく、予測方向が斜め方向以外のイントラ予測モードでのみ分離型のKLTを行い、予測方向が斜め方向のイントラ予測モードでは非分離型のKLTを行う。
具体的には、直交変換部201は、インター予測用直交変換部64Aとイントラ予測用直交変換部201Bにより構成される。イントラ予測用直交変換部201Bは、予測画像選択部76からイントラ予測モード情報が供給される場合、演算部63からの残差情報に対して直交変換処理を行う。具体的には、イントラ予測用直交変換部201Bは、残差情報に対してDWTを行い、低周波数成分および高周波数成分を抽出する。なお、イントラ予測用直交変換部201Bは、イントラ予測モードの予測方向が斜め方向であるか、斜め方向以外の方向であるかによって、DWTの回数を異なるようにすることができる。
イントラ予測用直交変換部201Bは、イントラ予測モードの予測方向が斜め方向である場合、低周波数成分に対して、イントラ予測モード情報ごとの非分離型のKLTを施す。一方、イントラ予測用直交変換部201Bは、イントラ予測モードの予測方向が斜め方向以外の方向である場合、低周波数成分に対して、イントラ予測モード情報ごとの分離型のKLTを施す。イントラ予測用直交変換部201Bは、イントラ予測モード情報が示す最適イントラ予測モードのKLTの結果得られる係数と高周波数成分を、変換係数として量子化部65に供給する。
逆直交変換部202は、インター予測用逆直交変換部69Aとイントラ予測用逆直交変換部202Bにより構成される。イントラ予測用逆直交変換部202Bは、予測画像選択部76からイントラ予測モード情報が供給される場合、逆量子化部68から供給される変換係数に対して、逆直交変換処理を行う。具体的には、イントラ予測用逆直交変換部202Bは、イントラ予測モードの予測方向が斜め方向である場合、変換係数のうちの低周波数成分の係数に対してイントラ予測モードごとの非分離型の逆KLTを行う。一方、イントラ予測モードの予測方向が斜め方向以外の方向である場合、イントラ予測用逆直交変換部202Bは、変換係数のうちの低周波数成分の係数に対してイントラ予測モードごとの分離型の逆KLTを行う。
また、イントラ予測用逆直交変換部202Bは、イントラ予測モード情報が示す最適イントラ予測モードの逆KLTの結果得られる低周波数成分と、変換係数のうちの高周波数成分に対して、逆DWTを行い、残差情報を得る。なお、イントラ予測用逆直交変換部202Bは、最適イントラ予測モードの予測方向が斜め方向であるか、斜め方向以外の方向であるかによって、逆DWTの回数を異なるようにすることができる。イントラ予測用逆直交変換部202Bは、残差情報を演算部70に供給する。
[イントラ予測用直交変換部の詳細構成例]
図16は、図15のイントラ予測用直交変換部201Bの詳細構成例を示すブロック図である。
図16に示す構成のうち、図3の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図16のイントラ予測用直交変換部201Bの構成は、主に、DWT部221が新たに設けられている点、KLT部92−3乃至92−8の代わりにKLT部222−3乃至222−8が設けられている点、セレクタ93の代わりにセレクタ223が設けられている点が、図3の構成と異なる。
図16のイントラ予測用直交変換部201Bにおいて、DWT部91は、0乃至2番のイントラ予測モード用のDWT部であり、DWT部91から出力される低周波数成分は、KLT部92−0乃至92−2にのみ供給される。
DWT部221は、3乃至8番のイントラ予測モード用のDWT部である。DWT部221(前直交変換手段)は、必要に応じて、演算部63(図15)から供給される残差情報に対してDWTを行い、低周波数成分と高周波成分を得る。なお、DWT部221によるDWTの回数は、DWT部91によるDWTの回数と同一であってもよいし、異なっていてもよい。但し、KLT部222−3乃至222−8で行われる非分離型のKLTは、KLT部92−0乃至92−2で行われる分離型のKLTに比べて演算量が多いため、両方のKLT部で処理可能な演算量が同一である場合、DWT部221は、DWT部91に比べてDWTの回数を多くする必要がある。
DWT部221は、低周波数成分をKLT部222−3乃至222−8に供給し、高周波数成分をセレクタ223に供給する。また、DWT部221は、KLTを行う必要がない場合、残差情報をそのままKLT部222−3乃至222−8に供給する。
KLT部222−3乃至222−8(後直交変換手段)は、それぞれ、3番乃至8番のイントラ予測モードのKLTの基底で、DWT部221から供給される低周波数成分または残差情報に対して非分離型のKLTを行う。なお、各イントラ予測モードのKLTの基底は、予め学習により求められた最適値である。KLT部222−3乃至222−8は、非分離型のKLTの結果得られる係数をセレクタ223に供給する。
セレクタ223には、予測画像選択部76から供給されるイントラ予測モード情報が供給される。セレクタ223は、イントラ予測モード情報に基づいて、KLT部92−0乃至92−2およびKLT部222−3乃至222−8から供給される係数のうちの、最適イントラ予測モードに対応するKLT部92−0乃至92−2またはKLT部222−3乃至222−8から供給される係数を選択する。そして、セレクタ223は、選択された残差情報の係数を量子化部65(図15)に供給する。または、セレクタ223は、低周波数成分の係数と、最適イントラ予測モードに対応するDWT部91またはDWT部221から供給される高周波数成分を変換係数として量子化部65に供給する。
以上のように、イントラ予測用直交変換部201Bは、予測方向が斜め方向である3乃至8番のイントラ予測モードに対応するKLTとして非分離型のKLTを行うので、符号化効率を向上させることができる。
具体的には、分離型のKLTでは、水平方向と垂直方向に分離してKLTが行われるので、非分離型のKLTに比べてKLTの基底に制約が加わり、性能が劣化する。特に、イントラ予測モードの予測方向が斜め方向である場合、斜め方向の相関が強い残差情報が発生しやすいが、分離型のKLTでは、斜め方向の相関が考慮されにくいため、性能が劣化する。これに対して、イントラ予測用直交変換部201Bは、予測方向が斜め方向であるイントラ予測モードに対応するKLTとして非分離型のKLTを行うので、斜め方向の相関が考慮され、性能が向上する。その結果、符号化効率が向上する。
なお、予測方向が斜め方向以外の方向、即ち水平方向や垂直方向であるイントラ予測モード時には、水平方向や垂直方向に相関が強い残差情報が発生しやすいため、分離型のKLTであっても、十分な符号化効率を実現することができる。従って、イントラ予測用直交変換部201Bは、予測方向が斜め方向以外のイントラ予測モードである場合には、分離型のKLTを行うことにより演算量を削減する。
図16のイントラ予測用直交変換部201Bでは、セレクタ223がKLT部92−0乃至92−2およびKLT部222−3乃至222−8の後に設けられたが、セレクタが、KLT部92−0乃至92−2およびKLT部222−3乃至222−8の前に設けられるようにしてもよい。この場合、DWT部91またはDWT部221から出力される低周波数成分または残差情報が、最適イントラ予測モードに対応するKLT部92−0乃至92−2およびKLT部222−3乃至222−8のいずれかにのみ供給される。
[DWTの説明]
図17は、DWT部221によるDWTを説明する図である。
図17の例では、DWT部221は、DWTを3回行っている。図17A乃至図17Cは、図4A乃至図4Cと同一であるので、説明は省略する。
図17Dに示すように、図17Cに示すLLLL成分に対して水平方向および垂直方向にDWTが行われると、LLLL成分の水平成分および垂直成分が、さらに、それぞれ、高周波数成分と低周波数成分に分割される。その結果、LLLL成分は、水平成分および垂直成分が低周波数成分である成分(LLLLLL成分)、水平成分が高周波数成分で、垂直成分が低周波数成分である成分(LLLLHL成分)、水平成分が低周波数成分で、垂直成分が高周波数成分である成分(LLLLLH成分)、および、水平成分および垂直成分が高周波数成分である成分(LLLLHH成分)に分割される。なお、残差情報のLLLL成分以外の成分であるHL成分、LH成分、HH成分、LLHL成分、LLLH成分、LLHH成分は、そのままである。
例えば、DWT部91が、図4に示したようにDWTを2回行う場合、DWT部221は、図17に示すようにDWTを3回行い、KLTの対象となる低周波数成分のサイズをより小さくする。
[イントラ予測用逆直交変換部の詳細構成例]
図18は、図15のイントラ予測用逆直交変換部202Bの詳細構成例を示すブロック図である。
図18に示す構成のうち、図5の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図18のイントラ予測用逆直交変換部202Bの構成は、主に、逆KLT部101−3乃至101−8の代わりに逆KLT部241−3乃至241−8が設けられている点、セレクタ102の代わりにセレクタ242とセレクタ243が設けられている点、および逆DWT部244が新たに設けられている点が図5の構成と異なる。
図18のイントラ予測用逆直交変換部202Bの逆KLT部241−3乃至241−8は、それぞれ、3番乃至8番のイントラ予測モードの逆KLTの基底で、図15の逆量子化部68から供給される変換係数のうちの係数に対して非分離型の逆KLTを行う。
セレクタ242には、予測画像選択部76から供給されるイントラ予測モード情報が供給される。セレクタ242は、イントラ予測モード情報に基づいて、逆KLT部101−0乃至101−2から供給される逆KLT後の成分のうちの、最適イントラ予測モードに対応する逆KLT部101−0乃至101−2から供給される逆KLT後の成分を選択する。そして、セレクタ242は、選択された逆KLT後の成分を逆DWT部103に供給する。
セレクタ243には、予測画像選択部76から供給されるイントラ予測モード情報が供給される。セレクタ243は、イントラ予測モード情報に基づいて、逆KLT部241−3乃至241−8から供給される逆KLT後の成分のうちの、最適イントラ予測モードに対応する逆KLT部241−3乃至241−8から供給される逆KLT後の成分を選択する。そして、セレクタ243は、選択された逆KLT後の成分を逆DWT部244に供給する。
イントラ予測用逆直交変換部202Bにおいて、逆DWT部103は、0乃至2番のイントラ予測モード用の逆DWT部であり、逆DWT部103には、逆KLT部101−0乃至101−2のいずれかにより得られた成分がセレクタ242を介して供給される。
逆DWT部244は、3乃至8番のイントラ予測モード用の逆DWT部である。逆DWT部244は、逆KLT部241−3乃至241−8からセレクタ243を介して供給される成分を残差情報として演算部70(図15)に供給する。または、逆DWT部244は、セレクタ243から供給される成分と、逆量子化部68から供給される変換係数のうちの高周波数成分とに対して、DWT部221によるDWTに対応する逆DWTを行い、その結果得られる成分を残差情報として演算部70に供給する。
なお、図18のイントラ予測用逆直交変換部202Bでは、セレクタ242およびセレクタ243が逆KLT部101−0乃至101−2および逆KLT部241−3乃至241−8の後に設けられたが、セレクタが、逆KLT部101−0乃至101−2および逆KLT部241−3乃至241−8の前に設けられるようにしてもよい。この場合、逆量子化部68から供給される変換係数のうちの係数が、最適イントラ予測モードに対応する逆KLT部101−0乃至101−2および逆KLT部241−3乃至241−8のいずれかにのみ供給される。
[画像符号化装置の処理の説明]
図15の画像符号化装置200の符号化処理は、図7のステップS14におけるイントラ予測用直交変換部64Bによる直交変換処理、および、ステップS17におけるイントラ予測用逆直交変換部69Bによる逆直交変換処理を除いて、図7の符号化処理と同様である。従って、この直交変換処理と逆直交変換処理についてのみ説明する。
図19は、画像符号化装置200のイントラ予測用直交変換部201Bによる直交変換処理を説明するフローチャートである。
図19のステップS241乃至S246の処理は、ステップS245およびS246の処理をKLT部92−0乃至92−2が行うことを除いて、図8のステップS41乃至S44およびS48と同様である。
ステップS245またはステップS246の処理後、ステップS247において、イントラ予測用直交変換部201BのDWT部221(図16)は、演算部63(図15)から供給される残差情報のサイズが、KLT部222−3乃至222−8で処理可能なサイズであるかどうかを判定する。
ステップS247で、残差情報のサイズがKLT部222−3乃至222−8で処理可能なサイズではないと判定された場合、ステップS248において、DWT部221は、残差情報に対してDWTを行う。
ステップS249において、DWT部221は、ステップS248の処理の結果得られる低周波数成分のサイズが、KLT部222−3乃至222−8で処理可能なサイズであるかどうかを判定する。ステップS249で、DWTの結果得られる低周波数成分のサイズが、KLT部222−3乃至222−8で処理可能なサイズではないと判定された場合、ステップS250において、DWT部221は、ステップS248の処理の結果得られる低周波数成分に対してDWTを行う。そして、処理はステップS249に戻り、低周波数成分のサイズがKLT部222−3乃至222−8で処理可能なサイズになるまで、ステップS249およびS250の処理が繰り返される。
ステップS249で、DWTの結果得られる低周波数成分のサイズが、KLT部222−3乃至222−8で処理可能なサイズであると判定された場合、DWT部221は、DWTの結果得られる低周波数成分をKLT部222−3乃至222−8に供給し、高周波数成分をセレクタ223に供給する。
そして、ステップS252において、KLT部222−3乃至222−8は、それぞれ、対応するイントラ予測モードのKLTの基底で、低周波数成分に対して非分離型のKLTを行う。そして、処理はステップS253に進む。
一方、ステップS247で残差情報のサイズが、KLT部222−3乃至222−8で処理可能なサイズであると判定された場合、DWT部221は、残差情報をそのままKLT部222−3乃至222−8に供給する。そして、ステップS251において、KLT部222−3乃至222−8は、それぞれ、対応するイントラ予測モードのKLTの基底で、残差情報に対して非分離型のKLTを行い、処理をステップS253に進める。
ステップS253において、セレクタ223は、図8のステップS46の処理と同様に、イントラ予測モード情報に基づいて、KLT部92−0乃至92−2およびKLT部222−3乃至222−8から供給される係数のうちの、最適イントラ予測モードに対応するKLT部92−0乃至92−2またはKLT部222−3乃至222−8から供給される係数を選択し、量子化部65(図15)に出力する。
ステップS254において、セレクタ223は、最適イントラ予測モードに対応するDWT部91またはDWT部221がDWTを行ったかどうか、即ち最適イントラ予測モードに対応するDWT部91またはDWT部221から高周波数成分が供給されたかどうかを判定する。
ステップS254で最適イントラ予測モードに対応するDWT部91またはDWT部221がDWTを行ったと判定された場合、処理はステップS255に進む。ステップS255において、セレクタ223は、最適イントラ予測モードに対応するDWT部91またはDWT部221から供給される高周波数成分をそのまま量子化部65(図15)に出力し、処理を終了する。
一方、ステップS254で最適イントラ予測モードに対応するDWT部91またはDWT部221がDWTを行っていないと判定された場合、そのまま処理は終了する。
図20は、画像符号化装置200のイントラ予測用逆直交変換部202Bの逆直交変換処理を説明するフローチャートである。
ステップS261において、イントラ予測用逆直交変換部202Bの逆KLT部101−0乃至101−2(図18)は、それぞれ、0番乃至2番のイントラ予測モードのKLTの基底で、逆量子化部68(図15)から供給される変換係数のうちの係数に対して分離型の逆KLTを行う。
ステップS262において、逆KLT部241−3乃至241−8は、それぞれ、3番乃至8番のイントラ予測モードのKLTの基底で、逆量子化部68から供給される変換係数のうちの係数に対して非分離型の逆KLTを行う。
ステップS263において、セレクタ242およびセレクタ243は、それぞれ、予測画像選択部76からのイントラ予測モード情報に基づいて、逆KLT部101−0乃至101−2または逆KLT部241−3乃至241−8から供給される逆KLT後の成分のうちの、最適イントラ予測モードに対応する逆KLT部101−0乃至101−2または逆KLT部241−3乃至241−8から供給される逆KLT後の成分を選択する。そして、セレクタ242およびセレクタ243は、選択された逆KLT後の成分を逆DWT部103または逆DWT部244に供給し、処理をステップS264に進める。以降の処理は、逆KLT後の成分が供給された逆DWT部103または逆DWT部244により行われる。
ステップS264において、逆DWT部103または逆DWT部244は、セレクタ242またはセレクタ243から供給される逆KLT後の成分のサイズがブロックサイズであるかどうかを判定する。ステップS264で、逆KLT後の成分のサイズがブロックサイズではないと判定された場合、処理はステップS265に進む。ステップS265において、逆DWT部103は、逆KLT後の成分と逆量子化部68から供給される変換係数のうちの高周波数成分に対して逆DWTを行う。
ステップS266において、逆DWT部103または逆DWT部244は、ステップS264の処理の結果得られる逆DWT後の成分のサイズがブロックサイズであるかどうかを判定する。ステップS265で、逆DWT後の成分のサイズがブロックサイズではないと判定された場合、処理はステップS265に戻り、逆DWT後の成分のサイズがブロックサイズになるまで、ステップS265およびS266の処理が繰り返される。
ステップS266で逆DWT後の成分のサイズがブロックサイズであると判定された場合、処理はステップS267に進む。
一方、ステップS264で逆KLT後の成分のサイズがブロックサイズであると判定された場合、処理はステップS267に進む。
ステップS267において、逆DWT部103または逆DWT部244は、逆DWT後の成分または逆KLT後の成分を残差情報として演算部70に供給する。
[画像復号装置の構成例]
図21は、本発明を適用した画像復号装置の第2実施の形態の構成例を示すブロック図である。
図21に示す構成のうち、図12の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図21の画像復号装置300の構成は、主に、逆直交変換部164の代わりに逆直交変換部301が設けられている点が図12の構成と異なる。
画像復号装置300の逆直交変換部301は、図15の逆直交変換部202と同様に構成される。逆直交変換部301は、可逆復号部162から供給されるインター予測モード情報またはイントラ予測モード情報に応じて、逆量子化部163から供給される変換係数に対して逆直交変換処理を行う。逆直交変換部301は、逆直交変換処理の結果得られる残差情報を演算部165に供給する。
[画像復号装置の処理の説明]
図21の画像復号装置300の復号処理は、図13のステップS134の逆直交変換処理を除いて、図13の復号処理と同様であるので、その逆直交変換処理以外の処理についての説明は省略する。画像復号装置300の逆直交変換処理では、可逆復号部162からイントラ予測情報が供給される場合、図20の逆直交変換処理と同様の逆直交変換処理が行われ、インター予測情報が供給される場合、逆量子化部163から供給される変換係数に対して逆直交変換が行われる。
なお、上述した説明では、3乃至8番のイントラ予測モードの予測方向は、斜め方向として扱われたが、5番および7番のイントラ予測モードの予測方向は垂直方向として、6番および8番のイントラ予測モードの予測方向は水平方向として、それぞれ扱われるようにしてもよい。
また、上述した説明では、イントラ予測のブロックサイズとして、4×4画素と8×8画素の2種類が扱われたが、16×16画素、32×32画素、64×64画素、128×128画素などの他のブロックサイズが扱われるようにしてもよい。但し、この場合、イントラ予測モードの数が異なるため、KLT部や逆KLT部の数も異なる。例えば、ブロックサイズが16×16画素である場合、イントラ予測モードの種類は4種類であり、KLT部や逆KLT部の数は4つとなる。
さらに、上述した説明では、KLTの前にDWTが行われたが、KLTの前に行われる直交変換は、KLTより演算量の少ない、例えば高速アルゴリズムが用意可能な直交変換であればどのようなものであってもよい。
また、本発明において、マクロブロックの大きさは任意である。本発明は、例えば図22に示すようなあらゆる大きさのマクロブロックに対して適用することができる。例えば、本発明は、通常の16×16画素のようなマクロブロックだけでなく、32×32画素のような拡張されたマクロブロック(拡張マクロブロック)にも適用することができる。
<第3実施の形態>
[本発明を適用したコンピュータの説明]
次に、上述した符号化処理や復号処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。符号化処理や復号処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図23は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部408やROM(Read Only Memory)402に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブルメディア411に格納(記録)しておくことができる。このようなリムーバブルメディア411は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア411としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブルメディア411からドライブ410を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部408にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、デジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)401を内蔵しており、CPU401には、バス404を介して、入出力インタフェース405が接続されている。
CPU401は、入出力インタフェース405を介して、ユーザによって、入力部406が操作等されることにより指令が入力されると、それに従って、ROM402に格納されているプログラムを実行する。あるいは、CPU401は、記憶部408に格納されたプログラムを、RAM(Random Access Memory)403にロードして実行する。
これにより、CPU401は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU401は、その処理結果を、必要に応じて、例えば、入出力インタフェース405を介して、出力部407から出力、あるいは、通信部409から送信、さらには、記憶部408に記録等させる。
なお、入力部406は、キーボードや、マウス、マイク等で構成される。また、出力部407は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
<第4実施の形態>
[テレビジョン受像機の構成例]
図24は、本発明を適用した画像復号装置を用いるテレビジョン受像機の主な構成例を示すブロック図である。
図24に示されるテレビジョン受像機500は、地上波チューナ513、ビデオデコーダ515、映像信号処理回路518、グラフィック生成回路519、パネル駆動回路520、および表示パネル521を有する。
地上波チューナ513は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ515に供給する。ビデオデコーダ515は、地上波チューナ513から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路518に供給する。
映像信号処理回路518は、ビデオデコーダ515から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路519に供給する。
グラフィック生成回路519は、表示パネル521に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路520に供給する。また、グラフィック生成回路519は、項目の選択などにユーザにより利用される画面を表示するための映像データ(グラフィック)を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路520に供給するといった処理も適宜行う。
パネル駆動回路520は、グラフィック生成回路519から供給されたデータに基づいて表示パネル521を駆動し、番組の映像や上述した各種の画面を表示パネル521に表示させる。
表示パネル521はLCD(Liquid Crystal Display)などよりなり、パネル駆動回路520による制御に従って番組の映像などを表示させる。
また、テレビジョン受像機500は、音声A/D(Analog/Digital)変換回路514、音声信号処理回路522、エコーキャンセル/音声合成回路523、音声増幅回路524、およびスピーカ525も有する。
地上波チューナ513は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ513は、取得した音声信号を音声A/D変換回路514に供給する。
音声A/D変換回路514は、地上波チューナ513から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路522に供給する。
音声信号処理回路522は、音声A/D変換回路514から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル/音声合成回路523に供給する。
エコーキャンセル/音声合成回路523は、音声信号処理回路522から供給された音声データを音声増幅回路524に供給する。
音声増幅回路524は、エコーキャンセル/音声合成回路523から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ525から出力させる。
さらに、テレビジョン受像機500は、デジタルチューナ516およびMPEGデコーダ517も有する。
デジタルチューナ516は、デジタル放送(地上デジタル放送、BS(Broadcasting Satellite)/CS(Communications Satellite)デジタル放送)の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS(Moving Picture Experts Group-Transport Stream)を取得し、それをMPEGデコーダ517に供給する。
MPEGデコーダ517は、デジタルチューナ516から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象(視聴対象)になっている番組のデータを含むストリームを抽出する。MPEGデコーダ517は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路522に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路518に供給する。また、MPEGデコーダ517は、MPEG-TSから抽出したEPG(Electronic Program Guide)データを図示せぬ経路を介してCPU532に供給する。
テレビジョン受像機500は、このように映像パケットをデコードするMPEGデコーダ517として、上述した画像復号装置151(300)を用いる。したがって、MPEGデコーダ517では、画像復号装置151(300)の場合と同様に、少ない演算量で逆直交変換処理を行うことができる。
MPEGデコーダ517から供給された映像データは、ビデオデコーダ515から供給された映像データの場合と同様に、映像信号処理回路518において所定の処理が施される。そして、所定の処理が施された映像データは、グラフィック生成回路519において、生成された映像データ等が適宜重畳され、パネル駆動回路520を介して表示パネル521に供給され、その画像が表示される。
MPEGデコーダ517から供給された音声データは、音声A/D変換回路514から供給された音声データの場合と同様に、音声信号処理回路522において所定の処理が施される。そして、所定の処理が施された音声データは、エコーキャンセル/音声合成回路523を介して音声増幅回路524に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ525から出力される。
また、テレビジョン受像機500は、マイクロホン526、およびA/D変換回路527も有する。
A/D変換回路527は、音声会話用のものとしてテレビジョン受像機500に設けられるマイクロホン526により取り込まれたユーザの音声の信号を受信する。A/D変換回路527は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル/音声合成回路523に供給する。
エコーキャンセル/音声合成回路523は、テレビジョン受像機500のユーザ(ユーザA)の音声のデータがA/D変換回路527から供給されている場合、ユーザAの音声データを対象としてエコーキャンセルを行う。そして、エコーキャンセル/音声合成回路523は、エコーキャンセルの後、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路524を介してスピーカ525より出力させる。
さらに、テレビジョン受像機500は、音声コーデック528、内部バス529、SDRAM(Synchronous Dynamic Random Access Memory)530、フラッシュメモリ531、CPU532、USB(Universal Serial Bus) I/F533、およびネットワークI/F534も有する。
A/D変換回路527は、音声会話用のものとしてテレビジョン受像機500に設けられるマイクロホン526により取り込まれたユーザの音声の信号を受信する。A/D変換回路527は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック528に供給する。
音声コーデック528は、A/D変換回路527から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス529を介してネットワークI/F534に供給する。
ネットワークI/F534は、ネットワーク端子535に装着されたケーブルを介してネットワークに接続される。ネットワークI/F534は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック528から供給された音声データを送信する。また、ネットワークI/F534は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子535を介して受信し、それを、内部バス529を介して音声コーデック528に供給する。
音声コーデック528は、ネットワークI/F534から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル/音声合成回路523に供給する。
エコーキャンセル/音声合成回路523は、音声コーデック528から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路524を介してスピーカ525より出力させる。
SDRAM530は、CPU532が処理を行う上で必要な各種のデータを記憶する。
フラッシュメモリ531は、CPU532により実行されるプログラムを記憶する。フラッシュメモリ531に記憶されているプログラムは、テレビジョン受像機500の起動時などの所定のタイミングでCPU532により読み出される。フラッシュメモリ531には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。
例えば、フラッシュメモリ531には、CPU532の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ531は、例えばCPU532の制御により、そのMPEG-TSを、内部バス529を介してMPEGデコーダ517に供給する。
MPEGデコーダ517は、デジタルチューナ516から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機500は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ517を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。
また、テレビジョン受像機500は、リモートコントローラ551から送信される赤外線信号を受光する受光部537も有する。
受光部537は、リモートコントローラ551からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU532に出力する。
CPU532は、フラッシュメモリ531に記憶されているプログラムを実行し、受光部537から供給される制御コードなどに応じてテレビジョン受像機500の全体の動作を制御する。CPU532とテレビジョン受像機500の各部は、図示せぬ経路を介して接続されている。
USB I/F533は、USB端子536に装着されたUSBケーブルを介して接続される、テレビジョン受像機500の外部の機器との間でデータの送受信を行う。ネットワークI/F534は、ネットワーク端子535に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。
テレビジョン受像機500は、MPEGデコーダ517として画像復号装置151(300)を用いることにより、逆直交変換処理の演算量を削減することができる。その結果として、テレビジョン受像機500は、アンテナを介して受信した放送波信号や、ネットワークを介して取得したコンテンツデータから、より少ない演算量で復号画像を得て、表示することができる。
<第5実施の形態>
[携帯電話機の構成例]
図25は、本発明を適用した画像符号化装置および画像復号装置を用いる携帯電話機の主な構成例を示すブロック図である。
図25に示される携帯電話機600は、各部を統括的に制御するようになされた主制御部650、電源回路部651、操作入力制御部652、画像エンコーダ653、カメラI/F部654、LCD制御部655、画像デコーダ656、多重分離部657、記録再生部662、変復調回路部658、および音声コーデック659を有する。これらは、バス660を介して互いに接続されている。
また、携帯電話機600は、操作キー619、CCD(Charge Coupled Devices)カメラ616、液晶ディスプレイ618、記憶部623、送受信回路部663、アンテナ614、マイクロホン(マイク)621、およびスピーカ617を有する。
電源回路部651は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機600を動作可能な状態に起動する。
携帯電話機600は、CPU、ROMおよびRAM等でなる主制御部650の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。
例えば、音声通話モードにおいて、携帯電話機600は、マイクロホン(マイク)621で集音した音声信号を、音声コーデック659によってデジタル音声データに変換し、これを変復調回路部658でスペクトラム拡散処理し、送受信回路部663でデジタルアナログ変換処理および周波数変換処理する。携帯電話機600は、その変換処理により得られた送信用信号を、アンテナ614を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号(音声信号)は、公衆電話回線網を介して通話相手の携帯電話機に供給される。
また、例えば、音声通話モードにおいて、携帯電話機600は、アンテナ614で受信した受信信号を送受信回路部663で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部658でスペクトラム逆拡散処理し、音声コーデック659によってアナログ音声信号に変換する。携帯電話機600は、その変換して得られたアナログ音声信号をスピーカ617から出力する。
更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機600は、操作キー619の操作によって入力された電子メールのテキストデータを、操作入力制御部652において受け付ける。携帯電話機600は、そのテキストデータを主制御部650において処理し、LCD制御部655を介して、画像として液晶ディスプレイ618に表示させる。
また、携帯電話機600は、主制御部650において、操作入力制御部652が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機600は、その電子メールデータを、変復調回路部658でスペクトラム拡散処理し、送受信回路部663でデジタルアナログ変換処理および周波数変換処理する。携帯電話機600は、その変換処理により得られた送信用信号を、アンテナ614を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号(電子メール)は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。
また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機600は、基地局から送信された信号を、アンテナ614を介して送受信回路部663で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機600は、その受信信号を変復調回路部658でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機600は、復元された電子メールデータを、LCD制御部655を介して液晶ディスプレイ618に表示する。
なお、携帯電話機600は、受信した電子メールデータを、記録再生部662を介して、記憶部623に記録する(記憶させる)ことも可能である。
この記憶部623は、書き換え可能な任意の記憶媒体である。記憶部623は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。
さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機600は、撮像によりCCDカメラ616で画像データを生成する。CCDカメラ616は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。その画像データを、カメラI/F部654を介して、画像エンコーダ653で、例えばMPEG2やMPEG4等の所定の符号化方式によって圧縮符号化することにより符号化画像データに変換する。
携帯電話機600は、このような処理を行う画像エンコーダ653として、上述した画像符号化装置51(200)を用いる。したがって、画像エンコーダ653は、画像符号化装置51(200)の場合と同様に、より少ない演算量で直交変換処理および逆直交変換処理を行うことができる。
なお、携帯電話機600は、このとき同時に、CCDカメラ616で撮像中にマイクロホン(マイク)621で集音した音声を、音声コーデック659においてアナログデジタル変換し、さらに符号化する。
携帯電話機600は、多重分離部657において、画像エンコーダ653から供給された符号化画像データと、音声コーデック659から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機600は、その結果得られる多重化データを、変復調回路部658でスペクトラム拡散処理し、送受信回路部663でデジタルアナログ変換処理および周波数変換処理する。携帯電話機600は、その変換処理により得られた送信用信号を、アンテナ614を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号(画像データ)は、ネットワーク等を介して、通信相手に供給される。
なお、画像データを送信しない場合、携帯電話機600は、CCDカメラ616で生成した画像データを、画像エンコーダ653を介さずに、LCD制御部655を介して液晶ディスプレイ618に表示させることもできる。
また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機600は、基地局から送信された信号を、アンテナ614を介して送受信回路部663で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機600は、その受信信号を変復調回路部658でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機600は、多重分離部657において、その多重化データを分離して、符号化画像データと音声データとに分ける。
携帯電話機600は、画像デコーダ656において、符号化画像データを、MPEG2やMPEG4等の所定の符号化方式に対応した復号方式でデコードすることにより、再生動画像データを生成し、これを、LCD制御部655を介して液晶ディスプレイ618に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ618に表示される。
携帯電話機600は、このような処理を行う画像デコーダ656として、上述した画像復号装置151(300)を用いる。したがって、画像デコーダ656は、画像復号装置151(300)の場合と同様に、より少ない演算量で逆直交変換処理を行うことができる。
このとき、携帯電話機600は、同時に、音声コーデック659において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ617より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。
なお、電子メールの場合と同様に、携帯電話機600は、受信した簡易ホームページ等にリンクされたデータを、記録再生部662を介して、記憶部623に記録する(記憶させる)ことも可能である。
また、携帯電話機600は、主制御部650において、撮像されてCCDカメラ616で得られた2次元コードを解析し、2次元コードに記録された情報を取得することができる。
さらに、携帯電話機600は、赤外線通信部681で赤外線により外部の機器と通信することができる。
携帯電話機600は、画像エンコーダ653として画像符号化装置51(200)を用いることにより、より少ない演算量で直交変換処理および逆直交変換処理を行うことができる。結果として、携帯電話機600は、より少ない演算量で復号可能な符号化データ(画像データ)を、他の装置に提供することができる。
また、携帯電話機600は、画像デコーダ656として画像復号装置151(300)を用いることにより、より少ない演算量で逆直交変換処理を行うことができる。その結果として、携帯電話機600は、例えば、簡易ホームページにリンクされた動画像ファイルから、より少ない演算量で復号画像を得て、表示することができる。
なお、以上において、携帯電話機600が、CCDカメラ616を用いるように説明したが、このCCDカメラ616の代わりに、CMOS(Complementary Metal Oxide Semiconductor)を用いたイメージセンサ(CMOSイメージセンサ)を用いるようにしてもよい。この場合も、携帯電話機600は、CCDカメラ616を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。
また、以上においては携帯電話機600として説明したが、例えば、PDA(Personal Digital Assistants)、スマートフォン、UMPC(Ultra Mobile Personal Computer)、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機600と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機600の場合と同様に、画像符号化装置51(200)および画像復号装置151(300)を適用することができる。
<第6実施の形態>
[ハードディスクレコーダの構成例]
図26は、本発明を適用した画像符号化装置および画像復号装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。
図26に示されるハードディスクレコーダ(HDDレコーダ)700は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号(テレビジョン信号)に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。
ハードディスクレコーダ700は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ700は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。
さらに、ハードディスクレコーダ700は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ760に供給し、モニタ760の画面にその画像を表示させる。また、ハードディスクレコーダ700は、モニタ760のスピーカよりその音声を出力させることができる。
ハードディスクレコーダ700は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ760に供給し、モニタ760の画面にその画像を表示させる。また、ハードディスクレコーダ700は、モニタ760のスピーカよりその音声を出力させることもできる。
もちろん、この他の動作も可能である。
図26に示されるように、ハードディスクレコーダ700は、受信部721、復調部722、デマルチプレクサ723、オーディオデコーダ724、ビデオデコーダ725、およびレコーダ制御部726を有する。ハードディスクレコーダ700は、さらに、EPGデータメモリ727、プログラムメモリ728、ワークメモリ729、ディスプレイコンバータ730、OSD(On Screen Display)制御部731、ディスプレイ制御部732、記録再生部733、D/Aコンバータ734、および通信部735を有する。
また、ディスプレイコンバータ730は、ビデオエンコーダ741を有する。記録再生部733は、エンコーダ751およびデコーダ752を有する。
受信部721は、リモートコントローラ(図示せず)からの赤外線信号を受信し、電気信号に変換してレコーダ制御部726に出力する。レコーダ制御部726は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ728に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部726は、このとき、ワークメモリ729を必要に応じて使用する。
通信部735は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部735は、レコーダ制御部726により制御され、チューナ(図示せず)と通信し、主にチューナに対して選局制御信号を出力する。
復調部722は、チューナより供給された信号を、復調し、デマルチプレクサ723に出力する。デマルチプレクサ723は、復調部722より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ724、ビデオデコーダ725、またはレコーダ制御部726に出力する。
オーディオデコーダ724は、入力されたオーディオデータを、例えばMPEG方式でデコードし、記録再生部733に出力する。ビデオデコーダ725は、入力されたビデオデータを、例えばMPEG方式でデコードし、ディスプレイコンバータ730に出力する。レコーダ制御部726は、入力されたEPGデータをEPGデータメモリ727に供給し、記憶させる。
ディスプレイコンバータ730は、ビデオデコーダ725またはレコーダ制御部726より供給されたビデオデータを、ビデオエンコーダ741により、例えばNTSC(National Television Standards Committee)方式のビデオデータにエンコードし、記録再生部733に出力する。また、ディスプレイコンバータ730は、ビデオデコーダ725またはレコーダ制御部726より供給されるビデオデータの画面のサイズを、モニタ760のサイズに対応するサイズに変換する。ディスプレイコンバータ730は、画面のサイズが変換されたビデオデータを、さらに、ビデオエンコーダ741によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部732に出力する。
ディスプレイ制御部732は、レコーダ制御部726の制御のもと、OSD(On Screen Display)制御部731が出力したOSD信号を、ディスプレイコンバータ730より入力されたビデオ信号に重畳し、モニタ760のディスプレイに出力し、表示させる。
モニタ760にはまた、オーディオデコーダ724が出力したオーディオデータが、D/Aコンバータ734によりアナログ信号に変換されて供給されている。モニタ760は、このオーディオ信号を内蔵するスピーカから出力する。
記録再生部733は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。
記録再生部733は、例えば、オーディオデコーダ724より供給されるオーディオデータを、エンコーダ751によりMPEG方式でエンコードする。また、記録再生部733は、ディスプレイコンバータ730のビデオエンコーダ741より供給されるビデオデータを、エンコーダ751によりMPEG方式でエンコードする。記録再生部733は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部733は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。
記録再生部733は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部733は、デコーダ752によりオーディオデータおよびビデオデータをMPEG方式でデコードする。記録再生部733は、復号したオーディオデータをD/A変換し、モニタ760のスピーカに出力する。また、記録再生部733は、復号したビデオデータをD/A変換し、モニタ760のディスプレイに出力する。
レコーダ制御部726は、受信部721を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ727から最新のEPGデータを読み出し、それをOSD制御部731に供給する。OSD制御部731は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部732に出力する。ディスプレイ制御部732は、OSD制御部731より入力されたビデオデータをモニタ760のディスプレイに出力し、表示させる。これにより、モニタ760のディスプレイには、EPG(電子番組ガイド)が表示される。
また、ハードディスクレコーダ700は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。
通信部735は、レコーダ制御部726に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部726に供給する。レコーダ制御部726は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部733に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部726および記録再生部733が、必要に応じて再エンコード等の処理を行うようにしてもよい。
また、レコーダ制御部726は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ730に供給する。ディスプレイコンバータ730は、ビデオデコーダ725から供給されるビデオデータと同様に、レコーダ制御部726から供給されるビデオデータを処理し、ディスプレイ制御部732を介してモニタ760に供給し、その画像を表示させる。
また、この画像表示に合わせて、レコーダ制御部726が、復号したオーディオデータを、D/Aコンバータ734を介してモニタ760に供給し、その音声をスピーカから出力させるようにしてもよい。
さらに、レコーダ制御部726は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ727に供給する。
以上のようなハードディスクレコーダ700は、ビデオデコーダ725、デコーダ752、およびレコーダ制御部726に内蔵されるデコーダとして画像復号装置151(300)を用いる。したがって、ビデオデコーダ725、デコーダ752、およびレコーダ制御部726に内蔵されるデコーダは、画像復号装置151(300)の場合と同様に、より少ない演算量で逆直交変換処理を行うことができる。
したがって、ハードディスクレコーダ700は、精度の高い予測画像を生成することができる。その結果として、ハードディスクレコーダ700は、例えば、チューナを介して受信されたビデオデータの符号化データや、記録再生部733のハードディスクから読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高精細な復号画像を得て、モニタ760に表示させることができる。
また、ハードディスクレコーダ700は、エンコーダ751として画像符号化装置51(200)を用いる。したがって、エンコーダ751は、画像符号化装置51(200)の場合と同様に、より少ない演算量で直交変換処理および逆直交変換処理を行うことができる。
したがって、ハードディスクレコーダ700は、例えば、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、ハードディスクレコーダ700は、より高速に、ハードディスクの記憶領域をより効率よく使用することができる。
なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ700について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ700の場合と同様に、画像符号化装置51(200)および画像復号装置151(300)を適用することができる。
<第7実施の形態>
[カメラの構成例]
図27は、本発明を適用した画像復号装置および画像符号化装置を用いるカメラの主な構成例を示すブロック図である。
図27に示されるカメラ800は、被写体を撮像し、被写体の画像をLCD816に表示させたり、それを画像データとして、記録メディア833に記録したりする。
レンズブロック811は、光(すなわち、被写体の映像)を、CCD/CMOS812に入射させる。CCD/CMOS812は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部813に供給する。
カメラ信号処理部813は、CCD/CMOS812から供給された電気信号を、Y,Cr,Cbの色差信号に変換し、画像信号処理部814に供給する。画像信号処理部814は、コントローラ821の制御の下、カメラ信号処理部813から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ841で例えばMPEG方式により符号化したりする。画像信号処理部814は、画像信号を符号化して生成した符号化データを、デコーダ815に供給する。さらに、画像信号処理部814は、オンスクリーンディスプレイ(OSD)820において生成された表示用データを取得し、それをデコーダ815に供給する。
以上の処理において、カメラ信号処理部813は、バス817を介して接続されるDRAM(Dynamic Random Access Memory)818を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM818に保持させる。
デコーダ815は、画像信号処理部814から供給された符号化データを復号し、得られた画像データ(復号画像データ)をLCD816に供給する。また、デコーダ815は、画像信号処理部814から供給された表示用データをLCD816に供給する。LCD816は、デコーダ815から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。
オンスクリーンディスプレイ820は、コントローラ821の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス817を介して画像信号処理部814に出力する。
コントローラ821は、ユーザが操作部822を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス817を介して、画像信号処理部814、DRAM818、外部インタフェース819、オンスクリーンディスプレイ820、およびメディアドライブ823等を制御する。FLASH ROM824には、コントローラ821が各種処理を実行する上で必要なプログラムやデータ等が格納される。
例えば、コントローラ821は、画像信号処理部814やデコーダ815に代わって、DRAM818に記憶されている画像データを符号化したり、DRAM818に記憶されている符号化データを復号したりすることができる。このとき、コントローラ821は、画像信号処理部814やデコーダ815の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部814やデコーダ815が対応していない方式により符号化・復号処理を行うようにしてもよい。
また、例えば、操作部822から画像印刷の開始が指示された場合、コントローラ821は、DRAM818から画像データを読み出し、それを、バス817を介して外部インタフェース819に接続されるプリンタ834に供給して印刷させる。
さらに、例えば、操作部822から画像記録が指示された場合、コントローラ821は、DRAM818から符号化データを読み出し、それを、バス817を介してメディアドライブ823に装着される記録メディア833に供給して記憶させる。
記録メディア833は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア833は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。
また、メディアドライブ823と記録メディア833を一体化し、例えば、内蔵型ハードディスクドライブやSSD(Solid State Drive)等のように、非可搬性の記憶媒体により構成されるようにしてもよい。
外部インタフェース819は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ834と接続される。また、外部インタフェース819には、必要に応じてドライブ831が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア832が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM824にインストールされる。
さらに、外部インタフェース819は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ821は、例えば、操作部822からの指示に従って、DRAM818から符号化データを読み出し、それを外部インタフェース819から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ821は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース819を介して取得し、それをDRAM818に保持させたり、画像信号処理部814に供給したりすることができる。
以上のようなカメラ800は、デコーダ815として画像復号装置151(300)を用いる。したがって、デコーダ815は、画像復号装置151の場合と同様に、より少ない演算量で逆直交変換処理を行うことができる。
したがって、カメラ800は、処理の高速化を実現するとともに、精度の高い予測画像を生成することができる。その結果として、カメラ800は、例えば、CCD/CMOS812において生成された画像データや、DRAM818または記録メディア833から読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高精細な復号画像を得て、LCD816に表示させることができる。
また、カメラ800は、エンコーダ841として画像符号化装置51(200)を用いる。したがって、エンコーダ841は、画像符号化装置51(200)の場合と同様に、より少ない演算量で直交変換処理および逆直交変換処理を行うことができる。
したがって、カメラ800は、例えば、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、カメラ800は、より高速に、DRAM818や記録メディア833の記憶領域をより効率よく使用することができる。
なお、コントローラ821が行う復号処理に画像復号装置151(300)の復号方法を適用するようにしてもよい。同様に、コントローラ821が行う符号化処理に画像符号化装置51(200)の符号化方法を適用するようにしてもよい。
また、カメラ800が撮像する画像データは動画像であってもよいし、静止画像であってもよい。
もちろん、画像符号化装置51(200)および画像復号装置151(300)は、上述した装置以外の装置やシステムにも適用可能である。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
51 画像符号化装置, 66 可逆符号化部, 91 DWT部, 92−0乃至92−8 KLT部, 101−0乃至101−8 逆KLT部, 103 逆DWT部, 151 画像復号装置, 162 可逆復号部, 200 画像符号化装置, 221 DWT部, 222−3乃至222−8 KLT部, 241−3乃至241−8 逆KLT部, 244 逆DWT部

Claims (14)

  1. 画像に対して、第1の直交変換より演算量の少ない第2の直交変換を行う前直交変換手段と、
    前記第2の直交変換の結果得られる前記画像の低周波数成分に対して、前記第1の直交変換を行う後直交変換手段と、
    前記第1の直交変換後の前記低周波数成分と、前記第2の直交変換の結果得られる前記画像の高周波数成分とを符号化する符号化手段と
    を備える符号化装置。
  2. 前記第1の直交変換は、分離型のカルーネン・レーベ変換である
    請求項1に記載の符号化装置。
  3. 前記後直交変換手段は、前記画像のAVC(Advanced Video Coding)方式におけるイントラ予測モードの予測方向が斜め方向である場合、前記低周波数成分に対して非分離型のカルーネン・レーベ変換を行い、前記画像の前記イントラ予測モードの予測方向が斜め方向ではない場合、前記低周波数成分に対して分離型のカルーネン・レーベ変換を行う
    請求項1に記載の符号化装置。
  4. 前記前直交変換手段は、前記画像の前記イントラ予測モードの予測方向が斜め方向である場合、前記画像の前記イントラ予測モードの予測方向が斜め方向ではない場合に比べて多い回数の前記第2の直交変換を行う
    請求項3に記載の符号化装置。
  5. 前記第2の直交変換は、ウェーブレット変換である
    請求項1に記載の符号化装置。
  6. 前記符号化手段は、前記画像のAVC(Advanced Video Coding)方式におけるイントラ予測モードに応じた順序で、前記第1の直交変換後の前記低周波数成分と前記高周波数成分を符号化する
    請求項1に記載の符号化装置。
  7. 符号化装置が、
    画像に対して、第1の直交変換より演算量の少ない第2の直交変換を行う前直交変換ステップと、
    前記第2の直交変換の結果得られる前記画像の低周波数成分に対して、前記第1の直交変換を行う後直交変換ステップと、
    前記第1の直交変換後の前記低周波数成分と、前記第2の直交変換の結果得られる前記画像の高周波数成分とを符号化する符号化ステップと
    を含む符号化方法。
  8. 画像の符号化結果として、前記画像に対して第1の直交変換より演算量の少ない第2の直交変換を行った結果得られた前記画像の低周波数成分の前記第1の直交変換後の係数と、前記第2の直交変換を行った結果得られた前記画像の高周波数成分の符号化結果を取得し、前記画像の符号化結果を復号する復号手段と、
    前記復号の結果得られる前記低周波数成分の前記第1の直交変換後の係数に対して、前記第1の直交変換に対応する第1の逆直交変換を行う前逆直交変換手段と、
    前記第1の逆直交変換の結果得られる前記低周波数成分と、前記復号の結果得られる前記高周波数成分に対して、前記第2の直交変換に対応する第2の逆直交変換を行い、前記画像を得る後逆直交変換手段と
    を備える復号装置。
  9. 前記第1の逆直交変換は、分離型の逆カルーネン・レーベ変換である
    請求項8に記載の復号装置。
  10. 前記符号化結果には、前記画像のAVC(Advanced Video Coding)方式におけるイントラ予測モードが含まれており、
    前記前逆直交変換手段は、前記イントラ予測モードの予測方向が斜め方向である場合、前記低周波数成分の前記第1の直交変換後の係数に対して非分離型の逆カルーネン・レーベ変換を行い、前記イントラ予測モードの予測方向が斜め方向ではない場合、前記低周波数成分の前記第1の直交変換後の係数に対して分離型の逆カルーネン・レーベ変換を行う
    請求項8に記載の復号装置。
  11. 前記前逆直交変換手段は、前記イントラ予測モードの予測方向が斜め方向である場合、前記イントラ予測モードの予測方向が斜め方向ではない場合に比べて多い回数の前記第2の逆直交変換を行う
    請求項10に記載の復号装置。
  12. 前記第2の逆直交変換は、逆ウェーブレット変換である
    請求項8に記載の復号装置。
  13. 前記符号化結果には、前記画像のAVC(Advanced Video Coding)方式におけるイントラ予測モードが含まれており、
    前記復号手段は、前記イントラ予測モードに応じた順序で、前記低周波数成分の前記第1の直交変換後の係数と前記高周波数成分を復号する
    請求項8に記載の復号装置。
  14. 復号装置が、
    画像の符号化結果として、前記画像に対して第1の直交変換より演算量の少ない第2の直交変換を行った結果得られた前記画像の低周波数成分の前記第1の直交変換後の係数と、前記第2の直交変換を行った結果得られた前記画像の高周波数成分の符号化結果を取得し、前記画像の符号化結果を復号する復号ステップと、
    前記復号の結果得られる前記低周波数成分の前記第1の直交変換後の係数に対して、前記第1の直交変換に対応する第1の逆直交変換を行う前逆直交変換ステップと、
    前記第1の逆直交変換の結果得られる前記低周波数成分と、前記復号の結果得られる前記高周波数成分に対して、前記第2の直交変換に対応する第2の逆直交変換を行い、前記画像を得る後逆直交変換ステップと
    を含む復号方法。
JP2010160952A 2010-07-15 2010-07-15 符号化装置および符号化方法、並びに、復号装置および復号方法 Withdrawn JP2012023632A (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2010160952A JP2012023632A (ja) 2010-07-15 2010-07-15 符号化装置および符号化方法、並びに、復号装置および復号方法
CN201180033755.6A CN102986222B (zh) 2010-07-15 2011-07-08 编码设备、编码方法、解码设备以及解码方法
KR1020137000138A KR20130088119A (ko) 2010-07-15 2011-07-08 부호화 장치 및 부호화 방법, 및 복호 장치 및 복호 방법
EP11806718.0A EP2595383A1 (en) 2010-07-15 2011-07-08 Encoding device, encoding method, decoding device, and decoding method
US13/805,428 US9918084B2 (en) 2010-07-15 2011-07-08 Encoding device, encoding method, decoding device, and decoding method
PCT/JP2011/065734 WO2012008388A1 (ja) 2010-07-15 2011-07-08 符号化装置および符号化方法、並びに、復号装置および復号方法
US15/886,252 US10728544B2 (en) 2010-07-15 2018-02-01 Encoding device, encoding method, decoding device, and decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010160952A JP2012023632A (ja) 2010-07-15 2010-07-15 符号化装置および符号化方法、並びに、復号装置および復号方法

Publications (1)

Publication Number Publication Date
JP2012023632A true JP2012023632A (ja) 2012-02-02

Family

ID=45469388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010160952A Withdrawn JP2012023632A (ja) 2010-07-15 2010-07-15 符号化装置および符号化方法、並びに、復号装置および復号方法

Country Status (6)

Country Link
US (2) US9918084B2 (ja)
EP (1) EP2595383A1 (ja)
JP (1) JP2012023632A (ja)
KR (1) KR20130088119A (ja)
CN (1) CN102986222B (ja)
WO (1) WO2012008388A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101756442B1 (ko) * 2010-11-29 2017-07-11 에스케이텔레콤 주식회사 인트라예측모드의 중복성을 최소화하기 위한 영상 부호화/복호화 방법 및 장치
US10390048B2 (en) * 2016-02-15 2019-08-20 Qualcomm Incorporated Efficient transform coding using optimized compact multi-pass transforms
KR102664785B1 (ko) * 2018-07-12 2024-05-17 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 비디오 신호를 처리하기 위한 방법 및 장치
JP7200253B2 (ja) * 2018-09-02 2023-01-06 エルジー エレクトロニクス インコーポレイティド 映像信号を処理するための方法及び装置
CN118175313A (zh) * 2019-04-16 2024-06-11 Lg电子株式会社 图像解码和编码方法、数据的发送方法及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8428133B2 (en) * 2007-06-15 2013-04-23 Qualcomm Incorporated Adaptive coding of video block prediction mode
US8285068B2 (en) * 2008-06-25 2012-10-09 Cisco Technology, Inc. Combined deblocking and denoising filter
BR122015015910B1 (pt) * 2009-01-27 2022-05-10 Interdigital Vc Holdings, Inc Métodos e aparelhos para seleções de transformada em codificação e decodificação de vídeo

Also Published As

Publication number Publication date
US10728544B2 (en) 2020-07-28
CN102986222B (zh) 2016-05-18
US20130094584A1 (en) 2013-04-18
KR20130088119A (ko) 2013-08-07
WO2012008388A1 (ja) 2012-01-19
CN102986222A (zh) 2013-03-20
US9918084B2 (en) 2018-03-13
EP2595383A1 (en) 2013-05-22
US20180160115A1 (en) 2018-06-07

Similar Documents

Publication Publication Date Title
US10721480B2 (en) Image processing apparatus and method
JP5464435B2 (ja) 画像復号装置および方法
TWI411310B (zh) Image processing apparatus and method
WO2011089972A1 (ja) 画像処理装置および方法
WO2011018965A1 (ja) 画像処理装置および方法
WO2012096229A1 (ja) 符号化装置および符号化方法、並びに復号装置および復号方法
WO2010095560A1 (ja) 画像処理装置および方法
JP5556996B2 (ja) 画像処理装置および方法
US10728544B2 (en) Encoding device, encoding method, decoding device, and decoding method
WO2011125866A1 (ja) 画像処理装置および方法
WO2010064675A1 (ja) 画像処理装置および画像処理方法、並びにプログラム
WO2010064674A1 (ja) 画像処理装置および画像処理方法、並びにプログラム
US8483495B2 (en) Image processing device and method
WO2013065572A1 (ja) 符号化装置および方法、並びに、復号装置および方法
WO2011078067A1 (ja) 画像処理装置および方法
WO2013047325A1 (ja) 画像処理装置および方法
WO2010101063A1 (ja) 画像処理装置および方法
WO2012077532A1 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2012138884A (ja) 符号化装置および符号化方法、並びに復号装置および復号方法
WO2013065571A1 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20131001