Nothing Special   »   [go: up one dir, main page]

JP2021175035A - 画像処理装置、画像処理方法 - Google Patents

画像処理装置、画像処理方法 Download PDF

Info

Publication number
JP2021175035A
JP2021175035A JP2020075607A JP2020075607A JP2021175035A JP 2021175035 A JP2021175035 A JP 2021175035A JP 2020075607 A JP2020075607 A JP 2020075607A JP 2020075607 A JP2020075607 A JP 2020075607A JP 2021175035 A JP2021175035 A JP 2021175035A
Authority
JP
Japan
Prior art keywords
image
compression coding
value
image processing
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2020075607A
Other languages
English (en)
Other versions
JP2021175035A5 (ja
Inventor
恵子 米沢
Keiko Yonezawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2020075607A priority Critical patent/JP2021175035A/ja
Priority to US17/230,785 priority patent/US20210329285A1/en
Publication of JP2021175035A publication Critical patent/JP2021175035A/ja
Publication of JP2021175035A5 publication Critical patent/JP2021175035A5/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 圧縮符号化に用いる背景画像における特定領域と非特定領域とで異なる圧縮符号化パラメータを設定するケースにおいて、特定領域においては動き量に応じた圧縮符号化パラメータを設定するための技術を提供すること。【解決手段】 複数の画像から同じ画素位置における画素値を取得し、該取得した画素値の頻度分布に基づき、背景画像における該画素位置の画素値および動き量を決定する。背景画像に対して圧縮符号化パラメータを設定する。背景画像における特定領域には、該特定領域に属する画素の動き量に応じた圧縮符号化パラメータを設定する。【選択図】 図2

Description

本発明は、画像の圧縮符号化技術に関するものである。
近年、スマートフォンやデジタルビデオカメラ等の普及に伴い、撮像を行って映像データを生成する機会が増えている。その一方、データを記録しておくストレージの容量や、データを送受信する際の通信帯域には限りがあるため、映像データを効率的に圧縮する技術が求められている。映像圧縮の方法としては、H.264/AVCという標準規格が知られている。また、H.265/HEVCという標準規格も普及し始めている。
映像データの圧縮符号化技術において、画質を調整するために、量子化パラメータ(Quantization Parameter)等のパラメータが規定されている。これらのパラメータを用いて、必要な情報を保持したままデータ量をできるだけ少なくすることが求められている。具体的には、映像中の注目領域をROI(Region of Interest)として抽出し、ROIとそれ以外の領域とで量子化パラメータを変える手法がある。監視を主な目的としたネットワークカメラでは、動体が重要物であることが多いため、動体を検知してROIとする方法が知られている。また、動体の中でもより重要とされる人や車などの特定物体を検知し、特定物体のみをROIとする方法も一般的である。
動体が重要物であることが多いとしたが、例外もある。例えば風にゆれる木々や、噴水や海面など常時揺れている背景物も存在する。そのような背景物は複雑な動きをもつために、正確に再現しようとすると圧縮効率が落ちてデータ量の増大を招くが、そこに含まれる情報は一般的に重要なものではない。そこで、重要な領域をROIとして高画質化すると同時に、重要ではないが動きのある領域を選択して低画質化することで、必要な情報を失わずにビットレートを低減することが可能になる。
水面や植生などの領域は、取得した映像を構成する一枚一枚の画像(以下、フレームと呼ぶ)に対して領域分割(セグメンテーションなどとも呼ばれる)手法を適応することで取得することができる。但し前景となる人や車が含まれていると正しく領域分割ができないために、前景を除いた背景画像を生成する必要がある。特許文献1には、複数のフレームを用いて背景画像を生成する方法が開示されている。また特許文献2には、重要領域とされる人の顔領域の中で、動く領域と動かない領域に分けて画質を変える方法が開示されている。
特開2012-203680号公報 特開平8-181992号公報
特許文献1の方法を用いることで、前景が含まれない背景画像を作成することができるが、特許文献1の方法では、背景画像を用いた圧縮制御は行っていない。特許文献2の方法では、背景に含まれる動き領域を対象とはしていないため、植生などの動きを想定していない。さらに、フレームごとに領域分割を行い、分割内容によって画質パラメータを変更することも可能であるが、その場合、植生であれば一律に画質が定まってしまい、動いている植生と動いていない植生とで異なる画質を設定することができないという課題がある。
本発明では、圧縮符号化に用いる背景画像における特定領域と非特定領域とで異なる圧縮符号化パラメータを設定するケースにおいて、特定領域においては動き量に応じた圧縮符号化パラメータを設定するための技術を提供する。
本発明の一様態は、複数の画像から同じ画素位置における画素値を取得し、該取得した画素値の頻度分布に基づき、背景画像における該画素位置の画素値および動き量を決定する決定手段と、前記背景画像に対して圧縮符号化パラメータを設定する設定手段とを備え、前記設定手段は、前記背景画像における特定領域には、該特定領域に属する画素の動き量に応じた圧縮符号化パラメータを設定することを特徴とする。
本発明の構成によれば、圧縮符号化に用いる背景画像における特定領域と非特定領域とで異なる圧縮符号化パラメータを設定するケースにおいて、特定領域においては動き量に応じた圧縮符号化パラメータを設定するための技術を提供することができる。
画像処理システム10の構成例を示すブロック図。 (A)は画像処理装置100の機能構成例を示すブロック図、(B)は画像処理装置100のハードウェア構成例を示すブロック図。 第1の実施形態のユースケースを説明する図。 分析段階にて画像処理装置100が行う処理のフローチャート。 ヒストグラムの一例を示す図。 図3のシーンを撮像した撮像画像群から生成した背景画像の一例を示す図。 圧縮段階にて画像処理装置100が行う処理のフローチャート。 分析段階にて画像処理装置100が行う処理のフローチャート。 圧縮段階にて画像処理装置100が行う処理のフローチャート。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
以下の各実施形態では、監視目的の撮像を例に取り説明するが、これに限らず、以下の各実施形態は、放送目的等、種々の目的の撮像に適用することも可能である。また、以下の各実施形態では、ネットワークに接続して他の装置と通信可能な撮像装置(ネットワークカメラ)として機能する画像処理装置について説明する。しかし、これに限らず、以下の各実施形態は、ネットワークに接続できない撮像装置として機能する画像処理装置にも適用することも可能である。また、以下の各実施形態では、画像処理装置が撮像機能を有しているものとして説明するが、画像処理装置が撮像機能を有することに限らず、撮像機能を画像処理装置とは別個の装置で実現させ、画像処理装置は撮像画像を該装置から取得する構成としても良い。
[第1の実施形態]
本実施形態には、撮像された動画像におけるフレームの画像の圧縮(圧縮符号化)に用いる背景画像を分析する分析段階と、該分析段階後に撮像された動画像におけるフレームの画像を該分析の結果を用いて圧縮符号化する圧縮段階と、がある。
前者の分析段階では、画角等を固定して同一シーンを撮像した動画像における複数フレームの画像から、背景画像と、該背景画像における画素位置ごとのある時間における動き量と、を求める。そして、該背景画像において特定領域と該非特定領域とで異なる圧縮符号化パラメータを設定するが、特定領域には、該特定領域における動き量に応じた圧縮符号化パラメータを設定する。以下では、圧縮符号化パラメータとして、量子化パラメータ値であるQp値を用いた例を説明するが、圧縮符号化パラメータはQp値に限らず、画質に影響を与える圧縮符号化パラメータであれば如何なる圧縮符号化パラメータを採用してもよい。
後者の圧縮段階では、画角等を固定して同一シーン(分析段階で撮像したシーンと同じシーン)を撮像した動画像における各フレームの画像から前景を抽出し、該抽出した前景にROIを設定する。そして、該画像において上記の特定領域に対応する対応領域には「背景画像の特定領域に設定したQp値」を設定し、該画像において上記の非特定領域に対応する対応領域には「背景画像の非特定領域に設定したQp値」を設定する。その際、該画像のROIには「高画質化に相当するQp値(特定領域のQp値および非特定領域のQp値の何れよりも小さいQp値)」を設定する。そして、該画像のそれぞれの領域を該領域のQp値を用いて量子化して圧縮符号化することで、背景で動きが大きく、圧縮コストが高い割に重要な情報を含まない領域のみを低画質化して圧縮効率を上げつつ前景の重要な領域の画質を保った画像圧縮を可能にする。
<画像処理システム10の構成例>
先ず、本実施形態に係る画像処理システム10の構成例について、図1のブロック図を用いて説明する。図1に示す如く、本実施形態に係る画像処理システム10は、撮像機能を有する画像処理装置100と、クライアント装置200と、を有し、それぞれはネットワーク300を介して互いにデータ通信が可能なように構成されている。本実施形態では、画像処理装置100はネットワーク300に接続して他の装置と通信可能である装置(ネットワークカメラ等)を想定するが、ネットワーク300に接続可能であることは必須ではない。
クライアント装置200は、ユーザによる操作に基づいて、画像処理装置100に対して、動画像(ストリーム)の配信を要求する配信要求コマンドや、各種パラメータやROIの情報等を設定するための設定コマンドを送信する。画像処理装置100は、配信要求コマンドに応じて、ストリームをクライアント装置200に配信し、設定コマンドに応じて、各種パラメータやROIの情報等を記憶する。クライアント装置200は、パーソナルコンピュータ、タブレット端末、スマートフォンなどのコンピュータ装置である。クライアント装置200のCPU等のプロセッサが該クライアント装置200のメモリに格納されているコンピュータプログラムやデータを用いて各種の処理を実行する。これによりクライアント装置200のプロセッサは、クライアント装置200全体の動作制御を行うと共に、クライアント装置200が行うものとして説明する各処理を実行若しくは制御する。
<画像処理装置100の構成例について>
続いて、図2(A)と図2(B)を参照して画像処理装置100の構成例について説明する。図2(A)は、画像処理装置100の機能構成例を示すブロック図、図2(B)は、画像処理装置100のハードウェア構成例を示すブロック図である。
先ず、画像処理装置100の機能構成例について、図2(A)のブロック図を用いて説明する。画像取得部211は、撮像部221(図2(B))や外部装置(不図示)等から動画像を取得し、該動画像から各フレームの撮像画像(画像フレーム)を取得する。例えば、画像取得部211は、記憶部222(図2(B))から取得した各種パラメータ(各種設定)を利用して、動画像から各フレームの撮像画像(画像フレーム)を生成する。
背景分析部214は、画像取得部211が取得した複数フレームの撮像画像を用いて、撮像シーンにおける前景を除いた背景の画像(背景画像)を生成するとともに、該背景画像における各画素に対応する動き量を求める。そして背景分析部214は、生成した背景画像を被写体ごとの領域に分割する領域分割を行い、分割領域ごとにQp値を設定するのであるが、特定の被写体の分割領域については、対応する動き量に応じたQp値を設定する。そして背景分析部214は、各領域について設定したQp値を記憶部222に格納する。
前景抽出部215は、画像取得部211が取得した撮像画像から前景(前景領域)を抽出し、該抽出した前景にROIを設定する。圧縮符号化部212は、圧縮符号化対象として画像取得部211が取得した撮像画像を、背景分析部214によって記憶部222に格納されたQp値を用いて圧縮符号化する。
通信制御部213は、圧縮符号化部212によって圧縮符号化された撮像画像を、例えばストリーム形式で、通信部224(図2(B))を介して、ネットワーク300を通じてクライアント装置200に送信する。通信制御部213により送信されるデータの形式や送信先については特定のデータ形式、特定の送信先に限らない。
次に、画像処理装置100のハードウェア構成例について、図2(B)を用いて説明する。撮像部221は、レンズを通して結像した光を撮像素子で受光し、その受光した光を電荷に変換して、動画像を取得する。撮像素子には、例えば、CMOS(Complementary Metal Oxide Semiconductor)イメージセンサを用いることができる。また、撮像素子には、CCD(Charge Coupled Device)イメージセンサを用いてもよい。
記憶部222は、ROM(Read Only Memory)やRAM(Random Access Memory)等のメモリ装置を含む。記憶部222には、画像処理装置100が行うものとして説明する各種の処理を制御部223に実行若しくは制御させるためのコンピュータプログラムやデータが格納されている。また記憶部222は、通信部224を介してクライアント装置200等の外部装置から取得したデータ(コマンドや画像)や各種パラメータなどを記憶することができる。例えば、記憶部222は、撮像部221で取得された動画像に対するホワイトバランスや露出等の設定であるカメラパラメータや、圧縮符号化パラメータ等を記憶する。圧縮符号化パラメータには、量子化パラメータ値(Qp値)が含まれる。なおQp値は、値が大きくなるほど量子化ステップが大きくなり、値が小さくなるほど量子化ステップが小さくなる。よって、より大きいQp値を用いて圧縮符号化すると画質は低下し、より小さいQp値を用いて圧縮符号化すると画質は向上する。また、記憶部222は、動画像のフレームレートや撮像画像のサイズ(解像度)等を含む、撮像画像に関するパラメータも記憶し得る。
また、記憶部222は、制御部223が各種の処理を実行する際に用いるワークエリアを提供し得る。さらに、記憶部222は、フレームメモリやバッファメモリとして機能することも可能である。なお、記憶部222として、ROM、RAM等のメモリの他に、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、DVDなどの記憶媒体を用いてもよい。
制御部223は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等を有する。制御部223は、記憶部222に格納されているコンピュータプログラムやデータを用いて各種の処理を実行する。これにより制御部223は、画像処理装置100全体の動作制御を行うと共に、画像処理装置100が行うものとして説明する各処理を実行若しくは制御する。なお、制御部223は、記憶部222に格納されているコンピュータプログラムとOS(Operating System)との協働により画像処理装置100全体を制御するようにしてもよい。なお、制御部223は、DSP(Digital Signal Processor)等のプロセッサやASIC(Application Specific Integrated Circuit)により構成されてもよい。
通信部224は、ネットワーク300を介してクライアント装置200と通信するために、有線信号または無線信号の送受信を行う。なお、図2(A)に示す画像処理装置100の各機能部は、ハードウェアで実装しても良いし、ソフトウェア(コンピュータプログラム)で実装しても良い。後者の場合、このコンピュータプログラムは上記の記憶部222に格納され、制御部223により実行される。
アクセラレータ部225は、CPU、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)などや記憶部を有する。アクセラレータ部225は、主にDeepLearningによる高性能処理を行うために、撮像部221に付加される処理部である。背景分析部214や前景抽出部215の処理をアクセラレータ部225で行ってもよい。
以下では、図2(A)に示した機能部を処理の主体として説明する。なお、図2(A)に示した機能部をソフトウェア(コンピュータプログラム)で実装した場合、該機能部の機能を制御部223に実行もしくは制御させるためのコンピュータプログラムを該制御部223が実行することで、該機能部の機能が実現される。また、機械学習による処理を高速に行うために、アクセラレータ部225で処理を行ってもよい。
<分析段階の処理について>
分析段階にて画像処理装置100が行う処理について、図4のフローチャートに従って説明する。ステップS410では、画像取得部211は、動画像を解析するために必要な設定を取得する。例えば、画像取得部211は、記憶部222から、動画像に関するパラメータやカメラパラメータ等を取得する。動画像に関するパラメータには、動画像のフレームレートや動画像のサイズ(解像度)が含まれ、カメラパラメータには、撮像部221のホワイトバランスや露出、カメラゲイン等の設定が含まれる。本実施形態では、一例として、動画像のサイズは1280画素×720画素、フレームレートは30fpsとする。
また、画像取得部211は、記憶部222から圧縮符号化パラメータを取得する。画像取得部211が記憶部222から取得する圧縮符号化パラメータには、H.264に準拠した圧縮符号化を行うために用いる上記のQp値(量子化パラメータ値)が含まれる。画像取得部211が取得するQp値には、一般背景用のQp値(非特定領域用のQp値)と、特定領域用のQp値と、が含まれている。本実施形態では、一例として、一般背景用のQp値は「36」、特定領域用のQp値は「40」であるものとして説明する。
ステップS420では、画像取得部211は、撮像部221によって撮像された動画像から、ステップS410で取得した各種設定に従って、所定時間分のフレームの撮像画像を生成する。本実施形態では、所定時間を例えば10分とし、フレームレートは30fpsである場合、動画像から18000フレームの撮像画像を生成することになる。
本実施形態では、図3に示すような一般道路の監視を対象としたユースケースを想定している。図3に示す撮像画像30には、道路を左右に走る車310、その周囲の木立320、歩道を歩く通行人330、建物340、建物340の前にある芝生350などが含まれている。
ステップS430では、背景分析部214は、ステップS420で画像取得部211が取得した18000枚の撮像画像を用いて、背景画像と、該背景画像における小領域ごとの動き量と、を取得する。
先ず、背景画像の生成方法について説明する。背景画像は小領域ごとに、該小領域に対応する18000枚の撮像画像のそれぞれの対応領域の中で最も頻度の高い画素値を組み合わせて生成する。以下では小領域が画素であり、画素値が輝度値であるケースについて説明する。つまり、以下では、背景画像における画素位置(x、y)における輝度値を18000枚の撮像画像から決定する決定方法について説明する。この決定方法を背景画像における各画素位置に適用することで、背景画像における各画素位置の輝度値が決定することになり、結果として各画素位置の輝度値が決定した背景画像を生成することになる。 先ず、背景分析部214は、18000枚の撮像画像のそれぞれから画素位置(x、y)における輝度値を収集し、該収集した輝度値(18000個の画素の輝度値)の頻度分布を生成する。本実施形態では、背景分析部214は、輝度分布の一例として、各輝度値の頻度を表すヒストグラムを生成する。
ヒストグラムの一例を図5(a)、(b)に示す。図5(a)、(b)において、横軸はR,G,Bのそれぞれの輝度値を示し、縦軸は、R,G,Bのそれぞれの輝度値の頻度を示している。
図5(a)は、図3に示す撮像画像30上の画素位置360(道路の領域内の画素位置)を(x、y)としたときに、18000枚の撮像画像のそれぞれにおける画素位置(x、y)から収集したR,G,Bのそれぞれの輝度値のヒストグラムを示す。道路の領域は、車が通過する場合にのみ異なる輝度値を取るが、それ以外では輝度変化が少なく、その結果、ヒストグラムは図5(a)に示す如く、高頻度の頻度値は比較的ばらつきが小さく、高頻度ではない頻度値はばらつきが大きいヒストグラムとなる。「高頻度ではない頻度値はばらつきが大きい」ことは、さまざまな色の車が道路を通過することに対応している。すなわち、図5(a)の画素位置360のケースでは、所定時間における「動き量が小さい」こととなる。
図5(b)は、図3に示す撮像画像30上の画素位置370(立木の領域内の画素位置)を(x、y)としたときに、18000枚の撮像画像のそれぞれにおける画素位置(x、y)から収集したR,G,Bのそれぞれの輝度値のヒストグラムを示す。立木の領域は、風で大きくゆれる木の領域であるため、輝度変化が大きく、その結果、ヒストグラムは図5(b)に示す如く、頻度値のばらつきが比較的つきが大きい。すなわち、図5(b)の画素位置370のケースでは、所定時間における「動き量が大きい」こととなる。
よって、背景分析部214は、背景画像における画素位置(x、y)について生成したヒストグラムにおいて頻度が最も高い輝度値を、背景画像中の画素位置(x、y)における画素の輝度値として決定する。
例えば、図5(a)のRのヒストグラムにおいて頻度が最も高い輝度値は「195」、Gのヒストグラムにおいて頻度が最も高い輝度値は「191」、Bのヒストグラムにおいて頻度が最も高い輝度値は「187」である。よって、「195」、「191」、「187」のそれぞれを、背景画像において画素位置360に対応する画素位置(対応画素位置)の画素のRの輝度値、Gの輝度値、Bの輝度値として決定する。
また例えば、図5(b)のRのヒストグラムにおいて頻度が最も高い輝度値は「98」、Gのヒストグラムにおいて頻度が最も高い輝度値は「91」、Bのヒストグラムにおいて頻度が最も高い輝度値は「57」である。よって、「98」、「91」、「57」のそれぞれを、背景画像において画素位置370に対応する画素位置の画素のRの輝度値、Gの輝度値、Bの輝度値として決定する。
図3のシーンを撮像した撮像画像群から上記の処理によって生成した背景画像の一例を図6に示す。図6に示す背景画像60と図3のシーンとを比較すると、図6に示す背景画像60は、前景となる車や人はなくなり、道路や歩道、木立や建物など背景としてシーンに存在するもののみが残った画像となっている。但し、背景画像60中の木立320に関しては、図5(b)に示したように頻度値のばらつきが大きく、画素ごとにヒストグラムから選択される輝度値にばらつきが生じるため、図3の撮像画像30における木立320と比べて、ぼやけた状態になる。それに対して、植生領域であっても、遠方の建物の前にあるような対象、例えば、撮像画像30における芝生350と背景画像60における芝生350とでは大きな差異は生じない。背景分析部214は、このようにして生成した背景画像を記憶部222に格納する。
次に、背景画像における画素ごとの動き量を求める方法について説明する。以下では、背景画像中の画素位置(x、y)における動き量を求める方法について説明する。この方法を背景画像における各画素位置に適用することで、背景画像中の各画素位置における動き量を求めることができる。
背景画像における画素位置(x、y)における動き量は、該画素位置(x、y)について生成したヒストグラムにおいて最も高い頻度を含むピークの幅の逆数や、最も高い頻度及びその周辺に分布する頻度の合計値の総頻度(頻度の総数で、ここでは18000)に対する割合の逆数とすることができる。ここでは後者の方法でもって、背景画像中の画素位置(x、y)における動き量を求める方法について説明する。
先ずは、背景画像中の画素位置(x、y)について生成したヒストグラムにおいて最も高い頻度(最高頻度)と、該ヒストグラムにおいて最高頻度に対応する輝度値に隣接する2つの輝度値のそれぞれの頻度と、の合計値を「ピークの幅」として求める。そして背景分析部214は、総頻度「18000」に対する「ピークの幅」の割合を求め、該求めた割合の逆数を、背景画像における画素位置(x、y)の動き量として求める。ここで注意する必要があるのは、前景の動きを除いた背景の動き量を取得することが目的であるため、例えば、図5(a)の低輝度値に広がるばらつきの影響は除きたい。
例えば、背景画像において画素位置360に対応する画素位置の動き量を求める場合、先ずは、図5(a)のヒストグラムを参照して、R,G,Bのそれぞれについてピークの幅を求め、該求めたピークの幅の総頻度「18000」に対する割合を求める。
Rについては、最大頻度は「3544」、該最大頻度に対応する輝度値に隣接する輝度値に対応する頻度は「1532」,「0」であるので、ピークの幅は、これらの合計値「5076」(=3544+1532+0)となる。よって、総頻度「18000」に対する「ピークの幅」の割合は5076/18000=0.282となる。
Gについては、最大頻度は「4898」、該最大頻度に対応する輝度値に隣接する輝度値に対応する頻度は「2761」,「0」であるので、ピークの幅は、これらの合計値「7659」(=4898+2761+0)となる。よって、総頻度「18000」に対する「ピークの幅」の割合は7659/18000=0.426となる。
Bについては、最大頻度は「4055」、該最大頻度に対応する輝度値に隣接する輝度値に対応する頻度は「3573」,「0」であるので、ピークの幅は、これらの合計値「7628」(=4055+3573+0)となる。よって、総頻度「18000」に対する「ピークの幅」の割合は7628/18000=0.424となる。
動き量は、1つの画素位置におけるR,G,Bのそれぞれについて求めてもよいし、1つの画素位置について1つ求めてもよい。ここでは後者を採用する。よって、この場合、R,G,Bのそれぞれについて求めた割合の平均値「0.377」(=(0.282+0.426+0.424)/3)を求め、その逆数「2.65」を、「背景画像において画素位置360に対応する画素位置の動き量」として求める。
また例えば、背景画像において画素位置370に対応する画素位置の動き量を求める場合、先ずは、図5(b)のヒストグラムを参照して、R,G,Bのそれぞれについてピークの幅を求め、該求めたピークの幅の総頻度「18000」に対する割合を求める。
Rについては、最大頻度は「693」、該最大頻度に対応する輝度値に隣接する輝度値に対応する頻度は「512」,「334」であるので、ピークの幅は、これらの合計値「1539」(=693+512+334)となる。よって、総頻度「18000」に対する「ピークの幅」の割合は1539/18000=0.086となる。
Gについては、最大頻度は「727」、該最大頻度に対応する輝度値に隣接する輝度値に対応する頻度は「631」,「540」であるので、ピークの幅は、これらの合計値「1898」(=727+631+540)となる。よって、総頻度「18000」に対する「ピークの幅」の割合は1898/18000=0.105となる。
Bについては、最大頻度は「1020」、該最大頻度に対応する輝度値に隣接する輝度値に対応する頻度は「816」,「511」であるので、ピークの幅は、これらの合計値「2347」(=1020+816+511)となる。よって、総頻度「18000」に対する「ピークの幅」の割合は2347/18000=0.130となる。
そして、R,G,Bのそれぞれについて求めた割合の平均値「0.107」(=(0.086+0.105+0.130)/3)を求め、その逆数「9.35」を、「背景画像において画素位置370に対応する画素位置の動き量」として求める。
上記の如く、動きが小さいほど最大頻度の周りに大部分が分布することになるため、上記割合は大きくなる。よって本実施形態では、このような関係から、割合の平均値の逆数を動き量としている。
なお、上記で説明した、ヒストグラムから動き量を求める方法は一例であり、この方法に限らない。例えば、上記の説明では、最大頻度と、該最大頻度に対応する輝度値に隣接する輝度値の頻度と、の合計値を求めた。しかし、ピークの幅が広くなればなるほど、動きが小さい場合でもそのピークの高さが周囲と平均化されてしまう。そのような影響を防ぐために、総頻度に対する最大頻度の割合の逆数を動き量としてもよい。また、上記の合計値として、最大頻度と、該最大頻度に対応する輝度値に隣接する輝度値の頻度のうち大きい方と、の合計値を求めてもよい。なお、「隣接する輝度値」の代わりに「近傍の輝度値」としてもよい。
次に、ステップS440では、背景分析部214は、ステップS430で生成した背景画像に対して意味的領域分割処理(セグメンテーション)を行い、背景画像を被写体の領域ごとに分割する。なお、本実施形態では、ステップS440における領域分割で得られた分割領域のうち「植生の領域(植生領域)」を特定領域とし、「植生領域」以外の分割領域を非特定領域とする。しかし、特定領域および非特定領域の属性はそれぞれ「植生領域」、「植生領域以外の分割領域」に限らない。
セグメンテーションの方法としては複数の方法が知られているが、ここでは機械学習、特にDeepLearningをベースとした手法である、DeepLab(Google)を用いる。DeepLabを用いて道路や空、木立や建物の領域を取得する識別器を構築するために、動画像から道路や建物が写っているフレームの画像を集めて学習用データとして準備する。具体的には、動画像中の各フレームの画像から、道路や建物の領域を抽出してラベル(道路や建物)を記載したファイルを作成する。このようにして準備した学習用データを学習し、道路や建物の領域をセグメンテーションする識別器を構築する。
次に、ステップS450では、背景分析部214は、ステップS430で生成した背景画像を複数の単位領域に分割する。そして背景分析部214は、背景画像における各単位領域に対してQp値を設定する。H.264においては、マクロブロックとして16×16の単位でQp値を設定することになるため、本実施形態では、マクロブロックごとにQp値を設定する(つまり単位領域=マクロブロックとする)。但し、マクロブロックをさらに小さく分割することができる場合には、より小さい単位でQp値を設定するようにしてもよい。さらに、H.265ではCTU単位での設定が可能となるため、Qp値の設定が可能な単位領域の大きさに応じて設定する。
背景分析部214は、マクロブロックを構成する画素のうち1つでも、ステップS440における領域分割で得られた分割領域のうち非特定領域に属する場合には、該マクロブロックは非特定領域に属するものと判断する。そして背景分析部214は、非特定領域に属するものと判断したマクロブロックには、非特定領域用のQp値「36」を設定する。
一方、圧縮符号化部212は、マクロブロックを構成する全ての画素が、ステップS440における領域分割で得られた分割領域のうち特定領域に属する場合には、該マクロブロックは特定領域に属するものと判断する。そして背景分析部214は、特定領域に属するものと判断したマクロブロックには、特定領域用のQp値である「40」を該マクロブロックを構成する各画素の動き量に基づいて制御したQp値を設定する。例えば、圧縮符号化部212は、全ての画素が特定領域に属するマクロブロックについては、該マクロブロックを構成する各画素に対応する動き量の平均値Avを求め、該マクロブロックに設定するQp値を「40+Av」とする。
例えば、図5(b)で示されるようなヒストグラムをもつ画素(図3の画素位置370における画素など)で構成されるマクロブロックでは、動き量の平均値が〜8となるため、特定領域用のQp値「40」に動き量の8を足して、Qp値「48」を設定する。同様に植生領域であっても、建物の前にある芝領域に存在する画素位置380における画素で構成されるマクロブロックでは、動き量が〜3であるため、特定領域用のQp値「40」に動き量の3を足して、Qp値「43」を設定する。
なお、動き量の平均値に重みをつけてQp値「40」に加算することも考えられる。具体的には、重み係数をγとして、図3の画素位置370周辺の植生領域に設定されるQp値を「40+8γ」、図3の画素位置380周辺の植生領域に設定されるQp値を「40+3γ」としてもよい。γの大きさは1としてもよいし、動きがあるものにより大きな圧縮を行いたい場合には1より大きくしてもよい。さらに、本実施形態では、特定領域として植生領域のみを選択しているが、複数の異なる特定領域を選択して、重みに差をつけることも考えられる。具体的には、植生領域の重み係数γは1であるのに対し、水面領域も特定領域として動き量を考慮し、さらに水面領域の重み係数γを1.5とするようなケースも考えられる。但し、Qp値は整数単位でのみ設定が可能であるため、たとえ重み係数γが1.5で40+3γ=44.5となった場合でも、四捨五入などの処理を行って、整数値でQp値を設定する。その場合、ここでは、45がQp値として設定されることになる。
このように、同じ植生領域であっても、より動きの大きい所により大きなQp値を設定することで、重要な情報を含んでいるわけではないが、圧縮効率が低くビットレートの増大をまねくことになる背景の動き領域の画質を劣化させて、ビットレートを低減することが可能になる。そして背景分析部214は、背景画像における各マクロブロックに対するQp値を記憶部222に格納する。
<圧縮段階の処理について>
次に、圧縮段階にて画像処理装置100が行う処理について、図7のフローチャートに従って説明する。ステップS710では、画像取得部211は、上記のステップS410と同様にして、動画像を解析するために必要な設定を取得する。また、圧縮符号化部212は、記憶部222から圧縮符号化パラメータを取得する。本ステップで取得する圧縮符号化パラメータには、ROI用(前景領域用)のQp値(ここでは「32」とする)が含まれている。
ステップS720では、制御部223は、図4のフローチャートに従った処理で求めた、背景画像における各マクロブロックに対するQp値を記憶部222から取得する。ステップS730では、画像取得部211は、上記のステップS420と同様に、撮像部221によって撮像された動画像から、ステップS710で取得した各種設定に従って、連続する各フレームの撮像画像を生成する。
ステップS740では、前景抽出部215は、ステップS730で取得した撮像画像から検出ターゲットとなる前景(前景領域)を抽出する。ここでは、図3で示した道路のシーンを想定し、検出ターゲットは車と人とする。なお、前景の抽出は、各フレームの撮像画像について行ってもよいし、数フレーム間隔の撮像画像について行ってもよい。
画像解析による車や人の検出方法としては、機械学習、特にDeepLearningをベースとした手法が、高精度且つリアルタイム処理に対応可能な高速化を達成している手法として知られている。具体的には、YOLO(You Only Look Once)やSSD(Single Shot Multibox Detector)などがあげられるが、ここではSSDを用いた場合について示す。SSDは複数物体が写っている画像からそれぞれの物体を検出する方法の一つである。
SSDを用いて画像から人や車を検出する識別器を構築するために、複数の画像から車や人が写っている画像を集めて学習用データとして準備する。具体的には、画像中の人や車の領域を抽出し、その中心位置の座標と大きさを記載したファイルを作成する。このようにして準備した学習用データを学習し、画像から車や人を検出する識別器を構築する。
前景抽出部215は、このようにして生成された識別器を用いて撮像画像から車や人を検出すると、検出した車や人の領域(前景領域)の位置と大きさ(幅と高さ)を圧縮符号化部212に出力する。前景領域の位置は、撮像画像の左上の位置を原点とする座標系における該前景領域の中心位置とする。また、前景領域の大きさは、撮像画像の大きさ(幅と高さ)に対する該前景領域(幅と高さ)の割合とする。このようにして取得した前景領域の位置と大きさは、撮像画像内に車や人が複数検出される場合もあるので、リストとして圧縮符号化部212に出力される。
ステップS750では、圧縮符号化部212は、ステップS740で前景抽出部215から出力された「前景領域の位置および大きさ」で特定される「撮像画像上の前景領域」に対応する背景画像上の対応領域を特定する。そして圧縮符号化部212は、背景画像における各マクロブロックのうち、一部若しくは全部が該対応領域に含まれるマクロブロックを特定し、該特定したマクロブロックのQp値の代わりにROI用のQp値「32」が用いられるよう設定する。
ステップS760では、圧縮符号化部212は、撮像画像を複数のマクロブロックに分割し、該マクロブロックを、該マクロブロックに対応する背景画像のマクロブロックのQp値を用いて圧縮符号化する。そして通信制御部213は通信部224を制御し、このようにして全てのマクロブロックが圧縮符号化された撮像画像を、ネットワーク300を介してクライアント装置200に配信する。なお、通信部224による配信先は特定の配信先に限らない。例えば通信部224は、圧縮符号化済みの撮像画像を、クライアント装置200に加えて若しくは代えて他の装置に配信してもよいし、自身の記憶部222に格納してもよい。
ステップS770では、制御部223は、圧縮符号化を続ける(処理すべき撮像画像がある)か否かを判断し、続ける場合には、処理はステップS730に進み、続けない場合には、図7のフローチャートに従った処理は終了する。
このように、本実施形態では、所定時間分のフレームの撮像画像を分析することで生成及び抽出した背景画像および背景の動き量に基づいて、背景に対するQp値を設定する。これにより、常時動きがある植生など、ビットレートの上昇を招くものの重要な情報を含まない領域に対して、高圧縮で圧縮符号化を行うことが可能になる。さらに、本実施形態によれば、撮像画像におけるROIをROI用のQp値を用いて圧縮符号化し、ROIを除く領域を、背景画像において該領域に対応する対応領域に設定されているQp値を用いて圧縮符号化する。これにより、植生領域の前方をターゲットが通過した場合には前景の高画質化を優先し、そうでない場合には背景として低画質化することが可能となり、結果としてより効果的なビットレートの低減が可能となる。
<背景分析処理と前景抽出処理のタイミングについて>
本実施形態では、背景分析部214による背景分析に用いるフレーム数と対象とする時間(30fps全てを用いるのか、間引くのか)や、背景情報(背景画像や該背景画像における画素ごとの動き量)を更新するタイミングが重要となる。
背景分析にかける時間はユースケースに合わせて変える必要がある。例えば、一日分の動画像で背景分析を行って背景情報を月1回更新する場合と、数GOP(Group of picture)程度の動画像で分析を行って背景情報を数分ごとに更新する場合とでは、抽出したい背景の動きの意味合いが異なってくる。本実施形態では、図3に示すような一般道路の監視を対象としたユースケースを想定している。その場合、前者では、よく動く木立とあまり動きのない芝生の分布が抽出され、季節によって木立の状況が変われば背景情報を更新する。それに対して後者では、風の強さに応じた木立の動きの変化を反映させようとするが、分析に用いる時間スケールが短いために信号待ちをしている人や車も背景として処理される。本実施形態で示した10分程度の動画像を用いた背景分析は、信号待ちをしている車や人が背景として認識されない時間の背景分析である。そして1時間おきに背景情報を更新する場合には、天候の変化による風の強さの変化を反映できると考えている。特定領域として指定する領域を、植生ではなく水面などとすれば、同様のタイミングで海水面や湖面などにも適用可能だと考えている。
[第2の実施形態]
本実施形態を含む以下の各実施形態では、第1の実施形態との差分について説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。圧縮符号化の制御には、Qp値を指定する制御だけでなく、CBR(Constant Bit Rate)による制御がある。CBRによる制御は、ビットレートを一定に保つように、動画像に応じてQp値を変化させるものであり、動画像を記録するための容量を制御できるなどの利点があるが、動画像の内容によっては画質が大幅に低下するなどの弊害が生じる可能性がある。また、同じシーンの撮像であっても、風が強くて木立の揺れが大きい日とそうでない日では、設定されるQp値が異なることでメインの被写体の画質が変化するなどのケースも想定される。このような状況を防ぐために、本実施形態では、動きの大きな領域を選択的に低画質化してビットレートを制御する。
<分析段階の処理について>
分析段階にて画像処理装置100が行う処理について、図8のフローチャートに従って説明する。なお、図8のフローチャートにおいて、図4に示した処理ステップと同じ処理ステップには同じステップ番号を付しており、該処理ステップに係る説明は省略する。
ステップS810では画像取得部211は、ステップS410で取得する設定に加え、H.264に準拠した符号化を行う際のQp値に関し、一般背景用のQp値のROI用のQp値からの差分、特定領域用のQp値のROI用のQp値からの差分、を取得する。
ここでは、一般背景用のQp値のROI用のQp値からの差分(以下、「△一般背景用Qp値」と称する)として「4」を、特定領域用のQp値のROI用のQp値からの差分(以下、「△特定領域用Qp値」と称する)として「8」を取得する。
次に、ステップS850では、前景抽出部215は、ステップS430で生成した背景画像を複数の単位領域に分割する。そして前景抽出部215は、背景画像における各単位領域に対して差分Qp値を設定する。本実施形態でも、マクロブロックごとに差分Qp値を設定する。
前景抽出部215は、マクロブロックを構成する画素のうち1つでもステップS440における領域分割で得られた分割領域のうち非特定領域に属する場合、該マクロブロックは非特定領域に属すると判断する。そして前景抽出部215は、非特定領域に属すると判断したマクロブロックには、差分Qp値=α×△一般背景用Qp値を圧縮符号化パラメータとして設定する。ここで、αは重み係数である。
前景抽出部215は、マクロブロックを構成する全ての画素がステップS440における領域分割で得られた分割領域のうち特定領域に属する場合、該マクロブロックは特定領域に属すると判断する。そして前景抽出部215は、特定領域に属すると判断したマクロブロックには、差分Qp値=β×△特定領域用Qp値+γ×vを圧縮符号化パラメータとして設定する。ここで、βおよびγは重み係数(γは上記の通り)、vはマクロブロックを構成する各画素に対応する動き量の平均値である。そして前景抽出部215は、背景画像における各マクロブロックについて設定した差分Qp値を記憶部222に格納する。
<圧縮段階の処理について>
次に、圧縮段階にて画像処理装置100が行う処理について、図9のフローチャートに従って説明する。なお、図9のフローチャートにおいて、図7に示した処理ステップと同じ処理ステップには同じステップ番号を付しており、該処理ステップに係る説明は省略する。
ステップS910では、画像取得部211は、上記のステップS410と同様にして、動画像を解析するために必要な設定を取得する。また、圧縮符号化部212は、記憶部222から圧縮符号化パラメータを取得する。本ステップで取得する圧縮符号化パラメータには、ROI用のQp値(ここでは「32」とする)、ROI用のQp値のCBRの初期値(ここでは「38」とする)、CBRの目標ビットレートとして「2Mbps」、が含まれている。
ステップS920では、制御部223は、図8のフローチャートに従った処理で求めた、背景画像における各マクロブロックに対する差分Qp値を記憶部222から取得する。
次に、ステップS950では、圧縮符号化部212は、撮像画像におけるROI、特定領域、非特定領域のそれぞれに対するQp値を設定する。ビットレートを制御する方法には複数の方法が知られているが、ここでは最も単純な制御方法を採用する。つまり、初期Qp値を設定して圧縮符号化を行い、ビットレートが想定よりも大きければQp値を大きくし、ビットレートが想定よりも小さければQp値を小さくする、という制御方法を採用する。初期qP値としては、想定より非常に大きなビットレートとなってしまって配信やストレージを圧迫することを防ぐために、比較的低画質のQp値とする。ここでは一例として、圧縮符号化部212は、撮像画像におけるROI、特定領域、非特定領域のそれぞれに対するQp値として以下のようなQp値を設定する。
ROI用のQp値 = R
特定領域用のQp値 = R+(β×△特定領域用Qp値+γ×v)
非特定領域用のQp値= R+(α×△一般領域用Qp値)
ここで、特定領域用のQp値における「(β×△特定領域用Qp値+γ×v)」の項は、特定領域におけるマクロブロックに対応する背景画像中のマクロブロックに設定された差分Qp値である。また、非特定領域用のQp値における「(α×△一般領域用Qp値)」の項は、非特定領域におけるマクロブロックに対応する背景画像中のマクロブロックに設定された差分Qp値である。
ここで、Rの初期値を「38」とし、α、β、γの初期値を「1」とする。この場合、ROI用のQp値、特定領域用のQp値、非特定領域用のQp値はそれぞれ以下のようになる。
ROI用のQp値 = 38
特定領域用のQp値 = 38+(8×β+v)
非特定領域用のQp値= 38+(4×α)
次に、ステップS960では、圧縮符号化部212は、撮像画像をROI用のQp値、特定領域用のQp値、非特定領域用のQp値、を用いて圧縮符号化を行う。ROIはROI用のQp値を用いて圧縮符号化し、特定領域は特定領域用のQp値を用いて圧縮符号化し、非特定領域は非特定領域用のQp値を用いて圧縮符号化する。そして圧縮符号化部212は、圧縮符号化の結果のビットレートが目標ビットレートに近づくように、Rの値を減じる。よって、次の圧縮符号化では、この減じたRが反映されたQp値を用いて圧縮符号化が行われる。
例えば、圧縮符号化部212は、圧縮符号化の結果のビットレートが目標ビットレートよりも小さい場合には、Rの値を減じる(Rが32に達した場合には、これ以上Rを減じない)。最初は圧縮符号化の結果が目標ビットレートより小さいことが想定されるので、Rを初期値である38から1ずつ値を減らしていく。但しビットレートが目標値の半分以下の場合には2ずつ減らしてもよい。
そして、Rが32に達しても、まだ現在のビットレートが目標ビットレートよりも小さい場合には、圧縮符号化部212は、Rを32に固定したまま、α、βを小さくし、特定領域用のQp値および非特定領域用のQp値とROI用のQp値との差異を小さくすることで、背景の画質劣化を軽減する。
α、βが0に達しても、まだ現在のビットレートが目標ビットレートよりも小さい場合には、圧縮符号化部212は、Rを32に固定し且つα及びβを0に固定したまま、γを小さくする(Qp値への動き量の平均値の寄与度を小さくする)。α、β、γの縮小の仕方は特定の仕方に限らず、例えば、α、βが0.5以下になったらγを小さくしたり、α、β、γを同時に決められた比率(例えばα:β:γ=4:2:1)で小さくしたりしてもよい。
また、圧縮符号化部212は、Rが32に達する前に現在のビットレートが目標ビットレートよりも大きくなってしまった場合には、Rを32にしても現在のビットレートが目標ビットレートより小さくなるように、重み係数α、β、γを大きくして調節する。その際、最初に大きくするのは、重み係数γとする。そして重み係数γを15まで大きくしても、現在のビットレートが目標ビットレートよりも大きい場合には、次に重み係数βを大きくし、最後に重み係数αを大きくする。ここでも、重み係数α、β、γの調整の仕方には複数の方法があり、ユースケースに応じて変更するなどしてもよい。
このように、本実施形態では、CBRでビットレート制御を行う際に、ROIの画質は下げずに動画像の配信を行うことが可能になる。その際に、動きのある背景、植生領域などの特定領域、一般背景をそれぞれ異なる重みで制御することが可能となる。特に、動きのある背景を最初に低画質化し、次に植生領域などの特定領域、最後に一般背景を低画質化することにより、より情報量が少なくビットレートを上げやすい領域から低画質化することが可能になる。
[第3の実施形態]
上記の各実施形態では、H.264やH.265のような動画像圧縮に特徴的な、IフレームとPフレームの違いに基づくQp値の制御は行っておらず、両者に共通のQp値を設定してきた。しかし、Iフレームはフレーム内の情報を用いて圧縮するのに比べて、Pフレームは前フレームからの差分のみを圧縮するため、背景の動きの影響はPフレームでより大きくなる。よって、Iフレームの撮像画像についてはγ=0としたQp値(動き量に依存しないQp値)を用いて圧縮符号化し、Pフレームについては上記の実施形態と同様にγを設定したQp値(動き量に依存するQp値)を用いて圧縮符号化する。そのように設定することで、圧縮効果は小さくなるが、動画像の画質は大きく向上させることができる。その理由は、Pフレームで設定されるQp値が大きくなると、対象となる単位領域(マクロブロック)がスキップになりやすくなり、前フレームの値がそのまま用いられることになる。そうすると、比較的高画質で圧縮したIフレームの値がそのまま用いられ、木の揺れによる動きの変化は正確に反映されないが、比較的きれいな背景の動画像となる。もしくは、動き量が大きい場合には、Pフレームにおいてスキップとなるように設定する方法もある。
このような処理を行うと、植生領域が大きな公園などのユースシーンの場合、木々の細かい揺れなどの不必要な情報のみを失うだけで、画質が維持された動画像を取得することが可能になる。
[第4の実施形態]
上記の各実施形態では、画像処理装置100とクライアント装置200とがネットワーク300を介して接続されている構成を例にとり説明したが、これに限らず、画像処理装置100とクライアント装置200とを一体化させてもよい。
また、上記の各実施形態では、背景分析部214による背景分析処理や前景抽出部215による前景抽出処理を、アクセラレータ部225を含んだ画像処理装置100で行うケースについて説明した。しかし、特に背景分析処理に関しては、一旦動画像を配信した後でクライアント装置200などのコンピュータ装置において行ってもよいし、外部より付加したアクセラレータ部で行ってもよい。また、画像処理装置100にて撮像された動画像を該画像処理装置100に挿入されているSDカードなどの記録媒体に記録し、ネットワーク300に接続されていないコンピュータ装置に該記録媒体を挿入して該動画像を該コンピュータ装置にコピーしてもよい。これにより、該コンピュータ装置は、該動画像に対して上記の背景分析処理や前景抽出処理等を行うことができる。
また、上記の説明において使用した数値、処理タイミング、処理順などは、具体的な説明を行うために一例として挙げたものであり、これらの数値、処理タイミング、処理順などに限定することを意図したものではない。
また、以上説明した各実施形態の一部若しくは全部を適宜組み合わせて使用しても構わない。また、以上説明した各実施形態の一部若しくは全部を選択的に使用しても構わない。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
211:画像取得部 212:圧縮符号化部 213:通信制御部 214:背景分析部 215:前景抽出部

Claims (16)

  1. 複数の画像から同じ画素位置における画素値を取得し、該取得した画素値の頻度分布に基づき、背景画像における該画素位置の画素値および動き量を決定する決定手段と、
    前記背景画像に対して圧縮符号化パラメータを設定する設定手段と
    を備え、
    前記設定手段は、
    前記背景画像における特定領域には、該特定領域に属する画素の動き量に応じた圧縮符号化パラメータを設定する
    ことを特徴とする画像処理装置。
  2. 前記決定手段は、複数の画像から同じ画素位置の画素値を取得し、該取得した画素値の頻度分布において最も高い頻度の画素値を、前記背景画像における該画素位置の画素値として決定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記決定手段は、複数の画像から同じ画素位置の画素値を取得し、該取得した画素値の頻度分布において最も高い頻度の画素値およびその近傍の画素値のそれぞれに対応する頻度の合計値を求め、該頻度分布における頻度の総数に対する該合計値の割合の逆数を、前記背景画像における該画素位置の動き量として決定することを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記決定手段は、複数の画像から同じ画素位置の画素値を取得し、該取得した画素値の頻度分布において最も高い頻度の、該頻度分布における頻度の総数に対する割合の逆数を、前記背景画像における該画素位置の動き量として決定することを特徴とする請求項1または2に記載の画像処理装置。
  5. 前記設定手段は、前記背景画像を分割した複数の単位領域のうち特定領域に属する単位領域について、該単位領域に属する画素の動き量の平均値が大きいほど大きい量子化パラメータ値を設定することを特徴とする請求項1ないし4の何れか1項に記載の画像処理装置。
  6. 前記特定領域に属する単位領域に設定する量子化パラメータ値は、特定領域用の量子化パラメータ値と、該単位領域に属する画素の動き量の平均値と、に基づく量子化パラメータ値であることを特徴とする請求項5に記載の画像処理装置。
  7. 前記特定領域に属する単位領域に設定する量子化パラメータ値は、特定領域用の量子化パラメータ値の前景領域用の量子化パラメータ値からの差分と、該単位領域に属する画素の動き量の平均値と、に基づく量子化パラメータ値であることを特徴とする請求項5に記載の画像処理装置。
  8. 更に、
    圧縮符号化の対象となる画像から前景領域を抽出する抽出手段と、
    前記前景領域を前景領域用の圧縮符号化パラメータを用いて圧縮符号化し、該画像において該前景領域を除く領域を、前記背景画像において該領域に対応する対応領域に設定されている圧縮符号化パラメータを用いて圧縮符号化する圧縮符号化手段と
    を備えることを特徴とする請求項1ないし7の何れか1項に記載の画像処理装置。
  9. 前記圧縮符号化手段は、
    前記圧縮符号化手段による圧縮符号化のビットレートが目標ビットレートよりも小さい場合には、前景領域用の第1圧縮符号化パラメータ、前記圧縮符号化の対象となる画像において前記背景画像の特定領域に対応する領域用の第2圧縮符号化パラメータ、前記圧縮符号化の対象となる画像において前記背景画像の非特定領域に対応する領域用の第3圧縮符号化パラメータ、を制御する
    ことを特徴とする請求項8に記載の画像処理装置。
  10. 前記圧縮符号化手段は、
    前記圧縮符号化手段による圧縮符号化のビットレートが目標ビットレートよりも小さい場合には、前記第1圧縮符号化パラメータと、前記第2圧縮符号化パラメータおよび前記第3圧縮符号化パラメータと、の差異を小さくするように制御する
    ことを特徴とする請求項9に記載の画像処理装置。
  11. 前記圧縮符号化手段は、
    前記圧縮符号化手段による圧縮符号化のビットレートが目標ビットレートよりも小さい場合には、前記第2圧縮符号化パラメータへの、前記特定領域に属する画素の動き量の寄与度を小さくするように制御する
    ことを特徴とする請求項9または10に記載の画像処理装置。
  12. 前記圧縮符号化手段は、
    前記圧縮符号化の対象となる画像がIフレームの場合には、該画像において前記特定領域に対応する対応領域を、該特定領域に属する画素の動き量に依存しない圧縮符号化パラメータを用いて圧縮符号化し、
    前記圧縮符号化の対象となる画像がPフレームの場合には、該画像において前記特定領域に対応する対応領域を、該特定領域に属する画素の動き量に依存する圧縮符号化パラメータを用いて圧縮符号化する
    ことを特徴とする請求項8に記載の画像処理装置。
  13. 更に、
    前記圧縮符号化手段による圧縮符号化の結果を配信する配信手段を備えることを特徴とする請求項8ないし12の何れか1項に記載の画像処理装置。
  14. 更に、撮像手段を備え、
    前記複数の画像および前記圧縮符号化の対象となる画像は前記撮像手段によって撮像された撮像画像であることを特徴とする請求項8に記載の画像処理装置。
  15. 画像処理装置が行う画像処理方法であって、
    前記画像処理装置の決定手段が、複数の画像から同じ画素位置における画素値を取得し、該取得した画素値の頻度分布に基づき、背景画像における該画素位置の画素値および動き量を決定する決定工程と、
    前記画像処理装置の設定手段が、前記背景画像に対して圧縮符号化パラメータを設定する設定工程と
    を備え、
    前記設定工程では、
    前記背景画像における特定領域には、該特定領域に属する画素の動き量に応じた圧縮符号化パラメータを設定する
    ことを特徴とする画像処理方法。
  16. コンピュータを、請求項1ないし13の何れか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。
JP2020075607A 2020-04-21 2020-04-21 画像処理装置、画像処理方法 Withdrawn JP2021175035A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020075607A JP2021175035A (ja) 2020-04-21 2020-04-21 画像処理装置、画像処理方法
US17/230,785 US20210329285A1 (en) 2020-04-21 2021-04-14 Image processing apparatus, image processing method, and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020075607A JP2021175035A (ja) 2020-04-21 2020-04-21 画像処理装置、画像処理方法

Publications (2)

Publication Number Publication Date
JP2021175035A true JP2021175035A (ja) 2021-11-01
JP2021175035A5 JP2021175035A5 (ja) 2023-04-27

Family

ID=78082820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020075607A Withdrawn JP2021175035A (ja) 2020-04-21 2020-04-21 画像処理装置、画像処理方法

Country Status (2)

Country Link
US (1) US20210329285A1 (ja)
JP (1) JP2021175035A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022070449A (ja) * 2020-10-27 2022-05-13 セイコーエプソン株式会社 識別方法、画像表示方法、識別システム、画像表示システム、及びプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3067628B2 (ja) * 1996-01-19 2000-07-17 日本電気株式会社 画像符号化装置
JP3116994B2 (ja) * 1996-08-29 2000-12-11 富士ゼロックス株式会社 画質予測装置および方法ならびに画質制御装置および方法
GB2382940A (en) * 2001-11-27 2003-06-11 Nokia Corp Encoding objects and background blocks
WO2008105406A1 (ja) * 2007-02-27 2008-09-04 Nec Corporation データ収集システム、データ収集方法、およびデータ収集プログラム
US20090027517A1 (en) * 2007-07-25 2009-01-29 Micron Technology, Inc. Method, apparatus, and system for pre-compression assessment of compressed data length
US8094943B2 (en) * 2007-09-27 2012-01-10 Behavioral Recognition Systems, Inc. Background-foreground module for video analysis system
JP4544334B2 (ja) * 2008-04-15 2010-09-15 ソニー株式会社 画像処理装置および画像処理方法
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
KR101675116B1 (ko) * 2009-08-06 2016-11-10 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US20110274162A1 (en) * 2010-05-04 2011-11-10 Minhua Zhou Coding Unit Quantization Parameters in Video Coding
JP5496976B2 (ja) * 2011-09-21 2014-05-21 富士フイルム株式会社 撮影装置、撮影プログラム、及び撮影方法
GB201312382D0 (en) * 2013-07-10 2013-08-21 Microsoft Corp Region-of-interest aware video coding
US9584814B2 (en) * 2014-05-15 2017-02-28 Intel Corporation Content adaptive background foreground segmentation for video coding
GB201417536D0 (en) * 2014-10-03 2014-11-19 Microsoft Corp Adapting quantization
KR20180105294A (ko) * 2017-03-14 2018-09-28 한국전자통신연구원 이미지 압축 장치
US11025913B2 (en) * 2019-03-01 2021-06-01 Intel Corporation Encoding video using palette prediction and intra-block copy

Also Published As

Publication number Publication date
US20210329285A1 (en) 2021-10-21

Similar Documents

Publication Publication Date Title
US20220312021A1 (en) Analytics-modulated coding of surveillance video
WO2021244341A1 (zh) 图像编码方法及装置、电子设备及计算机可读存储介质
CN109587480B (zh) 图像处理设备、图像处理方法和记录介质
KR101001033B1 (ko) 비디오 인코더 성능을 향상시키기 위한 적응형 필터링
JP7213662B2 (ja) 画像処理装置、画像処理方法
US10582196B2 (en) Generating heat maps using dynamic vision sensor events
US8009963B2 (en) Adaptive filtering to enhance video bit-rate control performance
US20100309975A1 (en) Image acquisition and transcoding system
JP2021013146A (ja) 画像処理装置、画像処理方法
US20090290645A1 (en) System and Method for Using Coded Data From a Video Source to Compress a Media Signal
CN112771859A (zh) 基于感兴趣区域的视频数据编码方法、装置和存储介质
US10735724B2 (en) Method and device for compressing image on basis of photography information
US10999577B2 (en) Quantization parameter determination method and image capture apparatus
JP2011091510A (ja) 画像処理装置およびその制御方法
US10917648B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2021175035A (ja) 画像処理装置、画像処理方法
KR102445008B1 (ko) 이벤트 기반 영상 센싱 장치 및 방법
CN114157870A (zh) 编码方法、介质及电子设备
JPH1051770A (ja) 画像符号化システム及び方法、及び画像分割システム
CN113489993A (zh) 编码方法、装置、编码器、设备及计算机可读存储介质
WO2020195767A1 (ja) 3dモデル送信装置、及び、3dモデル受信装置
JP5153660B2 (ja) 画像処理装置および画像処理方法、ならびにプログラム
US11533484B1 (en) Method and system for optimizing image and video compression for machine vision
CN112788364B (zh) 码流动态调整装置、方法及计算机可读存储介质
CN111050175A (zh) 视频编码的方法和装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230419

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20231106