JP2021039642A - 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム - Google Patents
符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム Download PDFInfo
- Publication number
- JP2021039642A JP2021039642A JP2019161826A JP2019161826A JP2021039642A JP 2021039642 A JP2021039642 A JP 2021039642A JP 2019161826 A JP2019161826 A JP 2019161826A JP 2019161826 A JP2019161826 A JP 2019161826A JP 2021039642 A JP2021039642 A JP 2021039642A
- Authority
- JP
- Japan
- Prior art keywords
- image
- target
- candidate
- area
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
Description
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定するステップと、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別するステップと
を有する対象識別方法が提供される。
(a)所定以上の大きさと、基準向きに対し所定以上の角度をなす向きとを有する順方向予測の動きベクトル、
(b)所定以上の大きさを有する画面内予測の符号量、及び
(c)所定以下の大きさを有する量子化ステップサイズ
のうちの少なくとも1つであって、当該単位画像区域はマクロブロックであることも好ましい。
当該少なくとも1つの候補画像領域のそれぞれを入力とし、当該候補画像領域の特徴に係る特徴情報をそれぞれ出力する少なくとも1つの畳み込み層部(Convolutional Layers)と、
上記の少なくとも1つの畳み込み層部から出力される特徴情報を取りまとめて入力とし、当該対象のクラスに係る情報を出力する全結合層部(Fully-Connected Layers)と
を含むことも好ましい。
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定する候補領域決定手段と、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別する対象識別手段と
を有する対象識別装置が提供される。
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報であって、クライアントから当該画像データとともに取得された位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定する候補領域決定手段と、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別する対象識別手段と
を有する対象識別サーバが提供される。
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定する候補領域決定手段と、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別する対象識別手段と
してコンピュータを機能させる対象識別プログラムが提供される。
図1は、本発明による対象識別装置(サーバ)及びクライアントを備えた対象識別システムの一実施形態を説明するための模式図及び機能ブロック図である。
(a)移動可能なクライアントである少なくとも1つの端末20と、
(b)端末20から、所定の対象を画像内に含み得る画像データを取得可能なサーバであるクラウドサーバ1と
を有し、クラウドサーバ1において、当該画像データから所定の対象が識別されるのである。
(A)識別処理対象である画像データを含む映像データを符号化した際に決定される「符号化パラメータ」が所定条件を満たすことになる「単位画像区域」の画像内での位置に係る情報に基づき、当該画像データにおいて、所定の対象に係る少なくとも1つの「候補画像領域」を決定する候補領域決定部112と、
(B)決定された少なくとも1つの「候補画像領域」を入力とし、所定の対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから所定の対象を識別する対象識別部113と
を有することを特徴としている。
(a)順方向予測の動きベクトルが、所定以上の大きさと、基準向き(例えば、消失点(画像内地平線上の収束点)へ向かう向き)に対し所定以上の角度をなす向きとを有している、
(b)画面内予測の符号量が、所定以上の大きさを有する、及び
(c)量子化ステップサイズが、所定以下の大きさを有する
との3つの条件のうちの1つ、2つ又は全部が満たされる「マクロブロック」であることも好ましい。
図1に示した機能ブロック図によれば、クラウドサーバ1は、通信インタフェース101と、プロセッサ・メモリとを有する。ここで、このプロセッサ・メモリは、本発明による対象識別プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この対象識別プログラムを実行することによって、対象識別処理を実施する。
(a)符号化パラメータが所定条件を満たすことになるマクロブロックの画像内における位置情報、例えばマクロブロックアドレスや、マクロブロックの画像内位置座標値、又は
(b)符号化パラメータマップ
とすることができる。
(a)順方向予測の動きベクトルが、所定以上の大きさと、消失点へ向かう基準向きに対し所定以上の角度をなす向きとを有している、
(b)画面内予測の符号量が、所定以上の大きさを有する、及び
(c)量子化ステップサイズが、所定以下の大きさを有する
との3つの条件のうちの1つ、2つ又は全部(いずれを採用するかは予め設定される)が満たされるマクロブロックの画像内位置情報となっている。
(a)この基準対象位置(所定条件を満たすマクロブロックの画像内位置)を含む第1の候補画像領域と、
(b)第1の候補画像領域の全体(又は所定以上の部分)を含む第2の候補画像領域と、
(c)第2の候補画像領域の全体(又は所定以上の部分)を含む第3の候補画像領域と
を決定しているのである。
(a)決定された基準対象位置を含む第1の候補画像領域と、
(b)第1の候補画像領域を自らの中央に配し、且つ第1の候補画像領域の全体を包含する第2の候補画像領域と、
(c)第2の候補画像領域を自らの中央に配し、且つ第2の候補画像領域の全体を包含する第3の候補画像領域と
を決定することができる。
(a)基準対象位置が自らの下部又は下端となっており、且つ第1の候補画像領域の全体を包含する第2の候補画像領域と、同じく基準対象位置が自らの下部又は下端となっており、且つ第2の候補画像領域の全体を包含する第3の候補画像領域と
を決定してもよく、または、
(b)第1の候補画像領域を自らの中央に配し、且つ第1の候補画像領域の全体を包含する第2の候補画像領域と、第2の候補画像領域を自らの中央に配し、且つ第2の候補画像領域の全体を包含する第3の候補画像領域と
を決定することも可能である。
(1) S1=fs(a)
で表すことができる。
(a)複数の(本実施例では3つの)候補画像領域のそれぞれを入力とし、当該候補画像領域の特徴に係る特徴情報をそれぞれ出力する複数の畳み込み層部(Convolutional Layers)と、
(b)上記(a)の複数の畳み込み層部から出力される特徴情報を取りまとめて入力とし、所定の対象(本実施例では自動車)のクラスに係る情報(例えばクラス"自動車"とそのスコア)を出力する全結合層部(Fully-Connected Layers)と
を含む構成となっている。
同じく図1に示した機能ブロック図によれば、端末20は、通信インタフェース201と、カメラ202と、ディスプレイ(DP)203と、プロセッサ・メモリとを有する。ここで、このプロセッサ・メモリは、本発明に係る画像データ提供プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この画像データ提供プログラムを実行することによって、画像データ提供処理を実施する。
(a)順方向予測の動きベクトルが、所定以上の大きさと、消失点へ向かう基準向きに対し所定以上の角度をなす向きとを有している、
(b)画面内予測の符号量が、所定以上の大きさを有する、及び
(c)量子化ステップサイズが、所定以下の大きさを有する
との3つの条件のうちの1つ、2つ又は全部(いずれを採用するかは予め設定される)が満たされるマクロブロックを選別する。ちなみにこのような条件を満たす符号化パラメータは、おしなべて言えば画像の時間的変動が所定以上に大きいことを示すものとなっている。
(a)符号化パラメータが所定条件を満たすことになるマクロブロックの画像内における位置情報、例えばマクロブロックアドレスや、マクロブロックの画像内位置座標値、又は
(b)符号化パラメータマップ
を生成し、この「マクロブロック位置情報」をクラウドサーバ1へ通知するのである。
101、201 通信インタフェース
111 画像取得部
112 候補領域決定部
113 対象識別部
114 学習データ生成部
115 学習モデル生成部
116 送受信制御部
2 自動車
20 端末(クライアント)
202 カメラ
203 ディスプレイ(DP)
211 映像生成部
212 符号化パラメータ抽出部
213 マクロブロック選別部
214 有意映像ストリーム生成部
215 提示情報生成部
216 送受信制御部
Claims (11)
- 所定の対象を画像内に含み得る画像データから当該対象を識別するコンピュータにおける対象識別方法であって、
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定するステップと、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別するステップと
を有することを特徴とする対象識別方法。 - 前記候補画像領域を決定するステップにおいて、当該候補画像領域として、当該単位画像区域の画像内での位置を含む第1の候補画像領域と、第n(nは2からN(≧2)までの各整数)の候補画像領域であって、第(n−1)の候補画像領域の全体又は所定以上の部分を含む第nの候補画像領域とからなるN個の候補画像領域を決定することを特徴とする請求項1に記載の対象識別方法。
- 第nの候補画像領域は、第(n−1)の候補画像領域を自らの中央に配し、且つ第(n−1)の候補画像領域の全体を包含するように決定されることを特徴とする請求項2に記載の対象識別方法。
- 第1の候補画像領域は、当該単位画像区域の画像内での位置が、自らの下部又は下端となるように決定されることを特徴とする請求項2に記載の対象識別方法。
- 第1の候補画像領域は、当該単位画像区域の画像内での位置における画像下端からの距離が小さいほど、より大きな面積を有するように決定されることを特徴とする請求項2から4のいずれか1項に記載の対象識別方法。
- 第1の候補画像領域は、当該単位画像区域の画像内での位置における消失点からの距離が大きいほど、より大きな面積を有するように決定されることを特徴とする請求項2から5のいずれか1項に記載の対象識別方法。
- 当該映像データの符号化はMPEG(Moving Picture Experts Group)による符号化であり、所定条件を満たす符号化パラメータは、
(a)所定以上の大きさと、基準向きに対し所定以上の角度をなす向きとを有する順方向予測の動きベクトル、
(b)所定以上の大きさを有する画面内予測の符号量、及び
(c)所定以下の大きさを有する量子化ステップサイズ
のうちの少なくとも1つであって、当該単位画像区域はマクロブロックであることを特徴とする請求項1から6のいずれか1項に記載の対象識別方法。 - 当該識別器は、
当該少なくとも1つの候補画像領域のそれぞれを入力とし、当該候補画像領域の特徴に係る特徴情報をそれぞれ出力する少なくとも1つの畳み込み層部(Convolutional Layers)と、
前記少なくとも1つの畳み込み層部から出力される特徴情報を取りまとめて入力とし、当該対象のクラスに係る情報を出力する全結合層部(Fully-Connected Layers)と
を含むことを特徴とする請求項1から7のいずれか1項に記載の対象識別方法。 - 所定の対象を画像内に含み得る画像データから当該対象を識別する装置であって、
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定する候補領域決定手段と、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別する対象識別手段と
を有することを特徴とする対象識別装置。 - クライアントで生成された、所定の対象を画像内に含み得る画像データを取得し、当該対象を識別するサーバであって、
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報であって、前記クライアントから当該画像データとともに取得された位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定する候補領域決定手段と、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別する対象識別手段と
を有することを特徴とする対象識別サーバ。 - 所定の対象を画像内に含み得る画像データから当該対象を識別するコンピュータを機能させるプログラムであって、
当該画像データを含む映像データを符号化した際に決定される符号化パラメータが所定条件を満たすことになる単位画像区域の画像内での位置に係る情報に基づき、当該画像データにおいて、当該対象に係る少なくとも1つの候補画像領域を決定する候補領域決定手段と、
決定された当該少なくとも1つの候補画像領域を入力とし、当該対象のクラスに係る情報を出力する学習済みの識別器を用いて、当該画像データから当該対象を識別する対象識別手段と
してコンピュータを機能させることを特徴とする対象識別プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019161826A JP7143263B2 (ja) | 2019-09-05 | 2019-09-05 | 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019161826A JP7143263B2 (ja) | 2019-09-05 | 2019-09-05 | 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021039642A true JP2021039642A (ja) | 2021-03-11 |
JP7143263B2 JP7143263B2 (ja) | 2022-09-28 |
Family
ID=74847184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019161826A Active JP7143263B2 (ja) | 2019-09-05 | 2019-09-05 | 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7143263B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115861330A (zh) * | 2023-03-03 | 2023-03-28 | 深圳市小辉智驾智能有限公司 | 摄像头图像数据传输方法、识别方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011134207A (ja) * | 2009-12-25 | 2011-07-07 | Konica Minolta Holdings Inc | 運転記録装置および地図作成システム |
JP2013114596A (ja) * | 2011-11-30 | 2013-06-10 | Kddi Corp | 画像認識装置及び方法 |
JP2015215868A (ja) * | 2014-04-25 | 2015-12-03 | 本田技研工業株式会社 | 対象物認識装置 |
JP2016031576A (ja) * | 2014-07-28 | 2016-03-07 | クラリオン株式会社 | 物体検出装置 |
JP2018517972A (ja) * | 2015-05-08 | 2018-07-05 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 複数の境界領域を減らすためのシステムおよび方法 |
JP2018124689A (ja) * | 2017-01-31 | 2018-08-09 | 株式会社日立製作所 | 移動物体検出装置、移動物体検出システム、及び移動物体検出方法 |
JP2018147431A (ja) * | 2017-03-09 | 2018-09-20 | コニカミノルタ株式会社 | 画像認識装置及び画像認識方法 |
-
2019
- 2019-09-05 JP JP2019161826A patent/JP7143263B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011134207A (ja) * | 2009-12-25 | 2011-07-07 | Konica Minolta Holdings Inc | 運転記録装置および地図作成システム |
JP2013114596A (ja) * | 2011-11-30 | 2013-06-10 | Kddi Corp | 画像認識装置及び方法 |
JP2015215868A (ja) * | 2014-04-25 | 2015-12-03 | 本田技研工業株式会社 | 対象物認識装置 |
JP2016031576A (ja) * | 2014-07-28 | 2016-03-07 | クラリオン株式会社 | 物体検出装置 |
JP2018517972A (ja) * | 2015-05-08 | 2018-07-05 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 複数の境界領域を減らすためのシステムおよび方法 |
JP2018124689A (ja) * | 2017-01-31 | 2018-08-09 | 株式会社日立製作所 | 移動物体検出装置、移動物体検出システム、及び移動物体検出方法 |
JP2018147431A (ja) * | 2017-03-09 | 2018-09-20 | コニカミノルタ株式会社 | 画像認識装置及び画像認識方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115861330A (zh) * | 2023-03-03 | 2023-03-28 | 深圳市小辉智驾智能有限公司 | 摄像头图像数据传输方法、识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7143263B2 (ja) | 2022-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230336754A1 (en) | Video compression using deep generative models | |
EP3722992B1 (en) | System and method for pre-processing images captured by a vehicle | |
CN106162177B (zh) | 视频编码方法和装置 | |
US11727255B2 (en) | Systems and methods for edge assisted real-time object detection for mobile augmented reality | |
CN114079779B (zh) | 图像处理方法、智能终端及存储介质 | |
CN112771859A (zh) | 基于感兴趣区域的视频数据编码方法、装置和存储介质 | |
EP3975133A1 (en) | Processing of images captured by vehicle mounted cameras | |
Chan et al. | Influence of AVC and HEVC compression on detection of vehicles through Faster R-CNN | |
KR102179077B1 (ko) | 상용분류기 외부 연동 학습형 신경망을 이용한 압축영상에 대한 신택스 기반의 객체 분류 방법 | |
JP7143263B2 (ja) | 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム | |
KR20230040287A (ko) | 영상정보의 비트스트림정보에 기반하여 객체의 낙상이벤트를 감지하는 방법 및 시스템 | |
US12113957B2 (en) | Program, device, and method for generating significant video stream from original video stream | |
JP7145830B2 (ja) | 符号化パラメータ特徴量を利用した対象識別方法、装置及びプログラム | |
WO2020241269A1 (ja) | 映像伝送システム、映像送信装置、映像受信装置、映像配信方法、映像送信方法、映像受信方法およびコンピュータプログラム | |
Khan et al. | Data rate estimation based on scene complexity for dynamic vision sensors on unmanned vehicles | |
JP7211373B2 (ja) | 動画像解析装置、動画像解析システム、動画像解析方法、及びプログラム | |
EP4120684A1 (en) | Method and system for optimizing image and video compression for machine vision | |
EP4120683A1 (en) | Method and system for optimizing image and video compression for machine vision | |
JP7533601B2 (ja) | 情報処理装置、情報処理システム、情報処理方法 | |
KR102178952B1 (ko) | 압축영상에 대한 신택스 기반의 mrpn-cnn을 이용한 객체 분류 방법 | |
CN115294429A (zh) | 一种基于特征域网络训练方法和装置 | |
JP7269134B2 (ja) | 映像ストリームに影響した外的要因情報を推定するプログラム、サーバ、システム、端末及び方法 | |
WO2023199696A1 (ja) | 映像圧縮方法、映像圧縮装置、及びコンピュータプログラム | |
US20230100728A1 (en) | A system, an arrangement, a computer software module arrangement, a circuitry arrangement and a method for improved image processing utilzing two entities | |
KR20230089558A (ko) | 영상 전송 장치 및 방법, 그리고 영상 수신 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210716 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7143263 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |