JP6719457B2 - 画像の主要被写体を抽出する方法とシステム - Google Patents
画像の主要被写体を抽出する方法とシステム Download PDFInfo
- Publication number
- JP6719457B2 JP6719457B2 JP2017521554A JP2017521554A JP6719457B2 JP 6719457 B2 JP6719457 B2 JP 6719457B2 JP 2017521554 A JP2017521554 A JP 2017521554A JP 2017521554 A JP2017521554 A JP 2017521554A JP 6719457 B2 JP6719457 B2 JP 6719457B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- main subject
- processing target
- area
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 102
- 238000012545 processing Methods 0.000 claims description 97
- 238000001514 detection method Methods 0.000 claims description 50
- 238000000605 extraction Methods 0.000 claims description 44
- 230000011218 segmentation Effects 0.000 claims description 17
- 230000002093 peripheral effect Effects 0.000 claims description 12
- PICXIOQBANWBIZ-UHFFFAOYSA-N zinc;1-oxidopyridine-2-thione Chemical class [Zn+2].[O-]N1C=CC=CC1=S.[O-]N1C=CC=CC1=S PICXIOQBANWBIZ-UHFFFAOYSA-N 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000012795 verification Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 24
- 238000003709 image segmentation Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/143—Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Description
本出願は画像処理の技術分野に関し、具体的には画像の主要被写体を抽出する方法に関する。本出願はまた、画像の主要被写体を抽出するシステムに関する。
近年、技術の発展と人々の概念の遷移と共に、オンラインショッピングが徐々にショッピングの主流の1つになっている。オンラインショッピングプラットホームはうまく開発されている。このような状況下で、オンラインショッピングプラットホームは大量の製品画像を蓄積してきた。これらの製品画像を効果的に編成し、解析し、取り出し、消費者へ表示する方法が極めて重要になった。
一態様では、本開示は、画像の主要被写体のコンテンツの正確な判断および抽出を実現するために画像の主要被写体を抽出する方法に向けられる。本方法は、規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断する工程を含み得る。本方法はまた、認識対象領域が存在する場合、処理対象画像の主要被写体を含む主要被写体領域を主要被写体領域の事前設定特徴パラメータと認識対象領域の座標および大きさとに従って判断する工程を含み得る。本方法はさらに、前景ターゲットの抽出処理のための前景画像として主要被写体領域の画像を抽出し、抽出された画像を処理対象画像の主要被写体として取得する工程を含み得る。
背景技術において述べたように、既存画像抽出技術は画像抽出の効率と精度の両方を考慮し得ない。この目的のため、本開示は画像の主要被写体を抽出する方法を提案する。規定特徴に対応する認識対象領域が処理対象画像内に存在するということを判断した後、本方法は、処理対象画像の主要被写体を含む主要被写体領域を主要被写体領域の事前設定特徴パラメータと認識対象領域の座標および大きさとに従って判断する工程を含む。本方法はまた、前景ターゲットの抽出処理のための前景画像として主要被写体領域の画像を抽出する工程を含む。したがって、抽出された主要被写体は正確でありかつ信頼でき、主要被写体の抽出は自動化される。処理効率はそれに応じて改善される。
ここでmは近さ係数(closeness factor)である。この例では、スーパーピクセルの数は200として設定され、近さ係数は10として設定される。製品画像は約200個のスーパーピクセルブロックにセグメント化され得る。図2は、製品画像のスーパーピクセルセグメント化の例示的結果の概要図である。
ここでθは事前設定色閾値である。スーパーピクセルブロックの平均色値から画像の背景色までの距離がθより短ければ、スーパーピクセルブロックの色は画像の背景色と同じであると判断される。閾値はこの例では100として設定される。
pr=pθ/Pall (6)
ここでPallは画像のピクセルの総数である。実験によると、単色背景のスコアが0.3より大きければ製品画像は単色背景を有する。単色背景を有する場合、製品画像の主要被写体を抽出する必要は無い。
A1:規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断する。同領域が存在すれば、工程B1へ移る。同領域が存在しなければ、処理は終了される。
左上頂点のx座標=RectX−0.5*Length (7)
左上頂点のy座標=RectY+0.7*Length (8)
矩形フレームの幅=Length*2 (9)
矩形フレームの高さ=Length*10 (10)
(a)重要度値を含む重要度マップに対し二値化処理を行う。
(b)二値化された画像内の小さな色ブロックに対しクリーンアップ処理を行う。
(c)クリーンアップ処理を行った後に画像内の各色ブロックのプロファイル線を探索し、各色ブロックのプロファイル線をポリゴンにより近似する。
(d)矩形により各ポリゴンを取り囲み、すべての矩形を取り囲む周辺矩形フレーム(peripheral rectangle frame)を主要被写体領域として取得する。
V(C)=Vh(C)+Vv(C) (17)
S(C)=(1−V(C))×(1−D(C)) (18)
ここで、
D(C)=Σxp(C│Ix)dx
(a)各スーパーピクセルブロックの平均重要度値が事前設定閾値より連続的に高いかどうかを判断する。
(b)スーパーピクセルブロックの平均重要度値が事前設定閾値より高い場合、スーパーピクセルブロック内の各ピクセルの画像マスク値を非零として設定する。
(c)非零画像マスク値のピクセルを取り囲む周辺矩形フレームを使用することにより主要被写体領域を更新する。
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断するように構成された判断モジュール1201;
認識対象領域が存在する場合に、処理対象画像の主要被写体を含む主要被写体領域を主要被写体領域の事前設定特徴パラメータと認識対象領域の座標および大きさとに従って判断するように構成された矩形フレーム取得モジュール1202;
前景領域ターゲットの抽出処理のための前景画像として主要被写体領域の画像を抽出し、抽出された画像を処理対象画像の主要被写体として取得するように構成された抽出モジュール1203。
処理対象画像に対してスーパーピクセルセグメント化を行い、各セグメント化スーパーピクセルブロックの平均色値を判断するように構成されたセグメント化モジュール;
各スーパーピクセルブロックの平均色値に従って処理対象画像の背景色を判断するように構成された背景色モジュール;
処理対象画像の単色背景のスコアを判断し、処理対象画像が単色背景を有するかどうかを単色背景のスコアに従って判断するように構成された単色判断モジュール。単色背景のスコアは、処理対象画像のピクセルの総数に対する背景色の色閾値を満足するスーパーピクセルブロック内に含まれるピクセルの数の比を含む。
規定特徴に対応する領域が処理対象画像内に存在するかどうかを検出するように構成された検出サブモジュール;
規定特徴に対応する領域が存在するということを検出サブモジュールが検出すると処理対象画像内の規定特徴に対応する領域に対しプロファイル検出を行い、領域が規定特徴に対応する認識対象領域かどうかを確認するために、検出された領域を規定特徴に対応するパラメータ化外観モデルに従って検証するように構成された確認サブモジュール。
Claims (19)
- 画像の主要被写体を抽出する方法であって、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断することと、
前記認識対象領域が存在する場合に、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータと前記認識対象領域の座標および大きさとに従って判断することと、
前景ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出することであって、前記抽出画像は前記処理対象画像の前記主要被写体として処理される、抽出することと、を含み、
前記規定特徴に対応する前記認識対象領域が前記処理対象画像内に存在するかどうかを判断する前に、さらに、
前記処理対象画像に対してスーパーピクセルセグメント化を行うことと、
各セグメント化スーパーピクセルブロックの平均色値を判断することと、
各スーパーピクセルブロックの前記平均色値に従って前記処理対象画像の背景色を判断することと、
前記処理対象画像の単色背景のスコアを判断することと、
前記処理対象画像が単色背景を有するかどうかを前記単色背景の前記スコアに従って判断することと、を含み、
前記単色背景の前記スコアは、前記処理対象画像のピクセルの総数に対する前記背景色の色閾値を満足するスーパーピクセルブロック内に含まれるピクセルの数の比を含む、方法。 - 前記規定特徴に対応する前記認識対象領域が前記処理対象画像内に存在するかどうかを判断することは、
前記規定特徴に対応する領域が前記処理対象画像内に存在するかどうかを検出することと、
前記領域が存在する場合に、前記処理対象画像内の前記規定特徴に対応する前記領域に対してプロファイル検出を行うことと、
前記領域が前記規定特徴に対応する前記認識対象領域かどうかを確認するために、検出された領域を前記規定特徴に対応するパラメータ化外観モデルに従って検証することと
を含む、請求項1に記載の方法。 - 前記規定特徴は人間の頭および肩の領域を含み、
前記処理対象画像内の前記規定特徴に対応する前記領域に対し前記プロファイル検出を行うことは、前記処理対象画像内の前記人間の頭および肩の前記領域に対応する領域を上半身検出アルゴリズムと頭−肩プロファイル検出器とにより検出することを含み
前記検出された領域を前記規定特徴に対応するパラメータ化外観モデルに従い検証することは、前記検出された領域を頭−肩外観モデルに従って検証することを含む、請求項2に記載の方法。 - 前記頭−肩プロファイル検出器はHoG特徴と組み合わせたAdaBoostアルゴリズムによりトレーニングすることにより得られ、前記頭−肩外観モデルはデプスネットワークモデルに従って確立される、請求項3に記載の方法。
- 前記認識対象領域が存在しないという前記判断に応じて、前記処理対象画像に対し重要度検出を行い、前記検出後に前記処理対象画像内の各ピクセルの重要度値に従って前記処理対象画像の前記主要被写体領域を判断することをさらに含む、請求項1に記載の方法。
- 画像の主要被写体を抽出する方法であって、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断することと、
前記認識対象領域が存在する場合に、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータと前記認識対象領域の座標および大きさとに従って判断することと、
前景ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出することであって、前記抽出画像は前記処理対象画像の前記主要被写体として処理される、抽出することと、を含み、
前記認識対象領域が存在しないという前記判断に応じて、前記処理対象画像に対し重要度検出を行い、前記検出後に前記処理対象画像内の各ピクセルの重要度値に従って前記処理対象画像の前記主要被写体領域を判断することをさらに含み、
前記検出後に前記処理対象画像内の各ピクセルの前記重要度値に従って前記処理対象画像の前記主要被写体領域を判断することは、
前記重要度値を含む重要度マップに対して二値化処理を行うことと、
前記二値化画像内の1つまたは複数のより小さい色ブロックに対してクリーンアップ処理を行うことと、
前記クリーンアップ処理を行った後に前記画像内の各色ブロックのプロファイル線を探索し、各色ブロックの前記プロファイル線をポリゴンにより近似することと、
矩形により各ポリゴンを取り囲み、すべての矩形を取り囲む周辺矩形フレームを前記主要被写体領域として取得することと、を含む、方法。 - 画像の主要被写体を抽出する方法であって、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断することと、
前記認識対象領域が存在する場合に、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータと前記認識対象領域の座標および大きさとに従って判断することと、
前景ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出することであって、前記抽出画像は前記処理対象画像の前記主要被写体として処理される、抽出することと、を含み、
前記前景ターゲットの前記抽出処理のための前記前景画像として前記主要被写体領域の前記画像を抽出する前に、さらに、
前記処理対象画像に対してスーパーピクセルセグメント化を行い、各スーパーピクセルブロック内のすべてのピクセルの平均重要度値を判断することと、
各スーパーピクセルブロックの前記平均重要度値が事前設定閾値より連続的に高いかどうかを判断することと、
スーパーピクセルブロックの前記平均重要度値が前記事前設定閾値より高い場合に前記スーパーピクセルブロック内の各ピクセルの画像マスク値を非零となるように設定することと、
非零画像マスク値の前記ピクセルを取り囲む周辺矩形フレームを使用することにより前記主要被写体領域を更新することと、を含む、方法。 - 前記前景ターゲットの前記抽出処理のための前記前景画像として前記主要被写体領域の前記画像を抽出することは、前記前景画像として前記主要被写体領域の前記画像を設定することと、前記前景画像に対してGrabCutアルゴリズムを行うこととを含む、請求項1〜7のいずれか1項に記載の方法。
- 画像の主要被写体を抽出するシステムであって、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断するために使用される判断モジュールと、
前記認識対象領域が存在する場合、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータおよび前記認識対象領域の座標と大きさとに従って判断するために使用される矩形フレーム取得モジュールと、
前景領域ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出し、前記抽出画像を前記処理対象画像の前記主要被写体として取得するために使用される抽出モジュールと、を含み、
前記処理対象画像に対してスーパーピクセルセグメント化を行い、各セグメント化スーパーピクセルブロックの平均色値を判断するために使用されるセグメント化モジュールと、
各スーパーピクセルブロックの前記平均色値に従って前記処理対象画像の背景色を判断するために使用される背景色モジュールと、
前記処理対象画像の単色背景のスコアを判断し、前記処理対象画像が単色背景を有するかどうかを前記単色背景の前記スコアに従って判断するために使用される単色判断モジュールと、をさらに含み、
前記単色背景の前記スコアは、前記処理対象画像のピクセルの総数に対する前記背景色の色閾値を満足するスーパーピクセルブロック内に含まれるピクセルの数の比を含む、システム。 - 前記判断モジュールは、
前記規定特徴に対応する領域が前記処理対象画像内かどうかを検出するために使用される検出サブモジュールと、
前記規定特徴に対応する領域が存在するということを前記検出サブモジュールが検出すると前記処理対象画像内の前記規定特徴に対応する前記領域に対しプロファイル検出を行い、前記領域が前記規定特徴に対応する前記認識対象領域かどうかを確認するために、検出された領域を、前記規定特徴に対応するパラメータ化外観モデルに従って検証するために使用される確認サブモジュール、とを含む、請求項9に記載のシステム。 - 前記規定特徴は人間の頭および肩の領域を含み、
前記確認サブモジュールは、前記処理対象画像内の前記人間の頭および肩の前記領域に対応する領域を上半身検出アルゴリズムと頭−肩プロファイル検出器とにより検出し、前記検出された領域を頭−肩外観モデルに従って検証するために使用される、請求項10に記載のシステム。 - 前記頭−肩プロファイル検出器はHoG特徴と組み合わせたAdaBoostアルゴリズムによりトレーニングすることにより得られ、前記頭−肩外観モデルはデプスネットワークモデルに従って確立される、請求項11に記載のシステム。
- 前記認識対象領域が存在しないという前記判断に応じて、前記処理対象画像に対して重要度検出を行い、前記検出後に前記処理対象画像内の各ピクセルの重要度値に従って前記処理対象画像の前記主要被写体領域を判断するために使用される重要度検出モジュールをさらに含む、請求項9に記載のシステム。
- 画像の主要被写体を抽出するシステムであって、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断するために使用される判断モジュールと、
前記認識対象領域が存在する場合、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータおよび前記認識対象領域の座標と大きさとに従って判断するために使用される矩形フレーム取得モジュールと、
前景領域ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出し、前記抽出画像を前記処理対象画像の前記主要被写体として取得するために使用される抽出モジュールと、を含み、
前記認識対象領域が存在しないという前記判断に応じて、前記処理対象画像に対して重要度検出を行い、前記検出後に前記処理対象画像内の各ピクセルの重要度値に従って前記処理対象画像の前記主要被写体領域を判断するために使用される重要度検出モジュールをさらに含み、
前記重要度検出モジュールは、
前記重要度値を含む重要度マップに対して二値化処理を行い、
二値化画像内の1つまたは複数のより小さい色ブロックに対してクリーンアップ処理を行い、
前記クリーンアップ処理を行った後に前記画像内の各色ブロックのプロファイル線を探索し、ポリゴンにより前記各色ブロックの前記プロファイル線を近似し、
矩形により各ポリゴンを取り囲み、すべての矩形を取り囲む周辺矩形フレームを前記主要被写体領域として取得するために使用される、システム。 - 画像の主要被写体を抽出するシステムであって、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断するために使用される判断モジュールと、
前記認識対象領域が存在する場合、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータおよび前記認識対象領域の座標と大きさとに従って判断するために使用される矩形フレーム取得モジュールと、
前景領域ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出し、前記抽出画像を前記処理対象画像の前記主要被写体として取得するために使用される抽出モジュールと、を含み、
前記処理対象画像に対してスーパーピクセルセグメント化を行い、各スーパーピクセルブロック内のすべてのピクセルの平均重要度値を判断し、
各スーパーピクセルブロックの前記平均重要度値が事前設定閾値より連続的に高いかどうかを判断し、
スーパーピクセルブロックの前記平均重要度値が前記事前設定閾値より高い場合に前記スーパーピクセルブロック内の各ピクセルの画像マスク値を非零として設定し、
非零画像マスク値の前記ピクセルを取り囲む周辺矩形フレームを使用することにより前記主要被写体領域を更新するために使用される、矩形フレーム更新モジュールをさらに含む、システム。 - 前記抽出モジュールは、前記前景画像として前記主要被写体領域の前記画像を設定し、前記前景画像に対してGrabCutアルゴリズムを行うために使用される、請求項9〜15のいずれか1項に記載のシステム。
- 命令のセットを格納する非一時的コンピュータ可読媒体であって、前記命令のセットは、装置に画像の主要被写体を抽出する方法を行わせるように、前記装置の少なくとも一つのプロセッサによって実行可能であり、前記方法が、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断することと、
前記認識対象領域が存在する場合に、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータと前記認識対象領域の座標および大きさとに従って判断することと、
前景ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出することであって、前記抽出画像は前記処理対象画像の前記主要被写体として処理される、抽出することと、を含み、
前記規定特徴に対応する前記認識対象領域が前記処理対象画像内に存在するかどうかを判断する前に、さらに、
前記処理対象画像に対してスーパーピクセルセグメント化を行うことと、
各セグメント化スーパーピクセルブロックの平均色値を判断することと、
各スーパーピクセルブロックの前記平均色値に従って前記処理対象画像の背景色を判断することと、
前記処理対象画像の単色背景のスコアを判断することと、
前記処理対象画像が単色背景を有するかどうかを前記単色背景の前記スコアに従って判断することと、を含み、
前記単色背景の前記スコアは、前記処理対象画像のピクセルの総数に対する前記背景色の色閾値を満足するスーパーピクセルブロック内に含まれるピクセルの数の比を含む、
非一時的コンピュータ可読媒体。 - 命令のセットを格納する非一時的コンピュータ可読媒体であって、前記命令のセットは、装置に画像の主要被写体を抽出する方法を行わせるように、前記装置の少なくとも一つのプロセッサによって実行可能であり、前記方法が、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断することと、
前記認識対象領域が存在する場合に、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータと前記認識対象領域の座標および大きさとに従って判断することと、
前景ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出することであって、前記抽出画像は前記処理対象画像の前記主要被写体として処理される、抽出することと、を含み、
前記命令のセットは、前記装置に、
前記認識対象領域が存在しないという前記判断に応じて、前記処理対象画像に対し重要度検出を行い、前記検出後に前記処理対象画像内の各ピクセルの重要度値に従って前記処理対象画像の前記主要被写体領域を判断すること
を更に行わせるように、前記装置の前記少なくとも一つのプロセッサによって実行可能であり、
前記検出後に前記処理対象画像内の各ピクセルの前記重要度値に従って前記処理対象画像の前記主要被写体領域を判断することは、
前記重要度値を含む重要度マップに対して二値化処理を行うことと、
前記二値化画像内の1つまたは複数のより小さい色ブロックに対してクリーンアップ処理を行うことと、
前記クリーンアップ処理を行った後に前記画像内の各色ブロックのプロファイル線を探索し、各色ブロックの前記プロファイル線をポリゴンにより近似することと、
矩形により各ポリゴンを取り囲み、すべての矩形を取り囲む周辺矩形フレームを前記主要被写体領域として取得することと、を含む、
非一時的コンピュータ可読媒体。 - 命令のセットを格納する非一時的コンピュータ可読媒体であって、前記命令のセットは、装置に画像の主要被写体を抽出する方法を行わせるように、前記装置の少なくとも一つのプロセッサによって実行可能であり、前記方法が、
規定特徴に対応する認識対象領域が処理対象画像内に存在するかどうかを判断することと、
前記認識対象領域が存在する場合に、前記処理対象画像の前記主要被写体を含む主要被写体領域を前記主要被写体領域の事前設定特徴パラメータと前記認識対象領域の座標および大きさとに従って判断することと、
前景ターゲットの抽出処理のための前景画像として前記主要被写体領域の画像を抽出することであって、前記抽出画像は前記処理対象画像の前記主要被写体として処理される、抽出することと、を含み、
前記前景ターゲットの前記抽出処理のための前記前景画像として前記主要被写体領域の前記画像を抽出する前に、さらに、
前記処理対象画像に対してスーパーピクセルセグメント化を行い、各スーパーピクセルブロック内のすべてのピクセルの平均重要度値を判断することと、
各スーパーピクセルブロックの前記平均重要度値が事前設定閾値より連続的に高いかどうかを判断することと、
スーパーピクセルブロックの前記平均重要度値が前記事前設定閾値より高い場合に前記スーパーピクセルブロック内の各ピクセルの画像マスク値を非零となるように設定することと、
非零画像マスク値の前記ピクセルを取り囲む周辺矩形フレームを使用することにより前記主要被写体領域を更新することと、を含む、
非一時的コンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410584982.3A CN105631455B (zh) | 2014-10-27 | 2014-10-27 | 一种图像主体提取方法及系统 |
CN201410584982.3 | 2014-10-27 | ||
PCT/CN2015/092505 WO2016066038A1 (zh) | 2014-10-27 | 2015-10-22 | 一种图像主体提取方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017531883A JP2017531883A (ja) | 2017-10-26 |
JP6719457B2 true JP6719457B2 (ja) | 2020-07-08 |
Family
ID=55856591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017521554A Active JP6719457B2 (ja) | 2014-10-27 | 2015-10-22 | 画像の主要被写体を抽出する方法とシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10497121B2 (ja) |
JP (1) | JP6719457B2 (ja) |
CN (1) | CN105631455B (ja) |
WO (1) | WO2016066038A1 (ja) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631455B (zh) | 2014-10-27 | 2019-07-05 | 阿里巴巴集团控股有限公司 | 一种图像主体提取方法及系统 |
WO2017203705A1 (ja) * | 2016-05-27 | 2017-11-30 | 楽天株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
US10573040B2 (en) * | 2016-11-08 | 2020-02-25 | Adobe Inc. | Image modification using detected symmetry |
CN106780306B (zh) * | 2016-12-09 | 2020-07-24 | 腾讯音乐娱乐(深圳)有限公司 | 一种重构稿生成方法及装置 |
CN108269260B (zh) * | 2016-12-30 | 2021-08-27 | 粉迷科技股份有限公司 | 动态影像去背方法、系统与计算机可读取存储装置 |
CN106815848A (zh) * | 2017-01-17 | 2017-06-09 | 厦门可睿特信息科技有限公司 | 基于grubcut和人工智能的人像背景分离及轮廓提取方法 |
CN108694719B (zh) * | 2017-04-05 | 2020-11-03 | 北京京东尚科信息技术有限公司 | 图像输出方法和装置 |
CN107452013A (zh) * | 2017-05-27 | 2017-12-08 | 深圳市美好幸福生活安全系统有限公司 | 基于Harris角点检测和Sugeno模糊积分的显著性检测方法 |
CN109003289B (zh) * | 2017-12-11 | 2021-04-30 | 罗普特科技集团股份有限公司 | 一种基于颜色标签的目标跟踪快速初始化方法 |
CN108198172B (zh) * | 2017-12-28 | 2022-01-28 | 北京大学深圳研究生院 | 图像显著性检测方法和装置 |
CN108968991B (zh) * | 2018-05-08 | 2022-10-11 | 平安科技(深圳)有限公司 | 手骨x光片骨龄评估方法、装置、计算机设备和存储介质 |
CN109410169B (zh) * | 2018-09-11 | 2020-06-05 | 广东智媒云图科技股份有限公司 | 一种图像背景干扰度的识别方法及装置 |
CN109389582B (zh) * | 2018-09-11 | 2020-06-26 | 广东智媒云图科技股份有限公司 | 一种图像主体亮度的识别方法及装置 |
CN109584251A (zh) * | 2018-12-06 | 2019-04-05 | 湘潭大学 | 一种基于单目标区域分割的舌体图像分割方法 |
CN111476253B (zh) * | 2019-01-23 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 服装图像分类、图像分类方法、装置及设备 |
CN110084801A (zh) * | 2019-04-28 | 2019-08-02 | 深圳回收宝科技有限公司 | 一种终端屏幕的检测方法、装置、便携式终端和存储介质 |
CN110717865B (zh) * | 2019-09-02 | 2022-07-29 | 苏宁云计算有限公司 | 图片检测方法及装置 |
CN110569380B (zh) * | 2019-09-16 | 2021-06-04 | 腾讯科技(深圳)有限公司 | 一种图像标签获取方法、装置及存储介质和服务器 |
JP7439431B2 (ja) * | 2019-09-25 | 2024-02-28 | 株式会社Jvcケンウッド | 情報配信装置、情報生成方法、及び情報生成プログラム |
US11039037B2 (en) * | 2019-10-31 | 2021-06-15 | Kyocera Document Solutions Inc. | Image processing apparatus, image forming apparatus and image processing method for improving efficiency of clipping process |
CN113256361A (zh) * | 2020-02-10 | 2021-08-13 | 阿里巴巴集团控股有限公司 | 商品发布方法及图像处理方法、装置、设备和存储介质 |
CN111383244B (zh) * | 2020-02-28 | 2023-09-01 | 浙江大华技术股份有限公司 | 一种目标检测跟踪方法 |
CN111724396B (zh) * | 2020-06-17 | 2023-07-14 | 泰康保险集团股份有限公司 | 图像分割方法及装置、计算机可读存储介质、电子设备 |
CN114154457A (zh) * | 2020-09-07 | 2022-03-08 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、电子设备及存储介质 |
US11776184B2 (en) * | 2020-10-18 | 2023-10-03 | Adobe, Inc. | Sky replacement |
CN113194282A (zh) * | 2021-04-13 | 2021-07-30 | 杭州三信网络技术有限公司 | 一种基于后端人工智能的视播融合应急广播系统 |
CN115439334A (zh) * | 2021-06-02 | 2022-12-06 | 中国科学院分子植物科学卓越创新中心 | 整穗图像处理方法和装置 |
CN114170675B (zh) * | 2021-11-10 | 2024-10-25 | 沈阳工程学院 | 一种基于mrf超像素标记的人体姿态估计方法 |
CN114108757B (zh) * | 2021-12-13 | 2024-04-05 | 广东威力电器有限公司 | 一种厕用虹吸式人体红外自动感应冲水系统 |
CN114494730A (zh) * | 2022-04-15 | 2022-05-13 | 深圳安牌信息技术有限公司 | 基于图像识别的商标自动分类处理系统 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004029659A2 (en) * | 2002-06-14 | 2004-04-08 | Honda Giken Kogyo Kabushiki Kaisha | Pedestrian detection and tracking with night vision |
US7200266B2 (en) * | 2002-08-27 | 2007-04-03 | Princeton University | Method and apparatus for automated video activity analysis |
JP4318465B2 (ja) * | 2002-11-08 | 2009-08-26 | コニカミノルタホールディングス株式会社 | 人物検出装置および人物検出方法 |
US7864989B2 (en) * | 2006-03-31 | 2011-01-04 | Fujifilm Corporation | Method and apparatus for adaptive context-aided human classification |
JP4626692B2 (ja) * | 2008-09-12 | 2011-02-09 | ソニー株式会社 | 物体検出装置、撮像装置、物体検出方法およびプログラム |
CN102598113A (zh) * | 2009-06-30 | 2012-07-18 | 安芯美特控股有限公司 | 匹配出现在两个或多个图像内的对象或人的方法、电路和系统 |
JP2011035636A (ja) | 2009-07-31 | 2011-02-17 | Casio Computer Co Ltd | 画像処理装置及び方法 |
US8638993B2 (en) * | 2010-04-05 | 2014-01-28 | Flashfoto, Inc. | Segmenting human hairs and faces |
US9025864B2 (en) | 2010-06-01 | 2015-05-05 | Hewlett-Packard Development Company, L.P. | Image clustering using a personal clothing model |
EP2395452A1 (en) * | 2010-06-11 | 2011-12-14 | Toyota Motor Europe NV/SA | Detection of objects in an image using self similarities |
CN102446347B (zh) * | 2010-10-09 | 2014-10-01 | 株式会社理光 | 图像白平衡方法和装置 |
CN102467740A (zh) * | 2010-11-08 | 2012-05-23 | 北京大学 | 一种大尺寸彩色图像的前景和背景交互式分割方法及系统 |
JP5873442B2 (ja) * | 2010-12-09 | 2016-03-01 | パナソニック株式会社 | 物体検出装置および物体検出方法 |
US9153031B2 (en) * | 2011-06-22 | 2015-10-06 | Microsoft Technology Licensing, Llc | Modifying video regions using mobile device input |
JP6032921B2 (ja) | 2012-03-30 | 2016-11-30 | キヤノン株式会社 | 物体検出装置及びその方法、プログラム |
CN102779270B (zh) * | 2012-06-21 | 2015-03-25 | 西南交通大学 | 一种针对购物图像搜索的目标衣物图像提取方法 |
JP6192271B2 (ja) * | 2012-08-22 | 2017-09-06 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
CN103164858B (zh) * | 2013-03-20 | 2015-09-09 | 浙江大学 | 基于超像素和图模型的粘连人群分割与跟踪方法 |
CN105631455B (zh) | 2014-10-27 | 2019-07-05 | 阿里巴巴集团控股有限公司 | 一种图像主体提取方法及系统 |
-
2014
- 2014-10-27 CN CN201410584982.3A patent/CN105631455B/zh active Active
-
2015
- 2015-10-22 JP JP2017521554A patent/JP6719457B2/ja active Active
- 2015-10-22 WO PCT/CN2015/092505 patent/WO2016066038A1/zh active Application Filing
-
2017
- 2017-04-27 US US15/499,840 patent/US10497121B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017531883A (ja) | 2017-10-26 |
US10497121B2 (en) | 2019-12-03 |
CN105631455B (zh) | 2019-07-05 |
CN105631455A (zh) | 2016-06-01 |
WO2016066038A1 (zh) | 2016-05-06 |
US20170228872A1 (en) | 2017-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6719457B2 (ja) | 画像の主要被写体を抽出する方法とシステム | |
CN107346409B (zh) | 行人再识别方法和装置 | |
CN107358149B (zh) | 一种人体姿态检测方法和装置 | |
CN110717489B (zh) | Osd的文字区域的识别方法、装置及存储介质 | |
CN108229509B (zh) | 用于识别物体类别的方法及装置、电子设备 | |
KR102641115B1 (ko) | 객체 검출을 위한 영상 처리 방법 및 장치 | |
WO2018103608A1 (zh) | 一种文字检测方法、装置及存储介质 | |
US8737740B2 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium | |
CN105404847B (zh) | 一种遗留物实时检测方法 | |
US8639042B2 (en) | Hierarchical filtered motion field for action recognition | |
US9317784B2 (en) | Image processing apparatus, image processing method, and program | |
US20120093362A1 (en) | Device and method for detecting specific object in sequence of images and video camera device | |
WO2019071976A1 (zh) | 基于区域增长和眼动模型的全景图像显著性检测方法 | |
CN106557740B (zh) | 一种遥感图像中油库目标的识别方法 | |
CN112464797B (zh) | 一种吸烟行为检测方法、装置、存储介质及电子设备 | |
JP6338429B2 (ja) | 被写体検出装置、被写体検出方法及びプログラム | |
US20170103536A1 (en) | Counting apparatus and method for moving objects | |
CN107368832A (zh) | 基于图像的目标检测及分类方法 | |
JP2020119250A (ja) | オブジェクト抽出方法および装置 | |
JP2004038980A (ja) | 画像を解析する方法、しきい値を生成する方法、該方法を実行するコンピュータプログラム、該プログラムを記憶するコンピュータ可読媒体および該方法を実行するように適応した装置 | |
CN115294162B (zh) | 目标识别方法、装置、设备及存储介质 | |
JP6851246B2 (ja) | 物体検出装置 | |
CN107122714B (zh) | 一种基于边缘约束的实时行人检测方法 | |
CN107180244B (zh) | 一种基于级联分类器的图像检测方法及装置 | |
JP6429323B2 (ja) | オブジェクト抽出方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170621 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181019 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191008 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6719457 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |