Nothing Special   »   [go: up one dir, main page]

JP7512724B2 - 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム - Google Patents

学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム Download PDF

Info

Publication number
JP7512724B2
JP7512724B2 JP2020118520A JP2020118520A JP7512724B2 JP 7512724 B2 JP7512724 B2 JP 7512724B2 JP 2020118520 A JP2020118520 A JP 2020118520A JP 2020118520 A JP2020118520 A JP 2020118520A JP 7512724 B2 JP7512724 B2 JP 7512724B2
Authority
JP
Japan
Prior art keywords
image
style
learning
real
inference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020118520A
Other languages
English (en)
Other versions
JP2022015587A (ja
Inventor
文子 山野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2020118520A priority Critical patent/JP7512724B2/ja
Publication of JP2022015587A publication Critical patent/JP2022015587A/ja
Application granted granted Critical
Publication of JP7512724B2 publication Critical patent/JP7512724B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)

Description

本発明は、学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラムに関し、詳しくは、画風変換のための学習装置、推論装置、学習方法、推論方法、学習プログラム、および推論プログラムに関する。
画像認識における機械学習は、大量の教師データを必要とする。しかし、実写データを大量に用意することは、難しい場合もある。そこで、画像認識における機械学習では、大量の実写データを用意する代わりに、コンピューターグラフィックス(CG(Computer Graphic))データを活用することが提案されている。CGデータの活用には、正解付け工数の削減や、データの水増し、バリエーションの確保が容易になるなどのメリットがある。
しかし、CGデータを学習に用いた機械学習では、実写とCGで見た目の乖離が大きいため、デグレードすることが知られている。
従来、実写とCGでは見た目の乖離を少なくするための技術が提案されている。実写とCGの見た目の乖離を少なくするための技術としては、たとえば、特許文献1および2がある。
特許文献1の技術は、実写画像を画風目標画像として、あらゆる写実的な入力画像を画風変換する画風変換ネットワークを訓練する。この技術では、訓練済みの画風変換ネットワークを用いて、原訓練データセットの訓練画像を変換後訓練画像に変換する。続いて、この技術では、各変換後訓練画像を原訓練データセットの対応する訓練画像の訓練ラベルでラベル付けして、水増し訓練データセットを作成する。さらにこの技術では、水増し訓練データセットを用いて、特定の作業を行うようにディープニューラルネットワーク(DNN(Deep Neural Network))を訓練する。
また、特許文献2の技術は、画像処理装置は、第1の画像データと、分類スコアとを取得し、分類スコアに基づいて第1の画像データから第1の画像データよりも高解像度の第2の画像データを生成する処理手段を備える。この技術では、処理手段を構成するパラメータは、学習用画像データと学習用画像データの分類を識別する識別子とを含む組の複数のデータで構成される学習用データに基づいて決定される一方、分類スコアは、第1の画像データが識別子の各々である確率を示している。これにより、この技術は、第1の画像データよりも高解像度の第2の画像データを生成する。
特開2019-32821号公報 特開2020-24612号公報
しかしながら、従来の技術は、いずれも、画像全体を均一に評価して画風変換のための機械学習を行っている。このため、従来の技術は、変換前後の差異が上手く学習できず、画風変換対象の画像か否かに関わらず一様に変換されてしまうという問題があった。具体的には、たとえば、人の動作をCG画像で再現し、その背景に実写画像を使用する場合、従来の技術では、CG画像も実写画像も同じように評価されてしまう。このため、本来そのまま用いても良い実写画像までが画風変換されてしまっていた。
そこで、本発明の第1の目的は、画風変換したい領域のみ画風変換を促進される学習ができる学習装置、学習方法、および学習プログラムを提供することである。また、本発明の第2の目的は、画風変換したい特定領域の画風変換が促進されて画風変換する推論装置、推論方法、および推論プログラムを提供することである。
本発明の上記目的は、下記の手段によって達成される。
(1)第1画像に第2画像が合成された画像が入力される入力部と、
前記入力部から入力された前記画像から特定領域と非特定領域を分離する分離部と、
前記特定領域と前記非特定領域を各々評価する評価部と、
前記評価部における評価結果を用いて、画風変換器を学習する学習部と、
を有する、学習装置。
(2)前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、上記(1)に記載の学習装置。
(3)前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、上記(1)に記載の学習装置。
(4)第1画像に第2画像が合成された画像が入力される入力部と、
上記(1)~(3)のいずれか一つに記載の学習装置によって学習済みの画風変換器を有し、前記画風変換器により、前記入力部から入力された前記画像を画風変換する画風変換部と、
前記画風変換部により画風変換された画像を出力する出力部と、
を有する、推論装置。
(5)前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、上記(4)に記載の推論装置。
(6)前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、上記(4)に記載の推論装置。
(7)第1画像に第2画像が合成された画像が入力される段階(a)と、
前記段階(a)で入力された前記画像から特定領域と非特定領域を分離する段階(b)と、
前記特定領域と前記非特定領域を各々評価する段階(c)と、
前記段階(c)による評価結果を用いて、画風変換器を学習する段階(d)と、
を有する、学習方法。
(8)前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、上記(7)に記載の学習方法。
(9)前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、上記(7)に記載の学習方法。
(10)第1画像に第2画像が合成された画像が入力される段階(a)と、
上記(7)~(9)のいずれか一つに記載の学習方法によって学習済みの画風変換器により、前記段階(a)で入力された前記画像を画風変換する段階(b)と、
前記段階(b)により画風変換された画像を出力する段階(c)と、
を有する、推論方法。
(11)前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、上記(10)に記載の推論方法。
(12)前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、上記(10)に記載の推論方法。
(13)上記(7)~(9)のいずれか一つに記載の学習方法をコンピューターに実行させるための学習プログラム。
(14)上記(10)~(12)のいずれか一つに記載の推論方法をコンピューターに実行させるための推論プログラム。
本発明の学習装置は、一つの画像を特定領域と非特定領域に分離したうえで、それぞれの領域で評価することとしたので、特に画風変換したい特定領域の画風変換を促進するように学習できる。また、本発明の推論装置は、特定領域の画風変換を促進するように学習させた画風変換器を用いたので、画風変換対象の画像の中から、特に特定領域のみ画風変換できる。
本発明の一実施形態に係る学習装置の機能構成を示すブロック図である。 学習装置のハードウエア構成の一例を示すブロック図である。 学習動作の概要を説明するための説明図である。 画風変換器を学習するため学習方法の処理手順を示すフローチャートである。 分離部および評価部による処理を説明するための説明図である。 クラス分けによる前景領域の差分の求め方を説明するための説明図である。 関節点の推定による前景領域の差分の求め方を説明するための説明図である。 前景領域(特定領域)と背景領域(非特定領域)を分離しない形態の処理を説明するための説明図である。 本発明の一実施形態に係る推論装置の機能を説明するためのブロック図である。 画風変換するための推論方法の処理手順を示すフローチャートである。
以下、図面を参照して、本発明の実施形態を詳細に説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
(実施形態1)
図1は、本発明の一実施形態に係る学習装置の機能構成を示すブロック図である。
学習装置100は、入力部101、分離部102、評価部103、学習部104を有する。学習装置100には、学習対象である画風変換器150の生成した画像の真偽を識別する識別器151が接続されている。
入力部101は、実写画像の背景に、コンピューターグラフィックス(CG)画像のオブジェクトを前景として合成された画像の入力を受け付ける。実写画像は、第1画像であり、CG画像は第2画像である。
分離部102は、入力された画像から特定領域と非特定領域を分離する。特定領域と非特定領域は、ユーザーによって任意に設定されるが、本実施形態では、特定領域を前景、非特定領域を背景とする。
評価部103は、分離された特定領域と非特定領域を各々評価する。
学習部104は、評価部103における評価結果を用いて、画風変換器150を機械学習する。機械学習は、たとえば、周知のCNN(Convolution Neural Network)やDNNを利用する。また、生成モデルとしては、たとえば、GAN(Generative Adversarial Network)を用いることができる。なお、これら機械学学習の手法や生成モデルは、特に限定されない。
各部の詳細は後述するが、このような学習装置100は、一般的なコンピューターによって所定の学習プログラム(後述)が実行されることで実現される。ここでは、このような学習装置100を実現するためのコンピューターの構成の一例を説明する。
図2は、学習装置100のハードウエア構成の一例を示すブロック図である。
学習装置100となるコンピューター10は、たとえば、図2に示すように、CPU(Central Processing Unit)11、記憶部12、通信インターフェース(I/F)13などを備える。また、コンピューター10には、操作表示部15が接続される。図示しないが、コンピューター10内には、画像処理高速化のために、さらにGPU(Graphics Processing Unit)が備えられてもよい。
CPU11は、各種プログラムや各種データに基づいて、各部の制御や各種の演算処理を実行する。
記憶部12は、あらかじめ各種プログラムや各種データを格納しておくROM(Read Only Memory)、CPU11の作業領域として一時的にプログラムやデータを記憶するRAM(Random Access Memory)、および各種プログラムや各種データを記憶するハードディスクなどから構成される。
通信インターフェース13は、このコンピューター10と外部機器とをデータ通信により接続する。外部機器は、たとえば、操作表示部15や、他のコンピューター10、携帯端末などである。通信インターフェース13としては、たとえば、SATA(Serial Advanced Technology Attachment)、PCI(Peripheral Component Interconnect) Express、USB(Universal Serial Bus)、イーサネット(登録商標)、IEEE1394などの規格によるネットワークインターフェース、Bluetooth(登録商標)、IEEE802.11などの無線通信インターフェース、などが用いられる。
操作表示部15は、たとえば、キーボードおよびポインティングデバイスなどの入力機器と、表示装置であるディスプレイを備える。操作表示部15では、画像データの入力指示、画像の表示などが行われる。
次に、学習動作の概要を説明する。図3は、学習動作の概要を説明するための説明図である。
学習動作は、主に、学習部104の機能として実行される。学習部104は、まず、画風変換前の画像141を画風変換器150へ入力する。画風変換器150では、入力された画像が画風変換される。画風変換後の画像142は、学習部104に接続された識別器151に入力される。識別器151には、画像変換後の正解画像143も入力される。正解画像143は、画風変換器150を学習させるための教師データとなる。
そして、識別器151では、画風変換器150で変換された画像142と、正解画像143とが比較されて、どちらが実際の画像か判定される。判定結果は、識別器損失145および変換器損失146として出力される。
識別器損失145(Discriminator Loss)は、実画像の損失と偽画像の損失の合計である。識別器損失145は、正解画像143が実画像と判定された場合、および画風変換器150で変換された画像142が偽画像と判定された場合に、それぞれ損失無しとなる。逆に、正解画像143が偽画像と判定された場合、および画風変換器150で変換された画像142が実画像と判定された場合に、それぞれ損失有りとなる。本実施形態1では、画風変換器150で変換された画像142が実画像と判定されるように画風変換器150を学習させるので、画風変換器150で変換された画像142が実画像と判定される場合が多くなる方がよい。正解画像143が教師データである場合、正解画像143が偽画像と判定されることはない(または少ない)。このため、識別器損失145は、全体として、大きくなる方がよい。
変換器損失146(Generator Loss)については、後述する。
次に、画風変換器150を学習するため学習方法を説明する。図4は、画風変換器150を学習するため学習方法の処理手順を示すフローチャートである。この処理手順は、コンピューター10内の記憶部12に記憶され、CPU11によって実行される。
まず、画風変換後の正解画像143が入力される(S111)。
続いて、画風変換前の画像141が入力される(S112)。
続いて、CPU11は、S121のステップで入力された画像141を画風変換器150により画風変換させる(S113)。
続いて、CPU11は、識別器損失145を算出する(S114)。
続いて、CPU11は、識別器151を学習する(S115)。
続いて、CPU11は、変換器損失146を算出する(S116)。変換器損失146の変換器とは、画風変換器150のことである。
続いて、CPU11は、画風変換器150を学習する(S117)。
以下、このような処理手順に沿って動作する各部の機能を説明する。
本実施形態では、CG画像の人物を実写風人物に画風変換するための画風変換器150を学習する。
このために、まず、入力部101から画像141が入力される画像入力方法としては、2つの方法がある。
第1の画像入力方法は、CG画像と実写画像を用いる。この場合、入力させる画像の1つは、画風変換前の画像141として、実写の背景にCG画像の人物が前景として合成された画像を用いる。また、画風変換後の正解画像143としては、実写の背景画像と実写の人物の前景からなる画像、すなわち、全て実写画像を用いる。
第2の画像入力方法は、低解像度、高解像度の実写の背景画像と実写人物の画像を用いる。この場合、CG画像は、学習時には用いない。すなわち、第2の画像入力方法は、画風変換前の画像141として、低解像の実写の背景画像と実写人物からなる全て実写画像を用い、画風変換後の正解画像として、高解像の実写の背景画像と実写の人物画像からなる全て実写画像を用いる。
第2の画像入力方法は、低解像にすることで、実写人物とCG人物の見た目が変わらなくなるということを利用している。第2の画像入力方法は、実写画像を低解像度から高解像に復元することを学習させて、CG人物から実写風人物へ画風変換するための画風変換器150を生成させる。
図5は、分離部102および評価部103による処理を説明するための説明図である。
まず、分離部102には、画風変換器150により生成された画風変換後の画像Aが入力される(S121)。そして、分離部102では、画像Aから、前景領域と背景領域を分離する(S122)。
また、分離部102には、前記同様に、画風変換後の正解画像Bが入力される(S123)。そして、分離部102では、画像Bから、前景領域と背景領域を分離する(S124)。
前景領域と背景領域の分離は、機械学習による前景、背景分離手法を用いることができる。
続いて、分離された各画像は、評価部103よって前景と背景とが別々に評価される。このために、評価部103では、画像Aの前景領域と画像Bの前景領域との差分が算出され(S125)、画像Aの背景領域と画像Bの背景領域との差分が算出される(S126)。そして、評価部103では、算出された2つの差分の値から、変換器損失146を算出する。変換器損失146は、下記(1)式により算出される。
変換器損失=画像全体の差分+α×前景領域の差分+β×背景領域の差分 …(1)
(1)式中、αおよびβは、変換器損失146を算出するための関数として、前景および背景に対する重み付けのための係数である。前景の画風変換を促進し、背景の画風変換を抑える場合は、α<βとする。特に、βの値を大きくすることで、背景の画風変換がほとんど行われないようにできる。なお、αおよびβは、たとえば、前景と背景の画風変換された画像をユーザーが見て、適切な値を決定すればよい。
評価部103における前景領域の差分の求め方は、2通りある。1つはクラス分けによる方法であり、他の1つは、人の関節点を推定する方法である。
図6は、クラス分けによる前景領域の差分の求め方を説明するための説明図である。
評価部103では、すでに説明したように、画風変換器150による画風変換後の画像Aが入力され(S131)、前景領域が分離されて(S132)、画像Aの前景領域が認識される(S133)。評価部103では、同様に、画風変換後の正解画像Bが入力されて(S134)、前景領域が分離されて(S135)、画像Bの前景領域が認識される(S136)。
そして、クラス分けによる前景領域の差分の求め方では、「人」クラスを含む多クラス分類器を事前に作成しておき、認識された画像Aの前景領域と画像Bの前景領域から、各クラスの信頼度の差の総和を算出する(S137)。これにより、画像Aの前景に含まれる人と、画像Bの前景に含まれる人との差分がクラス分けによって得られる。「人」クラスを含む多クラス分類器は、人が写っている画像データを教師データ、人および他の物体が写っている画像データを入力データとして機械学習させることで、人と他の物体を分類する。
図7は、関節点の推定による前景領域の差分の求め方を説明するための説明図である。
評価部103への画像AおよびBの入力から、それら画像の前景領域の認識まで(S131~S136)は図6を参照した説明と同様である。
そして、関節点の推定による前景領域の差分の求め方では、人の関節点を推定する学習器を事前に作成しておき、認識された画像Aの前景領域と画像Bの前景領域から、各関節点の位置ずれの差の総和を算出する(S138)。これにより、画像Aの前景に含まれる人と、画像Bの前景に含まれる人との差分が関節点の位置の違いから得られる。人の関節点を推定する学習器は、人の関節点の位置を示した画像データを教師データ、人および他の物体が写っている画像データを入力データとして機械学習させることで、人の関節点の位置が認識される。
一方、背景領域の差分は、たとえば、平均二乗誤差(MSE(Mean Square Error))を用いて算出する。
このように本実施形態1では、画風変換器150による画風変換後の画像と正解画像とを、それぞれ前景領域(特定領域)と背景領域(非特定領域)に分離して評価することとした。これにより、前景の画風変換を促進する一方、背景は画風変換しない(または変換を抑える)ようにできる。より具体的には、たとえば、前景として人の動きをCG画像のオブジェクトによって再現し、これを実写の背景に合成した画像を用いた場合、画風変換したいのは、CG画像のオブジェクトだけでよい。このような場合に、本実施形態では、前景のCG画像のオブジェクトのみ画風変換することができる。一方、背景は、ほとんど画風変換されないため、背景がぼやけたり不鮮明になったりせずに、学習させることができる。
また、本実施形態では、同様に、実写画像を低解像度から高解像度の画像に復元するための画風変換器150の学習にも用いることができる。これは、すでに説明したように、学習時の入力画像に、低解像度の画像と正解画像としての高解像度の画像を入力して、前景となる部分のみ、低解像度から高解像度への画風変換するための学習を行わせる。そして、後述する実施形態2では、CG画像を低解像度にして画風変換させることで、低解像度のCG画像を実写人物として画風変換させることができるようになる。
(比較例)
ここで、本実施形態の理解のために、前景領域(特定領域)と背景領域(非特定領域)を分離しない形態を比較例として説明する。
図8は、前景領域(特定領域)と背景領域(非特定領域)を分離しない形態の処理を説明するための説明図である。
比較例では、画風変換後の画像501と、画風変換後の正解画像502から、変換器損失503が算出される。したがって、比較例で算出される変換器損失503は、画像全体の差分である。このため、比較例では、変換対象ではない背景部分まで損失が計算されるため、変換対象(たとえば、前景であるCG画像のオブジェクト)だけの画風変換が上手く学習できない。
このような比較例に対して、すでに説明したように、実施形態1では、変換対象(たとえば、前景であるCG画像のオブジェクト)だけの画風変換を学習させることができる。
(実施形態2)
実施形態2は、実施形態1によって学習された画風変換器150を用いて画風変換する推論装置である。
図9は、本発明の一実施形態に係る推論装置の機能を説明するためのブロック図である。
推論装置200は、入力部201、画風変換部202、および出力部203を有する。
入力部201は、実写の背景にCG画像のオブジェクトが合成された画像の入力を受け付ける。
画風変換部202は、実施形態1の学習装置100によって学習された画風変換器150を有する。
出力部203は、画風変換後の画像を、操作表示部15や、外部のコンピューター10などに出力する。
このような推論装置200は、一般的なコンピューター10によって所定の学習プログラム(後述)が実行されることで実現される。推論装置200を実現するためのコンピューターの構成の一例は、実施形態1に置いて説明したコンピューター10を同様であるので、説明を省略する。
次に、画風変換するための推論方法を説明する。図10は、画風変換するための推論方法の処理手順を示すフローチャートである。この処理手順は、コンピューター10内の記憶部12に記憶され、CPU11によって実行される。
まず、画風変換前の画像が入力される(S211)。入力される画像は、実写の背景にCG画像のオブジェクトが合成された画像である。
続いて、CPU11は、S211のステップで入力された画像を画風変換部202により画風変換する(S212)。
続いて、CPU11は、画風変換後の画像を出力する(S213)。
本実施形態2では、すでに説明した学習装置100により学習済みの画風変換器150を用いた。これにより、本実施形態2では、前景のみの画風変換を行うよう前景の特徴を復元しつつ、背景の状態は変えないようにできる。したがって、本実施形態2では、画風変換対象のCG画像のオブジェクトのみ実写化する効果がある。
以上、本発明の実施形態を説明したが、本発明はこれら実施形態に限定されない。実施形態では、特定領域を人物の存在する前景領域、非特定領域を人物の存在しない背景領域としたが、特定領域および非特定領域は、これらに限定されない。たとえば、特定領域は動きのある物体の存在する領域とし、非特定領域は動きのある物体の存在しない領域とすることができる。これにより、動きのある物体は、CG画像により再現して機械学習させることが可能になる。
また、実施形態1では、高解像度の実写画像(第1画像)の中に低解像度の実写画像(第2画像)が合成された画像から、低解像度の前景のみ高解像度となるように画風変換器を学習させてもよい。そして、実施形態2では、高解像度の実写画像(第1画像)の中に、低解像度の実写画像(第2画像)が合成された画像を、低解像度の前景のみ高解像度となるように画風変換させることができる。
また、これらとは逆に、実施形態1では、低解像度の実写画像(第1画像)の中に高解像度の実写画像(第2画像)が合成された画像から、高解像度の前景のみ低解像度となるように画風変換器を学習させてもよい。そして、実施形態2では、低解像度の実写画像(第1画像)の中に、高解像度の実写画像(第2画像)が合成された画像を、高解像度の前景のみ低解像度となるように画風変換させることができる。
すなわち、これらの場合、第1画像と第2画像は、共に実写画像であるが、両者の解像度が異なることとなる。
また、実施形態の説明の中で使用した条件や数値などはあくまでも説明のためのものであり、本発明がこれら条件や数値に限定されない。
本発明は特許請求の範囲に記載された構成に基づき様々な改変が可能であり、それらについても本発明の範疇である。
10 コンピューター、
11 CPU、
12 記憶部、
13 通信インターフェース、
15 操作表示部、
100 学習装置、
101 入力部、
102 分離部、
103 評価部、
104 学習部、
150 画風変換器、
151 識別器、
200 推論装置、
201 入力部、
202 画風変換部、
203 出力部。

Claims (14)

  1. 第1画像に第2画像が合成された画像が入力される入力部と、
    前記入力部から入力された前記画像から特定領域と非特定領域を分離する分離部と、
    前記特定領域と前記非特定領域を各々評価する評価部と、
    前記評価部における評価結果を用いて、画風変換器を学習する学習部と、
    を有する、学習装置。
  2. 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項1に記載の学習装置。
  3. 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項1に記載の学習装置。
  4. 第1画像に第2画像が合成された画像が入力される入力部と、
    請求項1~3のいずれか一つに記載の学習装置によって学習済みの画風変換器を有し、前記画風変換器により、前記入力部から入力された前記画像を画風変換する画風変換部と、
    前記画風変換部により画風変換された画像を出力する出力部と、
    を有する、推論装置。
  5. 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項4に記載の推論装置。
  6. 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項4に記載の推論装置。
  7. 第1画像に第2画像が合成された画像が入力される段階(a)と、
    前記段階(a)で入力された前記画像から特定領域と非特定領域を分離する段階(b)と、
    前記特定領域と前記非特定領域を各々評価する段階(c)と、
    前記段階(c)による評価結果を用いて、画風変換器を学習する段階(d)と、
    を有する、学習方法。
  8. 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項7に記載の学習方法。
  9. 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項7に記載の学習方法。
  10. 第1画像に第2画像が合成された画像が入力される段階(a)と、
    請求項7~9のいずれか一つに記載の学習方法によって学習済みの画風変換器により、前記段階(a)で入力された前記画像を画風変換する段階(b)と、
    前記段階(b)により画風変換された画像を出力する段階(c)と、
    を有する、推論方法。
  11. 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項10に記載の推論方法。
  12. 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項10に記載の推論方法。
  13. 請求項7~9のいずれか一つに記載の学習方法をコンピューターに実行させるための学習プログラム。
  14. 請求項10~12のいずれか一つに記載の推論方法をコンピューターに実行させるための推論プログラム。
JP2020118520A 2020-07-09 2020-07-09 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム Active JP7512724B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020118520A JP7512724B2 (ja) 2020-07-09 2020-07-09 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020118520A JP7512724B2 (ja) 2020-07-09 2020-07-09 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム

Publications (2)

Publication Number Publication Date
JP2022015587A JP2022015587A (ja) 2022-01-21
JP7512724B2 true JP7512724B2 (ja) 2024-07-09

Family

ID=80120964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020118520A Active JP7512724B2 (ja) 2020-07-09 2020-07-09 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム

Country Status (1)

Country Link
JP (1) JP7512724B2 (ja)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011197998A (ja) 2010-03-19 2011-10-06 Casio Computer Co Ltd 画像処理装置及び画像処理方法
JP2011254152A (ja) 2010-05-31 2011-12-15 Casio Comput Co Ltd 画像合成装置、及びプログラム
JP2012043151A (ja) 2010-08-18 2012-03-01 Canon Inc 画像処理装置及びその方法、プログラム、並びに撮像装置
JP2012216179A (ja) 2011-03-31 2012-11-08 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
JP2012215927A (ja) 2011-03-31 2012-11-08 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
CN106778928A (zh) 2016-12-21 2017-05-31 广州华多网络科技有限公司 图像处理方法及装置
US20180260668A1 (en) 2017-03-10 2018-09-13 Adobe Systems Incorporated Harmonizing composite images using deep learning
WO2020004593A1 (ja) 2018-06-28 2020-01-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ データ生成装置およびデータ生成方法
CN111223039A (zh) 2020-01-08 2020-06-02 广东博智林机器人有限公司 图像风格转换方法、装置、电子设备及存储介质
JP2020095611A (ja) 2018-12-14 2020-06-18 キヤノン株式会社 情報処理装置、システム、情報処理装置の制御方法、及び、プログラム
JP2020519923A (ja) 2017-09-29 2020-07-02 シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッドShanghai Cambricon Information Technology Co.,Ltd. 画像処理装置及び方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011197998A (ja) 2010-03-19 2011-10-06 Casio Computer Co Ltd 画像処理装置及び画像処理方法
JP2011254152A (ja) 2010-05-31 2011-12-15 Casio Comput Co Ltd 画像合成装置、及びプログラム
JP2012043151A (ja) 2010-08-18 2012-03-01 Canon Inc 画像処理装置及びその方法、プログラム、並びに撮像装置
JP2012216179A (ja) 2011-03-31 2012-11-08 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
JP2012215927A (ja) 2011-03-31 2012-11-08 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
CN106778928A (zh) 2016-12-21 2017-05-31 广州华多网络科技有限公司 图像处理方法及装置
US20180260668A1 (en) 2017-03-10 2018-09-13 Adobe Systems Incorporated Harmonizing composite images using deep learning
JP2020519923A (ja) 2017-09-29 2020-07-02 シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッドShanghai Cambricon Information Technology Co.,Ltd. 画像処理装置及び方法
WO2020004593A1 (ja) 2018-06-28 2020-01-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ データ生成装置およびデータ生成方法
JP2020095611A (ja) 2018-12-14 2020-06-18 キヤノン株式会社 情報処理装置、システム、情報処理装置の制御方法、及び、プログラム
CN111223039A (zh) 2020-01-08 2020-06-02 广东博智林机器人有限公司 图像风格转换方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP2022015587A (ja) 2022-01-21

Similar Documents

Publication Publication Date Title
CN109409222B (zh) 一种基于移动端的多视角人脸表情识别方法
US20220261968A1 (en) Image optimization method and apparatus, computer storage medium, and electronic device
CN110322416B (zh) 图像数据处理方法、装置以及计算机可读存储介质
WO2020103700A1 (zh) 一种基于微表情的图像识别方法、装置以及相关设备
CN112991160B (zh) 图像处理方法、装置、计算机设备及存储介质
JP7482783B2 (ja) フォント作成装置、フォント作成方法及びフォント作成プログラム
KR102400609B1 (ko) 딥러닝 네트워크를 이용한 배경 및 얼굴 합성 방법 및 장치
CN109635783A (zh) 视频监控方法、装置、终端和介质
CN109359527B (zh) 基于神经网络的头发区域提取方法及系统
CN112581370A (zh) 人脸图像的超分辨率重建模型的训练及重建方法
WO2021077140A2 (en) Systems and methods for prior knowledge transfer for image inpainting
CN113160032B (zh) 一种基于生成对抗网络的无监督多模态图像转换方法
US20230153965A1 (en) Image processing method and related device
CN112036260A (zh) 一种自然环境下多尺度子块聚合的表情识别方法及系统
CN110610131B (zh) 人脸运动单元的检测方法、装置、电子设备及存储介质
JP7512724B2 (ja) 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム
CN114529785A (zh) 模型的训练方法、视频生成方法和装置、设备、介质
CN113095506A (zh) 基于端、边及云协同的机器学习方法、系统及介质
CN112990123A (zh) 图像处理方法、装置、计算机设备和介质
CN109657589B (zh) 一种基于人体交互动作的体验者动作生成方法
CN111242216A (zh) 基于条件生成对抗卷积神经网络的图像生成方法
US20240020918A1 (en) Information processing apparatus and information processing method
CN118076984A (zh) 用于视线估计的方法和设备
CN113553877B (zh) 深度手势识别方法及其系统和电子设备
JP7238510B2 (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240610

R150 Certificate of patent or registration of utility model

Ref document number: 7512724

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150