JP7512724B2 - 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム - Google Patents
学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム Download PDFInfo
- Publication number
- JP7512724B2 JP7512724B2 JP2020118520A JP2020118520A JP7512724B2 JP 7512724 B2 JP7512724 B2 JP 7512724B2 JP 2020118520 A JP2020118520 A JP 2020118520A JP 2020118520 A JP2020118520 A JP 2020118520A JP 7512724 B2 JP7512724 B2 JP 7512724B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- style
- learning
- real
- inference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000006243 chemical reaction Methods 0.000 claims description 40
- 238000012549 training Methods 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 23
- 238000000926 separation method Methods 0.000 claims description 11
- 238000012546 transfer Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 16
- 238000010801 machine learning Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Landscapes
- Processing Or Creating Images (AREA)
Description
前記入力部から入力された前記画像から特定領域と非特定領域を分離する分離部と、
前記特定領域と前記非特定領域を各々評価する評価部と、
前記評価部における評価結果を用いて、画風変換器を学習する学習部と、
を有する、学習装置。
上記(1)~(3)のいずれか一つに記載の学習装置によって学習済みの画風変換器を有し、前記画風変換器により、前記入力部から入力された前記画像を画風変換する画風変換部と、
前記画風変換部により画風変換された画像を出力する出力部と、
を有する、推論装置。
前記段階(a)で入力された前記画像から特定領域と非特定領域を分離する段階(b)と、
前記特定領域と前記非特定領域を各々評価する段階(c)と、
前記段階(c)による評価結果を用いて、画風変換器を学習する段階(d)と、
を有する、学習方法。
上記(7)~(9)のいずれか一つに記載の学習方法によって学習済みの画風変換器により、前記段階(a)で入力された前記画像を画風変換する段階(b)と、
前記段階(b)により画風変換された画像を出力する段階(c)と、
を有する、推論方法。
図1は、本発明の一実施形態に係る学習装置の機能構成を示すブロック図である。
(1)式中、αおよびβは、変換器損失146を算出するための関数として、前景および背景に対する重み付けのための係数である。前景の画風変換を促進し、背景の画風変換を抑える場合は、α<βとする。特に、βの値を大きくすることで、背景の画風変換がほとんど行われないようにできる。なお、αおよびβは、たとえば、前景と背景の画風変換された画像をユーザーが見て、適切な値を決定すればよい。
ここで、本実施形態の理解のために、前景領域(特定領域)と背景領域(非特定領域)を分離しない形態を比較例として説明する。
実施形態2は、実施形態1によって学習された画風変換器150を用いて画風変換する推論装置である。
11 CPU、
12 記憶部、
13 通信インターフェース、
15 操作表示部、
100 学習装置、
101 入力部、
102 分離部、
103 評価部、
104 学習部、
150 画風変換器、
151 識別器、
200 推論装置、
201 入力部、
202 画風変換部、
203 出力部。
Claims (14)
- 第1画像に第2画像が合成された画像が入力される入力部と、
前記入力部から入力された前記画像から特定領域と非特定領域を分離する分離部と、
前記特定領域と前記非特定領域を各々評価する評価部と、
前記評価部における評価結果を用いて、画風変換器を学習する学習部と、
を有する、学習装置。 - 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項1に記載の学習装置。
- 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項1に記載の学習装置。
- 第1画像に第2画像が合成された画像が入力される入力部と、
請求項1~3のいずれか一つに記載の学習装置によって学習済みの画風変換器を有し、前記画風変換器により、前記入力部から入力された前記画像を画風変換する画風変換部と、
前記画風変換部により画風変換された画像を出力する出力部と、
を有する、推論装置。 - 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項4に記載の推論装置。
- 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項4に記載の推論装置。
- 第1画像に第2画像が合成された画像が入力される段階(a)と、
前記段階(a)で入力された前記画像から特定領域と非特定領域を分離する段階(b)と、
前記特定領域と前記非特定領域を各々評価する段階(c)と、
前記段階(c)による評価結果を用いて、画風変換器を学習する段階(d)と、
を有する、学習方法。 - 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項7に記載の学習方法。
- 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項7に記載の学習方法。
- 第1画像に第2画像が合成された画像が入力される段階(a)と、
請求項7~9のいずれか一つに記載の学習方法によって学習済みの画風変換器により、前記段階(a)で入力された前記画像を画風変換する段階(b)と、
前記段階(b)により画風変換された画像を出力する段階(c)と、
を有する、推論方法。 - 前記第1画像は実写画像であり、前記第2画像はコンピューターグラフィックス画像である、請求項10に記載の推論方法。
- 前記第1画像は実写画像であり、前記第2画像は実写画像であり、かつ解像度が前記第1画像と異なる、請求項10に記載の推論方法。
- 請求項7~9のいずれか一つに記載の学習方法をコンピューターに実行させるための学習プログラム。
- 請求項10~12のいずれか一つに記載の推論方法をコンピューターに実行させるための推論プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020118520A JP7512724B2 (ja) | 2020-07-09 | 2020-07-09 | 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020118520A JP7512724B2 (ja) | 2020-07-09 | 2020-07-09 | 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022015587A JP2022015587A (ja) | 2022-01-21 |
JP7512724B2 true JP7512724B2 (ja) | 2024-07-09 |
Family
ID=80120964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020118520A Active JP7512724B2 (ja) | 2020-07-09 | 2020-07-09 | 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7512724B2 (ja) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011197998A (ja) | 2010-03-19 | 2011-10-06 | Casio Computer Co Ltd | 画像処理装置及び画像処理方法 |
JP2011254152A (ja) | 2010-05-31 | 2011-12-15 | Casio Comput Co Ltd | 画像合成装置、及びプログラム |
JP2012043151A (ja) | 2010-08-18 | 2012-03-01 | Canon Inc | 画像処理装置及びその方法、プログラム、並びに撮像装置 |
JP2012216179A (ja) | 2011-03-31 | 2012-11-08 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
JP2012215927A (ja) | 2011-03-31 | 2012-11-08 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
CN106778928A (zh) | 2016-12-21 | 2017-05-31 | 广州华多网络科技有限公司 | 图像处理方法及装置 |
US20180260668A1 (en) | 2017-03-10 | 2018-09-13 | Adobe Systems Incorporated | Harmonizing composite images using deep learning |
WO2020004593A1 (ja) | 2018-06-28 | 2020-01-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | データ生成装置およびデータ生成方法 |
CN111223039A (zh) | 2020-01-08 | 2020-06-02 | 广东博智林机器人有限公司 | 图像风格转换方法、装置、电子设备及存储介质 |
JP2020095611A (ja) | 2018-12-14 | 2020-06-18 | キヤノン株式会社 | 情報処理装置、システム、情報処理装置の制御方法、及び、プログラム |
JP2020519923A (ja) | 2017-09-29 | 2020-07-02 | シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッドShanghai Cambricon Information Technology Co.,Ltd. | 画像処理装置及び方法 |
-
2020
- 2020-07-09 JP JP2020118520A patent/JP7512724B2/ja active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011197998A (ja) | 2010-03-19 | 2011-10-06 | Casio Computer Co Ltd | 画像処理装置及び画像処理方法 |
JP2011254152A (ja) | 2010-05-31 | 2011-12-15 | Casio Comput Co Ltd | 画像合成装置、及びプログラム |
JP2012043151A (ja) | 2010-08-18 | 2012-03-01 | Canon Inc | 画像処理装置及びその方法、プログラム、並びに撮像装置 |
JP2012216179A (ja) | 2011-03-31 | 2012-11-08 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
JP2012215927A (ja) | 2011-03-31 | 2012-11-08 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
CN106778928A (zh) | 2016-12-21 | 2017-05-31 | 广州华多网络科技有限公司 | 图像处理方法及装置 |
US20180260668A1 (en) | 2017-03-10 | 2018-09-13 | Adobe Systems Incorporated | Harmonizing composite images using deep learning |
JP2020519923A (ja) | 2017-09-29 | 2020-07-02 | シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッドShanghai Cambricon Information Technology Co.,Ltd. | 画像処理装置及び方法 |
WO2020004593A1 (ja) | 2018-06-28 | 2020-01-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | データ生成装置およびデータ生成方法 |
JP2020095611A (ja) | 2018-12-14 | 2020-06-18 | キヤノン株式会社 | 情報処理装置、システム、情報処理装置の制御方法、及び、プログラム |
CN111223039A (zh) | 2020-01-08 | 2020-06-02 | 广东博智林机器人有限公司 | 图像风格转换方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2022015587A (ja) | 2022-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409222B (zh) | 一种基于移动端的多视角人脸表情识别方法 | |
US20220261968A1 (en) | Image optimization method and apparatus, computer storage medium, and electronic device | |
CN110322416B (zh) | 图像数据处理方法、装置以及计算机可读存储介质 | |
WO2020103700A1 (zh) | 一种基于微表情的图像识别方法、装置以及相关设备 | |
CN112991160B (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
JP7482783B2 (ja) | フォント作成装置、フォント作成方法及びフォント作成プログラム | |
KR102400609B1 (ko) | 딥러닝 네트워크를 이용한 배경 및 얼굴 합성 방법 및 장치 | |
CN109635783A (zh) | 视频监控方法、装置、终端和介质 | |
CN109359527B (zh) | 基于神经网络的头发区域提取方法及系统 | |
CN112581370A (zh) | 人脸图像的超分辨率重建模型的训练及重建方法 | |
WO2021077140A2 (en) | Systems and methods for prior knowledge transfer for image inpainting | |
CN113160032B (zh) | 一种基于生成对抗网络的无监督多模态图像转换方法 | |
US20230153965A1 (en) | Image processing method and related device | |
CN112036260A (zh) | 一种自然环境下多尺度子块聚合的表情识别方法及系统 | |
CN110610131B (zh) | 人脸运动单元的检测方法、装置、电子设备及存储介质 | |
JP7512724B2 (ja) | 学習装置、推論装置、学習方法、推論方法、学習プログラム、推論プログラム | |
CN114529785A (zh) | 模型的训练方法、视频生成方法和装置、设备、介质 | |
CN113095506A (zh) | 基于端、边及云协同的机器学习方法、系统及介质 | |
CN112990123A (zh) | 图像处理方法、装置、计算机设备和介质 | |
CN109657589B (zh) | 一种基于人体交互动作的体验者动作生成方法 | |
CN111242216A (zh) | 基于条件生成对抗卷积神经网络的图像生成方法 | |
US20240020918A1 (en) | Information processing apparatus and information processing method | |
CN118076984A (zh) | 用于视线估计的方法和设备 | |
CN113553877B (zh) | 深度手势识别方法及其系统和电子设备 | |
JP7238510B2 (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7512724 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |