JP7453828B2 - プログラム、ニューラルネットワークシステム、情報処理方法およびニューラルネットワークモデルの生成方法 - Google Patents
プログラム、ニューラルネットワークシステム、情報処理方法およびニューラルネットワークモデルの生成方法 Download PDFInfo
- Publication number
- JP7453828B2 JP7453828B2 JP2020056716A JP2020056716A JP7453828B2 JP 7453828 B2 JP7453828 B2 JP 7453828B2 JP 2020056716 A JP2020056716 A JP 2020056716A JP 2020056716 A JP2020056716 A JP 2020056716A JP 7453828 B2 JP7453828 B2 JP 7453828B2
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- image data
- image
- slice
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims description 59
- 238000000034 method Methods 0.000 title claims description 29
- 230000010365 information processing Effects 0.000 title claims description 27
- 238000003062 neural network model Methods 0.000 title claims description 6
- 238000003672 processing method Methods 0.000 title claims description 3
- 239000013598 vector Substances 0.000 claims description 70
- 238000012545 processing Methods 0.000 claims description 30
- 238000011176 pooling Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 32
- 238000010801 machine learning Methods 0.000 description 26
- 238000012360 testing method Methods 0.000 description 18
- 238000004088 simulation Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 238000010606 normalization Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 241000282376 Panthera tigris Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
図1は、ニューラルネットワークシステム10の概要を説明する説明図である。ニューラルネットワークシステム10は、入力画像41が入力された場合に、入力画像41に対応する分類を推定した推定結果46を出力する。図1においては、入力画像41が「車」のラベルに対応する確率が5パーセント、「鳥」のラベルに対応する確率が3パーセント、「虎」のラベルに対応する確率が90パーセント等であると出力されている。なお、ニューラルネットワークシステム10の出力は、推定結果に限られない。
S(x,y)は、座標(x,y)の画素の正規化後のピクセルバリューである。
Imaxは、コピー画像を構成する画素の最大値である。
Iminは、コピー画像を構成する画素の最小値である。
Aは、スライス画像の階調数である。
本実施の形態は、ニューラルネットワークシステム10の機械学習を行なうプログラムに関する。実施の形態1と共通する部分については、説明を省略する。
本実施の形態のニューラルネットワークシステム10の効果を説明する第1のシミュレーションについて説明する。図13は、シミュレーション例-1で用いる画像ノイズの例を説明する説明図である。図13Aは、入力画像41の例を示す。図13Bおよび図13Cは、入力画像41に黒点ノイズをランダムに重畳させたノイズ重畳画像49の例を示す。図13Bにおいては、入力画像41の面積の30パーセントが黒点ノイズに覆われており、ノイズ量は30パーセントである。図13Cにおいては、入力画像41の面積の50パーセントが黒点ノイズに覆われており、ノイズ量は50%である。
本実施の形態のニューラルネットワークシステム10の効果を説明する第2のシミュレーションについて説明する。図15は、シミュレーション例-2で用いる画像ノイズの例を説明する説明図である。シミュレーション例-1と共通する部分については、説明を省略する。
本実施の形態のニューラルネットワークシステム10の効果を説明する第3のシミュレーションについて説明する。
本実施の形態は、スライス画像42を作成する条件の一部が重複しているニューラルネットワークシステム10に関する。実施の形態1と共通する部分については、説明を省略する。
本実施の形態は、追加層15を有するニューラルネットワークシステム10に関する。実施の形態1と共通する部分については、説明を省略する。
y(x)=α・x
αは、学習可能なパラメータ
の式で表現されるLA(Linear Activation layer)である。
本実施の形態は、入力画像41を座標に基づいてスライスするニューラルネットワークシステム10に関する。実施の形態1と共通する部分については、説明を省略する。
図24は、実施の形態6の情報処理装置20の機能ブロック図である。情報処理装置20は、画像取得部81、スライス画像生成部82、複数の特徴ベクトル抽出部83、結合特徴ベクトル生成部84および出力部85を有する。複数の特徴ベクトル抽出部83は、互いに並列に接続されている。
本実施の形態は、汎用のコンピュータ90とプログラム97とを組み合わせて動作させることにより、本実施の形態の情報処理装置20を実現する形態に関する。図25は、実施の形態7の情報処理装置20の構成を示す説明図である。実施の形態1と共通する部分については、説明を省略する。
今回開示された実施の形態はすべての点で例示であって、制限的なものでは無いと考えられるべきである。本発明の範囲は、上記した意味では無く、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
11 スライス部
12 ストリーム
121 コンボリューション層
122 プーリング層
13 全結合層
14 ソフトマックス層
15 追加層
16 結合特徴ベクトル生成層
17 スキップコネクション
19 学習モデル
20 情報処理装置
21 制御部
22 主記憶装置
23 補助記憶装置
24 通信部
25 出力部
26 入力部
29 読取部
41 入力画像(画像データ)
42 スライス画像
43 特徴ベクトル
44 結合特徴ベクトル
46 推定結果
49 ノイズ重畳画像
61 スライス条件DB
81 画像取得部
82 スライス画像生成部
83 特徴ベクトル抽出部
84 結合特徴ベクトル生成部
85 出力部
90 コンピュータ
96 可搬型記録媒体
97 プログラム
98 半導体メモリ
Claims (9)
- 画像データを取得し、
取得した前記画像データを複数のピクセルバリュー範囲に基づいてそれぞれスライスすることにより、複数のスライス画像データを生成し、
コンボリューション層とプーリング層とを繰り返して構成した複数のストリームが相互に並列に配置されており、複数の前記ストリームのそれぞれに生成した前記スライス画像データを入力することにより、複数の前記スライス画像データそれぞれの特徴ベクトルを抽出し、
抽出した複数の前記特徴ベクトルを結合して1つの結合特徴ベクトルを生成し、
生成した前記結合特徴ベクトルを全結合層に入力して、前記全結合層から出力される推定結果を出力する
処理をコンピュータに実行させるプログラム。 - 複数の前記ピクセルバリュー範囲は、一部が相互に重複している
請求項1に記載のプログラム。 - 前記全結合層に連結したソフトマックス層を介して前記推定結果を出力する
請求項1または請求項2に記載のプログラム。 - 抽出した前記特徴ベクトルを、学習可能なパラメータを有する追加層に入力して変換し、
変換した前記特徴ベクトルを結合して、前記結合特徴ベクトルを生成する
請求項1から請求項3のいずれか一つに記載のプログラム。 - 画像データを複数のピクセルバリュー範囲に基づいてそれぞれスライスすることにより生成された複数のスライス画像データそれぞれの特徴ベクトルを抽出する、相互に並列配置された複数のストリームと、
前記ストリームがそれぞれ抽出した複数の特徴ベクトルを結合した一つの特徴ベクトルが入力される全結合層と、
を備えるニューラルネットワークシステム。 - 前記ストリームと、前記全結合層との間に、学習可能なパラメータを有する追加層を備える
請求項5に記載のニューラルネットワークシステム。 - 前記ストリームは、スキップコネクションを有する
請求項5または請求項6に記載のニューラルネットワークシステム。 - 画像データを取得し、
取得した前記画像データを複数のピクセルバリュー範囲に基づいてそれぞれスライスすることにより、複数のスライス画像データを生成し、
コンボリューション層とプーリング層とを繰り返して構成した複数のストリームが相互に並列に配置されており、複数の前記ストリームのそれぞれに生成した前記スライス画像データを入力することにより、複数の前記スライス画像データそれぞれの特徴ベクトルを抽出し、
抽出した複数の前記特徴ベクトルを結合して1つの結合特徴ベクトルを生成し、
生成した前記結合特徴ベクトルを全結合層に入力して、前記全結合層から出力される推定結果を出力する
処理をコンピュータが実行する情報処理方法。 - 画像データを複数のピクセルバリュー範囲に基づいてそれぞれスライスすることにより生成された複数のスライス画像のセットとラベルとを関連づけて複数組記録した学習データを取得し、
複数のスライス画像データそれぞれの特徴ベクトルを抽出する、相互に並列配置された複数のストリーム、および、複数の前記ストリームがそれぞれ抽出した複数の特徴ベクトルを結合した一つの特徴ベクトルが入力される全結合層を備えるニューラルネットワークモデルを用意し、
前記学習データを用いて、前記セットを構成する複数の前記スライス画像のそれぞれを複数の前記ストリームのそれぞれに入力した場合に、前記画像データに関連するラベルの予測値を出力するように前記ニューラルネットワークモデルのパラメータを調整する
処理をコンピュータが実行するニューラルネットワークモデルの生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020056716A JP7453828B2 (ja) | 2020-03-26 | 2020-03-26 | プログラム、ニューラルネットワークシステム、情報処理方法およびニューラルネットワークモデルの生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020056716A JP7453828B2 (ja) | 2020-03-26 | 2020-03-26 | プログラム、ニューラルネットワークシステム、情報処理方法およびニューラルネットワークモデルの生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021157468A JP2021157468A (ja) | 2021-10-07 |
JP7453828B2 true JP7453828B2 (ja) | 2024-03-21 |
Family
ID=77917938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020056716A Active JP7453828B2 (ja) | 2020-03-26 | 2020-03-26 | プログラム、ニューラルネットワークシステム、情報処理方法およびニューラルネットワークモデルの生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7453828B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014099027A (ja) | 2012-11-14 | 2014-05-29 | Nippon Hoso Kyokai <Nhk> | 画像特徴量算出装置、学習装置、識別装置、およびそのプログラム |
JP2017513144A (ja) | 2014-04-11 | 2017-05-25 | ペキン センスタイム テクノロジー ディベロップメント カンパニー リミテッド | 顔認証方法およびシステム |
JP2019220129A (ja) | 2018-06-19 | 2019-12-26 | ケーピーアイティ テクノロジーズ リミテッド | 交通標識を認識するためのシステムおよび方法 |
JP2020017082A (ja) | 2018-07-25 | 2020-01-30 | 日本放送協会 | 画像オブジェクト抽出装置及びプログラム |
-
2020
- 2020-03-26 JP JP2020056716A patent/JP7453828B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014099027A (ja) | 2012-11-14 | 2014-05-29 | Nippon Hoso Kyokai <Nhk> | 画像特徴量算出装置、学習装置、識別装置、およびそのプログラム |
JP2017513144A (ja) | 2014-04-11 | 2017-05-25 | ペキン センスタイム テクノロジー ディベロップメント カンパニー リミテッド | 顔認証方法およびシステム |
JP2019220129A (ja) | 2018-06-19 | 2019-12-26 | ケーピーアイティ テクノロジーズ リミテッド | 交通標識を認識するためのシステムおよび方法 |
JP2020017082A (ja) | 2018-07-25 | 2020-01-30 | 日本放送協会 | 画像オブジェクト抽出装置及びプログラム |
Non-Patent Citations (1)
Title |
---|
内田 祐介,外1名,畳み込みニューラルネットワークの研究動向,電子情報通信学会技術研究報告 Vol.117 No.362,日本,一般社団法人電子情報通信学会,2017年,第117巻 |
Also Published As
Publication number | Publication date |
---|---|
JP2021157468A (ja) | 2021-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11068722B2 (en) | Method for analysing media content to generate reconstructed media content | |
CN111754596B (zh) | 编辑模型生成、人脸图像编辑方法、装置、设备及介质 | |
CN108875807B (zh) | 一种基于多注意力多尺度的图像描述方法 | |
US11514694B2 (en) | Teaching GAN (generative adversarial networks) to generate per-pixel annotation | |
CN114008663A (zh) | 实时视频超分辨率 | |
KR102011788B1 (ko) | 계층적 시각 특징을 이용한 시각 질의 응답 장치 및 방법 | |
CN107506695A (zh) | 视频监控设备故障自动检测方法 | |
US20220101121A1 (en) | Latent-variable generative model with a noise contrastive prior | |
CN111401117B (zh) | 基于双流卷积神经网络的新生儿疼痛表情识别方法 | |
Jin et al. | Just noticeable difference for deep machine vision | |
US20220138536A1 (en) | Actional-structural self-attention graph convolutional network for action recognition | |
JP2021012595A (ja) | 情報処理装置、情報処理装置の制御方法、および、プログラム | |
CN115526891B (zh) | 一种缺陷数据集的生成模型的训练方法及相关装置 | |
US20140086479A1 (en) | Signal processing apparatus, signal processing method, output apparatus, output method, and program | |
CN114170657A (zh) | 融合注意力机制与高阶特征表示的面部情感识别方法 | |
CN116030296A (zh) | 用于图文数据协同的社交平台数据挖掘方法及其系统 | |
JP6832252B2 (ja) | 超解像装置およびプログラム | |
US20230342884A1 (en) | Diverse Image Inpainting Using Contrastive Learning | |
US20220398697A1 (en) | Score-based generative modeling in latent space | |
JP7453828B2 (ja) | プログラム、ニューラルネットワークシステム、情報処理方法およびニューラルネットワークモデルの生成方法 | |
CN114529785A (zh) | 模型的训练方法、视频生成方法和装置、设备、介质 | |
CN114782742A (zh) | 基于教师模型分类层权重的输出正则化方法 | |
JP2020187583A (ja) | 機械学習モデルのトレーニング方法、データ生成装置、および、学習済みの機械学習モデル | |
CN112084371B (zh) | 一种电影多标签分类方法、装置、电子设备以及存储介质 | |
US12051151B2 (en) | System and method for reconstruction of an animatable three-dimensional human head model from an image using an implicit representation network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20200421 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7453828 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |