KR102336103B1 - 딥러닝 기반 영상 디블러링 방법 및 이를 수행하는 장치 - Google Patents
딥러닝 기반 영상 디블러링 방법 및 이를 수행하는 장치 Download PDFInfo
- Publication number
- KR102336103B1 KR102336103B1 KR1020200115575A KR20200115575A KR102336103B1 KR 102336103 B1 KR102336103 B1 KR 102336103B1 KR 1020200115575 A KR1020200115575 A KR 1020200115575A KR 20200115575 A KR20200115575 A KR 20200115575A KR 102336103 B1 KR102336103 B1 KR 102336103B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- neural network
- correct answer
- answer label
- deblurring
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000013135 deep learning Methods 0.000 title abstract description 3
- 238000013528 artificial neural network Methods 0.000 claims abstract description 66
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013434 data augmentation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002071 nanotube Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005442 molecular electronic Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G06T5/003—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
딥러닝 기반 영상 디블러링 방법 및 이를 수행하는 장치가 개시된다. 일 실시예에 따른 이미지 디블러링 방법은, 블러 이미지(blurred image)를 입력 받는 단계와, 상기 블러 이미지에 기초하여 선명한 원본 이미지를 출력하는 디블러링 단계를 포함하고, 상기 디블러링 단계는, 제1 이미지를 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지는 제2 이미지를 획득하는 단계와, 상기 제1 이미지 및 상기 제2 이미지를 결합하여(concatenate) 상기 제1 이미지와 동일한 스케일을 가지는 제3 이미지를 획득하는 단계와, 상기 제3 이미지를 상기 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지는 제4 이미지를 획득하는 단계를 포함한다.
Description
본 개시는 딥러닝 기반 이미지 디블러링 방법 및 이를 수행하는 장치에 관한 것이다.
균일하지 않은 단일 이미지의 디블러링(non-uniform deblurring)에 있어서, 알려지지 않은 비균일 블러 커널(blur kernels)을 예측하지 않고 흐릿한 이미지에서 선명한 이미지를 복구하는 것은 어려운 문제이다.
디블러닝 방법 중 한 가지는 균일한 블러를 가정하고 이미지 및 블러 커널을 복구하여 문제를 단순화하는 방법이다. 그러나, 균일한 블러는 실제 블러를 근사화하기에 충분히 정확하지 않기 때문에 블러 모델을 완전 밀집 매트릭스(full dense matrix)에 비해 제한된 방식으로 균일에서 비균일로 확장하는 연구가 많이 있다.
디블러링을 위해 심층 뉴럴 네트워크(DNN)를 사용하는 방법은 크게 두 가지가 있다. 하나는 DNN을 사용하여 비균일 블러를 명시적으로 추정하는 것이고, 다른 하나는 DNN을 사용하여 블러를 추정하지 않고 선명한 이미지를 직접 추정하는 것이다.
관련 선행기술로, 한국 등록특허공보 제10-1152525호(발명의 명칭: 모션 블러 제거 방법 및 이러한 방법을 수행하는 장치)가 있다.
아래 실시예들은 디블러링 과정에서 고주파수 영역의 특성이 파괴되는 문제를 발생시키지 않으면서 처리 속도가 빠르고 높은 성능을 가지는 영상 디블러링 기술을 제공할 수 있다.
다만, 기술적 과제는 상술한 기술적 과제들로 한정되는 것은 아니며, 또 다른 기술적 과제들이 존재할 수 있다.
일 실시예에 따른 이미지 디블러링 방법은, 블러 이미지(blurred image)를 입력 받는 단계와, 상기 블러 이미지에 기초하여 선명한 원본 이미지를 출력하는 디블러링 단계를 포함하고, 상기 디블러링 단계는, 제1 이미지를 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지는 제2 이미지를 획득하는 단계와, 상기 제1 이미지 및 상기 제2 이미지를 결합하여(concatenate) 상기 제1 이미지와 동일한 스케일을 가지는 제3 이미지를 획득하는 단계와, 상기 제3 이미지를 상기 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지는 제4 이미지를 획득하는 단계를 포함한다.
상기 이미지 디블러링 방법은, 상기 제1 이미지를 상기 뉴럴 네트워크에 입력하여 제1 피처맵 및 제2 피처맵을 획득하는 단계와, 상기 제1 피처맵 및 상기 제2 피처맵을 상기 뉴럴 네트워크에 입력하여 제3 피처맵 및 제4 피처맵을 획득하는 단계를 더 포함할 수 있다.
상기 뉴럴 네트워크는, 복수의 인코더 및 복수의 디코더를 포함한 구조의 재귀 뉴럴 네트워크(Recursive Neural Network)일 수 있다.
상기 복수의 인코더 및 상기 복수의 디코더 각각은, 서로 다른 채널의 잔차 블록(residual blocks) 및 특징 추출 레이어(feature extraction layers)를 포함할 수 있다.
일 실시예에 따른 이미지 디블러링 장치는, 인스트럭션들을 포함하는 메모리와, 상기 인스트럭션들을 실행하기 위한 프로세서를 포함하고, 상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는, 제1 이미지를 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지는 제2 이미지를 획득하고, 상기 제1 이미지 및 상기 제2 이미지를 결합하여(concatenate) 상기 제1 이미지와 동일한 스케일을 가지는 제3 이미지를 획득하고, 상기 제3 이미지를 상기 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지는 제4 이미지를 획득한다.
상기 프로세서는, 상기 제1 이미지를 상기 뉴럴 네트워크에 입력하여 제1 피처맵 및 제2 피처맵을 획득하고, 상기 제1 피처맵 및 상기 제2 피처맵을 상기 뉴럴 네트워크에 입력하여 제3 피처맵 및 제4 피처맵을 획득할 수 있다.
상기 뉴럴 네트워크는, 복수의 인코더 및 복수의 디코더를 포함한 구조의 재귀 뉴럴 네트워크(Recursive Neural Network)일 수 있다.
상기 복수의 인코더 및 상기 복수의 디코더 각각은, 서로 다른 채널의 잔차 블록(residual blocks) 및 특징 추출 레이어(feature extraction layers)를 포함할 수 있다.
일 실시예에 따른 뉴럴 네트워크 학습 방법은, 제1 이미지를 뉴럴 네트워크에 입력하여 제2 이미지를 획득하는 단계와, 제1 정답 라벨 및 상기 제2 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정하는 단계와, 상기 제1 이미지 및 상기 제2 이미지를 상기 뉴럴 네트워크에 입력하여 제3 이미지를 획득하는 단계와, 제2 정답 라벨 및 상기 제3 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정하는 단계를 포함한다.
상기 제1 이미지는, 연속적으로 촬영된 복수의 이미지를 결합하여 생성된 이미지일 수 있다.
상기 제1 정답 라벨은, 상기 제1 이미지 보다 적은 수의 이미지를 결합하여 생성된 이미지일 수 있다.
상기 제2 정답 라벨은, 상기 제1 정답 라벨 보다 적은 수의 이미지를 결합하여 생성된 이미지일 수 있다.
일 실시예에 따른 뉴럴 네트워크 학습 장치는, 인스트럭션들을 포함하는 메모리와, 상기 인스트럭션들을 실행하기 위한 프로세서를 포함하고, 상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는, 제1 이미지를 뉴럴 네트워크에 입력하여 제2 이미지를 획득하고, 제1 정답 라벨 및 상기 제2 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정하고, 상기 제1 이미지 및 상기 제2 이미지를 상기 뉴럴 네트워크에 입력하여 제3 이미지를 획득하고, 제2 정답 라벨 및 상기 제3 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정한다.
상기 제1 이미지는, 연속적으로 촬영된 복수의 이미지를 결합하여 생성된 이미지일 수 있다.
상기 제1 정답 라벨은, 상기 제1 이미지 보다 적은 수의 이미지를 결합하여 생성된 이미지일 수 있다.
상기 제2 정답 라벨은, 상기 제1 정답 라벨 보다 적은 수의 이미지를 결합하여 생성된 이미지일 수 있다.
도1a 내지 도1c는 종래의 이미지 디블러링 방법을 설명하기 위한 도면이다.
도 2은 일 실시예에 따른 이미지 디블러링 방법을 설명하기 위한 도면이다.
도 3는 도 2에 도시된 이미지 디블러링 방법을 수행하는 장치를 개략적으로 나타내는 도면이다.
도 4는 도 2에 도시된 이미지 디블러링 방법을 수행하기 위한 뉴럴 네트워크를 학습하는 방법을 설명하기 위한 도면이다.
도 5는 도 2에 도시된 이미지 디블러링 방법을 수행하는 뉴럴 네트워크를 설명하기 위한 도면이다.
도 6은 도 2에 도시된 이미지 디블러링 방법을 통해 디블러링 된 이미지를 나타내는 도면이다.
도 2은 일 실시예에 따른 이미지 디블러링 방법을 설명하기 위한 도면이다.
도 3는 도 2에 도시된 이미지 디블러링 방법을 수행하는 장치를 개략적으로 나타내는 도면이다.
도 4는 도 2에 도시된 이미지 디블러링 방법을 수행하기 위한 뉴럴 네트워크를 학습하는 방법을 설명하기 위한 도면이다.
도 5는 도 2에 도시된 이미지 디블러링 방법을 수행하는 뉴럴 네트워크를 설명하기 위한 도면이다.
도 6은 도 2에 도시된 이미지 디블러링 방법을 통해 디블러링 된 이미지를 나타내는 도면이다.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.
실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
또한, 실시 예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
어느 하나의 실시 예에 포함된 구성요소와, 공통적인 기능을 포함하는 구성요소는, 다른 실시 예에서 동일한 명칭을 사용하여 설명하기로 한다. 반대되는 기재가 없는 이상, 어느 하나의 실시 예에 기재한 설명은 다른 실시 예에도 적용될 수 있으며, 중복되는 범위에서 구체적인 설명은 생략하기로 한다.
도1a 내지 도1c는 종래의 이미지 디블러링 방법을 설명하기 위한 도면이다.
도 1a는 원 스테이지(One-Stage(OS)) 디블러링 방법(11)을 도시한다. OS 디블러링 방법은 공간 스케일의 흐릿한 이미지에서 원래 이미지를 복구하는 방법이다.
OS 디블러링 방법(11)은 심층 뉴럴 네트워크(Deep Neural Networks(DNN)) 모델 (M)이 원본 이미지의 높은 공간 스케일(original high spatial scale)에서 한번에 선명한 원본 이미지를 출력하도록 감독한다.
도 1b는 스택-버전(Stack-Version(SV)) 디블러링 방법(12)을 도시한다. SV 디블러링 방법(12)은 독립적인 DNN 모델(M1 내지 M3)을 여러 번 사용한다. SV 디블러링 방법(12)은 선명한 원본 이미지를 복원하기 위해 반복적으로 DNN 모델(M1 내지 M3)에 순차적으로 출력 이미지를 입력한다.
SV 디블러링 방법(12)은 독립적인 복수의 모델을 이용한다. 각각의 모델은 원본 이미지의 높은 공간 스케일에서 독립적으로 선명한 원본 이미지를 복원하도록 학습된다. SV 디블러링 방법(12)은 각각의 모델마다 입력이 다르며, 이전 모델의 출력이 다른 모델에 입력될 수 있다.
도 1c는 다중 스케일(Multi-Scale(MS)) 디블러링 방법(13)을 도시한다. MS 디블러링 방법(13)은 서로 다른 공간 스케일로 다운 샘플링 된 이미지를 이용하여 선명한 원본 이미지를 복원한다.
MS 디블러링 방법(13)은 가장 낮은 스케일로 다운 샘플링 된 이미지를 DNN 모델(M)을 이용하여 복원한 후 순차적으로 이미지를 더 높은 공간 스케일의 이미지를 복원한다. MS 디블러링 방법(13)은 이미지를 축소하여 선명한 원본 이미지 복원을 수행하므로 이미지의 엣지 정보(edge information)이 손실되는 단점이 존재한다.
도 2은 일 실시예에 따른 이미지 디블러링 방법을 설명하기 위한 도면이다.
디블러링 방법(20)은 원본 이미지의 공간 스케일에서 블러 이미지를 선명한 원본 이미지로 복원할 수 있다. 디블러링 방법(20)은 블러 이미지를 다운 샘플링 하지 않고, 원본 공간 스케일에서 블러 이미지를 점진적으로 디블러링 할 수 있다.
디블러링 방법(20)은 상대적으로 소량의 블러를 복원하는 DNN 모델(M)을 반복적으로 이용하여 최종적으로 선명한 원본 이미지를 복원할 수 있다. 디블러링 방법(20)은 점진적인 디블러링 과정의 각 단계에서 획득한 결과를 다음 단계로 전달하여 점진적으로 선명한 원본 이미지를 복원할 수 있다.
디블러링 방법(20)은 MT-RNN(Multi-Temporal recurrent neural network)를 이용하여 디블러링을 수행할 수 있다. MT-RNN은 각 단계에서 획득한 결과를 다음 단계로 전달하기 위한 재귀 피처맵(recurrent feature map)을 이용할 수 있다.
디블러링 방법(20)은 동일한 공간 스케일을 공유하는 매개변수를 이용하여 더 높은 성능을 제공할 수도 있다.
디블러링 방법(20)은 점진적 시간 학습(incremental temporal training)을 통해 MT-RNN을 학습할 수 있다. 예를 들어, 디블러링 방법(20)은 MT-RNN이 단계적 디블러링을 수행할 수 있도록 학습할 수 있다.
MT-RNN의 학습을 위한 학습 데이터는 시간적 데이터 증대 방법(Temporal Data Augmentation)을 통해 생성될 수 있다.
도 3는 도 2에 도시된 이미지 디블러링 방법을 수행하는 장치를 개략적으로 나타내는 도면이다.
디블러링 방법(20)을 수행하는 장치(100)는 메모리(200) 및 프로세서(300)를 포함한다.
프로세서(300)는 메모리(200)에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서에 의해 유발된 인스트럭션(instruction)들을 실행할 수 있다.
프로세서(300)는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다.
예를 들어, 하드웨어로 구현된 데이터 처리 장치는 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.
메모리(200)는 프로세서에 의해 실행가능한 인스트럭션들(또는 프로그램)을 저장할 수 있다. 예를 들어, 인스트럭션들은 프로세서의 동작 및/또는 프로세서의 각 구성의 동작을 실행하기 위한 인스트럭션들을 포함할 수 있다.
메모리(200)는 휘발성 메모리 장치 또는 불휘발성 메모리 장치로 구현될 수 있다.
휘발성 메모리 장치는 DRAM(dynamic random access memory), SRAM(static random access memory), T-RAM(thyristor RAM), Z-RAM(zero capacitor RAM), 또는 TTRAM(Twin Transistor RAM)으로 구현될 수 있다.
불휘발성 메모리 장치는 EEPROM(Electrically Erasable Programmable Read-Only Memory), 플래시(flash) 메모리, MRAM(Magnetic RAM), 스핀전달토크 MRAM(Spin-Transfer Torque(STT)-MRAM), Conductive Bridging RAM(CBRAM), FeRAM(Ferroelectric RAM), PRAM(Phase change RAM), 저항 메모리(Resistive RAM(RRAM)), 나노 튜브 RRAM(Nanotube RRAM), 폴리머 RAM(Polymer RAM(PoRAM)), 나노 부유 게이트 메모리(Nano Floating Gate Memory(NFGM)), 홀로그래픽 메모리(holographic memory), 분자 전자 메모리 소자(Molecular Eelectronic Memory Device), 또는 절연 저항 변화 메모리(Insulator Resistance Change Memory)로 구현될 수 있다.
프로세서(300)는 MT-RNN을 이용하여 원본 공간 스케일에서 블러 이미지를 디블러링 할 수 있다.
프로세서(300)는 MT-RNN이 점진적인 디블러링 방법(20)을 수행하도록 학습할 수 있다. 프로세서(300)는 시간적 데이터 증대 방법(Temporal Data Augmentation)을 통해 MT-RNN을 학습하는 학습 데이터를 생성할 수 있다.
이하, 학습 데이터 생성 방법, MT-RNN 학습 방법 및 MT-RNN의 동작을 상세히 설명하도록 한다.
도 4는 도 2에 도시된 이미지 디블러링 방법을 수행하기 위한 뉴럴 네트워크를 학습하는 방법을 설명하기 위한 도면이다.
프로세서(300)는 복수의 선명한 이미지를 통합하여 비균일 디블러링 데이터 세트(non-uniform deblurring datasets)를 생성할 수 있다. 예를 들어, 프로세서(300)는 복수의 선명한 이미지들의 평균으로 비균일 디블러링 데이터를 생성할 수 있다. 이때, 복수의 선명한 이미지는 고속 카메라를 통해 촬영된 이미지 일 수 있다.
T 및 x(t)는 각각 연속적인 시간 도메인의 시간 t에서 노출 시간(exposure time) 및 선명한 이미지를 나타낸다. 예를 들어, 노출 시간 T는 이미지를 촬영하는 고속 카메라의 셔터를 누르는 속도를 의미할 수 있다. x[i]는 불연속적인 도메인에서 i번째 선명한 이미지를 나타내고, n은 선명한 이미지의 개수를 나타낸다. g는 카메라 응답 함수(Camera Response Function(CRF))이다.
즉, 프로세서(300)는 n 개의 선명한 이미지를 이용하여 블러 이미지를 생성할 수 있다. 이하, 설명의 편의를 위해 n 개의 선명한 이미지를 이용하여 생성된 블러 이미지를 TL n (Temporal Level n)으로 지칭한다.
프로세서(300)는 지상 진실(ground truth) TL 1 및 서로 다른 프레임 개수로 생성된 블러 이미지들 TL n을 포함하는 학습 데이터 세트를 생성할 수 있다. 이때, TL 1은 MT-RNN의 최종 복원 이미지의 정답 라벨로 이용되고, 생성된 블러 이미지들 TL n은 MT-RNN의 중간 과정의 정답 라벨로 이용될 수 있다.
프로세서(300)는 점진적 시간 학습(incremental temporal training)을 통해 MT-RNN을 학습할 수 있다. 프로세서(300)는 중간 과정의 정답 라벨을 포함하는 데이터 세트에 기초한 커리큘럼 러닝(curriculum learning approach)를 통해 MT-RNN을 학습할 수 있다.
프로세서(300)는 첫번째 반복(1 Iter)에서 TL n을 MT-RNN에 입력하고, 출력된 이미지(estimated TL n-2) 및 정답 라벨 TL n-2 사이의 L1 손실 함수(L1 loss function)에 기초하여 MT-RNN을 학습할 수 있다.
프로세서(300)는 다음 반복에서 이전 반복에서 출력된 이미지 및 TL n가 MT-RNN에 입력되고, 출력된 이미지에 대응하는 정답 라벨 사이의 L1 손실 함수에 기초하여 MT-RNN을 학습할 수 있다.
프로세서(300)는 최종적으로 출력된 이미지가 최종 정답 라벨 TL 1이 될 때까지 학습 과정을 반복할 수 있다.
MT-RNN은 동일한 파라미터를 사용하며, 보든 반복에 대해 독립적으로 학습될 수 있다. 이를 통해, 프로세서(300)는 제한된 메모리로 MT-RNN을 학습하고 파라미터의 공유 없이 MT-RNN의 네트워크 크기를 줄일 수 있다.
도 5는 도 2에 도시된 이미지 디블러링 방법을 수행하는 뉴럴 네트워크를 설명하기 위한 도면이다.
MT-RNN은 재귀 피처맵(recurrent feature map)을 활용하여 디블러링을 수행할 수 있다. MT-RNN은 수학식 2와 같이 표현될 수 있다.
i는 반복 횟수를 나타내고, 및 i-1 번째 반복에서 재귀되는 피처맵이고, 는 네트워크의 입력으로 사용되는 블러 이미지이고, 및 는 각각 i-1 번째 반복 및 i 번째 반복에서 예측되는 이미지이고, 및 는 i 번째 반복에서 생성되는 재귀 피처맵이고, 는 네트워크의 파라미터들이다.
MT-RNN은 인코더-디코더 구조를 가질 수 있다. 인코더-디코더 구조는 상위, 중간 및 하위 인코더 및 디코더에서 각각 32, 64 및 128 채널의 잔차 블록(residual block)과 특징 추출 레이어(feature extraction layer)로 구성될 수 있다.
설명의 편의를 위해, 인코더의 각 레이어는 제1 컨볼루션 레이어(511), 제1 잔차 블록(512), 제1 다운 샘플링 컨볼루션 레이어(513), 제2 잔차 블록(514), 제2 다운 샘플링 컴볼루션 레이어(515) 및 제3 잔차 블록(516)으로 지칭하고, 디코더의 각 레이어는 제4 잔차 블록(531) 제1 업 샘플링 컨볼루션 레이어(532), 제5 잔차 블록(533), 제2 업 샘플링 컨볼루션 레이어(534), 제6 잔차 블록(535) 및 제2 컨볼루션 레이어(536)으로 지칭하도록 한다. 이때, 제1 업 샘플링 컨볼루션 레이어(532) 및 제2 업 샘플링 컨볼루션 레이어(534)는 특징 추출 레이어일 수 있다.
MT-RNN의 i 번째 반복에는 입력 이미지 및 i-1 번째 반복에서 예측된 이미지 의 합(concatenation)이 입력될 수 있다. 또한, i-1 번째 반복에서 제1 업 샘플링 컨볼루션 레이어(532) 및 제2 업 샘플링 컨볼루션 레이어(534) 각각에서 추출된 재귀 피처맵 및 는 각각 제1 다운 샘플링 컨볼루션 레이어(513) 및 제2 다운 샘플링 컨볼루션 레이어(515)에 입력될 수 있다.
MT-RNN의 i번째 반복에서 제1 잔차 블록(512) 및 제2 잔차 블록(514)에서 추출되는 재귀 피처맵 및 은 각각 제1 다운 샘플링 컨볼루션 레이어(513) 및 제2 다운 샘플링 컨볼루션 레이어(515)로 공급될 수 있다. 즉, 제1 다운 샘플링 컨볼루션 레이어(513) 및 제2 다운 샘플링 컨볼루션 레이어(515)는 피처 스캡 커넥션 레이어(feature skip connection layer)일 수 있다.
재귀 피처맵 는 각 디코더의 마지막 잔차 블록으로부터 공급될 수 있으며, 수학식 3과 같이 특징 추출 레이어에서 이전 인코더의 피처 맵과 합쳐질(concatenated) 수 있다.
MT-RNN은 RNN 셀에서 중간 피처 맵(intermediate feature map)을 다음 반복으로 전달하기 위해 컨볼루셔널 LSTM을 사용하거나 셀에서 숨겨진 상태(hidden state)를 사용하는 것과 유사하게 재귀 피처맵 을 사용할 수 있다.
프로세서(300)는 상술한 방식으로 동작하는 MT-RNN이용하여 점진적으로 디블러링을 수행할 수 있다.
도 6은 도 2에 도시된 이미지 디블러링 방법을 통해 디블러링 된 이미지를 나타내는 도면이다.
도 6은 MT-RNN을 이용하여 디블러링 방법(20)을 수행한 결과를 도시한다. MT-RNN의 반복 횟수에 따라서 디블러링 성능에 영향이 있을 수 있다.
도 6에서는 6번의 반복을 수행한 결과를 나타내는데 높은 선능으로 디블러링이 수행됨을 확인할 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.
Claims (16)
- 블러 이미지(blurred image)를 입력 받는 단계; 및
상기 블러 이미지에 기초하여 인코더-디코더 구조의 뉴럴 네트워크를 이용하여 디블러링을 수행함으로써 선명한 원본 이미지를 출력하는 단계
를 포함하고,
상기 출력하는 단계는,
이전 반복에서 제1 이미지를 뉴럴 네트워크에 입력하여 획득된 상기 제1 이미지와 동일한 스케일을 가지며 상기 제1 이미지보다 덜 흐린 제1 정답 라벨에 기초하는 제2 이미지를 수신하는 단계;
상기 제1 이미지 및 상기 제2 이미지를 결합하여(concatenate) 상기 제1 이미지와 동일한 스케일을 가지며 상기 제1 정답 라벨보다 덜 흐린 제2 정답 라벨에 기초하는 제3 이미지를 획득하는 단계; 및
현재 반복에서 상기 제3 이미지를 상기 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지며 상기 제2 정답 라벨보다 덜 흐린 제3 정답 라벨에 기초하는 제4 이미지를 획득하는 단계
를 포함하고,
상기 제4 이미지를 획득하는 단계는,
상기 이전 반복에서 상기 뉴럴 네트워크의 디코더에서 출력된 재귀 피처맵이 상기 현재 반복에서 상기 뉴럴 네트워크의 인코더에 입력되어 상기 제3 이미지를 디블러링함으로써 상기 제4 이미지를 획득하는 단계
를 포함하는, 이미지 디블러링 방법.
- 삭제
- 제1항에 있어서,
상기 뉴럴 네트워크는,
복수의 인코더 및 복수의 디코더를 포함한 구조의 재귀 뉴럴 네트워크(Recursive Neural Network)인, 이미지 디블러링 방법.
- 제3항에 있어서,
상기 복수의 인코더 및 상기 복수의 디코더 각각은,
서로 다른 채널의 잔차 블록(residual blocks) 및 특징 추출 레이어(feature extraction layers)를 포함하는, 이미지 디블러링 방법.
- 인코더-디코더 구조의 뉴럴 네트워크를 이용하여 디블러링을 수행하는 이미지 디블러링 장치에 있어서,
인스트럭션들을 포함하는 메모리; 및
상기 인스트럭션들을 실행하기 위한 프로세서
를 포함하고,
상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는,
이전 반복에서 제1 이미지를 뉴럴 네트워크에 입력하여 획득된 상기 제1 이미지와 동일한 스케일을 가지며 상기 제1 이미지보다 덜 흐린 제1 정답 라벨에 기초하는 제2 이미지를 수신하고, 상기 제1 이미지 및 상기 제2 이미지를 결합하여(concatenate) 상기 제1 이미지와 동일한 스케일을 가지며 상기 제1 정답 라벨보다 덜 흐린 제2 정답 라벨에 기초하는 제3 이미지를 획득하고, 현재 반복에서 상기 제3 이미지를 상기 뉴럴 네트워크에 입력하여 상기 제1 이미지와 동일한 스케일을 가지며 상기 제2 정답 라벨보다 덜 흐린 제3 정답 라벨에 기초하는 제4 이미지를 획득하고,
상기 프로세서는,
상기 이전 반복에서 상기 뉴럴 네트워크의 디코더에서 출력된 재귀 피처맵을 상기 현재 반복에서 상기 뉴럴 네트워크의 인코더에 입력하여 상기 제3 이미지를 디블러링함으로써 상기 제4 이미지를 획득하는, 이미지 디블러링 장치.
- 삭제
- 제5항에 있어서,
상기 뉴럴 네트워크는,
복수의 인코더 및 복수의 디코더를 포함한 구조의 재귀 뉴럴 네트워크(Recursive Neural Network)인, 이미지 디블러링 장치.
- 제7항에 있어서,
상기 복수의 인코더 및 상기 복수의 디코더 각각은,
서로 다른 채널의 잔차 블록(residual blocks) 및 특징 추출 레이어(feature extraction layers)를 포함하는, 이미지 디블러링 장치.
- 인코더-디코더 구조의 뉴럴 네트워크 학습 방법에 있어서,
이전 반복에서 제1 이미지를 뉴럴 네트워크에 입력하여 획득된 제2 이미지를 수신하는 단계;
상기 제1 이미지보다 덜 흐린 제1 정답 라벨 및 상기 제2 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정하는 단계;
현재 반복에서 상기 제1 이미지 및 상기 제2 이미지를 상기 뉴럴 네트워크에 입력하여 제3 이미지를 획득하는 단계; 및
상기 제1 정답 라벨보다 덜 흐린 제2 정답 라벨 및 상기 제3 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정하는 단계
를 포함하고,
상기 제3 이미지를 획득하는 단계는,
상기 이전 반복에서 상기 뉴럴 네트워크의 디코더에서 출력된 재귀 피처맵이 상기 현재 반복에서 상기 뉴럴 네트워크의 인코더에 입력되어 상기 제1 이미지와 상기 제2 이미지를 합한 이미지를 디블러링함으로써 상기 제3 이미지를 획득하는 단계
를 포함하는, 뉴럴 네트워크 학습 방법.
- 제9항에 있어서,
상기 제1 이미지는,
연속적으로 촬영된 복수의 이미지를 결합하여 생성된 이미지인, 뉴럴 네트워크 학습 방법.
- 제10항에 있어서,
상기 제1 정답 라벨은,
상기 제1 이미지 보다 적은 수의 이미지를 결합하여 생성된 이미지인, 뉴럴 네트워크 학습 방법
- 제11항에 있어서,
상기 제2 정답 라벨은,
상기 제1 정답 라벨 보다 적은 수의 이미지를 결합하여 생성된 이미지인, 뉴럴 네트워크 학습 방법.
- 인코더-디코더 구조의 뉴럴 네트워크를 학습시키는 장치에 있어서,
인스트럭션들을 포함하는 메모리; 및
상기 인스트럭션들을 실행하기 위한 프로세서
를 포함하고,
상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는,
이전 반복에서 제1 이미지를 뉴럴 네트워크에 입력하여 획득된 제2 이미지를 수신하고, 상기 제1 이미지보다 덜 흐린 제1 정답 라벨 및 상기 제2 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정하고, 현재 반복에서 상기 제1 이미지 및 상기 제2 이미지를 상기 뉴럴 네트워크에 입력하여 제3 이미지를 획득하고, 상기 제1 정답 라벨보다 덜 흐린 제2 정답 라벨 및 상기 제3 이미지에 기초하여 상기 뉴럴 네트워크의 파라미터를 수정하고,
상기 프로세서는,
상기 이전 반복에서 상기 뉴럴 네트워크의 디코더에서 출력된 재귀 피처맵을 상기 현재 반복에서 상기 뉴럴 네트워크의 인코더에 입력하여 상기 제1 이미지와 상기 제2 이미지를 합한 이미지를 디블러링함으로써 상기 제3 이미지를 획득하는, 뉴럴 네트워크 학습 장치.
- 제13항에 있어서,
상기 제1 이미지는,
연속적으로 촬영된 복수의 이미지를 결합하여 생성된 이미지인, 뉴럴 네트워크 학습 장치.
- 제14항에 있어서,
상기 제1 정답 라벨은,
상기 제1 이미지 보다 적은 수의 이미지를 결합하여 생성된 이미지인, 뉴럴 네트워크 학습 장치.
- 제15항에 있어서,
상기 제2 정답 라벨은,
상기 제1 정답 라벨 보다 적은 수의 이미지를 결합하여 생성된 이미지인, 뉴럴 네트워크 학습 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200115575A KR102336103B1 (ko) | 2020-09-09 | 2020-09-09 | 딥러닝 기반 영상 디블러링 방법 및 이를 수행하는 장치 |
US17/095,983 US11645738B2 (en) | 2020-09-09 | 2020-11-12 | Driving deep learning-based image deblurring method and apparatus performing the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200115575A KR102336103B1 (ko) | 2020-09-09 | 2020-09-09 | 딥러닝 기반 영상 디블러링 방법 및 이를 수행하는 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102336103B1 true KR102336103B1 (ko) | 2021-12-08 |
Family
ID=78867608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200115575A KR102336103B1 (ko) | 2020-09-09 | 2020-09-09 | 딥러닝 기반 영상 디블러링 방법 및 이를 수행하는 장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11645738B2 (ko) |
KR (1) | KR102336103B1 (ko) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019167884A1 (ja) * | 2018-02-28 | 2019-09-06 | 富士フイルム株式会社 | 機械学習方法及び装置、プログラム、学習済みモデル、並びに判別装置 |
KR20190114340A (ko) * | 2018-03-29 | 2019-10-10 | 한국과학기술원 | 이미지 디블러링(Deblurring) 네트워크 처리방법 및 시스템 |
JP2020036310A (ja) * | 2018-08-24 | 2020-03-05 | キヤノン株式会社 | 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、記憶媒体、および、画像処理システム |
KR102103770B1 (ko) * | 2018-04-02 | 2020-04-24 | 동국대학교 산학협력단 | 보행자 검출 장치 및 방법 |
JP2020517946A (ja) * | 2017-04-25 | 2020-06-18 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | ディープ畳み込みニューラルネットワークを使用した医用画像化のための線量低減 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2919943B1 (fr) | 2007-08-07 | 2010-02-26 | Dxo Labs | Procede de traitement d'objet numerique et systeme associe |
KR101152525B1 (ko) | 2010-12-29 | 2012-07-11 | 포항공과대학교 산학협력단 | 모션 블러 제거 방법 및 이러한 방법을 수행하는 장치 |
US9430817B2 (en) * | 2013-11-12 | 2016-08-30 | Microsoft Technology Licensing, Llc | Blind image deblurring with cascade architecture |
US10289951B2 (en) * | 2016-11-02 | 2019-05-14 | Adobe Inc. | Video deblurring using neural networks |
CN108629743B (zh) * | 2018-04-04 | 2022-03-25 | 腾讯科技(深圳)有限公司 | 图像的处理方法、装置、存储介质和电子装置 |
-
2020
- 2020-09-09 KR KR1020200115575A patent/KR102336103B1/ko active
- 2020-11-12 US US17/095,983 patent/US11645738B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020517946A (ja) * | 2017-04-25 | 2020-06-18 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | ディープ畳み込みニューラルネットワークを使用した医用画像化のための線量低減 |
WO2019167884A1 (ja) * | 2018-02-28 | 2019-09-06 | 富士フイルム株式会社 | 機械学習方法及び装置、プログラム、学習済みモデル、並びに判別装置 |
KR20190114340A (ko) * | 2018-03-29 | 2019-10-10 | 한국과학기술원 | 이미지 디블러링(Deblurring) 네트워크 처리방법 및 시스템 |
KR102103770B1 (ko) * | 2018-04-02 | 2020-04-24 | 동국대학교 산학협력단 | 보행자 검출 장치 및 방법 |
JP2020036310A (ja) * | 2018-08-24 | 2020-03-05 | キヤノン株式会社 | 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、記憶媒体、および、画像処理システム |
Also Published As
Publication number | Publication date |
---|---|
US11645738B2 (en) | 2023-05-09 |
US20220076386A1 (en) | 2022-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6998968B2 (ja) | ディープニューラルネットワークの実行方法、実行装置、学習方法、学習装置及びプログラム | |
JP2021100247A (ja) | 歪んだドキュメント画像の矯正方法及び装置 | |
CN110781923B (zh) | 特征提取方法及装置 | |
KR102390553B1 (ko) | 연합 학습 방법 및 시스템 | |
JP6612473B2 (ja) | ニューラルネットワークを使用した画像生成 | |
CN111950718B (zh) | 利用存算一体芯片实现递进式cnn运算的方法 | |
JP7143529B2 (ja) | 画像復元方法及びその装置、電子機器並びに記憶媒体 | |
CN107610069B (zh) | 基于共享k-svd字典的dvs可视化视频去噪方法 | |
KR102642058B1 (ko) | 시간 적응적, 공간 선택적 시그널링을 이용한 뉴럴 네트워크 처리 방법 및 장치 | |
WO2022100490A1 (en) | Methods and systems for deblurring blurry images | |
KR20200096026A (ko) | 딥러닝을 이용한 움직임 블러제거 장치 및 동작 방법 | |
KR102336103B1 (ko) | 딥러닝 기반 영상 디블러링 방법 및 이를 수행하는 장치 | |
KR102394314B1 (ko) | 고문서 이미지 광학 문자 판독 장치 및 방법 | |
KR102398365B1 (ko) | 학습 가능한 공간-스펙트럴 변환 기법 기반의 딥러닝 영상 분해 및 압축 센싱 방법 | |
US20210406682A1 (en) | Quantization of neural network models using data augmentation | |
KR102417967B1 (ko) | 다중 출력 아키텍처를 통한 점진적 초해상도 영상 변환 장치 및 방법 | |
KR101946692B1 (ko) | 그래프 랭킹 수행 방법 및 장치 | |
KR102364628B1 (ko) | 비디오 처리 방법 및 장치 | |
KR102153786B1 (ko) | 선택 유닛을 이용한 이미지 처리 방법 및 장치 | |
KR102126916B1 (ko) | 블러된 영상 복원을 위한 장치 및 방법 | |
KR20220129976A (ko) | 씬 플로우 추정 방법 및 장치 | |
KR102565440B1 (ko) | 디블러와 초해상도를 이용한 딥러닝 기반 이미지 화질 향상 방법 | |
KR102590926B1 (ko) | 왜곡 이미지의 이미지 복원 방법 및 장치 | |
CN118644821B (zh) | 基于注意力特征融合与多列特征增强的人群计数方法 | |
CN118691504B (zh) | 基于模糊核修正的光学图像去运动模糊方法、装置和设备 |