KR20210014561A - 다수 컨벌루션 윈도우 중의 이미지 데이터를 추출하는 방법, 장치, 기기 및 컴퓨터 판독 가능한 저장매체 - Google Patents
다수 컨벌루션 윈도우 중의 이미지 데이터를 추출하는 방법, 장치, 기기 및 컴퓨터 판독 가능한 저장매체 Download PDFInfo
- Publication number
- KR20210014561A KR20210014561A KR1020200029546A KR20200029546A KR20210014561A KR 20210014561 A KR20210014561 A KR 20210014561A KR 1020200029546 A KR1020200029546 A KR 1020200029546A KR 20200029546 A KR20200029546 A KR 20200029546A KR 20210014561 A KR20210014561 A KR 20210014561A
- Authority
- KR
- South Korea
- Prior art keywords
- convolutional
- data
- image data
- window
- data processing
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012545 processing Methods 0.000 claims abstract description 118
- 238000000605 extraction Methods 0.000 claims abstract description 54
- 238000013075 data extraction Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 54
- 230000015654 memory Effects 0.000 claims description 32
- 230000017105 transposition Effects 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 13
- 238000000638 solvent extraction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 238000005192 partition Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 31
- 238000010586 diagram Methods 0.000 description 15
- 239000000284 extract Substances 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G06N3/0454—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/153—Multidimensional correlation or convolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Neurology (AREA)
- Image Processing (AREA)
- Complex Calculations (AREA)
- Image Analysis (AREA)
Abstract
Description
도 1은 컨벌루션 신경망의 컨벌루션 과정을 도시한 설명도이다.
도 2는 본 발명 실시예에 따라 다수 컨벌루션 윈도우 중의 이미지 데이터를 병렬 추출하는 방법을 도시한 흐름도이다.
도 3은 본 발명 실시예에 따라 다수 컨벌루션 윈도우 중의 이미지 데이터를 병렬 추출하는 과정을 도시한 설명도이다.
도 4는 본 발명 실시예에 따라 데이터를 병렬 처리하는 가속기 설비의 예시 구조를 도시한 설명도이다.
도 5는 본 발명 실시예에 따라 컨벌브된 데이터를 추출하는 예시 과정을 도시한 설명도이다.
도 6은 본 발명 실시예에 따른 병렬 전치행렬의 예시 과정을 도시한 설명도이다.
도 7은 본 발명 실시예에 따른 다수 컨벌루션 윈도우 중의 이미지 데이터를 병렬 추출하는 장치를 도시한 블록도이다.
도 8은 본 발명의 다수 실시예를 구현할 수 있는 전자 기기를 도시한 블록도이다.
Claims (20)
- 다수 컨벌루션 윈도우에서 이미지 데이터를 병렬 추출하는 방법에 있어서,
이미지를 다수 컨벌루션 윈도우 그룹으로 구획하는 단계 -상기 다수 컨벌루션 윈도우 그룹은 제1 컨벌루션 윈도우 그룹과 제2 컨벌루션 윈도우 그룹을 포함함 -
다수 데이터 처리장치를 통해 상기 제1 컨벌루션 윈도우 그룹의 다수 컨벌루션 윈도우의 이미지 데이터를 병렬 추출하는 단계; 및
상기 제1 컨벌루션 윈도우 그룹의 이미지 데이터를 추출 완료함에 응답하여, 상기 다수 데이터 처리장치를 통해 상기 제2 컨벌루션 윈도우 그룹의 다수 컨벌루션 윈도우의 이미지 데이터를 병렬 추출하는 단계를 포함하는 방법. - 제 1항에 있어서,
상기 다수 데이터 처리장치는 제1 데이터 처리장치와 제2 데이터 처리장치를 포함하고, 상기 제1 컨벌루션 윈도우 그룹은 제1 컨벌루션 윈도우와 제2 컨벌루션 윈도우를 포함하며,
다수의 데이터 처리장치를 통해 상기 제1 컨벌루션 윈도우 그룹의 다수 컨벌루션 윈도우의 이미지 데이터를 병렬 추출하는 단계는,
상기 제1 데이터 처리장치를 사용하여 상기 제1 컨벌루션 윈도우의 이미지 데이터를 추출하는 단계; 및
상기 제2 데이터 처리장치를 사용하여 상기 제2 컨벌루션 윈도우의 이미지 데이터를 추출하는 단계를 포함하는 방법. - 제 2항에 있어서,
상기 제1 데이터 처리장치를 사용하여 상기 제1 컨벌루션 윈도우의 이미지 데이터를 추출하는 단계는,
상기 제1 컨벌루션 윈도우의 제1채널 중의 제1행 이미지 데이터를 추출하는 단계;
상기 제1 컨벌루션 윈도우의 상기 제1채널 중의 제2행 이미지 데이터를 추출하는 단계; 및
상기 제1 컨벌루션 윈도우의 상기 제1채널 중의 제3행 이미지 데이터를 추출하는 단계를 포함하는 방법. - 제 3항에 있어서,
상기 제1 데이터 처리장치를 사용하여 상기 제1 컨벌루션 윈도우의 이미지 데이터를 추출하는 단계는,
상기 제1 컨벌루션 윈도우의 제1채널 중의 모든 이미지 데이터를 추출 완료함에 응답하여,
상기 제1 컨벌루션 윈도우의 제2채널 중의 제1행 이미지 데이터를 추출하는 단계;
상기 제1 컨벌루션 윈도우의 상기 제2채널 중의 제2행 이미지 데이터를 추출하는 단계; 및
상기 제1 컨벌루션 윈도우의 상기 제2채널 중의 제3행 이미지 데이터를 추출하는 단계를 더 포함하는 방법. - 제 4항에 있어서,
상기 제1 데이터 처리장치를 사용하여 상기 제1 컨벌루션 윈도우의 이미지 데이터를 추출하는 단계는,
상기 제1 컨벌루션 윈도우의 전체 채널 중 전체 이미지 데이터를 추출 완료함에 응답하여, 상기 제1 컨벌루션 윈도우의 전체 이미지 데이터를 1차원 벡터로 나타내는 단계 - 상기 1차원 벡터의 길이는 상기 이미지의 채널 수, 각 컨벌루션 윈도우의 행의 개수 및 각 컨벌루션 윈도우의 열의 개수의 적임 - 를 더 포함하는 방법. - 제 1항에 있어서,
타깃 메모리에 상기 다수의 컨벌루션 윈도우 그룹의 전체 이미지 데이터를 2차 행렬로 저장하는 단계 - 상기 2차 행렬의 행의 개수는 상기 다수의 컨벌루션 윈도우 그룹의 전체 컨벌루션 윈도우의 수이며, 상기 2차 행렬의 열의 개수는 상기 이미지의 채널 수, 각 컨벌루션 윈도우의 행의 개수 및 각 컨벌루션 윈도우의 열의 개수의 적임 - 를 더 포함하는 방법. - 제 1항에 있어서,
행렬을 열단위로 다수의 블록으로 구획하는 단계 - 상기 다수 블록은 제1블록과 제2블록을 포함함 - ;
상기 다수 데이터 처리장치를 사용하여 상기 제1블록의 다수 열 데이터를 병렬 전치하는 단계; 및
상기 제1블록의 다수 열 데이터를 전치 완료함에 응답하여, 상기 다수 데이터 처리장치를 사용하여 상기 제2블록의 다수 열 데이터를 병렬 전치하는 단계를 더 포함하는 방법. - 제 7항에 있어서,
상기 다수 데이터 처리장치를 사용하여 제1블록의 다수 열 데이터를 병렬 전치하는 단계는,
상기 다수 데이터 처리장치 중 제1 데이터 처리장치를 통해 상기 제1블록의 제1열 데이터를 전치하는 단계; 및
상기 다수 데이터 처리장치 중 제2 데이터 처리장치를 통해 상기 제2블록의 제2열 데이터를 전치하는 단계를 포함하는 방법. - 제 7항에 있어서,
행렬을 열단위로 다수의 블록으로 구획하는 단계는,
상기 다수 데이터 처리장치의 개수에 기반하여 상기 행렬을 상기 다수 블록으로 구획하는 단계를 포함하는 방법. - 다수 컨벌루션 윈도우에서 이미지 데이터를 병렬 추출하는 장치에 있어서,
이미지를 다수 컨벌루션 윈도우 그룹으로 구획하는 컨벌루션 윈도우 그룹 구획 모듈 - 상기 다수 컨벌루션 윈도우 그룹은 제1 컨벌루션 윈도우 그룹과 제2 컨벌루션 윈도우 그룹을 포함함 -
다수 데이터 처리장치를 통해 상기 제1 컨벌루션 윈도우 그룹의 다수 컨벌루션 윈도우의 이미지 데이터를 병렬 추출하는 제1 병렬 추출 모듈; 및
상기 제1 컨벌루션 윈도우 그룹의 이미지 데이터를 추출 완료함에 응답하여, 상기 다수 데이터 처리장치를 통해 상기 제2 컨벌루션 윈도우 그룹의 다수 컨벌루션 윈도우의 이미지 데이터를 병렬 추출하는 제2 병렬 추출 모듈을 포함하는 장치. - 제 10항에 있어서,
상기 다수 데이터 처리장치는 제1 데이터 처리장치와 제2 데이터 처리장치를 포함하고, 상기 제1 컨벌루션 윈도우 그룹은 제1 컨벌루션 윈도우와 제2 컨벌루션 윈도우를 포함하며, 상기 제1 병렬 추출 모듈은,
상기 제1 데이터 처리장치를 사용하여 상기 제1 컨벌루션 윈도우의 이미지 데이터를 추출하는 제1 데이터 추출 모듈; 및
상기 제2 데이터 처리장치를 사용하여 상기 제2 컨벌루션 윈도우의 이미지 데이터를 추출하는 제2 데이터 추출 모듈을 포함하는 장치. - 제 11항에 있어서,
상기 제1 데이터 추출 모듈은,
상기 제1 컨벌루션 윈도우의 제1채널 중의 제1행 이미지 데이터를 추출하는 제1 추출 모듈;
상기 제1 컨벌루션 윈도우의 상기 제1채널 중의 제2행 이미지 데이터를 추출하는 제2 추출 모듈; 및
상기 제1 컨벌루션 윈도우의 상기 제1채널 중의 제3행 이미지 데이터를 추출하는 제3 추출 모듈을 포함하는 장치. - 제 12항에 있어서,
상기 제1 데이터 추출 모듈은,
상기 제1 컨벌루션 윈도우의 제1채널 중의 모든 이미지 데이터를 추출 완료함에 응답하여,
상기 제1 컨벌루션 윈도우의 제2채널 중의 제1행 이미지 데이터를 추출하고;
상기 제1 컨벌루션 윈도우의 상기 제2채널 중의 제2행 이미지 데이터를 추출하고;
상기 제1 컨벌루션 윈도우의 상기 제2채널 중의 제3행 이미지 데이터를 추출하는 제2채널 추출 모듈을 더 포함하는 장치. - 제 13항에 있어서,
상기 제1 데이터 추출 모듈은,
상기 제1 컨벌루션 윈도우의 전체 채널 중의 전체 이미지 데이터를 추출 완료함에 응답하여, 상기 제1 컨벌루션 윈도우의 전체 이미지 데이터를 1차원 벡터로 나타내는 데이터 표시 모듈을 더 포함하되,
상기 1차원 벡터의 길이는 상기 이미지의 채널 수, 각 컨벌루션 윈도우의 행의 개수 및 각 컨벌루션 윈도우의 열의 개수의 적인 장치. - 제 10항에 있어서,
타깃 메모리에 상기 다수의 컨벌루션 윈도우 그룹의 전체 이미지 데이터를 2차 행렬로 저장하는 데이터 저장 모듈을 더 포함하되,
상기 2차 행렬의 행의 개수는 상기 다수의 컨벌루션 윈도우 그룹의 전체 컨벌루션 윈도우의 수이며, 상기 2차 행렬의 열의 개수는 상기 이미지의 채널 수, 각 컨벌루션 윈도우의 행의 개수 및 각 컨벌루션 윈도우의 열의 개수의 적인 장치. - 제 10항에 있어서,
행렬을 열단위로 다수의 블록으로 구획하는 블록 구획 모듈 - 상기 다수의 블록은 제1블록과 제2블록을 포함함 -;
상기 다수 데이터 처리장치를 사용하여 상기 제1블록의 다수 열 데이터를 병렬 전치하는 제1 병렬 전치 모듈;
상기 제1블록의 다수 열 데이터를 전치 완료함에 응답하여, 상기 다수 데이터 처리장치를 사용하여 상기 제2블록의 다수 열 데이터를 병렬 전치하는 제2 병렬 전치 모듈을 더 포함하는 장치. - 제 16항에 있어서,
제1 병렬 전치 모듈은,
상기 다수 데이터 처리장치 중 제1 데이터 처리장치를 통해 상기 제1블록의 제1열 데이터를 전치하는 제1 행렬 전치 모듈; 및
상기 다수 데이터 처리장치 중 제2 데이터 처리장치를 통해 상기 제2블록의 제2열 데이터를 전치하는 제2 행렬 전치 모듈을 포함하는 장치. - 제 16항에 있어서,
상기 블록 구획 모듈은,
상기 다수 데이터 처리장치의 개수에 기반하여 상기 행렬을 상기 다수 블록으로 구획하는 제2블록 구획 모듈을 포함하는 장치. - 한 개 또는 다수의 프로세서; 및
한 개 또는 다수의 프로그램을 저장하는 저장유닛을 포함하는 전자 기기에 있어서,
상기 한 개 또는 다수의 프로그램이 상기 한 개 또는 다수의 프로세서에 의해 실행이 되어, 상기 전자 기기가 청구항 제1항 내지 제9항 중 어느 한 항의 방법을 구현하도록 하는 전자 기기. - 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 저장매체에 있어서,
상기 프로그램이 프로세서에 의해 실행될 때 청구항 제1항 내지 제9항 중 어느 한 항의 상기 방법을 구현하는 컴퓨터 판독 가능한 저장매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910694475.8A CN112306555A (zh) | 2019-07-30 | 2019-07-30 | 并行提取多个卷积窗中的图像数据的方法、装置、设备以及计算机可读存储介质 |
CN201910694475.8 | 2019-07-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210014561A true KR20210014561A (ko) | 2021-02-09 |
KR102470027B1 KR102470027B1 (ko) | 2022-11-24 |
Family
ID=69784274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200029546A KR102470027B1 (ko) | 2019-07-30 | 2020-03-10 | 다수 컨벌루션 윈도우 중의 이미지 데이터를 추출하는 방법, 장치, 기기 및 컴퓨터 판독 가능한 저장매체 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11481994B2 (ko) |
EP (1) | EP3771999B1 (ko) |
JP (1) | JP6955598B2 (ko) |
KR (1) | KR102470027B1 (ko) |
CN (1) | CN112306555A (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704172B (zh) * | 2021-08-20 | 2023-11-21 | 北京大学 | 基于脉动阵列的转置卷积和卷积加速器芯片设计方法 |
CN114708446B (zh) * | 2022-03-14 | 2024-10-18 | 中国科学技术大学 | 目标检测方法、装置、设备及存储介质 |
CN114936633B (zh) * | 2022-06-15 | 2023-06-30 | 北京爱芯科技有限公司 | 用于转置运算的数据处理单元及图像转置运算方法 |
CN115184771B (zh) * | 2022-07-08 | 2024-06-11 | 北京地平线信息技术有限公司 | 图像信号处理器的故障检测方法和装置、电子设备和介质 |
CN117949964B (zh) * | 2024-03-27 | 2024-06-21 | 青岛科技大学 | 一种激光多普勒测速系统信号处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018196863A1 (zh) * | 2017-04-28 | 2018-11-01 | 北京市商汤科技开发有限公司 | 卷积加速和计算处理方法、装置、电子设备及存储介质 |
WO2019109795A1 (zh) * | 2017-12-06 | 2019-06-13 | 腾讯科技(深圳)有限公司 | 卷积运算处理方法及相关产品 |
US20190220731A1 (en) * | 2014-12-04 | 2019-07-18 | Nvdia Corporation | Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190051697A (ko) | 2017-11-07 | 2019-05-15 | 삼성전자주식회사 | 뉴럴 네트워크의 디컨벌루션 연산을 수행하는 장치 및 방법 |
US10747844B2 (en) * | 2017-12-12 | 2020-08-18 | Tesla, Inc. | Systems and methods for converting a matrix input to a vectorized input for a matrix processor |
CN111712830B (zh) * | 2018-02-21 | 2024-02-09 | 罗伯特·博世有限公司 | 使用深度传感器的实时对象检测 |
US11574694B2 (en) * | 2018-10-11 | 2023-02-07 | International Business Machines Corporation | Kernel sets normalization with capacitor charge sharing |
US11586883B2 (en) * | 2018-12-14 | 2023-02-21 | Microsoft Technology Licensing, Llc | Residual quantization for neural networks |
US20200210840A1 (en) * | 2018-12-31 | 2020-07-02 | Microsoft Technology Licensing, Llc | Adjusting precision and topology parameters for neural network training based on a performance metric |
US12165038B2 (en) * | 2019-02-14 | 2024-12-10 | Microsoft Technology Licensing, Llc | Adjusting activation compression for neural network training |
-
2019
- 2019-07-30 CN CN201910694475.8A patent/CN112306555A/zh active Pending
-
2020
- 2020-03-03 US US16/807,775 patent/US11481994B2/en active Active
- 2020-03-09 JP JP2020039446A patent/JP6955598B2/ja active Active
- 2020-03-10 KR KR1020200029546A patent/KR102470027B1/ko active IP Right Grant
- 2020-03-10 EP EP20161994.7A patent/EP3771999B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190220731A1 (en) * | 2014-12-04 | 2019-07-18 | Nvdia Corporation | Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system |
WO2018196863A1 (zh) * | 2017-04-28 | 2018-11-01 | 北京市商汤科技开发有限公司 | 卷积加速和计算处理方法、装置、电子设备及存储介质 |
WO2019109795A1 (zh) * | 2017-12-06 | 2019-06-13 | 腾讯科技(深圳)有限公司 | 卷积运算处理方法及相关产品 |
Non-Patent Citations (1)
Title |
---|
"Throughput-Optimized OpenCL-based FPGA Accelerator for Large-Scale Convolutional Neural Networks", ACM/SIGDA International Symposium on Field-Programmable Gate Arrays(pp. 16-25), 2016. * |
Also Published As
Publication number | Publication date |
---|---|
JP6955598B2 (ja) | 2021-10-27 |
KR102470027B1 (ko) | 2022-11-24 |
US11481994B2 (en) | 2022-10-25 |
EP3771999B1 (en) | 2023-01-18 |
JP2021022362A (ja) | 2021-02-18 |
US20210034900A1 (en) | 2021-02-04 |
EP3771999A1 (en) | 2021-02-03 |
CN112306555A (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102470027B1 (ko) | 다수 컨벌루션 윈도우 중의 이미지 데이터를 추출하는 방법, 장치, 기기 및 컴퓨터 판독 가능한 저장매체 | |
US11960934B2 (en) | Systems and methods for improved neural network execution | |
CN112214726B (zh) | 运算加速器 | |
US10417555B2 (en) | Data-optimized neural network traversal | |
US11675997B2 (en) | Device and method for processing convolution operation using kernel | |
JP7403638B2 (ja) | 高速なスパースニューラルネットワーク | |
US20220083857A1 (en) | Convolutional neural network operation method and device | |
US12182688B2 (en) | Hierarchical partitioning of operators | |
CN114995782B (zh) | 数据处理方法、装置、设备和可读存储介质 | |
US12106222B2 (en) | Neural network training under memory restraint | |
US11562554B1 (en) | Workload reduction for non-maximum suppression operation | |
CN109416755B (zh) | 人工智能并行处理方法、装置、可读存储介质、及终端 | |
CN109313663A (zh) | 人工智能计算辅助处理装置、方法、存储介质、及终端 | |
US11113361B2 (en) | Electronic apparatus and control method thereof | |
US12125124B1 (en) | Matrix transpose hardware acceleration | |
CN114138231B (zh) | 执行矩阵乘法运算的方法、电路及soc | |
US20190114542A1 (en) | Electronic apparatus and control method thereof | |
KR102606207B1 (ko) | 매트릭스 수학 명령어 세트에 대한 타일링 알고리즘 | |
CN113077042A (zh) | 卷积神经网络的数据重用与高效处理方法 | |
CN117851742A (zh) | 数据存储方法、数据处理方法、数据存储器、数据处理器 | |
JP5045652B2 (ja) | 相関処理装置及びその相関処理装置で読みとり可能な媒体 | |
US20240281281A1 (en) | Neural network accelerator and method of controlling same | |
US11842273B2 (en) | Neural network processing | |
KR102718583B1 (ko) | 뉴럴 네트워크를 위한 데이터 처리 방법 및 장치 | |
KR102764317B1 (ko) | 뉴럴 네트워크의 컨볼루션 연산을 처리하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20200310 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
PN2301 | Change of applicant |
Patent event date: 20211027 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220405 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221024 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20221118 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20221121 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |