Nothing Special   »   [go: up one dir, main page]

CN112101178B - 一种辅助盲人感知外界环境的智能soc终端 - Google Patents

一种辅助盲人感知外界环境的智能soc终端 Download PDF

Info

Publication number
CN112101178B
CN112101178B CN202010944871.4A CN202010944871A CN112101178B CN 112101178 B CN112101178 B CN 112101178B CN 202010944871 A CN202010944871 A CN 202010944871A CN 112101178 B CN112101178 B CN 112101178B
Authority
CN
China
Prior art keywords
fpga
module
environment image
environment
arm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010944871.4A
Other languages
English (en)
Other versions
CN112101178A (zh
Inventor
阎波
牧士宁
许宏达
魏然
柴进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010944871.4A priority Critical patent/CN112101178B/zh
Publication of CN112101178A publication Critical patent/CN112101178A/zh
Application granted granted Critical
Publication of CN112101178B publication Critical patent/CN112101178B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种辅助盲人感知外界环境的智能SOC终端,其包括环境图像采集模块、环境图像识别模块和识别结果输出模块;环境图像采集模块用于采集盲人在行走过程中所处环境的环境图像,环境图像识别模块用于利用ARM将环境图像数据分批搬运至FPGA,再利用基于FPGA的可配置复用的卷积神经网络加速器对分批搬入的环境图像数据计算特征图,并利用ARM将FPGA输出的特征图和对应的网络权重分配搬出后进行目标识别,识别结果输入模块用于向盲人输出识别结果。本发明利用基于FPGA的可配置复用的神经网络加速器,在保证物体识别精度的同时并进行语音播报,大幅提升了终端目标检测速度,且使用较少的资源以及功耗,确保了基于SoC的导盲智能穿戴系统的低成本特性及实时性。

Description

一种辅助盲人感知外界环境的智能SOC终端
技术领域
本发明涉及智能终端技术领域,具体涉及一种辅助盲人感知外界环境的智能SOC终端。
背景技术
盲人作为弱势群体,在生活中受到的身体和精神上的压力非常大。对于盲人来说,想要对外界的事物进行了解,只能通过听觉且无法确定外界到底有什么,这让盲人的生活变得非常枯燥。由于目前神经网络的发展迅速,AI识别技术已经广泛的应用于生活中,对于盲人来说,辅助盲人感知外界的核心在于物体识别的精确性和实时性,以便于准确的播报。
但是由于神经网络的特性,虽然网络越大识别越准确,但是巨大的网络带来的巨大运算量,但是对于较小的网络,运算量小但是识别的准确率却是非常低。目前高精度的物体识别神经网络基本上都是在GPU环境下运行。尽管GPU能够实现实时处理,然而其功耗大,成本高,难以满足盲人便携高续航的要求,因此能够研究出一套速度快、准确度高以及功耗低的目标检测系统具有重要的实际意义。
发明内容
针对现有技术中的上述不足,本发明提供了一种辅助盲人感知外界环境的智能SOC终端。
为了达到上述发明目的,本发明采用的技术方案为:
一种辅助盲人感知外界环境的智能SOC终端,包括环境图像采集模块、环境图像识别模块和识别结果输出模块;
所述环境图像采集模块用于采集盲人在行走过程中所处环境的环境图像;
所述环境图像识别模块用于构建基于ARM和FPGA的异构体系,利用ARM将存储的环境图像数据分批搬运至FPGA中,再利用基于FPGA的可配置复用的卷积神经网络加速器对分批搬入的环境图像数据计算特征图,并利用ARM将FPGA输出的特征图和对应的网络权重分配搬出后进行目标识别;
所述识别结果输入模块用于向盲人输出识别结果。
优选地,所述环境图像识别模块具体包括ARM、FPGA和DDR;
所述DDR用于存储所述环境图像采集模块采集的环境图像数据,并且存储ARM从FPGA搬出的特征图和对应的网络权重数据;
所述ARM用于采用DMA控制器将DDR存储的环境图像数据分批搬运至FPGA中,同时在每批搬运过程中对FPGA中的卷积神经网络权重进行配置;并且采用DMA控制器将FPGA每批输出的特征图和对应的网络权重分配搬出至DDR,根据DDR中存储的所有特征图和对应的网络权重采用目标检测算法进行目标识别;
所述FPGA用于采用深层次卷积神经网络对ARM分批搬入的环境图像数据加速计算特征图。
优选地,所述FPGA包括卷积模块、累加模块、池化模块和填充模块,以对分批搬入的环境图像数据分别进行卷积、累加、池化及填充操作。
优选地,所述FPGA在每次特征图搬运过程中将特征图的行列信息配置到FPGA的卷积模块、累加模块和池化模块。
优选地,所述FPGA中的卷积模块具体采用深层次卷积神经网络将分批搬入的环境图像数据进行分类,得到特征图。
优选地,所述FPGA采用的深层次卷积神经网络包括多层卷积层,每层卷积层对环境图像数据进行卷积计算后,再通过激活函数,然后进行最大池化处理,得到相应的特征图。
优选地,所述环境图像识别模块输出的目标识别结果包括目前物体种类、目标物体概率和目标物体在盲人周围所处环境中的位置。
本发明具有以下有益效果:
(1)本发明基于卷积计算的并行性和卷积神经网络结构的并行特征,构建基于ARM和FPGA的异构体系,进行软硬件功能的划分,利用基于FPGA的可配置复用的神经网络加速器,在保证物体识别精度的同时并进行语音播报,大幅提升了终端目标检测速度,且使用较少的资源以及功耗,确保了基于SoC的导盲智能穿戴系统的低成本特性及实时性。
(2)本发明基于FPGA的可配置复用的神经网络加速器对卷积神经网络模型的特征图计算进行加速,在降低成本的同时也达到降低资源的目的;同时采用数据分批搬运的方式,能够使用最短的时间传输较多的数据,以便于提高智能识别的实时性。
附图说明
图1为本发明的辅助盲人感知外界环境的智能SOC终端结构示意图;
图2为本发明实施例中深层次卷积神经网络结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,本发明实施例提供了一种辅助盲人感知外界环境的智能SOC(SystemOn Chip,片上系统)终端,包括环境图像采集模块、环境图像识别模块和识别结果输出模块;
所述环境图像采集模块用于采集盲人在行走过程中所处环境的环境图像;
所述环境图像识别模块用于构建基于ARM和FPGA的异构体系,利用ARM将存储的环境图像数据分批搬运至FPGA中,再利用基于FPGA的可配置复用的卷积神经网络加速器对分批搬入的环境图像数据计算特征图,并利用ARM将FPGA输出的特征图和对应的网络权重分配搬出后进行目标识别;
所述识别结果输入模块用于向盲人输出识别结果。
在本实施例中,环境图像采集模块主要用于采集盲人在行走过程中所处环境的环境图像,该功能的实现可以采用摄像头。本发明利用网络摄像头准确采集盲人在行走过程中所处环境的环境图像,从而有利于智能SOC终端准确识别盲人所处环境中的目标物体,提高终端识别效果。
在本实施例中,环境图像识别模块具体包括ARM(Advanced RISC Machines,RISC微处理器)、FPGA(Field Programmable Gate Array,现场可编程逻辑门阵列)和DDR(Double Data Rate Synchronous Dynamic Random Access Memory,双倍数据率同步动态随机存取存储器)。
所述DDR用于存储所述环境图像采集模块采集的环境图像数据,具体而言,将网络摄像头采集的环境图像数据直接存储到DDR中;并且DDR还用于存储ARM从FPGA搬出的特征图和对应的网络权重数据;
所述ARM用于采用DMA控制器将DDR存储的环境图像数据分批搬运至FPGA中,同时在每批搬运过程中对FPGA中的卷积神经网络权重进行配置;并且采用DMA控制器将FPGA每批输出的特征图和对应的网络权重分配搬出至DDR,根据DDR中存储的所有特征图和对应的网络权重采用目标检测算法进行目标识别;
所述FPGA用于采用深层次卷积神经网络对ARM分批搬入的环境图像数据加速计算特征图。
本发明采用DMA(Direct Memory Access,直接存储器访问)控制器传输将数据从一个地址空间复制到另外一个地址空间。当CPU初始化这个传输动作,传输动作本身是由DMA控制器来实行和完成。在实现DMA传输时,是由DMA控制器直接掌管总线,因此,在DMA传输前,CPU要把总线控制权交给DMA控制器,而在结束DMA传输后,DMA控制器应立即把总线控制权再交回给CPU。
由于深层次网络的数据量过大,无法将所有的数据一次性搬运至FPGA,因为会导致成本过高,所以本发明采用数据分批搬运的方式,同时根据内存数据的存储特性,进行连续的传输搬运,使用最短的时间传输较多的数据,以便于提高智能识别的实时性。
在本实施例中,FPGA包括卷积模块、累加模块、池化模块和填充模块,以对分批搬入的环境图像数据分别进行卷积、累加、池化及填充操作,并利用ARM将输出数据通过DMA控制器搬出至DDR。
由于深层次卷积神经网络层数较多、数据量很大,且每层特征图大小都不一样,因此FPGA在每次特征图搬运过程中将特征图的行列信息配置到FPGA的卷积模块、累加模块和池化模块,以便于适应于所有层的特征图计算,在降低成本的同时也达到降低资源的目的,对于每层特征图行列的变化,本发明会对行列信息重新进行配置,从而实现可重构的神经网路结构。
在本实施例中,FPGA中的卷积模块具体采用深层次卷积神经网络将分批搬入的环境图像数据进行分类,得到特征图。
具体而言,FPGA采用的深层次卷积神经网络包括多层卷积层,每层卷积层对环境图像数据进行卷积计算后,再通过激活函数,然后进行最大池化处理,得到相应的特征图。
如图2所示,FPGA采用深层次卷积神经网络对ARM分批搬入的环境图像数据加速计算特征图的过程为:
(1)将DDR中的图片416*416*3数据分批搬入FPGA,第一次搬运(1-26)*416*3,第二次搬运(27-52)*416*3,直到最后一次搬运(391-416)*416*3,经过卷积层1的计算,然后通过激活函数,然后进行最大池化,得到208*208*16的特征图1,每次的输出都要从FPGA搬至DDR以便于节约FPGA的资源,后面所有层的数据搬运以此类推。
(2)填充特征图1经过卷积层2的计算,然后通过激活函数,然后进行最大池化,得到104*104*32的特征图2;
(3)填充特征图2经过卷积层3的计算,然后通过激活函数,然后进行最大池化,得到52*52*64的特征图3;
(4)填充特征图3经过卷积层4的计算,然后通过激活函数,然后进行最大池化,得到26*26*128的特征图4;
(5)填充特征图4经过卷积层5的计算,然后通过激活函数,然后进行最大池化,得到13*13*256的特征图5;
(6)填充特征图5经过卷积层6的计算,然后通过激活函数,然后进行最大池化,得到13*13*512的特征图6;
(7)填充特征图6经过卷积层7的计算,然后通过激活函数,得到13*13*1024的特征图7;
(8)填充特征图7经过卷积层8的计算,然后通过激活函数,得到13*13*325的特征图8。
本发明利用ARM采用DMA控制器将FPGA输出的总计1942个特征图和对应网络权重分批搬出至DDR,根据DDR中存储的所有特征图和对应的网络权重采用目标检测算法进行目标识别。
具体而言,环境图像识别模块输出的目标识别结果包括目前物体种类、目标物体概率和目标物体在盲人周围所处环境中的位置。
在本实施例中,识别结果输入模块主要用于向盲人输出识别结果,该功能的实现可以采用麦克风。本发明利用麦克风可以将环境图像识别模块输出的识别结果进行语音播报,方便盲人感知外界的物体。
本发明通过训练深层次卷积神经网络模型,能够显著提高识别物体种类和识别精确度,识别的物体种类高达60类,识别的精确率高达61%,可以有效的帮助盲人感知周围环境中的物体,丰富盲人的生活。并且本发明结合了SoC软硬件协同分工体系,ARM负责特征图数据的分批搬入,FPGA进行卷积神经网络的加速,保证智能SOC终端的实时性、低成本和续航能力强,同时具有设备体积较小且便于携带的优点。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (4)

1.一种辅助盲人感知外界环境的智能SOC终端,其特征在于,包括环境图像采集模块、环境图像识别模块和识别结果输出模块;
所述环境图像采集模块用于采集盲人在行走过程中所处环境的环境图像;
所述环境图像识别模块用于构建基于ARM和FPGA的异构体系,利用ARM将存储的环境图像数据分批搬运至FPGA中,再利用基于FPGA的可配置复用的卷积神经网络加速器对分批搬入的环境图像数据计算特征图,并利用ARM将FPGA输出的特征图和对应的网络权重分配搬出后进行目标识别;
所述环境图像识别模块具体包括ARM、FPGA和DDR;
所述DDR用于存储所述环境图像采集模块采集的环境图像数据,并且存储ARM从FPGA搬出的特征图和对应的网络权重数据;
所述ARM用于采用DMA控制器将DDR存储的环境图像数据分批搬运至FPGA中,同时在每批搬运过程中对FPGA中的卷积神经网络权重进行配置;并且采用DMA控制器将FPGA每批输出的特征图和对应的网络权重分配搬出至DDR,根据DDR中存储的所有特征图和对应的网络权重采用目标检测算法进行目标识别;
所述FPGA用于采用深层次卷积神经网络对ARM分批搬入的环境图像数据加速计算特征图;
所述FPGA包括卷积模块、累加模块、池化模块和填充模块,以对分批搬入的环境图像数据分别进行卷积、累加、池化及填充操作;所述FPGA在每次特征图搬运过程中将特征图的行列信息配置到FPGA的卷积模块、累加模块和池化模块;
所述识别结果输入模块用于向盲人输出识别结果。
2.根据权利要求1所述的辅助盲人感知外界环境的智能SOC终端,其特征在于,所述FPGA中的卷积模块具体采用深层次卷积神经网络将分批搬入的环境图像数据进行分类,得到特征图。
3.根据权利要求1所述的辅助盲人感知外界环境的智能SOC终端,其特征在于,所述FPGA采用的深层次卷积神经网络包括多层卷积层,每层卷积层对环境图像数据进行卷积计算后,再通过激活函数,然后进行最大池化处理,得到相应的特征图。
4.根据权利要求1所述的辅助盲人感知外界环境的智能SOC终端,其特征在于,所述环境图像识别模块输出的目标识别结果包括目前物体种类、目标物体概率和目标物体在盲人周围所处环境中的位置。
CN202010944871.4A 2020-09-10 2020-09-10 一种辅助盲人感知外界环境的智能soc终端 Active CN112101178B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010944871.4A CN112101178B (zh) 2020-09-10 2020-09-10 一种辅助盲人感知外界环境的智能soc终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010944871.4A CN112101178B (zh) 2020-09-10 2020-09-10 一种辅助盲人感知外界环境的智能soc终端

Publications (2)

Publication Number Publication Date
CN112101178A CN112101178A (zh) 2020-12-18
CN112101178B true CN112101178B (zh) 2023-03-24

Family

ID=73752269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010944871.4A Active CN112101178B (zh) 2020-09-10 2020-09-10 一种辅助盲人感知外界环境的智能soc终端

Country Status (1)

Country Link
CN (1) CN112101178B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108245384A (zh) * 2017-12-12 2018-07-06 清华大学苏州汽车研究院(吴江) 基于增强学习的双目视觉导盲仪
EP3346423A1 (en) * 2017-01-04 2018-07-11 STMicroelectronics Srl Deep convolutional network heterogeneous architecture system and device
CN109034025A (zh) * 2018-07-16 2018-12-18 东南大学 一种基于zynq的人脸关键点检测系统
CN109416756A (zh) * 2018-01-15 2019-03-01 深圳鲲云信息科技有限公司 卷积器及其所应用的人工智能处理装置
CN109938974A (zh) * 2019-04-01 2019-06-28 杨天歌 一种视障人士用便携式智能导盲设备及导盲方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11694066B2 (en) * 2017-10-17 2023-07-04 Xilinx, Inc. Machine learning runtime library for neural network acceleration
CN108932548A (zh) * 2018-05-22 2018-12-04 中国科学技术大学苏州研究院 一种基于fpga的稀疏度神经网络加速系统
CN108921182A (zh) * 2018-09-26 2018-11-30 苏州米特希赛尔人工智能有限公司 Fpga实现的特征提取图像传感器
CN110348574B (zh) * 2019-07-17 2022-02-15 哈尔滨理工大学 一种基于zynq的通用卷积神经网络加速结构及设计方法
CN110472529A (zh) * 2019-07-29 2019-11-19 深圳大学 目标识别导航方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3346423A1 (en) * 2017-01-04 2018-07-11 STMicroelectronics Srl Deep convolutional network heterogeneous architecture system and device
CN108245384A (zh) * 2017-12-12 2018-07-06 清华大学苏州汽车研究院(吴江) 基于增强学习的双目视觉导盲仪
CN109416756A (zh) * 2018-01-15 2019-03-01 深圳鲲云信息科技有限公司 卷积器及其所应用的人工智能处理装置
CN109034025A (zh) * 2018-07-16 2018-12-18 东南大学 一种基于zynq的人脸关键点检测系统
CN109938974A (zh) * 2019-04-01 2019-06-28 杨天歌 一种视障人士用便携式智能导盲设备及导盲方法

Also Published As

Publication number Publication date
CN112101178A (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
TWI759361B (zh) 用於稀疏神經網路加速的架構、方法、電腦可讀取媒體和裝備
TWI746865B (zh) 深度視覺處理器
CN110050267B (zh) 用于数据管理的系统和方法
CN108241890B (zh) 一种可重构神经网络加速方法及架构
CN109543832B (zh) 一种计算装置及板卡
CN108416436B (zh) 使用多核心处理模块进行神经网络划分的方法及其系统
CN107301456B (zh) 基于向量处理器的深度神经网络多核加速实现方法
CN108090565A (zh) 一种卷积神经网络并行化训练加速方法
CN109558937A (zh) 神经网络系统和神经网络系统的操作方法
CN112862874B (zh) 点云数据匹配方法、装置、电子设备及计算机存储介质
CN109740508B (zh) 一种基于神经网络系统的图像处理方法及神经网络系统
Srivastava et al. A depthwise separable convolution architecture for CNN accelerator
US12079591B2 (en) Neural network device, method of operating the neural network device, and application processor including the neural network device
CN112101178B (zh) 一种辅助盲人感知外界环境的智能soc终端
CN113837922B (zh) 计算装置、数据处理方法及相关产品
CN112861780B (zh) 一种行人重识别方法、装置、介质和移动机器人
US20210311703A1 (en) Neural network device for neural network operation, operating method of the neural network device, and application processor including the same
Zong-ling et al. The design of lightweight and multi parallel CNN accelerator based on FPGA
KR20220078819A (ko) 딥러닝 연산 수행 방법 및 장치
CN109814067A (zh) 一种三维节点定位方法及装置
CN114626515A (zh) 基于通道数量执行卷积运算的npu装置及其操作方法
CN116050469A (zh) Ai模型的处理方法、运算方法及装置
CN111105015A (zh) 一种通用cnn推理加速器及其控制方法、可读存储介质
JP2024528690A (ja) ニューラルネットワークアクセラレータにおけるデータ再利用のための活性化バッファアーキテクチャ
CN111178505A (zh) 卷积神经网络的加速方法、计算机可读存储介质及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant