CN112101178B

CN112101178B - 一种辅助盲人感知外界环境的智能soc终端

Info

Publication number: CN112101178B
Application number: CN202010944871.4A
Authority: CN
Inventors: 阎波; 牧士宁; 许宏达; 魏然; 柴进
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2020-09-10
Filing date: 2020-09-10
Publication date: 2023-03-24
Anticipated expiration: 2040-09-10
Also published as: CN112101178A

Abstract

本发明公开了一种辅助盲人感知外界环境的智能SOC终端，其包括环境图像采集模块、环境图像识别模块和识别结果输出模块；环境图像采集模块用于采集盲人在行走过程中所处环境的环境图像，环境图像识别模块用于利用ARM将环境图像数据分批搬运至FPGA，再利用基于FPGA的可配置复用的卷积神经网络加速器对分批搬入的环境图像数据计算特征图，并利用ARM将FPGA输出的特征图和对应的网络权重分配搬出后进行目标识别，识别结果输入模块用于向盲人输出识别结果。本发明利用基于FPGA的可配置复用的神经网络加速器，在保证物体识别精度的同时并进行语音播报，大幅提升了终端目标检测速度，且使用较少的资源以及功耗，确保了基于SoC的导盲智能穿戴系统的低成本特性及实时性。

Description

一种辅助盲人感知外界环境的智能SOC终端

技术领域

本发明涉及智能终端技术领域，具体涉及一种辅助盲人感知外界环境的智能SOC终端。

背景技术

盲人作为弱势群体，在生活中受到的身体和精神上的压力非常大。对于盲人来说，想要对外界的事物进行了解，只能通过听觉且无法确定外界到底有什么，这让盲人的生活变得非常枯燥。由于目前神经网络的发展迅速，AI识别技术已经广泛的应用于生活中，对于盲人来说，辅助盲人感知外界的核心在于物体识别的精确性和实时性，以便于准确的播报。

但是由于神经网络的特性，虽然网络越大识别越准确，但是巨大的网络带来的巨大运算量，但是对于较小的网络，运算量小但是识别的准确率却是非常低。目前高精度的物体识别神经网络基本上都是在GPU环境下运行。尽管GPU能够实现实时处理,然而其功耗大,成本高,难以满足盲人便携高续航的要求,因此能够研究出一套速度快、准确度高以及功耗低的目标检测系统具有重要的实际意义。

发明内容

针对现有技术中的上述不足，本发明提供了一种辅助盲人感知外界环境的智能SOC终端。

为了达到上述发明目的，本发明采用的技术方案为：

一种辅助盲人感知外界环境的智能SOC终端，包括环境图像采集模块、环境图像识别模块和识别结果输出模块；

所述环境图像采集模块用于采集盲人在行走过程中所处环境的环境图像；

所述环境图像识别模块用于构建基于ARM和FPGA的异构体系，利用ARM将存储的环境图像数据分批搬运至FPGA中，再利用基于FPGA的可配置复用的卷积神经网络加速器对分批搬入的环境图像数据计算特征图，并利用ARM将FPGA输出的特征图和对应的网络权重分配搬出后进行目标识别；

所述识别结果输入模块用于向盲人输出识别结果。

优选地，所述环境图像识别模块具体包括ARM、FPGA和DDR；

所述DDR用于存储所述环境图像采集模块采集的环境图像数据，并且存储ARM从FPGA搬出的特征图和对应的网络权重数据；

所述ARM用于采用DMA控制器将DDR存储的环境图像数据分批搬运至FPGA中，同时在每批搬运过程中对FPGA中的卷积神经网络权重进行配置；并且采用DMA控制器将FPGA每批输出的特征图和对应的网络权重分配搬出至DDR，根据DDR中存储的所有特征图和对应的网络权重采用目标检测算法进行目标识别；

所述FPGA用于采用深层次卷积神经网络对ARM分批搬入的环境图像数据加速计算特征图。

优选地，所述FPGA包括卷积模块、累加模块、池化模块和填充模块，以对分批搬入的环境图像数据分别进行卷积、累加、池化及填充操作。

优选地，所述FPGA在每次特征图搬运过程中将特征图的行列信息配置到FPGA的卷积模块、累加模块和池化模块。

优选地，所述FPGA中的卷积模块具体采用深层次卷积神经网络将分批搬入的环境图像数据进行分类，得到特征图。

优选地，所述FPGA采用的深层次卷积神经网络包括多层卷积层，每层卷积层对环境图像数据进行卷积计算后，再通过激活函数，然后进行最大池化处理，得到相应的特征图。

优选地，所述环境图像识别模块输出的目标识别结果包括目前物体种类、目标物体概率和目标物体在盲人周围所处环境中的位置。

本发明具有以下有益效果：

(1)本发明基于卷积计算的并行性和卷积神经网络结构的并行特征，构建基于ARM和FPGA的异构体系，进行软硬件功能的划分，利用基于FPGA的可配置复用的神经网络加速器，在保证物体识别精度的同时并进行语音播报，大幅提升了终端目标检测速度，且使用较少的资源以及功耗，确保了基于SoC的导盲智能穿戴系统的低成本特性及实时性。

(2)本发明基于FPGA的可配置复用的神经网络加速器对卷积神经网络模型的特征图计算进行加速，在降低成本的同时也达到降低资源的目的；同时采用数据分批搬运的方式，能够使用最短的时间传输较多的数据，以便于提高智能识别的实时性。

附图说明

图1为本发明的辅助盲人感知外界环境的智能SOC终端结构示意图；

图2为本发明实施例中深层次卷积神经网络结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，本发明实施例提供了一种辅助盲人感知外界环境的智能SOC(SystemOn Chip，片上系统)终端，包括环境图像采集模块、环境图像识别模块和识别结果输出模块；

所述识别结果输入模块用于向盲人输出识别结果。

在本实施例中，环境图像采集模块主要用于采集盲人在行走过程中所处环境的环境图像，该功能的实现可以采用摄像头。本发明利用网络摄像头准确采集盲人在行走过程中所处环境的环境图像，从而有利于智能SOC终端准确识别盲人所处环境中的目标物体，提高终端识别效果。

在本实施例中，环境图像识别模块具体包括ARM(Advanced RISC Machines，RISC微处理器)、FPGA(Field Programmable Gate Array，现场可编程逻辑门阵列)和DDR(Double Data Rate Synchronous Dynamic Random Access Memory，双倍数据率同步动态随机存取存储器)。

所述DDR用于存储所述环境图像采集模块采集的环境图像数据，具体而言，将网络摄像头采集的环境图像数据直接存储到DDR中；并且DDR还用于存储ARM从FPGA搬出的特征图和对应的网络权重数据；

本发明采用DMA(Direct Memory Access，直接存储器访问)控制器传输将数据从一个地址空间复制到另外一个地址空间。当CPU初始化这个传输动作，传输动作本身是由DMA控制器来实行和完成。在实现DMA传输时，是由DMA控制器直接掌管总线，因此，在DMA传输前，CPU要把总线控制权交给DMA控制器，而在结束DMA传输后，DMA控制器应立即把总线控制权再交回给CPU。

由于深层次网络的数据量过大，无法将所有的数据一次性搬运至FPGA，因为会导致成本过高，所以本发明采用数据分批搬运的方式，同时根据内存数据的存储特性，进行连续的传输搬运，使用最短的时间传输较多的数据，以便于提高智能识别的实时性。

在本实施例中，FPGA包括卷积模块、累加模块、池化模块和填充模块，以对分批搬入的环境图像数据分别进行卷积、累加、池化及填充操作，并利用ARM将输出数据通过DMA控制器搬出至DDR。

由于深层次卷积神经网络层数较多、数据量很大，且每层特征图大小都不一样，因此FPGA在每次特征图搬运过程中将特征图的行列信息配置到FPGA的卷积模块、累加模块和池化模块，以便于适应于所有层的特征图计算，在降低成本的同时也达到降低资源的目的，对于每层特征图行列的变化，本发明会对行列信息重新进行配置，从而实现可重构的神经网路结构。

在本实施例中，FPGA中的卷积模块具体采用深层次卷积神经网络将分批搬入的环境图像数据进行分类，得到特征图。

具体而言，FPGA采用的深层次卷积神经网络包括多层卷积层，每层卷积层对环境图像数据进行卷积计算后，再通过激活函数，然后进行最大池化处理，得到相应的特征图。

如图2所示，FPGA采用深层次卷积神经网络对ARM分批搬入的环境图像数据加速计算特征图的过程为：

(1)将DDR中的图片416*416*3数据分批搬入FPGA，第一次搬运(1-26)*416*3，第二次搬运(27-52)*416*3,直到最后一次搬运(391-416)*416*3，经过卷积层1的计算，然后通过激活函数，然后进行最大池化，得到208*208*16的特征图1，每次的输出都要从FPGA搬至DDR以便于节约FPGA的资源，后面所有层的数据搬运以此类推。

(2)填充特征图1经过卷积层2的计算，然后通过激活函数，然后进行最大池化，得到104*104*32的特征图2；

(3)填充特征图2经过卷积层3的计算，然后通过激活函数，然后进行最大池化，得到52*52*64的特征图3；

(4)填充特征图3经过卷积层4的计算，然后通过激活函数，然后进行最大池化，得到26*26*128的特征图4；

(5)填充特征图4经过卷积层5的计算，然后通过激活函数，然后进行最大池化，得到13*13*256的特征图5；

(6)填充特征图5经过卷积层6的计算，然后通过激活函数，然后进行最大池化，得到13*13*512的特征图6；

(7)填充特征图6经过卷积层7的计算，然后通过激活函数，得到13*13*1024的特征图7；

(8)填充特征图7经过卷积层8的计算，然后通过激活函数，得到13*13*325的特征图8。

本发明利用ARM采用DMA控制器将FPGA输出的总计1942个特征图和对应网络权重分批搬出至DDR，根据DDR中存储的所有特征图和对应的网络权重采用目标检测算法进行目标识别。

具体而言，环境图像识别模块输出的目标识别结果包括目前物体种类、目标物体概率和目标物体在盲人周围所处环境中的位置。

在本实施例中，识别结果输入模块主要用于向盲人输出识别结果，该功能的实现可以采用麦克风。本发明利用麦克风可以将环境图像识别模块输出的识别结果进行语音播报，方便盲人感知外界的物体。

本发明通过训练深层次卷积神经网络模型，能够显著提高识别物体种类和识别精确度，识别的物体种类高达60类，识别的精确率高达61％，可以有效的帮助盲人感知周围环境中的物体，丰富盲人的生活。并且本发明结合了SoC软硬件协同分工体系，ARM负责特征图数据的分批搬入，FPGA进行卷积神经网络的加速，保证智能SOC终端的实时性、低成本和续航能力强，同时具有设备体积较小且便于携带的优点。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种辅助盲人感知外界环境的智能SOC终端，其特征在于，包括环境图像采集模块、环境图像识别模块和识别结果输出模块；

所述环境图像识别模块具体包括ARM、FPGA和DDR；

所述FPGA用于采用深层次卷积神经网络对ARM分批搬入的环境图像数据加速计算特征图；

所述FPGA包括卷积模块、累加模块、池化模块和填充模块，以对分批搬入的环境图像数据分别进行卷积、累加、池化及填充操作；所述FPGA在每次特征图搬运过程中将特征图的行列信息配置到FPGA的卷积模块、累加模块和池化模块；

所述识别结果输入模块用于向盲人输出识别结果。

2.根据权利要求1所述的辅助盲人感知外界环境的智能SOC终端，其特征在于，所述FPGA中的卷积模块具体采用深层次卷积神经网络将分批搬入的环境图像数据进行分类，得到特征图。

3.根据权利要求1所述的辅助盲人感知外界环境的智能SOC终端，其特征在于，所述FPGA采用的深层次卷积神经网络包括多层卷积层，每层卷积层对环境图像数据进行卷积计算后，再通过激活函数，然后进行最大池化处理，得到相应的特征图。

4.根据权利要求1所述的辅助盲人感知外界环境的智能SOC终端，其特征在于，所述环境图像识别模块输出的目标识别结果包括目前物体种类、目标物体概率和目标物体在盲人周围所处环境中的位置。