CN109919304A - 神经网络搜索方法、装置、可读存储介质和计算机设备 - Google Patents
神经网络搜索方法、装置、可读存储介质和计算机设备 Download PDFInfo
- Publication number
- CN109919304A CN109919304A CN201910161226.2A CN201910161226A CN109919304A CN 109919304 A CN109919304 A CN 109919304A CN 201910161226 A CN201910161226 A CN 201910161226A CN 109919304 A CN109919304 A CN 109919304A
- Authority
- CN
- China
- Prior art keywords
- neural network
- candidate
- network
- subspace
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
本申请涉及一种神经网络搜索方法、装置、计算机可读存储介质和计算机设备,该方法包括:获取神经网络搜索空间;从多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将等待搜索神经网络对应的神经网络子空间固定,从当前搜索神经网络对应的当前搜索神经网络子空间集合中选取初始目标候选神经网络子空间;返回从多层神经网络中获取当前搜索神经网络和等待搜索神经网络的步骤,直到各个神经网络搜索得到对应的初始目标候选神经网络子空间;各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜索空间;根据预设神经网络选择策略对中间神经网络搜索空间进行搜索得到目标神经网络。本申请提供的方案能够提高神经网络搜索效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种神经网络搜索方法、装置、计 算机可读存储介质和计算机设备。
背景技术
随着计算机技术领域的发展,出现了神经网络搜索技术,通过神经网络搜索 技术搜索出合适的神经网络结构。然而,目前的神经网络搜索方法是非常耗时的, 需要学习一个额外的控制器,由于控制器本身的训练过程不仅非常耗时,而且很 难收敛,导致神经网络搜索过程复杂且搜索效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高神经网络搜索效率的 神经网络搜索方法、装置、计算机可读存储介质和计算机设备。
一种神经网络搜索方法,包括:
获取神经网络搜索空间,神经网络搜索空间包括多层神经网络,各层神经网 络存在对应的搜索神经网络子空间集合,搜索神经网络子空间集合中的各个候 选神经网络子空间包括由多个神经元组成的基本网络结构;
从多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将等待搜 索神经网络对应的神经网络子空间固定,从当前搜索神经网络对应的当前搜索 神经网络子空间集合中选取初始目标候选神经网络子空间;
返回从多层神经网络中获取当前搜索神经网络和等待搜索神经网络的步骤, 直到神经网络搜索空间的各个神经网络搜索得到对应的初始目标候选神经网络 子空间;
各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜索 空间;
根据预设神经网络选择策略对中间神经网络搜索空间进行搜索得到目标神 经网络。
一种神经网络搜索装置,该装置包括:
神经网络搜索空间获取模块,用于获取神经网络搜索空间,神经网络搜索空 间包括多层神经网络,各层神经网络存在对应的搜索神经网络子空间集合,搜索 神经网络子空间集合中的各个候选神经网络子空间包括由多个神经元组成的基 本网络结构;
神经网络搜索模块,用于从多层神经网络中获取当前搜索神经网络和等待 搜索神经网络,将等待搜索神经网络对应的神经网络子空间固定,从当前搜索神 经网络对应的当前搜索神经网络子空间集合中选取初始目标候选神经网络子空 间;
神经网络搜索模块还用于返回从多层神经网络中获取当前搜索神经网络和 等待搜索神经网络的步骤,直到神经网络搜索空间的各个神经网络搜索得到对 应的初始目标候选神经网络子空间;
中间神经网络搜索空间形成模块,用于各层神经网络对应的初始目标候选 神经网络子空间形成中间神经网络搜索空间;
目标神经网络搜索模块,用于根据预设神经网络选择策略对中间神经网络 搜索空间进行搜索得到目标神经网络。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运 行的计算机程序,该处理器执行所述程序时实现以下步骤:
获取神经网络搜索空间,神经网络搜索空间包括多层神经网络,各层神经网 络存在对应的搜索神经网络子空间集合,搜索神经网络子空间集合中的各个候 选神经网络子空间包括由多个神经元组成的基本网络结构;
从多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将等待搜 索神经网络对应的神经网络子空间固定,从当前搜索神经网络对应的当前搜索 神经网络子空间集合中选取初始目标候选神经网络子空间;
返回从多层神经网络中获取当前搜索神经网络和等待搜索神经网络的步骤, 直到神经网络搜索空间的各个神经网络搜索得到对应的初始目标候选神经网络 子空间;
各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜索 空间;
根据预设神经网络选择策略对中间神经网络搜索空间进行搜索得到目标神 经网络。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执 行时,使得处理器执行以下步骤:
获取神经网络搜索空间,神经网络搜索空间包括多层神经网络,各层神经网 络存在对应的搜索神经网络子空间集合,搜索神经网络子空间集合中的各个候 选神经网络子空间包括由多个神经元组成的基本网络结构;
从多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将等待搜 索神经网络对应的神经网络子空间固定,从当前搜索神经网络对应的当前搜索 神经网络子空间集合中选取初始目标候选神经网络子空间;
返回从多层神经网络中获取当前搜索神经网络和等待搜索神经网络的步骤, 直到神经网络搜索空间的各个神经网络搜索得到对应的初始目标候选神经网络 子空间;
各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜索 空间;
根据预设神经网络选择策略对中间神经网络搜索空间进行搜索得到目标神 经网络。
上述神经网络搜索方法、装置、计算机可读存储介质和计算机设备,获取神 经网络搜索空间,神经网络搜索空间包括多层神经网络,各层神经网络存在对应 的搜索神经网络子空间集合,搜索神经网络子空间集合中的各个候选神经网络 子空间包括由多个神经元组成的基本网络结构,从多层神经网络中获取当前搜 索神经网络和等待搜索神经网络,将等待搜索神经网络对应的神经网络子空间 固定,从当前搜索神经网络对应的当前搜索神经网络子空间集合中选取初始目 标候选神经网络子空间;返回从多层神经网络中获取当前搜索神经网络和等待 搜索神经网络的步骤,直到神经网络搜索空间的各层神经网络搜索得到对应的 初始目标候选神经网络子空间;各层神经网络对应的初始目标候选神经网络子 空间形成中间神经网络搜索空间;根据预设神经网络选择策略对中间神经网络 搜索空间进行搜索得到目标神经网络。
因此,可利用由具有简单的网络拓扑结构的候选网络子空间组成的神经网 络搜索空间,搜索得到目标神经网络,不仅减少了搜索范围,而且简单的网络拓 扑结构容易应用于各种平台,在计算复杂度方面效率也更高。同时,在神经网络 搜索过程中,利用当前搜索神经网络和等待搜索神经网络,将等待搜索神经网络 对应的神经网络子空间的基本网络结构固定,搜索当前搜索神经网络对应的初 始目标候选神经网络子空间,依次类推,直至神经网络搜索空间的各层神经网络 搜索得到对应的初始目标候选神经网络子空间。这种神经网络的搜索方式简单 高效。最后,根据预设网络选择策略搜索得到目标神经网络的准确度高。
附图说明
图1为一个实施例中神经网络搜索方法的应用环境图;
图2为一个实施例中神经网络搜索方法的流程示意图;
图2A为一个实施例中神经网络搜索空间的结构示意图;
图2B为一个实施例中候选神经网络子空间的基本网络结构的结构示意图;
图2C为另一个实施例中候选神经网络子空间的基本网络结构的结构示意图;
图2D为又一个实施例中候选神经网络子空间的基本网络结构的结构示意图;
图2E为一个实施例中神经网络搜索空间搜索过程的示意图;
图2F为一个实施例中中间神经网络搜索空间的结构示意图;
图3为一个实施例中初始目标候选神经网络子空间搜索步骤的流程示意图;
图4为一个实施例中候选神经网络集合筛选步骤的流程示意图;
图5为一个实施例中候选训练精度获取步骤的流程示意图;
图6为一个实施例中候选神经网络训练步骤的流程示意图;
图7为一个实施例中候选验证精度获取步骤的流程示意图;
图8为一个实施例中中间神经网络搜索空间搜索步骤的流程示意图;
图9为一个实施例中神经网络搜索装置的结构框图;
图10为另一个实施例中神经网络搜索模块的结构框图;
图11为一个实施例中初始目标候选神经网络确定单元的结构框图;
图12为一个实施例中目标神经网络搜索模块的结构框图;
图13为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施 例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用 以解释本申请,并不用于限定本申请。
图1为一个实施例中神经网络搜索方法的应用环境图。参照图1,该神经网 络搜索方法应用于神经网络搜索系统。该神经网络搜索系统包括终端110和服 务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端 或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。 服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,服务器120获取神经网络搜索空间,神经网络搜索空间包括多层 神经网络,各层神经网络存在对应的搜索神经网络子空间集合,搜索神经网络子 空间集合中的各个候选神经网络子空间包括由多个神经元组成的基本网络结构; 从多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将等待搜索神 经网络对应的神经网络子空间固定,从当前搜索神经网络对应的当前搜索神经 网络子空间集合中选取初始目标候选神经网络子空间;返回从多层神经网络中 获取当前搜索神经网络和等待搜索神经网络的步骤,直到神经网络搜索空间的 各个神经网络搜索得到对应的初始目标候选神经网络子空间;各层神经网络对 应的初始目标候选神经网络子空间形成中间神经网络搜索空间;根据预设神经 网络选择策略对中间神经网络搜索空间进行搜索得到目标神经网络。进一步地,服务器120可将目标神经网络发送至终端110,终端110可将目标神经网络具体 应用到实际应用场景中。
如图2所示,在一个实施例中,提供了一种神经网络搜索方法。本实施例主 要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该神经网络搜 索方法具体包括如下步骤:
步骤202,获取神经网络搜索空间,神经网络搜索空间包括多层神经网络, 各层神经网络存在对应的搜索神经网络子空间集合,搜索神经网络子空间集合 中的各个候选神经网络子空间包括由多个神经元组成的基本网络结构。
其中,神经网络搜索空间是用来搜索神经网络结构的空间,神经网络搜索空 间由多层神经网络组成,这里的神经网络是用来进行数据处理的数字模型网络 结构,神经网络可以是RNN循环神经网络模型(Recurrent Neural Network,循 环神经网络)、NMT神经网络机器翻译模型(Neural Machine Translation,神经 网络机器翻译)、Encoder-Decoder(编码器-解码器)结构的神经网络模型等。
其中,各层神经网络都存在对应的搜索神经网络子空间集合,这里的搜索神 经网络子空间集合是由多个神经网络子空间组成的,即各层神经网络包括多个 神经网络子空间。其中,各层神经网络中的各个神经网络子空间可以为不同网络 结构的神经网络子空间,即神经网络子空间是各层神经网络的基本组成单元。而 各个神经网络子空间是由多个神经元组成的基本网络结构。这里的神经元是指 神经网络子空间的基本结构和单元。
在一个实施例中,如图2A所示,图2A示出一个实施例中神经网络搜索空 间的结构示意图。图2A为神经网络搜索空间,图2A中的神经网络搜索空间包 括N层神经网络,如神经网络Cell1、神经网络Cell2、神经网络Cell3……神经网 络CellN等。而各层神经网络存在对应的搜索神经网络子空间集合,搜索神经网 络子空间集合包括K个候选神经网络子空间,如神经网络Cell1对应的搜索神经 网络子空间集合包括候选神经网络子空间候选神经网络子空间候选 神经网络子空间候选神经网络子空间
而各个候选神经网络子空间包括由多个神经元组成的基本网络结构。其中 各个候选神经网络子空间的基本网络结构可如图2B、图2C和图2D所示,图2B、图2C和图2D示出一个实施例中候选神经网络子空间的基本网络结构的结 构示意图。图2B、图2C和图2D所示为各个候选神经网络子空间的4种基本网 络结构,如基本结构Cell A、基本结构Cell B、基本结构Cell C和基本结构Cell D。应当说明的是,候选神经网络子空间包括但不限于这4中基本网络结构,还 包括由这4种基本网络结构变形得到的其他网络结构。其中,候选网络子空间 的具体网络结果可由3个网络模型参数决定:比例Ratio,身份Identity,分类 Split。其中,图2B、图2C和图2D中的4种基本网络结构不包括Ratio,但可 将Ratio包括在pwise操作中,从而得到4种基本网络结构变形后的其他网络结 构。而身份Identity模型参数相当于图2B、图2C和图2D中的Add。其中,图 2B、图2C和图2D中的Pwise指Pointwise卷积操作,Dwise指Depthwise卷 积操作。Split将input分成两个部分。Shuffle打乱输出特征中通道的顺序。 Cell A无Identity操作无Split操作。Cell B有Identity操作无Split操作。CellC 无Identity操作有Split操作。Cell D有Identity操作有Split操作。Ratio的值取 {4,6,8},作用于Cell中第一个Pwise操作,Ratio=第一个Pwise操作输入的通道 数/Input的通道数。
步骤204,从多层神经网络中获取当前搜索神经网络和等待搜索神经网络, 将等待搜索神经网络对应的神经网络子空间固定,从当前搜索神经网络对应的 当前搜索神经网络子空间集合中选取初始目标候选神经网络子空间。
其中,当前搜索神经网络是指目前用来搜索初始目标候选神经网络子空间 的神经网络,当前搜索神经网络可以从多层神经网络中选取某一层神经网络作 为当前搜索神经网络。具体可以是根据多层神经网络的连接关系,按照从输出层 至输入层的方向,依次获取预设数量的神经网络作为当前搜索神经网络。还可以 是根据多层神经网络的连接关系,按照从输入层至输出层的方向,依次获取预设 数量的神经网络作为当前搜索神经网络。或者还可以是从多层神经网络中随机 选取预设数量的神经网络作为当前搜索神经网络等。其中,预设数量可自定义, 自定义可以根据实际应用场景或者业务需求进行设置。
其中,等待搜索神经网络是指目前用于等待搜索对应的初始目标候选神经 网络子空间的神经网络,等待搜索神经网络可以是将未作为当前搜索神经网络 的其他神经网络作为等待搜索神经网络,还可以是从多层神经网络中选取预设 数量的神经网络作为等待搜索神经网络等。其中,预设数量可自定义,自定义可 以根据实际应用场景或者业务需求进行设置。
具体地,首先从神经网络搜索空间中的多层神经网络中获取当前搜索神经 网络和等待搜索神经网络,为了神经网络搜索的有序性和神经网络搜索的搜索 效率,需将等待搜索神经网络对应的神经网络子空间固定,即预先将等待搜索神 经网络对应的神经网络子空间的基本网络结构固定。然后,再从当前搜索神经网 络对应的当前搜索神经网络子空间集合中选取初始目标候选网络子空间,其中 可根据预设神经网络选择策略从当前搜索神经网络对应的当前搜索神经网络子 空间集合中选取初始目标候选网络子空间,而选取初始目标候选网络子空间的 数量为自定义,自定义可以根据人为经验或者实际应用场景或者业务需求进行 设置。在实际应用场景中,初始目标候选网络子空间的数量为4效果最佳
其中,预设神经网络选择策略可自定义,自定义可以是根据当前搜索神经网 络对应的当前搜索神经网络子空间集合中的各个当前搜索神经网络子空间和等 待搜索网络对应的神经网络子空间形成当前搜索神经网络集合,根据当前搜索 网络集合中的各个当前搜索网络的训练准确度和验证准确度筛选得到目标当前 搜索网络,再根据目标当前搜索网络得到当前搜索神经网络对应的初始目标候 选神经网络子空间。或者还可以是根据当前搜索神经网络对应的当前搜索神经 网络子空间集合中的各个当前搜索神经网络子空间的空间质量确定当前搜索神 经网络对应的初始目标候选神经网络子空间等。
在一个实施例中,根据各层神经网络的连接关系,按照输出层至输入层的方 向,将最后一层神经网络确定为当前搜索神经网络,将其他层神经网络确定为等 待搜索神经网络。再将等待搜索神经网络对应的神经网络子空间的基本网络结 构固定,从当前搜索神经网络对应的当前搜索神经网络子空间集合中选取初始 目标候选神经网络子空间。如,目标神经网络的初始网络结构为 神经网络搜索空间如图2A所示,确定最后一层 神经网络为当前搜索神经网络为其他层神经网络为等待搜索神经网络,即 等待搜索神经网络对应的神经网络子空间的基本网络结构固定。从当前搜索神 经网络对应的当前搜索神经网络子空间集合中选 取初始目标候选神经网络子空间,具体是将当前搜索神经网络子空间集合中各 个当前搜索神经网络子空间替换神经网络的初始网络结构S(0)中的最后一层,如 等。再根据预设神经网络选择策略丛当前搜索神 经网络对应的当前搜索神经网络子空间集合中选取预设数量个初始目标候选神 经网络子空间,如
步骤206,返回从多层神经网络中获取当前搜索神经网络和等待搜索神经网 络的步骤,直到神经网络搜索空间的各层神经网络搜索得到对应的初始目标候 选神经网络子空间。
其中,由于步骤204只确定了当前搜索神经网络对应的初始目标候选神经 网络子空间,而等待搜索神经网络对应的初始目标候选神经网络子空间并未进 行搜索确定。因此,需返回步骤204从多层神经网络中获取当前搜索神经网络 和等待搜索神经网络,直至神经网络搜索空间的各个神经网络都搜索得到对应 的初始目标候选神经网络子空间后,停止进行网络搜索,再进入步骤208。
在一个实施例中,如图2E所示,图2E示出一个实施例中神经网络搜索空 间搜索过程的示意图,例如神经网络的初始网络结构为 神经网络搜索空间如图2E所示,第一次神经网络搜索,确 定最后一层神经网络为当前搜索神经网络为其他层神经网络为等待搜索 神经网络,即等待搜索神经网络对应的神经网络子空间的基本网络结构固定。从 当前搜索神经网络对应的当前搜索神经网络子空间集合 中选取初始目标候选神经网络子空间,具体是将当前搜索神 经网络子空间集合中各个当前搜索神经网络子空间替换神经网络的初始网络结 构S(0)中的最后一层,如 等。
进一步地,再根据预设神经网络选择策略丛当前搜索神经网络对应的 当前搜索神经网络子空间集合中选取预设数量个初始目标候选神经网络子空间, 如然后,再进行第二次神经网络搜索,确定倒 数第二层神经网络为当前搜索神经网络而其他层神经网络为等待搜索 神经网络,即等待搜索神经网络对应的神经网络子空间的基本网络结构固定,最 后一层神经网络对应的基本网络结构在第一次神经网络搜索时已确定存在4种 基本网络结构。从当前搜索神经网络对应的当前搜索神经网络子空间集 合中选取初始目标候选神经网络子空 间,具体是将当前搜索神经网络子空间集合中各个当前搜索神经网络子空间替 换神经网络的初始网络结构S(0)中的倒数第二层,如: 等等。再根据预设神经网络选择策略丛当前搜索神经网络对应的当前搜索神经网络子空间集合中 选取预设数量个初始目标候选神经网络子空间,如 依次类推,直至神经网络搜索空间中的各层神经网络都搜索得到对应 的初始目标候选神经网络子空间。
步骤208,各层神经网络对应的初始目标候选神经网络子空间形成中间神经 网络搜索空间。
其中,中间神经网络搜索空间是各层神经网络搜索得到对应的初始目标候 选神经网络子空间后,由各层神经网络的初始目标候选神经网络子空间组成的 神经网络搜索空间。中间神经网络搜索空间包括多层神经网络,各层神经网络都 存在对应的初始目标候选神经网络子空间集合,初始目标候选神经网络子空间 集合中的各个初始目标候选神经网络子空间都是通过神经网络搜索得到的。同 样地,初始目标候选神经网络子空间包括由多个神经元组成的基本网络结构。如, 通过神经网络搜索,根据各层神经网络的连接关系,按照输出层至输入层的方向, 确定最后一层神经网络对应的初始目标候选神经网络子空间为 倒数第二层神经网络对应的初始目标候选神经 网络子空间为……第一层神经网络对 应的初始目标候选神经网络子空间为等。具体可 如图2F所示,图2F示出一个实施例中中间神经网络搜索空间的结构示意图, 图2F为中间神经网络搜索空间。
步骤210,根据预设神经网络选择策略对中间神经网络搜索空间进行搜索得 到目标神经网络。
其中,预设神经网络选择策略是预先提前设置用来筛选目标神经网络的策 略规则,预设神经网络选择策略可自定义,自定义可以是先获取中间神经网络搜 索空间中的各层神经网络对应的中间神经网络子空间,将各层神经网络对应的 中间神经网络子空间排列组合,得到中间神经网络集合,对中间神经网络集合中 的中间神经网络训练得到训练准确度,再获取已训练的中间神经网络的验证准 确度。最后根据训练准确度和验证准确度筛选中间神经网络集合,将筛选得到的 中间神经网络作为目标神经网络。自定义还可以是先获取中间神经网络搜索空 间中的各层神经网络对应的中间神经网络子空间,将各层神经网络对应的中间 神经网络子空间排列组合,得到中间神经网络集合,计算中间神经网络集合中的 各个中间神经网络的网络质量,根据各个中间神经网络的网络质量确定目标神 经网络等等。
在一个实施例中,例如,中间神经网络搜索空间的结构示意图如图2F所示, 图2F示出的中间神经网络搜索空间包括N层神经网络,各层神经网络包括对应 的初始目标候选神经网络子空间,如最后一层神经网络对应的初始目标候 选神经网络子空间为倒数第二层神经网络 对应的初始目标候选神经网络子空间为 ……第一层神经网络对应的初始目标候选神经网络子空间为 等。然后,再将中间神经网络搜索空间中的各层 神经网络对应的中间神经网络子空间排列组合,形成中间神经网络集合 C={C1、C2、C3......CN},如 等等。最后,获取各个中间神经网络对应的中间训练精度,根据中间训练精度训练对应的中间神经 网络,得到各个已训练的中间神经网络。再获取各个已训练的中间神经网络对应 的中间验证精度,根据中间训练精度和中间验证精度从中间神经网络集合中筛 选得到目标神经网络为:
上述神经网络搜索方法,获取神经网络搜索空间,神经网络搜索空间包括多 层神经网络,各层神经网络存在对应的搜索神经网络子空间集合,搜索神经网络 子空间集合中的各个候选神经网络子空间包括由多个神经元组成的基本网络结 构,从多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将等待搜索 神经网络对应的神经网络子空间固定,从当前搜索神经网络对应的当前搜索神 经网络子空间集合中选取初始目标候选神经网络子空间;返回从多层神经网络 中获取当前搜索神经网络和等待搜索神经网络的步骤,直到神经网络搜索空间 的各层神经网络搜索得到对应的初始目标候选神经网络子空间;各层神经网络 对应的初始目标候选神经网络子空间形成中间神经网络搜索空间;根据预设神 经网络选择策略对中间神经网络搜索空间进行搜索得到目标神经网络。
因此,可利用由具有简单的网络拓扑结构的候选网络子空间组成的神经网 络搜索空间,搜索得到目标神经网络,不仅减少了搜索范围,而且简单的网络拓 扑结构容易应用于各种平台,在计算复杂度方面效率也更高。同时,在神经网络 搜索过程中,利用当前搜索神经网络和等待搜索神经网络,将等待搜索神经网络 对应的神经网络子空间的基本网络结构固定,搜索当前搜索神经网络对应的初 始目标候选神经网络子空间,依次类推,直至神经网络搜索空间的各层神经网络 搜索得到对应的初始目标候选神经网络子空间。这种神经网络的搜索方式简单 高效。最后,根据预设网络选择策略搜索得到目标神经网络的准确度高。
在一个实施例中,从多层神经网络中获取当前搜索神经网络和等待搜索神 经网络,包括:根据多层神经网络的连接关系,按照从输出层至输入层的方向, 依次获取预设数量的神经网络作为当前搜索神经网络,将未作为当前搜索神经 网络的其它神经网络作为等待搜索神经网络。
其中,从多层神经网络中获取当前搜索神经网络和等待搜索神经网络的方 式可自定义,自定义可以是根据多层神经网络的连接关系,按照从输出层至输入 层的方向,依次获取预设数量的神经网络作为当前搜索神经网络。还可以是根据 多层神经网络的连接关系,按照从输入层至输出层的方向,依次获取预设数量的 神经网络作为当前搜索神经网络。或者还可以是从多层神经网络中随机选取预 设数量的神经网络作为当前搜索神经网络等。由于通过实践数据表明,根据多层 神经网络的连接关系,按照从输出层至输入层的方向,依次获取预设数量的神经 网络作为当前搜索神经网络,将未作为当前搜索神经网络的其它神经网络作为 等待搜索神经网络这种搜索方式,比其他搜索方式的搜索时间较短,搜索效率较 高。
在一个实施例中,神经网络搜索空间可如图2A所示,图2A示出的神经网 络搜索空间由N层神经网络组成,各层神经网络相互连接组成神经网络搜索空 间。可按照从输出层至输入层的方向,输出层位于神经网络搜索空间的末层,输 入层位于神经网络搜索空间的首层,因此按照从输出层至输入层的方向,即按照 神经网络搜索空间的从后往前的方向,依次获取预设数量的神经网络作为当前 搜索神经网络,将未作为当前搜索神经网络的其它神经网络作为等待搜索神经 网络。例如,当前搜索神经网络的预设数量为1,则将图2A中的最后一层神经 网络cellN确定为当前搜索神经网络,将其他未作为当前搜索神经网络的神经网 络作为等待搜索神经网络,如cell1、cell2、cell3……cellN-1等。
在一个实施例中,如图3所示,将等待搜索神经网络对应的神经网络子空 间固定,从当前搜索神经网络对应的当前搜索神经网络子空间集合中选取初始 目标候选神经网络子空间,包括:
步骤302,将等待搜索神经网络对应的神经网络子空间固定,依次从当前搜 索神经网络子空间集合中取出各个候选神经网络子空间替换当前搜索神经网络 对应的神经网络子空间,形成候选神经网络集合。
其中,由于神经网络搜索空间包括多层神经网络,各层神经网络包括存在对 应的搜索神经网络子空间集合,为了神经网络搜索空间的有序性从而提高神经 网络搜索的搜索效率,因此在进行各层神经网络对应的初始目标候选神经网络 子空间时,需要从多层神经网络中确定当前搜索神经网络和等待搜索神经网络。 当前搜索神经网络是目前用来搜索初始目标候选神经网络子空间的神经网络, 而等待搜索神经网络是目前用来等待搜索初始目标候选神经网络子空间的神经 网络。在每一次神经网络搜索的过程中,需要将等待搜索神经网络对应的神经网 络子空间固定。所谓固定就是将等待搜索神经网络对应的网络子空间的基本网 络结构确定,依次从当前搜索神经网络对应的当前搜索神经网络子空间集合中 取出各个候选神经网络子空间替换当前搜索神经网络对应的神经网络子空间,形成候选神经网络集合。
如,目标神经网络的初始状态为:目标神经网络的初始网络结构为神经网络搜索空间如图2A所示,确定最后一层 神经网络为当前搜索神经网络为其他层神经网络为等待搜索神经网络,即 等待搜索神经网络对应的神经网络子空间的基本网络结构固定。依次从当前搜 索神经网络子空间集合中取出各个候选神经网络子空 间替换当前搜索神经网络对应的神经网络子空间,如,第一次将当前搜索神经网 络子空间集合去替换S(0)中最后一层神经网络对应的神经网络子空间第二次将当前搜索神经网络子空间集合去替换S(0)中最后一层神经网络对 应的神经网络子空间第三次将当前搜索神经网络子空间集合去替换 S(0)中最后一层神经网络对应的神经网络子空间依次类推,直至第K次将 将当前搜索神经网络子空间集合去替换S(0)中最后一层神经网络对应的神 经网络子空间
进一步地,根据各个替换后的目标神经网络结构形成候选神经网络集合,如 候选神经网络集合中包括候选神经网络候选神 经网络候选神经网络 候选神经网络等等。
步骤304,根据预设神经网络选择策略从候选神经网络集合中确定初始目标 候选神经网络。
其中,预设神经网络选择策略为是预先提前设置用来筛选目标神经网络的 策略规则,预设神经网络选择策略可自定义,自定义可以是先对候选神经网络集 合中的候选神经网络训练得到训练准确度,再获取已训练的候选神经网络的验 证准确度。最后根据训练准确度和验证准确度筛选候选神经网络集合,将筛选得 到的候选神经网络作为初始目标候选神经网络。自定义还可以是计算候选神经 网络集合中的各个候选神经网络的网络质量,根据各个候选神经网络的网络质 量确定初始目标候选神经网络等等。
在一个实施例中,预设神经网络选择策略为:先对候选神经网络集合中的候 选神经网络训练得到训练准确度,再获取已训练的候选神经网络的验证准确度。 最后根据训练准确度和验证准确度筛选候选神经网络集合,将筛选得到的候选 神经网络作为初始目标候选神经网络。具体地,获取各个候选神经网络对应的候 选训练精度,并根据候选训练精度训练对应的候选神经网络,得到各个已训练的 候选神经网络。再获取各个已训练的候选神经网络对应的候选验证精度,根据候 选训练精度和候选验证精度计算得到候选神经网络效率。根据候选神经网络效 率从候选神经网络集合中筛选部分候选神经网络,再根据候选神经网络效率和 候选验证精度从部分候选神经网络中确定初始目标候选神经网络。
如,候选神经网络集合中包括候选神经网络候选神经网络候选神经网络 候选神经网络等等。根据预设神经网络选择策略从候选神经网络集合中确定初始目标候选神 经网络为:候选神经网络候选神经网络 候选神经网络候选神经网络
步骤306,根据初始目标候选神经网络得到当前搜索神经网络对应的初始目 标候选神经网络子空间。
其中,在根据预设神经网络选择策略从候选神经网络集合中确定初始目标 候选神经网络后,由于初始目标候选神经网络包括多个候选神经网络子空间组 成的,因此根据初始目标候选神经网络的网络结构确定当前搜索神经网络对应 的初始目标候选神经网络子空间,即将初始目标候选神经网络的当前搜索神经 网络对应的候选神经网络子空间确定为当前搜索神经网络对应的初始目标候选 神经网络子空间。
例如,目标神经网络的初始网络结构为 神经网络搜索空间如图2A所示,确定最后一层神经网络为当前搜索 神经网络为其他层神经网络为等待搜索神经网络,而根据预设神经网络 选择策略从候选神经网络集合中确定初始目标候选神经网络为:候选神经网络 候选神经网络 候选神经网络 候选神经网络那么当前搜索神经网络对应的初始目标候选神经网络子空间为:
在一个实施例中,如图4所示,根据预设神经网络选择策略从候选神经网 络集合中确定初始目标候选神经网络,包括:
步骤402,获取候选神经网络集合中各个候选神经网络对应的候选训练精度。
其中,候选训练精度是指候选神经网络的训练准确率,通过候选训练精度能 够反映候选神经网络的训练情况以及候选神经网络的数据处理状况。候选训练 精度越高,说明候选神经网络数据处理越准确。具体地,获取候选神经网络集合 中各个候选神经网络对应的候选训练精度,具体可以是有监督训练,获取训练图 片集,训练图片集中的训练图片存在对应的图片对象分类标签,将训练图片集作 为候选神经网络集合中各个候选神经网络的输入,得到各个候选神经网络输出 训练图片对应的输出结果。根据各个候选神经网络输出训练图片对应的输出结 果和对应的图片对象分类标签计算得到各个候选神经网络对应的候选训练精度。 如,将10张训练图片作为某一个候选神经网络的输入,该候选神经网络输出了 8张训练图片的输出结果,则该候选神经网络的候选训练精度为:8/10=0.8。
步骤404,根据候选训练精度训练对应的候选神经网络,得到各个已训练的 候选神经网络。
其中,在获取候选神经网络集合中各个候选神经网络对应的候选训练精度 后,可根据候选训练精度训练对应的候选神经网络,由于候选神经网络的网络模 型参数包括结构模型参数和应用场景模型参数,结构模型参数从神经网络搜索 空间中搜索出来时就已经确定的了,因此根据候选训练精度训练对应的候选神 经网络可以是根据候选训练精度不断调整候选神经网络的应用场景模型参数, 直至候选神经网络满足收敛条件,得到已训练的候选神经网络。应用场景模型参 数是与输入数据相关的模型参数,神经网络的输入数据不同,而应用场景模型参 数也不同。
在一个实施例中,由于候选神经网络集合中的候选神经网络的数量较多,为 了达到采用尽量少的训练样本和训练时间,可先对候选神经网络集合进行初步 筛选,具体可以是获取各个候选神经网络对应的目标候选网络结构参数,根据目 标候选网络结构参数从各个候选神经网络中筛选得到相同目标候选网络结构参 数的候选神经网络,根据训练精度调整对应的相同目标候选网络结构参数的候 选神经网络的网络结构参数,直至相同目标候选网络结构参数的候选神经网络 满足收敛条件,得到各个已训练的候选神经网络。例如,目标候选网络结构参数 为候选神经网络的第1个神经网络子空间的网络结构参数,获取各个候选神经 网络对应的第1个候选神经网络子空间的网络结构参数,根据各个候选神经网 络对应的第1个候选神经网络子空间的网络结构参数从各个候选神经网络中筛 选得到相同目标候选网络结构参数的候选神经网络,即将所有第1个候选神经 网络子空间的网络结构参数相同的候选网络作为筛选后的相同目标候选网络结 构参数的候选神经网络,这样子,相同目标候选网络结构参数的候选神经网络的 目标候选网络结构参数可共享进行训练,节省了训练候选神经网络的时间。
最后,在根据对应的训练精度调整对应的相同目标候选网络结构参数的候 选神经网络的网络结构参数,直至相同目标候选网络结构参数的候选神经网络 满足收敛条件,得到各个已训练的候选神经网络。
步骤406,获取各个已训练的候选神经网络对应的候选验证精度。
其中,候选验证精度是指候选神经网络在应用过程的验证准确率,通过候选 验证精度能够反映已训练的候选神经网络在实际应用时的预测情况。候选验证 精度越高,说明已训练的候选神经网络在实际应用时的预测越准确。具体地,获 取各个已训练的候选神经网络对应的候选验证精度具体可以是获取训练图片集, 训练图片集中的训练图片存在对应的图片对象分类标签,将训练图片集作为各 个已训练的候选神经网络的输入,得到各个已训练的候选神经网络输出训练图 片对应的输出结果。最后再根据各个已训练的候选神经网络输出训练图片对应 的输出结果与对应的图片对象分类标签计算得到各个已训练的候选神经网络对 应的候选验证精度。
步骤408,根据候选训练精度和候选验证精度计算得到对应的候选神经网络 效率。
其中,候选神经网络效率是反映候选神经网络的学习效率的,可根据候选训 练精度和候选验证精度计算得到。其中,根据候选训练精度和候选验证精度计算 候选神经网络效率的计算方式可自定义,自定义可以是将候选训练精度和候选 验证精度的比值作为候选神经网络效率,或者还可以是对候选训练精度和候选 验证精度进行加权计算,将加权计算得到的结果作为候选神经网络效率,或者还 可以是将候选训练精度和候选验证精度进行均值计算,将均值计算得到的结果 作为候选神经网络效率等等。
在一个实施例中,定义Av为候选神经网络对应的候选验证精度,At为候 选神经网络对应的候选训练精度,Ar为候选神经网络效率,将候选验证精度Av 与候选训练精度At的比值作为Ar候选神经网络效率,即Ar=Av/At。
步骤410,根据候选神经网络效率对候选神经网络集合进行筛选,得到筛选 后的候选神经网络。
其中,在根据候选训练精度和候选验证精度计算得到对应的候选神经网络 效率后,根据候选神经网络效率对候选神经网络集合进行筛选,得到筛选后的候 选神经网络。其中,根据候选神经网络效率对候选神经网络集合进行筛选的筛选 规则可自定义,自定义可以是将候选神经网络效率大于预设神经网络效率对应 的候选神经网络作为候选神经网络。自定义筛选规则还可以是将候选神经网络 效率按照高到低的顺序排序,根据排序顺序选取Top K个候选神经网络作为筛 选后的候选神经网络等。其中,K的具体数量可自定义,自定义可以根据人为经 验值或者实际应用场景或者业务需求进行设置。
步骤412,根据候选神经网络效率和候选验证精度从筛选后的候选神经网络 确定得到初始目标候选神经网络。
其中,在根据候选神经网络效率对候选神经网络集合进行筛选,得到筛选后 的候选神经网络,由于筛选后的候选神经网络的数量较多,且根据候选神经网络 效率对候选神经网络集合进行筛选是初步筛选,因此为了提高神经网络搜索的 准确性,还需对筛选后的候选神经网络进行筛选。具体可以是根据候选神经网络 效率和候选验证精度从筛选后的候选神经网络确定得到初始目标候选神经网络。 具体地,可根据候选神经网络效率和候选验证精度计算得到候选神经网络评价 值,再根据候选神经网络评价值对筛选后的候选神经网络进行筛选,得到初始目 标候选神经网络。
其中,根据候选神经网络效率和候选验证精度计算得到候选神经网络评价 值的计算方式可自定义,自定义可以是将候选神经网络效率和候选验证精度的 比值作为候选神经网络评价值,或者还可以是将候选神经网络效率和候选验证 精度进行加权计算,将加权计算得到的结果作为候选神经网络评价值,或者还可 以是获取预设权重值,根据预设权重值、候选神经网络效率和候选验证精度计算 得到候选神经网络评价值。在一个实施例中,定义Av为候选神经网络对应的候 选验证精度,At为候选神经网络对应的候选训练精度,Ar为候选神经网络效率, 预设权重值为a,E为候选神经网络评价值,根据预设权重值、候选神经网络效 率和候选验证精度计算得到候选神经网络评价值,即E=(1-a)Ar+a Av。
其中,根据候选神经网络评价值对筛选后的候选神经网络进行筛选的筛选 规则可自定义,自定义可以是将候选神经网络评价值大于预设神经网络评价值 对应的候选神经网络作为初始目标候选神经网络。自定义筛选规则还可以是将 候选神经网络评价值按照高到低的顺序排序,根据排序顺序选取候选神经网络 评价值最高的候选神经网络作为初始目标候选神经网络等。
在一个实施例中,如图5所示,获取候选神经网络集合中各个候选神经网 络对应的候选训练精度,包括:
步骤502,获取训练图片集,训练图片集中的训练图片存在对应的训练图片 对象分类标签。
其中,训练图片集是用来训练候选神经网络的,训练图片集中包括多个训练 图片,各个训练图片都存在对应的训练图片对象分类标签。其中训练图片对象分 类标签是指训练图片已确定的训练图片类别标签,这里的训练图片对象分类标 签是训练图片的正确标签,可通过人工对训练图片进行标注得到训练图片对象 分类标签。具体地,在进行训练候选神经网络之前,需获取训练图片集,训练图 片集中的训练图片都存在已标注的训练图片对象分类标签,训练图片对象分类 标签还用于检测候选神经网络输出的结果是否正确,若候选神经网络输出的结 果与对应的训练图片对象分类标签相同,则说明候选神经网络训练成功,否则则 需要继续训练候选神经网络。
步骤504,将训练图片集中的训练图片输入至各个候选神经网络,得到各个 候选神经网络输出的训练输出结果。
步骤506,根据各个候选神经网络输出的训练输出结果和对应的训练图片对 象分类标签计算得到各个候选神经网络对应的候选训练精度。
其中,在获取训练图片集后,根据训练图片集对各个候选神经网络进行训练, 具体可以是将训练图片集中的各个训练图片作为各个候选神经网络的输入数据, 各个候选神经网络对各个训练图片分别进行计算,得到各个候选神经网络输出 各个训练图片对应的训练输出结果。其中,这里的训练输出结果可以为各个训练 图片对应的输出图片对象分类标签。
进而,再根据各个候选神经网络输出各个训练图片对应的训练输出结果和 对应的训练图片对象分类标签计算得到各个候选神经网络对应的训练精度。若 训练精度越高,说明对应的候选神经网络的数据处理准确度越高,反之,则说明 候选神经网络的数据处理的准确度低。其中,训练精度的计算方式可自定义,自 定义可以是将训练图片对应的训练输出结果和对应的训练图片对象分类标签的 比值作为训练精度,或者还可以是对训练图片对应的训练输出结果和对应的训 练图片对象分类标签进行加权计算,将加权计算得到的数值作为训练精度。
在一个实施例中,如图6所示,根据候选训练精度训练对应的候选神经网 络,得到各个已训练的候选神经网络,包括:
步骤602,获取各个候选神经网络对应的目标候选神经网络子空间对应的目 标网络结构参数。
其中,目标候选神经网络子空间是指从各个候选神经网络对应的候选神经 网络子空间集合中选取符合预设选取条件的候选神经网络子空间。而各个候选 神经网络对应的候选神经网络子空间都存在对应的目标网络结构参数。其中预 设选取条件可自定义,自定义可以是随机选取某一个候选神经网络子空间作为 目标候选神经网络子空间等。
具体地,由于候选神经网络由候选神经网络子空间组成,候选神经网络子空 间的数量为至少一个,为了达到采用尽量少的训练样本和训练时间,可先对候选 神经网络集合进行初步筛选。初步筛选可以是获取各个候选神经网络对应的目 标候选神经网络子空间对应的目标网络结构参数,如目标候选神经网络子空间 为第1个候选神经网络子空间,则获取各个候选神经网络对应的第1个候选神 经网络子空间对应的网络结构参数。
步骤604,根据目标网络结构参数从各个候选神经网络中筛选得到相同目标 网络结构参数的候选神经网络。
其中,在获取各个候选神经网络对应的目标候选神经网络子空间对应的目 标网络结构参数后,为了尽量采用少的训练样本从而减少训练时间,则可根据目 标网络结构参数从各个候选神经网络中筛选得到相同目标网络结构参数的候选 神经网络,因为相同目标网络结构参数的候选神经网络的网络结构参数可以共 享进行训练,也就是说当某一个候选神经网络的目标候选神经网络子空间对应 的目标网络结构参数训练完成后,则相同网络结构参数的候选神经网络子空间 对应的候选神经网络的网络结构模型参数也训练完成,可以减少候选神经网络 的训练时间,提高候选神经网络的训练效率。
如,候选神经网络集合中包括候选神经网络A、候选神经网络B和候选神经 网络C,候选神经网络A为候选神经网络B为 候选神经网络C为目 标候选神经网络子空间为第1个候选神经网络子空间。具体地,获取各个候选 神经网络对应的第1个候选神经网络子空间对应的目标网络结构参数,根据目 标网络结构参数从各个候选神经网络中筛选得到相同目标网络结构参数的候选 神经网络为候选神经网络A和候选神经网络C,因为候选神经网络A和候选神经 网络C的第1个候选神经网络子空间的基本网络结构相同,因此对应的目标网 络结构参数也相同。这样子,通过对候选神经网络集合进行初步筛选,能够减少 训练样本从而提高训练效率。
步骤606,根据候选训练精度调整对应的相同目标网络结构参数的候选神经 网络的网络结构参数,直至相同目标网络结构参数的候选神经网络满足收敛条 件,得到各个已训练的候选神经网络。
其中,在对候选神经网络集合进行初步筛选得到筛选后的相同目标网络结 构参数的候选神经网络后,根据训练精度不断调整对应的相同目标网络结构参 数的候选神经网络的网络结构参数,直至相同目标网络结构参数的候选神经网 络满足收敛条件,得到各个已训练的候选神经网络。其中,收敛条件可自定义, 自定义可以是当收敛值达到最小或者不再发生变化时,则可认为候选神经网络 已经满足收敛条件。
在一个实施例中,如图7所示,获取各个已训练的候选神经网络对应的候 选验证精度,包括:
步骤702,获取验证图片集,验证图片集中的验证图片存在对应的验证图片 对象分类标签。
其中,验证图片集是用来在实际应用中用来验证已训练的候选神经网络的 数据处理准确度的,验证图片集中包括多个验证图片,各个验证图片都存在对应 的验证图片对象分类标签。其中验证图片对象分类标签是指验证图片已确定的 验证图片类别标签,这里的验证图片对象分类标签是验证图片的正确标签,可通 过人工对验证图片进行标注得到验证图片对象分类标签。具体地,在进行验证已 训练的候选神经网络之前,需获取验证图片集,验证图片集中的验证图片都存在 已标注的验证图片对象分类标签,验证图片对象分类标签还用于检测已训练的 候选神经网络输出的结果是否正确,若已训练的候选神经网络输出的结果与对 应的验证图片对象分类标签相同,则说明已训练的候选神经网络训练成功,否则 则需要继续训练已训练的候选神经网络。
步骤704,将验证图片集中的验证图片输入至各个已训练的候选神经网络, 得到各个已训练的候选神经网络输出的验证输出结果。
步骤706,根据各个已训练的候选神经网络输出的验证输出结果和对应的验 证图片对象分类标签计算得到各个已训练的候选神经网络的候选验证精度。
其中,在获取验证图片集后,根据验证图片集对各个已训练的候选神经网络 进行验证,具体可以是将验证图片集中的各个验证图片作为各个已训练的候选 神经网络的输入数据,各个已训练的候选神经网络对各个验证图片分别进行计 算,得到各个已训练的候选神经网络输出各个验证图片对应的验证输出结果。其 中,这里的验证输出结果可以为各个验证图片对应的输出验证图片对象分类标 签。
进而,再根据各个已训练的候选神经网络输出各个验证图片对应的验证输 出结果和对应的验证图片对象分类标签计算得到各个已训练的候选神经网络对 应的候选验证精度。若候选验证精度越高,说明对应的已训练的候选神经网络的 数据处理准确度越高,反之,则说明已训练的候选神经网络的数据处理的准确度 低。其中,候选验证精度的计算方式可自定义,自定义可以是将验证图片对应的 验证输出结果和对应的验证图片对象分类标签的比值作为候选验证精度,或者 还可以是对验证图片对应的验证输出结果和对应的验证图片对象分类标签进行 加权计算,将加权计算得到的数值作为候选验证精度。
在一个实施例中,如图8所示,根据预设神经网络选择策略对中间神经网 络搜索空间进行搜索得到目标神经网络,包括:
步骤802,中间神经网络搜索空间中的各层神经网络对应的中间神经网络子 空间排列组合,形成中间神经网络集合。
其中,中间神经网络搜索空间是各层神经网络搜索得到对应的初始目标候 选神经网络子空间后,由各层神经网络的初始目标候选神经网络子空间组成的 神经网络搜索空间。中间神经网络搜索空间包括多层神经网络,各层神经网络存 在对应的中间神经网络子空间,中间神经网络子空间即为通过各层神经网络搜 索得到的对应的初始目标候选神经网络子空间。
具体地,获取中间神经网络搜索空间中的各层神经网络对应的中间神经网 络子空间,将各层神经网络对应的中间神经网络子空间进行排列组合,形成中间 神经网络集合,其中中间神经网络集合中包括多个由各层神经网络对应的中间 神经网络子空间进行排列组合得到的中间神经网络。
在一个实施例中,中间神经网络搜索空间可如图2F所示,如图2F所示,通 过神经网络搜索,确定最后一层神经网络对应的中间神经网络子空间为倒数第二层神经网络对应的中间神经网络子空间为……第一层神经网络对应 的中间神经网络子空间为等。由图2F示出的中间 神经网络搜索空间中的各层神经网络对应的中间神经网络子空间排列组合,形 成中间神经网络集合C={C1、C2、C3……CN},如 等等。
步骤804,获取中间神经网络集合中各个中间神经网络对应的中间训练精度。
其中,中间训练精度是指中间神经网络的训练准确率,通过中间训练精度能 够反映中间神经网络的训练情况以及中间神经网络的数据处理状况。中间训练 精度越高,说明中间神经网络数据处理越准确。具体地,获取中间神经网络集合 中各个中间神经网络对应的中间训练精度,具体可以是有监督训练,获取训练图 片集,训练图片集中的训练图片存在对应的图片对象分类标签,将训练图片集作 为中间神经网络集合中各个中间神经网络的输入,得到各个中间神经网络输出 训练图片对应的输出结果。根据各个中间神经网络输出训练图片对应的输出结 果和对应的图片对象分类标签计算得到各个中间神经网络对应的中间训练精度。 如,将10张训练图片作为某一个中间神经网络的输入,该中间神经网络输出了 8张训练图片的输出结果,则该中间神经网络的中间训练精度为:8/10=0.8。
步骤806,根据中间训练精度训练各个中间神经网络,得到各个已训练的中 间神经网络。
其中,在获取中间神经网络集合中各个中间神经网络对应的中间训练精度 后,可根据中间训练精度训练对应的中间神经网络,由于中间神经网络的网络模 型参数包括结构模型参数和应用场景模型参数,结构模型参数从神经网络搜索 空间中搜索出来时就已经确定的了,因此根据训练精度训练对应的中间神经网 络可以是根据中间训练精度不断调整中间神经网络的应用场景模型参数,直至 中间神经网络满足收敛条件,得到已训练的中间神经网络。应用场景模型参数是 与输入数据相关的模型参数,神经网络的输入数据不同,而应用场景模型参数也 不同。在一个实施例中,由于中间神经网络的数量较多,因此在训练各个中间神 经网络之前,可先对中间神经网络集合进行初步筛选,其中初步筛选的规则可自 定义,自定义可以是根据各个中间神经网络对应的目标中间神经网络子空间的 网络结构参数进行筛选。
步骤808,获取各个已训练的中间神经网络对应的中间验证精度。
其中,中间验证精度是指中间神经网络在应用过程的验证准确率,通过中间 验证精度能够反映已训练的中间神经网络在实际应用时的预测情况。中间验证 精度越高,说明已训练的中间神经网络在实际应用时的预测越准确。具体地,获 取各个已训练的中间神经网络对应的中间验证精度具体可以是获取训练图片集, 训练图片集中的训练图片存在对应的图片对象分类标签,将训练图片集作为各 个已训练的中间神经网络的输入,得到各个已训练的中间神经网络输出训练图 片对应的输出结果。最后再根据各个已训练的中间神经网络输出训练图片对应 的输出结果与对应的图片对象分类标签计算得到各个已训练的中间神经网络对 应的中间验证精度。
步骤810,根据中间训练精度和中间验证精度计算得到对应的中间神经网络 效率。
其中,中间神经网络效率是反映中间神经网络的学习效率的,可根据中间训 练精度和中间验证精度计算得到。其中,根据中间训练精度和中间验证精度计算 中间神经网络效率的计算方式可自定义,自定义可以是将中间训练精度和中间 验证精度的比值作为中间神经网络效率,或者还可以是对中间训练精度和中间 验证精度进行加权计算,将加权计算得到的结果作为中间神经网络效率,或者还 可以是将中间训练精度和中间验证精度进行均值计算,将均值计算得到的结果 作为中间神经网络效率等等。
在一个实施例中,定义Av为中间神经网络对应的中间验证精度,At为中 间神经网络对应的中间训练精度,Ar为中间神经网络效率,将中间验证精度Av 与中间训练精度At的比值作为Ar中间神经网络效率,即Ar=Av/At。
步骤812,根据中间神经网络效率对中间神经网络集合进行筛选,得到筛选 后的中间神经网络。
其中,在根据中间训练精度和中间验证精度计算得到对应的中间神经网络 效率后,根据中间神经网络效率对中间神经网络集合进行筛选,得到筛选后的中 间神经网络。其中,根据中间神经网络效率对中间神经网络集合进行筛选的筛选 规则可自定义,自定义可以是将中间神经网络效率大于预设神经网络效率对应 的中间神经网络作为中间神经网络。自定义筛选规则还可以是将中间神经网络 效率按照高到低的顺序排序,根据排序顺序选取Top K个中间神经网络作为筛 选后的中间神经网络等。其中,K的具体数量可自定义,自定义可以根据人为经 验值或者实际应用场景或者业务需求进行设置。
步骤814,根据中间神经网络效率和中间验证精度从筛选后的中间神经网络 搜索得到目标神经网络。
其中,在根据中间神经网络效率对中间神经网络集合进行筛选,得到筛选后 的中间神经网络,由于筛选后的中间神经网络的数量较多,且根据中间神经网络 效率对中间神经网络集合进行筛选是初步筛选,因此为了提高神经网络搜索的 准确性,还需对筛选后的中间神经网络进行筛选。具体可以是根据中间神经网络 效率和中间验证精度从筛选后的中间神经网络确定得到目标神经网络。具体地, 可根据中间神经网络效率和中间验证精度计算得到中间神经网络评价值,根据 中间神经网络评价值对筛选后的中间神经网络进行筛选,得到目标神经网络。
其中,根据中间神经网络效率和中间验证精度计算得到中间神经网络评价 值的计算方式可自定义,自定义可以是将中间神经网络效率和中间验证精度的 比值作为中间神经网络评价值,或者还可以是将中间神经网络效率和中间验证 精度进行加权计算,将加权计算得到的结果作为中间神经网络评价值,或者还可 以是获取预设权重值,根据预设权重值、中间神经网络效率和中间验证精度计算 得到中间神经网络评价值。在一个实施例中,定义Av为中间神经网络对应的中 间验证精度,At为中间神经网络对应的中间训练精度,Ar为中间神经网络效率, 预设权重值为a,E为中间神经网络评价值,根据预设权重值、中间神经网络效 率和中间验证精度计算得到中间神经网络评价值,即E=(1-a)Ar+a Av。
其中,根据中间神经网络评价值对筛选后的中间神经网络进行筛选的筛选 规则可自定义,自定义可以是将中间神经网络评价值大于预设中间神经网络评 价值对应的中间神经网络作为目标神经网络。自定义筛选规则还可以是将中间 神经网络的评价值按照高到低的顺序排序,根据排序顺序选取中间神经网络评 价值数值最高的中间神经网络作为目标神经网络等。
在一个具体的实施例中,提供了一种神经网络搜索方法,具体包括以下步骤:
1、获取神经网络搜索空间,神经网络搜索空间包括多层神经网络,各层神 经网络存在对应的搜索神经网络子空间集合,搜索神经网络子空间集合中的各 个候选神经网络子空间包括由多个神经元组成的基本网络结构。
2、从多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将等待 搜索神经网络对应的神经网络子空间固定,从当前搜索神经网络对应的当前搜 索神经网络子空间集合中选取初始目标候选神经网络子空间。
2-1、根据多层神经网络的连接关系,按照从输出层至输入层的方向,依次 获取预设数量的神经网络作为当前搜索神经网络,将未作为当前搜索神经网络 的其它神经网络作为等待搜索神经网络。
2-2、将等待搜索神经网络对应的神经网络子空间固定,依次从当前搜索神 经网络子空间集合中取出各个候选神经网络子空间替换当前搜索神经网络对应 的神经网络子空间,形成候选神经网络集合。
2-3、根据预设神经网络选择策略从候选神经网络集合中确定初始目标候选 神经网络。
2-3-1、获取候选神经网络集合中各个候选神经网络对应的候选训练精度。
2-3-1-1、获取训练图片集,训练图片集中的训练图片存在对应的训练图片 对象分类标签。
2-3-1-2、将训练图片集中的训练图片输入至各个候选神经网络,得到各个 候选神经网络输出的训练输出结果。
2-3-1-3、根据各个候选神经网络输出的训练输出结果和对应的训练图片对 象分类标签计算得到各个候选神经网络对应的训练精度。
2-3-2、根据候选训练精度训练对应的候选神经网络,得到各个已训练的候 选神经网络。
2-3-2-1、获取各个候选神经网络对应的目标候选神经网络子空间对应的目 标网络结构参数。
2-3-2-2、根据目标网络结构参数从各个候选神经网络中筛选得到相同目标 网络结构参数的候选神经网络。
2-3-2-3、根据训练精度调整对应的相同目标网络结构参数的候选神经网络 的网络结构参数,直至相同目标网络结构参数的候选神经网络满足收敛条件,得 到各个已训练的候选神经网络。
2-3-3、获取各个已训练的候选神经网络对应的候选验证精度。
2-3-3-1、获取验证图片集,验证图片集中的验证图片存在对应的验证图片 对象分类标签。
2-3-3-2、将验证图片集中的验证图片输入至各个已训练的候选神经网络, 得到各个已训练的候选神经网络输出的验证输出结果。
2-3-3-3、根据各个已训练的候选神经网络输出的验证输出结果和对应的验 证图片对象分类标签计算得到各个已训练的候选神经网络的候选验证精度。
2-3-4、根据候选训练精度和候选验证精度计算得到对应的候选神经网络效 率。
2-3-5、根据候选神经网络效率对候选神经网络集合进行筛选,得到筛选后 的候选神经网络。
2-3-6、根据候选神经网络效率和候选验证精度从筛选后的候选神经网络确 定得到初始目标候选神经网络。
2-4、根据初始目标候选神经网络得到当前搜索神经网络对应的初始目标候 选神经网络子空间。
3、返回从多层神经网络中获取当前搜索神经网络和等待搜索神经网络的步 骤,直到神经网络搜索空间的各层神经网络搜索得到对应的初始目标候选神经 网络子空间。
4、各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜 索空间。
5、根据预设神经网络选择策略对中间神经网络搜索空间进行搜索得到目标 神经网络。
5-1、中间神经网络搜索空间中的各层神经网络对应的中间神经网络子空间 排列组合,形成中间神经网络集合。
5-2、获取中间神经网络集合中各个中间神经网络对应的中间训练精度。
5-3、根据中间训练精度训练各个中间神经网络,得到各个已训练的中间神 经网络。
5-4、获取各个已训练的中间神经网络对应的中间验证精度。
5-5、根据中间训练精度和中间验证精度计算得到对应的中间神经网络效率。
5-6、根据中间神经网络效率对中间神经网络集合进行筛选,得到筛选后的 中间神经网络。
5-7、根据中间神经网络效率和中间验证精度从筛选后的中间神经网络搜索 得到目标神经网络。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但 是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说 明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。 而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些 子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行, 这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或 者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种神经网络搜索装置900,该装置 900包括:
神经网络搜索空间获取模块902,用于获取神经网络搜索空间,神经网络搜 索空间包括多层神经网络,各层神经网络存在对应的搜索神经网络子空间集合, 搜索神经网络子空间集合中的各个候选神经网络子空间包括由多个神经元组成 的基本网络结构。
神经网络搜索模块904,用于从多层神经网络中获取当前搜索神经网络和等 待搜索神经网络,将等待搜索神经网络对应的神经网络子空间固定,从当前搜索 神经网络对应的当前搜索神经网络子空间集合中选取初始目标候选神经网络子 空间。
神经网络搜索模块904还用于返回从多层神经网络中获取当前搜索神经网 络和等待搜索神经网络的步骤,直到神经网络搜索空间的各个神经网络搜索得 到对应的初始目标候选神经网络子空间。
中间神经网络搜索空间形成模块906,用于各层神经网络对应的初始目标候 选神经网络子空间形成中间神经网络搜索空间。
目标神经网络搜索模块908,用于根据预设神经网络选择策略对中间神经网 络搜索空间进行搜索得到目标神经网络。
在一个实施例中,神经网络搜索模块还用于根据多层神经网络的连接关系, 按照从输出层至输入层的方向,依次获取预设数量的神经网络作为当前搜索神 经网络,将未作为当前搜索神经网络的其它神经网络作为等待搜索神经网络。
在一个实施例中,如图10所示,神经网络搜索模块904包括:
候选神经网络集合形成单元904a,用于将等待搜索神经网络对应的神经网 络子空间固定,依次从当前搜索神经网络子空间集合中取出各个候选神经网络 子空间替换当前搜索神经网络对应的神经网络子空间,形成候选神经网络集合。
初始目标候选神经网络确定单元904b,用于根据预设神经网络选择策略从 候选神经网络集合中确定初始目标候选神经网络。
初始目标候选神经网络子空间确定单元904c,用于根据初始目标候选神经 网络得到当前搜索神经网络对应的初始目标候选神经网络子空间。
在一个实施例中,如图11所示,初始目标候选神经网络确定单元904b包 括:
候选训练精度获取子单元1102,用于获取候选神经网络集合中各个候选神 经网络对应的候选训练精度。
候选神经网络训练子单元1104,用于根据候选训练精度训练对应的候选神 经网络,得到各个已训练的候选神经网络。
候选验证精度获取子单元1106,用于获取各个已训练的候选神经网络对应 的候选验证精度。
候选神经网络效率计算子单元1108,用于根据候选训练精度和候选验证精 度计算得到对应的候选神经网络效率。
候选神经网络集合筛选子单元1110,用于根据候选神经网络效率对候选神 经网络集合进行筛选,得到筛选后的候选神经网络。
初始目标候选神经网络确定子单元1112,用于根据候选神经网络效率和候 选验证精度从筛选后的候选神经网络确定得到初始目标候选神经网络。
在一个实施例中,候选训练精度获取子单元1102还用于获取训练图片集, 训练图片集中的训练图片存在对应的训练图片对象分类标签;将训练图片集中 的训练图片输入至各个候选神经网络,得到各个候选神经网络输出的训练输出 结果;根据各个候选神经网络输出的训练输出结果和对应的训练图片对象分类 标签计算得到各个候选神经网络对应的训练精度。
在一个实施例中,候选神经网络训练子单元1104还用于获取各个候选神经 网络对应的目标候选神经网络子空间对应的目标网络结构参数;根据目标网络 结构参数从各个候选神经网络中筛选得到相同目标网络结构参数的候选神经网 络;根据训练精度调整对应的相同目标网络结构参数的候选神经网络的网络结 构参数,直至相同目标网络结构参数的候选神经网络满足收敛条件,得到各个已 训练的候选神经网络。
在一个实施例中,候选验证精度获取子单元1106还用于获取验证图片集, 验证图片集中的验证图片存在对应的验证图片对象分类标签;将验证图片集中 的验证图片输入至各个已训练的候选神经网络,得到各个已训练的候选神经网 络输出的验证输出结果;根据各个已训练的候选神经网络输出的验证输出结果 和对应的验证图片对象分类标签计算得到各个已训练的候选神经网络的验证精 度。
在一个实施例中,如图12所示,目标神经网络搜索模块908包括:
中间神经网络集合形成单元908a,用于中间神经网络搜索空间中的各层神 经网络对应的中间神经网络子空间排列组合,形成中间神经网络集合。
中间训练精度获取单元908b,用于获取中间神经网络集合中各个中间神经 网络对应的中间训练精度。
中间神经网络训练单元908c,用于根据中间训练精度训练各个中间神经网 络,得到各个已训练的中间神经网络。
中间验证精度获取单元908d,用于获取各个已训练的中间神经网络对应的 中间验证精度。
中间神经网络效率计算单元908e,用于根据中间训练精度和中间验证精度 计算得到对应的中间神经网络效率。
中间神经网络筛选单元908f,用于根据中间神经网络效率对中间神经网络 集合进行筛选,得到筛选后的中间神经网络。
目标神经网络确定单元908g,用于根据中间神经网络效率和中间验证精度 从筛选后的中间神经网络搜索得到目标神经网络。
图13示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可 以是图1中的服务器120。如图13所示,该计算机设备包括该计算机设备包括 通过系统总线连接的处理器、存储器、网络接口、输入装置。其中,存储器包括 非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作 系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实 现神经网络搜索方法。该内存储器中也可储存有计算机程序,该计算机程序被处 理器执行时,可使得处理器执行神经网络搜索方法。计算机设备的输入装置可以 是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触 控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关 的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定, 具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件, 或者具有不同的部件布置。
在一个实施例中,本申请提供的神经网络搜索装置可以实现为一种计算机 程序的形式,计算机程序可在如图13所示的计算机设备上运行。计算机设备的 存储器中可存储组成该神经网络搜索装置的各个程序模块,比如,图9所示的 神经网络搜索空间获取模块、神经网络搜索模块、中间神经网络搜索空间形成模 块和目标神经网络搜索模块。各个程序模块构成的计算机程序使得处理器执行 本说明书中描述的本申请各个实施例的神经网络搜索方法中的步骤。
例如,图13所示的计算机设备可以通过如图9所示的神经网络搜索装置中 的神经网络搜索空间获取模块执行获取神经网络搜索空间,神经网络搜索空间 包括多层神经网络,各层神经网络存在对应的搜索神经网络子空间集合,搜索神 经网络子空间集合中的各个候选神经网络子空间包括由多个神经元组成的基本 网络结构。神经网络搜索模块执行从多层神经网络中获取当前搜索神经网络和 等待搜索神经网络,将等待搜索神经网络对应的神经网络子空间固定,从当前搜 索神经网络对应的当前搜索神经网络子空间集合中选取初始目标候选神经网络 子空间。神经网络搜索模块还执行返回从多层神经网络中获取当前搜索神经网 络和等待搜索神经网络的步骤,直到神经网络搜索空间的各个神经网络搜索得 到对应的初始目标候选神经网络子空间。中间神经网络搜索空间形成模块执行各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜索空间。 目标神经网络搜索模块执行根据预设神经网络选择策略对中间神经网络搜索空 间进行搜索得到目标神经网络。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存 储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述神经网络搜 索方法的步骤。此处神经网络搜索方法的步骤可以是上述各个实施例的神经网 络搜索方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计 算机程序被处理器执行时,使得处理器执行上述神经网络搜索方法的步骤。此处 神经网络搜索方法的步骤可以是上述各个实施例的神经网络搜索方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易 失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例 的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或 其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器 可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦 除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM) 或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态 RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、 增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线 (Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器 总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实 施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的 组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的 普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进, 这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求 为准。
Claims (13)
1.一种神经网络搜索方法,包括:
获取神经网络搜索空间,所述神经网络搜索空间包括多层神经网络,各层神经网络存在对应的搜索神经网络子空间集合,所述搜索神经网络子空间集合中的各个候选神经网络子空间包括由多个神经元组成的基本网络结构;
从所述多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将所述等待搜索神经网络对应的神经网络子空间固定,从所述当前搜索神经网络对应的当前搜索神经网络子空间集合中选取初始目标候选神经网络子空间;
返回所述从所述多层神经网络中获取当前搜索神经网络和等待搜索神经网络的步骤,直到所述神经网络搜索空间的各层神经网络搜索得到对应的初始目标候选神经网络子空间;
各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜索空间;
根据预设神经网络选择策略对所述中间神经网络搜索空间进行搜索得到目标神经网络。
2.根据权利要求1所述的方法,其特征在于,所述从所述多层神经网络中获取当前搜索神经网络和等待搜索神经网络,包括:
根据所述多层神经网络的连接关系,按照从输出层至输入层的方向,依次获取预设数量的神经网络作为所述当前搜索神经网络,将未作为所述当前搜索神经网络的其它神经网络作为所述等待搜索神经网络。
3.根据权利要求1所述的方法,其特征在于,所述将所述等待搜索神经网络对应的神经网络子空间固定,从所述当前搜索神经网络对应的当前搜索神经网络子空间集合中选取初始目标候选神经网络子空间,包括:
将所述等待搜索神经网络对应的神经网络子空间固定,依次从所述当前搜索神经网络子空间集合中取出各个所述候选神经网络子空间替换所述当前搜索神经网络对应的神经网络子空间,形成候选神经网络集合;
根据所述预设神经网络选择策略从所述候选神经网络集合中确定初始目标候选神经网络;
根据所述初始目标候选神经网络得到所述当前搜索神经网络对应的初始目标候选神经网络子空间。
4.根据权利要求3所述的方法,其特征在于,所述根据所述预设神经网络选择策略从所述候选神经网络集合中确定初始目标候选神经网络,包括:
获取所述候选神经网络集合中各个候选神经网络对应的候选训练精度;
根据所述候选训练精度训练对应的候选神经网络,得到各个已训练的候选神经网络;
获取各个所述已训练的候选神经网络对应的候选验证精度;
根据所述候选训练精度和所述候选验证精度计算得到对应的候选神经网络效率;
根据所述候选神经网络效率对所述候选神经网络集合进行筛选,得到筛选后的候选神经网络;
根据所述候选神经网络效率和所述候选验证精度从所述筛选后的候选神经网络确定得到所述初始目标候选神经网络。
5.根据权利要求4所述的方法,其特征在于,所述获取所述候选神经网络集合中各个候选神经网络对应的候选训练精度,包括:
获取训练图片集,所述训练图片集中的训练图片存在对应的训练图片对象分类标签;
将所述训练图片集中的训练图片输入至各个所述候选神经网络,得到各个候选神经网络输出的训练输出结果;
根据各个所述候选神经网络输出的训练输出结果和对应的训练图片对象分类标签计算得到各个候选神经网络对应的候选训练精度。
6.根据权利要求4所述的方法,其特征在于,所述根据所述候选训练精度训练对应的候选神经网络,得到各个已训练的候选神经网络,包括:
获取各个所述候选神经网络对应的目标候选神经网络子空间对应的目标网络结构参数;
根据所述目标网络结构参数从各个所述候选神经网络中筛选得到相同目标网络结构参数的候选神经网络;
根据所述候选训练精度调整对应的所述相同目标网络结构参数的候选神经网络的网络结构参数,直至所述相同目标网络结构参数的候选神经网络满足收敛条件,得到各个所述已训练的候选神经网络。
7.根据权利要求4所述的方法,其特征在于,所述获取各个所述已训练的候选神经网络对应的候选验证精度,包括:
获取验证图片集,所述验证图片集中的验证图片存在对应的验证图片对象分类标签;
将所述验证图片集中的验证图片输入至各个所述已训练的候选神经网络,得到各个已训练的候选神经网络输出的验证输出结果;
根据所述各个已训练的候选神经网络输出的验证输出结果和对应的验证图片对象分类标签计算得到各个所述已训练的候选神经网络的候选验证精度。
8.根据权利要求1所述的方法,其特征在于,所述根据预设神经网络选择策略对所述中间神经网络搜索空间进行搜索得到目标神经网络,包括:
所述中间神经网络搜索空间中的各层神经网络对应的中间神经网络子空间排列组合,形成中间神经网络集合;
获取所述中间神经网络集合中各个中间神经网络对应的中间训练精度;
根据所述中间训练精度训练各个所述中间神经网络,得到各个已训练的中间神经网络;
获取所述各个所述已训练的中间神经网络对应的中间验证精度;
根据所述中间训练精度和所述中间验证精度计算得到对应的中间神经网络效率;
根据所述中间神经网络效率对所述中间神经网络集合进行筛选,得到筛选后的中间神经网络;
根据所述中间神经网络效率和所述中间验证精度从所述筛选后的中间神经网络搜索得到目标神经网络。
9.一种神经网络搜索装置,其特征在于,所述装置包括:
神经网络搜索空间获取模块,用于获取神经网络搜索空间,所述神经网络搜索空间包括多层神经网络,各层神经网络存在对应的搜索神经网络子空间集合,所述搜索神经网络子空间集合中的各个候选神经网络子空间包括由多个神经元组成的基本网络结构;
神经网络搜索模块,用于从所述多层神经网络中获取当前搜索神经网络和等待搜索神经网络,将所述等待搜索神经网络对应的神经网络子空间固定,从所述当前搜索神经网络对应的当前搜索神经网络子空间集合中选取初始目标候选神经网络子空间;
所述神经网络搜索模块还用于返回所述从所述多层神经网络中获取当前搜索神经网络和等待搜索神经网络的步骤,直到所述神经网络搜索空间的各个神经网络搜索得到对应的初始目标候选神经网络子空间;
中间神经网络搜索空间形成模块,用于各层神经网络对应的初始目标候选神经网络子空间形成中间神经网络搜索空间;
目标神经网络搜索模块,用于根据预设神经网络选择策略对所述中间神经网络搜索空间进行搜索得到目标神经网络。
10.根据权利要求9所述的装置,其特征在于,所述神经网络搜索模块还用于根据所述多层神经网络的连接关系,按照从输出层至输入层的方向,依次获取预设数量的神经网络作为所述当前搜索神经网络,将未作为所述当前搜索神经网络的其它神经网络作为所述等待搜索神经网络。
11.根据权利要求9所述的装置,其特征在于,所述神经网络搜索模块包括:
候选神经网络集合形成单元,用于将所述等待搜索神经网络对应的神经网络子空间固定,依次从所述当前搜索神经网络子空间集合中取出各个所述候选神经网络子空间替换所述当前搜索神经网络对应的神经网络子空间,形成候选神经网络集合;
初始目标候选神经网络确定单元,用于根据所述预设神经网络选择策略从所述候选神经网络集合中确定初始目标候选神经网络;
初始目标候选神经网络子空间确定单元,用于根据所述初始目标候选神经网络得到所述当前搜索神经网络对应的初始目标候选神经网络子空间。
12.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910161226.2A CN109919304B (zh) | 2019-03-04 | 2019-03-04 | 图像处理方法、装置、可读存储介质和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910161226.2A CN109919304B (zh) | 2019-03-04 | 2019-03-04 | 图像处理方法、装置、可读存储介质和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109919304A true CN109919304A (zh) | 2019-06-21 |
CN109919304B CN109919304B (zh) | 2021-07-02 |
Family
ID=66963119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910161226.2A Active CN109919304B (zh) | 2019-03-04 | 2019-03-04 | 图像处理方法、装置、可读存储介质和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109919304B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414570A (zh) * | 2019-07-04 | 2019-11-05 | 北京迈格威科技有限公司 | 图像分类模型生成方法、装置、设备和存储介质 |
CN111047563A (zh) * | 2019-11-26 | 2020-04-21 | 深圳度影医疗科技有限公司 | 一种应用于医学超声图像的神经网络构建方法 |
CN111382868A (zh) * | 2020-02-21 | 2020-07-07 | 华为技术有限公司 | 神经网络结构搜索方法和神经网络结构搜索装置 |
CN111401517A (zh) * | 2020-02-21 | 2020-07-10 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
CN111967569A (zh) * | 2020-06-29 | 2020-11-20 | 北京百度网讯科技有限公司 | 神经网络结构的生成方法、装置、存储介质及电子设备 |
WO2021008206A1 (zh) * | 2019-07-12 | 2021-01-21 | 华为技术有限公司 | 神经网络结构的搜索方法、图像处理方法和装置 |
CN112445823A (zh) * | 2019-09-04 | 2021-03-05 | 华为技术有限公司 | 神经网络结构的搜索方法、图像处理方法和装置 |
WO2021051596A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 模型预测优化方法、装置、设备及可读存储介质 |
WO2021088365A1 (zh) * | 2019-11-08 | 2021-05-14 | 华为技术有限公司 | 确定神经网络的方法和装置 |
CN112819138A (zh) * | 2021-01-26 | 2021-05-18 | 上海依图网络科技有限公司 | 一种图像神经网络结构的优化方法及装置 |
CN113239077A (zh) * | 2021-07-12 | 2021-08-10 | 深圳市永达电子信息股份有限公司 | 一种基于神经网络的搜索方法、系统和计算机可读存储介质 |
CN113408692A (zh) * | 2020-03-16 | 2021-09-17 | 顺丰科技有限公司 | 网络结构的搜索方法、装置、设备及存储介质 |
CN113469352A (zh) * | 2020-03-31 | 2021-10-01 | 上海商汤智能科技有限公司 | 神经网络模型的优化方法、数据处理方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017148536A1 (en) * | 2016-03-04 | 2017-09-08 | VON MÜLLER, Albrecht | Electronic devices, artificial evolutionary neural networks, methods and computer programs for implementing evolutionary search and optimisation |
CN109034367A (zh) * | 2018-08-22 | 2018-12-18 | 广州杰赛科技股份有限公司 | 神经网络更新方法、装置、计算机设备和可读存储介质 |
CN109284820A (zh) * | 2018-10-26 | 2019-01-29 | 北京图森未来科技有限公司 | 一种深度神经网络的结构搜索方法及装置 |
-
2019
- 2019-03-04 CN CN201910161226.2A patent/CN109919304B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017148536A1 (en) * | 2016-03-04 | 2017-09-08 | VON MÜLLER, Albrecht | Electronic devices, artificial evolutionary neural networks, methods and computer programs for implementing evolutionary search and optimisation |
CN109034367A (zh) * | 2018-08-22 | 2018-12-18 | 广州杰赛科技股份有限公司 | 神经网络更新方法、装置、计算机设备和可读存储介质 |
CN109284820A (zh) * | 2018-10-26 | 2019-01-29 | 北京图森未来科技有限公司 | 一种深度神经网络的结构搜索方法及装置 |
Non-Patent Citations (4)
Title |
---|
BARRET ZOPH ET AL.: "Neural Architecture Search with Reinforcement Learning", 《MACHINE LEARNING》 * |
GUILLAUME MICHEL ET AL.: "DVOLVER Efficient Pareto-Optimal Neural Network Architecture Search", 《COMPUTER VISION AND PATTERN RECOGNITION (CS.CV)》 * |
HONGLEI ZHANG ET AL.: "Finding Better Topologies for Deep Convolutional Neural Networks by Evolution", 《NEURAL AND EVOLUTIONARY COMPUTING》 * |
孟庆飞: "基于多模型融合的基因调控网络建模研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414570A (zh) * | 2019-07-04 | 2019-11-05 | 北京迈格威科技有限公司 | 图像分类模型生成方法、装置、设备和存储介质 |
CN110414570B (zh) * | 2019-07-04 | 2022-01-28 | 北京迈格威科技有限公司 | 图像分类模型生成方法、装置、设备和存储介质 |
US12026938B2 (en) | 2019-07-12 | 2024-07-02 | Huawei Technologies Co., Ltd. | Neural architecture search method and image processing method and apparatus |
WO2021008206A1 (zh) * | 2019-07-12 | 2021-01-21 | 华为技术有限公司 | 神经网络结构的搜索方法、图像处理方法和装置 |
CN112445823A (zh) * | 2019-09-04 | 2021-03-05 | 华为技术有限公司 | 神经网络结构的搜索方法、图像处理方法和装置 |
WO2021051596A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 模型预测优化方法、装置、设备及可读存储介质 |
WO2021088365A1 (zh) * | 2019-11-08 | 2021-05-14 | 华为技术有限公司 | 确定神经网络的方法和装置 |
CN111047563B (zh) * | 2019-11-26 | 2023-09-01 | 深圳度影医疗科技有限公司 | 一种应用于医学超声图像的神经网络构建方法 |
CN111047563A (zh) * | 2019-11-26 | 2020-04-21 | 深圳度影医疗科技有限公司 | 一种应用于医学超声图像的神经网络构建方法 |
WO2021164751A1 (zh) * | 2020-02-21 | 2021-08-26 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
CN111401517A (zh) * | 2020-02-21 | 2020-07-10 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
CN111382868A (zh) * | 2020-02-21 | 2020-07-07 | 华为技术有限公司 | 神经网络结构搜索方法和神经网络结构搜索装置 |
CN111401517B (zh) * | 2020-02-21 | 2023-11-03 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
CN111382868B (zh) * | 2020-02-21 | 2024-06-18 | 华为技术有限公司 | 神经网络结构搜索方法和神经网络结构搜索装置 |
CN113408692A (zh) * | 2020-03-16 | 2021-09-17 | 顺丰科技有限公司 | 网络结构的搜索方法、装置、设备及存储介质 |
CN113469352A (zh) * | 2020-03-31 | 2021-10-01 | 上海商汤智能科技有限公司 | 神经网络模型的优化方法、数据处理方法及装置 |
CN111967569A (zh) * | 2020-06-29 | 2020-11-20 | 北京百度网讯科技有限公司 | 神经网络结构的生成方法、装置、存储介质及电子设备 |
CN111967569B (zh) * | 2020-06-29 | 2024-02-13 | 北京百度网讯科技有限公司 | 神经网络结构的生成方法、装置、存储介质及电子设备 |
CN112819138A (zh) * | 2021-01-26 | 2021-05-18 | 上海依图网络科技有限公司 | 一种图像神经网络结构的优化方法及装置 |
CN113239077A (zh) * | 2021-07-12 | 2021-08-10 | 深圳市永达电子信息股份有限公司 | 一种基于神经网络的搜索方法、系统和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109919304B (zh) | 2021-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109919304A (zh) | 神经网络搜索方法、装置、可读存储介质和计算机设备 | |
CN109978893B (zh) | 图像语义分割网络的训练方法、装置、设备及存储介质 | |
CN109977943A (zh) | 一种基于yolo的图像目标识别方法、系统和存储介质 | |
CN109376615A (zh) | 用于提升深度学习网络预测性能的方法、装置及存储介质 | |
JP7376731B2 (ja) | 画像認識モデル生成方法、装置、コンピュータ機器及び記憶媒体 | |
CN110348562A (zh) | 神经网络的量化策略确定方法、图像识别方法和装置 | |
CN106326837A (zh) | 对象追踪方法和装置 | |
CN106156781A (zh) | 排序卷积神经网络构建方法及其图像处理方法与装置 | |
CN110472060A (zh) | 题目推送方法、装置、计算机设备和存储介质 | |
CN110889450B (zh) | 超参数调优、模型构建方法和装置 | |
CN110046706A (zh) | 模型生成方法、装置及服务器 | |
TWI785739B (zh) | 目標模型的獲取方法、電子設備與儲存媒體 | |
CN109583594A (zh) | 深度学习训练方法、装置、设备及可读存储介质 | |
CN110209472A (zh) | 任务数据处理方法和板卡 | |
CN111598213A (zh) | 网络训练方法、数据识别方法、装置、设备和介质 | |
DE112021005910T5 (de) | Schnellere abdeckungskonvergenz mit automatischer testparameterabstimmung bei eingeschränkter zufallsverifikation | |
CN110070171A (zh) | 基于神经网络的分类方法、装置、终端及可读介质 | |
CN110414586A (zh) | 基于深度学习的防伪标签验伪方法、装置、设备及介质 | |
CN111582094B (zh) | 并行选取超参数设计多分支卷积神经网络识别行人的方法 | |
CN110377742A (zh) | 文本分类评测方法、装置、可读存储介质和计算机设备 | |
CN111159450B (zh) | 图片分类方法、装置、计算机设备和存储介质 | |
CN112580807A (zh) | 一种基于效能评估的神经网络改进需求自动生成方法及装置 | |
CN110147850B (zh) | 图像识别的方法、装置、设备及存储介质 | |
CN105654095A (zh) | 一种特征的选择方法和装置 | |
CN111475402A (zh) | 程序功能的测试方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |