CN106033554A - 一种基于分段的两级深度学习模型的大数据处理方法 - Google Patents
一种基于分段的两级深度学习模型的大数据处理方法 Download PDFInfo
- Publication number
- CN106033554A CN106033554A CN201510111904.6A CN201510111904A CN106033554A CN 106033554 A CN106033554 A CN 106033554A CN 201510111904 A CN201510111904 A CN 201510111904A CN 106033554 A CN106033554 A CN 106033554A
- Authority
- CN
- China
- Prior art keywords
- layer
- big data
- learning model
- order
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
本发明提供了一种基于分段的两级深度学习模型的大数据处理方法,所述方法包括:步骤1)构建并训练基于分段的两级深度学习模型,该模型从纵向层次上分为两级:第一级和第二级;所述第一级的各层从横向上分为M段;第一级中不同段间相邻层的神经元节点间权重为0;步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;步骤3)输出大数据处理结果。本发明提出的基于分段的两级深度学习模型能够有效地减小了模型规模,缩短了模型的训练时间;本发明的方法能够提高大数据的处理速度,缩短处理时间。
Description
技术领域
本发明涉及人工智能和大数据领域,特别涉及一种基于分段的两级深度学习模型的大数据处理方法。
背景技术
随着网络技术的快速发展,数据的容量和多样性快速增加,而处理数据的算法复杂度却难以改善,如何高效处理大数据已经成为一个紧迫的难题。在现有的依赖个人经验和手工操作来描述数据、标注数据、选择特征、提取特征、处理数据的方法,已经很难满足大数据快速增长的需求。随着人工智能技术的快速发展,特别是深度学习算法的研究突破,为解决大数据处理问题指明了一个值得探索的方向。
Hinton等人在2006年提出了用于深度置信网的逐层初始化训练方法,这是深度学习方法的研究起点,该方法打破了持续了几十年的深度神经网络训练困难且效果不好的局面。此后,深度学习算法在图像识别、语音识别、自然语言理解等领域得到广泛的应用。深度学习是通过模拟人脑分层次的抽象,将底层数据逐层映射而获得更抽象的特征,由于它可以从大数据中自动提取特征,并通过海量的样本训练获得很好的处理效果,从而得到了广泛的关注。实际上,大数据的快速增长和深度学习的研究突破是相辅相成的,一方面大数据的快速增长需要一种高效处理海量数据的方法,另一方面深度学习模型的训练需要海量的样本数据。总之,大数据可以使深度学习的性能达到极致。
但是,现有的深度学习模型仍然存在很多严重的问题,例如:模型难以扩展、参数优化困难、训练时间过长、推理效率低下等。在2013年Bengio的一篇综述论文中,总结了目前深度学习所面临的挑战和难点,包括如何扩展现有的深度学习模型的规模,并应用到更大的数据集;如何减小参数优化困难;如何避免昂贵的推理和采样;以及如何解开变化因素等。
发明内容
本发明的目的在于克服在大数据应用中现有神经网络深度学习模型存在的上述问题,提出了基于分段的两级深度学习模型,通过对深度学习模型分级分段的处理,对跨段间的权重进行约束,提高了模型的扩展能力,基于该模型,本发明提出了一种基于分段的两级深度学习模型的大数据处理方法,该方法能够提高大数据的处理速度,缩短处理时间。
为了实现上述目的,本发明提出了一种基于分段的两级深度学习模型的大数据处理方法,所述方法包括:
步骤1)构建并训练基于分段的两级深度学习模型,该模型从纵向层次上分为两级:第一级和第二级;所述第一级的各层从横向上分为M段;其中,M为多模态输入的模态个数;第一级中不同段间相邻层的神经元节点间权重为0;
步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;
步骤3)输出大数据处理结果。
上述技术方案中,所述步骤1)进一步包括:
步骤101)将深度为L层的深度学习模型从纵向层次上分为两级:第一级和第二级:
输入层为第一层,输出层为第L层,第L*层为划分层,2≤L*≤L-1;则从第一层到第L*层间的所有层称为第一级,而第L*+1层到第L层间的所有层称为第二级;
步骤102)将第一级内每层上的神经元节点从横向上分为M段:
设L层神经网络的输入宽度为N,即每层有N个神经元节点,第一级的神经元节点划分为M段,每一段的宽度为Dm,1≤m≤M,且并在同一段中,任意两层的宽度都相同;
步骤103)将训练样本划分为M个子集,分别输入深度学习模型的第一层的M段;
步骤104)分别对第一级的M段子模型进行训练:
第一级中不同段间相邻层的神经元节点间权重为0,即第m段的所有节点集合为Sm,第l-1层的任意节点为2≤l≤L*,而第o段第l层的任意节点 且m≠o,则节点和间权重
在上述约束条件下,利用深度神经网络学习算法分别对第一级的M段子模型进行训练;
步骤105)对第二级的各层进行训练;
步骤106)通过深度神经网络学习算法对各层的网络参数进行全局微调,直到各层的网络参数达到最优值。
上述技术方案中,L*的取值方法为:在L*的取值区间内通过交叉验证方法确定一个最优值。
本发明的优点在于:
1、本发明提出的基于分段的两级深度学习模型能够有效地减小了模型规模,缩短了模型的训练时间;
2、本发明提出的大数据处理方法支持多源异构或多模态的大数据的并行输入,提高了大数据的处理速度,缩短了处理时间。
附图说明
图1为本发明的基于分段的两级深度学习模型的大数据处理方法的流程图;
图2为基于分段的两级深度学习模型的示意图。
具体实施方式
以下结合附图对本发明的方法做进一步详细的描述。
如图1所示,一种基于分段的两级深度学习模型的大数据处理方法,包括:
步骤1)构建并训练基于分段的两级深度学习模型;包括:
步骤101)将深度为L层的深度学习模型从纵向上分为两级:第一级和第二级:
输入层为第一层,输出层为第L层,第L*层为划分层,其中2≤L*≤L-1,则从第一层到第L*层间的所有层称为第一级,而第L*+1层到第L层间的所有层称为第二级。
L*的取值方法为:在L*的取值区间内通过交叉验证方法确定一个最优值。
步骤102)将第一级内每层上的神经元节点从横向上分为M段;其中,M为多模态输入的模态个数;
如图2所示,设L层神经网络的输入宽度为N,即每层有N个神经元节点,第一级的神经元节点划分为M段,每一段的宽度为Dm,1≤m≤M,且并在同一段中,任意两层的宽度都相同;
步骤103)将训练样本划分为M个子集,分别输入深度学习模型的第一层的M段;
步骤104)分别对第一级的M段子模型进行训练;
第一级中不同段间相邻层的神经元节点间权重为0,即第m段的所有节点集合为Sm,第l-1层的任意节点为2≤l≤L*,而第o段第l层的任意节点 且m≠o,则节点和间权重
在上述约束条件下,利用深度神经网络学习算法分别对第一级的M段子模型进行训练。
步骤105)对第二级的各层进行训练;
步骤106)通过深度神经网络学习算法对各层的网络参数进行全局微调,直到各层的网络参数达到最优值;
所述深度神经网络学习算法为BP算法。
步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;
步骤3)输出大数据处理结果。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
1.一种基于分段的两级深度学习模型的大数据处理方法,所述方法包括:
步骤1)构建并训练基于分段的两级深度学习模型,该模型从纵向层次上分为两级:第一级和第二级;所述第一级的各层从横向上分为M段;其中,M为多模态输入的模态个数;第一级中不同段间相邻层的神经元节点间权重为0;
步骤2)将待处理的大数据按照数据的类型分为M个子集,分别输入基于分段的两级深度学习模型的第一层的M段进行处理;
步骤3)输出大数据处理结果。
2.根据权利要求1所述的基于分段的两级深度学习模型的大数据处理方法,其特征在于,所述步骤1)进一步包括:
步骤101)将深度为L层的深度学习模型从纵向层次上分为两级:第一级和第二级:
输入层为第一层,输出层为第L层,第L*层为划分层,2≤L*≤L-1;则从第一层到第L*层间的所有层称为第一级,而第L*+1层到第L层间的所有层称为第二级;
步骤102)将第一级内每层上的神经元节点从横向上分为M段:
设L层神经网络的输入宽度为N,即每层有N个神经元节点,第一级的神经元节点划分为M段,每一段的宽度为Dm,1≤m≤M,且并在同一段中,任意两层的宽度都相同;
步骤103)将训练样本划分为M个子集,分别输入深度学习模型的第一层的M段;
步骤104)分别对第一级的M段子模型进行训练:
第一级中不同段间相邻层的神经元节点间权重为0,即第m段的所有节点集合为Sm,第l-1层的任意节点为2≤l≤L*,而第o段第l层的任意节点 且m≠o,则节点和间权重
在上述约束条件下,利用深度神经网络学习算法分别对第一级的M段子模型进行训练;
步骤105)对第二级的各层进行训练;
步骤106)通过深度神经网络学习算法对各层的网络参数进行全局微调,直到各层的网络参数达到最优值。
3.根据权利要求2所述的基于分段的两级深度学习模型的大数据处理方法,其特征在于,所述L*的取值方法为:在L*的取值区间内通过交叉验证方法确定一个最优值。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510111904.6A CN106033554A (zh) | 2015-03-13 | 2015-03-13 | 一种基于分段的两级深度学习模型的大数据处理方法 |
JP2017548135A JP2018511870A (ja) | 2015-03-13 | 2015-03-31 | セグメントに基づく二段深層学習モデル用のビッグデータの処理方法 |
US15/557,463 US20180068215A1 (en) | 2015-03-13 | 2015-03-31 | Big data processing method for segment-based two-grade deep learning model |
PCT/CN2015/075472 WO2016145675A1 (zh) | 2015-03-13 | 2015-03-31 | 一种基于分段的两级深度学习模型的大数据处理方法 |
EP15885058.6A EP3270329A4 (en) | 2015-03-13 | 2015-03-31 | Big data processing method for segment-based two-grade deep learning model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510111904.6A CN106033554A (zh) | 2015-03-13 | 2015-03-13 | 一种基于分段的两级深度学习模型的大数据处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106033554A true CN106033554A (zh) | 2016-10-19 |
Family
ID=56918381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510111904.6A Pending CN106033554A (zh) | 2015-03-13 | 2015-03-13 | 一种基于分段的两级深度学习模型的大数据处理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20180068215A1 (zh) |
EP (1) | EP3270329A4 (zh) |
JP (1) | JP2018511870A (zh) |
CN (1) | CN106033554A (zh) |
WO (1) | WO2016145675A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522914A (zh) * | 2017-09-19 | 2019-03-26 | 中国科学院沈阳自动化研究所 | 一种基于图像的模型融合的神经网络结构训练方法 |
CN109657285A (zh) * | 2018-11-27 | 2019-04-19 | 中国科学院空间应用工程与技术中心 | 汽轮机转子瞬态应力的检测方法 |
WO2019128475A1 (zh) * | 2017-12-29 | 2019-07-04 | 中兴通讯股份有限公司 | 数据训练方法及装置、存储介质、电子装置 |
CN110889492A (zh) * | 2019-11-25 | 2020-03-17 | 北京百度网讯科技有限公司 | 用于训练深度学习模型的方法和装置 |
WO2020113782A1 (zh) * | 2018-12-05 | 2020-06-11 | 清华大学深圳研究生院 | 基于数据分布的联合深度学习方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108198625B (zh) * | 2016-12-08 | 2021-07-20 | 推想医疗科技股份有限公司 | 一种分析高维医疗数据的深度学习方法和装置 |
JP6858082B2 (ja) * | 2017-06-07 | 2021-04-14 | Kddi株式会社 | 管理装置、管理方法、及びプログラム |
CN107316024B (zh) * | 2017-06-28 | 2021-06-29 | 北京博睿视科技有限责任公司 | 基于深度学习的周界报警算法 |
CN109005060B (zh) * | 2018-08-02 | 2022-01-25 | 上海交通大学 | 一种基于层级化高度异构分布式系统的深度学习应用优化框架 |
CN109299782B (zh) * | 2018-08-02 | 2021-11-12 | 奇安信科技集团股份有限公司 | 一种基于深度学习模型的数据处理方法及装置 |
CN110287175A (zh) * | 2019-05-19 | 2019-09-27 | 中国地质调查局西安地质调查中心 | 一种资源环境承载能力的大数据智能测定系统 |
CN112465030B (zh) * | 2020-11-28 | 2022-06-07 | 河南财政金融学院 | 一种基于两级迁移学习的多源异构信息融合故障诊断方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0438556A (ja) * | 1990-06-04 | 1992-02-07 | Takayama:Kk | データ処理装置 |
KR910020571A (ko) * | 1990-05-21 | 1991-12-20 | 다카도리 수나오 | 데이터 처리장치 |
JP2001022722A (ja) * | 1999-07-05 | 2001-01-26 | Nippon Telegr & Teleph Corp <Ntt> | 質的変数で条件付けられる数法則の発見方法及び装置及び質的変数で条件付けられる数法則の発見プログラムを格納した記憶媒体 |
JP2005237668A (ja) * | 2004-02-26 | 2005-09-08 | Kazuya Mera | コンピュータネットワークにおける感情を考慮した対話装置 |
WO2014205231A1 (en) * | 2013-06-19 | 2014-12-24 | The Regents Of The University Of Michigan | Deep learning framework for generic object detection |
CN103945533B (zh) * | 2014-05-15 | 2016-08-31 | 济南嘉科电子技术有限公司 | 基于大数据的无线实时位置定位方法 |
CN104102929B (zh) * | 2014-07-25 | 2017-05-03 | 哈尔滨工业大学 | 基于深度学习的高光谱遥感数据分类方法 |
-
2015
- 2015-03-13 CN CN201510111904.6A patent/CN106033554A/zh active Pending
- 2015-03-31 WO PCT/CN2015/075472 patent/WO2016145675A1/zh active Application Filing
- 2015-03-31 JP JP2017548135A patent/JP2018511870A/ja active Pending
- 2015-03-31 US US15/557,463 patent/US20180068215A1/en not_active Abandoned
- 2015-03-31 EP EP15885058.6A patent/EP3270329A4/en not_active Ceased
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522914A (zh) * | 2017-09-19 | 2019-03-26 | 中国科学院沈阳自动化研究所 | 一种基于图像的模型融合的神经网络结构训练方法 |
WO2019128475A1 (zh) * | 2017-12-29 | 2019-07-04 | 中兴通讯股份有限公司 | 数据训练方法及装置、存储介质、电子装置 |
CN109993299A (zh) * | 2017-12-29 | 2019-07-09 | 中兴通讯股份有限公司 | 数据训练方法及装置、存储介质、电子装置 |
CN109993299B (zh) * | 2017-12-29 | 2024-02-27 | 中兴通讯股份有限公司 | 数据训练方法及装置、存储介质、电子装置 |
CN109657285A (zh) * | 2018-11-27 | 2019-04-19 | 中国科学院空间应用工程与技术中心 | 汽轮机转子瞬态应力的检测方法 |
WO2020113782A1 (zh) * | 2018-12-05 | 2020-06-11 | 清华大学深圳研究生院 | 基于数据分布的联合深度学习方法 |
CN110889492A (zh) * | 2019-11-25 | 2020-03-17 | 北京百度网讯科技有限公司 | 用于训练深度学习模型的方法和装置 |
CN110889492B (zh) * | 2019-11-25 | 2022-03-08 | 北京百度网讯科技有限公司 | 用于训练深度学习模型的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US20180068215A1 (en) | 2018-03-08 |
WO2016145675A1 (zh) | 2016-09-22 |
EP3270329A4 (en) | 2018-04-04 |
JP2018511870A (ja) | 2018-04-26 |
EP3270329A1 (en) | 2018-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106033554A (zh) | 一种基于分段的两级深度学习模型的大数据处理方法 | |
CN106033555A (zh) | 基于满足k度稀疏约束的深度学习模型的大数据处理方法 | |
CN107526785B (zh) | 文本分类方法及装置 | |
US11804074B2 (en) | Method for recognizing facial expressions based on adversarial elimination | |
CN111144329B (zh) | 一种基于多标签的轻量快速人群计数方法 | |
CN109977250B (zh) | 融合语义信息和多级相似性的深度哈希图像检索方法 | |
CN108399421A (zh) | 一种基于词嵌入的深度零样本分类方法 | |
CN106779068A (zh) | 调整人工神经网络的方法和装置 | |
CN107506761A (zh) | 基于显著性学习卷积神经网络的脑部图像分割方法及系统 | |
Xia et al. | Fully dynamic inference with deep neural networks | |
CN108108354B (zh) | 一种基于深度学习的微博用户性别预测方法 | |
CN107273426B (zh) | 一种基于深度语义路径搜索的短文本聚类方法 | |
CN107145893A (zh) | 一种基于卷积深度网络的图像识别算法及系统 | |
CN106845329A (zh) | 一种基于深度卷积特征多通道金字塔池化的动作识别方法 | |
CN108765512B (zh) | 一种基于多层级特征的对抗图像生成方法 | |
US20220383127A1 (en) | Methods and systems for training a graph neural network using supervised contrastive learning | |
CN112990325B (zh) | 一种面向嵌入式实时视觉目标检测的轻型网络构建方法 | |
CN104951987B (zh) | 基于决策树的作物育种评价方法 | |
JP2018511870A5 (zh) | ||
CN109086802A (zh) | 一种基于八元数卷积神经网络的图像分类方法 | |
Qin et al. | Deep residual weight-sharing attention network with low-rank attention for visual question answering | |
CN110473195B (zh) | 一种可自动定制的医学病灶检测架构及方法 | |
CN109783799A (zh) | 一种基于语义依存图的关系提取方法 | |
CN116109920A (zh) | 一种基于Transformer的遥感图像建筑物提取方法 | |
Hussain et al. | Analysis of techniques for anfis rule-base minimization and accuracy maximization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161019 |