CN113009906A - 一种基于工业互联网的大数据预测分析方法及系统 - Google Patents
一种基于工业互联网的大数据预测分析方法及系统 Download PDFInfo
- Publication number
- CN113009906A CN113009906A CN202110239987.2A CN202110239987A CN113009906A CN 113009906 A CN113009906 A CN 113009906A CN 202110239987 A CN202110239987 A CN 202110239987A CN 113009906 A CN113009906 A CN 113009906A
- Authority
- CN
- China
- Prior art keywords
- data
- neural network
- time
- sub
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 claims abstract description 168
- 238000012545 processing Methods 0.000 claims abstract description 63
- 238000012937 correction Methods 0.000 claims abstract description 27
- 230000003993 interaction Effects 0.000 claims abstract description 10
- 238000013135 deep learning Methods 0.000 claims abstract description 7
- 108091006146 Channels Proteins 0.000 claims description 49
- 230000004927 fusion Effects 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 19
- 238000009826 distribution Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 239000002131 composite material Substances 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract description 8
- 238000011161 development Methods 0.000 abstract description 3
- 230000004913 activation Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 3
- 238000009776 industrial production Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101100208381 Caenorhabditis elegans tth-1 gene Proteins 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0259—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
- G05B23/0262—Confirmation of fault detection, e.g. extra checks to confirm that a failure has indeed occurred
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/24—Pc safety
- G05B2219/24065—Real time diagnostics
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于工业互联网的大数据预测分析方法,包括下列步骤,获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。本发明通过大数据预测分析方法实现工业大数据的分类或拟合,预测工业流程的发展趋势,从而能够提高决策的科学性;通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;通过正则化处理获取所述数据集中数据的原始属性之间的交互作用。
Description
技术领域
本发明涉及计算机、智能计算领域,尤其涉及一种设备数字孪生建模方法及系统。
背景技术
随着工业互联网技术的发展,基于工业物联网的大数据预测分析对于生产过程中的预测性维护、降低设备故障率、优化维护例程、降低生产成本以及超前客户服务等环节具有重要意义。
现有的预测及分析技术能够根据各类生产数据,进行一定的故障检测、异常抛出等预测分析,在要求不高的预测维护和生产异常监测场景,起到了积极的作用。然而对于预测实时性较高或大数据集时空不对称等场景,现有技术因为必须等待完整数据、单次预测参数过多导致预测机制和效率都无法适应需求。
例如,专利申请号为201811311398.5一种基于BP神经网络模型的故障预测方法及预测系统的对比文件,通过数据采集模块采集温度以及机内测试数据,将完整维度的数据经通用预处理后发送给故障预测单元,进行故障预测。参照对比文件的说明书附图2,输入由m维{x1,...xm}输入元构成,经过BP神经网络隐含层的激活输出和误差比对后,直接反馈修正网络参数,直到预测的数据符合样本数据的期望,这种技术对于数据维度完整、采样数据各元素不存在时空差异或对采样数据时空差异不敏感的情况下,能够发挥预测作用,一旦数据采集维度不同步或者数据各元素存在的时空差异会对性能需求造成影响时,则现有技术要么根据已过时的采集数据预测,要么等待数据维度完整后,再进行预测,前一种情况将导致预测准确度大大降低,后一种情况将造成预测实时性打折扣。
发明内容
本申请所要解决的技术问题是:当工业大数据超并发、存在采集不同步、数据元素存在时空差异的前提下,如何精准而又高实时性的展开数据预测分析。
为解决上述技术问题,本发明基于工业互联网的大数据预测分析方法,包括下列步骤,
S1.获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;
S2.将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。
进一步的,所述S1中,包括下列步骤,
S11.根据实际需求设定采集时间步长,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据,工业大数据以数据流的形式存在,描述为由连续的数据项{A1,A2,...}和时间戳ts组成;
本发明所述的工业大数据预测分析方法适用于所有工业数据的预测,可根据实际需求作相应的调整。
S12.构造特征池20,工业大数据流首先进入特征池20,所述特征池20用于从工业大数据中提取出有效数据信息,代表数据的近似特征,不同采集途径对应不同的特征池20;
S13.每个数据项的到达时间表示该数据项的时间戳,时间戳配置模块30使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳:
ts=(t+1)mod N其中,T表示时间戳,t表示数据到达的时间,mod为求余函数;当特征池20中的数据项的时间戳与新到达的数据项的时间戳相等时,表示两个数据项之间相差N个数据,即此数据项不在窗口中;设定只有在当前窗口中的数据项是有效数据,其余数据为无效数据,每个数据按照到达窗口的时间设置时间戳。
S14.正则化处理模块50对预处理后数据的特征属性进行正则化处理。
进一步的,所述S1中,修正移动模块40设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动:
所述趋势修正移动的有益效果为:通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度。
所述正则化处理的有益效果为:通过正则化处理获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则。
进一步的,所述S2中,包括下列步骤,
S21.所述分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据Xti∈{Xt1,Xt2,...,XtN}和空间序列数据Aj∈{A1,A2,AM},tN表示时间序列数据的数量,对于任一时间戳用ti表示;M表示采集途径的数量,对于任一采集途径用j表示,所述时间序列数据为同一时刻各采集途径直接获得的可联合进行数据预测分析的数据集;所述空间序列数据为不同采集途径的特征池20中,按照时间窗尺寸进行滑窗取样的数据集;
S22.大数据预测模块70构建大数据预测神经网络;
进一步的,所述大数据预测神经网络包括时间序列子神经网络、空间序列子神经网络和多特征融合子神经网络;时间序列子神经网络的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络和空间序列子神经网络的输出端连接多特征融合神经网络,作为多特征融合神经网络的输入,最终输出相应的预测结果。
进一步的,所述S22步骤中包括下列子步骤,
S221.所述时间序列子神经网络包括输入层、特征映射层、卷积复合层和池化层;
S222.所述空间序列子神经网络包括输入层、第一处理层、第二处理层和第三处理层;
S223.所述多特征融合子神经网络包括输入层、压缩层、输出层。
S224.针对时间序列子神经网络和空间序列子神经网络均建立以下损失函数:
利用反向传播算法训练时间序列子神经网络和空间序列子神经网络,调整时间序列子神经网络和空间序列子神经网络的权重参数,实现预测值与真实值的逼近过程,优化获得训练后的时间序列子神经网络和空间序列子神经网络;
利用训练后的时间序列子神经网络和空间序列子神经网络结合形成训练后的多特征融合子神经网络,将待测情况的参考变量参数数据输入到训练后的多特征融合子神经网络后输出预测获得目标变量参数。
所述大数据预测神经网络的有益效果为:采用时间序列子神经网络和空间序列子神经网络的深度学习可自发的从给定样本中提取大量的变量间空间关系和时间特征信息,无需依赖过多的流程工业生产信息。本发明只要提供给模型充分的训练样本集和测试样本集,深度学习模型便能有效的提取样本中包含的特征知识,并将特征进行融合压缩,最终通过输出层得到关键变量当前状态的预测值。然后通过反向传播误差对神经网络参数的不断调整优化,以不断提高预测准确率,最终完成工业大数据的预测。
本发明还涉及一种如上述基于工业互联网的大数据预测分析方法在机器学习中的应用。
本发明还涉及一种运行上述基于工业互联网的大数据预测分析系统,包括数据接入模块10、特征池20、时间戳配置模块30、修正移动模块40、正则化处理模块50、分流通道60和大数据预测模块70。
所述数据接入模块10设有定时器,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据;数据接入模块10通过数据连接的方式将接入的数据发送给特征池20;
所述特征池20,用于从工业大数据中提取出有效数据信息,代表数据的近似特征,特征池20通过数据连接的方式将特征属性发送给时间戳配置模块30和修正移动模块40;
所述时间戳配置模块30,用于使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳以数据连接的方式发送给修正移动模块40和大数据预测模块70;
所述修正移动模块40,用于设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;修正移动模块40将修正后的数据并与其对应的时间戳通过数据连接的方式将处理结果发送给正则化处理模块50;
所述正则化处理模块50,用于根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则;正则化处理通过数据连接的方式将处理结果发送给分流通道60;
所述分流通道60,包括时间序列通道601和空间序列通道602,用于对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;分流通道60根据数据的不同选择不同的通道以数据连接的方式发送给大数据预测模块70;
所述大数据预测模块70,用于构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703;时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的预测结果。
进一步的,所述数据接入模块10根据定时器定时接收工业大数据,将数据传输给特征池20;特征池20提取数据特征,将数据特征发送给时间戳配置模块30和修正移动模块40;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳发送给修正移动模块40和大数据预测模块70;修正移动模块40对数据进行两次趋势修正移动,并将修正后的数据与其对应的时间戳发送给正则化处理模块50;正则化处理模块50根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,将处理结果发送给分流通道60;分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;大数据预测模块70构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的数据分类或拟合预测结果。
本发明的有益效果是:
(1)通过大数据预测分析方法实现工业大数据的分类或拟合,预测工业流程的发展趋势,从而能够提高决策的科学性;
(2)通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;通过正则化处理获取所述数据集中数据的原始属性之间的交互作用。
(3)采用时间序列子神经网络和空间序列子神经网络的深度学习可自发的从给定样本中提取大量的变量间空间关系和时间特征信息,无需依赖过多的流程工业生产信息。本发明只要提供给模型充分的训练样本集和测试样本集,深度学习模型便能有效的提取样本中包含的特征知识,并将特征进行融合压缩,最终通过输出层得到关键变量当前状态的预测值。然后通过反向传播误差对神经网络参数的不断调整优化,以不断提高预测准确率,最终完成工业大数据的预测。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1本发明所述的基于工业互联网的大数据预测分析装置模型图。
图2本发明所述的大数据预测神经网络结构图。
具体实施方式
以下将结合本实施例中的附图来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
参照图1,本发明所述的大数据预测分析装置包括以下部分:
数据接入模块10、特征池20、时间戳配置模块30、修正移动模块40、正则化处理模块50、分流通道60和大数据预测模块70。
所述数据接入模块10设有定时器,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据;数据接入模块10通过数据连接的方式将接入的数据发送给特征池20;
所述特征池20,用于从工业大数据中提取出有效数据信息,代表数据的近似特征,所占内存远小于数据集的规模,不同采集途径对应不同的特征池20,所述特征提取方法采用现有技术。特征池20通过数据连接的方式将特征属性发送给时间戳配置模块30和修正移动模块40;
所述时间戳配置模块30,用于使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳以数据连接的方式发送给修正移动模块40和大数据预测模块70;
所述修正移动模块40,用于设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;修正移动模块40将修正后的数据并与其对应的时间戳通过数据连接的方式将处理结果发送给正则化处理模块50;
所述正则化处理模块50,用于根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则;正则化处理通过数据连接的方式将处理结果发送给分流通道60;
所述分流通道60,包括时间序列通道601和空间序列通道602,用于对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;分流通道60根据数据的不同选择不同的通道以数据连接的方式发送给大数据预测模块70;
所述大数据预测模块70,用于构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的预测结果。
数据接入模块10根据定时器定时接收工业大数据,将数据传输给特征池20;特征池20提取数据特征,将数据特征发送给时间戳配置模块30和修正移动模块40;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳发送给修正移动模块40和大数据预测模块70;修正移动模块40对数据进行两次趋势修正移动,并将修正后的数据与其对应的时间戳发送给正则化处理模块50;正则化处理模块50根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,将处理结果发送给分流通道60;分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;大数据预测模块70构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的分类或拟合预测结果。
本发明所述基于工业互联网的大数据预测分析方法包括:
S1.获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;
S11.根据实际需求设定采集时间步长,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据,采集途径包括但不限于传感器、RFID技术、网络爬虫等。工业大数据以数据流的形式存在,可以描述为由连续的数据项{A1,A2,...}和时间戳ts组成,数据项连续不断的流入,每个数据项可能包含多维属性。本发明所述的工业大数据预测分析方法适用于所有工业数据的预测,可根据实际需求作相应的调整。
所述工业大数据是在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据。
S12.由于工业大数据的无限性,无法在内存中构建一个存储全部的数据对其进行处理,因此本发明构造了特征池20。当工业大数据流入本发明所述的大数据预测分析装置时,首先进入特征池20。所述特征池20用于从工业大数据中提取出有效数据信息,代表数据的近似特征,所占内存远小于数据集的规模,不同采集途径对应不同的特征池20。所述特征池20的特征提取方法现有技术已较为成熟,本发明在此不做过多阐述。随着数据的不断流入,特征池20会实时更新。
所述修正移动模块40设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动:
所述趋势修正移动的有益效果为:通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度。
S13.每个数据项的到达时间表示该数据项的时间戳,但由于工业大数据数量过多,不适合用数字递增表达无限的数据流,因此,本发明所述时间戳配置模块30使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳:
ts=(t+1)mod N
其中,T表示时间戳,t表示数据到达的时间,mod为求余函数。当特征池20中的数据项的时间戳与新到达的数据项的时间戳相等时,表示两个数据项之间相差N个数据,即此数据项不在窗口中。本发明设定只有在当前窗口中的数据项是有效数据,其余数据为无效数据,每个数据按照到达窗口的时间设置时间戳。
所述正则化处理的有益效果为:通过正则化处理获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则。
S2.将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。
S21.所述分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据Xti∈{Xt1,Xt2,...,XtN}和空间序列数据Aj∈{A1,A2,AM},tN表示时间序列数据的数量,对于任一时间戳用ti表示;M表示采集途径的数量,对于任一采集途径用j表示。所述时间序列数据为同一时刻各采集途径直接获得的可联合进行数据预测分析的数据集;所述空间序列数据为不同采集途径的特征池20中,按照时间窗尺寸进行滑窗取样的数据集。
S22.所述大数据预测模块70构建大数据预测神经网络,主要包括时间序列子神经网络、空间序列子神经网络和多特征融合子神经网络,如图2所示。时间序列子神经网络的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络和空间序列子神经网络的输出端连接多特征融合神经网络,作为多特征融合神经网络的输入,最终输出相应的预测结果。
S221.所述时间序列子神经网络包括输入层、特征映射层、卷积复合层和池化层;
输入层对输入的时间序列数据进行归一化处理,以消除各个子序列之间的量纲关系,所述归一化处理方法采用现有技术,本发明在此不做过多阐述。输入层将归一化处理后的数据发送给特征映射层;
特征映射层包括多个映射通道,每条映射通道可传输相邻两个时间戳的数据,经过映射通道将特征映射到特征空间中,计算公式如下:
其中,α0是映射参数,αi和cr分别是第ti时间戳数据和第ti-1时间戳数据的激活因子,ni是第ti时间戳数据含有的特征属性的数量,ni-1是第ti-1时间戳数据含有的特征属性的数量,是第ti时间戳数据Xti的第i个特征,第ti-1时间戳数据Xti-1的第r个特征。经过映射通道映射到特征空间后,特征映射层将特征输出给卷积复合层。
卷积复合层对特征空间中相邻两个时间戳数据的特征进行复合处理,并用激活函数对其激活,计算公式如下:
Cti=f(ωti*Sti-1+bti)=μ(1+exp(ωti*Sti-1+bti))-1
其中,Cti是卷积复合层第ti时间戳数据的输出,通过非线性激活函数f获得第ti时间戳数据的复合特征Cti,ωti表示第ti时间戳数据的共享权重,与第ti-1时间戳数据的特征Sti-1进行卷积操作,*是卷积运算符号,bti是第ti时间戳数据的偏置向量,μ是激活因子。卷积复合层将复合后的结果发送给池化层。
池化层对复合后的特征进行压缩,减小过拟合,池化层的输出为特征空间的数据维度特征数据:
S222.所述空间序列子神经网络包括输入层、第一处理层、第二处理层和第三处理层。
输入层对输入的空间序列数据进行归一化处理,以消除各个子序列之间的量纲关系,所述归一化处理方法采用现有技术,本发明在此不做过多阐述。输入层将归一化处理后的数据发送给第一处理层;
第一处理层对空间序列数据进行激活,计算公式如下:
其中,Kj表示第一处理层的输出,ωj表示第一处理层的权值,α表示第一处理参数,hj-1为空间序列数据特征状态值,初始值从[0,1]随机选择一个数值,bj表示第一处理层的偏置。第一处理层将计算结果输出给第二处理层。
第二处理层中设有映射阈值,所述映射阈值根据实际计算情况确定。第二处理层对空间序列数据特征状态值进行迭代更新,直至连续两个神经元的输出之差小于映射阈值。
第三处理层通过激活函数将映射后的相邻两个数据特征进行加权融合,计算公式如下:Rj=g(Wj·[hj-1,hj])
其中,Rj是第三处理层的输出,Wj为融合权值,g为激活函数,可根据实际需求选择已有激活函数,本发明在此不做限制。第三处理层将结果输出给多特征融合子神经网络的输入层。
S223.所述多特征融合子神经网络包括输入层、压缩层、输出层。
输入层接收时间序列子神经网络和空间序列子神经网络发送的高维度特征数据,将两项数据相加并联以向量的形式发送给压缩层。
压缩层将合并后的数据压缩成一维数据后输入最后的输出层,所述数据压缩方法采用现有技术,本发明在此不做过多限制。输出层将压缩后的数据输出。由此将相同样本数的高维特征数据合并,把空间维度的特征与时间维度的特征全部映射到高维的特征空间中,将这些数据最后输入多特征融合子神经网络中输出相应的预测结果。
S224.针对时间序列子神经网络和空间序列子神经网络均建立以下损失函数:
利用反向传播算法训练时间序列子神经网络和空间序列子神经网络,调整时间序列子神经网络和空间序列子神经网络的权重参数,实现预测值与真实值的逼近过程,优化获得训练后的时间序列子神经网络和空间序列子神经网络;
利用训练后的时间序列子神经网络和空间序列子神经网络结合形成训练后的多特征融合子神经网络,将待测情况的参考变量参数数据输入到训练后的多特征融合子神经网络后输出预测获得目标变量参数。
所述大数据预测神经网络的有益效果为:采用时间序列子神经网络和空间序列子神经网络的深度学习可自发的从给定样本中提取大量的变量间空间关系和时间特征信息,无需依赖过多的流程工业生产信息。本发明只要提供给模型充分的训练样本集和测试样本集,深度学习模型便能有效的提取样本中包含的特征知识,并将特征进行融合压缩,最终通过输出层得到关键变量当前状态的预测值。然后通过反向传播误差对神经网络参数的不断调整优化,以不断提高预测准确率,最终完成工业大数据的预测。
综上所述,便完成了本发明所述的基于工业互联网的大数据预测分析方法及装置。
以上所述仅为本发明的较佳实施例,并不用于限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于工业互联网的大数据预测分析方法,其特征在于:包括下列步骤,
S1.获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;
S2.将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。
2.按照权利要求1所述的基于工业互联网的大数据预测分析方法,其特征在于:所述S1中,包括下列步骤,
S11.根据实际需求设定采集时间步长,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据,工业大数据以数据流的形式存在,描述为由连续的数据项{A1,A2,...}和时间戳ts组成,
S12.构造特征池20,工业大数据流首先进入特征池20,所述特征池20用于从工业大数据中提取出有效数据信息,代表数据的近似特征,不同采集途径对应不同的特征池20;
S13.每个数据项的到达时间表示该数据项的时间戳,时间戳配置模块30使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳:
ts=(t+1)mod N
其中,T表示时间戳,t表示数据到达的时间,mod为求余函数;当特征池20中的数据项的时间戳与新到达的数据项的时间戳相等时,表示两个数据项之间相差N个数据,即此数据项不在窗口中;设定只有在当前窗口中的数据项是有效数据,其余数据为无效数据,每个数据按照到达窗口的时间设置时间戳。
S14.正则化处理模块50对预处理后数据的特征属性进行正则化处理。
5.按照权利要求2所述的基于工业互联网的大数据预测分析方法,其特征在于:所述S2中,包括下列步骤,
S21.所述分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据Xti∈{Xt1,Xt2,XtN}和空间序列数据Aj∈{A1,A2,AM},tN表示时间序列数据的数量,对于任一时间戳用ti表示;M表示采集途径的数量,对于任一采集途径用j表示,所述时间序列数据为同一时刻各采集途径直接获得的可联合进行数据预测分析的数据集;所述空间序列数据为不同采集途径的特征池20中,按照时间窗尺寸进行滑窗取样的数据集;
S22.大数据预测模块70构建大数据预测神经网络。
6.按照权利要求5所述的基于工业互联网的大数据预测分析方法,其特征在于:所述大数据预测神经网络包括时间序列子神经网络、空间序列子神经网络和多特征融合子神经网络;时间序列子神经网络的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络和空间序列子神经网络的输出端连接多特征融合神经网络,作为多特征融合神经网络的输入,最终输出相应的预测结果。
7.按照权利要求5或6所述的基于工业互联网的大数据预测分析方法,其特征在于:所述S22步骤中包括下列子步骤,
S221.所述时间序列子神经网络包括输入层、特征映射层、卷积复合层和池化层;
S222.所述空间序列子神经网络包括输入层、第一处理层、第二处理层和第三处理层;
S223.所述多特征融合子神经网络包括输入层、压缩层、输出层。
S224.针对时间序列子神经网络和空间序列子神经网络均建立以下损失函数:
利用反向传播算法训练时间序列子神经网络和空间序列子神经网络,调整时间序列子神经网络和空间序列子神经网络的权重参数,实现预测值与真实值的逼近过程,优化获得训练后的时间序列子神经网络和空间序列子神经网络;
利用训练后的时间序列子神经网络和空间序列子神经网络结合形成训练后的多特征融合子神经网络,将待测情况的参考变量参数数据输入到训练后的多特征融合子神经网络后输出预测获得目标变量参数。
8.一种如权利要求1-7任意一项所述基于工业互联网的大数据预测分析方法在机器学习中的应用。
9.一种运行权利要求1-7任意一项基于工业互联网的大数据预测分析系统,其特征在于:包括
数据接入模块10、特征池20、时间戳配置模块30、修正移动模块40、正则化处理模块50、分流通道60和大数据预测模块70。
所述数据接入模块10设有定时器,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据;数据接入模块10通过数据连接的方式将接入的数据发送给特征池20;
所述特征池20,用于从工业大数据中提取出有效数据信息,代表数据的近似特征,特征池20通过数据连接的方式将特征属性发送给时间戳配置模块30和修正移动模块40;
所述时间戳配置模块30,用于使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳以数据连接的方式发送给修正移动模块40和大数据预测模块70;
所述修正移动模块40,用于设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;修正移动模块40将修正后的数据并与其对应的时间戳通过数据连接的方式将处理结果发送给正则化处理模块50;
所述正则化处理模块50,用于根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则;正则化处理通过数据连接的方式将处理结果发送给分流通道60;
所述分流通道60,包括时间序列通道601和空间序列通道602,用于对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;分流通道60根据数据的不同选择不同的通道以数据连接的方式发送给大数据预测模块70;
所述大数据预测模块70,用于构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703;时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的预测结果。
10.按照权利要求9所述的基于工业互联网的大数据预测分析系统,其特征在于:所述数据接入模块10根据定时器定时接收工业大数据,将数据传输给特征池20;特征池20提取数据特征,将数据特征发送给时间戳配置模块30和修正移动模块40;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳发送给修正移动模块40和大数据预测模块70;修正移动模块40对数据进行两次趋势修正移动,并将修正后的数据与其对应的时间戳发送给正则化处理模块50;正则化处理模块50根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,将处理结果发送给分流通道60;分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;大数据预测模块70构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的数据分类或拟合预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110239987.2A CN113009906B (zh) | 2021-03-04 | 2021-03-04 | 一种基于工业互联网的大数据预测分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110239987.2A CN113009906B (zh) | 2021-03-04 | 2021-03-04 | 一种基于工业互联网的大数据预测分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113009906A true CN113009906A (zh) | 2021-06-22 |
CN113009906B CN113009906B (zh) | 2022-08-02 |
Family
ID=76405180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110239987.2A Active CN113009906B (zh) | 2021-03-04 | 2021-03-04 | 一种基于工业互联网的大数据预测分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113009906B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117391071A (zh) * | 2023-12-04 | 2024-01-12 | 中电科大数据研究院有限公司 | 一种新闻话题数据挖掘方法、装置及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101839733A (zh) * | 2010-05-13 | 2010-09-22 | 重庆工业自动化仪表研究所 | 一体化多参数水质在线监测装置及其控制方法 |
CN103776480A (zh) * | 2014-01-29 | 2014-05-07 | 清华大学 | 基于多次移动平均的微小故障检测方法和装置 |
US20160034111A1 (en) * | 2014-07-31 | 2016-02-04 | Adobe Systems Incorporated | Method and apparatus for providing a contextual timeline of an online interaction for use in assessing effectiveness |
CN105468450A (zh) * | 2015-12-29 | 2016-04-06 | 华为技术有限公司 | 任务调度方法及系统 |
US20190354853A1 (en) * | 2018-05-21 | 2019-11-21 | Fair Isaac Corporation | System and method for generating explainable latent features of machine learning models |
CN110493362A (zh) * | 2019-08-22 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 请求量控制方法、装置、存储介质和计算机设备 |
CN110728324A (zh) * | 2019-10-12 | 2020-01-24 | 西安电子科技大学 | 基于深度复值全卷积神经网络的极化sar图像分类方法 |
CN111476274A (zh) * | 2020-03-16 | 2020-07-31 | 宜通世纪科技股份有限公司 | 一种大数据预测分析的方法、系统、装置及存储介质 |
CN111881000A (zh) * | 2020-08-07 | 2020-11-03 | 广州云从博衍智能科技有限公司 | 一种故障预测方法、装置、设备及机器可读介质 |
CN112001527A (zh) * | 2020-07-29 | 2020-11-27 | 中国计量大学 | 多特征融合深度神经网络的工业生产过程目标数据预测方法 |
CN112380308A (zh) * | 2020-11-17 | 2021-02-19 | 中国地质科学院矿产资源研究所 | 一种基于数据正则化的地球化学异常圈定方法及系统 |
-
2021
- 2021-03-04 CN CN202110239987.2A patent/CN113009906B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101839733A (zh) * | 2010-05-13 | 2010-09-22 | 重庆工业自动化仪表研究所 | 一体化多参数水质在线监测装置及其控制方法 |
CN103776480A (zh) * | 2014-01-29 | 2014-05-07 | 清华大学 | 基于多次移动平均的微小故障检测方法和装置 |
US20160034111A1 (en) * | 2014-07-31 | 2016-02-04 | Adobe Systems Incorporated | Method and apparatus for providing a contextual timeline of an online interaction for use in assessing effectiveness |
CN105468450A (zh) * | 2015-12-29 | 2016-04-06 | 华为技术有限公司 | 任务调度方法及系统 |
US20190354853A1 (en) * | 2018-05-21 | 2019-11-21 | Fair Isaac Corporation | System and method for generating explainable latent features of machine learning models |
CN110493362A (zh) * | 2019-08-22 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 请求量控制方法、装置、存储介质和计算机设备 |
CN110728324A (zh) * | 2019-10-12 | 2020-01-24 | 西安电子科技大学 | 基于深度复值全卷积神经网络的极化sar图像分类方法 |
CN111476274A (zh) * | 2020-03-16 | 2020-07-31 | 宜通世纪科技股份有限公司 | 一种大数据预测分析的方法、系统、装置及存储介质 |
CN112001527A (zh) * | 2020-07-29 | 2020-11-27 | 中国计量大学 | 多特征融合深度神经网络的工业生产过程目标数据预测方法 |
CN111881000A (zh) * | 2020-08-07 | 2020-11-03 | 广州云从博衍智能科技有限公司 | 一种故障预测方法、装置、设备及机器可读介质 |
CN112380308A (zh) * | 2020-11-17 | 2021-02-19 | 中国地质科学院矿产资源研究所 | 一种基于数据正则化的地球化学异常圈定方法及系统 |
Non-Patent Citations (2)
Title |
---|
李征,房宏才,柯熙政,李芳,王燕宁: "滑动平均法在MEMS陀螺信号趋势项提取中的应用", 《电子测量与仪器学报》 * |
白建社,盛戈皞,江秀臣,曾奕: "基于移动时间窗的直流局部放电特征提取方法", 《电力系统自动化》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117391071A (zh) * | 2023-12-04 | 2024-01-12 | 中电科大数据研究院有限公司 | 一种新闻话题数据挖掘方法、装置及存储介质 |
CN117391071B (zh) * | 2023-12-04 | 2024-02-27 | 中电科大数据研究院有限公司 | 一种新闻话题数据挖掘方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113009906B (zh) | 2022-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ren et al. | TBSM: A traffic burst-sensitive model for short-term prediction under special events | |
Laredo et al. | A neural network-evolutionary computational framework for remaining useful life estimation of mechanical systems | |
US20190034497A1 (en) | Data2Data: Deep Learning for Time Series Representation and Retrieval | |
Tan et al. | Multi-node load forecasting based on multi-task learning with modal feature extraction | |
Deng et al. | A multi-view multi-task learning framework for multi-variate time series forecasting | |
CN115688035A (zh) | 一种基于自监督学习的时序电力数据异常检测方法 | |
Chan et al. | Tool wear prediction using convolutional bidirectional LSTM networks | |
CN114519610A (zh) | 信息预测方法以及装置 | |
CN117041017B (zh) | 数据中心的智能运维管理方法及系统 | |
CN116340796B (zh) | 时序数据分析方法、装置、设备及存储介质 | |
CN117094451B (zh) | 一种耗电量的预测方法、装置及终端 | |
GB2620602A (en) | Training of a machine learning model for predictive maintenance tasks | |
Hu et al. | Multi-attention based spatial-temporal graph convolution networks for traffic flow forecasting | |
CN113009906B (zh) | 一种基于工业互联网的大数据预测分析方法及系统 | |
Li et al. | FlashST: A Simple and Universal Prompt-Tuning Framework for Traffic Prediction | |
Zhu et al. | MR-Transformer: Multiresolution Transformer for Multivariate Time Series Prediction | |
Zhang et al. | LIFE: Learning individual features for multivariate time series prediction with missing values | |
CN118093996A (zh) | 基于深度学习的线下智能家居用户画像构建方法及系统 | |
CN117236666B (zh) | 应急物资需求分析方法及系统 | |
Wu et al. | Custom machine learning architectures: towards realtime anomaly detection for flight testing | |
CN112927507A (zh) | 一种基于LSTM-Attention的交通流量预测方法 | |
CN117371573A (zh) | 基于TrAdaBoost-LSTM的时间序列预测方法、装置及介质 | |
Li et al. | Multiscale Feature Extension Enhanced Deep Global-Local Attention Network for Remaining Useful Life Prediction | |
Xu et al. | Multi‐Dimensional Attention Based Spatial‐Temporal Networks for Traffic Forecasting | |
CN114997292B (zh) | 基于空间重构注意力模型的数字孪生扶梯寿命预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |