Nothing Special   »   [go: up one dir, main page]

CN113009906A - 一种基于工业互联网的大数据预测分析方法及系统 - Google Patents

一种基于工业互联网的大数据预测分析方法及系统 Download PDF

Info

Publication number
CN113009906A
CN113009906A CN202110239987.2A CN202110239987A CN113009906A CN 113009906 A CN113009906 A CN 113009906A CN 202110239987 A CN202110239987 A CN 202110239987A CN 113009906 A CN113009906 A CN 113009906A
Authority
CN
China
Prior art keywords
data
neural network
time
sub
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110239987.2A
Other languages
English (en)
Other versions
CN113009906B (zh
Inventor
白艳
郑超
赵传奇
郑立兵
王超
闫志旭
胡建平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Wangong Information Technology Co ltd
Original Assignee
Qingdao Wangong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Wangong Information Technology Co ltd filed Critical Qingdao Wangong Information Technology Co ltd
Priority to CN202110239987.2A priority Critical patent/CN113009906B/zh
Publication of CN113009906A publication Critical patent/CN113009906A/zh
Application granted granted Critical
Publication of CN113009906B publication Critical patent/CN113009906B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0262Confirmation of fault detection, e.g. extra checks to confirm that a failure has indeed occurred
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于工业互联网的大数据预测分析方法,包括下列步骤,获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。本发明通过大数据预测分析方法实现工业大数据的分类或拟合,预测工业流程的发展趋势,从而能够提高决策的科学性;通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;通过正则化处理获取所述数据集中数据的原始属性之间的交互作用。

Description

一种基于工业互联网的大数据预测分析方法及系统
技术领域
本发明涉及计算机、智能计算领域,尤其涉及一种设备数字孪生建模方法及系统。
背景技术
随着工业互联网技术的发展,基于工业物联网的大数据预测分析对于生产过程中的预测性维护、降低设备故障率、优化维护例程、降低生产成本以及超前客户服务等环节具有重要意义。
现有的预测及分析技术能够根据各类生产数据,进行一定的故障检测、异常抛出等预测分析,在要求不高的预测维护和生产异常监测场景,起到了积极的作用。然而对于预测实时性较高或大数据集时空不对称等场景,现有技术因为必须等待完整数据、单次预测参数过多导致预测机制和效率都无法适应需求。
例如,专利申请号为201811311398.5一种基于BP神经网络模型的故障预测方法及预测系统的对比文件,通过数据采集模块采集温度以及机内测试数据,将完整维度的数据经通用预处理后发送给故障预测单元,进行故障预测。参照对比文件的说明书附图2,输入由m维{x1,...xm}输入元构成,经过BP神经网络隐含层的激活输出和误差比对后,直接反馈修正网络参数,直到预测的数据符合样本数据的期望,这种技术对于数据维度完整、采样数据各元素不存在时空差异或对采样数据时空差异不敏感的情况下,能够发挥预测作用,一旦数据采集维度不同步或者数据各元素存在的时空差异会对性能需求造成影响时,则现有技术要么根据已过时的采集数据预测,要么等待数据维度完整后,再进行预测,前一种情况将导致预测准确度大大降低,后一种情况将造成预测实时性打折扣。
发明内容
本申请所要解决的技术问题是:当工业大数据超并发、存在采集不同步、数据元素存在时空差异的前提下,如何精准而又高实时性的展开数据预测分析。
为解决上述技术问题,本发明基于工业互联网的大数据预测分析方法,包括下列步骤,
S1.获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;
S2.将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。
进一步的,所述S1中,包括下列步骤,
S11.根据实际需求设定采集时间步长,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据,工业大数据以数据流的形式存在,描述为由连续的数据项{A1,A2,...}和时间戳ts组成;
本发明所述的工业大数据预测分析方法适用于所有工业数据的预测,可根据实际需求作相应的调整。
S12.构造特征池20,工业大数据流首先进入特征池20,所述特征池20用于从工业大数据中提取出有效数据信息,代表数据的近似特征,不同采集途径对应不同的特征池20;
S13.每个数据项的到达时间表示该数据项的时间戳,时间戳配置模块30使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳:
ts=(t+1)mod N其中,T表示时间戳,t表示数据到达的时间,mod为求余函数;当特征池20中的数据项的时间戳与新到达的数据项的时间戳相等时,表示两个数据项之间相差N个数据,即此数据项不在窗口中;设定只有在当前窗口中的数据项是有效数据,其余数据为无效数据,每个数据按照到达窗口的时间设置时间戳。
S14.正则化处理模块50对预处理后数据的特征属性进行正则化处理。
进一步的,所述S1中,修正移动模块40设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动:
Figure BDA0002961820550000021
其中,
Figure BDA0002961820550000022
为t时刻获取的初始数据,
Figure BDA0002961820550000023
为第一次趋势修正移动后的t时刻的数据,
Figure BDA0002961820550000024
为第二次趋势修正移动后的t时刻的数据,N为时间跨度,从t时刻开始向前选择N个数据。
所述趋势修正移动的有益效果为:通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度。
进一步的,设立处理后的数据为
Figure BDA0002961820550000025
n为该数据的特征数量,正则化处理公式为:
Figure BDA0002961820550000031
其中,
Figure BDA0002961820550000032
表示对
Figure BDA0002961820550000033
进行正则化处理,
Figure BDA0002961820550000034
为Xts的第i个特征属性,i∈n,
Figure BDA0002961820550000035
Figure BDA0002961820550000036
分别表示第i个特征属性的数据分布的δ分位数。
所述正则化处理的有益效果为:通过正则化处理获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则。
进一步的,所述S2中,包括下列步骤,
S21.所述分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据Xti∈{Xt1,Xt2,...,XtN}和空间序列数据Aj∈{A1,A2,AM},tN表示时间序列数据的数量,对于任一时间戳用ti表示;M表示采集途径的数量,对于任一采集途径用j表示,所述时间序列数据为同一时刻各采集途径直接获得的可联合进行数据预测分析的数据集;所述空间序列数据为不同采集途径的特征池20中,按照时间窗尺寸进行滑窗取样的数据集;
S22.大数据预测模块70构建大数据预测神经网络;
进一步的,所述大数据预测神经网络包括时间序列子神经网络、空间序列子神经网络和多特征融合子神经网络;时间序列子神经网络的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络和空间序列子神经网络的输出端连接多特征融合神经网络,作为多特征融合神经网络的输入,最终输出相应的预测结果。
进一步的,所述S22步骤中包括下列子步骤,
S221.所述时间序列子神经网络包括输入层、特征映射层、卷积复合层和池化层;
S222.所述空间序列子神经网络包括输入层、第一处理层、第二处理层和第三处理层;
S223.所述多特征融合子神经网络包括输入层、压缩层、输出层。
S224.针对时间序列子神经网络和空间序列子神经网络均建立以下损失函数:
Figure BDA0002961820550000037
其中,Loss表示预测值与实际值之间的误差,m表示时间序列子神经网络中的时间戳数量和空间序列子神经网络中的采集途径数量,yi表示第i个实际值,
Figure BDA0002961820550000038
表示第i个预测值;
利用反向传播算法训练时间序列子神经网络和空间序列子神经网络,调整时间序列子神经网络和空间序列子神经网络的权重参数,实现预测值与真实值的逼近过程,优化获得训练后的时间序列子神经网络和空间序列子神经网络;
利用训练后的时间序列子神经网络和空间序列子神经网络结合形成训练后的多特征融合子神经网络,将待测情况的参考变量参数数据输入到训练后的多特征融合子神经网络后输出预测获得目标变量参数。
所述大数据预测神经网络的有益效果为:采用时间序列子神经网络和空间序列子神经网络的深度学习可自发的从给定样本中提取大量的变量间空间关系和时间特征信息,无需依赖过多的流程工业生产信息。本发明只要提供给模型充分的训练样本集和测试样本集,深度学习模型便能有效的提取样本中包含的特征知识,并将特征进行融合压缩,最终通过输出层得到关键变量当前状态的预测值。然后通过反向传播误差对神经网络参数的不断调整优化,以不断提高预测准确率,最终完成工业大数据的预测。
本发明还涉及一种如上述基于工业互联网的大数据预测分析方法在机器学习中的应用。
本发明还涉及一种运行上述基于工业互联网的大数据预测分析系统,包括数据接入模块10、特征池20、时间戳配置模块30、修正移动模块40、正则化处理模块50、分流通道60和大数据预测模块70。
所述数据接入模块10设有定时器,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据;数据接入模块10通过数据连接的方式将接入的数据发送给特征池20;
所述特征池20,用于从工业大数据中提取出有效数据信息,代表数据的近似特征,特征池20通过数据连接的方式将特征属性发送给时间戳配置模块30和修正移动模块40;
所述时间戳配置模块30,用于使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳以数据连接的方式发送给修正移动模块40和大数据预测模块70;
所述修正移动模块40,用于设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;修正移动模块40将修正后的数据并与其对应的时间戳通过数据连接的方式将处理结果发送给正则化处理模块50;
所述正则化处理模块50,用于根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则;正则化处理通过数据连接的方式将处理结果发送给分流通道60;
所述分流通道60,包括时间序列通道601和空间序列通道602,用于对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;分流通道60根据数据的不同选择不同的通道以数据连接的方式发送给大数据预测模块70;
所述大数据预测模块70,用于构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703;时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的预测结果。
进一步的,所述数据接入模块10根据定时器定时接收工业大数据,将数据传输给特征池20;特征池20提取数据特征,将数据特征发送给时间戳配置模块30和修正移动模块40;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳发送给修正移动模块40和大数据预测模块70;修正移动模块40对数据进行两次趋势修正移动,并将修正后的数据与其对应的时间戳发送给正则化处理模块50;正则化处理模块50根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,将处理结果发送给分流通道60;分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;大数据预测模块70构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的数据分类或拟合预测结果。
本发明的有益效果是:
(1)通过大数据预测分析方法实现工业大数据的分类或拟合,预测工业流程的发展趋势,从而能够提高决策的科学性;
(2)通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;通过正则化处理获取所述数据集中数据的原始属性之间的交互作用。
(3)采用时间序列子神经网络和空间序列子神经网络的深度学习可自发的从给定样本中提取大量的变量间空间关系和时间特征信息,无需依赖过多的流程工业生产信息。本发明只要提供给模型充分的训练样本集和测试样本集,深度学习模型便能有效的提取样本中包含的特征知识,并将特征进行融合压缩,最终通过输出层得到关键变量当前状态的预测值。然后通过反向传播误差对神经网络参数的不断调整优化,以不断提高预测准确率,最终完成工业大数据的预测。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1本发明所述的基于工业互联网的大数据预测分析装置模型图。
图2本发明所述的大数据预测神经网络结构图。
具体实施方式
以下将结合本实施例中的附图来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
参照图1,本发明所述的大数据预测分析装置包括以下部分:
数据接入模块10、特征池20、时间戳配置模块30、修正移动模块40、正则化处理模块50、分流通道60和大数据预测模块70。
所述数据接入模块10设有定时器,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据;数据接入模块10通过数据连接的方式将接入的数据发送给特征池20;
所述特征池20,用于从工业大数据中提取出有效数据信息,代表数据的近似特征,所占内存远小于数据集的规模,不同采集途径对应不同的特征池20,所述特征提取方法采用现有技术。特征池20通过数据连接的方式将特征属性发送给时间戳配置模块30和修正移动模块40;
所述时间戳配置模块30,用于使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳以数据连接的方式发送给修正移动模块40和大数据预测模块70;
所述修正移动模块40,用于设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;修正移动模块40将修正后的数据并与其对应的时间戳通过数据连接的方式将处理结果发送给正则化处理模块50;
所述正则化处理模块50,用于根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则;正则化处理通过数据连接的方式将处理结果发送给分流通道60;
所述分流通道60,包括时间序列通道601和空间序列通道602,用于对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;分流通道60根据数据的不同选择不同的通道以数据连接的方式发送给大数据预测模块70;
所述大数据预测模块70,用于构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的预测结果。
数据接入模块10根据定时器定时接收工业大数据,将数据传输给特征池20;特征池20提取数据特征,将数据特征发送给时间戳配置模块30和修正移动模块40;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳发送给修正移动模块40和大数据预测模块70;修正移动模块40对数据进行两次趋势修正移动,并将修正后的数据与其对应的时间戳发送给正则化处理模块50;正则化处理模块50根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,将处理结果发送给分流通道60;分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;大数据预测模块70构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的分类或拟合预测结果。
本发明所述基于工业互联网的大数据预测分析方法包括:
S1.获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;
S11.根据实际需求设定采集时间步长,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据,采集途径包括但不限于传感器、RFID技术、网络爬虫等。工业大数据以数据流的形式存在,可以描述为由连续的数据项{A1,A2,...}和时间戳ts组成,数据项连续不断的流入,每个数据项可能包含多维属性。本发明所述的工业大数据预测分析方法适用于所有工业数据的预测,可根据实际需求作相应的调整。
所述工业大数据是在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据。
S12.由于工业大数据的无限性,无法在内存中构建一个存储全部的数据对其进行处理,因此本发明构造了特征池20。当工业大数据流入本发明所述的大数据预测分析装置时,首先进入特征池20。所述特征池20用于从工业大数据中提取出有效数据信息,代表数据的近似特征,所占内存远小于数据集的规模,不同采集途径对应不同的特征池20。所述特征池20的特征提取方法现有技术已较为成熟,本发明在此不做过多阐述。随着数据的不断流入,特征池20会实时更新。
所述修正移动模块40设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动:
Figure BDA0002961820550000081
其中,
Figure BDA0002961820550000082
为t时刻获取的初始数据,
Figure BDA0002961820550000083
为第一次趋势修正移动后的t时刻的数据,
Figure BDA0002961820550000084
为第二次趋势修正移动后的t时刻的数据,N为时间跨度,从t时刻开始向前选择N个数据。
所述趋势修正移动的有益效果为:通过对数据特征进行趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度。
S13.每个数据项的到达时间表示该数据项的时间戳,但由于工业大数据数量过多,不适合用数字递增表达无限的数据流,因此,本发明所述时间戳配置模块30使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳:
ts=(t+1)mod N
其中,T表示时间戳,t表示数据到达的时间,mod为求余函数。当特征池20中的数据项的时间戳与新到达的数据项的时间戳相等时,表示两个数据项之间相差N个数据,即此数据项不在窗口中。本发明设定只有在当前窗口中的数据项是有效数据,其余数据为无效数据,每个数据按照到达窗口的时间设置时间戳。
S14.所述正则化处理模块50对预处理后数据的特征属性进行正则化处理,设立处理后的数据为
Figure BDA0002961820550000091
n为该数据的特征数量,所述正则化处理公式为:
Figure BDA0002961820550000092
其中,
Figure BDA0002961820550000093
表示对
Figure BDA0002961820550000094
进行正则化处理,
Figure BDA0002961820550000095
为Xts的第i个特征属性,i∈n,
Figure BDA0002961820550000096
Figure BDA0002961820550000097
分别表示第i个特征属性的数据分布的δ分位数。
所述正则化处理的有益效果为:通过正则化处理获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则。
S2.将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。
S21.所述分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据Xti∈{Xt1,Xt2,...,XtN}和空间序列数据Aj∈{A1,A2,AM},tN表示时间序列数据的数量,对于任一时间戳用ti表示;M表示采集途径的数量,对于任一采集途径用j表示。所述时间序列数据为同一时刻各采集途径直接获得的可联合进行数据预测分析的数据集;所述空间序列数据为不同采集途径的特征池20中,按照时间窗尺寸进行滑窗取样的数据集。
S22.所述大数据预测模块70构建大数据预测神经网络,主要包括时间序列子神经网络、空间序列子神经网络和多特征融合子神经网络,如图2所示。时间序列子神经网络的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络和空间序列子神经网络的输出端连接多特征融合神经网络,作为多特征融合神经网络的输入,最终输出相应的预测结果。
S221.所述时间序列子神经网络包括输入层、特征映射层、卷积复合层和池化层;
输入层对输入的时间序列数据进行归一化处理,以消除各个子序列之间的量纲关系,所述归一化处理方法采用现有技术,本发明在此不做过多阐述。输入层将归一化处理后的数据发送给特征映射层;
特征映射层包括多个映射通道,每条映射通道可传输相邻两个时间戳的数据,经过映射通道将特征映射到特征空间中,计算公式如下:
Figure BDA0002961820550000101
其中,α0是映射参数,αi和cr分别是第ti时间戳数据和第ti-1时间戳数据的激活因子,ni是第ti时间戳数据含有的特征属性的数量,ni-1是第ti-1时间戳数据含有的特征属性的数量,
Figure BDA0002961820550000102
是第ti时间戳数据Xti的第i个特征,
Figure BDA0002961820550000103
第ti-1时间戳数据Xti-1的第r个特征。经过映射通道映射到特征空间后,特征映射层将特征输出给卷积复合层。
卷积复合层对特征空间中相邻两个时间戳数据的特征进行复合处理,并用激活函数对其激活,计算公式如下:
Cti=f(ωti*Sti-1+bti)=μ(1+exp(ωti*Sti-1+bti))-1
其中,Cti是卷积复合层第ti时间戳数据的输出,通过非线性激活函数f获得第ti时间戳数据的复合特征Cti,ωti表示第ti时间戳数据的共享权重,与第ti-1时间戳数据的特征Sti-1进行卷积操作,*是卷积运算符号,bti是第ti时间戳数据的偏置向量,μ是激活因子。卷积复合层将复合后的结果发送给池化层。
池化层对复合后的特征进行压缩,减小过拟合,池化层的输出为特征空间的数据维度特征数据:
Figure BDA0002961820550000104
其中,p是预指定池化参数,
Figure BDA0002961820550000105
是经过卷积复合后的数据Cti的第i特征属性,ni是Cti具有的特征数量。池化层将压缩后的数据发送给多特征融合子神经网络的输入层。
S222.所述空间序列子神经网络包括输入层、第一处理层、第二处理层和第三处理层。
输入层对输入的空间序列数据进行归一化处理,以消除各个子序列之间的量纲关系,所述归一化处理方法采用现有技术,本发明在此不做过多阐述。输入层将归一化处理后的数据发送给第一处理层;
第一处理层对空间序列数据进行激活,计算公式如下:
Figure BDA0002961820550000106
其中,Kj表示第一处理层的输出,ωj表示第一处理层的权值,α表示第一处理参数,hj-1为空间序列数据特征状态值,初始值从[0,1]随机选择一个数值,bj表示第一处理层的偏置。第一处理层将计算结果输出给第二处理层。
第二处理层中设有映射阈值,所述映射阈值根据实际计算情况确定。第二处理层对空间序列数据特征状态值进行迭代更新,直至连续两个神经元的输出之差小于映射阈值。
Figure BDA0002961820550000111
其中,hj为第二处理层的输出,βj为状态激励因子,
Figure BDA0002961820550000112
为元素乘法。第二处理层将结果输出给第三处理层。
第三处理层通过激活函数将映射后的相邻两个数据特征进行加权融合,计算公式如下:Rj=g(Wj·[hj-1,hj])
其中,Rj是第三处理层的输出,Wj为融合权值,g为激活函数,可根据实际需求选择已有激活函数,本发明在此不做限制。第三处理层将结果输出给多特征融合子神经网络的输入层。
S223.所述多特征融合子神经网络包括输入层、压缩层、输出层。
输入层接收时间序列子神经网络和空间序列子神经网络发送的高维度特征数据,将两项数据相加并联以向量的形式发送给压缩层。
压缩层将合并后的数据压缩成一维数据后输入最后的输出层,所述数据压缩方法采用现有技术,本发明在此不做过多限制。输出层将压缩后的数据输出。由此将相同样本数的高维特征数据合并,把空间维度的特征与时间维度的特征全部映射到高维的特征空间中,将这些数据最后输入多特征融合子神经网络中输出相应的预测结果。
S224.针对时间序列子神经网络和空间序列子神经网络均建立以下损失函数:
Figure BDA0002961820550000113
其中,Loss表示预测值与实际值之间的误差,m表示时间序列子神经网络中的时间戳数量和空间序列子神经网络中的采集途径数量,yi表示第i个实际值,
Figure BDA0002961820550000114
表示第i个预测值。
利用反向传播算法训练时间序列子神经网络和空间序列子神经网络,调整时间序列子神经网络和空间序列子神经网络的权重参数,实现预测值与真实值的逼近过程,优化获得训练后的时间序列子神经网络和空间序列子神经网络;
利用训练后的时间序列子神经网络和空间序列子神经网络结合形成训练后的多特征融合子神经网络,将待测情况的参考变量参数数据输入到训练后的多特征融合子神经网络后输出预测获得目标变量参数。
所述大数据预测神经网络的有益效果为:采用时间序列子神经网络和空间序列子神经网络的深度学习可自发的从给定样本中提取大量的变量间空间关系和时间特征信息,无需依赖过多的流程工业生产信息。本发明只要提供给模型充分的训练样本集和测试样本集,深度学习模型便能有效的提取样本中包含的特征知识,并将特征进行融合压缩,最终通过输出层得到关键变量当前状态的预测值。然后通过反向传播误差对神经网络参数的不断调整优化,以不断提高预测准确率,最终完成工业大数据的预测。
综上所述,便完成了本发明所述的基于工业互联网的大数据预测分析方法及装置。
以上所述仅为本发明的较佳实施例,并不用于限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于工业互联网的大数据预测分析方法,其特征在于:包括下列步骤,
S1.获取工业大数据,提取数据特征,对数据进行趋势修正移动和正则化处理,并配置时间戳减弱计算复杂度;
S2.将处理后的数据分为时间序列数据和空间序列数据,构建大数据预测神经网络,通过三个子神经网络的深度学习,输出相应的预测结果。
2.按照权利要求1所述的基于工业互联网的大数据预测分析方法,其特征在于:所述S1中,包括下列步骤,
S11.根据实际需求设定采集时间步长,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据,工业大数据以数据流的形式存在,描述为由连续的数据项{A1,A2,...}和时间戳ts组成,
S12.构造特征池20,工业大数据流首先进入特征池20,所述特征池20用于从工业大数据中提取出有效数据信息,代表数据的近似特征,不同采集途径对应不同的特征池20;
S13.每个数据项的到达时间表示该数据项的时间戳,时间戳配置模块30使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳:
ts=(t+1)mod N
其中,T表示时间戳,t表示数据到达的时间,mod为求余函数;当特征池20中的数据项的时间戳与新到达的数据项的时间戳相等时,表示两个数据项之间相差N个数据,即此数据项不在窗口中;设定只有在当前窗口中的数据项是有效数据,其余数据为无效数据,每个数据按照到达窗口的时间设置时间戳。
S14.正则化处理模块50对预处理后数据的特征属性进行正则化处理。
3.按照权利要求2所述的基于工业互联网的大数据预测分析方法,其特征在于:所述S1中,修正移动模块40设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动:
Figure FDA0002961820540000011
其中,
Figure FDA0002961820540000012
为t时刻获取的初始数据,
Figure FDA0002961820540000013
为第一次趋势修正移动后的t时刻的数据,
Figure FDA0002961820540000014
为第二次趋势修正移动后的t时刻的数据,N为时间跨度,从t时刻开始向前选择N个数据。
4.按照权利要求2或3所述的基于工业互联网的大数据预测分析方法,其特征在于:设立处理后的数据为
Figure FDA0002961820540000021
n为该数据的特征数量,正则化处理公式为:
Figure FDA0002961820540000022
其中,
Figure FDA0002961820540000023
表示对
Figure FDA0002961820540000024
进行正则化处理,
Figure FDA0002961820540000025
为Xts的第i个特征属性,i∈n,
Figure FDA0002961820540000026
Figure FDA0002961820540000027
分别表示第i个特征属性的数据分布的δ分位数。
5.按照权利要求2所述的基于工业互联网的大数据预测分析方法,其特征在于:所述S2中,包括下列步骤,
S21.所述分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据Xti∈{Xt1,Xt2,XtN}和空间序列数据Aj∈{A1,A2,AM},tN表示时间序列数据的数量,对于任一时间戳用ti表示;M表示采集途径的数量,对于任一采集途径用j表示,所述时间序列数据为同一时刻各采集途径直接获得的可联合进行数据预测分析的数据集;所述空间序列数据为不同采集途径的特征池20中,按照时间窗尺寸进行滑窗取样的数据集;
S22.大数据预测模块70构建大数据预测神经网络。
6.按照权利要求5所述的基于工业互联网的大数据预测分析方法,其特征在于:所述大数据预测神经网络包括时间序列子神经网络、空间序列子神经网络和多特征融合子神经网络;时间序列子神经网络的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络和空间序列子神经网络的输出端连接多特征融合神经网络,作为多特征融合神经网络的输入,最终输出相应的预测结果。
7.按照权利要求5或6所述的基于工业互联网的大数据预测分析方法,其特征在于:所述S22步骤中包括下列子步骤,
S221.所述时间序列子神经网络包括输入层、特征映射层、卷积复合层和池化层;
S222.所述空间序列子神经网络包括输入层、第一处理层、第二处理层和第三处理层;
S223.所述多特征融合子神经网络包括输入层、压缩层、输出层。
S224.针对时间序列子神经网络和空间序列子神经网络均建立以下损失函数:
Figure FDA0002961820540000028
其中,Loss表示预测值与实际值之间的误差,m表示时间序列子神经网络中的时间戳数量和空间序列子神经网络中的采集途径数量,yi表示第i个实际值,
Figure FDA0002961820540000031
表示第i个预测值;
利用反向传播算法训练时间序列子神经网络和空间序列子神经网络,调整时间序列子神经网络和空间序列子神经网络的权重参数,实现预测值与真实值的逼近过程,优化获得训练后的时间序列子神经网络和空间序列子神经网络;
利用训练后的时间序列子神经网络和空间序列子神经网络结合形成训练后的多特征融合子神经网络,将待测情况的参考变量参数数据输入到训练后的多特征融合子神经网络后输出预测获得目标变量参数。
8.一种如权利要求1-7任意一项所述基于工业互联网的大数据预测分析方法在机器学习中的应用。
9.一种运行权利要求1-7任意一项基于工业互联网的大数据预测分析系统,其特征在于:包括
数据接入模块10、特征池20、时间戳配置模块30、修正移动模块40、正则化处理模块50、分流通道60和大数据预测模块70。
所述数据接入模块10设有定时器,定时器根据设定的固定时间步长控制数据接入模块10定时接收工业大数据;数据接入模块10通过数据连接的方式将接入的数据发送给特征池20;
所述特征池20,用于从工业大数据中提取出有效数据信息,代表数据的近似特征,特征池20通过数据连接的方式将特征属性发送给时间戳配置模块30和修正移动模块40;
所述时间戳配置模块30,用于使用有效数据的相对位置来表示时间戳,为到达数据设置时间戳;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳以数据连接的方式发送给修正移动模块40和大数据预测模块70;
所述修正移动模块40,用于设置一个时间跨度为N个单位时间的滑动窗口,对数据进行两次趋势修正移动,避免当数据呈现明显的断层趋势变化时产生的滞后反应,提高数据预测的准确度;修正移动模块40将修正后的数据并与其对应的时间戳通过数据连接的方式将处理结果发送给正则化处理模块50;
所述正则化处理模块50,用于根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,发现工业大数据中存在的关系和规则;正则化处理通过数据连接的方式将处理结果发送给分流通道60;
所述分流通道60,包括时间序列通道601和空间序列通道602,用于对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;分流通道60根据数据的不同选择不同的通道以数据连接的方式发送给大数据预测模块70;
所述大数据预测模块70,用于构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703;时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的预测结果。
10.按照权利要求9所述的基于工业互联网的大数据预测分析系统,其特征在于:所述数据接入模块10根据定时器定时接收工业大数据,将数据传输给特征池20;特征池20提取数据特征,将数据特征发送给时间戳配置模块30和修正移动模块40;时间戳配置模块30实时为数据动态配置时间戳,将配置好的时间戳发送给修正移动模块40和大数据预测模块70;修正移动模块40对数据进行两次趋势修正移动,并将修正后的数据与其对应的时间戳发送给正则化处理模块50;正则化处理模块50根据特征属性的数据分布的δ分位数获取所述数据集中数据的原始属性之间的交互作用,将处理结果发送给分流通道60;分流通道60对采集的数据集分别按照时间点和采集途径进行分割,得到时间序列数据和空间序列数据,分别通过时间序列通道601和空间序列通道602将数据传输给大数据预测模块70;大数据预测模块70构建大数据预测神经网络,包括时间序列子神经网络单元701、空间序列子神经网络单元702和多特征融合子神经网络单元703。时间序列子神经网络单元701的输入为时间序列数据,输出为时间特征预测分析结果;空间序列子神经网络单元702的输入为空间序列数据,输出为空间特征预测分析结果;时间序列子神经网络单元701和空间序列子神经网络单元702的输出端连接多特征融合神经网络单元,作为多特征融合神经网络的输入,最终输出相应的数据分类或拟合预测结果。
CN202110239987.2A 2021-03-04 2021-03-04 一种基于工业互联网的大数据预测分析方法及系统 Active CN113009906B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110239987.2A CN113009906B (zh) 2021-03-04 2021-03-04 一种基于工业互联网的大数据预测分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110239987.2A CN113009906B (zh) 2021-03-04 2021-03-04 一种基于工业互联网的大数据预测分析方法及系统

Publications (2)

Publication Number Publication Date
CN113009906A true CN113009906A (zh) 2021-06-22
CN113009906B CN113009906B (zh) 2022-08-02

Family

ID=76405180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110239987.2A Active CN113009906B (zh) 2021-03-04 2021-03-04 一种基于工业互联网的大数据预测分析方法及系统

Country Status (1)

Country Link
CN (1) CN113009906B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117391071A (zh) * 2023-12-04 2024-01-12 中电科大数据研究院有限公司 一种新闻话题数据挖掘方法、装置及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101839733A (zh) * 2010-05-13 2010-09-22 重庆工业自动化仪表研究所 一体化多参数水质在线监测装置及其控制方法
CN103776480A (zh) * 2014-01-29 2014-05-07 清华大学 基于多次移动平均的微小故障检测方法和装置
US20160034111A1 (en) * 2014-07-31 2016-02-04 Adobe Systems Incorporated Method and apparatus for providing a contextual timeline of an online interaction for use in assessing effectiveness
CN105468450A (zh) * 2015-12-29 2016-04-06 华为技术有限公司 任务调度方法及系统
US20190354853A1 (en) * 2018-05-21 2019-11-21 Fair Isaac Corporation System and method for generating explainable latent features of machine learning models
CN110493362A (zh) * 2019-08-22 2019-11-22 腾讯科技(深圳)有限公司 请求量控制方法、装置、存储介质和计算机设备
CN110728324A (zh) * 2019-10-12 2020-01-24 西安电子科技大学 基于深度复值全卷积神经网络的极化sar图像分类方法
CN111476274A (zh) * 2020-03-16 2020-07-31 宜通世纪科技股份有限公司 一种大数据预测分析的方法、系统、装置及存储介质
CN111881000A (zh) * 2020-08-07 2020-11-03 广州云从博衍智能科技有限公司 一种故障预测方法、装置、设备及机器可读介质
CN112001527A (zh) * 2020-07-29 2020-11-27 中国计量大学 多特征融合深度神经网络的工业生产过程目标数据预测方法
CN112380308A (zh) * 2020-11-17 2021-02-19 中国地质科学院矿产资源研究所 一种基于数据正则化的地球化学异常圈定方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101839733A (zh) * 2010-05-13 2010-09-22 重庆工业自动化仪表研究所 一体化多参数水质在线监测装置及其控制方法
CN103776480A (zh) * 2014-01-29 2014-05-07 清华大学 基于多次移动平均的微小故障检测方法和装置
US20160034111A1 (en) * 2014-07-31 2016-02-04 Adobe Systems Incorporated Method and apparatus for providing a contextual timeline of an online interaction for use in assessing effectiveness
CN105468450A (zh) * 2015-12-29 2016-04-06 华为技术有限公司 任务调度方法及系统
US20190354853A1 (en) * 2018-05-21 2019-11-21 Fair Isaac Corporation System and method for generating explainable latent features of machine learning models
CN110493362A (zh) * 2019-08-22 2019-11-22 腾讯科技(深圳)有限公司 请求量控制方法、装置、存储介质和计算机设备
CN110728324A (zh) * 2019-10-12 2020-01-24 西安电子科技大学 基于深度复值全卷积神经网络的极化sar图像分类方法
CN111476274A (zh) * 2020-03-16 2020-07-31 宜通世纪科技股份有限公司 一种大数据预测分析的方法、系统、装置及存储介质
CN112001527A (zh) * 2020-07-29 2020-11-27 中国计量大学 多特征融合深度神经网络的工业生产过程目标数据预测方法
CN111881000A (zh) * 2020-08-07 2020-11-03 广州云从博衍智能科技有限公司 一种故障预测方法、装置、设备及机器可读介质
CN112380308A (zh) * 2020-11-17 2021-02-19 中国地质科学院矿产资源研究所 一种基于数据正则化的地球化学异常圈定方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李征,房宏才,柯熙政,李芳,王燕宁: "滑动平均法在MEMS陀螺信号趋势项提取中的应用", 《电子测量与仪器学报》 *
白建社,盛戈皞,江秀臣,曾奕: "基于移动时间窗的直流局部放电特征提取方法", 《电力系统自动化》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117391071A (zh) * 2023-12-04 2024-01-12 中电科大数据研究院有限公司 一种新闻话题数据挖掘方法、装置及存储介质
CN117391071B (zh) * 2023-12-04 2024-02-27 中电科大数据研究院有限公司 一种新闻话题数据挖掘方法、装置及存储介质

Also Published As

Publication number Publication date
CN113009906B (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
Ren et al. TBSM: A traffic burst-sensitive model for short-term prediction under special events
Laredo et al. A neural network-evolutionary computational framework for remaining useful life estimation of mechanical systems
US20190034497A1 (en) Data2Data: Deep Learning for Time Series Representation and Retrieval
Tan et al. Multi-node load forecasting based on multi-task learning with modal feature extraction
Deng et al. A multi-view multi-task learning framework for multi-variate time series forecasting
CN115688035A (zh) 一种基于自监督学习的时序电力数据异常检测方法
Chan et al. Tool wear prediction using convolutional bidirectional LSTM networks
CN114519610A (zh) 信息预测方法以及装置
CN117041017B (zh) 数据中心的智能运维管理方法及系统
CN116340796B (zh) 时序数据分析方法、装置、设备及存储介质
CN117094451B (zh) 一种耗电量的预测方法、装置及终端
GB2620602A (en) Training of a machine learning model for predictive maintenance tasks
Hu et al. Multi-attention based spatial-temporal graph convolution networks for traffic flow forecasting
CN113009906B (zh) 一种基于工业互联网的大数据预测分析方法及系统
Li et al. FlashST: A Simple and Universal Prompt-Tuning Framework for Traffic Prediction
Zhu et al. MR-Transformer: Multiresolution Transformer for Multivariate Time Series Prediction
Zhang et al. LIFE: Learning individual features for multivariate time series prediction with missing values
CN118093996A (zh) 基于深度学习的线下智能家居用户画像构建方法及系统
CN117236666B (zh) 应急物资需求分析方法及系统
Wu et al. Custom machine learning architectures: towards realtime anomaly detection for flight testing
CN112927507A (zh) 一种基于LSTM-Attention的交通流量预测方法
CN117371573A (zh) 基于TrAdaBoost-LSTM的时间序列预测方法、装置及介质
Li et al. Multiscale Feature Extension Enhanced Deep Global-Local Attention Network for Remaining Useful Life Prediction
Xu et al. Multi‐Dimensional Attention Based Spatial‐Temporal Networks for Traffic Forecasting
CN114997292B (zh) 基于空间重构注意力模型的数字孪生扶梯寿命预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant