CN118070040A

CN118070040A - 一种炼钢厂数据采集方法、装置、电子设备及存储介质

Info

Publication number: CN118070040A
Application number: CN202410218789.1A
Authority: CN
Inventors: 童俊; 周克; 孔大明
Original assignee: CISDI Engineering Co Ltd
Current assignee: CISDI Engineering Co Ltd
Priority date: 2024-02-28
Filing date: 2024-02-28
Publication date: 2024-05-24

Abstract

本发明涉及一种炼钢厂数据采集方法、装置、电子设备及存储介质，该方法通过获取炼钢厂当前生产过程的时序数据，将时序数据输入特征提取模型，得到非线性数据特征，特征提取模型由样本数据对预先构建的提取模型进行训练得到，基于非线性数据特征的动态密度估计值，确定出动态阈值，根据动态密度估计值与动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对炼钢厂进行数据采集；本发明能够根据动态密度估计值与动态阈值的比对结果，对数据采集频率进行调整，解决了采用固定频率对炼钢厂进行数据采集带来的过度采集或采集量不足的技术问题。

Description

一种炼钢厂数据采集方法、装置、电子设备及存储介质

技术领域

本发明涉及数据分析技术领域，尤其涉及一种炼钢厂数据采集方法、装置、电子设备及存储介质。

背景技术

随着工业4.0和智能制造的快速发展，炼钢厂作为重要的基础工业生产环节，对数据的实时采集和精确分析的需求日益增强。炼钢生产过程涉及多个复杂的步骤，如熔炼、连铸、轧制等，每个步骤都伴随着大量的数据产生。这些数据不仅反映了生产过程的状态，还与设备的健康状况、生产效率、产品质量等关键指标密切相关。

相关的数据采集和分析方法往往基于固定的采集频率和预定义的模型进行，这在某种程度上限制了数据分析的深度和广度，存在以下技术问题：(1)由于炼钢厂的生产环境具有高度的动态性和不确定性，通过固定的采集频率对炼钢厂数据进行采集，导致在数据变化剧烈时采集不足，而在数据变化缓慢时采集过多，既浪费资源又可能错过关键信息；(2)难以捕获炼钢厂数据中的深层次模式和特征，尤其是在不同的时间尺度上的特征；(3)由于炼钢生产过程的复杂性，数据中经常包含大量的噪声和干扰，对于数据中的干扰部分可能缺乏有效的识别和处理方法，导致数据分析的结果受到干扰，准确性低。

发明内容

鉴于以上所述现有技术的缺点，本申请提供一种炼钢厂数据采集方法、装置、电子设备及存储介质，以解决上述技术问题。

本发明提供的一种炼钢厂数据采集方法，所述炼钢厂数据采集方法包括：获取炼钢厂当前生产过程的时序数据；将所述时序数据输入特征提取模型，得到非线性数据特征，所述特征提取模型由样本数据对预先构建的提取模型进行训练得到，所述预先构建的提取模型包括用于捕获结构特征的时间序列分析层、用于识别异常结构特征的自注意力机制层和用于提取非线性数据特征的非线性变换层，所述样本数据包括炼钢厂历史生产过程的全部或部分时序数据；基于所述非线性数据特征的动态密度估计值，确定出动态阈值；根据所述动态密度估计值与所述动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对所述炼钢厂进行数据采集。

于本发明的一实施例中，通过调整后的数据采集频率对所述炼钢厂进行数据采集后，所述炼钢厂数据采集方法包括：基于采集得到的炼钢厂数据，构建多层次数据向量场，所述多层次数据向量场用于提取不同层次数据特征；将所述多层次数据向量场输入预设干扰识别函数，得到干扰数据；将所述干扰数据从所述炼钢厂数据中剔除，得到纯净的炼钢厂数据。

于本发明的一实施例中，根据所述动态密度估计值与所述动态阈值的比对结果，调整数据采集频率的过程包括：获取所述时序数据的当前数据采集频率；

若所述动态密度估计值小于或等于所述动态阈值，则判定所述动态密度估计值对应的数据特征为正常数据特征，并将所述当前数据采集频率调整为第一数据采集频率，所述第一数据采集频率小于所述当前数据采集频率；若所述动态密度估计值大于所述动态阈值，则判定所述动态密度估计值对应的数据特征为异常数据特征，并将所述当前数据采集频率调整为第二数据采集频率，所述第二数据采集频率大于所述当前数据采集频率。

于本发明的一实施例中，若所述预先构建的提取模型还包括用于提取不同尺度数据特征的多尺度分析层，则通过样本数据对预先构建的提取模型进行训练，得到特征提取模型的过程包括：将所述样本数据输入所述时间序列分析层，得到结构特征；将所述结构特征输入所述自注意力机制层，得到异常结构特征；将所述异常结构特征输入所述非线性变换层，得到非线性数据特征；将所述非线性数据特征输入所述多尺度分析层，得到不同尺度数据特征；基于所述不同尺度数据特征和所述时序数据，构建损失函数，以最小化所述损失函数为目标，对所述时间序列分析层的参数、所述自注意力机制层的参数、所述非线性变换层的参数和所述多尺度分析层的参数进行更新；将参数更新后的时间序列分析层、参数更新后的自注意力机制层、参数更新后的非线性变换层和参数更新后的多尺度分析层进行组合，得到所述特征提取模型。

于本发明的一实施例中，所述时间序列分析层的表达式为：其中，ts(x)表示时序数据的结构特征，x表示时序数据，sigm表示激活函数，W_t表示权重，b_t表示偏置，β表示高斯积分的权重系数，T表示转置；所述自注意力机制层的表达式为：/>其中，Q、K、V分别表示自注意力机制层中的查询矩阵、键矩阵和值矩阵，a(ts)表示异常结构特征，T表示转置，d_k表示键的维度，ts表示结构特征；所述非线性变换层的表达式为：其中，f(a)表示非线性数据特征，W_f表示非线性变换层的权重矩阵，b_f表示非线性变换层的偏置向量，μ表示正则化系数，a表示正弦函数的权重系数，W_r表示正则化的权重矩阵，a表示异常结构特征；所述多尺度分析层的表达式为：/>其中，m(f)表示不同尺度数据特征，W_i表示第i个尺度的权重矩阵，σ_i表示第i个尺度的标准差，f表示非线性数据特征；所述损失函数的表达式为：/>其中，L表示损失函数，μ₁和μ₂均为正则化系数，h_i表示第i个尺度所在神经元的状态，F表示Frobenius范数，W_i表示第i个尺度的权重矩阵，x表示时序数据；所述动态密度估计值的计算公式为：其中，d_t(f)表示在时间t下非线性数据特征f的动态密度估计值，N表示非线性数据特征数量，K表示空间-时间核函数，用于测量非线性数据特征之间在空间和时间上的相似度，u表示非线性数据特征之间的空间距离，ω表示时间衰减函数，Δt表示非线性数据特征的任一时间t₀和当前时间t的时间差；所述动态阈值的计算公式为：其中，Φ表示动态阈值，/>表示非线性数据特征的动态密度估计值d_t的均值，θ表示常数，σ表示高斯核函数的标准差。

于本发明的一实施例中，基于采集得到的炼钢厂数据，构建多层次数据向量场的过程包括：将所述炼钢厂数据进行维度转化，得到数据点集；基于所述数据点集，计算得到数据持续图；基于所述数据持续图，计算得到所述多层次数据向量场。

于本发明的一实施例中，所述数据点集的表达式为：P(t)＝M(U)＝exp(-k₁t²)U·sin(k₂t)+k₃tU，其中，k₁表示时间衰减因子，k₂表示周期性调节因子，t表示时间，k₃表示线性时间影响因子，U表示炼钢厂数据，M(U)表示将炼钢厂数据进行维度转化的映射函数，P(t)表示数据点集；所述数据持续图的表达式为：其中，λ表示衰减因子，P(t)表示数据点集，D(t)表示数据持续图，t表示时间；所述多层次数据向量场的表达式为：/>其中，V_k(t)表示在时间t时第k层数据向量场，/>表示梯度算子，γ表示权重参数，D_k(t′)表示在时间t′时第k层的数据持续图，t′∈[0，t]；所述预设干扰识别函数的表达式为：/>其中，Idf表示预设干扰识别函数，θ表示阈值函数，V_k(t)表示在时间t时第k层数据向量场，/>表示V_k(t)的平均向量，I_k(t)表示在时间t时第k层数据向量场中识别到的干扰数据；所述纯净的炼钢厂数据的表达式为：/>其中，y(t)表示在时间t时纯净的炼钢厂数据，w_kj表示第k层的第j个干扰向量的权重，I_kj表示在时间t时第k层识别出的第j个干扰向量，n_k表示第k层的干扰向量的数量，K表示数据向量场的总层数，δ表示调节因子，U(t)表示时间t时的炼钢厂数据，I_k(t)表示在时间t时第k层识别出I_kj的组合。

根据本发明实施例的一个方面，提供了一种炼钢厂数据采集装置，所述炼钢厂数据采集装置包括：数据获取模块，用于获取炼钢厂当前生产过程的时序数据；特征提取模块，用于将所述时序数据输入特征提取模型，得到非线性数据特征，所述特征提取模型由样本数据对预先构建的提取模型进行训练得到，所述预先构建的提取模型包括用于捕获结构特征的时间序列分析层、用于识别异常结构特征的自注意力机制层和用于提取非线性数据特征的非线性变换层，所述样本数据包括炼钢厂历史生产过程的全部或部分时序数据；阈值确定模块，用于基于所述非线性数据特征的动态密度估计值，确定出动态阈值；频率确定模块，用于根据所述动态密度估计值与所述动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对所述炼钢厂进行数据采集。

根据本发明实施例的一个方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如上述所述的炼钢厂数据采集方法。

根据本发明实施例的一个方面，提供了一种计算机可读存储介质，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行上述所述的炼钢厂数据采集方法。

本发明的有益效果：本发明通过获取炼钢厂当前生产过程的时序数据，将时序数据输入特征提取模型，得到非线性数据特征，特征提取模型由样本数据对预先构建的提取模型进行训练得到，基于非线性数据特征的动态密度估计值，确定出动态阈值，根据动态密度估计值与动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对炼钢厂进行数据采集，以上过程，能够根据动态密度估计值与动态阈值的比对结果，对数据采集频率进行调整，解决了采用固定频率对炼钢厂进行数据采集带来的过度采集或采集量不足的技术问题。

另外，结合时间序列分析层、自注意力机制层、非线性变换层、正交约束和多尺度分析层的特征提取模型能够深入地捕获时序数据的复杂模式和特征，尤其是在不同的时间尺度上捕获特征，并且能够考虑数据的时间依赖性，更适用于炼钢厂这种具有高度时间依赖性的数据环境，能够更为准确地对时序数据进行分析和处理；基于数据拓扑结构与多层次数据向量场，准确地识别出炼钢厂数据中的干扰部分，从而大大提高了数据采集的准确性，提高了数据采集的效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术者来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1是本申请的一示例性实施例示出的示例性系统架构的示意图；

图2是本申请的一示例性实施例示出的炼钢厂数据采集方法的流程图；

图3是本申请的另一示例性实施例示出的炼钢厂数据采集方法的流程图；

图4是本申请的另一示例性实施例示出的特征提取模型的结构图；

图5是本申请的一示例性实施例示出的炼钢厂数据采集装置的框图；

图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

以下将参照附图和优选实施例来说明本发明的实施方式，本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。应当理解，优选实施例仅为了说明本发明，而不是为了限制本发明的保护范围。

需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

在下文描述中，探讨了大量细节，以提供对本发明实施例的更透彻的解释，然而，对本领域技术人员来说，可以在没有这些具体细节的情况下实施本发明的实施例是显而易见的，在其他实施例中，以方框图的形式而不是以细节的形式来示出公知的结构和设备，以避免使本发明的实施例难以理解。

图1是本申请的一示例性实施例示出的示例性系统架构的示意图。

参照图1所示，系统架构可以包括采集设备101和计算机设备102。其中，计算机设备102可以是台式图形处理器(Graphic Processing Unit，GPU)计算机、GPU计算集群、神经网络计算机等中的至少一种。相关技术人员可以使用该计算机设备102通过获取炼钢厂当前生产过程的时序数据，将时序数据输入特征提取模型，得到非线性数据特征，特征提取模型由样本数据对预先构建的提取模型进行训练得到，基于非线性数据特征的动态密度估计值，确定出动态阈值，根据动态密度估计值与动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对炼钢厂进行数据采集。采集设备101用于采集时序数据，在本实施例中数据采集设备101采用传感器等设备对时序数据进行采集，并提供给计算机设备102进行处理。

示意性的，计算机设备102在获取到采集设备101中的时序数据之后，将时序数据输入特征提取模型，得到非线性数据特征，特征提取模型由样本数据对预先构建的提取模型进行训练得到，基于非线性数据特征的动态密度估计值，确定出动态阈值，根据动态密度估计值与动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对炼钢厂进行数据采集，以上过程，能够根据动态密度估计值与动态阈值的比对结果，对数据采集频率进行调整，解决了采用固定频率对炼钢厂进行数据采集带来的过度采集或采集量不足的技术问题。

需要说明的是，本申请实施例所提供的炼钢厂数据采集方法一般由计算机设备102执行，相应地，炼钢厂数据采集装置一般设置于计算机设备102中。

以下对本申请实施例的技术方案的实现细节进行详细阐述：

图2是本申请的一示例性实施例示出的炼钢厂数据采集方法的流程图，该炼钢厂数据采集方法可以计算处理设备来执行，该计算处理设备可以是图1中所示的计算机设备102。参照图2所示，该炼钢厂数据采集方法至少包括步骤S210至步骤S240，详细介绍如下：

在步骤S210中，获取炼钢厂当前生产过程的时序数据。

在本申请的一实施例中，时序数据包括炼钢厂当前生产过程中的参数变化数据，例如，温度随时间变化数据、化学成分随时间变化数据、压力随时间变化数据和材料流量随时间变化数据等。

在步骤S220中，将时序数据输入特征提取模型，得到非线性数据特征。

在本实施例中，特征提取模型由样本数据对预先构建的提取模型进行训练得到，预先构建的提取模型包括用于捕获结构特征的时间序列分析层、用于识别异常结构特征的自注意力机制层和用于提取非线性数据特征的非线性变换层，样本数据包括炼钢厂历史生产过程的全部或部分时序数据。

在本实施例中，时序数据的结构特征包括平稳的结构特征和非平稳的结构特征，其中，异常结构特征(或关键结构特征)包括非平稳的结构特征等。

在本实施例中，通过特征提取模块提取时序数据的非线性数据特征，从而捕获到了炼钢厂数据的内在结构特征，有利于减少炼钢厂数据的维度或复杂性。

在步骤S230中，基于非线性数据特征的动态密度估计值，确定出动态阈值。

在本实施例中，动态密度估计值的计算公式为：

其中，d_t(f)表示在时间t下非线性数据特征f的动态密度估计值，N表示非线性数据特征数量，K表示空间-时间核函数，用于测量非线性数据特征之间在空间和时间上的相似度，u表示非线性数据特征之间的空间距离，ω表示时间衰减函数，Δt表示非线性数据特征的任一时间t₀和当前时间t的时间差。

在本实施例中，通过动态密度估计值的计算，为每个提取出的非线性数据特征分配一个权重，这个权重基于非线性数据特征的时间属性，这意味着与异常数据特征最近的数据特征会被赋予更高的权重。

在本实施例中，时间衰减函数的表达式为：

ω(Δt)＝e^-βΔt 式(2)

其中，β表示常数，它决定了权重的衰减速度，Δt表示非线性数据特征的任一时间t₀和当前时间t的时间差，ω表示时间衰减函数。选择指数衰减函数作为时间衰减函数，可以确保与异常数据特征最近的数据点有更大的权重。

在本实施例中，空间-时间核函数的表达式为：

其中，σ表示高斯核函数的标准差，决定了核函数的宽度，s表示时序数据的维度，u表示非线性数据特征之间的空间距离，ω表示时间衰减函数，Δt表示非线性数据特征的任一时间t₀和当前时间t的时间差，K表示空间-时间核函数。

在本实施例中，空间-时间核函数用于测量非线性数据特征之间在空间和时间上的相似度，空间-时间核函数同时考虑数据的空间和时间属性，结合高斯核函数和时间衰减函数，两个非线性数据特征在空间和时间上都越接近，那么两个非线性数据特征的相似度越高。

在本实施例中，动态阈值的计算公式为：

其中，Φ表示动态阈值，表示非线性数据特征的动态密度估计值d_t的均值，θ表示常数，σ表示高斯核函数的标准差。

在本实施例中，动态阈值是基于所有非线性数据特征的动态密度估计值d_t的均值和高斯核函数的标准差计算的。

在步骤S240中，根据动态密度估计值与动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对炼钢厂进行数据采集。

在本实施例中，对于每个非线性数据特征，将其动态密度估计值d_t与动态阈值Φ进行比较，如果某个非线性数据特征的动态密度估计值大于动态阈值，那么，这个非线性数据特征被认为是异常数据特征(或关键数据特征)。一旦识别出异常数据特征，则增加数据采样频率，以获得更详细的炼钢厂数据；相反，如果非线性数据特征的动态密度估计值小于或等于动态阈值，则降低数据采样频率，以减少炼钢厂数据的采集和处理负担，因此，动态数据密度估计方法解决了采用固定频率对炼钢厂进行数据采集带来的过度采集或采集量不足的技术问题，不仅可以更准确地识别出时序数据中的异常数据特征，而且可以提高炼钢厂数据的采集效率，能够帮助炼钢厂更好地监控和优化生产过程。

在本申请的一实施例中，通过调整后的数据采集频率对炼钢厂进行数据采集后，炼钢厂数据采集方法包括：

基于采集得到的炼钢厂数据，构建多层次数据向量场，多层次数据向量场用于提取不同层次数据特征。

在本实施例中，多层次数据向量场可以揭示炼钢厂数据中的流动方向和模式。每一层的数据向量场都是基于不同的分辨率来构建的，从而捕捉到不同层次数据特征。

将多层次数据向量场输入预设干扰识别函数，得到干扰数据。

在本实施例中，预设干扰识别函数的表达式为：

其中，Idf表示预设干扰识别函数，θ表示阈值函数，用于筛选出V_k(t)与差异向量，V_k(t)表示在时间t时第k层数据向量场，/>表示V_k(t)的平均向量，I_k(t)表示在时间t时第k层数据向量场中识别到的干扰数据。

在本实施例中，通过预设干扰识别函数识别出与正常数据特征流动方向不符的向量，这些向量对应的是炼钢厂数据中的干扰部分。

将干扰数据从炼钢厂数据中剔除，得到纯净的炼钢厂数据。

在本实施例中，纯净的炼钢厂数据的表达式为：

其中，y(t)表示在时间t时纯净的炼钢厂数据，w_kj表示第k层的第j个干扰向量的权重，I_kj表示在时间t时第k层识别出的第j个干扰向量，n_k表示第k层的干扰向量的数量，K表示数据向量场的总层数，δ表示调节因子，U(t)表示时间t时的炼钢厂数据，I_k(t)表示在时间t时第k层识别出I_kj的组合。

在本实施例中，通过从炼钢厂数据中剔除中干扰数据，有效地降低采集到的炼钢厂数据中的干扰数据，确保采集到的炼钢厂数据的准确性。

在本申请的一实施例中，根据动态密度估计值与动态阈值的比对结果，调整数据采集频率的过程包括：

获取时序数据的当前数据采集频率。

在本实施例中，当前数据采集频率可以根据炼钢厂生产的工艺阶段、生产工况等进行设定，在此，不进行赘述。

若动态密度估计值小于或等于动态阈值，则判定动态密度估计值对应的数据特征为正常数据特征，并将当前数据采集频率调整为第一数据采集频率。

在本实施例中，第一数据采集频率小于当前数据采集频率，第一数据采集频率可以根据实际情况进行设定，在此，不进行赘述。

在本实施例中，在通过第一数据采集频率对炼钢厂进行数据采集，以减少炼钢厂数据采集和处理的负担。

若动态密度估计值大于动态阈值，则判定动态密度估计值对应的数据特征为异常数据特征，并将当前数据采集频率调整为第二数据采集频率。

在本实施例中，第二数据采集频率大于当前数据采集频率，第二数据采集频率可以根据实际情况进行设定，在此，不进行赘述。

在本实施例中，在通过第二数据采集频率对炼钢厂进行数据采集，以获得更详细的异常数据，从而不遗漏异常数据，提高炼钢厂数据采集的效率和准确性，还可以帮助炼钢厂更好地监控和优化生产过程。

在本申请的一实施例中，若预先构建的提取模型还包括用于提取不同尺度数据特征的多尺度分析层，则通过样本数据对预先构建的提取模型进行训练，得到特征提取模型的过程包括：

将样本数据输入时间序列分析层，得到结构特征。

在本实施例中，时间序列分析层的表达式为：

其中，tx(x)表示时序数据的结构特征，x表示时序数据，sigm表示激活函数，W_t表示权重，b_t表示偏置，β表示高斯积分的权重系数，T表示转置。

在本实施例中，通过时间序列分析层对时序数据进行处理，可以捕获时序数据中的局部模式，更好地理解时序数据的内在结构特征。例如，通过分析温度和化学成分随时间的变化，预测并调节炉温和材料投放，优化炼钢过程。

将结构特征输入自注意力机制层，得到异常结构特征。

在本实施例中，自注意力机制层的表达式为：

其中，Q、K、V分别表示自注意力机制层中的查询矩阵、键矩阵和值矩阵，a(ts)表示异常结构特征，T表示转置，d_k表示键的维度，ts表示结构特征。

在本实施例中，查询矩阵Q的表达式为：

Q＝W_qts 式(9)

其中，ts表示结构特征，W_q表示查询矩阵中的权重矩阵，Q表示自注意力机制层中的查询矩阵。

在本实施例中，键矩阵K的表达式为：

K＝W_kts 式(10)

其中，ts表示结构特征，W_k表示键矩阵中的权重矩阵，K表示自注意力机制层中的键矩阵。

在本实施例中，值矩阵V的表达式为：

V＝W_vts 式(11)

其中，ts表示结构特征，W_v表示值矩阵中的权重矩阵，V表示自注意力机制层中的值矩阵。

在本实施例中，自注意力机制层能够捕获并关注时序数据中的异常时间点或异常结构特征，并在捕获到异常时间点或异常结构特征之后，对炼钢生产过程中重要的影响因素进行分析，从而得到导致产生异常的原因。例如，当温度发生异常波动时，可以及时识别并处理潜在的生产问题。

将异常结构特征输入非线性变换层，得到非线性数据特征。

在本实施例中，非线性变换层的表达式为：

其中，f(a表示非线性数据特征，W_f表示非线性变换层的权重矩阵，b_f表示非线性变换层的偏置向量，μ表示正则化系数，α表示正弦函数的权重系数，W_r表示正则化的权重矩阵，a表示异常结构特征。

在本实施例中，增加非线性变换层使得特征提取模型能够处理复杂且相互关联的生产数据，如温度、压力、材料比例，既能确保数据间的独立性，又能避免冗余和误差累积，正交约束通过正则化的权重矩阵引入，以确保得到的数据特征是正交的。

将非线性数据特征输入多尺度分析层，得到不同尺度数据特征。

在本实施例中，多尺度分析层的表达式为：

其中，m(f)表示不同尺度数据特征，W_i表示第i个尺度的权重矩阵，σ_i表示第i个尺度的标准差，f表示非线性数据特征。

在本实施例中，多尺度分析层可以在不同时间尺度上捕获时序数据的非线性数据特征，从而得到时序数据在不同时间和空间尺度上的特征变化，如短期内的快速变化和长期趋势，以全面监控生产过程。

基于不同尺度数据特征和时序数据，构建损失函数，以最小化损失函数为目标，对时间序列分析层的参数、自注意力机制层的参数、非线性变换层的参数和多尺度分析层的参数进行更新。

在本实施例中，损失函数的表达式为：

其中，L表示损失函数，μ₁和μ₂均为正则化系数，h_i表示第i个尺度所在神经元的状态，F表示Frobenius范数，W_i表示第i个尺度的权重矩阵，x表示时序数据。

在本实施例中，损失函数利用梯度下降法对时间序列分析层的参数、自注意力机制层的参数、非线性变换层的参数和多尺度分析层的参数进行更新和优化，通过最小化损失函数值，可以确保特征提取模型能够准确地捕捉炼钢厂数据中的结构特征，并通过结构特征反映炼钢厂数据中的关键信息，同时减少炼钢厂数据的维度和复杂性，使后续的数据处理和分析更加高效和准确。

将参数更新后的时间序列分析层、参数更新后的自注意力机制层、参数更新后的非线性变换层和参数更新后的多尺度分析层进行组合，得到特征提取模型。

在本实施例中，结合时间序列分析层、自注意力机制层、非线性变换层、正交约束和多尺度分析层的特征提取模型能够深入地捕获时序数据的复杂模式和特征，尤其是在不同的时间尺度上捕获特征，并且能够考虑数据的时间依赖性，更适用于炼钢厂这种具有高度时间依赖性的数据环境，能够更为准确地对时序数据进行分析和处理。

在本申请的一实施例中，基于采集得到的炼钢厂数据，构建多层次数据向量场的过程包括：

将炼钢厂数据进行维度转化，得到数据点集。

在本实施例中，数据点集的表达式为：

P(t)＝M(U)＝exp(-k₁t²)U·sin(k₂t)+k₂tU 式(15)

其中，k₁表示时间衰减因子，k₂表示周期性调节因子，t表示时间，k₃表示线性时间影响因子，U表示炼钢厂数据，M(U)表示将炼钢厂数据进行维度转化的映射函数，P(t)表示数据点集。

在本实施例中，k₁用于控制exp(-k₁t²)项的衰减速度，k₂用于影响数据变化的频率，k₃用于控制数据随时间的线性变化速度，exp(-k₁t²)表示炼钢厂数据随时间衰减的影响，更直接反映时间变化的影响，sin(k₂t)用于保持对周期性变化的捕捉，k₃tU是线性项，直接将时间因子与炼钢厂数据U相关联，表示炼钢厂数据U随时间线性增长或减少的趋势。

基于数据点集，计算得到数据持续图。

在本实施例中，数据持续图的表达式为：

其中，λ表示衰减因子，P(t)表示数据点集，D(t)表示数据持续图，t表示时间。

在本实施例中，λ用于平衡数据点集一阶导数和数据点集二阶导数/>基于数据点集，计算得到数据持续图的方法为拓扑数据分析方法，通过拓扑数据分析方法，进一步揭示了炼钢厂数据的拓扑结构和数据特征。

基于数据持续图，计算得到多层次数据向量场。

在本实施例中，多层次数据向量场的表达式为：

其中，V_k(t)表示在时间t时第k层数据向量场，表示梯度算子，γ表示权重参数，D_k(t′)表示在时间t′时第k层的数据持续图，t′∈[0，t]。

在本实施例中，梯度算子表示炼钢厂数据的方向性特征，权重参数γ用于平衡梯度项/>和二次项/>

在本实施例中，基于数据拓扑结构与多层次数据向量场，准确地识别出炼钢厂数据中的干扰部分，从而大大提高了数据采集的准确性，提高了数据采集的效率。

图3是本申请的另一示例性实施例示出的炼钢厂数据采集方法的流程图，如图3所示，该炼钢厂数据采集方法包括：(1)构建特征提取模型，通过特征提取模型捕获时序数据中的内在结构特征；(2)采用基于时间序列特性和空间分布的数据密度估计方法，确定出动态阈值，并根据动态密度估计值与动态阈值的比对结果，识别出异常数据特征，并进行有针对性的数据采集；(3)根据动态调整的采集频率采集炼钢厂数据，并基于数据拓扑结构与多层次向量场的处理方法，剔除炼钢厂数据中的干扰数据。

在本实施例中，构建特征提取模型，通过特征提取模型捕获时序数据中的内在结构特征，有利于减少炼钢厂数据的维度或复杂性。

在本实施例中，采用基于时间序列特性和空间分布的数据密度估计方法，确定出动态阈值，并根据动态密度估计值与动态阈值的比对结果，识别出异常数据特征，可以对异常数据特征进行有针对性地数据采集，避免遗漏异常数据。

在本实施例中，基于数据拓扑结构与多层次向量场的处理方法，剔除炼钢厂数据中的干扰数据，有利于确保数据采集的准确性。

在本实施例中，采集设备通过传感器采集数据，根据时序数据的非线性数据特性，动态调整炼钢厂数据的采集频率，从而实现自适应采集。例如，在冶炼过程中，温度和化学成分在快速变化时，提高采集频率以获得更精确的数据；而在相对稳定的阶段，降低采集频率以减少数据处理负担。

在本实施例中，边缘计算节点通过接口与采集设备连接，实时监测炼钢过程中的参数变化数据，比如温度变化数据、压力变化数据和材料流量变化数据等。实时计算变化数据的非线性数据特性，当非线性数据特性超过动态阈值时，增加数据采集频率；当非线性数据特性低于动态阈值时，减少数据采集频率。

图4是本申请的另一示例性实施例示出的特征提取模型的结构图，如图4所示，该特征提取模型包括时间序列分析层、自注意力机制层、非线性变换层和多尺度分析层。

在本实施例中，时间序列分析层用于通过卷积核来捕获时间序列数据中的结构特征，有利于更好地理解数据的内在结构。

在本实施例中，自注意力机制层允许数据提取模型关注时序数据中的不同部分，通过关注生产过程中的异常时间点或异常结构特征，可以及时识别并处理潜在的生产问题。

在本实施例中，非线性变换层用于使得特征提取模型能够处理复杂且相互关联的生产数据，如温度、压力、材料比例，既能确保数据间的独立性，又能避免冗余和误差累积，正交约束通过正则化的权重矩阵引入，以确保得到的数据特征是正交的。

在本实施例中，多尺度分析层用于在不同时间尺度上捕获时序数据的非线性特征，从而得到时序数据在不同时间和空间尺度上的特征变化，如短期内的快速变化和长期趋势，以全面监控生产过程。

以下介绍本申请的装置实施例，可以用于执行本申请上述实施例中的炼钢厂数据采集方法。对于本申请装置实施例中未披露的细节，请参照本申请上述的炼钢厂数据采集方法的实施例。

图5是本申请的一示例性实施例示出的炼钢厂数据采集装置的框图。该装置可以应用于图1所示的实施环境，并具体配置在计算机设备102中。该装置也可以适用于其它的示例性实施环境，并具体配置在其它设备中，本实施例不对该装置所适用的实施环境进行限制。

如图5所示，该示例性的炼钢厂数据采集装置包括：

数据获取模块501用于获取炼钢厂当前生产过程的时序数据。

特征提取模块502用于将时序数据输入特征提取模型，得到非线性数据特征。

阈值确定模块503用于基于非线性数据特征的动态密度估计值，确定出动态阈值。

频率确定模块504用于根据动态密度估计值与动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对炼钢厂进行数据采集。

在本实施例中，时序数据的结构特征包括平稳的结构特征和非平稳的结构特征，其中，异常结构特征包括非平稳的结构特征等。

在本实施例中，动态密度估计值的计算公式如公式(1)所示，在此，不进行赘述。通过动态密度估计值的计算，为每个提取出的非线性数据特征分配一个权重，这个权重基于非线性数据特征的时间属性，这意味着与异常数据特征最近的数据特征会被赋予更高的权重。

在本实施例中，时间衰减函数的表达式如公式(2)所示，在此，不进行赘述。空间-时间核函数的表达式如公式(3)所示，在此，不进行赘述。

在本实施例中，动态阈值的计算公式如公式(4)所示，在此，不进行赘述。动态阈值是基于所有非线性数据特征的动态密度估计值d_t的均值和高斯核函数的标准差计算的。

在本实施例中，对于每个非线性数据特征，将其动态密度估计值d_t与动态阈值Φ进行比较，如果某个非线性数据特征的动态密度估计值大于动态阈值，那么，这个非线性数据特征被认为是异常数据特征(关键数据特征)。一旦识别出异常数据特征，则增加数据采样频率，以获得更详细的炼钢厂数据；相反，如果非线性数据特征小于或等于动态阈值，则降低数据采样频率，以减少炼钢厂数据的采集和处理负担，因此，动态数据密度估计方法解决了采用固定频率对炼钢厂进行数据采集带来的过度采集或采集量不足的技术问题，不仅可以更准确地识别出时序数据中的异常数据特征，而且可以提高炼钢厂数据的采集效率，能够帮助炼钢厂更好地监控和优化生产过程。

需要说明的是，上述实施例所提供的炼钢厂数据采集装置与上述实施例所提供的炼钢厂数据采集方法属于同一构思，其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述，此处不再赘述。上述实施例所提供的炼钢厂数据采集装置在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能，本处也不对此进行限制。

本申请的实施例还提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行时，使得电子设备实现上述各个实施例中提供的炼钢厂数据采集方法。

图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是，图6示出的电子设备的计算机系统600仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600包括中央处理单元(Central Processing Unit，CPU)601，其可以根据存储在只读存储器(Read-Only Memory，ROM)602中的程序或者从储存部分608加载到随机访问存储器(Random Access Memory，RAM)603中的程序而执行各种适当的动作和处理，例如执行上述实施例中的方法。在RAM 603中，还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(Input/Output，I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分607；包括硬盘等的储存部分608；以及包括诸如LAN(Local Area Network，局域网)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入储存部分608。

特别地，根据本申请的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本申请的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

本申请的另一方面还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被计算机的处理器执行时，使计算机执行如前所述的炼钢厂数据采集方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的，也可以是单独存在，而未装配入该电子设备中。

本申请的另一方面还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各个实施例中提供的炼钢厂数据采集方法。

上述实施例仅示例性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，但凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

Claims

1.一种炼钢厂数据采集方法，其特征在于，所述炼钢厂数据采集方法包括：

获取炼钢厂当前生产过程的时序数据；

将所述时序数据输入特征提取模型，得到非线性数据特征，所述特征提取模型由样本数据对预先构建的提取模型进行训练得到，所述预先构建的提取模型包括用于捕获结构特征的时间序列分析层、用于识别异常结构特征的自注意力机制层和用于提取非线性数据特征的非线性变换层，所述样本数据包括炼钢厂历史生产过程的全部或部分时序数据；

基于所述非线性数据特征的动态密度估计值，确定出动态阈值；

根据所述动态密度估计值与所述动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对所述炼钢厂进行数据采集。

2.根据权利要求1所述的炼钢厂数据采集方法，其特征在于，通过调整后的数据采集频率对所述炼钢厂进行数据采集后，所述炼钢厂数据采集方法包括：

基于采集得到的炼钢厂数据，构建多层次数据向量场，所述多层次数据向量场用于提取不同层次数据特征；

将所述多层次数据向量场输入预设干扰识别函数，得到干扰数据；

将所述干扰数据从所述炼钢厂数据中剔除，得到纯净的炼钢厂数据。

3.根据权利要求1或2的炼钢厂数据采集方法，其特征在于，根据所述动态密度估计值与所述动态阈值的比对结果，调整数据采集频率的过程包括：

获取所述时序数据的当前数据采集频率；

若所述动态密度估计值小于或等于所述动态阈值，则判定所述动态密度估计值对应的数据特征为正常数据特征，并将所述当前数据采集频率调整为第一数据采集频率，所述第一数据采集频率小于所述当前数据采集频率；

若所述动态密度估计值大于所述动态阈值，则判定所述动态密度估计值对应的数据特征为异常数据特征，并将所述当前数据采集频率调整为第二数据采集频率，所述第二数据采集频率大于所述当前数据采集频率。

4.根据权利要求1或2所述的炼钢厂数据采集方法，其特征在于，若所述预先构建的提取模型还包括用于提取不同尺度数据特征的多尺度分析层，则通过样本数据对预先构建的提取模型进行训练，得到特征提取模型的过程包括：

将所述样本数据输入所述时间序列分析层，得到结构特征；

将所述结构特征输入所述自注意力机制层，得到异常结构特征；

将所述异常结构特征输入所述非线性变换层，得到非线性数据特征；

将所述非线性数据特征输入所述多尺度分析层，得到不同尺度数据特征；

基于所述不同尺度数据特征和所述时序数据，构建损失函数，以最小化所述损失函数为目标，对所述时间序列分析层的参数、所述自注意力机制层的参数、所述非线性变换层的参数和所述多尺度分析层的参数进行更新；

将参数更新后的时间序列分析层、参数更新后的自注意力机制层、参数更新后的非线性变换层和参数更新后的多尺度分析层进行组合，得到所述特征提取模型。

5.根据权利要求4所述的炼钢厂数据采集方法，其特征在于，所述时间序列分析层的表达式为：

其中，ts(x)表示时序数据的结构特征，x表示时序数据，sigm表示激活函数，W_t表示权重，b_t表示偏置，β表示高斯积分的权重系数，T表示转置；

所述自注意力机制层的表达式为：

其中，Q、K、V分别表示自注意力机制层中的查询矩阵、键矩阵和值矩阵，a(ts)表示异常结构特征，T表示转置，d_k表示键的维度，ts表示结构特征；

所述非线性变换层的表达式为：

其中，f(a)表示非线性数据特征，W_f表示非线性变换层的权重矩阵，b_f表示非线性变换层的偏置向量，μ表示正则化系数，α表示正弦函数的权重系数，W_r表示正则化的权重矩阵，a表示异常结构特征；

所述多尺度分析层的表达式为：

其中，m(f)表示不同尺度数据特征，W_i表示第i个尺度的权重矩阵，σ_i表示第i个尺度的标准差，f表示非线性数据特征；

所述损失函数的表达式为：

其中，L表示损失函数，μ₁和μ₂均为正则化系数，h_i表示第i个尺度所在神经元的状态，F表示Frobenius范数，W_i表示第i个尺度的权重矩阵，x表示时序数据；

所述动态密度估计值的计算公式为：

其中，d_t(f)表示在时间t下非线性数据特征f的动态密度估计值，N表示非线性数据特征数量，K表示空间-时间核函数，用于测量非线性数据特征之间在空间和时间上的相似度，u表示非线性数据特征之间的空间距离，ω表示时间衰减函数，Δt表示非线性数据特征的任一时间t₀和当前时间t的时间差；

所述动态阈值的计算公式为：

6.根据权利要求2所述的炼钢厂数据采集方法，其特征在于，基于采集得到的炼钢厂数据，构建多层次数据向量场的过程包括：

将所述炼钢厂数据进行维度转化，得到数据点集；

基于所述数据点集，计算得到数据持续图；

基于所述数据持续图，计算得到所述多层次数据向量场。

7.根据权利要求6所述的炼钢厂数据采集方法，其特征在于，所述数据点集的表达式为：

P(t)＝M(U)＝exp(-k₁t²)U·sin(k₂t)+k₃tU

其中，k₁表示时间衰减因子，k₂表示周期性调节因子，t表示时间，k₃表示线性时间影响因子，U表示炼钢厂数据，M(U)表示将炼钢厂数据进行维度转化的映射函数，P(t)表示数据点集；

所述数据持续图的表达式为：

其中，λ表示衰减因子，P(t)表示数据点集，D(t)表示数据持续图，t表示时间；

所述多层次数据向量场的表达式为：

其中，V_k(t)表示在时间t时第k层数据向量场，表示梯度算子，γ表示权重参数，D_k(t′)表示在时间t′时第k层的数据持续图，t′∈[0，t]；

所述预设干扰识别函数的表达式为：

其中，Idf表示预设干扰识别函数，θ表示阈值函数，V_k(t)表示在时间t时第k层数据向量场，表示V_k(t)的平均向量，I_k(t)表示在时间t时第k层数据向量场中识别到的干扰数据；

所述纯净的炼钢厂数据的表达式为：

8.一种炼钢厂数据采集装置，其特征在于，所述炼钢厂数据采集装置包括：

数据获取模块，用于获取炼钢厂当前生产过程的时序数据；

特征提取模块，用于将所述时序数据输入特征提取模型，得到非线性数据特征，所述特征提取模型由样本数据对预先构建的提取模型进行训练得到，所述预先构建的提取模型包括用于捕获结构特征的时间序列分析层、用于识别异常结构特征的自注意力机制层和用于提取非线性数据特征的非线性变换层，所述样本数据包括炼钢厂历史生产过程的全部或部分时序数据；

阈值确定模块，用于基于所述非线性数据特征的动态密度估计值，确定出动态阈值；

频率确定模块，用于根据所述动态密度估计值与所述动态阈值的比对结果，调整数据采集频率，以通过调整后的数据采集频率对所述炼钢厂进行数据采集。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如权利要求1至7中任一项所述的炼钢厂数据采集方法。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行权利要求1至7中任一项所述的炼钢厂数据采集方法。