CN118569616B - 基于界面剂性能测试数据的智能生产管理方法与系统 - Google Patents
基于界面剂性能测试数据的智能生产管理方法与系统 Download PDFInfo
- Publication number
- CN118569616B CN118569616B CN202411060114.5A CN202411060114A CN118569616B CN 118569616 B CN118569616 B CN 118569616B CN 202411060114 A CN202411060114 A CN 202411060114A CN 118569616 B CN118569616 B CN 118569616B
- Authority
- CN
- China
- Prior art keywords
- data
- dimension
- outlier
- sample
- interface agent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 142
- 238000007726 management method Methods 0.000 title claims abstract description 41
- 238000011056 performance test Methods 0.000 title claims abstract description 26
- 238000012360 testing method Methods 0.000 claims abstract description 92
- 238000012417 linear regression Methods 0.000 claims abstract description 27
- 238000000034 method Methods 0.000 claims description 36
- 238000000611 regression analysis Methods 0.000 claims description 34
- 230000000875 corresponding effect Effects 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 20
- 230000002596 correlated effect Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000513 principal component analysis Methods 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 abstract description 13
- 239000003795 chemical substances by application Substances 0.000 description 119
- 238000004458 analytical method Methods 0.000 description 12
- 238000013507 mapping Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Manufacturing & Machinery (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Factory Administration (AREA)
Abstract
本发明涉及界面剂智能生产管理技术领域,具体涉及一种基于界面剂性能测试数据的智能生产管理方法与系统。本发明首先获取生产数据、测试性能数据和测试环境数据;进一步对生产数据进行降维并获取每个主要维度的重要程度参数;进一步获取每个界面剂样本的第一离群程度;进一步获取每个界面剂样本的第二离群程度;进一步获取每个界面剂样本的第三离群程度;进一步获取优化多元线性回归模型;最后对界面剂进行智能生产管理。本发明通过分析生产数据与测试性能数据之间离群相似性,结合测试环境数据的离群异常特征,使得回归模型避免样本偏差的问题,提高回归模型的拟合精度,从而对界面剂进行智能生产管理,提高生产效率,降低生产成本。
Description
技术领域
本发明涉及界面剂智能生产管理技术领域,具体涉及一种基于界面剂性能测试数据的智能生产管理方法与系统。
背景技术
传统的对于界面剂的测量通常遵循一系列国家标准,以确保产品质量和性能符合规定的要求,界面剂的成本和性能指标的关系存在一个平衡点,即在确保产品性能满足应用需求的同时,也要考虑成本效益,故考虑通过多个样本的生产数据以及其对应测试结果数据之间的关系,利用多元线性回归模型拟合二者之间的关系以进行成本的控制。
但由于在进行不同样本的生产过程中,企业仅根据现有的指标和标准进行生产,而没有考虑不同物质配比下多种情况的界面剂,这会导致所获取的多个样本无法较好的表示不同生产条件下的界面剂的性能,进而导致多元线性回归模型的精度较差,不利于对界面剂生产进行智能管理。
发明内容
为了解决现有多元线性回归模型对于界面剂生产测试数据的拟合精度较差,影响界面剂智能生产管理的技术问题,本发明的目的在于提供一种基于界面剂性能测试数据的智能生产管理方法与系统,所采用的技术方案具体如下:
一种基于界面剂性能测试数据的智能生产管理方法,所述方法包括:
获取预设测试界面剂样本集在生产过程中的生产数据、测试性能数据和测试环境数据;
利用非线性降维算法对所述生产数据进行降维,获取所述生产数据的主要维度,以及每个维度对于每个所述主要维度的降维贡献率;根据所述生产数据中每个界面剂样本在每个维度的数据分布,结合对应的所述降维贡献率,获取每个所述主要维度的重要程度参数;根据每个界面剂样本的数据在所有所述主要维度中的离群特征,结合对应的所述重要程度参数,获取所述生产数据中每个界面剂样本的第一离群程度;
获取所述测试性能数据中每个界面剂样本的第二离群程度;所述第二离群程度与所述第一离群程度的获取方法相同;根据所述测试环境数据中每个界面剂样本在所有维度的数据分布,获取所述测试环境数据中每个界面剂样本的第三离群程度;
根据每个界面剂样本的所述第一离群程度和所述第二离群程度的相似特征,结合所述第三离群程度,获取优化多元线性回归模型;
基于所述优化多元线性回归模型对界面剂进行智能生产管理。
进一步地,所述重要程度参数的获取方法包括:
在所述生产数据中,根据每个界面剂样本在每个维度中的数据占据对应整个维度数据的比例,获取每个界面剂样本在每个维度中的数据比重;基于所述数据比重,通过熵权法获取所述生产数据中每个维度的数据权重;
根据每个维度的所述数据权重和每个维度对于每个所述主要维度的降维贡献率,获取每个所述主要维度的重要程度参数;所述数据权重和所述降维贡献率均与所述重要程度参数正相关。
进一步地,所述重要程度参数的计算方法包括:
在所述生产数据中,选择任一所述主要维度作为目标主要维度;将每个维度与所述目标主要维度之间的所述降维贡献率与对应的所述数据权重的乘积作为重要程度子参数;将目标主要维度的所有所述重要程度子参数的均值作为重要程度参数。
进一步地,所述第一离群程度的获取方法包括:
将任一界面剂样本作为目标样本;
在所述生产数据中,获取所述目标样本在所述目标主要维度的样本值与整个所述目标主要维度的样本均值的差值绝对值,作为所述目标样本在所述目标主要维度的偏离参数;获取所述目标主要维度的样本值的标准差;根据所述目标主要维度的所述偏离参数和所述标准差,获取所述目标样本在所述目标主要维度的离群参数;所述标准差与所述离群参数负相关;所述偏离参数与所述离群参数正相关;
根据所述重要程度参数和所述离群参数,获取所述目标样本在所述目标主要维度的加权离群参数;所述重要程度参数和所述离群参数均与所述加权离群参数正相关;
在所述生产数据中,将所述目标样本对应的所有所述主要维度的所述加权离群参数的均值作为第一离群程度。
进一步地,所述第三离群程度的获取方法包括:
在所述测试环境数据中,选择任一维度为目标维度;获取所述目标维度中样本值的标准差和所述偏离参数;根据目标维度的所述偏离参数和所述标准差,获取所述目标样本在所述目标维度的离群参数;
在所述测试环境数据中,将所述目标样本对应的所有维度的所述离群参数的均值作为第三离群程度。
进一步地,所述离群参数的获取方法包括:
将所述目标样本同一维度的所述偏离参数与所述标准差的比值作为对应维度的所述离群参数。
进一步地,所述优化多元线性回归模型的获取方法包括:
根据每个界面剂样本的所述第一离群程度和第二离群程度的相似特征,获取每个界面剂样本的可参考性权重;根据每个界面剂样本的所述可参考性权重,所述第一离群程度和所述第三离群程度,获取每个界面剂样本的回归分析贡献率;所述可参考性权重和所述第一离群程度均与所述回归分析贡献率正相关;所述第三离群程度与所述回归分析贡献率负相关;
利用每个界面剂样本的所述回归分析贡献率,对每个样本参与损失函数计算时进行加权,获得优化多元线性回归模型。
进一步地,所述回归分析贡献率的获取方法包括:
将每个界面剂样本的所述可参考性权重与所述第三离群程度的比值再和所述第一离群程度求得的乘积,作为每个界面剂样本的回归分析贡献率。
进一步地,所述对所述生产数据进行降维,获取生产数据的主要维度及每个维度对于每个所述主要维度的降维贡献率所使用的降维方法为核主要成分分析算法。
本发明还提出了一种基于界面剂性能测试数据的智能生产管理系统,所述系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现任意一项所述一种基于界面剂性能测试数据的智能生产管理方法的步骤。
本发明具有如下有益效果:
本发明首先获取预设测试界面剂样本集在生产过程中的生产数据、测试性能数据和测试环境数据,为后续分析过程提供数据基础;进一步利用非线性降维算法对生产数据进行降维,获取生产数据的主要维度,以及每个维度对于每个主要维度的降维贡献率,降低后续回归分析的计算量大小,同时挖掘生产数据的非线性成分,便于后续更好的对数据进行回归模型拟合;进一步获取每个主要维度的重要程度参数,表征主要维度的重要程度,为后续分析更准确的离群特征做准备;进一步获取生产数据中每个界面剂样本的第一离群程度,用以表征界面剂样本在生产数据中的离群特征,为后续验证生产数据与测试数据离群一致性,排除噪声干扰,提供依据;进一步获取测试性能数据中每个界面剂样本的第二离群程度,为后续验证生产数据与测试数据离群一致性补充依据;进一步获取测试环境数据中每个界面剂样本的第三离群程度,表征测试环境的异常程度,用于修正测试结果的可靠性,提升回归模型拟合精度;进一步验证每个界面剂样本的第一离群程度和第二离群程度的相似特征,降低异常数据干扰,结合第三离群程度对测试结果可靠性进行修正,获取优化多元线性回归模型,为界面剂智能生产管理提供依据;最后基于优化多元线性回归模型对界面剂进行智能生产管理。本发明通过分析生产数据与测试性能数据之间离群相似性,结合测试环境数据的离群异常特征,使得回归模型避免样本偏差的问题,提高回归模型的拟合精度,从而对界面剂进行智能生产管理,提高生产效率,降低生产成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于界面剂性能测试数据的智能生产管理方法的流程图;
图2为本发明一个实施例所提供的一种第一离群程度的计算方法流程图;
图3为本发明一个实施例所提供的一种优化多元线性回归模型的获取方法的流程图;
图4为本发明一个实施例所提供的一种基于界面剂性能测试数据的智能生产管理系统示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于界面剂性能测试数据的智能生产管理方法与系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于界面剂性能测试数据的智能生产管理方法与系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于界面剂性能测试数据的智能生产管理方法的流程图,具体包括:
步骤S1:获取预设测试界面剂样本集在生产过程中的生产数据、测试性能数据和测试环境数据。
考虑到界面剂在生产时的成分配比、材料性状等会影响到界面剂产品的性能,同时测试环境也会影响到界面剂产品的性能表现,所以获取预设测试界面剂样本集在生产过程中的生产数据、测试性能数据和测试环境数据,为后续分析提供数据基础。
在本发明一个实施例中,每个界面剂样本的生产数据至少包括:不同组分的纯度百分比、组分之间的配比数据、混合溶液的温度、PH值,作为后续回归分析中的解释变量;测试性能数据至少包括:表干时间、实干时间、不挥发物含量,作为后续回归分析中的被解释变量;测试环境数据至少包括环境温度、湿度;在标准的测定法下,测试环境中的环境数据应当是满足规定的固定值,但测试结果可能会由于部分环境因素的变化,导致其测试结果中的部分数据产生异常,故需要基于测试环境数据进行后续回归过程的修正。
需要说明的是,各项数据指标计量单位不统一,获得的生产数据、测试性能数据和测试环境数据均经过归一化处理,消除量纲影响。
需要说明的是,样本集的数量由实施者自行设定,回归模型处理的数据的维度越多,样本集的数量应当越多,以保证具有足够的数据样本作为分析基础;在本发明其他实施例中,实施者可以根据实际界面剂生产需要,调整所需要的监测数据的种类和数量,在此不再进行赘述。
步骤S2:利用非线性降维算法对生产数据进行降维,获取生产数据的主要维度,以及每个维度对于每个主要维度的降维贡献率;根据生产数据中每个界面剂样本在每个维度的数据分布,结合对应的降维贡献率,获取每个主要维度的重要程度参数;根据每个界面剂样本的数据在所有主要维度中的离群特征,结合对应的重要程度参数,获取生产数据中每个界面剂样本的第一离群程度。
理论上最好的测试样本集应该是包含所有不同目标物质含量与不同材质浓度含量的情况,但由于实际生产过程中,受限于设备或者其他原因,以及测试成本,所获取的样本不会遍历所有的情况,导致所获取多个样本数据产生样本偏差的问题,而离群数据可以丰富样本数据空间,有利于回归分析时提高模型拟合的准确性,但离群数据也有可能是异常噪声数据,为了排除异常数据噪声干扰,需要首先分析各个样本在其对应数据空间中的离群程度大小,进而在后续可以根据各个测试样本在不同类型数据下的离群程度,验证生产数据表现离群时,测试性能数据是否表现出一致性,对后续回归分析进行修正。
在本发明实施例中,考虑到生产数据中存在多个数据维度,其各个维度数据对于最终测试结果的影响大小是不同的,且二者之间的关系并不一定是线性的关系,故直接利用生产数据对测试结果进行回归分析时,可能无法较好的表示二者之间的非线性关系,同时非主要维度的数据可能影响回归模型的精度,所以在进行回归分析之前,对所获取的多维度数据进行降维,可以降低后续回归分析的计算量大小,同时挖掘生产数据的非线性成分,并获得每个维度对于每个主要维度的降维贡献率,便于后续更好的对数据进行回归模型拟合。
优选地,在本发明一个实施例中,考虑到核主成分分析(Kernel PrincipalComponents Analysis,KPCA)在处理非线性数据和保留数据结构方面具有一定的优势,特别是当数据包含复杂的非线性关系时,KPCA可以提供更好的特征提取和降维效果,所以采用KPCA降维算法;在本发明其他实施例中,实施者也可以采用自编码器等其他非线性降维算法进行分析,其与KPCA均为本领域技术人员所熟知的技术手段,在此不再进行赘述。
考虑到每个数据维度内数据的分布特征不同,蕴含信息量不同,对于后续回归分析时的影响程度不同,而每个维度对于主要维度具有一个降维贡献率,任一数据维度蕴含的信息越多,对任一主要维度的降维贡献率越大,说明对应主要维度对于后续回归模型的重要程度越高,同时对应主要维度表现出的界面剂样本的生产数据的离群特征的参考性越强,所以获取每个主要维度的重要程度参数具有重要意义;因此根据生产数据中每个界面剂样本在每个维度的数据分布,结合对应的降维贡献率,获取每个主要维度的重要程度参数。
优选地,在本发明一个实施例中,考虑到熵权法能够考虑到各指标之间的相互关系,不会忽略任何一个指标的重要性,并且不需要假设指标之间的线性关系,可以便捷获取各指标的权重,而本发明实施例中一个监测指标对应一个数据维度,所以能够获取每个维度的数据权重;而数据维度的数据权重越大、对于主要维度的降维贡献率越高,对应主要维度的重要程度就越大,所以数据权重和降维贡献率均与重要程度参数正相关;
基于此,在生产数据中,根据每个界面剂样本在每个维度中的数据占据对应整个维度数据的比例,获取每个界面剂样本在每个维度中的数据比重;基于数据比重,通过熵权法获取生产数据中每个维度的数据权重;
根据每个维度的数据权重和每个维度对于每个主要维度的降维贡献率,获取每个主要维度的重要程度参数。
在本发明一个实施例中,在生产数据中,选择任一主要维度作为目标主要维度;将每个维度与目标主要维度之间的降维贡献率与对应的数据权重的乘积作为重要程度子参数;将目标主要维度的所有重要程度子参数的均值作为重要程度参数,重要程度参数的计算公式包括:
;
其中,表示生产数据中主要维度的序号;表示第个主要维度的重要程度参数;表示生产数据的数据维度的总数;表示生产数据的数据维度的序号;表示第个维度对于第个主要维度的降维贡献率;表示第个维度的数据权重,,表示以自然常数为底数的对数函数,表示界面剂样本的序号,表示界面剂样本的数量,表示第个界面剂样本的数据在第个维度的数据比重,,表示第个界面剂样本的数据在第个维度的数据值。
重要程度参数的计算公式中,越大,说明数据维度对于主要维度的影响程度越大,降维贡献率越高,以此作为数据维度对于主要维度的影响参数;同时越大,说明数据维度的数据权重越高,包含的信息量越多,对于后续回归模型分析更重要,重要程度参数就越大。通过每个数据维度的自身数据权重以及自身对于主要维度的降维贡献率,反映出主要维度的重要性,为后续更准确地分析样本离群特征做准备。
需要说明的是,在本发明其他实施例中,也可选用其他基础数学运算或者函数映射实现相关映射,其均为本领域技术人员熟知的技术手段,在此不做赘述。
其中,正相关关系表示因变量会随着自变量的增大而增大,因变量会随着自变量的减小而减小,具体关系可以为相乘关系、相加关系、指数函数的幂等,由实际应用进行确定;负相关关系表示因变量会随着自变量的增大而减小,因变量会随着自变量的减小而增大,可以为相减关系、相除关系等,由实际应用进行确定。
熵权法的具体过程可参见链接:https://blog.csdn.net/weixin_53972936/article/details/122782969?spm=1001.2014.3001.5502,在此不再进行赘述;在本发明其他实施例中,实施者也可以针对数据的离散分布进行分析:例如数据聚类,孤立森林算法等,数据分布越离散,说明数据样本空间越完备,提供的信息越多,越有利于回归模型分析,数据权重就越大,其均为本领域技术人员所熟知的技术手段,在此不再进行赘述。
对每个主要维度的重要程度进行评估后,就可以根据界面剂样本在每个主要维度表现出的离群特征,结合对应的重要程度参数,获取准确的第一离群程度。
优选地,在本发明一个实施例中,第一离群程度的获取方法包括:
请参阅图2,其示出了本发明一个实施例所提供的一种第一离群程度的计算方法流程图。
首先将任一界面剂样本作为目标样本,将任一主要维度作为目标主要维度;便于后续对界面剂样本进行逐个分析和描述;
步骤S101:在生产数据中,获取目标样本在目标主要维度的样本值与整个目标主要维度的样本均值的差值绝对值,作为目标样本在目标主要维度的偏离参数;获取目标主要维度的样本值的标准差;根据目标主要维度的偏离参数和标准差,获取目标样本在目标主要维度的离群参数。
考虑到目标样本的样本值与整个维度中所有样本的样本均值的差异越大,说明目标样本在目标主要维度中表现出的偏离整体样本的特征越明显,所以获取目标样本在目标主要维度的样本值与整个目标主要维度的样本均值的差值绝对值,作为目标样本在目标主要维度的偏离参数,偏离参数就越大,离群参数就越大,偏离参数与离群参数正相关;又考虑到目标主要维度的样本值的标准差越小,说明数据整体越集中,偏离参数所表现出的离群特征就越明显,离群参数就越大,所以标准差与离群参数负相关;根据偏离参数和标准差,获取目标样本在目标主要维度的离群参数。
在本发明一个实施例中,将目标样本同一维度的偏离参数与标准差的比值作为对应维度的离群参数。
在本发明其他实施例中,实施者也可以选用其他基础数学运算或者函数映射实现相关映射,例如借助指数函数进行映射;实施者也可以利用孤立森林算法或者聚类算法的聚类距离,分析目标样本的离群特征,获取离群参数,其均为本领域技术人员所熟知的技术手段,在此不再进行赘述。
步骤S102:根据重要程度参数和离群参数,获取目标样本在目标主要维度的加权离群参数。
获得目标样本在目标主要维度离群参数后,就可以通过目标主要维度的重要程度参数,对离群参数进行加权,重要程度参数越大,说明目标主要维度的重要程度越大、参考性越强,所以重要程度参数与加权离群参数正相关;同时离群参数越大,说明目标样本的离群特征越明显,加权离群参数就越大离群参数与加权离群参数正相关。
在本发明一个实施例中,将目标样本在目标主要维度的离群参数和目标主要维度对应的重要程度参数的乘积作为加权离群参数。在本发明其他实施例中,实施者也可以选用其他基础数学运算或者函数映射实现相关映射,例如借助指数函数进行映射,调整敏感度,其均为本领域技术人员所熟知的技术手段,在此不再进行赘述。
遍历所有主要维度,获取目标样本对应每个主要维度的加权离群参数。
步骤S103:在生产数据中,将目标样本对应的所有主要维度的加权离群参数的均值作为第一离群程度。
由于生产数据中的目标样本涉及多个主要维度,并且加权离群参数经过每个主要维度自身的重要程度参数进行加权,所以将目标样本对应的所有主要维度的加权离群参数的均值作为第一离群程度。
遍历所有界面剂样本,获取所有界面剂样本的第一离群程度。
步骤S3:获取测试性能数据中每个界面剂样本的第二离群程度;第二离群程度与第一离群程度的获取方法相同;根据测试环境数据中每个界面剂样本在所有维度的数据分布,获取测试环境数据中每个界面剂样本的第三离群程度。
在本发明实施例中,考虑到生产参数会影响到界面剂产品的性能表现,为了挖掘生产数据和测试性能数据之间的非线性关系,所以采用相同的方法获取测试性能数据中每个界面剂样本的第二离群程度。而测试环境数据是由具体测试过程中的环境参数获得,与生产参数和测试性能参数无关,所以采用不同的计算方法获取第三离群程度,第三离群程度越大,说明测试环境数据越异常,测试环境可靠性越低,测试结果可靠性就越低,用于修正测试结果的可靠性。
考虑到界面剂样本在测试环境数据的所有维度中的分布越异常,离群特征越明显,第三离群程度越大,所以根据测试环境数据中每个界面剂样本在所有维度的数据分布,获取测试环境数据中每个界面剂样本的第三离群程度。
优选地,在本发明一个实施例中,在测试环境数据中,选择任一维度为目标维度;获取目标维度中样本值的标准差和偏离参数;根据目标维度的偏离参数和标准差,获取目标样本在目标维度的离群参数;
在测试环境数据中,将目标样本对应的所有维度的离群参数的均值作为第三离群程度。
具体实现过程与步骤S101和步骤S102中所描述的过程相同,在此不再进行赘述。
步骤S4:根据每个界面剂样本的第一离群程度和第二离群程度的相似特征,结合第三离群程度,获取优化多元线性回归模型。
获取表征界面剂样本在生产数据中离群特征的第一离群程度,表征界面剂样本在测试性能数据中离群特征的第二离群程度,以及表征测试环境可靠性和稳定性的第三离群程度后,就可以验证生产数据表现离群时,测试性能数据是否表现出相似的离群特征,以排除异常噪声数据干扰,同时利用第三离群程度对测试结果的可信度进行修正,所以根据每个界面剂样本的第一离群程度和第二离群程度的相似特征,结合第三离群程度,获取优化多元线性回归模型。
优选地,在本发明一个实施例中,优化多元线性回归模型的获取方法包括:
请参阅图3,其示出了本发明一个实施例所提供的一种优化多元线性回归模型的获取方法的流程图。
步骤S201:根据每个界面剂样本的第一离群程度和第二离群程度的相似特征,获取每个界面剂样本的可参考性权重;根据每个界面剂样本的可参考性权重,第一离群程度和第三离群程度,获取每个界面剂样本的回归分析贡献率。
考虑到生产数据的离群程度并不一定能够表示该样本的异常,其可能是由于同种型号界面剂的生产批次不同,在生产过程中的正常误差所导致的,例如界面剂的各个组分的纯度信息,其受到在前批次生产过程中遗留的杂质或其他因素的影响,导致生产出的界面剂与其与样本之间存在一定的差异,但在一定生产误差范围内,保证界面剂性能的同时,该样本的离群程度越高,因为使得数据空间更加完备,第一离群程度与回归分析贡献率正相关;也有可能是不同型号的界面剂的成分配比不同,其会影响到测试性能数据的表现,更容易揭示生产数据对应界面剂产品性能的影响,提高多元线性回归模型的鲁棒性,利用该样本进行回归分析时对于模型拟合的准确性也会有一定的提高;但当第一离群程度和第二离群程度的差异越大时,有可能说明产品生产参数调整对性能的影响不大,更有可能反映出样本的监测数据出现异常,可参考性越低,可参考性权重越小;
同时,测试环境数据的第三离群程度越小,说明测试环境越稳定,测试结果的可靠性越强,所以第三离群程度与回归分析贡献率负相关;
在本发明一个实施例中,考虑到对勾函数的图像为两支勾形曲线,通过限制定义域为正半轴,曲线仅剩一支且存在最小值,所以借助对勾函数分析的相似性,获取可参考性权重;
将每个界面剂样本的可参考性权重与第三离群程度的比值再和第一离群程度求得的乘积,作为每个界面剂样本的回归分析贡献率。回归分析贡献率的计算公式包括:
;
其中,表示界面剂样本的序号;表示第个界面剂样本的回归分析贡献率;表示以自然常数为底数的指数函数;表示归一化函数,并且所有归一化结果的和值为1;表示第个界面剂样本的第一离群程度;表示第个界面剂样本的第二离群程度;表示第个界面剂样本的第三离群程度;表示预设常数,,防止分母为零,在本发明一个实施例中,。
回归分析贡献率的计算公式中,由于对勾函数的特性,当且仅当时,取得最小值2,此时可参考性权重取得最大值为1,当第一离群程度和第二离群程度差异越大时,说明测试样本的数据越有可能受噪声干扰,异常程度越大,对勾函数值越大,经过负相关映射后的可参考性权重越小,回归分析贡献率越小;越大,代表测试环境数据的离群程度越大,测试环境越异常,测试结果的可靠性就越低,所以回归分析贡献率越小。越小,说明当前界面剂样本的生产数据离群程度越低,信息重复度越高,局限性越高,对于分析回归模型的作用越小,回归分析贡献率越小。
需要说明的是,在本发明其他实施例中,也可选用其他基础数学运算或者函数映射实现相关映射,其均为本领域技术人员熟知的技术手段,在此不做赘述。
步骤S202:利用每个界面剂样本的回归分析贡献率,对每个样本参与损失函数计算时进行加权,获得优化多元线性回归模型。
在本发明一个实施例中,优化损失函数的计算公式包括:
;
其中,表示优化后的损失函数;表示界面剂样本的序号;表示界面剂样本的数量;表示最大最小值归一化函数;表示第个界面剂样本的回归分析贡献率;表示表示第个界面剂样本的维的测试性能数据;表示维的待求解的优化系数矩阵;表示第个界面剂样本的维的主要维度的生产数据,表示维的待求解的优化偏置向量。
进而获得优化多元线性回归模型,对于新增样本,代入优化后的回归模型,即可获得预测结果,具体计算公式包括:
;
其中,表示新增样本的序号;新增样本的预测结果;表示维的优化系数矩阵;表示新增样本的降维结果,即为第个新增样本的维的主要维度的生产数据;表示维的优化偏置向量。
步骤S5:基于优化多元线性回归模型对界面剂进行智能生产管理。
获得优化多元线性回归模型之后,就可以进行智能生产管理,例如型号为甲的界面剂需要调整性能参数A,达到A+,可以通过回归模型调整已有生产配方,增加某组分的浓度或含量,减少修改配方时的时间成本和物质成本,提高生产效率;还例如某种生产材料的原材料价格发生变化,可以利用回归模型进行模拟预测,以实现在满足界面剂性能测试的基础上,降低生产成本。
本发明一个实施例还提供了一种基于界面剂性能测试数据的智能生产管理系统,请参阅图4,该系统包括存储器401、处理器402和计算机程序403,其中存储器401用于存储相应的计算机程序403,处理器402用于运行相应的计算机程序403,计算机程序403在处理器402中运行时能够实现步骤S1-S5所描述的一种基于界面剂性能测试数据的智能生产管理方法。
综上所述,本发明针对现有多元线性回归模型对于界面剂生产测试数据的拟合精度较差,影响界面剂智能生产管理的技术问题,提出了一种基于界面剂性能测试数据的智能生产管理方法与系统。本发明首先获取预设测试界面剂样本集在生产过程中的生产数据、测试性能数据和测试环境数据;进一步利用非线性降维算法对生产数据进行降维,获取每个主要维度的重要程度参数;进一步获取生产数据中每个界面剂样本的第一离群程度;进一步获取测试性能数据中每个界面剂样本的第二离群程度;进一步获取测试环境数据中每个界面剂样本的第三离群程度;进一步获取优化多元线性回归模型;最后基于优化多元线性回归模型对界面剂进行智能生产管理。本发明通过分析生产数据与测试性能数据之间离群相似性,结合测试环境数据的离群异常特征,使得回归模型避免样本偏差的问题,提高回归模型的拟合精度,从而对界面剂进行智能生产管理,提高生产效率,降低生产成本。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (9)
1.一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述方法包括:
获取预设测试界面剂样本集在生产过程中的生产数据、测试性能数据和测试环境数据;
利用非线性降维算法对所述生产数据进行降维,获取所述生产数据的主要维度,以及每个维度对于每个所述主要维度的降维贡献率;根据所述生产数据中每个界面剂样本在每个维度的数据分布,结合对应的所述降维贡献率,获取每个所述主要维度的重要程度参数;根据每个界面剂样本的数据在所有所述主要维度中的离群特征,结合对应的所述重要程度参数,获取所述生产数据中每个界面剂样本的第一离群程度;
获取所述测试性能数据中每个界面剂样本的第二离群程度;所述第二离群程度与所述第一离群程度的获取方法相同;根据所述测试环境数据中每个界面剂样本在所有维度的数据分布,获取所述测试环境数据中每个界面剂样本的第三离群程度;
根据每个界面剂样本的所述第一离群程度和所述第二离群程度的相似特征,结合所述第三离群程度,获取优化多元线性回归模型;
基于所述优化多元线性回归模型对界面剂进行智能生产管理;
所述优化多元线性回归模型的获取方法包括:
根据每个界面剂样本的所述第一离群程度和第二离群程度的相似特征,获取每个界面剂样本的可参考性权重;根据每个界面剂样本的所述可参考性权重,所述第一离群程度和所述第三离群程度,获取每个界面剂样本的回归分析贡献率;所述可参考性权重和所述第一离群程度均与所述回归分析贡献率正相关;所述第三离群程度与所述回归分析贡献率负相关;
利用每个界面剂样本的所述回归分析贡献率,对每个样本参与损失函数计算时进行加权,获得优化多元线性回归模型。
2.根据权利要求1所述的一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述重要程度参数的获取方法包括:
在所述生产数据中,根据每个界面剂样本在每个维度中的数据占据对应整个维度数据的比例,获取每个界面剂样本在每个维度中的数据比重;基于所述数据比重,通过熵权法获取所述生产数据中每个维度的数据权重;
根据每个维度的所述数据权重和每个维度对于每个所述主要维度的降维贡献率,获取每个所述主要维度的重要程度参数;所述数据权重和所述降维贡献率均与所述重要程度参数正相关。
3.根据权利要求2所述的一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述重要程度参数的计算方法包括:
在所述生产数据中,选择任一所述主要维度作为目标主要维度;将每个维度与所述目标主要维度之间的所述降维贡献率与对应的所述数据权重的乘积作为重要程度子参数;将目标主要维度的所有所述重要程度子参数的均值作为重要程度参数。
4.根据权利要求3所述的一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述第一离群程度的获取方法包括:
将任一界面剂样本作为目标样本;
在所述生产数据中,获取所述目标样本在所述目标主要维度的样本值与整个所述目标主要维度的样本均值的差值绝对值,作为所述目标样本在所述目标主要维度的偏离参数;获取所述目标主要维度的样本值的标准差;根据所述目标主要维度的所述偏离参数和所述标准差,获取所述目标样本在所述目标主要维度的离群参数;所述标准差与所述离群参数负相关;所述偏离参数与所述离群参数正相关;
根据所述重要程度参数和所述离群参数,获取所述目标样本在所述目标主要维度的加权离群参数;所述重要程度参数和所述离群参数均与所述加权离群参数正相关;
在所述生产数据中,将所述目标样本对应的所有所述主要维度的所述加权离群参数的均值作为第一离群程度。
5.根据权利要求4所述的一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述第三离群程度的获取方法包括:
在所述测试环境数据中,选择任一维度为目标维度;获取所述目标维度中样本值的标准差和所述偏离参数;根据目标维度的所述偏离参数和所述标准差,获取所述目标样本在所述目标维度的离群参数;
在所述测试环境数据中,将所述目标样本对应的所有维度的所述离群参数的均值作为第三离群程度。
6.根据权利要求4或5所述的一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述离群参数的获取方法包括:
将所述目标样本同一维度的所述偏离参数与所述标准差的比值作为对应维度的所述离群参数。
7.根据权利要求1所述的一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述回归分析贡献率的获取方法包括:
将每个界面剂样本的所述可参考性权重与所述第三离群程度的比值再和所述第一离群程度求得的乘积,作为每个界面剂样本的回归分析贡献率。
8.根据权利要求1所述的一种基于界面剂性能测试数据的智能生产管理方法,其特征在于,所述对所述生产数据进行降维,获取生产数据的主要维度及每个维度对于每个所述主要维度的降维贡献率所使用的降维方法为核主要成分分析算法。
9.一种基于界面剂性能测试数据的智能生产管理系统,所述系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~8任意一项所述一种基于界面剂性能测试数据的智能生产管理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202411060114.5A CN118569616B (zh) | 2024-08-05 | 2024-08-05 | 基于界面剂性能测试数据的智能生产管理方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202411060114.5A CN118569616B (zh) | 2024-08-05 | 2024-08-05 | 基于界面剂性能测试数据的智能生产管理方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118569616A CN118569616A (zh) | 2024-08-30 |
CN118569616B true CN118569616B (zh) | 2024-10-25 |
Family
ID=92469774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202411060114.5A Active CN118569616B (zh) | 2024-08-05 | 2024-08-05 | 基于界面剂性能测试数据的智能生产管理方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118569616B (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180336561A1 (en) * | 2017-05-17 | 2018-11-22 | Mastercard International Incorporated | Spend-profile based transaction value limits for pin-less contactless payment-card authorizations |
CN108490904B (zh) * | 2018-05-10 | 2020-02-04 | 东北大学 | 一种基于设备多工况运行的能源系统优化调度方法 |
CN111732859A (zh) * | 2020-07-12 | 2020-10-02 | 西卡(上海)管理有限公司 | 一种低粘度界面剂及抗分水检测方法 |
CN115979509B (zh) * | 2022-12-13 | 2024-07-26 | 国家石油天然气管网集团有限公司 | 一种压力变送器故障检测方法、装置及存储介质 |
CN118153763A (zh) * | 2024-03-22 | 2024-06-07 | 山里质造云南农业科技发展有限公司 | 一种茶叶存储时间的预测方法 |
-
2024
- 2024-08-05 CN CN202411060114.5A patent/CN118569616B/zh active Active
Non-Patent Citations (1)
Title |
---|
页岩气井产量上升阶段开发指标的预测方法;王勇;张林霞;;石油化工应用;20200725(第07期);正文79-80 * |
Also Published As
Publication number | Publication date |
---|---|
CN118569616A (zh) | 2024-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110728008B (zh) | 一种用于确定智能电表的期望寿命的方法及装置 | |
CN112907062B (zh) | 融合温度特征的电网电量预测方法、装置、介质及终端 | |
CN110751339A (zh) | 管道腐蚀速率预测的方法、装置和计算机设备 | |
CN117710008B (zh) | 一种适用于喀斯特地区生态产品销售信息管理系统 | |
CN113869642A (zh) | 企业活跃度确定方法、装置、电子设备及存储介质 | |
CN118569616B (zh) | 基于界面剂性能测试数据的智能生产管理方法与系统 | |
CN112215398A (zh) | 电力用户负荷预测模型建立方法、装置、设备及存储介质 | |
CN115798593A (zh) | 一种基于图神经网络自监督聚类的单细胞识别方法及设备 | |
CN111429979A (zh) | 一种基于支持向量机分位数回归的钢材力学性能预测方法 | |
CN118329807B (zh) | 一种钼铁合金的成分含量精确测量方法及系统 | |
CN115687877A (zh) | 工业互联网的光电传感器精度控制方法、系统及电子设备 | |
CN113869556A (zh) | 一种用电量预测方法、装置及设备 | |
CN108491955A (zh) | 一种集成指标筛选与气温校正的月度工业用电量预测方法 | |
CN109858699B (zh) | 水质定量模拟方法、装置、电子设备及存储介质 | |
CN114441469A (zh) | 水分仪的校准方法、装置和计算机设备 | |
CN118396239B (zh) | 一种用于电厂的减污降碳效果评估方法 | |
CN114662050A (zh) | 物联网曲线回归多项式负荷能耗计量方法、介质和设备 | |
CN112581311A (zh) | 一种多风电场聚合后出力长期波动特性预测方法及系统 | |
CN118551230B (zh) | 一种高强度防护涂料自动化生产线的运行监测方法 | |
CN115481906B (zh) | 一种生产制造产线评估方法、装置、设备及介质 | |
CN112418611B (zh) | 湖泊叶绿素与营养盐关系时间稳定性判定方法及电子设备 | |
CN118037472B (zh) | 财务数据处理方法及相关装置 | |
CN114386196B (zh) | 一种板带力学性能预测准确性评估方法 | |
CN110070290A (zh) | 一种配电自动化水平综合评价方法及其相应组件 | |
CN114218819B (zh) | 基于自适应元模型的复杂结构有限元参数区间的修正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |