Nothing Special   »   [go: up one dir, main page]

CN110918651A - 基于多分类支持向量机的钢铁冷轧精整生产原料分配方法 - Google Patents

基于多分类支持向量机的钢铁冷轧精整生产原料分配方法 Download PDF

Info

Publication number
CN110918651A
CN110918651A CN201911239815.4A CN201911239815A CN110918651A CN 110918651 A CN110918651 A CN 110918651A CN 201911239815 A CN201911239815 A CN 201911239815A CN 110918651 A CN110918651 A CN 110918651A
Authority
CN
China
Prior art keywords
raw material
finishing production
cold rolling
sample set
steel cold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911239815.4A
Other languages
English (en)
Other versions
CN110918651B (zh
Inventor
王显鹏
张云佳
董志明
唐立新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201911239815.4A priority Critical patent/CN110918651B/zh
Publication of CN110918651A publication Critical patent/CN110918651A/zh
Application granted granted Critical
Publication of CN110918651B publication Critical patent/CN110918651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B37/00Control devices or methods specially adapted for metal-rolling mills or the work produced thereby
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mechanical Engineering (AREA)
  • General Factory Administration (AREA)

Abstract

本发明涉及钢铁企业冷轧精整生产过程的自动控制技术领域,提供一种基于多分类支持向量机的钢铁冷轧精整生产原料分配方法。首先采集精整生产样本集合;然后对精整生产样本集合依次进行特征一次选择、One‑Hot编码、基于随机森林模型的特征二次选择、数据标准化;接着,在任意两类样本间构建子学习机,H个子学习机构成基于多分类支持向量机的钢铁冷轧精整生产原料分配模型,并基于贝叶斯优化方法对模型参数进行优化,选择出准确率最高的超参数组合,得到训练后的原料分配模型;最后,采集待分配原料的信息数据,将数据清洗后的特征输入训练后的原料分配模型中,得到原料分配结果。本发明能够提高原料分配的精度和效率,减小工人的工作量。

Description

基于多分类支持向量机的钢铁冷轧精整生产原料分配方法
技术领域
本发明涉及钢铁企业冷轧精整生产过程的自动控制技术领域,特别是涉及一种基于多分类支持向量机的钢铁冷轧精整生产原料分配方法。
背景技术
精整是钢铁企业冷轧生产的一道重要工序。在实际生产过程中,精整工序的原料来自连退工序,连退后的原料首先会被分配到精整工序的原料池中,然后各精整机组从相应的原料池中获得原料以进行精整生产。实际生产中采用人工经验的方法将原料分配到各个原料池中,这种方法严重依赖人工操作经验,且由于精整工序的原料众多,工人的工作量巨大。当前针对钢铁冷轧精整生产原料分配的非人工方法还非常缺乏。
发明内容
针对现有技术存在的问题,本发明提供一种基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,能够提高原料分配的精度和效率,减小工人的工作量。
本发明的技术方案为:
一种基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,其特征在于,包括下述步骤:
步骤1:采集最近t时间段内钢铁冷轧的精整生产样本,得到含有M个精整生产样本的精整生产样本集合S={S1,S2,...,Sm,...,SM};
其中,Sm为第m个精整生产样本,m∈{1,2,...,M},Sm={Sm1,Sm2,...,Smn,...,Sm,N,ym},{Sm1,Sm2,...,Smn,...,SM,N}为样本Sm的原料信息数据,Smn为样本Sm的原料信息数据中的第n个特征,n∈{1,2,...,N},N为精整生产样本中的特征总数,ym为样本Sm的原料分配结果,所述原料分配结果为原料池号,原料池号的类别总数为a;
所述原料信息数据包括原料基本信息数据、加工信息数据、合同信息数据;所述原料基本信息数据包括材料号、材料种类、入口材料类型、入口材料厚度、入口材料宽度、入口材料长度、入口材料重量、入口材料内径、入口材料外径、出口材料厚度、出口材料宽度、出口材料长度、出口材料重量、出口材料内径、出口材料外径、入口厚度向上跳跃、入口厚度向下跳跃、入口宽度向上跳跃、入口宽度向下跳跃、出口厚度向上跳跃、出口厚度向下跳跃、出口宽度向上跳跃、出口宽度向下跳跃;所述加工信息数据包括封锁标记、全程工序途径码、制程号、当前工序顺序号、全程工序代码、后全程工序顺序号、后全程工序代码、返修标记、维修序号、返修工序代码、返修机组代码、材料组别、新试号、库区代码、材料库位号、材料状态码、材料预计生产时间、材料入库时间、持续时间、前工序、必做标记、涂油种类代码、涂油量代码、后处理方式代码、切边标记、冷轧精整加工类型、包装方式代码、分选度代码、下道工序指针、返修类型、成品工序标记、出钢记号、牌号;所述合同信息数据包括得分值、合同性质代码、订单号、合同交货期、紧急标记、拖期标记、工序计划日期、差欠重量、订货重量单件最小值、订货重量单件最大值、按周交货标志、出口标记、最终用户代码、订货重量;
步骤2:对精整生产样本集合进行数据清洗:
步骤2.1:对精整生产样本集合S进行特征一次选择,去除对原料分配影响小的特征,得到特征一次选择后的精整生产样本集合S1
其中,对原料分配影响小的特征包括原料基本信息数据中的材料号、材料种类、入口材料类型、入口厚度向上跳跃、入口厚度向下跳跃、入口宽度向上跳跃、入口宽度向下跳跃、出口厚度向上跳跃、出口厚度向下跳跃、出口宽度向上跳跃、出口宽度向下跳跃,加工信息数据中的封锁标记、新试号、材料入库时间、持续时间,合同信息数据中的合同交货期;
步骤2.2:对特征一次选择后的精整生产样本集合S1中的非数值型特征进行One-Hot编码,得到One-Hot编码后的精整生产样本集合S2
步骤2.3:构建随机森林模型,基于随机森林模型对One-Hot编码后的精整生产样本集合S2中的特征进行特征二次选择,得到特征二次选择后的精整生产样本集合S3;所述随机森林模型中决策树总棵数为K、每棵决策树可以选择的最大特征个数为Nmax、基尼指数评分阈值为T;
步骤2.4:对特征二次选择后的精整生产样本集合S3进行数据标准化,得到数据清洗后的精整生产样本集合为X={X1,X2,...,Xm,...,XM};
其中,Xm为数据清洗后的第m个精整生产样本,Xm={Xm1,Xm2,...,Xmj,...,XmJ,ym},{Xm1,Xm2,...,Xmj,...,XmJ}为数据清洗后的样本Xm的原料信息数据,Xmj为数据清洗后的样本Xm的原料信息数据中的第j个特征,j={1,2,...,J},J为特征二次选择后的特征总数;将相同原料池号的样本归为一类,从而将数据清洗后的精整生产样本集合X分为a类;
步骤3:利用数据清洗后的精整生产样本集合X构建并训练基于多分类支持向量机的钢铁冷轧精整生产原料分配模型:
步骤3.1:采用一对一分类法在任意两类样本之间构建一个子学习机,H个子学习机构成基于多分类支持向量机的钢铁冷轧精整生产原料分配模型;
其中,子学习机采用最小二乘支持向量机LSSVM,H=a(a-1)/2,每个子学习机的输入为数据清洗后的原料信息数据、输出为该子学习机对应的两个类别获取的投票数,H个子学习机的输出中获取投票数最大的类别为原料分配结果;
步骤3.2:基于贝叶斯优化方法,对钢铁冷轧精整生产原料分配模型的模型参数进行优化;
步骤3.2.1:确定需要优化的超参数为随机森林模型中的决策树总棵数K、每棵决策树可以选择的最大特征个数Nmax、基尼指数评分阈值T和子学习机中的误差惩罚参数C、核函数参数σ;
步骤3.2.2:确定各超参数的优化范围;
步骤3.2.3:初始化迭代次数G=1,设置最大迭代次数为Gmax,从各超参数的优化范围中各随机选取一个值构成第G次迭代的超参数组合;
步骤3.2.4:计算第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率;构建以超参数组合为输入、该超参数组合下的准确率为输出的目标函数,利用第{1,2,...,G}次迭代的超参数组合与准确率数据,使用高斯过程回归拟合目标函数,得到第G次迭代的目标函数的后验分布;
步骤3.2.5:根据第G次迭代的目标函数的后验分布选择置信区间上界算法作为采集函数从优化范围中寻找第G+1次迭代的超参数组合;
步骤3.2.6:若G<Gmax,则令G=G+1,返回步骤3.2.4;若G≥Gmax,则进入步骤3.2.7;
步骤3.2.7:选择Gmax个超参数组合中准确率最高的超参数组合作为钢铁冷轧精整生产原料分配模型的模型参数,得到训练后的钢铁冷轧精整生产原料分配模型;
步骤4:采集待分配原料的原料信息数据,采用步骤2中相同的数据清洗方法,对待分配原料的原料信息数据进行数据清洗,得到待分配原料的数据清洗后的J个特征构成输入向量,将输入向量输入训练后的钢铁冷轧精整生产原料分配模型中,得到待分配原料的原料分配结果。
进一步地,所述步骤2.2包括下述步骤:
步骤2.2.1:针对特征一次选择后的精整生产样本集合S1中的每个非数值型特征,统计该非数值型特征的l个可能取值;其中,非数值型特征的缺失数据视为该非数值型特征的一种非数值型取值;
步骤2.2.2:编码l个可能取值,创建l个新特征:若该非数值型特征取某个值,则该值对应的新特征取值为1、其他新特征均取值为0;
步骤2.2.3:删除原始非数值型特征,保留新特征。
进一步地,所述步骤2.3包括下述步骤:
步骤2.3.1:计算One-Hot编码后的精整生产样本集合S2中的第i个特征在第k棵决策树中的Mk个节点处分支前后的基尼指数变化量
Figure BDA0002305885580000041
用基尼指数变化量来表示特征在节点处的重要性;其中,i∈{1,2,...,I},I为One-Hot编码后的特征总数,k∈{1,2,...,K};
步骤2.3.2:计算第i个特征的基尼指数评分为
Figure BDA0002305885580000042
步骤2.3.3:对I个特征的基尼指数评分进行归一化处理,得到第i个特征的归一化处理后的基尼指数评分为
Figure BDA0002305885580000043
步骤2.3.4:若
Figure BDA0002305885580000044
则保留第i个特征;若
Figure BDA0002305885580000045
则去除第i个特征。
进一步地,所述步骤2.4中,对特征二次选择后的精整生产样本集合S3进行数据标准化,包括:对特征二次选择后的精整生产样本集合S3中的每个特征进行z-score标准化处理,使每个特征的均值为0、方差为1。
进一步地,所述步骤3.2.4中,计算第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率,包括下述步骤:
步骤3.2.4.1:计算精整生产样本集合X中各个类别之间的比例;
步骤3.2.4.2:初始化交叉验证次数R=1,设置最大交叉验证次数为Rmax,将精整生产样本集合X作为第R次交叉验证的精整生产样本集合;
步骤3.2.4.3:将第R次交叉验证的精整生产样本集合中的样本打乱;
步骤3.2.4.4:将打乱后的第R次交叉验证的精整生产样本集合中的样本划分为L部分;其中,每一部分为一折,每一折中各类别之间的比例与精整生产样本集合X中各类别之间的比例相同;
步骤3.2.4.5:利用第R次交叉验证中划分的L折,对第G次迭代的超参数组合下的钢铁冷轧精整生产原料分配模型进行L折交叉验证,得到第R次交叉验证中每一折的精度,计算第R次交叉验证中L折的精度平均值;
步骤3.2.4.6:若R<Rmax,则将打乱后的第R次交叉验证的精整生产样本集合作为第R+1次交叉验证的精整生产样本集合,令R=R+1,返回步骤3.2.4.3;若R≥Rmax,则计算R个精度平均值的平均值作为第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率。
进一步地,所述基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,还包括:
步骤5:待分配原料的原料信息数据与原料分配结果构成新的样本,判断当前批次的原料是否分配结束:若分配结束,则进入步骤6;若未分配结束,则返回步骤4,进行下一个待分配原料的分配;
步骤6:若新样本数量大于或等于预设的阈值,则返回步骤1;若新样本数量小于预设的阈值,则结束所述基于多分类支持向量机的钢铁冷轧精整生产原料分配方法。
本发明的有益效果为:
本发明面向多原料池的钢铁冷轧精整工序,通过支持向量机方法学习优秀的人工经验,构建基于多分类支持向量机的钢铁冷轧精整生产原料分配模型,在模型构建过程中基于贝叶斯优化对输入特征和模型参数进行同时优化,能够极大地提高原料分配的精度和效率,减小工人的工作量,增加企业的经济效益。
附图说明
图1为具体实施方式中本发明的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法的原理示意图;
图2为具体实施方式中本发明的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法的流程图;
图3为具体实施方式中本发明的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法中七分类时的OvO方法的原理示意图;
具体实施方式
下面将结合附图和具体实施方式,对本发明作进一步描述。
精整生产是钢铁企业冷轧厂的一道重要工序,精整工序有多个机组,各个机组由不同的原料池供料。精整的上一道工序是连退工序,连退后的原料首先会被分配到精整工序的原料池中,然后不同的原料池对相应的机组供料。
在实际生产中,对于连退后的原料,由人工根据原料的某些属性结合加工要求和合同需求将原料分配到各个原料池中,这些原料除了有特殊加工需求的需要分配到某个特殊的原料池之外,多数原料可以分配到多个原料池,但由于历史上偏向于分配到某个原料池,所以存在经验分配规律。
本发明的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法的原理如图1所示:首先,利用企业对原料进行人工分配的历史数据,建立基于多分类支持向量机的钢铁冷轧精整生产原料分配模型;然后,根据新原料的信息,使用训练好的分配模型预测原料的分配结果。当前批次分配结束后,在新样本数量达到要求后,结合新数据,启动钢铁冷轧精整生产原料分配模型的重新训练过程,保证模型能够跟踪最新工况。
本实施例中,利用本发明的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法对某钢厂精整工序的7个原料池进行原料分配。如图2所示,本发明的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,包括下述步骤:
步骤1:采集最近t时间段内钢铁冷轧的精整生产样本,得到如表1所示的含有M=613个精整生产样本的精整生产样本集合S={S1,S2,...,Sm,...,SM}。
其中,Sm为第m个精整生产样本,m∈{1,2,...,M},Sm={Sm1,Sm2,...,Smn,...,Sm,N,ym},{Sm1,Sm2,...,Smn,...,SM,N}为样本Sm的原料信息数据,Smn为样本Sm的原料信息数据中的第n个特征,n∈{1,2,...,N},N为精整生产样本中的特征总数,N=70,ym为样本Sm的原料分配结果,所述原料分配结果为原料池号,原料池号的类别总数为a=7;
所述原料信息数据包括原料基本信息数据、加工信息数据、合同信息数据;所述原料基本信息数据包括23个原料基本信息数据项,即材料号、材料种类、入口材料类型、入口材料厚度、入口材料宽度、入口材料长度、入口材料重量、入口材料内径、入口材料外径、出口材料厚度、出口材料宽度、出口材料长度、出口材料重量、出口材料内径、出口材料外径、入口厚度向上跳跃、入口厚度向下跳跃、入口宽度向上跳跃、入口宽度向下跳跃、出口厚度向上跳跃、出口厚度向下跳跃、出口宽度向上跳跃、出口宽度向下跳跃;所述加工信息数据包括33个加工信息数据项,即封锁标记、全程工序途径码、制程号、当前工序顺序号、全程工序代码、后全程工序顺序号、后全程工序代码、返修标记、维修序号、返修工序代码、返修机组代码、材料组别、新试号、库区代码、材料库位号、材料状态码、材料预计生产时间、材料入库时间、持续时间、前工序、必做标记、涂油种类代码、涂油量代码、后处理方式代码、切边标记、冷轧精整加工类型、包装方式代码、分选度代码、下道工序指针、返修类型、成品工序标记、出钢记号、牌号;所述合同信息数据包括14个合同信息数据项,即得分值、合同性质代码、订单号、合同交货期、紧急标记、拖期标记、工序计划日期、差欠重量、订货重量单件最小值、订货重量单件最大值、按周交货标志、出口标记、最终用户代码、订货重量。
表1中,每一行表示一个样本,每一列为一个数据项,并依次按着从原料基本信息数据、加工信息数据至最后的原料池号的顺序进行排列。
表1
Figure BDA0002305885580000071
步骤2:对精整生产样本集合进行数据清洗:
步骤2.1:对精整生产样本集合S进行特征一次选择,去除对原料分配影响小的特征,得到特征一次选择后的精整生产样本集合S1
其中,对原料分配影响小的特征包括原料基本信息数据中的材料号、材料种类、入口材料类型、入口厚度向上跳跃、入口厚度向下跳跃、入口宽度向上跳跃、入口宽度向下跳跃、出口厚度向上跳跃、出口厚度向下跳跃、出口宽度向上跳跃、出口宽度向下跳跃,加工信息数据中的封锁标记、新试号、材料入库时间、持续时间,合同信息数据中的合同交货期。
特征一次选择后剩下54个特征。
步骤2.2:对特征一次选择后的精整生产样本集合S1中的非数值型特征进行One-Hot编码,将一个非数值型特征替换为一个或多个新的数值型特征,解决数据缺失和非数值型特征编码问题,得到One-Hot编码后的精整生产样本集合S2
步骤2.2.1:针对特征一次选择后的精整生产样本集合S1中的每个非数值型特征,统计该非数值型特征的l个可能取值;其中,非数值型特征的缺失数据视为该非数值型特征的一种非数值型取值;
步骤2.2.2:编码l个可能取值,创建l个新特征:若该非数值型特征取某个值,则该值对应的新特征取值为1、其他新特征均取值为0;
步骤2.2.3:删除原始非数值型特征,保留新特征。
One-Hot编码后,特征被扩展到1087个。
步骤2.3:构建随机森林模型,基于随机森林模型对One-Hot编码后的精整生产样本集合S2中的特征进行特征二次选择,得到特征二次选择后的精整生产样本集合S3
步骤2.3.1:计算One-Hot编码后的精整生产样本集合S2中的第i个特征在第k棵决策树中的Mk个节点处分支前后的基尼指数变化量
Figure BDA0002305885580000081
用基尼指数变化量来表示特征在节点处的重要性;其中,i∈{1,2,...,I},I为One-Hot编码后的特征总数,k∈{1,2,...,K};
步骤2.3.2:计算第i个特征的基尼指数评分为
Figure BDA0002305885580000082
步骤2.3.3:对I个特征的基尼指数评分进行归一化处理,得到第i个特征的归一化处理后的基尼指数评分为
Figure BDA0002305885580000083
步骤2.3.4:若
Figure BDA0002305885580000084
则保留第i个特征;若
Figure BDA0002305885580000085
则去除第i个特征。
特征二次选择中,最终保留哪些特征由随机森林模型中的决策树总棵数K、每棵决策树可以选择的最大特征个数Nmax、基尼指数评分阈值T这三个参数决定。
步骤2.4:对特征二次选择后的精整生产样本集合S3进行数据标准化,以消除不同数据项之间量纲不同的影响,同时使数据更适合于对数据缩放非常敏感的支持向量机算法,得到数据清洗后的精整生产样本集合为X={X1,X2,...,Xm,...,XM};
其中,Xm为数据清洗后的第m个精整生产样本,Xm={Xm1,Xm2,...,Xmj,...,XmJ,ym},{Xm1,Xm2,...,Xmj,...,XmJ}为数据清洗后的样本Xm的原料信息数据,Xmj为数据清洗后的样本Xm的原料信息数据中的第j个特征,j={1,2,...,J},J为特征二次选择后的特征总数;将相同原料池号的样本归为一类,从而将数据清洗后的精整生产样本集合X分为7类。
本实施例中,对特征二次选择后的精整生产样本集合S3进行数据标准化,包括:对特征二次选择后的精整生产样本集合S3中的每个特征进行z-score标准化处理,使每个特征的均值为0、方差为1。
步骤3:利用数据清洗后的精整生产样本集合X构建并训练基于多分类支持向量机的钢铁冷轧精整生产原料分配模型:
步骤3.1:如图3所示,采用一对一分类法(One versus One,OvO)在任意两类样本之间构建一个子学习机,H=a(a-1)/2=21个子学习机构成基于多分类支持向量机的钢铁冷轧精整生产原料分配模型。
其中,子学习机采用最小二乘支持向量机(Least Square Support VectorMachine,LSSVM),每个子学习机的输入为数据清洗后的原料信息数据、输出为该子学习机对应的两个类别获取的投票数,21个子学习机的输出中获取投票数最大的类别为原料分配结果。
步骤3.2:基于贝叶斯优化方法,对钢铁冷轧精整生产原料分配模型的模型参数进行优化:
步骤3.2.1:确定需要优化的超参数为随机森林模型中的决策树总棵数K、每棵决策树可以选择的最大特征个数Nmax、基尼指数评分阈值T和子学习机中的误差惩罚参数C、核函数参数σ。
步骤3.2.2:确定各超参数的优化范围如表2所示。表2中,
Figure BDA0002305885580000091
步骤3.2.3:初始化迭代次数G=1,设置最大迭代次数为Gmax=30,从各超参数的优化范围中各随机选取一个值构成第G次迭代的超参数组合。
步骤3.2.4:计算第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率;构建以超参数组合为输入、该超参数组合下的准确率为输出的目标函数,利用第{1,2,...,G}次迭代的超参数组合与准确率数据,使用高斯过程回归拟合目标函数,得到第G次迭代的目标函数的后验分布。
表2
Figure BDA0002305885580000101
本实施例中,计算第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率,包括下述步骤:
步骤3.2.4.1:计算精整生产样本集合X中各个类别之间的比例;
步骤3.2.4.2:初始化交叉验证次数R=1,设置最大交叉验证次数为Rmax=10,将精整生产样本集合X作为第R次交叉验证的精整生产样本集合;
步骤3.2.4.3:将第R次交叉验证的精整生产样本集合中的样本打乱,以增加数据选取的随机性,避免模型过分依赖数据的某种划分;本实施例中,采用Python中的numpy.random.shuffle()函数打乱样本;
步骤3.2.4.4:将打乱后的第R次交叉验证的精整生产样本集合中的样本划分为L=5部分;其中,每一部分为一折,每一折中各类别之间的比例与精整生产样本集合X中各类别之间的比例相同,避免某一折中只包含某一类别样本的情况出现;
步骤3.2.4.5:利用第R次交叉验证中划分的5折,对第G次迭代的超参数组合下的钢铁冷轧精整生产原料分配模型进行5折交叉验证,得到第R次交叉验证中每一折的精度,计算第R次交叉验证中5折的精度平均值;
步骤3.2.4.6:若R<Rmax,则将打乱后的第R次交叉验证的精整生产样本集合作为第R+1次交叉验证的精整生产样本集合,令R=R+1,返回步骤3.2.4.3;若R≥Rmax,则计算R个精度平均值的平均值作为第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率。
步骤3.2.5:根据第G次迭代的目标函数的后验分布选择置信区间上界算法作为采集函数从优化范围中寻找第G+1次迭代的超参数组合。
步骤3.2.6:若G<Gmax,则令G=G+1,返回步骤3.2.4;若G≥Gmax,则进入步骤3.2.7。
步骤3.2.7:选择Gmax个超参数组合中准确率最高的超参数组合作为钢铁冷轧精整生产原料分配模型的模型参数,得到训练后的钢铁冷轧精整生产原料分配模型。本实施例中,贝叶斯优化方法得到的最佳超参数组合如表3所示。
表3
Figure BDA0002305885580000111
由该最佳超参数组合所确定的模型,最终保留的特征有45个,如下表4所示。
表4
编号 特征 编号 特征 编号 特征
1 全程工序途径码_14A2D3H5IHPF9A9B 16 返修机组代码_C470 31 入口材料重量
2 全程工序代码_IH 17 材料组别_1K0 32 入口材料外径
3 全程工序代码_M6 18 库区代码_C07 33 出口材料厚度
4 当前工序顺序号 19 库区代码_C1B 34 出口材料宽度
5 后全程工序顺序号 20 库区代码_C63 35 出口材料长度
6 后全程工序代码_P2 21 库区代码_D42 36 出口材料重量
7 后全程工序代码_P3 22 材料库位号_C07 37 出口材料内径
8 后全程工序代码_P4 23 材料库位号_C1B 38 出口材料外径
9 后全程工序代码_P8 24 材料库位号_C63 39 材料预计生产时间
10 后全程工序代码_PA 25 材料库位号_C64 40 分选度代码
11 后全程工序代码_PF 26 材料库位号_D42 41 得分值
12 返修工序代码_P3 27 前工序_C312 42 订货重量
13 返修工序代码_P8 28 入口材料厚度 43 订货重量单件最小值
14 返修机组代码_C160 29 入口材料宽度 44 订货重量单件最大值
15 返修机组代码_C270 30 入口材料长度 45 差欠重量
由表4可以看出,影响原料分配的特征主要有材料的尺寸等原料基本信息、全程工序等加工信息以及订单重量等合同信息。
由该最佳超参数组合所确定的模型,10次交叉验证的平均精度即平均准确率为0.980,具有较高的准确率。
步骤4:采集待分配原料的原料信息数据,采用步骤2中相同的数据清洗方法,对待分配原料的原料信息数据进行数据清洗,得到待分配原料的数据清洗后的J个特征构成输入向量,将输入向量输入训练后的钢铁冷轧精整生产原料分配模型中,得到待分配原料的原料分配结果。
本实施例中,重新采集钢铁冷轧的精整生产样本构成测试集,将训练后的钢铁冷轧精整生产原料分配模型应用到测试集上,分配准确率为0.985,表明该模型泛化性能良好。
步骤5:待分配原料的原料信息数据与原料分配结果构成新的样本,判断当前批次的原料是否分配结束:若分配结束,则进入步骤6;若未分配结束,则返回步骤4,进行下一个待分配原料的分配。
步骤6:若新样本数量大于或等于预设的阈值,则返回步骤1;若新样本数量小于预设的阈值,则结束所述基于多分类支持向量机的钢铁冷轧精整生产原料分配方法。
显然,上述实施例仅仅是本发明的一部分实施例,而不是全部的实施例。上述实施例仅用于解释本发明,并不构成对本发明保护范围的限定。基于上述实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,也即凡在本申请的精神和原理之内所作的所有修改、等同替换和改进等,均落在本发明要求的保护范围内。

Claims (6)

1.一种基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,其特征在于,包括下述步骤:
步骤1:采集最近t时间段内钢铁冷轧的精整生产样本,得到含有M个精整生产样本的精整生产样本集合S={S1,S2,...,Sm,...,SM};
其中,Sm为第m个精整生产样本,m∈{1,2,...,M},Sm={Sm1,Sm2,...,Smn,...,Sm,N,ym},{Sm1,Sm2,...,Smn,...,SM,N}为样本Sm的原料信息数据,Smn为样本Sm的原料信息数据中的第n个特征,n∈{1,2,...,N},N为精整生产样本中的特征总数,ym为样本Sm的原料分配结果,所述原料分配结果为原料池号,原料池号的类别总数为a;
所述原料信息数据包括原料基本信息数据、加工信息数据、合同信息数据;所述原料基本信息数据包括材料号、材料种类、入口材料类型、入口材料厚度、入口材料宽度、入口材料长度、入口材料重量、入口材料内径、入口材料外径、出口材料厚度、出口材料宽度、出口材料长度、出口材料重量、出口材料内径、出口材料外径、入口厚度向上跳跃、入口厚度向下跳跃、入口宽度向上跳跃、入口宽度向下跳跃、出口厚度向上跳跃、出口厚度向下跳跃、出口宽度向上跳跃、出口宽度向下跳跃;所述加工信息数据包括封锁标记、全程工序途径码、制程号、当前工序顺序号、全程工序代码、后全程工序顺序号、后全程工序代码、返修标记、维修序号、返修工序代码、返修机组代码、材料组别、新试号、库区代码、材料库位号、材料状态码、材料预计生产时间、材料入库时间、持续时间、前工序、必做标记、涂油种类代码、涂油量代码、后处理方式代码、切边标记、冷轧精整加工类型、包装方式代码、分选度代码、下道工序指针、返修类型、成品工序标记、出钢记号、牌号;所述合同信息数据包括得分值、合同性质代码、订单号、合同交货期、紧急标记、拖期标记、工序计划日期、差欠重量、订货重量单件最小值、订货重量单件最大值、按周交货标志、出口标记、最终用户代码、订货重量;
步骤2:对精整生产样本集合进行数据清洗:
步骤2.1:对精整生产样本集合S进行特征一次选择,去除对原料分配影响小的特征,得到特征一次选择后的精整生产样本集合S1
其中,对原料分配影响小的特征包括原料基本信息数据中的材料号、材料种类、入口材料类型、入口厚度向上跳跃、入口厚度向下跳跃、入口宽度向上跳跃、入口宽度向下跳跃、出口厚度向上跳跃、出口厚度向下跳跃、出口宽度向上跳跃、出口宽度向下跳跃,加工信息数据中的封锁标记、新试号、材料入库时间、持续时间,合同信息数据中的合同交货期;
步骤2.2:对特征一次选择后的精整生产样本集合S1中的非数值型特征进行One-Hot编码,得到One-Hot编码后的精整生产样本集合S2
步骤2.3:构建随机森林模型,基于随机森林模型对One-Hot编码后的精整生产样本集合S2中的特征进行特征二次选择,得到特征二次选择后的精整生产样本集合S3;所述随机森林模型中决策树总棵数为K、每棵决策树可以选择的最大特征个数为Nmax、基尼指数评分阈值为T;
步骤2.4:对特征二次选择后的精整生产样本集合S3进行数据标准化,得到数据清洗后的精整生产样本集合为X={X1,X2,...,Xm,...,XM};
其中,Xm为数据清洗后的第m个精整生产样本,Xm={Xm1,Xm2,...,Xmj,…,XmJ,ym},{Xm1,Xm2,...,Xmj,...,XmJ}为数据清洗后的样本Xm的原料信息数据,Xmj为数据清洗后的样本Xm的原料信息数据中的第j个特征,j={1,2,...,J},J为特征二次选择后的特征总数;将相同原料池号的样本归为一类,从而将数据清洗后的精整生产样本集合X分为a类;
步骤3:利用数据清洗后的精整生产样本集合X构建并训练基于多分类支持向量机的钢铁冷轧精整生产原料分配模型:
步骤3.1:采用一对一分类法在任意两类样本之间构建一个子学习机,H个子学习机构成基于多分类支持向量机的钢铁冷轧精整生产原料分配模型;
其中,子学习机采用最小二乘支持向量机LSSVM,H=a(a-1)/2,每个子学习机的输入为数据清洗后的原料信息数据、输出为该子学习机对应的两个类别获取的投票数,H个子学习机的输出中获取投票数最大的类别为原料分配结果;
步骤3.2:基于贝叶斯优化方法,对钢铁冷轧精整生产原料分配模型的模型参数进行优化;
步骤3.2.1:确定需要优化的超参数为随机森林模型中的决策树总棵数K、每棵决策树可以选择的最大特征个数Nmax、基尼指数评分阈值T和子学习机中的误差惩罚参数C、核函数参数σ;
步骤3.2.2:确定各超参数的优化范围;
步骤3.2.3:初始化迭代次数G=1,设置最大迭代次数为Gmax,从各超参数的优化范围中各随机选取一个值构成第G次迭代的超参数组合;
步骤3.2.4:计算第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率;构建以超参数组合为输入、该超参数组合下的准确率为输出的目标函数,利用第{1,2,...,G}次迭代的超参数组合与准确率数据,使用高斯过程回归拟合目标函数,得到第G次迭代的目标函数的后验分布;
步骤3.2.5:根据第G次迭代的目标函数的后验分布选择置信区间上界算法作为采集函数从优化范围中寻找第G+1次迭代的超参数组合;
步骤3.2.6:若G<Gmax,则令G=G+1,返回步骤3.2.4;若G≥Gmax,则进入步骤3.2.7;
步骤3.2.7:选择Gmax个超参数组合中准确率最高的超参数组合作为钢铁冷轧精整生产原料分配模型的模型参数,得到训练后的钢铁冷轧精整生产原料分配模型;
步骤4:采集待分配原料的原料信息数据,采用步骤2中相同的数据清洗方法,对待分配原料的原料信息数据进行数据清洗,得到待分配原料的数据清洗后的J个特征构成输入向量,将输入向量输入训练后的钢铁冷轧精整生产原料分配模型中,得到待分配原料的原料分配结果。
2.根据权利要求1所述的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,其特征在于,所述步骤2.2包括下述步骤:
步骤2.2.1:针对特征一次选择后的精整生产样本集合S1中的每个非数值型特征,统计该非数值型特征的l个可能取值;其中,非数值型特征的缺失数据视为该非数值型特征的一种非数值型取值;
步骤2.2.2:编码l个可能取值,创建l个新特征:若该非数值型特征取某个值,则该值对应的新特征取值为1、其他新特征均取值为0;
步骤2.2.3:删除原始非数值型特征,保留新特征。
3.根据权利要求1所述的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,其特征在于,所述步骤2.3包括下述步骤:
步骤2.3.1:计算One-Hot编码后的精整生产样本集合S2中的第i个特征在第k棵决策树中的Mk个节点处分支前后的基尼指数变化量
Figure FDA0002305885570000031
用基尼指数变化量来表示特征在节点处的重要性;其中,i∈{1,2,...,I},I为One-Hot编码后的特征总数,k∈{1,2,...,K};
步骤2.3.2:计算第i个特征的基尼指数评分为
Figure FDA0002305885570000041
步骤2.3.3:对I个特征的基尼指数评分进行归一化处理,得到第i个特征的归一化处理后的基尼指数评分为
Figure FDA0002305885570000042
步骤2.3.4:若
Figure FDA0002305885570000043
则保留第i个特征;若
Figure FDA0002305885570000044
则去除第i个特征。
4.根据权利要求1所述的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,其特征在于,所述步骤2.4中,对特征二次选择后的精整生产样本集合S3进行数据标准化,包括:对特征二次选择后的精整生产样本集合S3中的每个特征进行z-score标准化处理,使每个特征的均值为0、方差为1。
5.根据权利要求1所述的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,其特征在于,所述步骤3.2.4中,计算第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率,包括下述步骤:
步骤3.2.4.1:计算精整生产样本集合X中各个类别之间的比例;
步骤3.2.4.2:初始化交叉验证次数R=1,设置最大交叉验证次数为Rmax,将精整生产样本集合X作为第R次交叉验证的精整生产样本集合;
步骤3.2.4.3:将第R次交叉验证的精整生产样本集合中的样本打乱;
步骤3.2.4.4:将打乱后的第R次交叉验证的精整生产样本集合中的样本划分为L部分;其中,每一部分为一折,每一折中各类别之间的比例与精整生产样本集合X中各类别之间的比例相同;
步骤3.2.4.5:利用第R次交叉验证中划分的L折,对第G次迭代的超参数组合下的钢铁冷轧精整生产原料分配模型进行L折交叉验证,得到第R次交叉验证中每一折的精度,计算第R次交叉验证中L折的精度平均值;
步骤3.2.4.6:若R<Rmax,则将打乱后的第R次交叉验证的精整生产样本集合作为第R+1次交叉验证的精整生产样本集合,令R=R+1,返回步骤3.2.4.3;若R≥Rmax,则计算R个精度平均值的平均值作为第G次迭代的超参数组合下钢铁冷轧精整生产原料分配模型对精整生产样本集合X分类的准确率。
6.根据权利要求1所述的基于多分类支持向量机的钢铁冷轧精整生产原料分配方法,其特征在于,还包括:
步骤5:待分配原料的原料信息数据与原料分配结果构成新的样本,判断当前批次的原料是否分配结束:若分配结束,则进入步骤6;若未分配结束,则返回步骤4,进行下一个待分配原料的分配;
步骤6:若新样本数量大于或等于预设的阈值,则返回步骤1;若新样本数量小于预设的阈值,则结束所述基于多分类支持向量机的钢铁冷轧精整生产原料分配方法。
CN201911239815.4A 2019-12-06 2019-12-06 基于多分类支持向量机的钢铁冷轧精整生产原料分配方法 Active CN110918651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911239815.4A CN110918651B (zh) 2019-12-06 2019-12-06 基于多分类支持向量机的钢铁冷轧精整生产原料分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911239815.4A CN110918651B (zh) 2019-12-06 2019-12-06 基于多分类支持向量机的钢铁冷轧精整生产原料分配方法

Publications (2)

Publication Number Publication Date
CN110918651A true CN110918651A (zh) 2020-03-27
CN110918651B CN110918651B (zh) 2020-12-01

Family

ID=69858050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911239815.4A Active CN110918651B (zh) 2019-12-06 2019-12-06 基于多分类支持向量机的钢铁冷轧精整生产原料分配方法

Country Status (1)

Country Link
CN (1) CN110918651B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313049A (zh) * 2021-06-11 2021-08-27 北京百度网讯科技有限公司 超参数的确定方法、装置、设备、存储介质以及计算机程序产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128663A (ja) * 2003-10-22 2005-05-19 Hitachi Ltd プラントシステム,制御装置及び制御方法
CN106030424A (zh) * 2014-02-17 2016-10-12 东芝三菱电机产业系统株式会社 轧制工艺的学习控制装置
CN110142297A (zh) * 2019-06-19 2019-08-20 东北大学 一种五机架冷连轧机原料板启车方法及系统
CN110197286A (zh) * 2019-05-10 2019-09-03 武汉理工大学 一种基于混合高斯模型和稀疏贝叶斯的主动学习分类方法
CN110516312A (zh) * 2019-07-31 2019-11-29 北京首钢自动化信息技术有限公司 一种无弯辊中厚板末阶段板形锁定规程分配方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128663A (ja) * 2003-10-22 2005-05-19 Hitachi Ltd プラントシステム,制御装置及び制御方法
CN106030424A (zh) * 2014-02-17 2016-10-12 东芝三菱电机产业系统株式会社 轧制工艺的学习控制装置
CN110197286A (zh) * 2019-05-10 2019-09-03 武汉理工大学 一种基于混合高斯模型和稀疏贝叶斯的主动学习分类方法
CN110142297A (zh) * 2019-06-19 2019-08-20 东北大学 一种五机架冷连轧机原料板启车方法及系统
CN110516312A (zh) * 2019-07-31 2019-11-29 北京首钢自动化信息技术有限公司 一种无弯辊中厚板末阶段板形锁定规程分配方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313049A (zh) * 2021-06-11 2021-08-27 北京百度网讯科技有限公司 超参数的确定方法、装置、设备、存储介质以及计算机程序产品

Also Published As

Publication number Publication date
CN110918651B (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN104881706B (zh) 一种基于大数据技术的电力系统短期负荷预测方法
CN110619360A (zh) 一种考虑历史样本相似性的超短期风功率预测方法
Giménez et al. Efficiency analysis of the designations of origin in the Spanish wine sector
CN103745273A (zh) 一种半导体制造过程的多性能预测方法
Lolli et al. Decision trees for supervised multi-criteria inventory classification
CN114169434A (zh) 一种负荷预测方法
CN102750286A (zh) 一种处理缺失数据的新型决策树分类器方法
CN110047015A (zh) 一种融合kpca和思维优化bp神经网络的用水总量预测方法
Hargreaves et al. Does the use of technical & fundamental analysis improve stock choice?: A data mining approach applied to the Australian stock market
CN116187507A (zh) 一种基于人工智能的中药生产调优系统
CN110918651B (zh) 基于多分类支持向量机的钢铁冷轧精整生产原料分配方法
CN106600001A (zh) 基于混合高斯分布相关学习机的玻璃窑炉温度预报方法
CN114298579A (zh) 一种基于数据挖掘的有源配电网故障风险预警方法及系统
Zhao et al. Data-driven surplus material prediction in steel coil production
CN112731888A (zh) 一种批量流混合流水车间调度问题的改进候鸟优化方法
Güven et al. Machine Learning Algorithms with Intermittent Demand Forecasting: An Application in Retail Apparel with Plenty of Predictors
CN110070231A (zh) 一种基于遗传算法的智能仓库上架方法及装置
CN115907611A (zh) 一种基于配件市场价值的配件库存管控方法
Hallman A comparative study on Linear Regression and Neural Networks for estimating order quantities of powder blends
US20230334360A1 (en) Model-independent feature selection
CN116502943A (zh) 一种熔模铸造产品质量追溯方法
CN111651512B (zh) 基于半监督学习的多源异构商品特征权重求解方法和装置
CN110909238B (zh) 一种考虑竞争模式的关联挖掘算法
CN115759455A (zh) 一种基于时序高斯混合密度网络的负荷概率密度预测方法
CN103984756A (zh) 基于半监督概率潜在语义分析的软件变更日志分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant