CN112133373B - 基于机器学习的钛合金本构关系预测方法 - Google Patents
基于机器学习的钛合金本构关系预测方法 Download PDFInfo
- Publication number
- CN112133373B CN112133373B CN202010963824.4A CN202010963824A CN112133373B CN 112133373 B CN112133373 B CN 112133373B CN 202010963824 A CN202010963824 A CN 202010963824A CN 112133373 B CN112133373 B CN 112133373B
- Authority
- CN
- China
- Prior art keywords
- strain
- stress
- curve
- titanium alloy
- experimental
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229910001069 Ti alloy Inorganic materials 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000010801 machine learning Methods 0.000 title claims abstract description 17
- 239000000956 alloy Substances 0.000 claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 51
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims abstract description 31
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 51
- 238000012360 testing method Methods 0.000 claims description 41
- 210000002569 neuron Anatomy 0.000 claims description 30
- 238000009826 distribution Methods 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 16
- 238000002474 experimental method Methods 0.000 claims description 14
- 230000006399 behavior Effects 0.000 abstract description 6
- 239000007769 metal material Substances 0.000 abstract description 5
- 230000007547 defect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 abstract description 2
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 239000000463 material Substances 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012669 compression test Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 239000013585 weight reducing agent Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Strength Of Materials By Application Of Mechanical Stress (AREA)
Abstract
本发明涉及一种基于机器学习的钛合金本构关系预测方法,属于金属材料的本构行为预测技术领域。所述预测方法包括:获取多种钛合金分别在不同温度和应变率条件下的应力应变曲线并进行预处理;制作单独用于VAE‑GAN模型训练的曲线数据集;基于VAE‑GAN模型搭建预测模型部分一,并进行训练;基于多项式回归模型搭建预测模型部分二,实现由实验条件预测应力应变曲线的编码;将预测编码输入VAE‑GAN译码器,输出最终预测应力应变曲线。本发明所述预测方法实现了同时预测钛合金材料应力随应变的变化过程和失效应变,克服了传统本构模型不能预测合金材料失效应变的缺点,为合金材料本构关系预测提供了新方法。
Description
技术领域
本发明涉及机器学习技术在材料科学领域中的应用,具体地涉及一种利用神经网络编码器模型和多项式回归模型预测多种钛合金本构关系的方法,属于金属材料的本构行为预测技术领域。
背景技术
传统经验型金属本构模型,例如Johnson-Cook模型,能够描述金属材料在不同应变率、温度下的本构行为。然而,由于金属材料的变形与温度、应变率之间具有复杂的非线性关系,经验模型只能在有限的范围内准确拟合应力应变曲线。自从上世纪末起,不断有学者尝试使用神经网络(ANN)模型预测材料的本构行为,由于神经网络能够对高复杂度的函数进行拟合,因此相比于传统模型,能够对更宽广的温度、应变率范围内金属的本构行为进行预测。尽管如此,上述两种模型都没有对材料的失效行为进行表征,无法预测材料失效点,因而对材料力学性能的评估不够完整。
近年来,随着机器学习技术的快速发展,在数据降维方向不断出现新的模型。其中,基于神经网络的VAE模型能够实现高维数据的编码与重建,且相比AE模型,拥有更好的数据生成能力。但VAE模型所生成的数据往往比较模糊,无法达到本研究对数据拟合的精度要求。VAE-GAN模型由Boesen Lindbo Larsen等于2016年提出,相比于VAE模型,能够以更高的精度重建原始数据。然而,目前还未见到利用VAE-GAN模型对金属材料的本构进行预测的报道。
发明内容
有鉴于此,本发明提供一种基于机器学习的钛合金本构关系预测方法,该方法基于VAE-GAN模型以及多项式回归模型搭建钛合金本构关系的预测模型,利用多种牌号钛合金的应力应变曲线,以预测特定牌号钛合金在某一实验条件下的应力应变曲线及其失效应变,该方法实现了同时预测钛合金材料应力随应变的变化过程和失效应变,为合金材料本构关系预测提供了新方法。
本发明的目的是通过以下技术方案实现的。
基于机器学习的钛合金本构关系预测方法,所述方法步骤如下,
S01:分别获取不同牌号钛合金在不同温度和应变率条件下的实验应力应变曲线,并与实验条件一同记录;对获取的实验应力应变曲线分别进行预处理,使每条实验应力应变曲线形成一个向量,并将处理后的实验应力应变曲线数据及其对应的实验条件按所需比例划分为训练集和测试集;
其中,不同牌号钛合金是指元素成分或/和生产工艺不同的多种钛合金;实验应力应变曲线可以是拉伸条件下的真实应力应变曲线,也可以是压缩条件下的真实应力应变曲线;
S02:制作单独用于VAE-GAN模型训练的曲线数据集,即对步骤S01获取的实验应力应变曲线的训练集内实验应力应变曲线数据,截取屈服点并保留塑性段,对所有处理过的实验应力应变曲线数据两两组合,利用特定插值方法得到形状介于任一组合中两条曲线之间的插值曲线,所有插值曲线组成用于VAE-GAN模型训练的插值曲线数据集;
S03:基于VAE-GAN模型搭建预测模型部分一,对步骤S02得到的插值曲线数据集进行预处理获得插值曲线向量,并利用插值曲线向量进行模型训练,实现对插值曲线向量进行自动编码,同时以误差小于20%的精度将每条插值曲线向量的编码还原为插值曲线向量;
S04:基于多项式回归模型搭建预测模型部分二,实现由实验条件预测特定牌号钛合金材料应力应变曲线的编码;
S05:将步骤S04得到的预测编码输入训练好的预测模型部分一(即VAE-GAN)的译码器,输出最终预测应力应变曲线。
进一步地,S01中,不同牌号钛合金的种类数优选不少于10种。
进一步地,S01中,获取实验应力应变曲线的实验温度优选20℃~800℃,应变率优选0.001s-1~6000s-1。
进一步地,S01中,可以采用如下方法对处理后的实验应力应变曲线数据及其对应的实验条件划分为训练集和测试集:
从所有实验的不同牌号钛合金材料中任选一种钛合金材料,随机选取选定钛合金材料的部分实验应力应变曲线数据及其对应的实验条件作为测试集,记为{(xj,yj)},j=1,2,...,M,x为实验条件,y为实验应力应变曲线转化为的向量,M为测试集数据量;其他所有剩余的实验应力应变曲线数据及其对应的实验条件作为训练集,记为{(xi,yi)},i=1,2,...,Z,x为实验条件,y为实验应力应变曲线转化为的向量,Z为训练集数据量;其中,测试集的数据量(M)与训练集的数据量(Z)的比优选(5:95)~(30:70)。
进一步地,可以采用如下方法对S01中获取的实验应力应变曲线进行预处理:
S11:对任一实验应力应变曲线,按照0.2%~5%原则截取屈服点,并保留实验应力应变曲线的塑性变形部分,并沿应变轴平移,使得屈服点与应变轴原点对齐;
S12:设定一个固定维度的向量y(n),n为向量维度,该向量用于储存应变区间[0,ε1]内的应力值,ε1应大于所有实验应力应变曲线的最大极限应变值;从向量的一端到另一端,逐个元素y(i)(i∈{1,2,...,n})的序号i所对应的应变值均匀增大,而元素y(i)的值为步骤S01获取的实验应力应变曲线上,序号i对应应变值所对应的应力值,如果实验应力应变曲线的极限应变小于序号i所对应的应变值,则y(i)=0。
进一步地,S02中,得到插值曲线数据集的步骤如下:
S21:任取步骤S01获取的实验应力应变曲线的训练集内两条实验应力应变曲线,计算出插值曲线,插值曲线极限应变为kmax(kmax∈[0,1]),在其应变为k(k∈[0,1])处的应力:
进一步地,S03中,对插值曲线数据集进行预处理的方法与步骤S01中对实验应力应变进行预处理的方法相同,即可以参考步骤S11~S12;所述VAE-GAN模型包含编码器Enc(y)、译码器Dec(z)和鉴别器Dec(y)三部分,它们的作用分别为:
编码器负责将原始数据,即实验应力应变曲线经过S12步骤预处理后的向量进行降维,输出低维编码;译码器负责将低维编码还原为原始数据,即以编码作为输入,输出还原数据;同时,译码器具有独立生成数据的功能,即能够将随机数组成的编码输入译码器,也能够使其输出数据,称为生成数据;鉴别器实质上是二分类器,负责分辨原始数据与还原数据,要求其将原始数据标记为1,将还原数据标记为0;基于VAE-GAN模型搭建预测模型部分一的方法如下:
合理设计编码器神经网络结构,包括编码器的输入层、输出层神经元数量,隐藏层数量和每层神经元数量;具体地,编码器的输入层神经元数量与步骤S03得到的插值曲线向量维度相等;编码器的输出层神经元数量,即实验应力应变曲线向量编码的维度数量需要通过试验进行选择,选择的标准是,实验应力应变曲线编码能够使预测模型部分二在步骤S05中,对应力应变曲线应力值和失效应变的预测误差均在可接受范围内,同时使得编码维度数量尽可能少;编码器隐藏层数量和每层神经元数量也需要通过试验进行确定,选择的标准是,能够让预测模型部分一尽快达到收敛;
译码器神经网络结构与编码器神经网络结构完全对称,因此不需要单独调整;
合理设计鉴别器的输入层、隐藏层数量和每层神经元数量;具体地,鉴别器的输入层神经元数量与步骤S03得到的插值曲线向量维度相等;输出层为单个神经元,无需调整;鉴别器隐藏层数量和每层神经元数量也需要通过试验进行确定,选择的标准是,能够让预测模型部分一尽快达到收敛;
选择合适的目标函数,是神经网络模型能够进行学习的关键;依照文献中对VAE-GAN模型的使用经验并结合本发明的实际应用目的,对目标函数进行如下设定:
总体目标函数包括三项:
具体地:
其中,被用以衡量编码器所输出编码的概率分布与正态分布的差异,DKL(q(z|y)||p(z))的含义为概率分布q(z|y)与p(z)之间的K-L散度,K-L散度是一种用以量化两种分布差异性的指标,q(z|y)为编码器将变量y编码为z的概率,变量z符合标准正态分布,编码器将原始数据降维后,得到的编码越接近标准正态分布,就越低。被用以衡量输入编码器的原始数据与译码器输出的还原数据在像素层面的差异,由于本发明中VAE-GAN输入的并非图像矩阵而是应力应变曲线向量,所以原本含义中的像素实际上指向量的元素,该项用L2范数||Dec(Enc(y))-y||计算,其中Dec(Enc(y))是应力应变曲线y,也就是原始数据依次经过编码和译码后,由译码器输出的还原数据,L2范数越小,代表原始数据和还原数据越接近,符合模型训练目标;被用以衡量鉴别器对原始数据和还原数据的鉴别误差,Dis(y)为鉴别器对应力应变曲线向量y,即原始数据的鉴别结果,而Dis(Dec(z))的含义为,向译码器输入符合标准正态分布的变量z,再将译码器输出的生成数据输入鉴别器,最终由鉴别器输出的鉴别结果,鉴别器的鉴别能力越强,意味着对原始数据的鉴别结果越接近1,对译码器生成数据的鉴别结果越接近0,则的值越大。
VAE-GAN模型的训练需要分步进行,首先,更新若干次编码器与译码器的权重参数,更新目标是使得降低,特别地,降低的实际含义在于,使得译码器学会输出“以假乱真”的还原数据,以至于鉴别器无法正确鉴别原始数据和还原数据;接下来再对鉴别器单独进行参数更新,更新目标是使得值增大,这样做的实际含义在于,使得鉴别器的鉴别能力加强;上述两种更新都依次完成后,紧接着对编码器和译码器进行下一步更新;通过这种特殊的参数更新方式,使得译码器与鉴别器之间不断“对抗”,直到译码器所生成的数据足够“真实”,从本发明的角度看,训练VAE-GAN的目的即在于使得译码器输出的数据与应力应变曲线编码足够相近,使其能够从任意编码精确地还原出所对应的应力应变曲线信息;
进一步地,S04中,基于多项式回归模型预测应力应变曲线编码的具体步骤如下:
S41:设应力应变曲线的编码c∈Rn,n为编码的维度数量,对c的每一元素ci,使用多项式回归模型,利用步骤S01所得到的训练集中每一种钛合金的应力应变曲线数据和温度、应变率数据拟合二维曲面f为多项式函数;
S42:按照以下公式计算得到的值,度量选定钛合金材料a与任一其他钛合金材料b性能相似度dista,b:
其中,P为训练集中钛合金材料a包含的曲线数量,Tp、分别为训练集中钛合金材料a应力应变曲线的实验温度和应变率;平均距离越小,认为已知牌号钛合金材料bk与测试牌号钛合金材料b1在相同实验条件下曲线的编码越相近,即曲线相似度更高,钛合金力学性能更加相似;
S43:确定与选定钛合金材料a性能最相似的钛合金材料b0:b0=argminb(dista,b);对选定钛合金材料a测试集内曲线编码的预测按下式计算:
其中,为预测编码,Tz、分别为测试集中钛合金材料a应力应变曲线所对应的实验温度和应变率,w为权重,w∈[0,1];该式的意义在于,将与测试牌号钛合金材料具有相似本构关系的已知牌号钛合金材料数据作为预测的参考,能够降低预测误差;
预测误差用下式计算:
其中,Z为测试集数据量。
有益效果:
VAE-GAN模型所具有的降维功能,一方面有助于降低本文回归模型的复杂度,另一方面能够服务于在低维空间中比较不同牌号、不同性能钛合金的本构关系差异,通过聚类等技术实现区域划分,例如将潜空间划分为性能优劣不同的区域,通过应力应变曲线编码的分布特征,对不同钛合金的性能进行对比和评估。针对不同牌号钛合金在不同实验条件下的应力应变曲线,本发明所述方法能够以较高的精度预测其应力值和失效应变。特别地,本发明所述方法克服了传统本构模型不能够预测材料失效应变的缺点,实现了同时对应力应变曲线的应力值和失效应变进行预测,具有一定的应用价值。
附图说明
图1为本发明基于VAE-GAN模型和多项式回归模型搭建的钛合金本构关系预测模型的结构示意图。
图2为实施例中采用VAE-GAN模型对应力应变曲线降维所得编码示意图;其中,横坐标和纵坐标是分别编码的两个维度,每个点的横纵坐标值反映原始应力应变曲线的特征。
图3为实施例中对TA15钛合金在温度为25℃以及应变率为4000s-1条件下预测的应力应变曲线与在相同条件下测试获得的应力应变曲线的对比图。
图4为实施例中对TA19钛合金在温度为400℃以及应变率为0.001s-1条件下预测的应力应变曲线与在相同条件下测试获得的应力应变曲线的对比图。
具体实施方式
下面结合具体实施方式对本发明作进一步阐述,其中,所述方法如无特别说明均为常规方法,所述原材料如无特别说明均能从公开商业途径获得。
实施例1
基于机器学习对钛合金本构关系预测的具体步骤如下:
S01-1:分别获取13种牌号钛合金在室温(25℃)准静态压缩、高温准静态压缩以及室温动态压缩实验条件下的真实应力应变曲线,并与实验条件一同记录,总共135条数据;其中,对于重复条件下的试验数据,保留了所有的准静态压缩应力应变曲线,而对于高温准静态压缩或室温动态压缩应力应变曲线,在同一温度或应变率条件下仅保留一条曲线,所有牌号的高温准静态压缩试验温度范围在300℃~550℃之间,室温动态压缩实验应变率在1400s-1~4200s-1之间,室温准静态压缩实验在万能试验机上进行,高温准静态压缩实验在Gleeble3500实验仪上进行,室温动态压缩实验在霍普金斯压杆系统上进行,各个牌号钛合金的准静态压缩应力应变曲线、高温准静态压缩应力应变曲线以及室温动态压缩应力应变曲线的数量统计详见表1;
表1
S01-2:对步骤S01-1获取的应力应变曲线分别进行预处理,使每条应力应变曲线形成一个向量;其中,预处理的具体操作如下:
(S01-21)对任一应力应变曲线,按照0.2%原则截取屈服点,并保留应力应变曲线的塑性变形部分,并沿应变轴平移,使得屈服点与应变轴原点对齐;
(S01-22)设定一个固定维度的向量y(n),n为向量维度,n=150,该向量用于储存应变区间[0,ε1]内的应力值,ε1设定为0.6,此时ε1大于所有实验应力应变曲线的最大极限应变值;实验数据中,应力应变曲线的极限应变之间差异很大,大部分应力应变曲线的极限应变在0.2左右,而极少数应力应变曲线能达到0.6左右的极限应变,对应的编码会极大偏离集中区域,为下一步的预测造成困难,因此在预处理前,首先将曲线应变值进行对数转化(试验后采用f=log(ε*5+1)/5);从向量的一端到另一端,逐个元素y(i)(i∈{1,2,...,n})的序号i所对应的应变值均匀增大,而元素y(i)的值为步骤S01-1获取的应力应变曲线上,序号i对应应变值所对应的应力值,如果应力应变曲线的极限应变小于序号i所对应的应变值,则y(i)=0;
S01-3:将步骤S01-2处理后的应力应变曲线数据及其对应的实验条件按照以下方法划分为训练集和测试集:
(S01-31)从13种牌号钛合金材料中任选一种钛合金材料,随机选取选定钛合金材料的部分应力应变曲线数据及其对应的实验条件作为测试集,记为{(xj,yj)},j=1,2,...,M,x为实验条件,y为应力应变曲线转化为的向量,M为测试集数据量;其他12种钛合金材料的应力应变曲线数据及其对应的实验条件与选定钛合金材料的剩余应力应变曲线数据及其对应的实验条件共同构成训练集,记为{(xi,yi)},i=1,2,...,Z,x为实验条件,y为应力应变曲线转化为的向量,Z为训练集数据量;其中,Z与M的数量比为95:5;
S02:制作单独用于VAE-GAN模型训练的曲线数据集,即对步骤S01-1获取的原始应力应变曲线的训练集内应力应变曲线数据,截取屈服点并保留塑性段,对所有处理过的应力应变曲线数据两两组合,利用特定插值方法得到形状介于任一组合中两条曲线之间的插值曲线,所有插值曲线组成用于VAE-GAN模型训练的插值曲线数据集;其中,插值方法的具体操作如下:
(S021)任取步骤S01-1获取的原始应力应变曲线的训练集内两条原始应力应变曲线,计算出插值曲线,插值曲线极限应变为kmax(kmax∈[0,1]),在其应变为k(k∈[0,1])处的应力:
其中,为第i条曲线在应变为εi处的应力,为第i条曲线的极限应变,wi为权重,调整kmax和wi的值,可以获得不同的新曲线;在实际操作中,每对应力应变曲线组合都分别取6个kmax的值和10个wi的值进行计算,可以获得60条插值曲线,总共得到31860条插值曲线;
S03:基于VAE-GAN模型搭建预测模型部分一,对步骤S02得到的插值曲线数据集进行预处理获得插值曲线向量,并利用插值曲线向量进行模型训练,实现对插值曲线向量进行自动编码,同时以误差小于20%的精度将每条插值曲线向量的编码还原为插值曲线向量;
其中,对插值曲线数据集进行预处理的具体操作参考步骤S01-21~步骤S01-22;VAE-GAN模型包含编码器Enc(y)、译码器Dec(z)和鉴别器Dec(y)三部分,而基于VAE-GAN模型搭建预测模型部分一的具体步骤如下:
(S031)合理设计编码器神经网络结构,包括编码器的输入层、输出层神经元数量,隐藏层数量和每层神经元数量;具体地,编码器的输入层神经元数量与步骤S03得到的插值曲线向量维度相等;编码器的输出层神经元数量,即应力应变曲线向量编码的维度数量需要通过试验进行选择,选择的标准是,应力应变曲线编码能够使回归模型在步骤S05中,对应力应变曲线应力值和失效应变的预测误差均在可接受范围内,同时使得编码维度数量尽可能少;编码器隐藏层数量和每层神经元数量也需要通过试验进行确定,选择的标准是,能够让预测模型部分一尽快达到收敛;在实际操作中,为了方便多项式模型的预测,将编码维度数量设定为2;
译码器神经网络结构与编码器神经网络结构完全对称,因此不需要单独调整;
合理设计鉴别器的输入层、隐藏层数量和每层神经元数量;具体地,鉴别器的输入层神经元数量与步骤S03得到的插值曲线向量维度相等,输出层为单个神经元,无需调整;鉴别器隐藏层数量和每层神经元数量也需要通过试验进行确定,选择的标准是,能够让预测模型部分一尽快达到收敛;
选择合适的目标函数,是神经网络模型能够进行学习的关键;依照文献中对VAE-GAN模型的使用经验并结合本发明的实际应用目的,对目标函数进行如下设定:
总体目标函数包括三项:
具体地:
其中,被用以衡量编码器所输出编码的概率分布与正态分布的差异,DKL(q(z|y)||p(z))的含义为概率分布q(z|y)与p(z)之间的K-L散度,K-L散度是一种用以量化两种分布差异性的指标,q(z|y)为编码器将变量y编码为z的概率,变量z符合标准正态分布,编码器将原始数据降维后,得到的编码越接近标准正态分布,就越低。被用以衡量输入编码器的原始数据与与译码器输出的还原数据在像素层面的差异,由于本发明中VAE-GAN输入的并非图像矩阵而是应力应变曲线向量,所以原本含义中的像素实际上指向量的元素,该项用L2范数||Dec(Enc(y))-y||计算,其中Dec(Enc(y))是应力应变曲线y,也就是原始数据依次经过编码和译码后,由译码器输出的还原数据,L2范数越小,代表原始数据和还原数据越接近,符合模型训练目标;被用以衡量鉴别器对原始数据和还原数据的鉴别误差,Dis(y)为鉴别器对应力应变曲线向量y,即原始数据的鉴别结果,而Dis(Dec(z))的含义为,向译码器输入符合标准正态分布的变量z,再将译码器输出的生成数据输入鉴别器,最终由鉴别器输出的鉴别结果,鉴别器的鉴别能力越强,意味着对原始数据的鉴别结果越接近1,对译码器生成数据的鉴别结果越接近0,则的值越大。
VAE-GAN模型的训练需要分步进行,首先,更新若干次编码器与译码器的权重参数,更新目标是使得降低,特别地,降低的实际含义在于,使得译码器学会输出“以假乱真”的还原数据,以至于鉴别器无法正确鉴别原始数据和还原数据;接下来再对鉴别器单独进行参数更新,更新目标是使得值增大,这样做的实际含义在于,使得鉴别器的鉴别能力加强;上述两种更新都依次完成后,紧接着对编码器和译码器进行下一步更新;通过这种特殊的参数更新方式,使得译码器与鉴别器之间不断“对抗”,直到译码器所生成的数据足够“真实”,从本发明的角度看,训练VAE-GAN的目的即在于使得译码器输出的数据与应力应变曲线编码足够相近,使其能够从任意编码精确地还原出所对应的应力应变曲线信息;
VAE-GAN模型的搭建和训练都基于python语言的tensorflow框架进行,模型结构详见表2,括号中数字为该层神经网络的神经元数量;
表2
使用tensorflow默认的初始化方法进行变量初始化;训练前,对输入数据进行min-max标准化(Min-max normalization),batch size设置为100;采用rmsprop优化器进行训练。
对VAE-GAN模型训练试验表明,更新次数达到20000次时,目标函数接近收敛。VAE-GAN模型经过训练达到收敛后,编码器输出二维编码,反映真实应力应变曲线的特征。图2展示了实验所用钛合金应力应变曲线数据的编码分布情况,可以看到所有实验曲线的编码所代表的点呈月牙形分布在编码空间内。
S04:基于多项式回归模型搭建预测模型部分二,实现由实验条件预测特定牌号钛合金材料应力应变曲线的编码;其中,基于多项式回归模型预测应力应变曲线编码的具体步骤如下:
(S041)设应力应变曲线的编码c∈Rn,n为编码的维度数量,对c的每一元素ci,使用多项式回归模型,利用步骤S01所得到的训练集中每一种钛合金的应力应变曲线数据和温度、应变率数据拟合二维曲面f为多项式函数;
回归模型的建立和拟合都基于matlab语言进行,其任务是通过测试数据的实验条件(温度、应变率)预测测试数据经编码器降维后的二维编码。试验表明,模型最高次数大于等于3会造成过拟合,因此选用二次的多项式模型形式:
γ1,γ2~N(0,σ2);
分别对训练集中每一个牌号的钛合金数据使用二次多项式拟合,得到与牌号对应的回归系数。
(S042)按照以下公式计算得到的值,度量选定钛合金材料a与任一其他钛合金材料b性能相似度dista,b:
其中,P为训练集中钛合金材料a包含的曲线数量,Tp、分别为训练集中钛合金材料a应力应变曲线的实验温度和应变率;平均距离越小,认为已知牌号钛合金材料bk与测试牌号钛合金材料b1在相同实验条件下曲线的编码越相近,即曲线相似度更高,钛合金力学性能更加相似;
(S043)确定与选定钛合金材料a性能最相似的钛合金材料b0:b0=argminb(dista,b);对选定钛合金材料a测试集内曲线编码的预测按下式计算:
其中,为预测编码,Tz、分别为测试集中钛合金材料a应力应变曲线所对应的实验温度和应变率,w为权重,w∈[0,1];该式的意义在于,将与测试牌号钛合金材料具有相似本构关系的已知牌号钛合金材料数据作为预测的参考,能够降低预测误差;
预测误差用下式计算,即:
其中,Z为测试集数据量,即测试牌号钛合金a在测试集中包含的曲线数量。
S05:将步骤S04得到的预测编码输入训练好的预测模型部分一(即VAE-GAN)的译码器,输出最终预测应力应变曲线。
经试验后发现,w取0.7时,最终预测编码经过重建后得到的预测曲线误差最小。
利用极限应变和钛合金强度作为衡量预测准确率的指标。得到预测数据的极限应变平均预测误差为0.063,钛合金强度平均预测误差为162MPa。图3示例性地展示了采用所建的预测模型对TA15钛合金在温度为25℃以及应变率为4000s-1条件下应力应变曲线的预测效果。从图3中可以看出,所建的预测模型对该应力应变曲线的应力值预测较为准确,误差值为6%;对失效应变预测效果良好,误差值为27%,符合期望目标。图4示例性地展示了采用所建的预测模型对TA19钛合金在温度为400℃以及应变率为0.001s-1条件下应力应变曲线的预测效果。从图4中可以看出,所建的预测模型对该应力应变曲线的失效应变预测十分准确,误差值为1.2%;对变形后期应力值预测平均误差为18%,符合期望目标。
经过实施例验证,本发明基于VAE-GAN模型以及多项式回归模型搭建钛合金本构关系的预测模型,在经训练集数据训练后,可实现对任一牌号钛合金在指定工况下(室温、高温、准静态、动态)的应力应变曲线(即本构关系)与失效应变进行有效预测。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.基于机器学习的钛合金本构关系预测方法,其特征在于:所述方法步骤如下,
S01:分别获取不同牌号钛合金在不同温度和应变率条件下的实验应力应变曲线,并与实验条件一同记录;对获取的实验应力应变曲线分别进行预处理,使每条实验应力应变曲线形成一个向量,并将处理后的实验应力应变曲线数据及其对应的实验条件按所需比例划分为训练集和测试集;
S02:对步骤S01获取的实验应力应变曲线的训练集内实验应力应变曲线数据,截取屈服点并保留塑性段,对所有处理过的实验应力应变曲线数据两两组合,利用特定插值方法得到形状介于任一组合中两条曲线之间的插值曲线,所有插值曲线组成单独用于VAE-GAN模型训练的插值曲线数据集;
S03:基于VAE-GAN模型搭建预测模型部分一,对步骤S02得到的插值曲线数据集进行预处理获得插值曲线向量,并利用插值曲线向量进行模型训练,实现对插值曲线向量进行自动编码,同时以误差小于20%的精度将每条插值曲线向量的编码还原为插值曲线向量;
S04:基于多项式回归模型搭建预测模型部分二,实现由实验条件预测特定牌号钛合金材料应力应变曲线的编码;
S05:将步骤S04得到的预测编码输入训练好的预测模型部分一的译码器,输出最终预测应力应变曲线。
2.根据权利要求1所述的基于机器学习的钛合金本构关系预测方法,其特征在于:步骤S01中,不同牌号钛合金的种类数不少于10种。
3.根据权利要求1所述的基于机器学习的钛合金本构关系预测方法,其特征在于:步骤S01中,获取实验应力应变曲线的实验温度为20℃~800℃,应变率为0.001s-1~6000s-1。
4.根据权利要求1所述的基于机器学习的钛合金本构关系预测方法,其特征在于:步骤S01中,采用如下方法对处理后的实验应力应变曲线数据及其对应的实验条件划分为训练集和测试集:
从所有实验的不同牌号钛合金材料中任选一种钛合金材料,随机选取选定钛合金材料的部分实验应力应变曲线数据及其对应的实验条件作为测试集,记为{(xj,yj)),j=1,2,…,M,x为实验条件,y为实验应力应变曲线转化为的向量,M为测试集数据量;其他所有剩余的实验应力应变曲线数据及其对应的实验条件作为训练集,记为{(xi,yi)},i=1,2,...,Z,x为实验条件,y为实验应力应变曲线转化为的向量,Z为训练集数据量。
5.根据权利要求1或4所述的基于机器学习的钛合金本构关系预测方法,其特征在于:测试集的数据量与训练集的数据量比为(5∶95)~(30∶70)。
6.根据权利要求1所述的基于机器学习的钛合金本构关系预测方法,其特征在于:采用如下方法对步骤S01中获取的实验应力应变曲线进行预处理:
S11:对任一实验应力应变曲线,按照0.2%~5%原则截取屈服点,并保留实验应力应变曲线的塑性变形部分,并沿应变轴平移,使得屈服点与应变轴原点对齐;
S12:设定一个固定维度的向量y(n),n为向量维度,该向量用于储存应变区间[0,ε1]内的应力值,ε1应大于所有实验应力应变曲线的最大极限应变值;从向量的一端到另一端,逐个元素y(i)(i∈{1,2,...,n})的序号i所对应的应变值均匀增大,而元素y(i)的值为步骤S01获取的实验应力应变曲线上,序号i对应应变值所对应的应力值,如果实验应力应变曲线的极限应变小于序号i所对应的应变值,则y(i)=0。
8.根据权利要求1所述的基于机器学习的钛合金本构关系预测方法,其特征在于:步骤S03中,所述VAE-GAN模型包含编码器、译码器和鉴别器三部分,基于VAE-GAN模型搭建预测模型部分一的方法如下:
设计编码器神经网络结构,包括编码器的输入层、输出层神经元数量,隐藏层数量和每层神经元数量;具体地,编码器的输入层神经元数量与步骤S03得到的插值曲线向量维度相等;编码器的输出层神经元数量,即实验应力应变曲线向量编码的维度数量通过试验进行选择,选择的标准是,实验应力应变曲线编码能够使预测模型部分二在步骤S05中,对应力应变曲线应力值和失效应变的预测误差均在可接受范围内,同时使得编码维度数量尽可能少;编码器隐藏层数量和每层神经元数量通过试验进行确定,选择的标准是,能够让预测模型部分一尽快达到收敛;
译码器神经网络结构与编码器神经网络结构完全对称;
设计鉴别器的输入层、隐藏层数量和每层神经元数量;具体地,鉴别器的输入层神经元数量与步骤S03得到的插值曲线向量维度相等;输出层为单个神经元;鉴别器隐藏层数量和每层神经元数量通过试验进行确定,选择的标准是,能够让预测模型部分一尽快达到收敛;
对目标函数进行如下设定:
总体目标函数包括三项:
具体地:
其中,被用以衡量编码器所输出编码的概率分布与正态分布的差异,DKL(q(z|y)||p(z))的含义为概率分布q(z|y)与p(z)之间的K-L散度,K-L散度是一种用以量化两种分布差异性的指标,q(z|y)为编码器将变量y编码为z的概率,变量z符合标准正态分布, 被用以衡量输入编码器的原始数据与译码器输出的还原数据在像素层面的差异,Dec(Enc(y))是应力应变曲线y,也就是原始数据依次经过编码和译码后,由译码器输出的还原数据;被用以衡量鉴别器对原始数据和还原数据的鉴别误差,Dis(y)为鉴别器对应力应变曲线向量y,即原始数据的鉴别结果,Dis(Dec(z))是指向译码器输入符合标准正态分布的变量z,再将译码器输出的生成数据输入鉴别器,最终由鉴别器输出的鉴别结果。
9.根据权利要求1所述的基于机器学习的钛合金本构关系预测方法,其特征在于:S04中,基于多项式回归模型预测应力应变曲线编码的具体步骤如下:
S41:设应力应变曲线的编码c∈Rn,n为编码的维度数量,对c的每一元素ci,使用多项式回归模型,利用步骤S01所得到的训练集中每一种钛合金的应力应变曲线数据和温度、应变率数据拟合二维曲面f为多项式函数,T为实验温度,为应变率;
S42:按照以下公式计算得到的值,度量选定钛合金材料a与任一其他钛合金材料b性能相似度dista,b:
S43:确定与选定钛合金材料a性能最相似的钛合金材料b0:b0=arg minb(dista,b);对选定钛合金材料a测试集内曲线编码的预测按下式计算:
其中,将与测试牌号钛合金材料具有相似本构关系的已知牌号钛合金材料数据作为预测的参考,能够降低预测误差;
预测误差用下式计算:
其中,Z为测试集数据量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010963824.4A CN112133373B (zh) | 2020-09-14 | 2020-09-14 | 基于机器学习的钛合金本构关系预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010963824.4A CN112133373B (zh) | 2020-09-14 | 2020-09-14 | 基于机器学习的钛合金本构关系预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112133373A CN112133373A (zh) | 2020-12-25 |
CN112133373B true CN112133373B (zh) | 2022-11-25 |
Family
ID=73846695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010963824.4A Active CN112133373B (zh) | 2020-09-14 | 2020-09-14 | 基于机器学习的钛合金本构关系预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112133373B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113061767A (zh) * | 2021-03-19 | 2021-07-02 | 西北有色金属研究院 | 一种钨铼碳化铪合金高温变形行为的研究方法 |
KR102622748B1 (ko) * | 2021-11-29 | 2024-01-08 | 동아대학교 산학협력단 | 철근 가공 공정에서의 머신 러닝 기반의 철근 자동 교정 시스템 및 그 방법 |
CN117219212B (zh) * | 2023-11-07 | 2024-02-06 | 宝鸡拓普达钛业有限公司 | 基于硼含量的钛合金内部结构及力学性能增强方法及装置 |
CN117558381B (zh) * | 2024-01-12 | 2024-03-22 | 四川大学 | 一种金属材料温度与应变速率相关塑性硬化模型计算方法 |
CN117871259B (zh) * | 2024-01-15 | 2024-10-15 | 中南大学 | 盾构隧道老化密封垫应力松弛模型参数确定方法及应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853927A (zh) * | 2014-03-12 | 2014-06-11 | 北京理工大学 | 基于聚类全局优化算法预测材料力学行为的方法 |
CN110750926A (zh) * | 2019-09-30 | 2020-02-04 | 上海思致汽车工程技术有限公司 | 基于粒子群算法的高速拉伸曲线的处理及预测方法 |
JP2020038495A (ja) * | 2018-09-04 | 2020-03-12 | 横浜ゴム株式会社 | 物性データ予測方法及び物性データ予測装置 |
CN111159863A (zh) * | 2019-12-17 | 2020-05-15 | 上海交通大学 | 基于神经网络算法的材料变形及失效预测方法及系统 |
CN111310348A (zh) * | 2020-02-25 | 2020-06-19 | 江西理工大学 | 一种基于pso-lssvm的材料本构模型预测方法 |
-
2020
- 2020-09-14 CN CN202010963824.4A patent/CN112133373B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853927A (zh) * | 2014-03-12 | 2014-06-11 | 北京理工大学 | 基于聚类全局优化算法预测材料力学行为的方法 |
JP2020038495A (ja) * | 2018-09-04 | 2020-03-12 | 横浜ゴム株式会社 | 物性データ予測方法及び物性データ予測装置 |
CN110750926A (zh) * | 2019-09-30 | 2020-02-04 | 上海思致汽车工程技术有限公司 | 基于粒子群算法的高速拉伸曲线的处理及预测方法 |
CN111159863A (zh) * | 2019-12-17 | 2020-05-15 | 上海交通大学 | 基于神经网络算法的材料变形及失效预测方法及系统 |
CN111310348A (zh) * | 2020-02-25 | 2020-06-19 | 江西理工大学 | 一种基于pso-lssvm的材料本构模型预测方法 |
Non-Patent Citations (1)
Title |
---|
基于BP神经网络的Ti-26钛合金本构模型;赵恒章等;《钛工业进展》;20100225(第01期);第39-42页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112133373A (zh) | 2020-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112133373B (zh) | 基于机器学习的钛合金本构关系预测方法 | |
CN113593631B (zh) | 一种预测蛋白质-多肽结合位点的方法及系统 | |
CN112101426B (zh) | 基于自编码器的无监督学习图像异常检测方法 | |
CN109165664B (zh) | 一种基于生成对抗网络的属性缺失数据集补全与预测方法 | |
CN108629144A (zh) | 一种桥梁健康评估方法 | |
CN112288137A (zh) | 一种计及电价和Attention机制的LSTM短期负荷预测方法及装置 | |
CN114493755B (zh) | 一种融合时序信息的自注意力序列推荐方法 | |
WO2023279694A1 (zh) | 车辆置换预测方法、装置、设备及存储介质 | |
CN113328755A (zh) | 一种面向边缘计算的压缩数据传输方法 | |
CN110910328B (zh) | 一种基于对抗性样本分类等级的防御方法 | |
CN116469561A (zh) | 一种基于深度学习的乳腺癌生存预测方法 | |
CN116432697A (zh) | 一种融合长短期记忆网络与注意力机制的时间序列预测方法 | |
CN116230154A (zh) | 基于记忆强化Transformer的胸腔X光诊断报告生成方法 | |
CN112149355A (zh) | 基于半监督动态反馈堆栈降噪自编码器模型的软测量方法 | |
CN112185423B (zh) | 基于多头注意力机制的语音情感识别方法 | |
CN113762967A (zh) | 风险信息确定方法、模型训练方法、设备、程序产品 | |
CN116596150A (zh) | 基于多分支自注意力的Transformer霍克斯过程模型的事件预测方法 | |
CN113537539A (zh) | 一种基于注意力机制的多时间步供热用气量预测模型 | |
CN113033079A (zh) | 一种基于不平衡修正卷积神经网络的化学故障诊断方法 | |
CN117972585A (zh) | 一种基于pca-ddpm和cnn的小样本条件下故障增强诊断方法 | |
Ikeda et al. | New feature engineering framework for deep learning in financial fraud detection | |
CN118037423A (zh) | 农业贷款后农户还款意愿评价方法及系统 | |
CN117421545A (zh) | 基于数据处理的作战仿真系统及方法 | |
CN117575412A (zh) | 用于装药质量预测的模型训练方法、装置、设备和介质 | |
CN115130389A (zh) | 一种横向数据增强策略及其软测量建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |