CN116720260A - 一种基于迁移学习的船型优化方法 - Google Patents
一种基于迁移学习的船型优化方法 Download PDFInfo
- Publication number
- CN116720260A CN116720260A CN202310727001.5A CN202310727001A CN116720260A CN 116720260 A CN116720260 A CN 116720260A CN 202310727001 A CN202310727001 A CN 202310727001A CN 116720260 A CN116720260 A CN 116720260A
- Authority
- CN
- China
- Prior art keywords
- ship
- optimization
- model
- sampling
- domain data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000013526 transfer learning Methods 0.000 title claims abstract description 16
- 238000005070 sampling Methods 0.000 claims abstract description 41
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims abstract description 27
- 239000002245 particle Substances 0.000 claims description 23
- 238000013461 design Methods 0.000 claims description 19
- 238000004088 simulation Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000010219 correlation analysis Methods 0.000 claims description 2
- 238000013508 migration Methods 0.000 abstract description 8
- 230000005012 migration Effects 0.000 abstract description 8
- 230000006978 adaptation Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 18
- 239000003795 chemical substances by application Substances 0.000 description 13
- 101100189913 Caenorhabditis elegans pept-1 gene Proteins 0.000 description 11
- 238000012360 testing method Methods 0.000 description 9
- 101100243399 Caenorhabditis elegans pept-2 gene Proteins 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 238000012804 iterative process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005094 computer simulation Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 108700041286 delta Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012803 optimization experiment Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/15—Vehicle, aircraft or watercraft design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/25—Design optimisation, verification or simulation using particle-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/28—Design optimisation, verification or simulation using fluid dynamics, e.g. using Navier-Stokes equations or computational fluid dynamics [CFD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/04—Constraint-based CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/08—Fluids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Geometry (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Fluid Mechanics (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Aviation & Aerospace Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于迁移学习的船型优化方法,涉及船型优化技术领域。本发明通过利用Two Stage TrAdaBoost.R2回归迁移算法来提高最终关于船舶性能模型的精度与泛化性能。该算法利用已知的一些相关数据集的知识来辅助我们的目标船型数据建模,以提高模型的精度。本发明对于船型采样和建模阶段均分为两阶段进行:基于全局尺度采样数据来构建粗代理模型和基于经过全局和局部尺度采样阶段得到的数据来构建细代理模型,两个模型共同辅助后续的优化过程。对于优化过程提出一种双代理辅助的优化方法。所采用的优化算法的迭代流程被改进,不再是对单一代理模型独立进行更新,而是在优化过程中同时考虑他们的适应度值并选取最优者进行迭代。
Description
技术领域
本发明属于船型优化技术领域,具体涉及一种迁移学习下的Two StageTrAdaBoost.R2方法。
背景技术
在船舶工程中,船型设计和优化是一个非常重要的环节。通过船型的优化可以提高船舶的性能和效率,从而降低能耗和排放。然而,由于船舶模型的设计和实验测试成本很高,对于一些小型船舶或是非商业用途的船舶,采用传统的船模测试方法往往会导致高昂的成本。当前,基于计算机仿真的船型优化方法已经成为船舶工程中的热门领域。通过计算机仿真可以大大降低船模测试的成本,同时还能够快速地得到船舶的优化方案,常用的CFD仿真软件如Fluent,OpenFORM等,如图1所示。但是,在船型优化中,获取船的实验数据或仿真数据也需要高昂时间和计算资源成本,主要耗时在于网格绘制以及仿真计算。因此,本发明利用已有实验数据的知识来辅助只有少量样本的数据集,建立高精度的代理模型替代CFD仿真计算获取数据,对船型进行优化,给出合理的优化评估结果,从而提高船舶的性能和效率。
本发明提供了一种基于Two Stage TrAdaBoost.R2回归迁移方法的船型优化方法,其特点在于:
(1)降低建模成本:获取足量船模数据需要高昂成本,而通过Two StageTrAdaBoost.R2算法可以改善这一情况,它可以将别的数据集的知识迁移到数量不足的样本集中进行辅助建模。
(2)提高模型精度:Two Stage TrAdaBoost.R2算法可以通过利用源域数据的知识来建立目标域模型,从而提高目标域数据的预测精度。
(3)加快收敛速度:使用了双代理模型的混合优化策略,既能加快算法收敛速度,也能使算法陷入局部最优的概率明显降低。
发明内容
本发明是基于Two Stage TrAdaBoost.R2方法的船型建模优化流程,来解决在实验数据有限的情况下建立船舶代理模型,并在后续对船舶型线进行优化。包括以下步骤:
一种基于迁移学习的船型优化方法,具体步骤如下:
(1)获取公开的船模实验数据集作为源域数据集,并对源域数据进行预处理和特征处理;
进一步的,所述的源域数据集的预处理:从源域数据集中,选择与目标域数据集具有相似特征的样本数据,剔除源域数据集中与目标域数据明显差别过大的样本,源域数据集的特征处理:包括特征对齐、特征映射或者特征变换,使得源域和目标域的数据在相同的特征空间中进行表示。
(2)目标域数据集通过对需要进行船型优化的初始船进行采样获得;基于船型全局设计和船型局部设计两个方面,将目标域数据的采样及建模分为对应的两个阶段:基于全局尺度采样数据构建的粗代理模型和基于局部尺度采样数据构建的细代理模型,两个代理模型共同用于后续的优化过程。
进一步的,全局尺度采样包括对船长、船宽和型深这样的主尺度的采样,局部尺度采样指对船某一局部位置尺寸的采样。
进一步的,所述的目标域数据集的特征处理:特征对齐、特征降维、特征扩充;所述的目标域数据集的预处理:对于船舶的不同性能,需要通过相关性分析提取特征之间的关联,并对其无量纲化和标准化预处理操作,便于后续模型的训练。采样后通过CFD仿真获得需要的性能数据,从而获得添加了标签的目标域数据集。
(3)所述的步骤(2)中代理模型的构建过程:利用Two Stage TrAdaBoost.R2方法,利用源域数据对目标域数据辅助建模,两个阶段的建模分别得到粗代理模型和细代理模型。
(4)将建立好的粗代理模型和细代理模型应用到优化过程中,采用改进后QPSO优化算法对目标域的船型数据进行优化,以提高船舶的性能和效率。改进后QPSO优化算法在优化过程不是两个目标独立地进行求解,而是在所有粒子迭代更新时,同时考虑两个目标并始终选取较优者,然后再进行后续的迭代。
进一步的,在满足设计变量约束下,分别对不同条件下的船的外形进行优化,以满足不同的实际要求。最后将最优解通过数值重构得到船的外形,并通过CFD仿真进行验证优化结果。优化过程均选用改进后QPSO优化算法对目标进行搜索。
进一步的,优化过程中,第t次迭代中的函数值选择。其中f(Xt)表示第t次迭代中的粒子适应度值,表示第i个粒子/>在第t次迭代中粗代理模型的适应度值,表示第i个粒子/>在第t次迭代中细代理模型的适应度值。N表示粒子的种群大小。
本发明的有益效果:
(1)利用Two Stage TrAdaBoost.R2方法,基于已知的实验数据,构建代理模型,实现对目标域的船型数据进行优化,大大降低了船模测试的成本。
(2)通过优化代理模型的参数,提高其预测精度和准确性,使得船舶的优化方案更加准确和可靠。
(3)该方法普适性好,可对不同的船舶性能以及其他领域运用该方法进行回归迁移学习,具有广泛的应用前景。
(4)对优化过程进行改进,不再是两个目标独立地进行求解,而是在所有粒子迭代更新时,同时考虑两个目标并始终选取较优者。这样做的好处之一是能在某一目标陷入局部最优时更快的跳出局部最优,并加快收敛速度。
附图说明
图1为CFD仿真软件计算船舶性能绘制网格过程。
图2为船舶航行时遭遇的各阻力关系。
图3为拉丁超立方采样生成的cargovessel船型数据分布。
图4为使用AdaboostRegression方法船舶性能预测效果图。
图5为使用Decision Tree方法船舶性能预测效果图。
图6为使用RBF神经网络方法船舶性能预测效果图。
图7为使用随机森林方法船舶性能预测效果图。
图8为使用Two Stage TrAdaBoost.R2方法船舶性能预测效果图。
图9为大尺度采样数据的预测均方误差图。
图10为小尺度采样数据的预测均方误差图。
图11为大尺度采样数据拟合效果图。
图12为小尺度采样数据拟合效果图。
图13为第一阶段大尺度采样点示意图。
图14为第二阶段微调采样点示意图。
图15为基于迁移学习建立代理模型流程图。
图16为不同优化策略的收敛速度对比图。
图17为固定船宽时不同优化策略的收敛速度对比图。
图18为固定型深时不同优化策略的收敛速度对比图。
图19为粒子数为20时不同优化策略的收敛速度对比图。
图20为粒子数为50时不同优化策略的收敛速度对比图。
图21为粒子数为80时不同优化策略的收敛速度对比图。
图22为粒子数为100时不同优化策略的收敛速度对比图。
图23为不同优化策略陷入局部最优的次数对比图。
图24为固定船宽时不同优化策略陷入局部最优的次数对比图。
图25为固定型深时不同优化策略陷入局部最优的次数对比图。
图26为不同粒子数在不同优化策略下陷入局部最优的次数对比图。
具体实施方式
以下根据附图及实施例对本发明的技术方案进行进一步的说明。
1.方法概述
Two Stage TrAdaBoost.R2
Two Stage TrAdaBoost.R2方法是在TrAdaBoost方法和AdaBoost.R2方法的基础上提出来的。其中TrAdaBoost方法用于解决存在源域的分类问题,核心思想是通过将源域数据的知识迁移到目标域数据上,并在处理数据不充分或分布不同的情况下,提高目标域数据的分类性能和泛化能力。AdaBoost.R2的基本思想是通过迭代的方式训练一系列弱回归模型,并将它们加权组合成一个强回归模型。在每一轮迭代中,它会根据当前模型的预测结果与真实结果之间的误差来调整样本的权重,使下一轮迭代中更多的注意力放在之前模型预测结果较差的样本上,从而提高整体模型的准确性。
将AdaBoost.R2的原理与TrAdaBoost的原理相结合,产生了新的回归算法TrAdaBoost.R2。Pardoe等人在观察TrAdaBoost.R2算法发现它非常容易受到过拟合的影响,即在某些点之外,预测精度随着迭代次数N的增加反而降低。然而AdaBoost.R2算法似乎并没有遇到这个问题,但却会让那些与目标实例相似的样本权重逐渐降低为0,这一现象在TrAdaBoost.R2中得到了加重。而TrAdaBoost却能很好地保持样本的最终权重分配。
基于上述两个问题,提出了Two Stage TrAdaBoost.R2算法,该算法分两阶段调整样本权重:在第一阶段,通过F折交叉验证确定权重下限,并在迭代过程中逐渐向下调整源实例的权重直至这个下限值;在第二阶段,目标实例的权重在AdaBoost.R2中正常更新,而所有源实例的权重都将停止更新。另外,只有在第二阶段中生成的假设才被存储并用于最终结果模型的输出。请注意,加权因子βt不是像以前那样基于假设误差来选择的,而是为了给目标实例带来一定的总权重而选择的。以这种方式,目标实例的总权重从一个初始值m/(n+m)在迭代次数S步后均匀增加到1,这样做是为了给目标实例带来一定的总权重,从而缓解权重偏移而带来的过拟合影响。算法流程如下所示。
Two Stage TrAdaBoost.R2算法的具体步骤如下:
步骤(a),设源域数据集为Tsource,其数据量为n,目标域数据集为Ttarget,其数据量为m,步骤数S,增强迭代的最大次数为N,交叉验证折数为F,基础模型为learner,令数据集T为Tsource和Ttarget的并集,大小为n+m,并且前n个实例来自Tsource;设置初始权重向量其中/>
步骤(b),对数据集T使用AdaBoost.R2算法,创建第t次迭代的权重向量wt,N,和Learner获得模型modelt,但每次迭代中,对于中的前n个实例权重不进行更新,同理,使用F折交叉验证得到模型modelt的误差估计errort;
步骤(c),通过数据集T和权重wt调用learner得到一个映射关系ht:X→R;
其中,R表示X关于映射ht的像,X表示R关于映射ht的原像
步骤(d),对每一个样本计算误差
令
则相对误差为
计算调整误差εt:
计算模型modelt的加权因子βt:
βt=εt/(1-εt)
其中,Et和分别为最大绝对误差和相对误差,xi、xj表示T中变量值,yj表示xj的真实标签值,ht(xj)表示xj的函数预测值;
步骤(e),更新权重向量
其中,Zt为归一化系数,由于第一阶段未对后m个目标实例权重进行更新(只进行了简单的归一化),因此对于这m个实例的最终权重将调整为:
步骤(f),循环迭代S次步骤(b)至步骤(e);
步骤(g),输出modelk,其中k=argminv errorv,v=1,2,...,S.。
最后需要注意的是,如果源域和目标域的数据特征维度不一样,可能需要进行特征对齐、特征映射或者特征变换等操作,以使得源域和目标域的数据在相同的特征空间中进行表示。这样才能为Two Stage TrAdaBoost.R2算法提供相应的输入,使得算法可以在源领域和目标领域之间进行有效的知识迁移。
两阶段采样
采样步骤运用采样方法与物体形变方法结合进行目标船舶数据样本的扩充,选取一艘需要优化的初始船作为母船,分别对大尺度以及局部小尺度的形变来实现船体的变形与重构。并分为两阶段进行:第一阶段主要通过改变船的大尺度如长宽高来对船的主尺度外形进行改变,第二阶段对影响船的局部特征的变量进行改变,通过两阶段可得到不同长宽比、型宽吃水比以及局部特征不同的子船型。
混合优化策略
对于构建的双代理模型,最终的最优值并不能绝对保证出现在某一个代理模型中。此时分别独立寻优不失为一种可行方法,但却存在以下两个问题:一是寻优时间问题。当独立地进行迭代求解时,总的迭代次数也将是两部分之和,需要的迭代时间以及计算资源开销也会比较大,并且会随着问题的维度升高或者搜索空间的增大而迅速增加;二是收敛速度问题。对目标独立求解时也比较容易陷入局部最优,或者需要循环迭代很多次才能跳出某一个局部解,并且从局部解成功跳出来的概率仍比较小,多数时间会出现所有粒子收敛到同一局部最优解的情况。这导致收敛到最终解的速度将会变慢,甚至最终结果只收敛到某一次优解。
基于上述两个问题,本专利对优化算法的迭代过程进行了修改。不再是两个目标独立地进行求解,而是在所有粒子迭代更新时,同时考虑两个目标并始终选取较优者。下式展示了第t次迭代中的函数值选择。这样能保证在某一目标陷入局部最优时更快的跳出局部最优,并加快收敛速度。另外在不同粒子数时收敛效果也将有所区别。下式展示了第t次迭代中的函数值选择。其中f(Xt)表示第t次迭代中的适应度值,表示第t次迭代中粗代理模型的适应度值,/>表示第t次迭代中细代理模型的适应度值。
2.实验数据集
为了评估所提出的方法,我们在公共数据集系列60船模实验数据集和我们的目标数据集:cargo_vessel货船数据集和KCS采样数据集上进行了实验。
系列60船模实验数据集是系列60船模在方形系数Cb为0.6~0.8,船长型宽比L/B为5.5~8.5、型宽吃水比B/H为2.5、3、3.5的范围内变换形成的系列船型,并在速长比V/√Lwl为0.9~1.6的范围内进行船模试验所积累的阻力数据,60系列一共使用45个船模,数据838组。
cargo_vessel货船数据集由船长型宽比L/B为6.0~7.5,方形系数为0.45-0.6的民用货船数据组成,阻力数据为使用MAXSURF软件建立船模后导入CFD软件Fluent计算所得。该数据可用来验证本发明使用方法的有效性,以及模型预报效果与CFD仿真结果的误差情况。
KCS采样数据集为通过采样方法对KCS船模进行采样而得到的数据集。KCS是一艘由韩国船舶与海洋工程研究院(KRISO)开发的具有球鼻艏的现代化集装箱船模,是国际通用的标准船型。通过对该船进行大尺度和局部采样获得两个数据集,并通过上述迁移学习方法进行建模,最后对该船进行船型的优化。
实施例
Two Stage TrAdaBoost.R2
为验证已知的系列60船模实验数据对目标域建立的代理模型有显著贡献,通过采用一艘普通货船cargo_vessel,经过拉丁超立方采样生成的100条不同尺寸船型数据。并将这批数据随机扰乱后的100条数据的分布情况展示如图3所示,从图3可以看到cargo_vessel数据的总阻力系数CT的分布与系列60船模数据分布区间不同,该数据90%分布在0.742到0.941之间,最小值0.742,最大值1.151。
将cargo_vessel数据的其中20条作为目标域的训练集,剩下的85条作为测试集。为验证迁移学习预测效果的显著性,将常见的机器学习算法拟合效果作对比。图4到图8展示了Adaboost回归、决策树、RBF神经网络、随机森林以及Two Stage TrAdaBoost.R2方法在测试集上的表现效果。表1给出了他们在测试集上的最优误差MSEbest,最差误差MSEbest以及平均误差MSEmean,从表中结果来看,Two Stage TrAdaBoost.R2方法在测试集上的表现显著优于其与机器学习算法,体现了迁移学习在船舶领域小样本场景下船舶性能预测的有效性和准确性。
表1 cargovessel数据集上不同算法的船舶预报性能
我们在第一阶段和第二阶段分别采集20和40条仿真数据,并通过系列60船模数据进行回归迁移的建模。根据两阶段仿真结果的总阻力系数CT分别建立关于总阻力系数的代理模型。其中以Decision Tree作为该方法的基学习器,基本参数设置如表2所示。表中分别给出了弱学习器的数量NoE、算法迭代轮数Steps、交叉验证次数Fold以及决策树的最大深度MaxD。
首先我们将常用的一些机器学习算法在我们的目标域上进行拟合预测,图9和图10分别展示了在两个阶段的目标域上的均方误差(MSE)情况。其中x轴表示训练数量,训练数量加上预测数量为目标域的总数量。可以看出随着训练数量的增加,Two StageTrAdaBoost.R2算法都表现出良好的鲁棒性能和预测效果,大部分情况均拥有最低的预测误差。
最后通过该回归迁移算法对目标域进行训练,训练的MSE分别为0.0038和0.0086,图11和图12展示了对所有目标域数据的回归拟合效果。
表2 Two Stage TrAdaBoost.R2基本参数设定
船型优化
两阶段采样
选取KCS作为待优化船型,通过拉丁超立方采样对其进行样本扩充。
由于KCS左右对称,固只需改变半艘船的形状即可,因此设计变量也只需在一半的船上进行选择。然后创建合适大小的立方体网格并将需要变形的区域放置在网格中。本发明通过拉丁超立方采样的数据来对设计变量进行调控以实现对网格内物体的变形。
对船型采样时分为两个阶段,第一阶段主要改变船的主尺度比值,包括船宽、型深的变化以组成不同的长宽比、型宽吃水比等。第一阶段采样过程遵循船舶尺度比值规范。第二阶段包括对船头以及船尾进行局部微调得到不同形状的子船型。第二阶段采样过程满足排水量约束:|Δ′/Δ-1|≤0.01,以及船体湿表面积约束|S′/S-1|≤0.01。
我们现在令设计变量为:其中i=1,2,...,11表示11个由不同顶点集合组成的变形点组。j=1,2,3分别表示沿x轴,y轴,z轴进行FFD拉伸变化。图13和图14展示了具体变量对应的点。不同的点i变形的方向j遵循不同的约束,如为了保证船舶的变化合理性,在对船宽及型深变化时分别只在沿船宽方向y轴与型深方向z轴进行变化,而在对船局部调整时选取非船舶边界点以保证船的长度、宽度以及吃水不变。
具体地有:
总共27个设计变量来控制船的所有调整。如其中表示第一个顶点组对船的型宽沿y轴的调整值,/>和/>表示第二个和第三个顶点组分别通过六面体上表面与下表面沿z轴对船的型深进行调整的值。其余点表示对船的局部进行调整。因此第一阶段采样的设计变量为j=2,3时对应的/>和/>第二阶段采样对应的设计变量为全部的共计27个设计变量/>
设计变量的约束条件见表3,其中L表示船长。当所有变量取0时表示船的初始位置。
表3设计变量约束范围
总阻力系数的双代理模型
通过迁移学习方法可以将已有的系列60船模试验数据集的知识迁移到我们的目标船型集上,可以使得在少量数据集上建立起良好性能的船舶总阻力系数的代理模型。系列60船模数据为4维,分别为CB、L/B和B/H,其中V表示船速,Lwl表示水线长,CB为方形系数,L和B分别表示船长和船宽,H表示吃水高度。而控制船进行变形的设计变量有27个,固目标域数据维度为31维。为了使Two Stage TrAdaBoost.R2算法能更好地进行知识迁移,需要对源域数据缺失的维度数据进行特征处理,为方便起见,本发明采用目标域对应维度均值进行填充。然后根据迭代图15所示的步骤来建立代理模型。
通过迁移学习对两个采样阶段的数据分别建立两个代理模型,分别表示仅对的主尺度变化的粗代理模型f1(X1),和包括局部微调变化的细代理模型f2(X2)。
双代理模型的混合优化
优化定义
本发明中由于对KCS采样得到的数据分为两部分,并且两部分采样需满足不同的约束。因此,对于代理模型f1(X1)、f2(X2)进行优化时,也将满足不同的约束。对于f1(X1)的优化过程需要满足船舶设计主尺度约束,而f2(X2)需要保持船主尺度不变以及满足排水量和湿表面积变化量的约束。
优化目标如下:
船型大尺度优化Opt1:
Min CT=f1(X1),Fr=0.26
st.6.0≤L/B≤7.5
2.7≤B/d≤3.8
1.5≤D/d≤2.0
X1∈D1
船型细尺度优化Opt2:
Min CT=f2(X2),Fr=0.26
st.l=L-L0=0
b=B-B0=0
t=d-d0=0
v=|Δ′/Δ-1|≤0.01
s=|S′/S-1|≤0.01
X2∈D2
其中CT表示总阻力系数,BKCS表示原始母船KCS的宽度,B表示船宽,L表示船长,D表示型深,d表示吃水深度,Fr表示傅汝德数。等式约束l、b、t分别表示船的长度、宽度以及吃水变化量,而微调阶段需保持这些量的值为0。其中L0、B0和d0分别表示对该船在变形前的船长、船宽和吃水深度。不等式约束v与s分别表示微调阶段船的排水量与湿表面积变化量不超过原船的1%。其中Δ和Δ′分别表示船在变形前后的排水量,S和S′分别表示船在变形前后的湿表面积。D1、D2为表1所示的变量可行域。
混合优化策略
对上述构建的f1(X1)和f2(X2)进行混合优化,最终的最优值并不能绝对保证出现在某一个代理模型中。本发明对QPSO算法的迭代过程进行了修改。所有粒子在迭代过程中需要同时计算f1(X1)和f2(X2)的适应度值并选取最优的,然后再进行后续的迭代。
船型优化结果
现在我们对优化阶段设置参数。令QPSO算法的最大迭代次数为:1000*D,D为问题维数,种群大小为100。所有优化取独立运行31次的最佳值。
首先我们通过混合寻优方式对两个代理模型进行优化。表4的结果展示了最终优化结果在主尺度上的变化以及最终总阻力系数。
CT的变化情况。通过表结果可知最终优化后(Opt)的总阻力系数下降了17.93%,通过CFD仿真计算得到总阻力系数为3.0013,优化结果与实际仿真值误差为1.67%。另外,由于船长始终保持原始值,很容易得到优化后的船宽为30.69m,型深为16.88m。湿表面积减少了126.87m2(1.34%),排水量减少了2568.62m3(4.93%)。
表4最终船型优化结果
收敛结果对比
为比较我们所提出的混合优化策略的有效性,针对上述的总阻力系数优化结果,我们对采用单一搜索策略和混合搜索策略的收敛结果进行对比。图16展示了每一代中最优粒子的收敛速度。从图中可以看出采用了混合优化策略的方法收敛速度是最快的。另一方面,得益于QPSO算法的高效性和搜索空间大小的限制,所提出的方法在一开始便显示出了快速的收敛性能。可以看出当仅使用细代理模型进行优化(Opt2)时,收敛所需的迭代步数大于混合优化策略的2倍。而对于粗代理模型优化(Opt1),即只对大尺度优化时,从4.4.1节的结果也可知,最终得到的结果并没有加入局部调整的结果好。因此他只收敛到了3.0931。
最后为分析两阶段优化结果差异情况,我们分别对在不同约束下进行优化实验。表5展示了我们分别对于固定船宽、型深和微调时的优化结果。并通过CFD仿真计算所得结果的实际误差。对于表中前四列只展示了两个优化结果中的较优者对应的数值。在本实验中Opt2结果均优于Opt1的结果。
通过表5可以看出,对于不同约束下的优化结果,两个优化阶段表现出的效果也不同。总体来说只对第一阶段进行大尺度优化得到的结果普遍差于第二阶段的优化结果。第二阶段不仅包括了在主尺度上的改变,也包括进一步的船头船尾的细节变化。因此第二阶段的结果更优也符合实际情况,但并非绝对情况。特别的,对于不允许改动主尺度时,即只基于初始船进行船头和船尾的形状调整,得到优化结果为3.2574×10-3,优化幅度为9.41%,与CFD仿真结果误差为1.12%。Miao等人在对KCS进行船头与船尾变形优化时,选取了三种不同备选方案的最佳船体形式,在Fr=0.26时总阻力系数分别下降了1.52%、4.24%和9.24%。
表5不同约束下的优化结果
同理,我们对固定船在同一高度或宽度的约束下进行同样的收敛性实验。结果如图17和图18。通过图结果可知最终采用了混合优化策略的方法在收敛速度上始终是最快的。
上述收敛结果均为粒子数为100时的情形。为了分析优化阶段粒子数对于优化过程的收敛影响,下面我们分别将粒子数控制在不同的值,分析采用和不采用混合优化策略的最优值收敛情况。
我们分别将粒子数控制在20、50、80、100。由于Opt1的优化效果在本发明实验中均低于Opt2,并且由于问题维度很低,很快收敛到它的最优值,将其纳入收敛结果对比意义不大,固下面只将单纯的Opt2过程与采用混合优化策略的情况进行实验对比。从图19至图22中可以看到在所有的情况下混合优化策略的收敛速度均高于单纯的Opt2过程。
针对本发明的实验结果,由于Opt2的结果始终优于Opt1,下面对仅使用Opt2和采用了混合优化策略的陷入局部最优情况的对比。为了考察优化过程陷入局部最优的情况,我们总共对优化实验进行了不同次数的求解,其中图23至图25的柱状图展示了不同优化过程陷入局部最优的次数。可以看出采用了混合优化策略的求解过程也大大降低了陷入局部最优的概率。特别是对于未加大尺度约束时效果是最明显的,即图23,原因在于此时对于Opt1和Opt2的优化过程所有变量均可在可行域内进行搜索,使得寻找更优解的概率也会大大增加。
图26展示了在未加大尺度约束条件下粒子数为20、50、80、100和200时分别迭代50轮时的Opt2和混合优化策略时结果陷入局部最优的次数。可以看到单纯使用Opt2进行迭代时陷入局部解的次数一直高于混合优化策略。
Claims (6)
1.一种基于迁移学习的船型优化方法,其特征在于,具体步骤如下:
(1)获取公开的船模实验数据集作为源域数据集,并对源域数据进行预处理和特征处理;
(2)目标域数据集通过对需要进行船型优化的初始船进行采样获得;基于船型全局设计和船型局部设计两个方面,将目标域数据的采样及建模分为对应的两个阶段:基于全局尺度采样数据构建的粗代理模型和基于局部尺度采样数据构建的细代理模型,两个代理模型共同用于后续的优化过程;
(3)所述的步骤(2)中代理模型的构建过程:利用Two Stage TrAdaBoost.R2方法,利用源域数据对目标域数据辅助建模,两个阶段的建模分别得到粗代理模型和细代理模型;
(4)将建立好的粗代理模型和细代理模型应用到优化过程中,采用改进后QPSO优化算法对目标域的船型数据进行优化,以提高船舶的性能和效率;改进后QPSO优化算法在优化过程不是两个目标独立地进行求解,而是在所有粒子迭代更新时,同时考虑两个目标并始终选取较优者,然后再进行后续的迭代。
2.根据权利要求1所述的一种基于迁移学习的船型优化方法,其特征在于,步骤(1)中,所述的源域数据集的预处理:从源域数据集中,选择与目标域数据集具有相似特征的样本数据,剔除源域数据集中与目标域数据明显差别过大的样本,源域数据集的特征处理:包括特征对齐、特征映射或者特征变换,使得源域和目标域的数据在相同的特征空间中进行表示。
3.根据权利要求1所述的一种基于迁移学习的船型优化方法,其特征在于,步骤(2)中,全局尺度采样包括对船长、船宽和型深这样的主尺度的采样,局部尺度采样指对船某一局部位置尺寸的采样。
4.根据权利要求1所述的一种基于迁移学习的船型优化方法,其特征在于,步骤(2)中,所述的目标域数据集的特征处理:特征对齐、特征降维、特征扩充;所述的目标域数据集的预处理:对于船舶的不同性能,需要通过相关性分析提取特征之间的关联,并对其无量纲化和标准化预处理操作,便于后续模型的训练;采样后通过CFD仿真获得需要的性能数据,从而获得添加了标签的目标域数据集。
5.根据权利要求1所述的一种基于迁移学习的船型优化方法,其特征在于,步骤(4)中,在满足设计变量约束下,分别对不同条件下的船的外形进行优化,以满足不同的实际要求;最后将最优解通过数值重构得到船的外形,并通过CFD仿真进行验证优化结果;优化过程均选用改进后QPSO优化算法对目标进行搜索。
6.根据权利要求1所述的一种基于迁移学习的船型优化方法,其特征在于,步骤(4)中,优化过程中,第t次迭代中的函数值选择;其中f(Xt)表示第t次迭代中的粒子适应度值,表示第i个粒子/>在第t次迭代中粗代理模型的适应度值,/>表示第i个粒子在第t次迭代中细代理模型的适应度值;N表示粒子的种群大小;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310727001.5A CN116720260A (zh) | 2023-08-10 | 2023-08-10 | 一种基于迁移学习的船型优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310727001.5A CN116720260A (zh) | 2023-08-10 | 2023-08-10 | 一种基于迁移学习的船型优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116720260A true CN116720260A (zh) | 2023-09-08 |
Family
ID=87874919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310727001.5A Pending CN116720260A (zh) | 2023-08-10 | 2023-08-10 | 一种基于迁移学习的船型优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116720260A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118013647A (zh) * | 2024-03-22 | 2024-05-10 | 江南大学 | 基于迁移学习的船体外形设计代理辅助优化方法 |
-
2023
- 2023-08-10 CN CN202310727001.5A patent/CN116720260A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118013647A (zh) * | 2024-03-22 | 2024-05-10 | 江南大学 | 基于迁移学习的船体外形设计代理辅助优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Mngnas: distilling adaptive combination of multiple searched networks for one-shot neural architecture search | |
CN108959728B (zh) | 基于深度学习的射频器件参数优化方法 | |
Kavousi-Fard | Modeling uncertainty in tidal current forecast using prediction interval-based SVR | |
CN107578061A (zh) | 基于最小化损失学习的不平衡样本分类方法 | |
CN113641722A (zh) | 一种基于变体lstm的长期时间序列数据预测方法 | |
CN107330902B (zh) | 基于Arnold变换的混沌遗传BP神经网络图像分割方法 | |
CN107798379B (zh) | 改进量子粒子群优化算法的方法及基于改进算法的应用 | |
CN116503676B (zh) | 一种基于知识蒸馏小样本增量学习的图片分类方法及系统 | |
CN116579371A (zh) | 一种双层优化异构代理模型辅助多目标进化优化计算方法 | |
CN111355633A (zh) | 一种基于pso-delm算法的比赛场馆内手机上网流量预测方法 | |
CN116720260A (zh) | 一种基于迁移学习的船型优化方法 | |
CN107578101B (zh) | 一种数据流负载预测方法 | |
CN109074348A (zh) | 用于对输入数据集进行迭代聚类的设备和迭代方法 | |
CN114564787A (zh) | 用于目标相关翼型设计的贝叶斯优化方法、装置及存储介质 | |
CN108090564A (zh) | 基于网络权重初始和最终状态差异的冗余权重去除方法 | |
Yao et al. | Efficient global multi-objective aerodynamic optimization using combined multi-point infilling strategy and surrogate models | |
CN113240094A (zh) | 一种基于svm的lstm超参数优化方法、系统、介质及设备 | |
CN116976405A (zh) | 基于免疫优化算法的变分阴影量子神经网络 | |
CN117313576A (zh) | 一种用于翼型物理量重要度分析的贝叶斯优化方法 | |
CN115966266A (zh) | 一种基于图神经网络的抗肿瘤分子强化方法 | |
CN115423149A (zh) | 一种能源互联网负荷预测和噪声等级估计的增量迭代聚类方法 | |
Guo et al. | Optimal control of blank holder force based on deep reinforcement learning | |
Hsieh et al. | MS-DARTS: Mean-shift based differentiable architecture search | |
CN113743012A (zh) | 一种多用户场景下的云-边缘协同模式任务卸载优化方法 | |
CN114429800A (zh) | 基于模型融合的甲烷水合物生成速率预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |