Nothing Special   »   [go: up one dir, main page]

CN114862035A - 一种基于迁移学习的组合式海湾水温预测方法 - Google Patents

一种基于迁移学习的组合式海湾水温预测方法 Download PDF

Info

Publication number
CN114862035A
CN114862035A CN202210556998.8A CN202210556998A CN114862035A CN 114862035 A CN114862035 A CN 114862035A CN 202210556998 A CN202210556998 A CN 202210556998A CN 114862035 A CN114862035 A CN 114862035A
Authority
CN
China
Prior art keywords
water temperature
data
day
prediction model
bay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210556998.8A
Other languages
English (en)
Other versions
CN114862035B (zh
Inventor
陈能汪
赖晓倩
余镒琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN202210556998.8A priority Critical patent/CN114862035B/zh
Publication of CN114862035A publication Critical patent/CN114862035A/zh
Application granted granted Critical
Publication of CN114862035B publication Critical patent/CN114862035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Medical Informatics (AREA)
  • Animal Husbandry (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Geometry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Agronomy & Crop Science (AREA)
  • Computer Hardware Design (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于迁移学习的组合式海湾水温预测方法,该方法利用历史观测数据多的B海湾构建最佳的源LSTM神经网络模型,再基于最佳的源LSTM神经网络模型,通过迁移学习构建历史观测数据少的A海湾的最佳迁移LSTM神经网络模型,再结合纯差分回归预测模型和混差分回归预测模型,采用动态加权的方式将三个模型组合成A海湾的迁移水温在线预测模型或B海湾的源水温在线预测模型,不仅可通过源水温在线预测模型对历史观测数据较多的海湾进行水温预测,还可通过迁移水温在线预测模型对历史观测数据较少的海湾进行水温预测,预测精度高、结果可靠,解决了现有技术中因数据量不足导致水温预测精度不高的问题。

Description

一种基于迁移学习的组合式海湾水温预测方法
技术领域
本发明涉及水温预测技术领域,具体的说是一种基于迁移学习的组合式海湾水温预测方法。
背景技术
水温是水产养殖中影响鱼类生长状况、生长质量的关键因素之一,水温的突变会对水体中pH值、溶解氧、氨氮等产生影响,影响鱼类适宜的生存环境。
水温易受气温、水生物活动等多因素交叉影响,具有非平稳、非线性等特征,使得单项预测方法存在预测精度低、泛化性能差等缺陷,难以满足人们对渔业生产管理的实际需要。
现有的水温预测方法主要包括传统数理统计法和人工智能方法,基于水温机理的数理方法对影响水温变化的机理和因素进行了分析,研究了不同水层条件、时空分布、流速、流量等对水温的影响,利用水文气象理论、二维和三维模型等构建水温预测模型,这些方法虽然能够对水库、水槽的水温进行有效预测,但预测模型复杂,参数多且难获取;基于数据挖掘的非机理方法一般通过大量数据构建数学模型,获得水温与相关影响因子的关系,捕捉水温变化规律,针对大量样本构建的数学模型较多使用机器学习算法,但单一的机器学习算法往往只能预测水温变化趋势,无法对水温突变点进行有效预测。机器学习往往需要大量的训练数据,才能更好地发挥它的效果。但在实际的很多场景中,目标域没有足够多的训练数据,且构造的通用模型很难针对特定场景进行精确预测。目前仍缺少能有效预测水温变化趋势和水温突变点的水温预测方法,同时面临着机器学习和训练数据少之间的矛盾及通用模型与个性化需求之间的矛盾。
发明内容
本发明的目的在于提出了一种基于迁移学习的组合式海湾水温预测方法,该精度高、结果可靠,能较好地预测海湾未来7天的水温数值,并通过迁移学习技术帮助目标模型获取源模型学习到的知识以提升自身模型的预测性能,解决了现有技术中因数据量不足导致水温预测精度不高的问题,可为海洋渔业生产、科研和管理提供数据、信息和服务保障。
为实现上述目的,本发明采用以下技术方案:
一种基于迁移学习的组合式海湾水温预测方法,包括以下步骤:
S1、分别收集A海湾和B海湾的水温数据和气象数据,并分别进行数据预处理,所述B海湾的历史观测数据比所述A海湾的历史观测数据多;
S2、基于各自的预报气温差分值、实测水温值分别构建A海湾与B海湾的纯差分回归预测模型;基于各自的预报气温差分值、实测水温差分值和实测水温值分别构建A海湾与B海湾的混差分回归预测模型;
S3、针对B海湾,构建LSTM神经网络模型,通过训练和测试,选取最佳源LSTM神经网络预测模型;将最佳的源LSTM神经网络预测模型、B海湾的纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成源水温在线预测模型;再根据源水温在线预测模型对B海湾的水温进行预测;
S4、针对A海湾,选取B海湾最佳的源LSTM神经网络预测模型,通过迁移学习和测试,选取最佳迁移LSTM神经网络预测模型;将最佳迁移LSTM神经网络预测模型、A海湾的纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成迁移水温在线预测模型;再根据迁移水温在线预测模型对A海湾的水温进行预测。
优选地,步骤S1中所述水温数据包括日最高水温、日最低水温和日平均水温;所述气象数据包括气象观测数据和气象预报数据;所述气象观测数据包括气温统计量、气压统计量、相对湿度统计量、风速统计量、风向统计量和降水,时间分辨率为1天;所述气象预报数据包括每天更新的未来7日气象预报数据,未来7日气象预报数据包括未来7日的日最高温和日最低温。
优选地,步骤S2中纯差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
Figure BDA0003655313100000031
水温实测值为xk,当前时刻为t,则第1天水温预测值
Figure BDA0003655313100000032
的计算公式为:
Figure BDA0003655313100000033
第n(2≤n≤7)天水温预测值
Figure BDA0003655313100000034
的计算公式为:
Figure BDA0003655313100000035
其中,xt-1为第t-1天的水温实测值;
Figure BDA0003655313100000036
为第t+1-i天获取的当天气温预报值;
Figure BDA0003655313100000037
为第t-i天获取的当天气温预报值;
Figure BDA0003655313100000038
为第t天获取的未来第n天的气温预报值;
Figure BDA0003655313100000039
为第t天获取的当天气温预报值;wp1,wp2,wp3
Figure BDA00036553131000000310
Figure BDA00036553131000000311
为权重,通过构建线性回归方程的方式进行选取。
优选地,步骤S2中混差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
Figure BDA00036553131000000312
水温实测值为xk,当前时刻为t,则第1天水温预测值
Figure BDA00036553131000000313
的计算公式为:
Figure BDA00036553131000000314
第n(2≤n≤7)天水温预测值
Figure BDA00036553131000000315
的计算公式为:
Figure BDA00036553131000000316
其中,xt-1为第t-1天的水温实测值;xt-2为第t-2天的水温实测值;
Figure BDA00036553131000000317
为第t天获取的当天气温预报值;
Figure BDA00036553131000000318
为第t-1天获取的当天气温预报值;
Figure BDA00036553131000000319
为第t天获取的未来第n天的气温预报值;wm1,wm2
Figure BDA00036553131000000320
为权重,通过构建线性回归方程的方式进行选取。
优选地,通过线性回归方程的方式选取wp1,wp2,wp3,
Figure BDA00036553131000000321
wm1,wm2
Figure BDA00036553131000000322
Figure BDA00036553131000000323
的具体方式为:
设第k天发布的气象预报的气温预测值分别为
Figure BDA00036553131000000324
水温实测值为xk,当前时刻为t,根据该海湾的历史水温和气象预报数据,按以下各式建立线性回归方程,计算wp1,wp2,wp3,
Figure BDA00036553131000000325
wm1,wm2
Figure BDA00036553131000000326
Figure BDA00036553131000000327
Figure BDA00036553131000000328
Figure BDA0003655313100000041
Figure BDA0003655313100000042
其中,xt+1-n为第t+1-n天的水温实测值。
优选地,步骤S3的具体过程为:
S21、采用B海湾的水温数据和气象数据,对水温数据进行归一化处理,并将水温数据和气象观测数据按0.8:0.2的比例划分为训练集和测试集;
S22、基于水温数据的训练集部分,将气象观测数据和过去若干天的水温数据进行组合得到组合数据,再将组合数据作为输入因子,未来7天的水温数据作为输出因子,构建得到源LSTM神经网络预测模型,所述过去若干天的水温数据是指选取不同时间长度的水温数据;所述组合数据是指将水温数据作为固定输入参数,与其它气象观测要素遍历的方式进行组合;
S23、基于水温数据的测试集部分,将组合数据输入到训练好的网络中,通过反归一化,得到未来7天的日频水温预测结果;
S24、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R2作为检验标准,统计模型测试结果,并选取最佳的源LSTM神经网络预测模型;
S25、设置最佳的源LSTM神经网络预测模型、B海湾的纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。
优选地,步骤S4的具体过程为:
S31、获取步骤S21至S24构建得到的B海湾的最佳源LSTM神经网络预测模型;
S32、采用A海湾的水温数据和气象数据,对A海湾的数据进行归一化处理,并按0.5:0.5的比例划分为训练集和测试集;
S33、冻结最佳源LSTM神经网络预测模型的部分网络层,基于A海湾的训练集部分对网络进行微调,以实现对最佳源LSTM神经网络预测模型的迁移学习;
S34、基于A海湾的测试集部分,通过反归一化,得到未来7天的日频水温预测结果;
S35、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R2作为检验标准,统计模型测试结果,并选取最佳迁移LSTM神经网络预测模型;
S36、设置最佳迁移LSTM神经网络预测模型、A海湾的纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。
优选地,步骤S21和步骤S32中归一化处理的计算公式为:
Figure BDA0003655313100000051
其中,X是原始实测数据,Xnormal是归一化后的数据,Xmean和Xstd分别是B海湾的均值和方差。
优选地,步骤S23和步骤34中反归一化公式为:
Xfinal=Xpre*Xstd+Xmean
其中,Xpre是原始预测值,Xfinal是反归一化的最终预测值,Xmean和Xstd分别是B海湾的均值和方差;
步骤S24和S35中所述水温预警等级准确率的计算公式为:
Figure BDA0003655313100000052
其中,水温等级的划分参照大黄鱼的适宜生长温度,共有7个等级;
以均方根误差RMSE为最重要的指标,对所有训练好的模型进行测试,选取在验证集和测试集中精度最高的模型为最佳的LSTM神经网络预测模型或迁移LSTM神经网络预测模型。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:本发明为预测水温的变化趋势,利用历史观测数据多的B海湾构建最佳的源LSTM神经网络模型,再基于最佳的源LSTM神经网络模型,通过迁移学习构建历史观测数据少的A海湾的最佳迁移LSTM神经网络模型;为准确预报水温的突变点,对实测水温和预报气温数据进行差分,基于预报气温差分值、实测水温值构建纯差分回归预测模型,基于预报气温差分值、实测水温差分值和实测水温值构建混差分回归预测模型,最佳的源LSTM神经网络模型或最佳迁移LSTM神经网络模型结合纯差分回归预测模型和混差分回归预测模型;采用动态加权的方式将三个模型组合成A海湾的迁移水温在线预测模型或B海湾的源水温在线预测模型,不仅可通过源水温在线预测模型对历史观测数据较多的海湾进行水温预测,还可通过迁移水温在线预测模型对历史观测数据较少的海湾进行水温预测,预测精度高、结果可靠,能较好地预测海湾未来7天的水温数值,并通过迁移学习技术帮助目标模型获取源模型学习到的知识以提升自身模型的预测性能,解决了现有技术中因数据量不足水温预测精度不高的问题,可为海洋渔业生产、科研和管理提供数据、信息和服务保障。
附图说明
图1为本发明的流程图;
图2为本发明的流程框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1至图2,一种基于迁移学习的组合式海湾水温预测方法,包括以下步骤:
S1、分别收集A海湾和B海湾的水温数据和气象数据,并分别进行数据预处理,所述B海湾的历史观测数据比所述A海湾的历史观测数据多;
步骤S1中所述水温数据包括日最高水温、日最低水温和日平均水温;所述气象数据包括气象观测数据和气象预报数据;所述气象观测数据包括气温统计量、气压统计量、相对湿度统计量、风速统计量、风向统计量和降水,时间分辨率为1天;所述气象预报数据包括每天更新的未来7日气象预报数据,未来7日气象预报数据包括未来7日的日最高温和日最低温;
S2、基于各自的预报气温差分值、实测水温值分别构建A海湾与B海湾的纯差分回归预测模型;基于各自的预报气温差分值、实测水温差分值和实测水温值分别构建A海湾与B海湾的混差分回归预测模型;
步骤S2中纯差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
Figure BDA0003655313100000071
水温实测值为xk,当前时刻为t,则第1天水温预测值
Figure BDA0003655313100000072
的计算公式为:
Figure BDA0003655313100000073
第n(2≤n≤7)天水温预测值
Figure BDA0003655313100000074
的计算公式为:
Figure BDA0003655313100000075
其中,xt-1为第t-1天的水温实测值;
Figure BDA0003655313100000076
为第t+1-i天获取的当天气温预报值;
Figure BDA0003655313100000077
为第t-i天获取的当天气温预报值;
Figure BDA0003655313100000078
为第t天获取的未来第n天的气温预报值;
Figure BDA0003655313100000079
为第t天获取的当天气温预报值;wp1,wp2,wp3
Figure BDA00036553131000000710
Figure BDA00036553131000000711
为权重,通过构建线性回归方程的方式进行选取;
步骤S2中混差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
Figure BDA00036553131000000712
水温实测值为xk,当前时刻为t,则第1天水温预测值
Figure BDA00036553131000000713
的计算公式为:
Figure BDA00036553131000000714
第n(2≤n≤7)天水温预测值
Figure BDA00036553131000000715
的计算公式为:
Figure BDA00036553131000000716
其中,xt-1为第t-1天的水温实测值;xt-2为第t-2天的水温实测值;
Figure BDA00036553131000000717
为第t天获取的当天气温预报值;
Figure BDA00036553131000000718
为第t-1天获取的当天气温预报值;
Figure BDA00036553131000000719
为第t天获取的未来第n天的气温预报值;wm1,wm2
Figure BDA00036553131000000720
为权重,通过构建线性回归方程的方式进行选取;
通过线性回归方程的方式选取wp1,wp2,wp3,
Figure BDA0003655313100000081
wm1,wm2
Figure BDA0003655313100000082
的具体方式为:
设第k天发布的气象预报的气温预测值分别为
Figure BDA0003655313100000083
水温实测值为xk,当前时刻为t,根据该海湾的历史水温和气象预报数据,按以下各式建立线性回归方程,计算wp1,wp2,wp3,
Figure BDA0003655313100000084
wm1,wm2
Figure BDA0003655313100000085
Figure BDA0003655313100000086
Figure BDA0003655313100000087
Figure BDA0003655313100000088
Figure BDA0003655313100000089
其中,xt+1-n为第t+1-n天的水温实测值;
S3、针对B海湾,构建LSTM神经网络模型,通过训练和测试,选取最佳源LSTM神经网络预测模型;将最佳的源LSTM神经网络预测模型、B海湾的纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成源水温在线预测模型;再根据源水温在线预测模型对B海湾的水温进行预测;
步骤S3的具体过程为:
S21、采用B海湾的水温数据和气象数据,对水温数据进行归一化处理,并将水温数据和气象观测数据按0.8:0.2的比例划分为训练集和测试集;
S22、基于水温数据的训练集部分,将气象观测数据和过去若干天的水温数据进行组合得到组合数据,再将组合数据作为输入因子,未来7天的水温数据作为输出因子,构建得到源LSTM神经网络预测模型,所述过去若干天的水温数据是指选取不同时间长度的水温数据;所述组合数据是指将水温数据作为固定输入参数,与其它气象观测要素遍历的方式进行组合;
S23、基于水温数据的测试集部分,将组合数据输入到训练好的网络中,通过反归一化,得到未来7天的日频水温预测结果;
S24、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R2作为检验标准,统计模型测试结果,并选取最佳的源LSTM神经网络预测模型;
S25、设置最佳的源LSTM神经网络预测模型、B海湾的纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。若第二天LSTM神经网络预测模型的预测精度最高,则令LSTM神经网络预测模型的权重为(1+1)/(3+1)即1/2,令纯差分回归预测模型和混差分回归预测模型的权重均为1/(3+1)即1/4,将模型预测值乘以对应的权重并相加,就得到第二天组合模型对未来七天水温的预测结果;若第三天混差分回归预测模型的预测精度最高,则令混差分回归预测模型的权重为(1+1)/(3+2)即2/5,纯差分回归预测模型的权重为1/(3+2)即1/5,LSTM神经网络预测模型的权重为2/(3+2)即2/5,将模型预测值乘以对应的权重并相加,就得到第三天组合模型对未来七天水温的预测结果,以此类推;
S4、针对A海湾,选取B海湾最佳的源LSTM神经网络预测模型,通过迁移学习和测试,选取最佳迁移LSTM神经网络预测模型;将最佳迁移LSTM神经网络预测模型、A海湾的纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成迁移水温在线预测模型;再根据迁移水温在线预测模型对A海湾的水温进行预测;
步骤S4的具体过程为:
S31、获取步骤S21至S24构建得到的B海湾的最佳源LSTM神经网络预测模型;
S32、采用A海湾的水温数据和气象数据,对A海湾的数据进行归一化处理,并按0.5:0.5的比例划分为训练集和测试集;
S33、冻结最佳源LSTM神经网络预测模型的部分网络层(该LSTM神经网络预测模型共有两层网络层,在此采用冻结第一层网络层的方式),基于A海湾的训练集部分对网络进行微调,以实现对最佳源LSTM神经网络预测模型的迁移学习;
S34、基于A海湾的测试集部分,通过反归一化,得到未来7天的日频水温预测结果;
S35、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R2作为检验标准,统计模型测试结果,并选取最佳迁移LSTM神经网络预测模型;
S36、设置最佳迁移LSTM神经网络预测模型、A海湾的纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。若第二天LSTM神经网络预测模型的预测精度最高,则令LSTM神经网络预测模型的权重为(1+1)/(3+1)即1/2,令纯差分回归预测模型和混差分回归预测模型的权重均为1/(3+1)即1/4,将模型预测值乘以对应的权重并相加,就得到第二天组合模型对未来七天水温的预测结果;若第三天混差分回归预测模型的预测精度最高,则令混差分回归预测模型的权重为(1+1)/(3+2)即2/5,纯差分回归预测模型的权重为1/(3+2)即1/5,LSTM神经网络预测模型的权重为2/(3+2)即2/5,将模型预测值乘以对应的权重并相加,就得到第三天组合模型对未来七天水温的预测结果,以此类推;
步骤S21和步骤S32中归一化处理的计算公式为:
Figure BDA0003655313100000101
其中,X是原始实测数据,xnormal是归一化后的数据,Xmean和Xstd分别是B海湾的均值和方差;
步骤S23和步骤34中反归一化公式为:
Xfinal=Xpre*Xstd+Xmean
其中,Xpre是原始预测值,Xfinal是反归一化的最终预测值,Xmean和Xstd分别是B海湾的均值和方差;
步骤S24和S35中所述水温预警等级准确率的计算公式为:
Figure BDA0003655313100000111
其中,水温等级的划分参照大黄鱼的适宜生长温度,共有7个等级,见表1;
表1.水温等级的划分
Figure BDA0003655313100000112
等级预测结果说明见表2。
表2.等级预警结果说明
Figure BDA0003655313100000113
注:红低:红色低温;橙低:橙色低温;黄低:黄色低温;黄高:黄色高温;
橙高:橙色高温;红高:红色高温
以均方根误差RMSE为最重要的指标,对所有训练好的模型进行测试,选取在验证集和测试集中精度最高的模型为最佳的LSTM神经网络预测模型或迁移LSTM神经网络预测模型。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (9)

1.一种基于迁移学习的组合式海湾水温预测方法,其特征在于,包括以下步骤:
S1、分别收集A海湾和B海湾的水温数据和气象数据,并分别进行数据预处理,所述B海湾的历史观测数据比所述A海湾的历史观测数据多;
S2、基于各自的预报气温差分值、实测水温值分别构建A海湾与B海湾的纯差分回归预测模型;基于各自的预报气温差分值、实测水温差分值和实测水温值分别构建A海湾和B海湾的混差分回归预测模型;
S3、针对B海湾,构建LSTM神经网络模型,通过训练和测试,选取最佳源LSTM神经网络预测模型;将最佳的源LSTM神经网络预测模型、B海湾的纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成源水温在线预测模型;再根据源水温在线预测模型对B海湾的水温进行预测;
S4、针对A海湾,选取B海湾最佳的源LSTM神经网络预测模型,通过迁移学习和测试,选取最佳迁移LSTM神经网络预测模型;将最佳迁移LSTM神经网络预测模型、A海湾的纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成迁移水温在线预测模型;再根据迁移水温在线预测模型对A海湾的水温进行预测。
2.如权利要求1所述的基于迁移学习的组合式海湾水温预测方法,其特征在于:步骤S1中所述水温数据包括日最高水温、日最低水温和日平均水温;所述气象数据包括气象观测数据和气象预报数据;所述气象观测数据包括气温统计量、气压统计量、相对湿度统计量、风速统计量、风向统计量和降水,时间分辨率为1天;所述气象预报数据包括每天更新的未来7日气象预报数据,未来7日气象预报数据包括未来7日的日最高温和日最低温。
3.如权利要求1所述的基于迁移学习的组合式海湾水温预测方法,其特征在于,步骤S2中纯差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
Figure FDA0003655313090000011
水温实测值为xk,当前时刻为t,则第1天水温预测值
Figure FDA0003655313090000012
的计算公式为:
Figure FDA0003655313090000013
第n(2≤n≤7)天水温预测值
Figure FDA0003655313090000021
的计算公式为:
Figure FDA0003655313090000022
其中,xt-1为第t-1天的水温实测值;
Figure FDA0003655313090000023
为第t+1-i天获取的当天气温预报值;
Figure FDA0003655313090000024
为第t-i天获取的当天气温预报值;
Figure FDA0003655313090000025
为第t天获取的未来第n天的气温预报值;
Figure FDA0003655313090000026
为第t天获取的当天气温预报值;wp1,wp2,wp3
Figure FDA0003655313090000027
为权重,通过构建线性回归方程的方式进行选取。
4.如权利要求3所述的基于迁移学习的组合式海湾水温预测方法,其特征在于,步骤S2中混差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
Figure FDA0003655313090000028
水温实测值为xk,当前时刻为t,则第1天水温预测值
Figure FDA0003655313090000029
的计算公式为:
Figure FDA00036553130900000210
第n(2≤n≤7)天水温预测值
Figure FDA00036553130900000211
的计算公式为:
Figure FDA00036553130900000212
其中,xt-1为第t-1天的水温实测值;xt-2为第t-2天的水温实测值;
Figure FDA00036553130900000213
为第t天获取的当天气温预报值;
Figure FDA00036553130900000214
为第t-1天获取的当天气温预报值;
Figure FDA00036553130900000215
为第t天获取的未来第n天的气温预报值;wm1,wm2
Figure FDA00036553130900000216
为权重,通过构建线性回归方程的方式进行选取。
5.如权利要求4所述的基于迁移学习的组合式海湾水温预测方法,其特征在于,通过线性回归方程的方式选取wp1,wp2,wp3,
Figure FDA00036553130900000217
wm1,wm2
Figure FDA00036553130900000218
的具体方式为:
设第k天发布的气象预报的气温预测值分别为
Figure FDA00036553130900000219
水温实测值为xk,当前时刻为t,根据该海湾的历史水温和气象预报数据,按以下各式建立线性回归方程,计算wp1,wp2,wp3,
Figure FDA00036553130900000220
wm1,wm2
Figure FDA00036553130900000221
Figure FDA00036553130900000222
Figure FDA00036553130900000223
Figure FDA00036553130900000224
Figure FDA00036553130900000225
其中,xt+1-n为第t+1-n天的水温实测值。
6.如权利要求2所述的基于迁移学习的组合式海湾水温预测方法,其特征在于,步骤S3的具体过程为:
S21、采用B海湾的水温数据和气象数据,对水温数据进行归一化处理,并将水温数据和气象观测数据按0.8:0.2的比例划分为训练集和测试集;
S22、基于水温数据的训练集部分,将气象观测数据和过去若干天的水温数据进行组合得到组合数据,再将组合数据作为输入因子,未来7天的水温数据作为输出因子,构建得到源LSTM神经网络预测模型,所述过去若干天的水温数据是指选取不同时间长度的水温数据;所述组合数据是指将水温数据作为固定输入参数,与其它气象观测要素遍历的方式进行组合;
S23、基于水温数据的测试集部分,将组合数据输入到训练好的网络中,通过反归一化,得到未来7天的日频水温预测结果;
S24、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R2作为检验标准,统计模型测试结果,并选取最佳的源LSTM神经网络预测模型;
S25、设置最佳的源LSTM神经网络预测模型、B海湾的纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。
7.如权利要求6所述的基于迁移学习的组合式海湾水温预测方法,其特征在于,步骤S4的具体过程为:
S31、获取步骤S21至S24构建得到的B海湾的最佳源LSTM神经网络预测模型;
S32、采用A海湾的水温数据和气象数据,对A海湾的数据进行归一化处理,并按0.5:0.5的比例划分为训练集和测试集;
S33、冻结最佳源LSTM神经网络预测模型的部分网络层,基于A海湾的训练集部分对网络进行微调,以实现对最佳源LSTM神经网络预测模型的迁移学习;
S34、基于A海湾的测试集部分,通过反归一化,得到未来7天的日频水温预测结果;
S35、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R2作为检验标准,统计模型测试结果,并选取最佳迁移LSTM神经网络预测模型;
S36、设置最佳迁移LSTM神经网络预测模型、A海湾的纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。
8.如权利要求7所述的基于迁移学习的组合式海湾水温预测方法,其特征在于,步骤S21和步骤S32中归一化处理的计算公式为:
Figure FDA0003655313090000041
其中,X是原始实测数据,Xnormal是归一化后的数据,Xmean和Xstd分别是B海湾的均值和方差。
9.如权利要求7所述的基于迁移学习的组合式海湾水温预测方法,其特征在于,步骤S23和步骤34中反归一化公式为:
Xfinal=Xpre*Xstd+Xmean
其中,Xpre是原始预测值,Xfinal是反归一化的最终预测值,Xmean和Xstd分别是B海湾的均值和方差;
步骤S24和S35中所述水温预警等级准确率的计算公式为:
Figure FDA0003655313090000042
其中,水温等级的划分参照大黄鱼的适宜生长温度,共有7个等级;
以均方根误差RMSE为最重要的指标,对所有训练好的模型进行测试,选取在验证集和测试集中精度最高的模型为最佳的LSTM神经网络预测模型或迁移LSTM神经网络预测模型。
CN202210556998.8A 2022-05-20 2022-05-20 一种基于迁移学习的组合式海湾水温预测方法 Active CN114862035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210556998.8A CN114862035B (zh) 2022-05-20 2022-05-20 一种基于迁移学习的组合式海湾水温预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210556998.8A CN114862035B (zh) 2022-05-20 2022-05-20 一种基于迁移学习的组合式海湾水温预测方法

Publications (2)

Publication Number Publication Date
CN114862035A true CN114862035A (zh) 2022-08-05
CN114862035B CN114862035B (zh) 2024-05-03

Family

ID=82639481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210556998.8A Active CN114862035B (zh) 2022-05-20 2022-05-20 一种基于迁移学习的组合式海湾水温预测方法

Country Status (1)

Country Link
CN (1) CN114862035B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115757561A (zh) * 2022-12-09 2023-03-07 国网湖北省电力有限公司信息通信公司 一种数据中心设备运行数据时间序列组合预测方法
CN116128049A (zh) * 2023-04-04 2023-05-16 厦门大学 一种基于XGBoost模型的水质预测模型迁移条件选择方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190057013A (ko) * 2017-11-17 2019-05-27 한국외국어대학교 연구산학협력단 상세기상 예측정보 실시간 운영 시스템과 이를 이용하는 폭염 및 열대야 영향 예보 활용 방법
US20190385055A1 (en) * 2018-06-14 2019-12-19 Electronics And Telecommunications Research Institute Method and apparatus for artificial neural network learning for data prediction
KR20200017604A (ko) * 2018-08-02 2020-02-19 한국에너지기술연구원 최적 물리 학습모델과 기계학습을 이용한 에너지 운영관리 시스템
CN112116147A (zh) * 2020-09-16 2020-12-22 南京大学 一种基于lstm深度学习的河流水温预测方法
KR102220748B1 (ko) * 2019-12-17 2021-02-26 (주)지오시스템리서치 딥러닝을 이용한 수온시계열 예측자료의 미래시점 자료동화를 통한 해양예측 시스템
CN113033618A (zh) * 2021-03-03 2021-06-25 四川大学 基于支持向量回归的分层水库取水下泄水温预测模型及预测方法
CN114036838A (zh) * 2021-11-09 2022-02-11 云南大学 一种基于多层lstm神经网络的垂向水温模拟方法
CN114242156A (zh) * 2021-12-17 2022-03-25 厦门大学 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统
CN114372631A (zh) * 2022-01-11 2022-04-19 电子科技大学 一种基于小样本学习和lstm的缺资料地区径流预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190057013A (ko) * 2017-11-17 2019-05-27 한국외국어대학교 연구산학협력단 상세기상 예측정보 실시간 운영 시스템과 이를 이용하는 폭염 및 열대야 영향 예보 활용 방법
US20190385055A1 (en) * 2018-06-14 2019-12-19 Electronics And Telecommunications Research Institute Method and apparatus for artificial neural network learning for data prediction
KR20200017604A (ko) * 2018-08-02 2020-02-19 한국에너지기술연구원 최적 물리 학습모델과 기계학습을 이용한 에너지 운영관리 시스템
KR102220748B1 (ko) * 2019-12-17 2021-02-26 (주)지오시스템리서치 딥러닝을 이용한 수온시계열 예측자료의 미래시점 자료동화를 통한 해양예측 시스템
CN112116147A (zh) * 2020-09-16 2020-12-22 南京大学 一种基于lstm深度学习的河流水温预测方法
CN113033618A (zh) * 2021-03-03 2021-06-25 四川大学 基于支持向量回归的分层水库取水下泄水温预测模型及预测方法
CN114036838A (zh) * 2021-11-09 2022-02-11 云南大学 一种基于多层lstm神经网络的垂向水温模拟方法
CN114242156A (zh) * 2021-12-17 2022-03-25 厦门大学 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统
CN114372631A (zh) * 2022-01-11 2022-04-19 电子科技大学 一种基于小样本学习和lstm的缺资料地区径流预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115757561A (zh) * 2022-12-09 2023-03-07 国网湖北省电力有限公司信息通信公司 一种数据中心设备运行数据时间序列组合预测方法
CN116128049A (zh) * 2023-04-04 2023-05-16 厦门大学 一种基于XGBoost模型的水质预测模型迁移条件选择方法

Also Published As

Publication number Publication date
CN114862035B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
Liu et al. A flood forecasting model based on deep learning algorithm via integrating stacked autoencoders with BP neural network
CN105117602B (zh) 一种计量装置运行状态预警方法
CN112966891B (zh) 一种河流水环境质量预测方法
CN112508275A (zh) 一种基于聚类和趋势指标的配电网线路负荷预测方法和设备
CN111767517B (zh) 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质
CN109002888B (zh) 一种赤潮预警方法
CN113283588B (zh) 一种基于深度学习的近岸单点海浪浪高预报方法
CN114862035B (zh) 一种基于迁移学习的组合式海湾水温预测方法
CN111753893A (zh) 一种基于聚类和深度学习的风电机组功率集群预测方法
CN112926265A (zh) 基于遗传算法优化神经网络的大气多孔探针测量校准方法
CN103489039B (zh) 具有在线自整定优化能力的高速公路交通流量融合预测方法
CN109919356B (zh) 一种基于bp神经网络区间需水预测方法
CN114971005B (zh) 基于lstm与差分回归模型动态加权的海湾水温组合预测方法
CN112396152A (zh) 一种基于cs-lstm的洪水预报方法
CN108416460B (zh) 基于多因素时序—随机深度置信网络模型的蓝藻水华预测方法
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
CN115098999A (zh) 一种多模态融合的燃料电池系统性能衰减预测方法
CN112307410A (zh) 基于船载ctd测量数据的海水温盐信息时序预测方法
CN113537469B (zh) 一种基于LSTM网络和Attention机制的城市需水预测方法
CN116930609A (zh) 一种基于ResNet-LSTM模型的电能计量误差分析方法
CN114970815A (zh) 一种基于改进pso算法优化lstm的交通流预测方法及装置
CN116689503A (zh) 一种基于记忆性功能网络的带钢全长厚度预测方法
CN107729988A (zh) 基于动态深度置信网络的蓝藻水华预测方法
CN115471043A (zh) 一种基于集成sae-som的蜡模铸造热处理设备健康状态评估方法
CN114781606A (zh) 一种基于联邦学习的地区用电量中长期预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant