CN114880958A

CN114880958A - 一种基于多气象因子智能深度学习的能见度预报模型

Info

Publication number: CN114880958A
Application number: CN202210812014.8A
Authority: CN
Inventors: 慕熙昱; 张强; 陈志豪; 刘端阳; 成孝刚; 徐琪; 胡斐; 王宏斌; 严殊祺; 朱寿鹏
Original assignee: Nanjing Institute Of Meteorological Science And Technology Innovation
Current assignee: Nanjing Institute Of Meteorological Science And Technology Innovation
Priority date: 2022-07-12
Filing date: 2022-07-12
Publication date: 2022-08-09
Anticipated expiration: 2042-07-12
Also published as: CN114880958B

Abstract

本发明公开了一种基于多气象因子智能深度学习的能见度预报模型，主要包括数值预报模式选取、空间网格点多气象因子建模、特征提取与能见度映射、神经网络模型训练和能见度预报与模型参数更新等步骤，本发明利用深度学习技术结合数值预报及多气象因子建模，能实现对关键地区的精细化能见度预报。

Description

一种基于多气象因子智能深度学习的能见度预报模型

技术领域

本发明属于人工智能与气象预报技术领域，特别涉及气象因子的预测、气象因子特征的提取、气象因子与能见度的检测、精细化能见度的预报等技术，具体是一种将深度学习方法与物理要素结合的精细化能见度预报方法。

背景技术

目前的能见度预报方法主要有基于数值模式的能见度预报方法、基于统计的能见度预报方法以及基于机器学习的能见度预报方法。数值模式预报方法是根据当前的大气状态以及数学和物理原理，构建气象数值模式系统，从而对各种气象要素进行模拟、预报。近年来，随着观测技术以及计算机技术的发展，数值模式预报的准确率越来越高，发挥的作用也越来越重要。然而，基于数值模式的预报数据是格点数据，由于大气演变过程的复杂性以及能见度对地表风、低空稳定性和露点等要素的微小差异具有高度敏感性，格点型的预报数据无法预报处于非格点的关键地区的能见度，例如机场、码头等对能见度数据要求准确的地点。另外，数值模式的预报方法也存在着一些无法避免的误差，对于某些关键地区，这些误差可能造成极其严重的影响。

基于统计的预报方法属于传统的预报方法，即通过构建关键气象因子与能见度之间的固定映射关系来对能见度进行预报。由于大气运动具有极强的非线性关系，固定模式的映射关系难以描述复杂的大气运动，因此此类方法只能针对特定的情况进行能见度的预报，具有很强的局限性。近年来，机器学习技术迅猛发展，其开始应用于各行各业，气象领域也有了许多相关的应用。例如综合多元线性回归、随机森林、支持向量机、极端梯度提升等机器学习方法，其都证明了机器学习算法在气象预报方面的优越性。

随着近年来深度学习技术的发展以及相关气象数据的剧增，深度学习也被用于气象领域进行相关的气象预报。深度学习是机器学习的一个重要分支，相较于机器学习，深度学习需要更多的数据作为支撑以对更高维度的数据构建非线性映射关系。

在基于深度学习的能见度预报方面，BP神经网络、循环神经网络、遗传神经网络等深度学习算法已经被广泛使用。尽管已有大量的方法进行能见度的预报，但利用深度学习技术，针对关键地区的精细化能见度预报方法还较少。目前的基于深度学习的能见度预报方法大多为大尺度的同时预测，即根据网格型的气象因子得到网格型的大尺度能见度预报值。基于大量气象数据的支撑以及更加复杂的神经网络结构，深度学习算法具有更强的非线性拟合能力，因此基于深度学习的能见度预报方法相较于其它预报方法有了一定的提高。

发明内容

发明目的：针对上述现有存在的问题和不足，本发明的目的是提供了一种基于多气象因子智能深度学习的能见度预报模型。

技术方案：为实现上述发明目的，本发明采用以下技术方案：一种基于多气象因子智能深度学习的能见度预报模型，包括以下步骤：

步骤S1，数值预报模式选取：根据地区气象和地理条件选择数值预报模式；

步骤S2，气象因子建模：以空间同一网格点上的多个气象因子作为一个通道项，将空间多个网格点的特征作为多通道项进行补充，建立能见度预报的神经网络模型；所述多个气象因子包括温度、风速、湿度、大气层结；

步骤S3，特征提取与能见度映射：对数值预报模式输出的气象因子预报值进行提高分辨率的降尺度操作，从而得到关键地区的高分辨率气象因子数值，进而得到高分辨率气象因子的深层特征；

步骤S4，神经网络模型训练：获取历史数据并通过步骤S1所述数值预报模式处理得到预报值数据，并与气象观测站的能见度观测值对应后，对神经网络模型进行训练，得到收敛后的神经网络模型；

步骤S5，能见度预报与模型参数更新：通过步骤S4得到收敛后神经网络模型对步骤S1所述数值预报模式的实时输出数据进行处理得到能见度预报，同时对神经网络模型的参数进行更新。

进一步，步骤S1所述数值预报模式采用中尺度天气预报模式WRF。

进一步，步骤S3采用D2 Block结构进行特征提取，D2 Block结构的第i层输出结果通过式（1）和（2）得到

，

（1）

（2）

式中，

代表膨胀因子为

的空洞卷积运算，

为神经网络第i层输出结果对于神经网络第

层输出结果的贡献的参数，

表示神经网络总层数。

进一步，步骤S4中利用历史数据对神经网络模型训练的具体步骤如下：

首先，本发明神经网络模型采用式3所示损失函数Loss对参数进行约束以防止出现过拟，

(3)

式中，Loss为损失函数的值，V为神经网络输出的能见度预报值，

为气象观测站观测的能见度值，

为神经网络参数的L2范数，

为正则化调节系数，且

；

接着，利用反向传播算法与梯度下降算法对模型进行训练，反向传播的过程如下：

（1）通过式（4）的前向运算得到神经网络第N层的输出结果

，

(4)

式中，

为神经网络第N层的输出结果，

为神经网络第N层的参数，tanh为神经网络的激活函数，

为神经网络第N层的偏置项参数；

（2）继续通过神经网络第N层梯度信息的计算式（5），得到神经网络第N层的梯度值

，

(5)

式中，

为神经网络第N层的梯度值，

为神经网络中损失函数对激活函数的梯度项，e为矩阵的点乘运算，

为神经网络中激活函数对于输出值的梯度项；

（3）进而利用反向传播计算神经网络浅层项梯度的式（6）得到神经网络第N-1层的梯度值

，

(6)

式中，

为神经网络第N-1层的梯度值，

为神经网络第N层参数的转置表示；

（4）通过反向传播算法得到模型的梯度值后，使用梯度下降法进行迭代训练，得到由第i次到第i+1次迭代时产生的参数，如式（7）所示，

(7)

式中，

为神经网络第N层、第i+1次迭代时产生的参数，

为第i+1次迭代时的学习率，通过梯度下降算法可以不断对模型进行训练，直至模型收敛；

（5）最后，通过收敛的模型对实时气象因子预报值进行预处理后，利用完整的神经网络模型对预处理后的气象因子进行运算，如式（8）所示，得到未来时刻关键地区的能见度预报值

，

(8)

式中，

为t时刻能见度的预报值，F为完整的神经网络模型，P为气象因子的预处理操作，

为WRF模型输出的t时刻气象因子的预报值集合。

进一步，步骤S5中神经网络模型的参数进行更新的过程如下：

首先，将神经网络模型输出的能见度预报值进行缓存；

然后，当达到下次预报时刻时，通过气象观测站的观测值与缓存值进行损失计算，利用方向传播与梯度下降对神经网络模型中的全连接层参数进行更新。

有益效果：与现有技术相比，本发明具有以下优点：

（1）本发明将同一网格点不同高度层上的多个气象因子预报值置于同一通道，将空间其它位置的网格点数据置于不同通道，本阀门考虑了多个高度层、多个气象要素对能见度的综合影响，更符合影响能见度的物理机制，从而增强对气象因子的建模能力。

（2）本发明考虑了数值预报产品网格点与实际需要预报点之间存在的空间差异，采用D2 Block网络结构进行数值模式结果的特征提取，从而能充分空洞卷积与密集连接的优点，充分考虑气象因子之间的关联性，同时也可以综合各通道的空间信息，完成预报产品的降尺度及特征提取。

附图说明

图1为本发明所述基于多气象因子智能深度学习的能见度预报模型的流程示意图；

图2为现有技术中气象因子数据建模方式示意图；

图3为本发明具体实施方式中气象因子数据建模方式示意图；

图4为本发明具体实施方式中特征提取示意图；

图5为本发明具体实施方式中采用的D2 Block结构示意图

图6为本发明具体实施方式中所述神经网络模型的参数更新流程示意图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如图1所示，为本发明基于深度学习技术的精细化能见度预报方法示意图。本发明基于多气象因子智能深度学习的能见度预报模型的流程方法，主要包括：数值预报模式选择、数据建模、特征提取、能见度映射与神经网络训练、能见度预报与实时更新等步骤。本实施案例以南京市禄口机场能见度的预报为例，详细介绍本发明方法的技术思路及流程：

步骤S1:数值预报模式选择

依据本案例针对地区的天气气候特征、地理特征、时空分辨率及针对低能见度的物理特征，本发明选取使用区域数值预报模式WRF进行网格型的气象因子预报。WRF是一种中尺度天气预报模式，该模式输出的网格型气象因子预报值有利于数据的建模以及针对具体地区的精细化能见度预报。

步骤S2:数据预处理

图2为现有技术中心常见的气象因子数据建模方式。使用此种方式对数据进行建模，则卷积操作提取的特征主要为不同网格点单一气象因子的空间相关性，位于同一网格点不同气象因子之间的关系则难以进行提取。

图3为本实施案例使用的数据建模方式。该建模方式创新的将同一网格点的多个气象因子置于同一通道，将其它位置的网格点数据置于不同通道，以建立神经网络模型。除此之外，本建模方式还使用不同高度的数据对平面数据进行扩充（即采用的是空间网格点对应多个气象因子，相对于常规技术采用的是地表气象因子）。与以往常用的建模方式相比，本案例中采用的建模方式更加关注于气象因子之间的关系以及能见度与气象因子之间的关系，空间信息则作为补充数据。此建模方式更加适用于输出单通道的针对目标点的精细化能见度预报。建模之后，原本是分散的、无规律的、不符合深度学习输入格式的气象数据，变成了深度学习网络可识别的、类图像数据。

步骤S3:特征提取与能见度映射

对WRF产品输出的气象因子预报值进行数据预处理后，便可利用深度学习方法提取气象因子的深层特征。由于中尺度数值预报模式的水平分辨率并不能满足能见度预报的精细化要求，因此在特征提取的过程中，需要进行提高分辨率的降尺度操作，得到关键地区的高分辨率气象因子深层特征。已有的特征降尺度操作大多只考虑单个气象因子的空间性，即根据空间插值或统计方法进行降尺度。然而数值预报产品具有一定的误差且不同的气象因子之间可能会相互影响，因此在特征提取的过程中，需要综合考虑气象因子的空间分布及不同气象因子之间的关联性。另外，影响低能见度的天气主要是边界层过程，具有明显的三维结构特征，以往的工作中大多只考虑近地面层的气象因子，这种做法忽略了大气的层结特征，是不全面的。本案例特征提取的示意图如图4所示，其综合考虑了气象因子的三维空间特征以及不同气象因子之间的相互关系。

本实施案例采用D2 Block结构进行气象因子的深层特征提取，D2 Block是2021年Naoya Takahashi与Yuki Mitsufuji提出的一种神经网络结构（Takahashi N, MitsufujiY. Densely connected multi-dilated convolutional networks for denseprediction tasks[C]//Proceedings of the IEEE/CVF Conference on ComputerVision and Pattern Recognition. 2021: 993-1002.），图5为D2 Block结构的示意图。使用普通卷积操作对同一通道的不同气象因子进行特征提取，仅能提取部分气象因子之间的关系，剩余气象因子之间的关系则需要不断的进行卷积，直到神经网络的层数足够多才可以提取到；使用全连接操作可以同时对所有的气象因子进行特征提取，但此操作会导致参数过多，难以训练，并且神经网络极易受到干扰气象因子的影响。通常，空洞卷积可以扩大卷积的感受野，密集连接可以加强层级之间的特征融合能力，但直接对两种操作进行融合则会造成严重的混叠误差。本发明选用D2 Block通过在神经网络的不同位置设置不同的膨胀率将两项操作进行了融合，即使用密集连接的多空洞卷积进行气象因子的特征提取。密集连接的多空洞卷积将神经网络不同深度的特征使用不同膨胀率的空洞卷积进行融合以得到新的特征，该操作既可以充分利用密集连接与空洞卷积的优点，又可以避免直接使用空洞卷积与密集连接所造成的混叠误差。

D2 Block的计算方法如公式（1）和（2）所示，其中代表D2 Block第层的输出结果，此时的输出结果为气象因子的中间特征，

(1)

(2)

式中，

代表D2 Block第i层的输出结果，

代表膨胀因子为

的空洞卷积运算，

为神经网络第i层输出结果对于神经网络第

层输出结果的贡献的参数。膨胀率

的计算方法如公式2所示，其中i代表神经网络中对于第

层输出结果有贡献的中间层。

通过重复D2 Block结构的运算即得到气象因子的深层特征。将此深层特征作为输入，进行全连接结构的映射后便可以得到关键地区的能见度预报值。

本步骤确定了神经网络的具体结构，利用此结构可以对预处理后的气象因子进行计算，得到能见度预报值。但此时神经网络结构中的参数还未确定，完整的神经网络模型还需要利用历史数据对神经网络进行训练，详见下述步骤。

步骤S4:神经网络训练

确定了神经网络的结构后，便可利用历史数据对神经网络进行训练，得到神经网络各部分的参数值。将历史数据中的WRF输出值与气象观测站的能见度观测值在时间上进行对应后即可对神经网络进行训练。

首先，由于气象数据具有很强的时间、空间连续性，同一段时间内的气象数据可能具有极大的相似性，本发明神经网络模型的损失函数在均方误差的基础上使用L2正则化对参数进行约束以防止出现过拟合。如式3所示，本发明采用均方误差函数的形式损失函数Loss，

(3)

为气象观测站观测的能见度值，

为神经网络参数的L2范数，

为0至1之间的正则化调节系数。

接着，利用反向传播算法与梯度下降算法对模型进行训练，反向传播的过程如公式4-6所示，

（1）通过下式（4）的前向运算得到神经网络第N层的输出结果

，

(4)

式中，

为神经网络第N层的输出结果，

为神经网络第N层的参数，tanh为神经网络的激活函数，

为神经网络第N层的偏置项参数。

，

(5)

式中，

为神经网络第N层的梯度值，

为神经网络中激活函数对于输出值的梯度项。

，

(6)

式中，

为神经网络第N-1层的梯度值，

为神经网络第N层参数的转置表示。

(7)

式中，

为神经网络第N层、第i+1次迭代时产生的参数，

为第i+1次迭代时的学习率。通过梯度下降算法可以不断对模型进行训练，直至模型收敛。

，

(8)

式中，

为WRF模型输出的t时刻气象因子的预报值集合。

步骤S5: 能见度预报与模型参数更新

将神经网络训练至收敛后，便可以利用神经网络与实时输出的WRF数据进行能见度的预报。此时的神经网络是利用历史数据得到的，因此其泛化性可能较差，对于与历史数据偏差较大的情况可能无法进行准确的能见度预报，因此本案例使用Finetune的策略对神经网络的参数进行实时更新。具体做法为神经网络输出预报值时，可以对预报值进行缓存，当时间点到达预报的时刻时，可以通过气象观测站的观测值与缓存值进行损失计算，利用反向传播与梯度下降对神经网络中的全连接层的参数进行更新。更新的流程图如图6所示，首先对模型特征提取部分的参数进行冻结，其次利用损失函数计算出预报值与观测值之间的损失值，最后利用反向传播与梯度下降算法对模型的全连接层进行参数更新。不断产生的气象数据会逐步优化神经网络全连接模块的参数，使其适用于更多的天气情况。

本实施案例完整的模型运算流程如公式9所示，

（9）

其中

为c时刻的能见度预报模型，P为气象因子的预处理操作，

为WRF模型输出的t+c时刻气象因子的预报值集合，

为c时刻模型输出的t+c时刻的能见度预报值。用来训练的数据拥有很强的局限性，为了让模型适用于更多的情况，需要尽可能地使用更多的数据。因此在模型的实际使用中需要基于Finetune微调策略，不断利用新产生的数据以及过去的预报值对模型的全连接层参数进行更新，增强模型的能见度预报能力。