详情

卷积神经网络在CMA-GEPS的降水集合预报中的应用研究

申报人:王志国 申报日期:2024-03-25

基本情况

2024
卷积神经网络在CMA-GEPS的降水集合预报中的应用研究 盲选
创新训练项目
理学
大气科学类
B、学生来源于教师科研项目选题
创新类
2024-04
2025-04
降水与人类生产、生活和社会经济发展息息相关,尤其是极端降水事件往往会造成巨大的经济损失和人员伤亡,因此,降水尤其是极端降水的准确预报具有重大重要的理论意义和应用价值。传统的数值天气预报由于初值和模式的不确定性往往会产生预报误差,对极端降水的预报往往具有较大的误差,不能完全满足人们生产、生活和社会经济发展需要。 本项目拟将具有高度非线性构架的深度学习方法应用于降水预报当中,拟在数值天气预报的
负责人王志国同学曾经参与过重庆市气象局开展的西南雨季的监测项目,并且在本次项目中主要负责数据处理工作(K1,K2指数、雨季长度、单站雨强、区域预期强度,时间等),并且在智协飞教授的指导下对于深度学习(U-net)网络应用于气温概率统计后预报有了较为深刻的认知,基于此,本大创团队成员致力于将深度学习应用于偏态降水数据的统计后预报,力争能够对集合预报结果进行有效订正。

1、 智协飞,吕阳,季焱,朱寿鹏. 基于改进卷积神经网络的城市积水水位预测方法及系统,ZL202210815291.4 

2、 智协飞,吕阳,季焱,朱寿鹏. 一种基于人工智能的精细化城市积水水位拟合方法,ZL202210605679.1  

3、 Xiefei Zhi; Mengting Pan; Bin Song; Jingyu Wang ; Investigating air-sea interactions in the North Pacific on interannual timescales during boreal winter, Atmospheric Research, 2022, 269

4、 Ji, Luying; Zhi, Xiefei; Simmer, Clemens; Zhu, Shoupeng; Ji, Yan ; Multimodel Ensemble Forecasts of Precipitation Based on an Object-Based Diagnostic Evaluation, Monthly Weather Review, 2020, 148(6): 2591-2606

5、 Fu Dong; Xiefei Zhi; Shoupeng Zhu; Ling Zhang; Fei Ge; Yi Fan; Yang Lyu; Jingyu Wang; Klaus Fraedrich ; Principal Modes of Diurnal Cycle of Rainfall over South China during the Presummer Rainy Season, Journal of Climate, 2023, 149(10): 1-26

6 智协飞(1/6); 降水数值预报新技术及其在城市内涝预报预警中的应用, 中国发明协会, 发明创业奖创新奖一等奖, 2022 (科研奖励)

7 智协飞(1/7); 数值天气预报产品智能释用技术, 中国气象服务协会, 科学技术奖气象科技创新奖二等奖, 2022 (科研奖励)

8 智协飞(2/8); 基于WRF-ARW模式的吉林省短时强降水格点预报释用方法研究, 吉林省人民政府, 科技进步三等奖, 2022 (科研奖励)

 本项目针对降水集合预报过程中产生的无法避免的系统性误差,引进了具有非线性构架的深度学习方法对降水概率预报结果进行统计后订正,力求产出更高预报技巧的1-7天降水概率预报产品。选题合理,具有创新性,研究方案可行,可取得创新研究成果,特此推荐申报。

校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
王志国 大气科学学院 大气科学(气象学) 2021 人员分工、查找相关文献(CNN卷积网络在气温等其他气象要素上的应用)、编程以及分析结果图
王骢录 大气科学学院 大气科学(气象学) 2021 查找相关文献、分析结果图、制作汇报PPT
吉永士 大气物理学院 大气科学(大气物理) 2021 查找相关文献、分析结果图、CMA-GEPS数据预处理
袁仕搂 大气科学学院 大气科学(气象学) 2021 查找相关文献、查找CMA-GEPS数据和融合降水数据,并进行数据预处理
刘晔 计算机学院、网络空间安全学院(数字取证教育部工程研究中心、公共计算机教学部) 计算机科学与技术 2022 查找相关文献、查找CMA-GEPS数据和融合降水数据,辅助编程

指导教师

序号 教师姓名 教师账号 所属学院 是否企业导师 教师类型
智协飞 000337 期刊中心

立项依据

数值天气预报(NWP)由于受到大气混沌性质以及物理过程参数化方案的不完美的制约,导致NWP对降水尤其是极端降水的预测具有较大的偏差,因此本项目旨在在传统CSG EMOS方法基础上,利用深度学习方法对CAM-GEPS的降水集合预报进行统计后处理订正,力求得到更高预报技巧的1-7天降水概率产品,并且从传统逐点评估与空间诊断评估两个方面,深入分析主要预报误差的时空分布特征。
(1)首先建立CMA-GEPS低分辨率(0.5×0.5)集合预报与高分辨率(5km×5km)融合降水数据集。并对降水变量进行初步的预处理, 如缺失值处理、min-max归一化、对数化处理等,使其能有效地应用于后期的深度学习模型

(2)为了尽可能捕捉空间信息,我们选用CNN卷积神经网络作为本次项目的深度学习方法,利用python深度学习框(pytorch/tensorflow)搭建CNN框架,将CMA-GEPS集合预报结果划分成训练集、验证集、测试集,对CNN框架进行训练。

(3)本项目预期选择Brier score (BS)、CRPS、CRPSS、BSS、RMSE、MAE等评估指标作为深度学习方法的后验指标
在过去的几十年中,数值天气预报(Numerical Weather Prediction NWP)发展迅速,因此NWP也成为主流的降水预测方法,但是尽管NWP近些年取得了巨大的进展,由于大气本身的混沌性质以及物理过程的参数化方案的不完美,NWP在降水预报上的效果总是缺乏一定的准确性尤其是对于强降水的预报(Fritsch et al., 1998; Gourley and Vieux, 2005),因此,开发了集合预报系统(Ensemble prediction systems EPSs),EPSs通过向初始条件中添加一定的扰动,推动了从确定性预报到概率性预报的转变,从而产生了更多的可能降水的模拟,提高了预测能力(Majumdar and Torn, 2014; Scheuerer et al., 2017),然而,由于受到不完美的模型配置和大气混沌特性的制约,即使是最优的组合预测系统也会受到自身系统性偏差的影响,因此需要对预测结果进行适当的后处理步骤。

Bayesian model averaging (BMA)和ensemble model output statistics (EMOS)是两种常见的对集合预报结果进行后处理的方法(Gneiting et al., 2005; Peng et al., 2020),EMOS适用于PDF为高斯分布的变量进行预测,因此适用于偏态降水数据概率预测的方法CSG EMOS被应用作为传统的概率预报统计后处理方法。但这些传统的后处理方法基本上都是基于线性投影构建的,用于优化其参数的求解器在处理大量数据时效率有时过于低下(Hinton and Salakhutdinov, 2006),并且大气是高度非线性的系统,用线性方法处理大气必然会导致有用信息的损失。因此深度学习方法被引入(Deep Learning DL),DL方法通过建立高度非线性的框架,在大型数据集中展现了它们在表示学习方面的潜力。在此启发下,越来越多的研究正在应用先进的深度学习模型进行天气预测((Reichstein et al., 2019)和地球系统科学等领域的研究。针对深度学习如何应用于降水预报,大多都未展开深入的研究,仅借鉴前人的基础上进行分析。
偏态的降水数据对于传统的数值天气预报等方法很难预报准确,尤其是针对于强降水事件,本项目聚焦于在CMA-GEPS集合预报产品的基础上产生具有更高预报技巧的1-7天降水概率产品。此外,本项目引入深度学习方法处理大气高度非线性混沌系统,为人工智能领域在气象上的应用提供了重要的实践支撑。

技术路线:

(1)首先建立CMA-GEPS低分辨率(0.5×0.5)集合预报与高分辨率(5km×5km)融合降水数据集。并对降水变量进行初步的预处理,如缺失值处理、min-max归一化、对数化处理等,使其能有效地应用于后期的深度学习模型

(2)将处理好的数据,通过格点插值转化为适用于卷积神经网络的输入模式,通过对数据进行滚动1-7天训练,在训练过程中加入L2正则项加快模型的收敛速度,并且引入最大池化层(Maxing pooling)进行数据降维滤波,为了避免空间特征在池化后消失,我们预期在每次池化操作后将卷积核的数量翻倍,力求抓取更多信息。

(3)最后求取预测的降水概率密度曲线与真实降水数据的退化曲线的偏差,引入CRPS统计量作为损失函数进行反向梯度的求取。

预期成果:

(1)4-6月:完成基本的数据收集(CMA-GEPS数据和融合降水数据)和预处理,熟悉掌握基本的研究方法,完成基本的文献调研,撰写开题报告

(2)7-9月:至少完成CSG EMOS、NN等传统降水概率后预报产品的实现,为后续深度学习产品实现打下基础,撰写中期报告

(3)10-12月:掌握Python深度学习框架(Pytorch/Tensorflow),会实现CNN/U-net模型,将GMA-GEPS和融合降水数据处理为CNN可以训练的模式

(4)10月-4月:实现利用CNN,U-net深度学习框架对降水概率后预报,并对传统与深度学习方法进行比较和分析,撰写学术论文和结题报告
  (1)2024年4月-6月收集CMA-GEPS低分辨率数据与高分辨率融合降水数据,并对降水数据集进行整合和预处理,方便后续深度学习模型的应用

  (2)2024年7月-10月掌握pytorch深度学习框架,并且尝试传统方法CMOS、CSG CMOS 和浅层神经网络(NN)实现对CMA-GEPS集合预报数据进行订正,并比较差异。

  (3)2024年11月-2025年1月 利用CNN卷积神经网络和U-net网络对CMA-GEPS集合预报数据进行订正,并对传统方法和深度学习方法进行对比分析。

  (4)2025年2月-2025年4月 将得到的结果进行梳理、补充、撰写学术论文一篇。
[1] 在 朱延和.基于 U-net 神经网络的新疆地面气温和风的预报订正研究文献中 作者将U-net神经网络应用于地面气温和风的预报当中,将深度学习应用于气象研究之中。在文献中,主要是对气温和风进行确定型预报并非概率预报,且气温的PDF是正态分布数据,分布较为规律易于捕获特征。

[2] 在 Ji Y, Zhi X, Ji L, Zhang Y, Hao C and Peng T (2022), Deep-learning-based post-processing for probabilistic precipitation forecasting 文献中,作者认为降水的PDF主要形式为gamma分布并且将集合降水预报的五个扰动量作为CNN卷积神经网络的输入特征,将确定gamma分布的.三个参数当作预报量进行模型的训练,并且引入CRPS作为损失函数量化预测的降水PDF曲线和实际降水的退化曲线之间的差异,实现了对偏态降水的概率性预报而非确定型预报,具有更高的准确性。

[3] 在 Cui B, Toth Z, Zhu Y, et al. 2012. Bias correction for global ensemble forecast. Weather and Forecasting 27: 396-410.文献中,作者使用了传统的CSG EMOS方法对集合预报进行了统计后订正

[4]  Bauer P, Thorpe A, Brunet G. 2015. The quiet revolution of numerical weather prediction. Nature 525: 47-55.

[5] Agarap, A F. (2018). Deep learning using rectified linear units (relu). arXiv preprint arXiv:1803.08375.

[6] Abadi, M., Agarwal, A., Barham, P., Brevdo, E., Chen, Z., Citro, C., et al. (2015). TensorFlow: Large-scale machine learning on heterogeneous systems. Software available from tensorflow.org

[7] Geman S, Bienenstock E, Doursat R. 1992. Neural networks and the bias/variance dilemma. Neural Computation 4:1-58.

[8] Jordan, A., Krüger, F., and Lerch, S. (2017). Evaluating probabilistic forecasts with scoring rules. arXiv preprint arXiv:1709.04743.

已具备的条件:

       1、本项目的科研经费

       2、硬件条件(高性能计算平台)、软件支撑以及理论和技术支持

       3、知网和Science网站免费下载学术论文的平台

       4、MATLAB、office等相关绘图软件的免费资源

       5、传统CSG-EMOS方法实现统计后订正的原理和应用实例
 
       6、利用pytorch深度学习框架实现CNN卷积神经网络的经验

缺少的条件:

       缺少对CMA-GEPS低分辨率(0.5×0.5)集合预报与高分辨率(5km×5km)融合降水数据集的预处理方法,即将高分辨率和低分辨率的数据处理为CNN卷积神经网络模型可以处理的图像类输入模式







经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 18000.00 1、调研、差旅费 2、资料购置、打印、复印等费用 3、学生撰写与项目有关论文版面费、申请专利费 5000.00 13000.00
1. 业务费 16000.00 4000.00 12000.00
(1)计算、分析、测试费 2000.00 高速训练深度学习模型所需费用 1000.00 1000.00
(2)会议、差旅费 4000.00 进行调研、差旅费 3000.00 1000.00
(3)文献检索费 0.00 0.00 0.00
(4)论文出版费 10000.00 学生撰写与项目有关的论文版面费、申请专利费等等 0.00 10000.00
2. 实验装置试制费 0.00 0.00 0.00
3. 材料费 2000.00 资料购置、打印、复印、印刷等费用 1000.00 1000.00

项目附件

  • 大气科学学院 卷积神经网络在CMA-GEPS的降水集合预报中的应用研究 王志国.doc
    下载
结束