随着人工智能技术的飞速发展,大气科学研究正迎来一场深刻的范式变革。传统的气候数据分析方法逐渐与AI模型、Python高性能计算深度融合,为处理海量气象数据、挖掘复杂气候规律提供了前所未有的可能。本专题旨在系统探讨如何将最新AI工具(如GPT系列模型)与Python技术有机结合,应用于大气科学的核心场景------从基础数据预处理到高级模式评估,从历史气候分析到未来趋势预测。
内容覆盖GPT在科研中的多功能角色(如文献润色、数据提取)、Python在气象数据可视化与统计分析中的实战技巧,并深入遥感降水、ERA5再分析、WRF模式后处理、CMIP6未来气候预测及机器学习天气分类等关键领域。通过学习,学者不仅能掌握AI辅助科研的全流程工具,还能提升在气候监测、能源评估、极端事件分析等实际应用中的研究效率与深度。
专题一 预备知识
1.AI领域常见工具模型
2.POE平台及ChatGPT使用方法
3.提示词工程介绍、提示词常见模板
4.Python基本语法 Numpy使用、Pandas使用、Xarray使用、Matplotlib使用
专题二 科研辅助专题
1.GPT作为科研工具:搜索引擎、翻译软件、润色工具、提取整理文章数据、数据处理
2.作为科研助手生成
3.作为辅助工具下载数据:PERSIANN /GSMaP数据;GSOD数据;NCEP/NCAR再分析数据;GFS预报数据
专题三 可视化专题
1.绘制常见统计图
2.绘制风场图、风羽图、风矢图、流线图、双Y轴、风玫瑰图、填充图、添加子图、期刊常见图
专题四 站点数据处理
1.读取多种来源原始数据(ISD、GSDO)
2.缺失值处理
3.数据质量控制:基于统计阈值的异常检测:基于机器学习的异常检测(Isolation Forest等方法);多变量数据的异常检测(服务于自动气象站数据);基于时间序列方法均一化检验(服务于长时间气候变化评估)
4.时间序列的趋势:移动平均法、分解法(STL, Seasonal and Trend decomposition using loess)、Sen's斜率
5.时间序列的突变检验:MK (Mann-Kendall): Mann-Kendall趋势检验(用于分析数据集中的趋势变化);Pettitt检验(非参数检验方法,用于检测时间序列中的单一变化点);BUT (Buishand U Test)统计检验;SNHT (Standard Normal Homogeneity Test) 标准正态同质性检验(常用于气候数据的同质性检测);BG (Buishand Range Test) Buishand范围检验
6.时间序列周期分析:功率谱方法提取周期(提取气温、降水等周期);小波分析方法提取周期;EMD经验模态分解;EEMD集成经验模态分解
7.不同时间尺度上的统计
8.回归分析:线性回归(Linear Regression)简单线性回归、多元线性回归等;多项式回归(Polynomial Regression);非参数回归(Non-parametric Regression)
9.相关分析:常见的相关系数(Pearson Correlation Coefficient、Spearman's Rank Correlation Coefficient);偏相关分析(Partial Correlation);典型相关分析(Canonical Correlation Analysis, CCA)
10.站点数据的空间化:克里格插值、临近点插值、反距插值、基于高程模型的外推
专题五 WRF专题
1.使用Python生成WPS的静态数据
2.生成WRF配置文件
3.WRF的后处理:站点插值、能见度计算、垂直高度变量插值、降水相态辨识、水汽通量
4.WRF的评估:格点尺度评估、点尺度评估、模态评估
专题六 遥感降水
1.将PERSSIAN/GSMaP数据转化为netCDF格式
2.合并数据
3.时间域统计并可视化
4.空间域统计并可视化
5.常见统计评估指标:生成统计指标空间图、泰勒图、卫星降雨散点密度图
专题七 再分析数据
1.ERA5再分析数据下载、预处理、多时间尺度统计、干旱监测、极端指数计算、趋势分析
2.多套再分析数据的气候趋势分析:对比NCEP/NCAR、ERA5、CRU等均值
3.风能资源评估
4.太阳能资源评估
专题八 CMIP6未来气候
1.数据预处理:使用NetCDF工具(xarray)读取数据;裁剪时间范围和空间范围
2.计算区域平均温度:对于全球平均温度加权平均;对于特定区域,直接计算平均值
3.趋势分析:使用统计方法(如线性回归)分析温度随时间的变化趋势
4.可视化:绘制时间序列图显示温度趋势;使用地图可视化工具(basemap)展示空间分布的变化
专题九 基于机器学习方法判断天气晴雨
1.预处理:缺失值处理;数据探索;数据标准化/归一化;数据类型转换
2.数据采样:均衡采样;分层抽样;交叉验证分割;时间序列分割
3.特征工程:特征选择;降维;多项式特征
4.模型建模与堆叠:单模型训练如决策树、SVM、随机森林;模型堆叠;调参;集成学习
5.模型评估:性能指标根据问题类型(分类或回归)选择合适的评估指标,如准确度、召回率、F1分数、AUC值、均方误差;模型解释性:使用SHAP对模型的预测进行解释,提高模型的可解释性
★ 点 击 下 方 关 注,获取海量教程和资源!
↓↓↓