全球 气候变化已成为21世纪最严峻的环境挑战,其复杂的驱动因素如温室气体排放、气溶胶浓度、野火、海冰融化以及农业和生态系统变化等,交织影响着全球的气候格局。本内容旨在利用前沿的AI Agent技术和Python编程,系统讲解如何通过机器学习(如K-means、SVM、决策树)与深度学习(如CNN、LSTM)模型,进行全球气候变化驱动因素的数据分析与趋势预测。
内容涵盖数据获取、预处理、建模、训练优化到结果解释的全流程,重点为:如何下载和处理NASA卫星数据、CMIP6气候数据等多源数据。同时,将介绍如何借助大语言模型(如ChatGPT、Deepseek)辅助Python编程,实现智能化数据处理,并教授如何构建本地专属AI Agent,以支持科研数据分析和政策决策。
有丰富的编程实例和真实案例(包括野火探测、农作物影响评估、生态环境监测等)
**前沿技术融合:**融合AI Agent技术与Python编程,利用大语言模型(如ChatGPT、Deepseek)辅助数据处理与分析。
**多模型集成:**结合机器学习(K-means、SVM、决策树)与深度学习(CNN、LSTM)方法,对气候驱动因素进行全面预测。
**多源数据应用:**NASA卫星数据、CMIP6气候数据等多种数据源的下载、预处理与分析。
**实战案例丰富:**通过野火探测、农作物影响评估、生态环境监测等实际项目,帮助大家掌握理论与实践技能。
**数据科学全流程:**指导从数据获取、清洗、建模、训练优化到结果解释的完整数据科学流程。
第一部分:气候变化驱动因素与数据科学基础
1.1 气候变化
全球气候变化
中国碳中和计划
CMIP6气候数据简介
1.2 相关驱动因素导致全球全球气候变化
温室气体排放
云和气溶胶
火灾
生态环境
农业生产

1.3 ChatGPT、Deepseek的简介和应用
·ChatGPT、Deepseek的简介
·ChatGPT、Deepseek的使用
·ChatGPT的Prompt的模板(Elavis Saravia框架和CRISPE框架)

1.4不同大模型对比
·ChatGPT、Gemini、Deepseek、Claude、Grok等介绍并对比(什么事TOKENS、WindowContext、API调用费用)

1.5 气候数据科学的应用
·数据科学在气候变化研究中的作用
·机器学习和深度学习分析气候数据,预测气候变化趋势
·数据科学流程,包括数据获取、清洗、建模和结果解释
第二部分:Python数据处理和可视化
2.1 Python环境的安装(Anaconda环境安装,虚拟环境的配置,Jupyter Notebook安装)
2.2 Python相关库原理介绍(Numpy,Pandas,Matplotlib,Cartopy,Pyhdf)
2.3 Jupyter Notebook实操:
·Numpy库(最小值,最大值,平均值,标准差,NaN数据)
·Matplotlib库(折线图,散点图,饼状图,热力图)
·Pandas库(数据读取)
·Cartopy库(投影方式;分辨率,海岸线,河流,国界线;轨迹线;截取区域)
·Pyhdf库(读取卫星数据)

第三部分:机器学习模型
3.1机器学习的分类
监督学习(Supervised Learning)

非监督学习(Unsupervised Learning)

3.2监督学习
监督回归算法(Regression Algorithms)
线性回归(Linear Regression)
多项式回归(Polynomial Regression)
监督分类算法(Classification Algorithms)
逻辑回归(Logistic Regression)
K最近邻(K-Nearest Neighbors, KNN)
支持向量机(Support Vector Machines, SVM)

决策树(Decision Trees)

随机森林(Random Forests)

梯度提升机(Gradient Boosting Machines, GBM)

3.3 非监督学习
聚类算法(Clustering Algorithms)
K-means聚类

层次聚类(Hierarchical Clustering)

降维技术(Dimensionality Reduction)
主成分分析(Principal Component Analysis, PCA)

案例:不同汽车类型对气温的影响(甲烷、二氧化碳、水气)

3.4模型评估指标:
回归指标(MSE、RMSE、MAE、R²)
分类指标(Accuracy、Precision、Recall、F1-Score)
3.5 ARIMA(自回归差分移动平均):
ARIMA是时间序列分析与预测的统计模型。它可以用于处理平稳时间序列和非平稳时间序列,通过捕捉时间序列中的自相关和趋势信息来进行预测 。
案例:温室气体浓度的时序分析与预测(甲烷、二氧化碳、水气)

第四部分:深度学习模型
4.1 神经网络基础(Artificial Neural Networks, ANN)
4.2深度学习框架:TensorFlow和PyTorch
4.3卷积神经网络(Convolutional Neural Networks, CNN)

4.4 循环神经网络(Recurrent Neural Networks, RNN)

4.5 长短期记忆网络(Long Short-Term Memory, LSTM)


4.6 使用NN-SVG、torchviz、ChatGPT画神经网络图图,辅助科研论文撰写。


第五部分:实战
5.1 全球气候变化相关数据集下载与处理(MERRA2气溶胶、MODIS气溶胶、MODIS海冰、MODIS叶绿素、CALIPSO气溶胶、AERONET气溶胶)

5.2 CMIP6数据集下载和处理案例

5.3 野火气溶胶探测识别(R-CNN)