专题一预备知识1.大语言模型在大气科学中的常见应用场景ChatGPT是一种基于自然语言处理的技术因此在大气科学领域应用主要集中在文本处理和语言生成方面。例如1.1 辅助数据分析ChatGPT 可以帮助理解和解释大量的气象数据内在信息。1.2自然语言处理用于分析和解释历史气象记录、研究论文或报告提取关键信息和趋势1.3 文献搜索和综述ChatGPT 可以撰写文献综述同时快速查找和总结相关研究及论文1.4 论文撰写辅助辅助撰写科研论文提供文本编辑和改进建议1.5 专业咨询ChatGPT提供有关特定研究技术方法的专业建议。1.6 教学工具ChatGPT 可以帮助学生理解复杂的大气概念和编程相关问题2.大语言模型常见平台使用方法2.1 POE使用方法2.2 ChatGPT使用方法3.提示词工程3.1 提示词工程介绍3.2 提示词工程讲解3.3 提示词常见模板4.Python简明教程4.1 Python基本语法4.2 Numpy使用4.3 Pandas使用4.4 Xarray使用4.5 Matplotlib使用专题二科研辅助专题1.GPT作为科研工具1.1把GPT当作搜索引擎1.2把GPT当作翻译软件1.3把GPT当作润色工具1.4用GPT提取整理文章数据1.5用GPT数据处理2.GPT作为科研助手生成2.1用GPT分析结果2.2用GPT总结生成论文摘要2.3用GPT总结生成文献综述2.4用GPT分析论文技术方法2.5用GPT分析代码2.6用GPT分析论文公式2.7用GPT识别图片并分析2.8 DIY上传本地PDF资料用GPT分析相关资料中提出问题。用GPT总结评价评阅、审稿意见3.GPT作为辅助工具下载数据3.1使用GPT生成PERSIANN /GSMaP数据的下载代码3.2使用GPT生成代码下载GSOD数据3.3使用GPT生成代码下载NCEP/NCAR再分析数据3.4使用GPT生成代码下载GFS预报数据专题三可视化专题——基于GPT实现1.绘制常见统计图2.绘制风场图、风羽图、风矢图、流线图3.通过GPT绘制双Y轴4.风玫瑰图5.填充图6.绘制添加子图7.绘制期刊常见图专题四站点数据处理使用GPT处理/生成相应代码实现下列目标1.读取数据1.1读取多种来源原始数据ISD、GSDO2.缺失值处理2.1缺失值统计2.2常见统计方法缺失值填补2.3机器学习方法填补数据3.数据质量控制3.1基于统计阈值的异常检测3.2基于机器学习的异常检测Isolation Forest等方法3.3多变量数据的异常检测服务于自动气象站数据3.4基于时间序列方法均一化检验服务于长时间气候变化评估4.时间序列的趋势4.1移动平均法4.2分解法STL, Seasonal and Trend decomposition using loess4.3 Sen’s斜率5.时间序列的突变检验5.1 MK (Mann-Kendall): Mann-Kendall趋势检验用于分析数据集中的趋势变化5.2 Pettitt: Pettitt检验非参数检验方法用于检测时间序列中的单一变化点5.3 BUT (Buishand U Test): Buishand U型统计检验5.4 SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验常用于气候数据的同质性检测5.5 BG (Buishand Range Test): Buishand范围检验6.时间序列周期分析6.1功率谱方法提取周期提取气温、降水等周期6.2小波分析方法提取周期6.3 EMD经验模态分解6.4 EEMD集成经验模态分解7.时间尺度上的统计7.1不同时间尺度上的统计8.回归分析8.1线性回归Linear Regression:简单线性回归、多元线性回归等8.2多项式回归Polynomial Regression:8.3非参数回归Non-parametric Regression:9.相关分析9.1常见的相关系数Pearson Correlation Coefficient、Spearmans Rank Correlation Coefficient9.2偏相关分析Partial Correlation9.3典型相关分析Canonical Correlation Analysis, CCA10.站点数据的空间化10.1克里格插值10.2临近点插值10.3反距插值10.4 基于高程模型的外推专题五WRF专题——基于GPT和Python实现1.静态数据的替换1.1使用Python生成WPS的静态数据A替换反照率和LAI数据GPT生成转化GLASSThe Global Land Surface Satellite (GLASS) Product suite替换默认粗分辨率数据。B替换土地利用GPT将多分类的ECI CCI土地利用数据分类进行整合使之能够用于WPS系统GPT生成转化代码将数据转化为WPS可读取的二进制格式。使用Python更改WRF初始场GPT生成代码修改WRF初始场文件并替换土地利用、地表反照率等静态数据。2.生成WRF配置文件2.1在指定的地区推荐WRF namelist.input文件相关参数2.2补全相关参数信息3.WRF的后处理3.1站点插值3.2能见度计算3.3垂直高度变量插值3.4降水相态辨识3.5水汽通量4.WRF的评估4.1格点尺度评估4.2点尺度评估4.3模态评估专题六遥感降水专题——基于GPT和Python实现1.将PERSSIAN/GSMaP数据转化为netCDF格式2.合并数据3.时间域统计并可视化4.空间域统计并可视化5.常见统计评估指标生成统计指标空间图生成泰勒图生成卫星降雨散点密度图专题七再分析数据专题——基于GPT和Python实现1.ERA5再分析数据1.1 ERA5数据的下载1.2 ERA5数据预处理1.3多时间尺度统计1.4干旱监测计算标准化降水蒸散指数SPEI或标准化降水指数SPI作为干旱监测的指标。根据土壤湿度和降水量数据使用时间序列分析和阈值判断来评估干旱风险等级。1.5极端指数计算连续干旱天数夏日指数R99极端降水指数等1.6趋势分析滑动平均累积距平趋势分析代码时间序列分析2.多套再分析数据的气候趋势分析2.1对比NCEP/NCAR、ERA5、CRU等均值2.2趋势分析3.风能资源评估3.1计算研究区域内多年的平均风速3.2计算风速的季节性变化和年际变异性3.3计算空气密度3.4计算盛行风3.5计算风功率3.6计算weibull分布3.7基于站点和WRF模式的分析3.8基于ERA5计算风功率.太阳能资源评估4.1计算每天的平均太阳辐射量4.2分析日、月和季节性气候态时空格局4.3计算趋势专题八CMIP6未来气候专题——基于GPT和Python实现1.数据预处理1.1使用NetCDF工具xarray读取数据1.2裁剪时间范围和空间范围2.计算区域平均温度2.1对于全球平均温度加权平均2.2对于特定区域直接计算平均值3.趋势分析3.1使用统计方法如线性回归分析温度随时间的变化趋势4.可视化4.1绘制时间序列图显示温度趋势4.2使用地图可视化工具basemap展示空间分布的变化专题九基于机器学习方法判断天气晴雨——基于GPT和Python实现机器学习操作流程1.预处理1.1缺失值处理使用适当的策略填充或删除数据中的缺失值1.2数据探索通过统计摘要、可视化方法如直方图、箱线图来理解数据的分布、异常值情况和变量之间的关系1.3数据标准化/归一化1.4数据类型转换将分类变量转换为数值型使用独热编码One-Hot Encoding或标签编码Label Encoding2.数据采样2.1均衡采样对不平衡的数据集进行重采样确保各类别样本数量大致相同2.2分层抽样确保训练集和测试集中各类别样本的比例与原数据集相同使用分层采样技术。2.3交叉验证分割采用交叉验证的方法来进行更可靠的模型评估如K折交叉验证保证每个样本被用于训练和验证。2.4时间序列分割对于时间序列数据使用时间顺序分割数据确保训练集中的数据点时间上早于测试集中的数据点。3.特征工程3.1特征选择使用统计测试、模型系数或树模型的特征重要性来选择最有信息量的特征3.2降维使用主成分分析PCA、线性判别分析LDA等方法减少特征的维度3.3多项式特征生成特征的多项式组合如平方项、交互项以捕捉特征之间的非线性关系4.模型建模与堆叠4.1单模型训练如决策树、SVM、随机森林。4.2模型堆叠使用mlxtend库或自定义方法实现模型堆叠结合不同模型的预测结果作为新的特征训练一个新的模型。4.3调参使用网格搜索GridSearchCV或随机搜索RandomizedSearchCV等方法优化模型参数。4.4 集成学习除了堆叠还可以探索其他集成方法如Bagging和Boosting以提高模型的稳定性和准确性。5.模型评估5.1性能指标根据问题类型分类或回归选择合适的评估指标如准确度、召回率、F1分数、AUC值、均方误差5.2模型解释性使用SHAP对模型的预测进行解释提高模型的可解释
“AI大语言模型”助力大气科学相关交叉领域实践技术应用
发布时间:2026/6/13 1:39:01
专题一预备知识1.大语言模型在大气科学中的常见应用场景ChatGPT是一种基于自然语言处理的技术因此在大气科学领域应用主要集中在文本处理和语言生成方面。例如1.1 辅助数据分析ChatGPT 可以帮助理解和解释大量的气象数据内在信息。1.2自然语言处理用于分析和解释历史气象记录、研究论文或报告提取关键信息和趋势1.3 文献搜索和综述ChatGPT 可以撰写文献综述同时快速查找和总结相关研究及论文1.4 论文撰写辅助辅助撰写科研论文提供文本编辑和改进建议1.5 专业咨询ChatGPT提供有关特定研究技术方法的专业建议。1.6 教学工具ChatGPT 可以帮助学生理解复杂的大气概念和编程相关问题2.大语言模型常见平台使用方法2.1 POE使用方法2.2 ChatGPT使用方法3.提示词工程3.1 提示词工程介绍3.2 提示词工程讲解3.3 提示词常见模板4.Python简明教程4.1 Python基本语法4.2 Numpy使用4.3 Pandas使用4.4 Xarray使用4.5 Matplotlib使用专题二科研辅助专题1.GPT作为科研工具1.1把GPT当作搜索引擎1.2把GPT当作翻译软件1.3把GPT当作润色工具1.4用GPT提取整理文章数据1.5用GPT数据处理2.GPT作为科研助手生成2.1用GPT分析结果2.2用GPT总结生成论文摘要2.3用GPT总结生成文献综述2.4用GPT分析论文技术方法2.5用GPT分析代码2.6用GPT分析论文公式2.7用GPT识别图片并分析2.8 DIY上传本地PDF资料用GPT分析相关资料中提出问题。用GPT总结评价评阅、审稿意见3.GPT作为辅助工具下载数据3.1使用GPT生成PERSIANN /GSMaP数据的下载代码3.2使用GPT生成代码下载GSOD数据3.3使用GPT生成代码下载NCEP/NCAR再分析数据3.4使用GPT生成代码下载GFS预报数据专题三可视化专题——基于GPT实现1.绘制常见统计图2.绘制风场图、风羽图、风矢图、流线图3.通过GPT绘制双Y轴4.风玫瑰图5.填充图6.绘制添加子图7.绘制期刊常见图专题四站点数据处理使用GPT处理/生成相应代码实现下列目标1.读取数据1.1读取多种来源原始数据ISD、GSDO2.缺失值处理2.1缺失值统计2.2常见统计方法缺失值填补2.3机器学习方法填补数据3.数据质量控制3.1基于统计阈值的异常检测3.2基于机器学习的异常检测Isolation Forest等方法3.3多变量数据的异常检测服务于自动气象站数据3.4基于时间序列方法均一化检验服务于长时间气候变化评估4.时间序列的趋势4.1移动平均法4.2分解法STL, Seasonal and Trend decomposition using loess4.3 Sen’s斜率5.时间序列的突变检验5.1 MK (Mann-Kendall): Mann-Kendall趋势检验用于分析数据集中的趋势变化5.2 Pettitt: Pettitt检验非参数检验方法用于检测时间序列中的单一变化点5.3 BUT (Buishand U Test): Buishand U型统计检验5.4 SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验常用于气候数据的同质性检测5.5 BG (Buishand Range Test): Buishand范围检验6.时间序列周期分析6.1功率谱方法提取周期提取气温、降水等周期6.2小波分析方法提取周期6.3 EMD经验模态分解6.4 EEMD集成经验模态分解7.时间尺度上的统计7.1不同时间尺度上的统计8.回归分析8.1线性回归Linear Regression:简单线性回归、多元线性回归等8.2多项式回归Polynomial Regression:8.3非参数回归Non-parametric Regression:9.相关分析9.1常见的相关系数Pearson Correlation Coefficient、Spearmans Rank Correlation Coefficient9.2偏相关分析Partial Correlation9.3典型相关分析Canonical Correlation Analysis, CCA10.站点数据的空间化10.1克里格插值10.2临近点插值10.3反距插值10.4 基于高程模型的外推专题五WRF专题——基于GPT和Python实现1.静态数据的替换1.1使用Python生成WPS的静态数据A替换反照率和LAI数据GPT生成转化GLASSThe Global Land Surface Satellite (GLASS) Product suite替换默认粗分辨率数据。B替换土地利用GPT将多分类的ECI CCI土地利用数据分类进行整合使之能够用于WPS系统GPT生成转化代码将数据转化为WPS可读取的二进制格式。使用Python更改WRF初始场GPT生成代码修改WRF初始场文件并替换土地利用、地表反照率等静态数据。2.生成WRF配置文件2.1在指定的地区推荐WRF namelist.input文件相关参数2.2补全相关参数信息3.WRF的后处理3.1站点插值3.2能见度计算3.3垂直高度变量插值3.4降水相态辨识3.5水汽通量4.WRF的评估4.1格点尺度评估4.2点尺度评估4.3模态评估专题六遥感降水专题——基于GPT和Python实现1.将PERSSIAN/GSMaP数据转化为netCDF格式2.合并数据3.时间域统计并可视化4.空间域统计并可视化5.常见统计评估指标生成统计指标空间图生成泰勒图生成卫星降雨散点密度图专题七再分析数据专题——基于GPT和Python实现1.ERA5再分析数据1.1 ERA5数据的下载1.2 ERA5数据预处理1.3多时间尺度统计1.4干旱监测计算标准化降水蒸散指数SPEI或标准化降水指数SPI作为干旱监测的指标。根据土壤湿度和降水量数据使用时间序列分析和阈值判断来评估干旱风险等级。1.5极端指数计算连续干旱天数夏日指数R99极端降水指数等1.6趋势分析滑动平均累积距平趋势分析代码时间序列分析2.多套再分析数据的气候趋势分析2.1对比NCEP/NCAR、ERA5、CRU等均值2.2趋势分析3.风能资源评估3.1计算研究区域内多年的平均风速3.2计算风速的季节性变化和年际变异性3.3计算空气密度3.4计算盛行风3.5计算风功率3.6计算weibull分布3.7基于站点和WRF模式的分析3.8基于ERA5计算风功率.太阳能资源评估4.1计算每天的平均太阳辐射量4.2分析日、月和季节性气候态时空格局4.3计算趋势专题八CMIP6未来气候专题——基于GPT和Python实现1.数据预处理1.1使用NetCDF工具xarray读取数据1.2裁剪时间范围和空间范围2.计算区域平均温度2.1对于全球平均温度加权平均2.2对于特定区域直接计算平均值3.趋势分析3.1使用统计方法如线性回归分析温度随时间的变化趋势4.可视化4.1绘制时间序列图显示温度趋势4.2使用地图可视化工具basemap展示空间分布的变化专题九基于机器学习方法判断天气晴雨——基于GPT和Python实现机器学习操作流程1.预处理1.1缺失值处理使用适当的策略填充或删除数据中的缺失值1.2数据探索通过统计摘要、可视化方法如直方图、箱线图来理解数据的分布、异常值情况和变量之间的关系1.3数据标准化/归一化1.4数据类型转换将分类变量转换为数值型使用独热编码One-Hot Encoding或标签编码Label Encoding2.数据采样2.1均衡采样对不平衡的数据集进行重采样确保各类别样本数量大致相同2.2分层抽样确保训练集和测试集中各类别样本的比例与原数据集相同使用分层采样技术。2.3交叉验证分割采用交叉验证的方法来进行更可靠的模型评估如K折交叉验证保证每个样本被用于训练和验证。2.4时间序列分割对于时间序列数据使用时间顺序分割数据确保训练集中的数据点时间上早于测试集中的数据点。3.特征工程3.1特征选择使用统计测试、模型系数或树模型的特征重要性来选择最有信息量的特征3.2降维使用主成分分析PCA、线性判别分析LDA等方法减少特征的维度3.3多项式特征生成特征的多项式组合如平方项、交互项以捕捉特征之间的非线性关系4.模型建模与堆叠4.1单模型训练如决策树、SVM、随机森林。4.2模型堆叠使用mlxtend库或自定义方法实现模型堆叠结合不同模型的预测结果作为新的特征训练一个新的模型。4.3调参使用网格搜索GridSearchCV或随机搜索RandomizedSearchCV等方法优化模型参数。4.4 集成学习除了堆叠还可以探索其他集成方法如Bagging和Boosting以提高模型的稳定性和准确性。5.模型评估5.1性能指标根据问题类型分类或回归选择合适的评估指标如准确度、召回率、F1分数、AUC值、均方误差5.2模型解释性使用SHAP对模型的预测进行解释提高模型的可解释