用Python分析全球水资源变化：基于WaterGAP模型月数据（1901-2019）的完整流程

发布时间：2026/6/1 2:52:19

用Python分析全球水资源变化基于WaterGAP模型月数据1901-2019的完整流程当我们需要研究全球水资源的长期变化趋势时WaterGAP模型提供的月尺度数据无疑是一个宝贵的资源。这份跨越119年的数据集记录了从1901年到2019年间全球水循环的详细变化包括地表水、地下水、土壤水等多种水储量指标。本文将带领读者从数据获取开始一步步完成数据处理、分析和可视化的全过程最终生成专业的水资源变化趋势图。1. 环境准备与数据获取在开始分析之前我们需要搭建一个合适的工作环境。推荐使用Anaconda创建独立的Python环境确保依赖包的版本一致性。以下是核心依赖包及其作用# 创建conda环境 conda create -n watergap python3.9 conda activate watergap # 安装核心包 pip install xarray dask netCDF4 pandas numpy matplotlib cartopyWaterGAP数据可以从Pangaea数据仓库获取。数据集通常以NetCDF格式存储这种格式特别适合存储多维科学数据。我们可以使用xarray库高效地处理这些数据它提供了类似pandas的接口但专门为多维数组设计。import xarray as xr # 示例数据加载 ds xr.open_dataset(watergap_22d_gswp3-w5e5_histsoc_tws_monthly_1901_2019.nc4)2. 数据预处理与质量控制原始数据往往需要经过预处理才能用于分析。WaterGAP数据虽然已经过质量控制但我们仍需进行一些基本检查和处理。2.1 数据完整性检查首先检查数据的时间覆盖范围和空间分辨率print(f时间范围: {ds.time.min().values} 到 {ds.time.max().values}) print(f空间分辨率: {ds.lon[1].values - ds.lon[0].values} 度) print(f可用变量: {list(ds.data_vars)})2.2 缺失值处理WaterGAP数据中的缺失值通常用特定值标记如-9999我们需要将其替换为NaNds[tws] ds[tws].where(ds[tws] ! -9999)2.3 时间一致性检查确保时间轴连续且无跳跃import pandas as pd # 检查时间间隔是否一致 time_diffs pd.Series(ds.time.values[1:]) - pd.Series(ds.time.values[:-1]) print(f时间间隔是否一致: {all(time_diffs time_diffs[0])})3. 区域选择与时间序列分析针对特定区域的分析是水资源研究的常见需求。下面以长江流域为例展示如何提取区域数据并进行分析。3.1 定义区域边界长江流域的大致经纬度范围yangtze_bbox { lon_min: 90, lon_max: 122, lat_min: 24, lat_max: 35 }3.2 区域数据提取使用xarray的sel方法提取区域数据yangtze_ds ds.sel( lonslice(yangtze_bbox[lon_min], yangtze_bbox[lon_max]), latslice(yangtze_bbox[lat_max], yangtze_bbox[lat_min]) )3.3 时间序列聚合计算区域平均时间序列yangtze_ts yangtze_ds[tws].mean(dim[lon, lat])4. 趋势分析与可视化长期趋势分析是水资源研究的核心内容。下面介绍几种常用的分析方法。4.1 年际变化趋势首先将月数据聚合为年平均值yearly_mean yangtze_ts.groupby(time.year).mean()使用线性回归计算趋势from scipy.stats import linregress years yearly_mean.year.values values yearly_mean.values slope, intercept, r_value, p_value, std_err linregress(years, values) print(f趋势: {slope*10:.2f} mm/10年, p值: {p_value:.4f})4.2 可视化展示使用matplotlib绘制时间序列和趋势线import matplotlib.pyplot as plt import matplotlib.dates as mdates plt.figure(figsize(12, 6)) plt.plot(yearly_mean.year, yearly_mean, label年平均值) plt.plot(years, intercept slope*years, r, label趋势线) plt.title(长江流域总水储量年际变化 (1901-2019)) plt.xlabel(年份) plt.ylabel(总水储量 (mm)) plt.legend() plt.grid() plt.show()5. 空间分布与变化模式除了时间序列分析空间分布特征也是理解水资源变化的重要方面。5.1 多年平均空间分布计算整个时期的平均水储量mean_tws ds[tws].mean(dimtime)5.2 变化趋势的空间分布计算每个格点的线性趋势from scipy.stats import linregress def calc_trend(ts): years np.arange(len(ts)) slope, _, _, _, _ linregress(years, ts) return slope * len(years) # 总变化量 trend xr.apply_ufunc( calc_trend, ds[tws].chunk({lat: 10, lon: 10}), input_core_dims[[time]], output_core_dims[[]], vectorizeTrue )5.3 空间可视化使用cartopy绘制空间分布图import cartopy.crs as ccrs import cartopy.feature as cfeature proj ccrs.PlateCarree() fig plt.figure(figsize(15, 8)) ax fig.add_subplot(111, projectionproj) # 添加地理要素 ax.add_feature(cfeature.LAND) ax.add_feature(cfeature.COASTLINE) ax.add_feature(cfeature.BORDERS, linestyle:) # 绘制趋势 im trend.plot(axax, transformproj, cmapcoolwarm, cbar_kwargs{label: 水储量变化 (mm/世纪)}) ax.set_title(全球总水储量变化趋势 (1901-2019)) plt.show()6. 多变量分析与相关性研究水资源系统各分量之间存在复杂的相互作用多变量分析有助于理解这些关系。6.1 数据整合加载多个相关变量variables [tws, groundwstor, soilmoist, swe] datasets {} for var in variables: filename fwatergap_22d_gswp3-w5e5_histsoc_{var}_monthly_1901_2019.nc4 datasets[var] xr.open_dataset(filename)[var]6.2 区域平均时间序列计算长江流域各变量的年平均值yearly_means {} for var, da in datasets.items(): region_da da.sel( lonslice(yangtze_bbox[lon_min], yangtze_bbox[lon_max]), latslice(yangtze_bbox[lat_max], yangtze_bbox[lat_min]) ) yearly_means[var] region_da.groupby(time.year).mean()6.3 相关性分析计算各变量间的相关系数import pandas as pd df pd.DataFrame(yearly_means) corr_matrix df.corr() print(变量间相关系数矩阵:) print(corr_matrix)7. 高级分析与应用在前面的基础上我们可以进行更深入的分析为水资源管理提供科学依据。7.1 干旱事件识别定义基于TWS的干旱指标# 计算标准化异常 tws_mean yearly_means[tws].mean() tws_std yearly_means[tws].std() tws_anomaly (yearly_means[tws] - tws_mean) / tws_std # 识别严重干旱年份 drought_years tws_anomaly[tws_anomaly -1.5] print(f严重干旱年份: {list(drought_years.index)})7.2 变化点检测使用Pettitt检验检测突变点from pyhomogeneity import pettitt_test result pettitt_test(yearly_means[tws].values) print(f突变点年份: {years[result.cp]}, 显著性: {result.p:.3f})7.3 未来情景预测基于历史趋势的简单预测future_years np.arange(2020, 2051) future_tws intercept slope * future_years plt.figure(figsize(10, 5)) plt.plot(years, yearly_means[tws], label观测) plt.plot(future_years, future_tws, --, label预测) plt.title(长江流域总水储量预测) plt.xlabel(年份) plt.ylabel(总水储量 (mm)) plt.legend() plt.grid() plt.show()8. 性能优化与大数据处理当处理全球长时间序列数据时性能优化至关重要。以下是几种有效的优化策略。8.1 使用Dask进行并行计算import dask.array as da # 分块加载数据 ds xr.open_mfdataset(watergap_*.nc4, chunks{time: 120, lat: 100, lon: 100}) # 并行计算 mean_tws ds[tws].mean(dimtime).compute()8.2 内存优化技巧对于大型计算可以采取以下策略使用xarray的chunk方法控制内存使用及时删除不再需要的中间变量使用dask的persist方法缓存常用数据# 示例分块计算 chunked ds[tws].chunk({time: 120, lat: 50, lon: 50}) result chunked.groupby(time.year).mean().compute()8.3 结果存储优化将中间结果保存为Zarr格式提高后续读取效率# 保存为Zarr格式 ds.to_zarr(watergap_tws.zarr) # 从Zarr读取 ds_zarr xr.open_zarr(watergap_tws.zarr)

当风控PM，你到底需要会点什么？

📚 《风控PM记》系列文章目录订阅关注，不错过系列更新。欢迎在评论区留下你感兴趣的话题。入门篇当风控PM，你到底需要会点什么？《电商风控入门：我们到底在“防”什么？不只是薅羊毛！》方法…

2026/6/1 2:50:58 阅读更多

告别双芯片方案：手把手教你用Xilinx Zynq UltraScale+的R5核跑实时任务（附Vitis工程配置）

告别双芯片方案：手把手教你用Xilinx Zynq UltraScale的R5核跑实时任务（附Vitis工程配置）在嵌入式系统设计中，实时任务处理一直是个令人头疼的问题。传统解决方案往往采用"主控芯片实时协处理器"的双芯片架构——比如用一…

2026/6/1 2:49:17 阅读更多

告别手动画图！用Perl脚本自动化分析MS动力学轨迹中的氢键变化

告别手动画图！用Perl脚本自动化分析MS动力学轨迹中的氢键变化深夜的实验室里，咖啡杯已经见底，而电脑屏幕上还开着第37个轨迹分析窗口。这可能是每个做过分子动力学模拟的研究者都熟悉的场景——手动统计氢键数据不仅耗时费力，还容…

2026/6/1 2:47:56 阅读更多

JSP基础知识

JSP全称Java Server Pages，是一种动态网页开发技术。它使用JSP标签在HTML网页中插入Java代码。标签通常以<%开头，以%>结束。 JSP是一种Java servlet（在处理用户请求时会转化为servlet即java文件），主要用于实现Ja…

2026/6/1 3:50:03 阅读更多

Nginx 15分钟入门

零、前言Nginx 有如下几个重要功能：反向代理与负载均衡正向代理存放静态资源。如果客户端请求的是静态资源，可以直接返结果，不往后走了。等等这里暂且只讲反向代理功能，与反向代理下的负载均衡。1、反向代理如上图，网站…

2026/6/1 3:50:03 阅读更多

如何永久保存微信聊天记录：WeChatMsg完整指南与数据分析教程

如何永久保存微信聊天记录：WeChatMsg完整指南与数据分析教程【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we…

2026/6/1 3:49:23 阅读更多

TurboQuant TQ3_4S格式详解：为什么它是Qwen3.6模型本地部署的最佳选择？[特殊字符]

TurboQuant TQ3_4S格式详解：为什么它是Qwen3.6模型本地部署的最佳选择？🚀 【免费下载链接】Qwen3.6-27B-TQ3_4S 项目地址: https://ai.gitcode.com/hf_mirrors/YTan2000/Qwen3.6-27B-TQ3_4S 想要在本地设备上运行强大的Qwen3.6-27B大…

2026/6/1 3:49:03 阅读更多

Venusaur项目全面解析：高效句子嵌入模型的终极指南

Venusaur项目全面解析：高效句子嵌入模型的终极指南【免费下载链接】Venusaur 项目地址: https://ai.gitcode.com/hf_mirrors/zhouhui/Venusaur Venusaur是一款基于sentence-transformers框架构建的高效句子嵌入模型，专为自然语言处理任务设计&a…

2026/6/1 3:49:03 阅读更多

告别Putty？试试VSCode远程开发：用SSH把树莓派变成你的便携Linux服务器

用VSCode远程开发树莓派：超越Putty的高效工作流树莓派作为一款小巧而强大的单板计算机，已经成为开发者们进行嵌入式开发、服务器搭建和自动化任务的热门选择。然而，传统的SSH连接工具如Putty虽然能完成基本任务，却无法提供现代开…

2026/6/1 3:49:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/1 0:06:19 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/1 0:24:01 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/1 2:19:25 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/1 0:23:56 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

2026/6/1 0:06:19 阅读更多

相关文章

当风控PM，你到底需要会点什么？

告别双芯片方案：手把手教你用Xilinx Zynq UltraScale+的R5核跑实时任务（附Vitis工程配置）

告别手动画图！用Perl脚本自动化分析MS动力学轨迹中的氢键变化

JSP基础知识

Nginx 15分钟入门

如何永久保存微信聊天记录：WeChatMsg完整指南与数据分析教程

TurboQuant TQ3_4S格式详解：为什么它是Qwen3.6模型本地部署的最佳选择？[特殊字符]

Venusaur项目全面解析：高效句子嵌入模型的终极指南

告别Putty？试试VSCode远程开发：用SSH把树莓派变成你的便携Linux服务器

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因