用Python实战SARIMA模型：手把手教你预测月度用电碳排放（附完整代码）

发布时间：2026/5/24 2:40:03

Python实战SARIMA模型从数据清洗到碳排放预测全流程解析当企业需要制定碳中和战略时准确预测未来碳排放量成为关键决策依据。某能源集团的数据分析师王敏最近就遇到了这样的挑战管理层要求她基于历史数据预测未来两年集团电力生产的月度碳排放趋势。传统方法难以捕捉季节性波动而SARIMA模型恰好能解决这个问题。1. 环境准备与数据加载工欲善其事必先利其器。我们首先配置Python环境安装必要的库# 基础数据处理库 import pandas as pd import numpy as np # 统计分析库 import statsmodels.api as sm from statsmodels.tsa.statespace.sarimax import SARIMAX from statsmodels.tsa.seasonal import seasonal_decompose # 可视化库 import matplotlib.pyplot as plt import seaborn as sns # 模型评估 from sklearn.metrics import mean_absolute_error, mean_squared_error # 忽略警告信息 import warnings warnings.filterwarnings(ignore)加载碳排放数据集时需要特别注意数据质量。真实业务数据往往存在以下问题时间戳格式不统一异常值或缺失值计量单位不一致# 加载数据示例 df pd.read_csv(power_emission.csv, parse_dates[month], index_colmonth) # 检查数据前5行 print(df.head()) # 检查缺失值 print(df.isnull().sum())常见数据问题处理方案问题类型处理方法适用场景缺失值前向填充连续少量缺失异常值移动平均替换单点异常单位不一致统一转换为标准单位多数据源合并2. 数据探索与平稳性处理高质量的数据可视化能帮助我们直观理解数据特征。以下是关键可视化步骤# 绘制原始数据趋势 plt.figure(figsize(12,6)) df[emission].plot(title月度碳排放趋势(1973-2020)) plt.ylabel(百万吨CO2) plt.grid(True) plt.show()通过STL分解观察数据的季节性、趋势和残差分量# 季节性分解 decomposition seasonal_decompose(df[emission], modeladditive, period12) decomposition.plot() plt.tight_layout() plt.show()平稳性检验是时间序列分析的关键步骤。我们使用ADF检验from statsmodels.tsa.stattools import adfuller def adf_test(series): result adfuller(series.dropna()) print(ADF统计量: %f % result[0]) print(p值: %f % result[1]) print(临界值:) for key, value in result[4].items(): print(\t%s: %.3f % (key, value)) if result[1] 0.05: print(拒绝原假设数据平稳) else: print(无法拒绝原假设数据非平稳) adf_test(df[emission])当数据不平稳时我们需要进行差分处理# 一阶差分去趋势 df[diff_1] df[emission].diff(1) # 季节性差分(周期12个月) df[diff_seasonal] df[diff_1].diff(12) # 再次检验平稳性 adf_test(df[diff_seasonal].dropna())3. 模型构建与参数优化SARIMA模型有7个关键参数(p,d,q)(P,D,Q)m。确定这些参数的最佳组合是建模的核心挑战。参数网格搜索实现# 定义参数搜索空间 p d q range(0, 2) P D Q range(0, 2) m 12 # 月度数据的季节周期 # 生成所有参数组合 pdq list(itertools.product(p, d, q)) seasonal_pdq list(itertools.product(P, D, Q, [m])) # 网格搜索寻找最优参数 best_aic float(inf) best_params None for param in pdq: for param_seasonal in seasonal_pdq: try: mod SARIMAX(df[emission], orderparam, seasonal_orderparam_seasonal, enforce_stationarityFalse, enforce_invertibilityFalse) results mod.fit() if results.aic best_aic: best_aic results.aic best_params (param, param_seasonal) print(fSARIMA{param}x{param_seasonal} - AIC:{results.aic:.2f}) except: continue print(f\n最优参数组合: {best_params} - AIC: {best_aic:.2f})参数选择经验法则观察ACF/PACF图确定初步参数范围优先尝试dD≤2的组合季节性参数通常不超过1阶权衡模型复杂度(AIC)与过拟合风险4. 模型训练与验证确定最优参数后我们训练最终模型# 使用最优参数训练模型 best_order, best_seasonal_order best_params model SARIMAX(df[emission], orderbest_order, seasonal_orderbest_seasonal_order, enforce_stationarityFalse) results model.fit() # 输出模型摘要 print(results.summary())模型诊断要点残差应近似白噪声Q-Q图应接近直线残差自相关函数(ACF)无显著相关性# 模型诊断图 results.plot_diagnostics(figsize(12,8)) plt.tight_layout() plt.show()验证模型预测能力时我们保留最后24个月作为测试集# 划分训练测试集 train df.iloc[:-24] test df.iloc[-24:] # 在训练集上重新训练模型 model SARIMAX(train[emission], orderbest_order, seasonal_orderbest_seasonal_order) fitted model.fit() # 预测测试集 forecast fitted.get_forecast(steps24) forecast_ci forecast.conf_int() # 可视化预测结果 plt.figure(figsize(12,6)) plt.plot(train.index, train[emission], label训练数据) plt.plot(test.index, test[emission], label实际值) plt.plot(test.index, forecast.predicted_mean, label预测值) plt.fill_between(test.index, forecast_ci.iloc[:,0], forecast_ci.iloc[:,1], colorgray, alpha0.2) plt.title(SARIMA模型预测效果验证) plt.legend() plt.show()评估指标计算# 计算评估指标 mae mean_absolute_error(test[emission], forecast.predicted_mean) rmse np.sqrt(mean_squared_error(test[emission], forecast.predicted_mean)) print(fMAE: {mae:.2f}) print(fRMSE: {rmse:.2f})5. 模型部署与生产应用将训练好的模型应用于实际业务预测# 全量数据重新训练 final_model SARIMAX(df[emission], orderbest_order, seasonal_orderbest_seasonal_order) final_results final_model.fit() # 预测未来24个月 forecast final_results.get_forecast(steps24) forecast_ci forecast.conf_int() # 可视化长期预测 plt.figure(figsize(12,6)) plt.plot(df.index, df[emission], label历史数据) plt.plot(pd.date_range(df.index[-1], periods25, freqM)[1:], forecast.predicted_mean, label未来预测) plt.fill_between(pd.date_range(df.index[-1], periods25, freqM)[1:], forecast_ci.iloc[:,0], forecast_ci.iloc[:,1], colorgray, alpha0.2) plt.title(未来两年碳排放预测) plt.ylabel(百万吨CO2) plt.legend() plt.grid(True) plt.show()生产环境部署建议使用Joblib或Pickle保存训练好的模型设置定期(如每月)模型重训练机制实现自动化预测结果推送建立模型性能监控体系# 模型保存示例 import joblib joblib.dump(final_results, sarima_emission_model.pkl) # 模型加载示例 loaded_model joblib.load(sarima_emission_model.pkl) new_forecast loaded_model.get_forecast(steps12)6. 模型优化与高级技巧基SARIMA模型可以进一步优化提升预测精度1. 外生变量引入当有其他影响因素数据时可以使用SARIMAX模型# 假设有温度数据作为外生变量 exog pd.read_csv(temperature.csv, index_colmonth, parse_datesTrue) model SARIMAX(df[emission], exogexog, order(1,1,1), seasonal_order(1,1,1,12)) results model.fit()2. 参数自动优化使用pmdarima库实现自动参数选择from pmdarima import auto_arima model auto_arima(df[emission], seasonalTrue, m12, traceTrue, error_actionignore, suppress_warningsTrue) print(model.summary())3. 预测区间调整根据业务需求调整置信区间# 获取不同置信水平的预测区间 forecast_95 final_results.get_forecast(steps24).conf_int(alpha0.05) forecast_80 final_results.get_forecast(steps24).conf_int(alpha0.2)4. 多周期预测比较评估不同预测周期下的模型表现预测周期(月)MAERMSE训练时间(s)62.12.815123.24.118245.77.3227. 业务应用与决策支持将模型预测结果转化为业务洞察是关键。以下是典型应用场景1. 碳配额规划基于预测结果制定碳配额采购计划避免超额排放罚款或配额浪费。2. 减排措施评估模拟不同减排措施实施后的预测曲线变化评估措施效果。3. 能源结构调整分析不同能源占比变化对碳排放的影响优化能源结构。4. 报告自动化将预测结果自动生成可视化报告支持管理层决策。# 生成预测报告示例 report_data { 当前排放水平: df[emission][-1], 下季度预测: forecast.predicted_mean[:3].mean(), 明年同期变化率: (forecast.predicted_mean[12]/df[emission][-12]-1)*100 } pd.DataFrame.from_dict(report_data, orientindex, columns[值])实际项目中我们曾遇到一个典型案例某电厂通过SARIMA模型预测发现如果不采取改进措施明年三季度将超出碳配额7.2%。基于这一预警他们提前实施了能效提升计划最终避免了约280万元的超额排放罚款。

AI企业参与国防采购的挑战、机遇与实操路线图

1. 项目概述：当AI遇见国防采购，一场静默的“双向奔赴”在硅谷的咖啡厅和五角大楼的简报室之间，正上演着一场深刻而复杂的对话。话题的核心，是人工智能这项被誉为“新时代电力”的技术，如何融入世界上最庞大、最严谨的采…

2026/5/24 2:36:20 阅读更多

Unity编辑器光标精准定位：解决GUI坐标与文本度量错位

1. 这不是“换个光标样式”，而是重构编辑器交互体验的起点Unity开发者常误以为“Cursor”只是Cursor.SetCursor()那几行代码的事——改个图标、设个热区、调个模式，完事。但当你真正把Cursor逻辑嵌入到一个自定义代码编辑器（比如基于TextEdit…

2026/5/24 2:35:19 阅读更多

传感器网络误差分析：从核心公式到人群计数与城市计算的实战优化

1. 项目概述：从“数人头”到“算城市”，传感器网络误差的实战拆解在智慧城市、安防监控、交通流量分析这些领域，我们常常需要回答一个看似简单的问题：这里到底有多少人？无论是评估一个商圈的人气，还是监测一…

2026/5/24 2:33:18 阅读更多

Windows 10/11 下保姆级教程：VMD 1.9.4 和 NAMD 3.0 分子动力学模拟环境搭建（含官网注册避坑指南）

Windows 分子动力学模拟环境搭建全攻略：从零开始掌握VMD与NAMD在计算化学和生物物理研究领域，分子动力学模拟已成为不可或缺的研究工具。对于刚接触这一领域的Windows用户来说，如何正确搭建VMD和NAMD的模拟环境往往是第一个需要跨越的门槛。本…

2026/5/24 3:16:51 阅读更多

Unity接入Azure OpenAI实战避坑指南：TLS、认证与协程陷阱

1. 这不是“调个API”那么简单：为什么Unity里接Azure OpenAI常被低估为“几行代码的事”很多人看到“Unity接入OpenAI”，第一反应是：不就是发个HTTP请求、解析JSON、把返回文本塞进UI Text组件？我试过三次——第一次在编辑器里跑通…

2026/5/24 3:16:51 阅读更多

Arm CoreSight调试工具CSAT与CSAT600对比解析

1. CoreSight调试工具概述在嵌入式系统开发领域，CoreSight技术是Arm架构下用于系统级调试和追踪的关键基础设施。作为Arm开发工具链的重要组成部分，CoreSight Access Tool（CSAT）系列工具为开发者提供了直接访问芯片内部调试接口的…

2026/5/24 3:16:51 阅读更多

避坑指南：在Win11上为ENVI5.6成功挂载SARscape插件的完整流程（从安装到文件配置）

Win11系统下ENVI5.6与SARscape5.6无缝集成全流程指南对于遥感领域的从业者和研究者来说，ENVI和SARscape的组合堪称地表信息提取的黄金搭档。然而，当这套组合遇上最新的Win11系统，不少用户发现原本在Win10上顺畅的安装流程突然变得坎坷起来——…

2026/5/24 3:16:31 阅读更多

SqueezeBERT：用分组卷积思想加速Transformer，实现移动端4.3倍推理提速

1. 项目概述：当NLP模型需要“减肥”与“提速”在移动设备上部署自然语言处理模型，比如让手机里的智能助手理解你的长句指令，或者让离线翻译软件流畅工作，一直是个让人头疼的难题。传统的BERT模型虽然效果拔群，但动辄几…

2026/5/24 3:15:50 阅读更多

荒野搜救无人机图像采集优化：提升CV/ML应用效能的五条核心原则

1. 荒野搜救中的无人机图像采集：为什么CV/ML应用依然困难？如果你参与过荒野搜救，或者关注过无人机在应急响应中的应用，你可能会有一个疑问：现在计算机视觉和机器学习技术这么火，为什么在实际的搜救行动中&a…

2026/5/24 3:15:10 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/24 0:01:12 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/24 0:01:32 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/24 0:02:33 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

2026/5/24 0:01:12 阅读更多

附录 B：术语表

2026/5/24 0:01:32 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

2026/5/24 0:02:33 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/23 15:04:07 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/23 12:38:32 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/23 4:55:00 阅读更多

相关文章

AI企业参与国防采购的挑战、机遇与实操路线图

Unity编辑器光标精准定位：解决GUI坐标与文本度量错位

传感器网络误差分析：从核心公式到人群计数与城市计算的实战优化

Windows 10/11 下保姆级教程：VMD 1.9.4 和 NAMD 3.0 分子动力学模拟环境搭建（含官网注册避坑指南）

Unity接入Azure OpenAI实战避坑指南：TLS、认证与协程陷阱

Arm CoreSight调试工具CSAT与CSAT600对比解析

避坑指南：在Win11上为ENVI5.6成功挂载SARscape插件的完整流程（从安装到文件配置）

SqueezeBERT：用分组卷积思想加速Transformer，实现移动端4.3倍推理提速

荒野搜救无人机图像采集优化：提升CV/ML应用效能的五条核心原则

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥