手把手教你用Python搭建一个轴承故障预测模型

发布时间：2026/6/29 16:31:33

手把手教你用Python搭建一个轴承故障预测模型说实话轴承故障预测这个话题我大概是从 2019 年开始做的到现在 7 年时间了模型换了三轮——从最初的 SVM到 XGBoost再到现在的 LSTM。期间踩过的坑能写一本书。今天这篇不写教科书就讲讲我一个一线工程师的实战过程。为什么我最后选了 LSTM 而不是 Transformer你可能会问现在 Transformer 这么火为什么不上去年 Q3 我们接了一个化工企业的项目他们那批离心泵上的 SKF 6205 轴承每秒 25.6kHz 采样跑一段加速退化试验原始数据加起来有 80GB。我先上了一版 Transformer4 层 encoderd_model128在 A10 上训了 6 个小时——效果拉胯到我都想把键盘砸了。后来换成了 3 层 LSTM隐藏层 128 维训练 4 小时轴承内圈故障检出率直接拉到 94%。踩坑提醒对于一维振动信号这种局部模式占主导的数据LSTM 反而比 Transformer 好用。Transformer 注意力是全局的会把噪声也当特征学进去。这一点我后来和西门子一个专门做振动分析的德国工程师聊过他们的内部结论也是在小数据高采样率场景下LSTM 还是稳。数据预处理这一步最容易被低估很多人上来就开始搭模型我劝你冷静一下。振动信号预处理没做好后面模型再花哨都是垃圾。我一般这么干import numpy as np from scipy import signal import pywt # PyWavelets 1.5 def preprocess_vibration(raw_signal, fs25600): raw_signal: 原始振动信号1D numpy array fs: 采样率Hz 返回处理后的信号提取的统计特征 # 1. 带通滤波保留轴承特征频率范围一般 500-8000Hz # 实际工程中我们用 butterworth 4 阶 b, a signal.butter(4, [500, 8000], btypebandpass, fsfs) filtered signal.filtfilt(b, a, raw_signal) # 2. 小波去噪db4 小波3 层分解 coeffs pywt.wavedec(filtered, db4, level3) # 软阈值去噪 sigma np.median(np.abs(coeffs[-1])) / 0.6745 threshold sigma * np.sqrt(2 * np.log(len(filtered))) coeffs[1:] [pywt.threshold(c, threshold, modesoft) for c in coeffs[1:]] denoised pywt.waverec(coeffs, db4) # 3. 时域特征 features { rms: np.sqrt(np.mean(denoised**2)), kurtosis: np.mean((denoised - np.mean(denoised))**4) / (np.std(denoised)**4), peak: np.max(np.abs(denoised)), crest_factor: np.max(np.abs(denoised)) / np.sqrt(np.mean(denoised**2)), } return denoised[:len(raw_signal)], features注意这里有个细节滤波之后小波去噪的阈值选择强烈不建议用通用公式。我们现场数据噪声特性差异很大硬套sigma * sqrt(2*log(n))经常把信号本身的细节也抹掉了。我们后来改成了自适应阈值——根据每段信号的 SNR 动态调整。这一步在论文里没人会告诉你但你做了就知道差距有多大。滑动窗口切分样本轴承故障预测的本质是时序分类问题给定过去 T 个时间步判断接下来 T1 时刻会不会出故障。我用的窗口长度是 1024 个点约 40ms步长 256重叠率 75%。别小看这个步长选择——步长太大训练样本少步长太小样本之间冗余度高模型会过拟合到一些不该学的模式上。def make_windows(signal_data, window1024, step256): 把长信号切成固定长度的窗口 windows [] for start in range(0, len(signal_data) - window, step): windows.append(signal_data[start:start window]) return np.array(windows) # 假设正常数据 normal_windows make_windows(normal_signal) fault_windows make_windows(fault_signal)模型搭建3 层 LSTM Dropout下面这版模型是我们线上跑了一年多的版本。PyTorch 2.1。import torch import torch.nn as nn class BearingLSTM(nn.Module): def __init__(self, input_dim1, hidden_dim128, num_layers3, num_classes4): super().__init__() # num_classes: 正常/内圈故障/外圈故障/滚动体故障 self.lstm nn.LSTM( input_dim, hidden_dim, num_layers, batch_firstTrue, dropout0.3 ) self.fc nn.Sequential( nn.Linear(hidden_dim, 64), nn.ReLU(), nn.Dropout(0.5), nn.Linear(64, num_classes) ) def forward(self, x): # x shape: (batch, seq_len, input_dim) lstm_out, _ self.lstm(x) # 取最后一个时间步 last lstm_out[:, -1, :] return self.fc(last)踩坑提醒dropout0.3是经验值。我之前试过 0.5准确率更高一点点但模型震荡非常厉害训练后期 loss 曲线会反复横跳。0.3 是个稳的折中点。0.2 偏欠拟合0.4 偏不稳定。训练时一个反常识的发现很多人觉得准确率越高越好——但在预测性维护里高准确率往往意味着你根本没学到东西。因为故障样本天然就少。我那个化工项目里正常的样本有 12 万条4 类故障加起来只有 8000 条比例 15:1。这种情况下你训练一个模型啥也不学全部预测为正常准确率能到 94%。所以我看的不是 accuracy而是per-class recall和混淆矩阵。我们 KPI 卡的指标是内圈故障召回率 ≥ 90%误报率 ≤ 6%。# 训练时一定要用 class_weight 处理不平衡 from sklearn.utils.class_weight import compute_class_weight import numpy as np y_train [...] # 你的训练标签 weights compute_class_weight(balanced, classesnp.unique(y_train), yy_train) class_weights torch.FloatTensor(weights).cuda() criterion nn.CrossEntropyLoss(weightclass_weights)上线后真正的问题模型漂移你训练的时候数据是 2024 年的工厂里设备的工况、负载、油液状态在缓慢变化。到 2025 年 5 月模型召回率从 94% 掉到 81%——这就是概念漂移concept drift。我们的解决方案是在线学习定期重训每 24 小时做一次增量训练用新采集的标注样本每周做一次全量重训用 KL 散度监控输入分布KL 0.1 触发告警具体怎么落地的下一篇我会拆开来讲。最后说两句预测性维护不是一个模型一堆数据出活儿它是一个持续运营的过程。模型上线那天不是结束是开始。如果你刚开始接触这个领域我的建议是别上来就追最新的架构。把数据预处理、特征工程、类别不平衡处理这三件事做扎实比换个 SOTA 模型有用 10 倍。有具体问题可以评论区聊看到会回。下次见。

如何在Amlogic电视盒上安装Debian系统：2025年终极开源解决方案

如何在Amlogic电视盒上安装Debian系统：2025年终极开源解决方案【免费下载链接】debian-on-amlogic Minimal Debian and Ubuntu images for Amlogic based Android TV-boxes with mainline Linux LTS kernel. 项目地址: https://gitcode.com/gh_mirrors/de/debian…

2026/6/29 16:30:51 阅读更多

Embedding Model（嵌入模型）完整讲解：句子转向量全过程

Embedding Model（嵌入模型）完整讲解：句子转向量全过程一、核心作用Embedding 模型的唯一任务：把人类可读的文本（句子、段落、词语）映射成一段固定长度的浮点数字数组，也就是向量（vec…

2026/6/29 16:30:51 阅读更多

Magisk V24.1 源码编译实战：从环境配置到APK生成的完整避坑指南

1. 环境准备：搭建编译Magisk的基石第一次编译Magisk源码时，最让人头疼的往往不是代码本身，而是环境配置。我清楚地记得去年帮同事搭建环境时，光是解决JDK版本冲突就花了整整一下午。下面这些血泪经验，能让你少走至少…

2026/6/29 16:30:10 阅读更多

如何在Windows上完整显示AirPods电量：免费终极指南

如何在Windows上完整显示AirPods电量：免费终极指南【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDesktop 你是否曾经在Wi…

2026/6/29 17:53:38 阅读更多

2026年企业安全运营中心建设：甲方视角下的实战指南

当前安全圈有一种论调特别流行：买SIEM、上SOAR、搞态势感知，就能建好安全运营中心。作为一个在甲方干了快10年安全的老兵，我负责任地说一句——全TM是扯淡。一、什么才是真正的安全运营中心SOC不是一套系统，不是一块大屏&#xff…

2026/6/29 17:52:37 阅读更多

如何用浏览器扩展解决网页消失的终极烦恼？Wayback Machine的完整指南

如何用浏览器扩展解决网页消失的终极烦恼？Wayback Machine的完整指南【免费下载链接】wayback-machine-webextension A web browser extension for Chrome, Firefox, Edge, and Safari 14. 项目地址: https://gitcode.com/gh_mirrors/wa/wayback-machine-webexte…

2026/6/29 17:52:37 阅读更多

Open Harmony 能力增强：main_pages.json 页面注册机制解析

Open Harmony 能力增强：main_pages.json 页面注册机制解析 🚀 前言 🌟 在 OpenHarmony / HarmonyOS 应用中，页面不是随便写一个 .ets 文件就自动成为可加载页面的。页面需要被工程识别，也需要被 Ability 加载。当前项…

2026/6/29 17:51:36 阅读更多

终极游戏存档备份指南：使用Ludusavi保护你的游戏进度

终极游戏存档备份指南：使用Ludusavi保护你的游戏进度【免费下载链接】ludusavi Backup tool for PC game saves 项目地址: https://gitcode.com/gh_mirrors/lu/ludusavi 游戏存档备份是每位PC游戏玩家都应该重视的安全措施。无论是系统重装、硬件更换还是游…

2026/6/29 17:51:36 阅读更多

eNSP OSPF 诊断实战：从命令解析到网络状态全景洞察

1. 从零开始：eNSP环境下的OSPF诊断框架第一次在eNSP里遇到OSPF邻居起不来的时候，我盯着屏幕上的"2-Way"状态整整发呆了半小时。后来才发现，原来诊断OSPF问题就像医生看病一样，需要一套系统的"望闻问切"方法。…

2026/6/29 17:51:16 阅读更多

Java开发者转型安全开发：从代码审计到自动化工具实践

1. 转型背景与核心驱动力最近几年，身边不少做Java后端开发的朋友，都开始或多或少地关注起安全开发这个方向。我自己也是从写了七八年Java业务代码，一步步转向了安全领域，现在主要做代码审计和自动化安全工具开发。这个转变不是一时…

2026/6/29 0:00:05 阅读更多

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证” 开篇故事去年夏天，我正帮一家金融科技公司优化他们的TEE内Wasm沙箱。他们的核心业务是在Intel SGX enclave里运行用户提交的Wasm合约，用于实时交易验证。一天下午，运维突然报警：生产环境的enclave进程频繁崩…

2026/6/29 0:00:05 阅读更多

YAML函数动态解析：打造智能接口自动化测试用例

1. 项目概述：为什么YAML测试用例需要函数动态解析？在接口自动化测试的实践中，我们常常会面临一个核心矛盾：测试用例的可维护性与灵活性。早期的测试脚本，无论是用Python的unittest还是pytest，往往将测试数据…

2026/6/29 0:00:05 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/29 0:00:05 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/29 1:23:10 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/29 1:23:10 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/29 13:06:32 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/29 13:32:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/29 13:32:14 阅读更多

相关文章

如何在Amlogic电视盒上安装Debian系统：2025年终极开源解决方案

Embedding Model（嵌入模型）完整讲解：句子转向量全过程

Magisk V24.1 源码编译实战：从环境配置到APK生成的完整避坑指南

如何在Windows上完整显示AirPods电量：免费终极指南

2026年企业安全运营中心建设：甲方视角下的实战指南

如何用浏览器扩展解决网页消失的终极烦恼？Wayback Machine的完整指南

Open Harmony 能力增强：main_pages.json 页面注册机制解析

终极游戏存档备份指南：使用Ludusavi保护你的游戏进度

eNSP OSPF 诊断实战：从命令解析到网络状态全景洞察

Java开发者转型安全开发：从代码审计到自动化工具实践

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

YAML函数动态解析：打造智能接口自动化测试用例

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因