机器学习入门进阶（10.5）：随机森林补充

发布时间：2026/6/14 18:13:01

第 10.5 篇随机森林的 Bagging 和 OOB——为什么多棵树投票更稳前一篇第十篇我们讲了随机森林直觉多棵树投票让模型比单棵树更稳这里我们讲它背后的原理尤其是Bagging和OOB袋外误差。1. BaggingBootstrap AggregatingBagging 的思路非常直观对训练集随机采样有放回地抽出若干样本训练一棵树每棵树看到的数据可能不完全一样最终预测结果取多棵树的多数票分类或平均值回归为什么有效单棵树容易受噪声影响多棵树互相抵消偏差统计上相互独立的弱相关模型平均后方差会降低2. OOB袋外误差每棵树训练时只用了部分样本剩下的样本没有用到这些就是袋外样本。用袋外样本做预测算出准确率或误差这就相当于天然的验证集不需要额外切分数据统计上OOB 误差非常接近交叉验证结果3. 方差降低的直观理解单棵树方差大一棵树训练集改一点结果可能变化很大多棵树平均Var(yˉ)1B2∑i1BVar(yi)1B2∑i≠jCov(yi,yj) \text{Var}(\bar{y}) \frac{1}{B^2} \sum_{i1}^{B} \text{Var}(y_i) \frac{1}{B^2} \sum_{i \neq j} \text{Cov}(y_i, y_j)Var(yˉ)B21i1∑BVar(yi)B21ij∑Cov(yi,yj)B 是树数量如果树之间相关性低随机采样随机特征选择方差就大幅降低预测结果更稳4. 随机森林为什么随机抽特征每个节点分裂时只看随机特征目的是增加树之间差异降低相关性让 Bagging 的方差降低效果更明显5. 特征重要性原理随机森林还能算特征重要性看每棵树分裂节点时某个特征带来的纯度提升Gini 或信息增益对所有树求平均得到每个特征的重要性分数更稳健的方法是置换重要性打乱某个特征看模型性能下降多少下降越多 → 这个特征越重要6. 小结Bagging 随机特征选择 → 多棵树低相关 → 方差降低 → 预测更稳OOB 提供天然验证集特征重要性来自分裂纯度提升或置换测试理解这些原理你就明白为什么随机森林比单棵树稳又能解释特征贡献

Lepton AI日志聚合：ELK与Loki方案对比

Lepton AI日志聚合：ELK与Loki方案对比【免费下载链接】leptonai A Pythonic framework to simplify AI service building 项目地址: https://gitcode.com/gh_mirrors/le/leptonai Lepton AI是一个Pythonic框架，旨在简化AI服务的构建过程。在AI服…

2026/6/14 2:10:07 阅读更多

终极指南：如何使用Xamarin.Macios与.NET MAUI构建统一的多平台应用

终极指南：如何使用Xamarin.Macios与.NET MAUI构建统一的多平台应用【免费下载链接】xamarin-macios .NET for iOS, Mac Catalyst, macOS, and tvOS provide open-source bindings of the Apple SDKs for use with .NET managed languages such as C# 项目地址: h…

2026/6/9 21:53:35 阅读更多

计算思维如何改变问题解决方式：MIT课程深度解析

计算思维如何改变问题解决方式：MIT课程深度解析【免费下载链接】computational-thinking Course 18.S191 at MIT, Fall 2022 - Introduction to computational thinking with Julia 项目地址: https://gitcode.com/gh_mirrors/co/computational-thinking 计…

2026/6/9 17:20:53 阅读更多

FactoryBluePrints：戴森球计划3000+工厂蓝图库，3倍效率构建你的太空工业帝国

FactoryBluePrints：戴森球计划3000工厂蓝图库，3倍效率构建你的太空工业帝国【免费下载链接】FactoryBluePrints 游戏戴森球计划的**工厂**蓝图仓库项目地址: https://gitcode.com/GitHub_Trending/fa/FactoryBluePrints 还在为戴森球计划中复杂…

2026/6/14 18:12:53 阅读更多

解密ScintillaNET：构建高性能代码编辑器的核心技术实现

解密ScintillaNET：构建高性能代码编辑器的核心技术实现【免费下载链接】ScintillaNET A Windows Forms control, wrapper, and bindings for the Scintilla text editor. 项目地址: https://gitcode.com/gh_mirrors/sc/ScintillaNET 在.NET桌面应用开发中&a…

2026/6/14 18:12:33 阅读更多

如何用Notepad--跨平台文本编辑器提升你的工作效率：3个超实用技巧

如何用Notepad--跨平台文本编辑器提升你的工作效率：3个超实用技巧【免费下载链接】notepad-- 一个支持windows/linux/mac的文本编辑器，目标是做中国人自己的编辑器，来自中国。项目地址: https://gitcode.com/GitHub_Trending/no/notepad-…

2026/6/14 18:12:33 阅读更多

SuperMap iClient3D for Cesium加载矢量数据的三种姿势：地图服务、MVT、三维缓存怎么选？

SuperMap iClient3D for Cesium矢量数据加载实战指南：地图服务、MVT与三维缓存的深度抉择当城市天际线在浏览器中缓缓展开，每一栋建筑轮廓的流畅度、每一条道路标签的清晰度，都取决于开发者对矢量数据加载技术的精准把控。作为三维WebGIS开发…

2026/6/14 18:12:33 阅读更多

深入解析MPC8245：PowerPC SoC架构、外设集成与嵌入式系统实战

1. MPC8245：嵌入式系统的“瑞士军刀”在嵌入式系统开发领域，尤其是网络设备、工业控制和通信网关这类对性能和可靠性要求严苛的场景，选对一颗处理器往往意味着项目成功了一半。从业十几年，我经手过不少处理器平台，从早…

2026/6/14 18:12:13 阅读更多

如何用3个核心步骤让2008-2017年老款Mac焕发新生

如何用3个核心步骤让2008-2017年老款Mac焕发新生【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 您是否正为手中的老款Mac设备无法升级到最新macOS系统而烦恼…

2026/6/14 18:12:13 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/14 0:01:11 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

2026/6/14 0:01:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/14 10:35:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/14 10:02:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/14 10:02:42 阅读更多

相关文章

Lepton AI日志聚合：ELK与Loki方案对比

终极指南：如何使用Xamarin.Macios与.NET MAUI构建统一的多平台应用

计算思维如何改变问题解决方式：MIT课程深度解析

FactoryBluePrints：戴森球计划3000+工厂蓝图库，3倍效率构建你的太空工业帝国

解密ScintillaNET：构建高性能代码编辑器的核心技术实现

如何用Notepad--跨平台文本编辑器提升你的工作效率：3个超实用技巧

SuperMap iClient3D for Cesium加载矢量数据的三种姿势：地图服务、MVT、三维缓存怎么选？

深入解析MPC8245：PowerPC SoC架构、外设集成与嵌入式系统实战

如何用3个核心步骤让2008-2017年老款Mac焕发新生

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因