持续学习的指标

发布时间：2026/5/18 10:46:14

原文towardsdatascience.com/the-metrics-of-continual-learning-08f2d1cd959b持续学习是机器学习的一个子领域它处理在持续到达的数据上增量训练神经网络。关键的是数据不能完全存储很多时候甚至无法从旧任务中携带任何样本。因为网络只优化当前可用的数据它们会覆盖旧参数。在覆盖它们的过程中旧知识通常会被破坏即遗忘。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2686d69049a171843914adec729d0d15.png图片由 Reid Zura 在 Unsplash 上提供为了基准测试持续学习和灾难性遗忘持续学习研究中使用了几个评估指标。在本文中我将详细介绍三个最常用的指标。虽然我会以分类为例但这些指标同样适用于其他问题例如回归。如果你对持续学习的主题不太熟悉我建议你阅读我之前的两篇文章以更深入地了解这个主题。像之前一样我将在文章末尾提供阅读推荐以进一步探索这个主题。平均准确率最常用的指标是平均准确率通常缩写为 ACC。正如其名所示它衡量每个任务的测试集准确率然后对特定任务的准确率进行平均。形式上定义为 [1]https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0b5d7162617d43f8f4d196a81e99f4f6.png在方程中k是当前任务_ak,j表示在任务k上训练后对先前任务jj k的测试准确率。以下示例应该会使这一点更清晰假设我们在三个任务 1、2、3 上训练网络。我们首先在任务 1 上训练并在所有先前任务上进行测试。因为没有先前的任务所以我们只测试任务 1。接下来我们在任务 2 的数据上训练。然后我们在所有旧任务上进行评估。现在任务一被认为是先前的任务因此我们在它上面测试我们的网络。然后在训练任务三之后我们在任务 1 到 3 上进行评估。在最后一种情况下在训练之后上述方程将变为以下求和https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/cb48e008f0713a476693d450ffdc516c.png反向迁移当使用 ACC 来衡量性能时反向迁移BWT关注的是持续学习的性能变化——即灾难性遗忘。它衡量直接在任务上训练和在后续任务上训练后的测试集性能差异。形式上定义为 [1]https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0f8829855a5024ad67d5208696351393.png其中括号内的项表示性能差异。在大多数情况和研究中这个指标将是负值。负值表示遗忘对于某个任务的原始性能比后续训练任务时要好。以下示例应该会使它更清晰假设我们在任务 1 上进行训练并在之后直接对其测试集进行评估达到 90%的准确率。在后续任务上训练后我们后来再次评估我们持续训练的网络在任务 1 的测试集上的表现达到 90%的准确率。现在计算 BWTBurrows-Wheeler Transform简单就是 70% - 90%等于-20。这里持续训练我们的网络导致了灾难性遗忘。注意0 BWT即现在的性能差异是可能的。然而正的 BWT表示对旧任务的回顾性改进例如从 90%到 91%是非常具有挑战性的尤其是在没有访问旧数据点的情况下。前向迁移之前介绍的两个指标都是在持续设置中衡量性能。为了量化持续训练本身是否对学习新任务有益可以使用前向迁移度量 FWT。正式地FWT 定义为[1]。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9a76b0b6f46a099b3410a873b5dcd25d.png其中hat{a}是仅针对任务 j 的参考模型趋势的准确率。负的 FWTForward Weight Transfer值表明在先前任务上的顺序训练并没有导致优于从头开始训练的性能。示例在训练了一些先前任务后我们在任务 j 上达到了 90%的测试准确率。一个单独的、随机初始化的模型仅使用任务 j 的数据训练达到了 80%的准确率。那么前向迁移将是10这表明持续训练是有益的。通常前向迁移在文献中很少使用ACC 和 BWT 是主要的指标。结论在这篇文章中我描述了机器学习中常用的三种指标。平均准确率Acc衡量测试性能前向迁移BWT衡量灾难性遗忘前向迁移FWT评估与从头开始的任务特定训练相比持续训练的有效性。ACC 和 BWT 在文献中常用而 FWT 则很少使用。在我的文章中我专注于分类作为基本问题但这些指标也适用于回归或目标检测。要进一步探讨这些主题我推荐以下论文标题给出“梯度周期性记忆用于持续学习”“无遗忘的持续学习与获胜子网络”“持续学习的三种场景”参考文献[1] Lopez-Paz, David, and Marc’Aurelio Ranzato. “Gradient episodic memory for continual learning.” Advances in neural information processing systems 30 (2017).

AssetRipper终极指南：高效提取Unity游戏资源的完整解决方案

AssetRipper终极指南：高效提取Unity游戏资源的完整解决方案【免费下载链接】AssetRipper GUI Application to work with engine assets, asset bundles, and serialized files 项目地址: https://gitcode.com/GitHub_Trending/as/AssetRipper AssetRipper是…

2026/5/18 10:46:14 阅读更多

嵌入式显示开发终极指南：5步快速掌握TFT_eSPI图形库

嵌入式显示开发终极指南：5步快速掌握TFT_eSPI图形库【免费下载链接】TFT_eSPI Arduino and PlatformIO IDE compatible TFT library optimised for the Raspberry Pi Pico (RP2040), STM32, ESP8266 and ESP32 that supports different driver chips 项目地址: h…

2026/5/18 10:45:54 阅读更多

保姆级教程：用SOEM开源库搞定汇川SV660N伺服驱动器的EtherCAT通讯配置

工业自动化实战：SOEM开源库与汇川SV660N伺服驱动器的EtherCAT深度集成指南第一次接触EtherCAT协议栈时，我被它高效的总线机制所吸引，但真正在项目中部署汇川SV660N伺服驱动器时，才发现从理论到实践之间隔着无数个"坑"…

2026/5/18 10:45:33 阅读更多

序列去重操作

2026/5/19 7:57:02 阅读更多

【NotebookLM内容可信度跃迁关键】：如何用“证据锚定法”让讨论部分通过专家级评审？

更多请点击： https://intelliparadigm.com 第一章：NotebookLM讨论部分的可信度本质与评审标准可信度的本质：语义对齐与溯源可验证性 NotebookLM 的讨论部分并非传统意义上的“生成式问答”，而是基于用户上传文档构建的语义索引…

2026/5/19 7:57:02 阅读更多

NotebookLM信息冗余顽疾破解指南（92%用户忽略的3层语义去重机制）

更多请点击： https://intelliparadigm.com 第一章：NotebookLM信息去重的核心挑战与认知重构 NotebookLM 作为 Google 推出的基于用户文档构建的 AI 助手，其核心能力依赖于对上传资料的语义理解与上下文关联。然而，当用户批量导入…

2026/5/19 7:57:02 阅读更多

NotebookLM问答功能终极评估报告（基于217份真实研究笔记测试）：准确率、溯源性、逻辑连贯性三维评分，这份清单决定你是否该立刻升级

更多请点击： https://intelliparadigm.com 第一章：NotebookLM问答功能终极评估报告概览 NotebookLM 是 Google 推出的基于用户上传文档构建个性化知识代理的 AI 工具，其核心问答能力依赖于对私有资料的深度语义理解与上下文精准锚定。本章聚…

2026/5/19 7:57:02 阅读更多

终极指南：如何在Blender中完美处理3MF格式文件

终极指南：如何在Blender中完美处理3MF格式文件【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 想在Blender中实现3D打印工作流的无缝衔接吗？Blend…

2026/5/19 7:56:41 阅读更多

Win11笔记本避坑指南：手把手教你用Anaconda3和CUDA 11.6搞定PyTorch GPU环境

Win11笔记本深度学习环境搭建全攻略：Anaconda3与CUDA 11.6的黄金组合在个人笔记本电脑上搭建深度学习环境，尤其是针对Windows 11系统的用户，往往面临着比台式机更多的挑战。从显卡驱动的兼容性问题到散热性能的平衡，再到多个Pyt…

2026/5/19 7:56:21 阅读更多

5分钟快速上手：biliTickerBuy开源工具助你轻松抢购B站会员购热门票务

5分钟快速上手：biliTickerBuy开源工具助你轻松抢购B站会员购热门票务【免费下载链接】biliTickerBuy b站会员购购票辅助工具项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy biliTickerBuy是一款专为B站会员购平台设计的开源辅助工具&…

2026/5/19 0:00:10 阅读更多

一口气讲清楚 Monorepo、Turborepo、pnpm、Changesets 到底是什么？

你肯定遇到过这种情况：项目里同时有前端、后端、公共组件，放在一个仓库嫌乱，拆成多个仓库又改一个公共函数要在五个项目里各改一遍。于是出现了 Monorepo、Turborepo、pnpm、Changesets 这四个词。它们不是互相替代，而是分别解决工…

2026/5/19 0:00:31 阅读更多

从ok-skills项目解析技能树：设计理念、技术实现与工程实践

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目，叫“ok-skills”。光看这个名字，可能有点摸不着头脑，但点进去一看，发现这是一个关于“技能树”或“知识图谱”的开源项目。简单来说，它试图用一种结构化的…

2026/5/19 0:01:12 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/19 4:14:12 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/19 6:17:20 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/19 0:56:48 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/19 0:13:34 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/19 0:00:02 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/18 19:34:27 阅读更多

相关文章

AssetRipper终极指南：高效提取Unity游戏资源的完整解决方案

嵌入式显示开发终极指南：5步快速掌握TFT_eSPI图形库

保姆级教程：用SOEM开源库搞定汇川SV660N伺服驱动器的EtherCAT通讯配置

序列去重操作

【NotebookLM内容可信度跃迁关键】：如何用“证据锚定法”让讨论部分通过专家级评审？

NotebookLM信息冗余顽疾破解指南（92%用户忽略的3层语义去重机制）

NotebookLM问答功能终极评估报告（基于217份真实研究笔记测试）：准确率、溯源性、逻辑连贯性三维评分，这份清单决定你是否该立刻升级

终极指南：如何在Blender中完美处理3MF格式文件

Win11笔记本避坑指南：手把手教你用Anaconda3和CUDA 11.6搞定PyTorch GPU环境

5分钟快速上手：biliTickerBuy开源工具助你轻松抢购B站会员购热门票务

一口气讲清楚 Monorepo、Turborepo、pnpm、Changesets 到底是什么？

从ok-skills项目解析技能树：设计理念、技术实现与工程实践

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)