[论文学习]LLM 情境学习资料的快速精确遗忘技术:基于 In-Context Learning 与量化 K-Means 的 ERASE 方法

发布时间：2026/6/14 17:57:18

Fast Exact Unlearning for In-Context Learning Data for LLMs (A. Muresanu et al., ICML 2025)核心问题与动机现代大型语言模型LLM训练成本极高一旦部署后若因「被遗忘权」Right to be Forgotten法规、资料来源不可信、隐私洩露或版权问题而需移除特定训练资料会面临重大挑战。传统机器学习中的**精确遗忘Exact Unlearning**要求产生一个模型其行为完全等同于从一开始就排除该资料点后重新训练的结果即重现训练演算法在移除资料后的输出分布。在深度学习尤其是 SGD 基于权重微调中精确遗忘极其困难且昂贵。现有方法如SISASharded, Isolated, Sliced, and Aggregated虽能将遗忘成本降至原训练成本的 1/nn 为分片数但仍与完整训练成本同量级且增加分片数会降低模型效能。近似遗忘Approximate Unlearning虽较快但评估指标缺乏共识且可能无法满足法律或高安全需求。本文动机针对 LLM 的「微调阶段」Fine-tuning Data使用预训练模型适应下游任务探索是否能设计出高效的精确遗忘方案。作者观察到In-Context Learning (ICL)可替代传统 SGD 微调透过少量示范例子demonstrations引导 LLM 表现且效能接近权重微调。许多有效 ICL 例子选择策略可简化为特徵空间上的聚类Clustering例如 k-means on embeddings而聚类问题已有成熟的精确遗忘技术如 Quantized K-Means。这允许将敏感资料移至微调阶段利用预训练模型实现「模型大小与资料集大小无关」的快速精确遗忘解决深度学习遗忘的根本瓶颈。结果/成果作者提出ERASE结合 In-Context Learning 与 Quantized K-Means 的遗忘框架使用Quantized K-Means进行例子选择取代标准 k-means使单一资料点遗忘操作实现常数时间independent of dataset size and model size。在 Big-Bench Instruction Induction (BBII) 多项任务上评估ERASE 的任务效能与 SISA 等基线相当或更好同时遗忘成本大幅降低远低于重新训练或 SISA 的 O(1/n) 成本。关键实验洞见ICL Quantized K-Means 在多样性与代表性例子选择上有效维持或提升下游任务准确率。遗忘操作极快无需重新训练任何子模型只需更新聚类中心centroids且预训练模型本身不变。作者还提出新的整体成本度量考虑遗忘成本与推论成本的权衡。现有加速遗忘方法常增加推论开销例如 ensembleERASE 在此平衡上表现优异。分析与洞见多角度分析1. 技术创新将 ICL 视为学习演算法的核心开创性地将经典机器学习的精确遗忘Ginart et al. 2019 的量化聚类应用到 LLM 领域。这避开了 SGD 训练的不可逆与高维参数空间问题利用 LLM 的emergent ability情境学习能力实现「零成本」适应。2. 效能 vs. 成本权衡传统微调追求极致效能但遗忘成本高ERASE 牺牲部分潜在效能ICL 有时不如全参数微调却换来极低遗忘成本。对于需要频繁处理遗忘请求的部署情境如企业或合规应用这是重大优势。作者强调应根据预期遗忘请求频率选择学习策略。3. 边缘情况与限制假设预训练与微调资料集独立无重叠若敏感资料在预训练阶段问题仍未解决仍是开放挑战。ICL 效能依赖嵌入品质与聚类参数少样本任务或高度异质资料集可能需额外调优。Quantized K-Means 虽加速遗忘但量化可能引入轻微近似不过整体仍属 exact unlearning 框架。推论成本ICL 需要在 prompt 中放入例子token 消耗较高ensemble 方法则增加多次前向传递。作者的新度量有助量化这些 trade-off。4. 更广泛意涵隐私与合规为 LLM 部署提供可验证的「被遗忘权」实现路径可能影响未来 AI 法规。训练流程重构建议将潜在敏感资料置于微调阶段而非全混入预训练。研究启发鼓励探索其他「可遗忘友好」的学习范式如 Retrieval-Augmented Generation、Model Editing并推动统一遗忘成本评估框架。潜在风险虽然 exact但若例子选择不够 robust仍可能有间接洩露membership inference风险需结合其他防护。与相关工作比较相较知识遗忘移除特定行为而非资料点或近似方法ERASE 更严格且高效与 SISA 等相比ERASE 在遗忘速度上具压倒性优势。结论论文证明针对 LLM 微调阶段的资料利用In-Context Learning 结合 Quantized K-Means可实现高效、精确且实用的遗忘机制ERASE。这不仅解决了深度学习精确遗忘的长期难题还突显了「适配学习演算法以支援快速遗忘」的重要性。未来方向包括扩展到更多任务、处理预训练阶段遗忘、优化 ICL 效率以及制定更全面的成本-效能评估标准。文章连结arXiv: https://arxiv.org/abs/2402.00751 PDF: https://arxiv.org/pdf/2402.00751ICML 2025 版本https://openreview.net/forum?idTzNVZEsqTiHTML 版本https://arxiv.org/html/2402.00751v2

Paperless-ngx多语言配置终极指南：从单语困境到全球化文档管理

Paperless-ngx多语言配置终极指南：从单语困境到全球化文档管理【免费下载链接】paperless-ngx A community-supported supercharged document management system: scan, index and archive all your documents 项目地址: https://gitcode.com/GitHub_Trending/pa…

2026/6/14 17:57:18 阅读更多

如何一键解锁九大网盘真实下载地址：终极浏览器扩展使用指南

如何一键解锁九大网盘真实下载地址：终极浏览器扩展使用指南【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 /…

2026/6/14 17:57:17 阅读更多

VutronMusic：跨平台智能音乐播放解决方案

VutronMusic：跨平台智能音乐播放解决方案【免费下载链接】VutronMusic 高颜值的第三方网易云播放器；支持流媒体音乐，如navidrome、jellyfin、emby；支持本地音乐播放、离线歌单、逐字歌词、桌面歌词、Touch Bar歌词、Mac状态栏歌词…

2026/6/14 17:56:57 阅读更多

YOLOv5到v8怎么选？实测对比快递包裹检测，教你根据场景挑模型（附性能数据）

YOLOv5到v8实战选型指南：快递包裹检测场景下的模型性能深度解析1. 模型进化史与核心架构对比YOLO系列作为实时目标检测领域的标杆，从v5到v8的每次迭代都带来了显著的架构革新。要做出明智的选型决策，首先需要理解各版本的核心技术创新点&…

2026/6/14 19:12:16 阅读更多

从GRU到LSTM：为什么你的时间序列预测模型该升级了？一个实战对比告诉你

从GRU到LSTM：时间序列预测模型升级实战指南金融市场的波动、气象数据的演变、工业设备的运行状态——这些时间序列数据背后隐藏的规律，往往决定了商业决策的成败。当我们试图用深度学习模型捕捉这些时序规律时，GRU（门控循环单元&a…

2026/6/14 19:12:16 阅读更多

3步掌握Beat Saber模组管理：ModAssistant终极指南

3步掌握Beat Saber模组管理：ModAssistant终极指南【免费下载链接】ModAssistant Simple Beat Saber Mod Installer 项目地址: https://gitcode.com/gh_mirrors/mo/ModAssistant 你是否曾经在安装Beat Saber模组时感到困惑？面对复杂的依赖关系和版…

2026/6/14 19:11:15 阅读更多

实测对比：在aardio里画图，用原生控件、GDIPlus还是封装ScottPlot更香？

aardio图表绘制方案深度对比：原生控件、GDIPlus与ScottPlot封装实战在数据可视化需求日益增长的今天，aardio开发者经常面临一个关键选择：如何高效实现复杂图表绘制？当简单的折线图已经无法满足业务需求，当股票K线、多维…

2026/6/14 19:10:55 阅读更多

遗传算法实战调优：编码设计、选择压力与收敛诊断

1. 项目概述：这不是又一篇“遗传算法入门”——而是你真正能跑通、调明白、用得上的第二课“遗传算法入门”这五个字，我见过太多次了。打开网页，十篇里八篇是复制粘贴的生物类比：种群、染色体、基因、交叉、变异、适应度……讲得像…

2026/6/14 19:10:14 阅读更多

SPT-AKI存档编辑器终极指南：3分钟打造你的完美塔科夫角色

SPT-AKI存档编辑器终极指南：3分钟打造你的完美塔科夫角色【免费下载链接】SPT-AKI-Profile-Editor Программа для редактирования профиля игрока на сервере SPT-AKI 项目地址: https://gitcode.com/gh_mirror…

2026/6/14 19:09:53 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/14 0:01:11 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

2026/6/14 0:01:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/14 10:35:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/14 10:02:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/14 10:02:42 阅读更多

相关文章

Paperless-ngx多语言配置终极指南：从单语困境到全球化文档管理

如何一键解锁九大网盘真实下载地址：终极浏览器扩展使用指南

VutronMusic：跨平台智能音乐播放解决方案

YOLOv5到v8怎么选？实测对比快递包裹检测，教你根据场景挑模型（附性能数据）

从GRU到LSTM：为什么你的时间序列预测模型该升级了？一个实战对比告诉你

3步掌握Beat Saber模组管理：ModAssistant终极指南

实测对比：在aardio里画图，用原生控件、GDIPlus还是封装ScottPlot更香？

遗传算法实战调优：编码设计、选择压力与收敛诊断

SPT-AKI存档编辑器终极指南：3分钟打造你的完美塔科夫角色

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因