linux内核热补丁KLP原理浅析

发布时间：2026/6/21 7:32:34

本文代码基于linux内核4.19.195.KLP是linux内核中提供打热补丁能力的一个组件。一般我们通过用户态工具kpatch-build来制作热补丁ko该ko会利用KLP子系统的能力完成打热补丁的过程。本文侧重点在于内核侧的实现。kpatch-build的工作原理大致如下图所示就不详细展开了。┌─────────────────┐ ┌──────────────────┐ ┌─────────────────┐ │ 原始内核源码 │ │ 修改后的源码 │ │ 运行中的内核 │ │(vanilla)│ │(patched)│ │(vmlinux)│ └────────┬────────┘ └────────┬─────────┘ └─────────────────┘ │ │ └───────────┬───────────┘ ▼ ┌─────────────────┐ │ kpatch-build │ │(差异分析与构建)│ └────────┬────────┘ ▼ ┌─────────────────┐ │ 热补丁模块 │ │(kpatch-*.ko)│ └─────────────────┘kpatch-build做的工作太复杂还是拿内核的例子来讲会简单点。下面代码摘自samples/livepatch/livepatch-sample.cstaticintlivepatch_cmdline_proc_show(structseq_file*m,void*v){seq_printf(m,%s\n,this has been live patched);return0;}staticstructklp_funcfuncs[]{{.old_namecmdline_proc_show,.new_funclivepatch_cmdline_proc_show,},{}};staticstructklp_objectobjs[]{{/* name being NULL means vmlinux */.funcsfuncs,},{}};staticstructklp_patchpatch{.modTHIS_MODULE,.objsobjs,};staticintlivepatch_init(void){intret;retklp_register_patch(patch);if(ret)returnret;retklp_enable_patch(patch);if(ret){WARN_ON(klp_unregister_patch(patch));returnret;}return0;}关于struct klp_patch、static struct klp_object、struct klp_func几个结构体就不做过多的展开非本文重点。可以看到要打热补丁就两件事情把新的函数代码写好调用klp_register_patch()以及klp_enable_patch()讲热补丁打进去重点来了新的函数就按需写即可那klp_register_patch()以及klp_enable_patch()这两个函数是怎么实现的呢/** * klp_register_patch() - registers a patch * patch: Patch to be registered * * Initializes the data structure associated with the patch and * creates the sysfs interface. * * There is no need to take the reference on the patch module here. It is done * later when the patch is enabled. * * Return: 0 on success, otherwise error */intklp_register_patch(structklp_patch*patch){if(!patch||!patch-mod)return-EINVAL;if(!is_livepatch_module(patch-mod)){pr_err(module %s is not marked as a livepatch module\n,patch-mod-name);return-EINVAL;}if(!klp_initialized())return-ENODEV;if(!klp_have_reliable_stack()){pr_err(This architecture doesnt have support for the livepatch consistency model.\n);return-ENOSYS;}returnklp_init_patch(patch);}EXPORT_SYMBOL_GPL(klp_register_patch);klp_have_reliable_stack()比较有意思当前X86架构是支持的但是ARM64架构不支持听说是ARM64业界对于have_reliable_stack这个还没达成一个共识亦或者还没有完成所有必要的工具的开发。主要的工作最终都交给了klp_init_patch()去完成staticintklp_init_patch(structklp_patch*patch){structklp_object*obj;intret;if(!patch-objs)return-EINVAL;mutex_lock(klp_mutex);patch-enabledfalse;init_completion(patch-finish);retkobject_init_and_add(patch-kobj,klp_ktype_patch,klp_root_kobj,%s,patch-mod-name);if(ret){mutex_unlock(klp_mutex);returnret;}klp_for_each_object(patch,obj){retklp_init_object(patch,obj);if(ret)gotofree;}list_add_tail(patch-list,klp_patches);mutex_unlock(klp_mutex);return0;free:klp_free_objects_limited(patch,obj);mutex_unlock(klp_mutex);kobject_put(patch-kobj);wait_for_completion(patch-finish);returnret;}staticintklp_init_object(structklp_patch*patch,structklp_object*obj){structklp_func*func;intret;constchar*name;if(!obj-funcs)return-EINVAL;if(klp_is_module(obj)strlen(obj-name)MODULE_NAME_LEN)return-EINVAL;obj-patchedfalse;obj-modNULL;klp_find_object_module(obj);nameklp_is_module(obj)?obj-name:vmlinux;retkobject_init_and_add(obj-kobj,klp_ktype_object,patch-kobj,%s,name);if(ret)returnret;klp_for_each_func(obj,func){retklp_init_func(obj,func);if(ret)gotofree;}if(klp_is_object_loaded(obj)){retklp_init_object_loaded(patch,obj);if(ret)gotofree;}return0;free:klp_free_funcs_limited(obj,func);kobject_put(obj-kobj);returnret;}/* parts of the initialization that is done only when the object is loaded */staticintklp_init_object_loaded(structklp_patch*patch,structklp_object*obj){structklp_func*func;intret;mutex_lock(text_mutex);module_disable_ro(patch-mod);// 1. 暂时关闭只读保护 (Disable Read-Only),because klp_write_object_relocations 需要修改代码段里的指令retklp_write_object_relocations(patch-mod,obj);// 2. 执行重定位if(ret){// 如果失败记得把保护开回去然后解锁退出module_enable_ro(patch-mod,true);mutex_unlock(text_mutex);returnret;}// 3. 架构相关的初始化 (比如刷新指令缓存 I-Cache)arch_klp_init_object_loaded(patch,obj);module_enable_ro(patch-mod,true);// 4. 恢复只读保护 (Enable Read-Only)mutex_unlock(text_mutex);klp_for_each_func(obj,func){// 1. 查找旧函数在内存中的真实地址retklp_find_object_symbol(obj-name,func-old_name,func-old_sympos,func-old_addr);if(ret)returnret;// 2. 查找旧函数的大小 (Old Size)retkallsyms_lookup_size_offset(func-old_addr,func-old_size,NULL);if(!ret){pr_err(kallsyms size lookup failed for %s\n,func-old_name);return-ENOENT;}// 3. 查找新函数的大小 (New Size)retkallsyms_lookup_size_offset((unsignedlong)func-new_func,func-new_size,NULL);if(!ret){pr_err(kallsyms size lookup failed for %s replacement\n,func-old_name);return-ENOENT;}}return0;}重点关注klp_init_object_loaded其最关键的点在于klp_write_object_relocations()这里会把热补丁修改所引入的那些非导出符号给解析了可以参考kpatch-build中为什么需要做重定位表的相关文章结合起来一起理解然后再对热补丁涉及的结构做一些初始化。klp_register_patch()主要是做初始化klp_enable_patch()则是完成热补丁使能的关键函数。intklp_enable_patch(structklp_patch*patch){intret;mutex_lock(klp_mutex);if(!klp_is_patch_registered(patch)){ret-EINVAL;gotoerr;}ret__klp_enable_patch(patch);err:mutex_unlock(klp_mutex);returnret;}EXPORT_SYMBOL_GPL(klp_enable_patch);staticint__klp_enable_patch(structklp_patch*patch){structklp_object*obj;intret;if(klp_transition_patch)return-EBUSY;if(WARN_ON(patch-enabled))return-EINVAL;/* enforce stacking: only the first disabled patch can be enabled */if(patch-list.prev!klp_patches!list_prev_entry(patch,list)-enabled)return-EBUSY;/* * A reference is taken on the patch module to prevent it from being * unloaded. */if(!try_module_get(patch-mod))return-ENODEV;pr_notice(enabling patch %s\n,patch-mod-name);klp_init_transition(patch,KLP_PATCHED);// 初始化状态过渡/* * Enforce the order of the func-transition writes in * klp_init_transition() and the ops-func_stack writes in * klp_patch_object(), so that klp_ftrace_handler() will see the * func-transition updates before the handler is registered and the * new funcs become visible to the handler. */smp_wmb();klp_for_each_object(patch,obj){if(!klp_is_object_loaded(obj))continue;retklp_pre_patch_callback(obj);//pre callif(ret){pr_warn(pre-patch callback failed for object %s\n,klp_is_module(obj)?obj-name:vmlinux);gotoerr;}retklp_patch_object(obj);// 对每个对象应用补丁if(ret){pr_warn(failed to patch object %s\n,klp_is_module(obj)?obj-name:vmlinux);gotoerr;}}klp_start_transition();// 开始状态过渡klp_try_complete_transition();// 完成过渡patch-enabledtrue;return0;err:pr_warn(failed to enable patch %s\n,patch-mod-name);klp_cancel_transition();returnret;}使能热补丁的逻辑非常清晰初始化状态过渡调用热补丁的pre call对每个对象应用补丁开始状态过渡完成过渡做清理工作让我们一个个逻辑步骤来看这里以使能热补丁为例。第一步对于初始化状态过渡说白了就是给每个task给上KLP_UNPATCHED这个标志第二步调用热补丁的pre call这个没啥说的第三步对每个对象应用补丁这个调用了ftrace的接口通过ftrace_set_filter_ip()及register_ftrace_function()利用ftrace的机制在钩子函数里面将RIP替换掉从而实现了函数的替换当然这个钩子函数klp_ftrace_handler()里会根据进程的状态current-patch_state确定使用旧的代码还是新的代码详细就不展开了第四步开始状态过渡即klp_start_transition()函数的工作。本质就是给所有进程进程置上TIF_PATCH_PENDING的标签。第五步完成过渡也就是klp_try_complete_transition()函数的工作这块也是klp的核心工作但逻辑也不复杂。绝大部分工作由函数klp_try_switch_task()完成本质上对于非running的task就是通过检查函数栈确定函数的调用链路里面不涉及本次更新的代码详见函数klp_check_stack()就可以让该task度过“klp的过渡状态”清除该task的TIF_PATCH_PENDING并修改task-patch_state。而对于running的task如果这个task就是自己current那也可以做栈的检查但如果不是自己就只能暂时放弃了因为running的task你永远不知道他下一时刻会跑到哪个代码里。嗯那遇到running的task检查不了怎么办呢逻辑也非常简单通过schedule_delayed_work()等一会再做一次检查即可毕竟一个任务总有被CPU调度出去的时候。总之这里遵从的原则就是不能让一个进程即看到旧的代码又看到新的代码。第六步做清理工作具体由klp_complete_transition()函数完成。这里补充一下对于第五步并不单单只有klp的kworker去做检查还有好几个点比如控制流回到用户态的时候函数exit_to_usermode_loop()这里是直接这里可以思考一下如果被打热补丁的函数就是exit_to_usermode_loop()会怎么样系统进入idle的时候这个时候系统也没事情干了不如趁机检查一下能够过渡一下klp的状态同理这里也可以思考一下如果被打热补丁的函数是do_idle()会怎么样4.19.195代码里似乎没有在schedule()函数里面做检查高版本代码里有个klp_sched_try_switch()函数会在schedule()函数里对prev task做检查。看懂了打热补丁的逻辑基本就能理解热补丁的原理了。

深度综述：Effective Harnesses for Long-Running Agents

引言 AI Agent 在处理复杂长期任务时面临重大挑战。即使是当前最强大的语言模型，也常因上下文窗口受限、缺乏跨会话记忆而无法持续推进跨数小时或数天的工作。Anthropic 在 2025 年发布的技术文章《Effective Harnesses for Long-Running Agents》针对这一问题提出了…

2026/6/20 3:23:14 阅读更多

Notepad++高效排版：10倍提升工作效率

引言简要介绍Notepad作为一款免费文本编辑器的优势，以及高效排版对提升工作效率的重要性。Notepad高效排版技巧基础快捷键操作快速选择行：Ctrl L复制/剪切整行：Ctrl D / Ctrl Shift L快速跳转行：Ctrl G多行注释：C…

2026/6/20 20:46:09 阅读更多

2021必修首门CSS架构系统精讲理论+实战玩转蘑菇街百度网盘

在前端开发的职场鄙视链里，存在一个极其普遍的误区：认为电商页面就是“简单的列表详情”，没什么技术含量。殊不知，电商是前端技术最残酷的练兵场：毫秒级的首屏速度、像素级的视觉还原、千人千面的动态布局、以及大促期…

2026/6/20 17:18:27 阅读更多

字节跳动招聘骗局与内部人才绞肉机完整内幕白皮书

字节跳动招聘骗局与内部人才绞肉机完整内幕白皮书字节跳动被曝采用"人才绞肉机"模式：通过虚假高薪承诺吸引优质劳动力，入职后通过高强度加班、绩效压榨和业务快速迭代等手段，在员工28-35岁黄金期最大化榨取其价值。招聘环节存在JD…

2026/6/21 7:32:01 阅读更多

NVIDIA Profile Inspector终极指南：深度解锁显卡隐藏性能的免费专业工具

NVIDIA Profile Inspector终极指南：深度解锁显卡隐藏性能的免费专业工具【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 你是否曾对游戏画面撕裂、输入延迟过高感到烦恼？是否觉得…

2026/6/21 7:30:56 阅读更多

手机号定位神器：如何3秒内完成号码归属地查询与地图精准定位

手机号定位神器：如何3秒内完成号码归属地查询与地图精准定位【免费下载链接】location-to-phone-number This a project to search a location of a specified phone number, and locate the map to the phone number location. 项目地址: https://gitcode.com/g…

2026/6/21 7:30:16 阅读更多

OpenClaw本地AI Agent一键部署实战指南

1. 项目概述：这不是“白嫖”，而是本地AI Agent的平民化落地实践“龙虾白嫖部署教程”这个标题，乍看像网络段子，实则精准击中了当前AI应用落地最真实的痛点——不是模型不够强，而是普通人根本迈不过那道“部署门槛”。所…

2026/6/21 7:29:35 阅读更多

5分钟掌握音乐解锁工具：如何让加密音乐文件自由播放？

5分钟掌握音乐解锁工具：如何让加密音乐文件自由播放？ 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地…

2026/6/21 7:29:14 阅读更多

AI Agent本地化部署实战：从OpenClaw生态看服务编排与中文工程化

1. 项目概述：这不是一个“安装包”，而是一套面向AI Agent开发者的本地化工作流整合方案“openclaw 安装教程 (2026最新5月版)_TopClaw自动部署中文官网满血版龙虾AI”——这个标题里藏着三个被严重误读的关键词：“openclaw”、“TopClaw”和…

2026/6/21 7:28:54 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/21 0:00:02 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/21 0:00:02 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/21 0:00:22 阅读更多

Google AI Studio 300美元额度的真相与实战指南

2026/6/21 0:00:02 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

2026/6/21 0:00:02 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

2026/6/21 0:00:22 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/20 11:30:09 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/20 11:30:15 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/20 11:30:09 阅读更多

相关文章

深度综述：Effective Harnesses for Long-Running Agents

Notepad++高效排版：10倍提升工作效率

2021必修 首门CSS架构系统精讲 理论+实战玩转蘑菇街 百度网盘

字节跳动招聘骗局与内部人才绞肉机完整内幕白皮书

NVIDIA Profile Inspector终极指南：深度解锁显卡隐藏性能的免费专业工具

手机号定位神器：如何3秒内完成号码归属地查询与地图精准定位

OpenClaw本地AI Agent一键部署实战指南

5分钟掌握音乐解锁工具：如何让加密音乐文件自由播放？

AI Agent本地化部署实战：从OpenClaw生态看服务编排与中文工程化

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

2021必修首门CSS架构系统精讲理论+实战玩转蘑菇街百度网盘