、微信读书、知乎装进 Obsidian：我基于llm-wiki知识中枢搭建实录

发布时间：2026/6/29 18:27:35

为什么需要知识中枢首先, llm-wiki是什么。llm-wiki 是 Andrej Karpathy 在最近提出的一个概念把你过往积累的所有文字材料——笔记、博客、读书摘录、工作日志——作为语料库让 LLM 自动从中提取概念、建立页面、编织交叉引用最终形成一个结构化的、可持续迭代的个人 Wiki。它的核心前提很简单每个人在日常工作和学习中已经产生了大量有结构、有见解的文字只是它们散落在各处缺乏关联。llm-wiki 要做的就是用一个 LLM 驱动的流程把这些散落的珍珠串起来。你负责持续产生和收集内容LLM 负责组织和管理。和传统的手动 Wiki 维护不同——建页面、写摘要、加链接枯燥且难以坚持——llm-wiki 把组织成本降到了几乎为零。你只需要告诉 LLM 你的知识库结构和维护规则即一个 AGENTS.md 文件它就能反复执行摄入、更新、审计等操作。我自己实践下来的感受是看着 AI 把零散笔记变成结构化的交叉引用网络有一种债务清零的快感。数据接入我做的第一件事就是把之前在notion里写的各种笔记有开发知识、投资知识还有各种各样零碎的记录都导出然后放到了obsidian里。如何将 Notion 内容导入 Obsidian实际操作并不复杂核心步骤如下导出 Notion 数据在 Notion 的设置与成员 → 设置中选择导出所有工作区内容格式选Markdown CSV。导出后会得到一个 ZIP 包解压后每个 Notion 页面对应一个.md文件数据库则额外附带 CSV。注意Notion 免费版每次只能导出一个工作区如果你有多个工作区需要分别操作。安装 Obsidian Importer 插件在 Obsidian 社区插件市场搜索Importer并安装。这个插件支持从 Notion、Bear、Evernote、OneNote 等多种工具一键导入会自动处理图片附件和内部链接。启用插件后用CmdP打开命令面板搜索Importer: Open Importer选择 Notion 格式选中刚才解压的文件夹即可。手动导入备选方案如果不使用 Importer 插件直接将解压后的文件夹放入 Obsidian vault 目录即可。Obsidian 原生支持[[wiki-link]]格式的内部链接Notion 导出的 Markdown 中的链接通常已经转换为该格式。后续处理导入后建议将原始文件放入一个专门的子目录比如raw/notion-export/标记为不可修改。这样保留了原始数据的完整性——这是 llm-wiki 方法论中很重要的一环原始素材永不可改LLM 在此基础上生成结构化知识。如果你的 Notion 中有数据库CSV 文件可以作为参考保留如果某些页面嵌入了 Notion 特有的 Block如日历、看板导出后这些会丢失交互性但文本内容会保留。整个流程走下来我几千条分散的笔记就这样汇入了 Obsidian成为了知识中枢的第一批原料。然后将karpathy那篇gist喂给AI, 生成出项目的AGENTS.md文档AI能够自然的写出llm-wiki所需的摄入、审计等操作。接着就可以执行了。看着AI不停的生成wiki内容把我之前的积累分类整理还是非常舒适的。再往后我又做了几件事就是把知乎的创作和微信读书的笔记也纳入进来。知乎上我写了上千篇回答微信读书几年读了上百本书除了笔记之外这些也是我知识体系的重要组成部分。正好差不多那段时间微信读书发布了官方的skill, 我也就顺手用了起来。知乎收藏导入如何将知乎创作同步到 Obsidian知乎没有提供官方的数据导出 API这里我用 Playwright 做了浏览器自动化。操作步骤安装 Playwrightpip install playwright playwright install chromium首次运行脚本在打开的 Chromium 浏览器中扫码或密码登录知乎登录成功后脚本自动遍历个人主页抓取所有回答、文章和想法登录状态持久化保存到本地后续通过--reuse参数静默执行无需再次登录特点增量同步每次只抓取新内容已有文件不重复处理按回答/文章/想法分类存放。微信读书笔记同步如何将微信读书笔记同步到 Obsidian微信读书开放了 Agent API Gateway申请 API Key 后即可调用。操作步骤调用/user/notebooks接口获取有笔记的书籍列表对每本新书分别拉取划线和想法内容按章节分组输出为规范的 Markdown 文件输出格式书名和作者作为标题每章划线以引用块形式列出附带日期笔记和想法附在对应原文下方。特点完全增量同步脚本维护已同步书籍 ID 的状态文件每次运行只处理新增的书籍。151 本书的笔记就这样悄无声息地流入了 Obsidian成为了知识中枢最丰富的一批原料。LLM Wiki 智能检索到此内容层的准备基本就完成了。然后我又想既然我大部分的知识和创作都在这儿了是不是可以开始蒸馏我这个人了这块先搞了一版简单的就是把拆分出一个和wiki类似的personal流程也有ingest、lint等流程区别就是wiki的重点是知识而personal的重点是我这个人。知识库 vs 人格蒸馏两种不同的 AI 处理逻辑这里有必要解释一下两者的区别——它们共享同一套原始素材但目标和产出完全不同。知识库Wiki回答我知道什么从笔记、博客和读书摘录中提取客观知识生成概念页面如分布式一致性、实体页面如Raft 算法、来源摘要页面如《数据密集型应用设计》读书笔记并在它们之间建立密集的交叉引用。目标是让知识变得可查询、可复用像一个外部化的第二大脑。人格蒸馏Personal Model回答我是谁从创作和阅读中反向推导认知模式、表达风格和价值取向。例如通过分析技术博客可以归纳出论点先行、案例驱动的表达风格通过分析知乎回答可以发现第一性原理还原和量化思维等反复出现的认知特征。产出不是知识条目而是一个人的认知图谱——擅长什么、怎么思考、看重什么。两者的异同维度知识库人格蒸馏核心问题我知道什么我是谁输入笔记、博客、读书摘录一切个人创作和阅读记录产出概念/实体/来源页面交叉引用领域深度/认知特征/表达风格/价值观方向向外看结构化外部知识向内看建模个人认知流程摄入 → 查询 → Lint → 审计摄入 → 查询 → Lint → 审计同构两者在流程上高度相似但一个是向外看结构化和整理你拥有的知识一个是向内看蒸馏和建模你作为个体的认知特征。这种一体两面的设计是我觉得整个系统最有意思的地方。这块最近还在看网上的女娲等项目想看看有没有更好的蒸馏人格的方法。效果与心得以上就是近期关于知识库的一些实录有想法欢迎交流。常见问题Q: Obsidian 适合程序员做知识管理吗非常适合。Obsidian 的核心理念——本地 Markdown 文件、双向链接、图谱可视化——天然契合程序员的使用习惯。Markdown 语法你本来就会文件存储在本地意味着数据完全可控、可以用 Git 做版本管理双向链接让你能像管理代码依赖一样管理知识之间的引用关系。加上 llm-wiki 的思路AI 可以自动帮你从散落的笔记中提取概念、建立页面和交叉引用把零散文档变成结构化的知识网络。Q: LLM Wiki 需要 GPU 吗不需要自己部署 GPU。LLM Wiki 的核心理念是让 LLM 处理你的文本而不是让你自己跑模型。你只需要调用大模型的 API云端推理用它来读取你的 Markdown 文件、提取概念、生成页面和交叉引用。这个过程走的是云端 API不需要本地 GPU。实际上整个流程的硬件只需要 Obsidian 和一个能调用 LLM API 的工具如 WorkBuddy 等 Agent。Q: llm-wiki 和传统 Wiki 有什么区别传统 Wiki 需要你手动创建页面、写摘要、添加内部链接维护成本高且难以坚持。llm-wiki 把组织成本降到了几乎为零——你只需要继续产生和收集文字内容LLM 自动读取你的 AGENTS.md 规则反复执行摄入、更新、审计等操作生成结构化的交叉引用网络。换句话说传统 Wiki 是你组织知识llm-wiki 是AI 帮你组织知识。Q: 知识蒸馏和人格蒸馏有什么不同两者共享同一套原始素材但目标和产出完全不同。知识库Wiki回答我知道什么——从笔记和读书摘录中提取客观知识生成概念页面和交叉引用。人格蒸馏Personal Model回答我是谁——从创作和阅读记录中反向推导你的认知模式、表达风格和价值取向。一个向外看结构化知识一个向内看建模个人认知流程相似但方向相反。快速上手步骤安装 Obsidian从 obsidian.md 下载客户端创建本地 Vault知识库即为一个本地文件夹。配置 LLM Wiki在 Vault 根目录创建AGENTS.md参照 karpathy 的 llm-wiki 思路编写知识维护规则包括摄入ingest、更新、审计audit等流程定义。让 AI 工具读取该文件自动从原始笔记中提取概念、建立交叉引用。

防窜货管理系统技术实现：电子围栏与AI行为分析实战防窜货,渠道管理,AI行为分析,电子围栏

## 一、防窜货的技术挑战窜货是快消品行业最头疼的渠道问题。数字化防窜货系统通过"一物一码"让每件产品追溯到最终销售区域。核心挑战：如何精准定位扫码位置、如何区分正常流动和恶意窜货、如何在海量数据中实时发现异常。## 二、电子围栏：LB…

2026/6/29 18:27:14 阅读更多

AI编程实战：如何开发一个谷歌浏览器插件，并上架 Chrome 商店？

AI编程实战：如何开发一个谷歌浏览器插件，并上架 Chrome 商店？ 本文适合：第一次用 AI 开发浏览器插件，并准备上架 Chrome 商店的人。文章目录AI编程实战：如何开发一个谷歌浏览器插件，并上架 Chr…

2026/6/29 18:26:54 阅读更多

7种客户知识分享策略，Baklib同源多站发布让效率翻倍

7种客户知识分享策略，Baklib同源多站发布让效率翻倍我见过太多公司，把客户知识分享当成一个简单的 FAQ 页面或者一个帮助中心链接。但真正有效的客户内容体验解决方案，是让客户在任何触点都能自助找到答案，减少对客服的依赖&#…

2026/6/29 18:26:33 阅读更多

VinXiangQi：基于YOLOv5的象棋AI连线工具完整指南

VinXiangQi：基于YOLOv5的象棋AI连线工具完整指南【免费下载链接】VinXiangQi Xiangqi syncing tool based on Yolov5 / 基于Yolov5的中国象棋连线工具项目地址: https://gitcode.com/gh_mirrors/vi/VinXiangQi 想要在象棋对弈中获得AI智能辅助吗&#xff1…

2026/6/29 19:52:50 阅读更多

【2026最新】WPS2025下载保姆级安装图文教程（全网最详细）【附安装包+长期使用】

文章目录前言WPS2025安装前的准备WPS2025安装包下载WPS2025 安装教程（图文详解）WPS2025基础功能详解：文字、表格、演示三大组件快速上手前言 WPS2025的安装流程本身不算复杂，但网上很多教程写得比较跳跃，新手跟着做容…

2026/6/29 19:51:48 阅读更多

QKeyMapper：5分钟解决你的Windows按键映射烦恼，手柄玩PC游戏不是梦！

QKeyMapper：5分钟解决你的Windows按键映射烦恼，手柄玩PC游戏不是梦！ 【免费下载链接】QKeyMapper [按键映射工具] QKeyMapper，Qt开发Win10&Win11可用，不修改注册表、不需重新启动系统，可立即生效和停止…

2026/6/29 19:51:48 阅读更多

【Web基础】HTTPS详解

目录一. HTTPS是什么二. 加密是什么加密算法三. HTTPS的工作过程引入对称加密引入非对称加密为什么不只使用非对称加密传输数据？ 中间人攻击引入证书证书是什么？ 引入证书后的工作流程常见问题 1. 黑客能否修改证书中的公钥&…

2026/6/29 19:50:46 阅读更多

Docker化部署Snipe-IT实战：从零配置到QQ邮箱集成与排错

1. Docker环境准备与安装在开始部署Snipe-IT之前，我们需要先搭建好Docker运行环境。这里以CentOS系统为例，分享我多次实战验证过的安装流程。相比官方文档，我会补充几个国内开发者常遇到的坑点。首先更新系统基础工具包，这个步骤…

2026/6/29 19:50:02 阅读更多

基于ruoyi-vue-pro的企业级技术架构深度解析与实战指南

基于ruoyi-vue-pro的企业级技术架构深度解析与实战指南【免费下载链接】ruoyi-vue-pro 🔥 官方推荐 🔥 RuoYi-Vue 全新 Pro 版本，优化重构所有功能。基于 Spring Boot MyBatis Plus Vue & Element 实现的后台管理系统微信小程序&…

2026/6/29 19:49:42 阅读更多

Java开发者转型安全开发：从代码审计到自动化工具实践

1. 转型背景与核心驱动力最近几年，身边不少做Java后端开发的朋友，都开始或多或少地关注起安全开发这个方向。我自己也是从写了七八年Java业务代码，一步步转向了安全领域，现在主要做代码审计和自动化安全工具开发。这个转变不是一时…

2026/6/29 0:00:05 阅读更多

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证” 开篇故事去年夏天，我正帮一家金融科技公司优化他们的TEE内Wasm沙箱。他们的核心业务是在Intel SGX enclave里运行用户提交的Wasm合约，用于实时交易验证。一天下午，运维突然报警：生产环境的enclave进程频繁崩…

2026/6/29 0:00:05 阅读更多

YAML函数动态解析：打造智能接口自动化测试用例

1. 项目概述：为什么YAML测试用例需要函数动态解析？在接口自动化测试的实践中，我们常常会面临一个核心矛盾：测试用例的可维护性与灵活性。早期的测试脚本，无论是用Python的unittest还是pytest，往往将测试数据…

2026/6/29 0:00:05 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/29 0:00:05 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/29 1:23:10 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/29 1:23:10 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/29 13:06:32 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/29 13:32:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/29 13:32:14 阅读更多

相关文章

防窜货管理系统技术实现：电子围栏与AI行为分析实战防窜货,渠道管理,AI行为分析,电子围栏

AI编程实战：如何开发一个谷歌浏览器插件，并上架 Chrome 商店？

7种客户知识分享策略，Baklib同源多站发布让效率翻倍

VinXiangQi：基于YOLOv5的象棋AI连线工具完整指南

【2026最新】WPS2025下载保姆级安装图文教程（全网最详细）【附安装包+长期使用】

QKeyMapper：5分钟解决你的Windows按键映射烦恼，手柄玩PC游戏不是梦！

【Web基础】HTTPS详解

Docker化部署Snipe-IT实战：从零配置到QQ邮箱集成与排错

基于ruoyi-vue-pro的企业级技术架构深度解析与实战指南

Java开发者转型安全开发：从代码审计到自动化工具实践

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

YAML函数动态解析：打造智能接口自动化测试用例

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因