为什么需要知识中枢首先, llm-wiki是什么。llm-wiki 是 Andrej Karpathy 在 最近提出的一个概念把你过往积累的所有文字材料——笔记、博客、读书摘录、工作日志——作为语料库让 LLM 自动从中提取概念、建立页面、编织交叉引用最终形成一个结构化的、可持续迭代的个人 Wiki。它的核心前提很简单每个人在日常工作和学习中已经产生了大量有结构、有见解的文字只是它们散落在各处缺乏关联。llm-wiki 要做的就是用一个 LLM 驱动的流程把这些散落的珍珠串起来。你负责持续产生和收集内容LLM 负责组织和管理。和传统的手动 Wiki 维护不同——建页面、写摘要、加链接枯燥且难以坚持——llm-wiki 把组织成本降到了几乎为零。你只需要告诉 LLM 你的知识库结构和维护规则即一个 AGENTS.md 文件它就能反复执行摄入、更新、审计等操作。我自己实践下来的感受是看着 AI 把零散笔记变成结构化的交叉引用网络有一种债务清零的快感。数据接入我做的第一件事就是把之前在notion里写的各种笔记有开发知识、投资知识还有各种各样零碎的记录都导出然后放到了obsidian里。如何将 Notion 内容导入 Obsidian实际操作并不复杂核心步骤如下导出 Notion 数据在 Notion 的设置与成员 → 设置中选择导出所有工作区内容格式选Markdown CSV。导出后会得到一个 ZIP 包解压后每个 Notion 页面对应一个.md文件数据库则额外附带 CSV。注意Notion 免费版每次只能导出一个工作区如果你有多个工作区需要分别操作。安装 Obsidian Importer 插件在 Obsidian 社区插件市场搜索Importer并安装。这个插件支持从 Notion、Bear、Evernote、OneNote 等多种工具一键导入会自动处理图片附件和内部链接。启用插件后用CmdP打开命令面板搜索Importer: Open Importer选择 Notion 格式选中刚才解压的文件夹即可。手动导入备选方案如果不使用 Importer 插件直接将解压后的文件夹放入 Obsidian vault 目录即可。Obsidian 原生支持[[wiki-link]]格式的内部链接Notion 导出的 Markdown 中的链接通常已经转换为该格式。后续处理导入后建议将原始文件放入一个专门的子目录比如raw/notion-export/标记为不可修改。这样保留了原始数据的完整性——这是 llm-wiki 方法论中很重要的一环原始素材永不可改LLM 在此基础上生成结构化知识。如果你的 Notion 中有数据库CSV 文件可以作为参考保留如果某些页面嵌入了 Notion 特有的 Block如日历、看板导出后这些会丢失交互性但文本内容会保留。整个流程走下来我几千条分散的笔记就这样汇入了 Obsidian成为了知识中枢的第一批原料。然后将karpathy那篇gist喂给AI, 生成出项目的AGENTS.md文档AI能够自然的写出llm-wiki所需的摄入、审计等操作。接着就可以执行了。看着AI不停的生成wiki内容把我之前的积累分类整理还是非常舒适的。再往后我又做了几件事就是把知乎的创作和微信读书的笔记也纳入进来。知乎上我写了上千篇回答微信读书几年读了上百本书除了笔记之外这些也是我知识体系的重要组成部分。正好差不多那段时间微信读书发布了官方的skill, 我也就顺手用了起来。知乎收藏导入如何将知乎创作同步到 Obsidian知乎没有提供官方的数据导出 API这里我用 Playwright 做了浏览器自动化。操作步骤安装 Playwrightpip install playwright playwright install chromium首次运行脚本在打开的 Chromium 浏览器中扫码或密码登录知乎登录成功后脚本自动遍历个人主页抓取所有回答、文章和想法登录状态持久化保存到本地后续通过--reuse参数静默执行无需再次登录特点增量同步每次只抓取新内容已有文件不重复处理按回答/文章/想法分类存放。微信读书笔记同步如何将微信读书笔记同步到 Obsidian微信读书开放了 Agent API Gateway申请 API Key 后即可调用。操作步骤调用/user/notebooks接口获取有笔记的书籍列表对每本新书分别拉取划线和想法内容按章节分组输出为规范的 Markdown 文件输出格式书名和作者作为标题每章划线以引用块形式列出附带日期笔记和想法附在对应原文下方。特点完全增量同步脚本维护已同步书籍 ID 的状态文件每次运行只处理新增的书籍。151 本书的笔记就这样悄无声息地流入了 Obsidian成为了知识中枢最丰富的一批原料。LLM Wiki 智能检索到此内容层的准备基本就完成了。然后我又想既然我大部分的知识和创作都在这儿了是不是可以开始蒸馏我这个人了这块先搞了一版简单的就是把拆分出一个和wiki类似的personal流程也有ingest、lint等流程区别就是wiki的重点是知识而personal的重点是我这个人。知识库 vs 人格蒸馏两种不同的 AI 处理逻辑这里有必要解释一下两者的区别——它们共享同一套原始素材但目标和产出完全不同。知识库Wiki回答我知道什么从笔记、博客和读书摘录中提取客观知识生成概念页面如分布式一致性、实体页面如Raft 算法、来源摘要页面如《数据密集型应用设计》读书笔记并在它们之间建立密集的交叉引用。目标是让知识变得可查询、可复用像一个外部化的第二大脑。人格蒸馏Personal Model回答我是谁从创作和阅读中反向推导认知模式、表达风格和价值取向。例如通过分析技术博客可以归纳出论点先行、案例驱动的表达风格通过分析知乎回答可以发现第一性原理还原和量化思维等反复出现的认知特征。产出不是知识条目而是一个人的认知图谱——擅长什么、怎么思考、看重什么。两者的异同维度知识库人格蒸馏核心问题我知道什么我是谁输入笔记、博客、读书摘录一切个人创作和阅读记录产出概念/实体/来源页面 交叉引用领域深度/认知特征/表达风格/价值观方向向外看结构化外部知识向内看建模个人认知流程摄入 → 查询 → Lint → 审计摄入 → 查询 → Lint → 审计同构两者在流程上高度相似但一个是向外看结构化和整理你拥有的知识一个是向内看蒸馏和建模你作为个体的认知特征。这种一体两面的设计是我觉得整个系统最有意思的地方。这块最近还在看网上的女娲等项目想看看有没有更好的蒸馏人格的方法。效果与心得以上就是近期关于知识库的一些实录有想法欢迎交流。常见问题Q: Obsidian 适合程序员做知识管理吗非常适合。Obsidian 的核心理念——本地 Markdown 文件、双向链接、图谱可视化——天然契合程序员的使用习惯。Markdown 语法你本来就会文件存储在本地意味着数据完全可控、可以用 Git 做版本管理双向链接让你能像管理代码依赖一样管理知识之间的引用关系。加上 llm-wiki 的思路AI 可以自动帮你从散落的笔记中提取概念、建立页面和交叉引用把零散文档变成结构化的知识网络。Q: LLM Wiki 需要 GPU 吗不需要自己部署 GPU。LLM Wiki 的核心理念是让 LLM 处理你的文本而不是让你自己跑模型。你只需要调用大模型的 API云端推理用它来读取你的 Markdown 文件、提取概念、生成页面和交叉引用。这个过程走的是云端 API不需要本地 GPU。实际上整个流程的硬件只需要 Obsidian 和一个能调用 LLM API 的工具如 WorkBuddy 等 Agent。Q: llm-wiki 和传统 Wiki 有什么区别传统 Wiki 需要你手动创建页面、写摘要、添加内部链接维护成本高且难以坚持。llm-wiki 把组织成本降到了几乎为零——你只需要继续产生和收集文字内容LLM 自动读取你的 AGENTS.md 规则反复执行摄入、更新、审计等操作生成结构化的交叉引用网络。换句话说传统 Wiki 是你组织知识llm-wiki 是AI 帮你组织知识。Q: 知识蒸馏和人格蒸馏有什么不同两者共享同一套原始素材但目标和产出完全不同。知识库Wiki回答我知道什么——从笔记和读书摘录中提取客观知识生成概念页面和交叉引用。人格蒸馏Personal Model回答我是谁——从创作和阅读记录中反向推导你的认知模式、表达风格和价值取向。一个向外看结构化知识一个向内看建模个人认知流程相似但方向相反。快速上手步骤安装 Obsidian从 obsidian.md 下载客户端创建本地 Vault知识库即为一个本地文件夹。配置 LLM Wiki在 Vault 根目录创建AGENTS.md参照 karpathy 的 llm-wiki 思路编写知识维护规则包括摄入ingest、更新、审计audit等流程定义。让 AI 工具读取该文件自动从原始笔记中提取概念、建立交叉引用。
、微信读书、知乎装进 Obsidian:我基于llm-wiki知识中枢搭建实录
发布时间:2026/6/29 18:27:35
为什么需要知识中枢首先, llm-wiki是什么。llm-wiki 是 Andrej Karpathy 在 最近提出的一个概念把你过往积累的所有文字材料——笔记、博客、读书摘录、工作日志——作为语料库让 LLM 自动从中提取概念、建立页面、编织交叉引用最终形成一个结构化的、可持续迭代的个人 Wiki。它的核心前提很简单每个人在日常工作和学习中已经产生了大量有结构、有见解的文字只是它们散落在各处缺乏关联。llm-wiki 要做的就是用一个 LLM 驱动的流程把这些散落的珍珠串起来。你负责持续产生和收集内容LLM 负责组织和管理。和传统的手动 Wiki 维护不同——建页面、写摘要、加链接枯燥且难以坚持——llm-wiki 把组织成本降到了几乎为零。你只需要告诉 LLM 你的知识库结构和维护规则即一个 AGENTS.md 文件它就能反复执行摄入、更新、审计等操作。我自己实践下来的感受是看着 AI 把零散笔记变成结构化的交叉引用网络有一种债务清零的快感。数据接入我做的第一件事就是把之前在notion里写的各种笔记有开发知识、投资知识还有各种各样零碎的记录都导出然后放到了obsidian里。如何将 Notion 内容导入 Obsidian实际操作并不复杂核心步骤如下导出 Notion 数据在 Notion 的设置与成员 → 设置中选择导出所有工作区内容格式选Markdown CSV。导出后会得到一个 ZIP 包解压后每个 Notion 页面对应一个.md文件数据库则额外附带 CSV。注意Notion 免费版每次只能导出一个工作区如果你有多个工作区需要分别操作。安装 Obsidian Importer 插件在 Obsidian 社区插件市场搜索Importer并安装。这个插件支持从 Notion、Bear、Evernote、OneNote 等多种工具一键导入会自动处理图片附件和内部链接。启用插件后用CmdP打开命令面板搜索Importer: Open Importer选择 Notion 格式选中刚才解压的文件夹即可。手动导入备选方案如果不使用 Importer 插件直接将解压后的文件夹放入 Obsidian vault 目录即可。Obsidian 原生支持[[wiki-link]]格式的内部链接Notion 导出的 Markdown 中的链接通常已经转换为该格式。后续处理导入后建议将原始文件放入一个专门的子目录比如raw/notion-export/标记为不可修改。这样保留了原始数据的完整性——这是 llm-wiki 方法论中很重要的一环原始素材永不可改LLM 在此基础上生成结构化知识。如果你的 Notion 中有数据库CSV 文件可以作为参考保留如果某些页面嵌入了 Notion 特有的 Block如日历、看板导出后这些会丢失交互性但文本内容会保留。整个流程走下来我几千条分散的笔记就这样汇入了 Obsidian成为了知识中枢的第一批原料。然后将karpathy那篇gist喂给AI, 生成出项目的AGENTS.md文档AI能够自然的写出llm-wiki所需的摄入、审计等操作。接着就可以执行了。看着AI不停的生成wiki内容把我之前的积累分类整理还是非常舒适的。再往后我又做了几件事就是把知乎的创作和微信读书的笔记也纳入进来。知乎上我写了上千篇回答微信读书几年读了上百本书除了笔记之外这些也是我知识体系的重要组成部分。正好差不多那段时间微信读书发布了官方的skill, 我也就顺手用了起来。知乎收藏导入如何将知乎创作同步到 Obsidian知乎没有提供官方的数据导出 API这里我用 Playwright 做了浏览器自动化。操作步骤安装 Playwrightpip install playwright playwright install chromium首次运行脚本在打开的 Chromium 浏览器中扫码或密码登录知乎登录成功后脚本自动遍历个人主页抓取所有回答、文章和想法登录状态持久化保存到本地后续通过--reuse参数静默执行无需再次登录特点增量同步每次只抓取新内容已有文件不重复处理按回答/文章/想法分类存放。微信读书笔记同步如何将微信读书笔记同步到 Obsidian微信读书开放了 Agent API Gateway申请 API Key 后即可调用。操作步骤调用/user/notebooks接口获取有笔记的书籍列表对每本新书分别拉取划线和想法内容按章节分组输出为规范的 Markdown 文件输出格式书名和作者作为标题每章划线以引用块形式列出附带日期笔记和想法附在对应原文下方。特点完全增量同步脚本维护已同步书籍 ID 的状态文件每次运行只处理新增的书籍。151 本书的笔记就这样悄无声息地流入了 Obsidian成为了知识中枢最丰富的一批原料。LLM Wiki 智能检索到此内容层的准备基本就完成了。然后我又想既然我大部分的知识和创作都在这儿了是不是可以开始蒸馏我这个人了这块先搞了一版简单的就是把拆分出一个和wiki类似的personal流程也有ingest、lint等流程区别就是wiki的重点是知识而personal的重点是我这个人。知识库 vs 人格蒸馏两种不同的 AI 处理逻辑这里有必要解释一下两者的区别——它们共享同一套原始素材但目标和产出完全不同。知识库Wiki回答我知道什么从笔记、博客和读书摘录中提取客观知识生成概念页面如分布式一致性、实体页面如Raft 算法、来源摘要页面如《数据密集型应用设计》读书笔记并在它们之间建立密集的交叉引用。目标是让知识变得可查询、可复用像一个外部化的第二大脑。人格蒸馏Personal Model回答我是谁从创作和阅读中反向推导认知模式、表达风格和价值取向。例如通过分析技术博客可以归纳出论点先行、案例驱动的表达风格通过分析知乎回答可以发现第一性原理还原和量化思维等反复出现的认知特征。产出不是知识条目而是一个人的认知图谱——擅长什么、怎么思考、看重什么。两者的异同维度知识库人格蒸馏核心问题我知道什么我是谁输入笔记、博客、读书摘录一切个人创作和阅读记录产出概念/实体/来源页面 交叉引用领域深度/认知特征/表达风格/价值观方向向外看结构化外部知识向内看建模个人认知流程摄入 → 查询 → Lint → 审计摄入 → 查询 → Lint → 审计同构两者在流程上高度相似但一个是向外看结构化和整理你拥有的知识一个是向内看蒸馏和建模你作为个体的认知特征。这种一体两面的设计是我觉得整个系统最有意思的地方。这块最近还在看网上的女娲等项目想看看有没有更好的蒸馏人格的方法。效果与心得以上就是近期关于知识库的一些实录有想法欢迎交流。常见问题Q: Obsidian 适合程序员做知识管理吗非常适合。Obsidian 的核心理念——本地 Markdown 文件、双向链接、图谱可视化——天然契合程序员的使用习惯。Markdown 语法你本来就会文件存储在本地意味着数据完全可控、可以用 Git 做版本管理双向链接让你能像管理代码依赖一样管理知识之间的引用关系。加上 llm-wiki 的思路AI 可以自动帮你从散落的笔记中提取概念、建立页面和交叉引用把零散文档变成结构化的知识网络。Q: LLM Wiki 需要 GPU 吗不需要自己部署 GPU。LLM Wiki 的核心理念是让 LLM 处理你的文本而不是让你自己跑模型。你只需要调用大模型的 API云端推理用它来读取你的 Markdown 文件、提取概念、生成页面和交叉引用。这个过程走的是云端 API不需要本地 GPU。实际上整个流程的硬件只需要 Obsidian 和一个能调用 LLM API 的工具如 WorkBuddy 等 Agent。Q: llm-wiki 和传统 Wiki 有什么区别传统 Wiki 需要你手动创建页面、写摘要、添加内部链接维护成本高且难以坚持。llm-wiki 把组织成本降到了几乎为零——你只需要继续产生和收集文字内容LLM 自动读取你的 AGENTS.md 规则反复执行摄入、更新、审计等操作生成结构化的交叉引用网络。换句话说传统 Wiki 是你组织知识llm-wiki 是AI 帮你组织知识。Q: 知识蒸馏和人格蒸馏有什么不同两者共享同一套原始素材但目标和产出完全不同。知识库Wiki回答我知道什么——从笔记和读书摘录中提取客观知识生成概念页面和交叉引用。人格蒸馏Personal Model回答我是谁——从创作和阅读记录中反向推导你的认知模式、表达风格和价值取向。一个向外看结构化知识一个向内看建模个人认知流程相似但方向相反。快速上手步骤安装 Obsidian从 obsidian.md 下载客户端创建本地 Vault知识库即为一个本地文件夹。配置 LLM Wiki在 Vault 根目录创建AGENTS.md参照 karpathy 的 llm-wiki 思路编写知识维护规则包括摄入ingest、更新、审计audit等流程定义。让 AI 工具读取该文件自动从原始笔记中提取概念、建立交叉引用。