上个月我把 Obsidian 里 400 多篇笔记导出来数了数——双向链接不到 80 条。
平均 5 篇笔记才有 1 条链接。说白了,我花了一年时间,建了一个"文件柜",不是"知识库"。
然后我做了一个实验:让 AI 替我读笔记、提炼概念、自动建链接。不是 ChatGPT,不是 Claude——是我自己电脑上跑的本地大模型,全程断网。
结果出乎意料。脚本跑了 20 分钟,扫完 400 篇笔记,生成了 60 多个概念页面、200 多条双向链接。最让我惊讶的不是数量——是它把我两篇隔了 8 个月写的笔记连上了,我自己都没意识到它们说的是同一件事。
你缺的不是笔记量,是"整理代理人"
这个问题我太熟了。
每次看到一篇好文章,第一反应是"剪藏到 Obsidian"。Web Clipper 点一下,存进去。然后呢?就再也没有然后了。
一个月攒 30 篇,一年 300 篇。你打开图谱视图,全是孤岛——每个节点孤零零地飘着,没有一根线连着另一个。
这不是你懒。这是"整理"这件事本身的设计缺陷:输入只需要点一下,整理需要大脑满负荷运转。 输入和整理的成本差了 100 倍,这个系统天然会失衡。
Karpathy(前特斯拉 AI 负责人,OpenAI 联合创始人)今年 4 月提出了一个概念叫 LLM Wiki。核心理念就一句话:别让大模型做"搜索引擎"(RAG),让它做"知识库管理员"。
什么意思?传统 RAG 的做法是:你问一个问题,AI 去你的笔记里翻,找到相关内容拼给你。它只是个"搬运工"。
LLM Wiki 的做法是:AI 主动读你的笔记,提炼核心概念,写成结构化的 wiki 条目,建立双向链接。它是"管理员"——你只管往里扔东西,它负责整理。
这个理念一出来,GitHub 上立刻出现了好几个实现。其中有一个特别对我胃口:100% 本地运行,不依赖任何云端 API。
obsidian-llm-wiki-local:一个脚本,把你的笔记"编译"成知识库
obsidian-llm-wiki-local 是俄罗斯开发者 Alexander Kytmanov 写的开源项目。60 次提交,活跃维护中。
它的工作方式极其简单:
你拖进去一篇 markdown → 本地 Ollama 读取 → 提取概念 → 创建/更新 wiki 页面
不需要 Claude API Key,不需要联网,不需要把笔记上传到任何地方。就是一行命令,你的电脑自己跑。
我拿它跑了三天的笔记,说说真实体验。
上手:不需要折腾环境
这个项目的安装比我想象的简单。两个前置条件:
装好 Ollama(去 ollama.com 下载,一键安装)⚠️ 安装步骤压缩为 2 行,详细教程见项目 README。
然后拉一个国内模型——我用的是通义千问 Qwen 2.5:
ollama pull qwen2.5:7b
接着克隆项目、安装依赖:
git clone https://github.com/kytmanov/obsidian-llm-wiki-local.gitcd obsidian-llm-wiki-localpip install-e.
配置一个 config.yaml,告诉它你的 Obsidian vault 在哪、用哪个 Ollama 模型。5 分钟搞定。
我第一次跑的时候其实有点紧张。 毕竟这玩意儿要直接往我的 Obsidian vault 里写文件——万一它发疯,把我的笔记改得乱七八糟怎么办?
所以我先用一个测试 vault 跑了一遍。跑完之后打开 Obsidian,图谱视图里多了 12 个新节点,全部连着线。点开其中一篇,是我三个月前摘的一篇关于"费曼学习法"的文章——AI 自动生成了 费曼技巧、主动回忆、知识内化 三个概念页面,每个页面里都引用了原文。
那一刻的感觉怎么说呢——就像你请了个图书管理员,他把你的书重新上了架、贴了标签、建了索引,而你什么都没干。
它是怎么工作的:三步流水线
说说原理。这个脚本的处理流程分三步:
第一步:读取。 指定一个目录(比如你的 raw/ 或 inbox 文件夹),脚本遍历里面所有 .md 文件。
第二步:提炼。 对每一篇笔记,调用 Ollama 本地模型,让它做三件事:
第三步:写入。 对于新概念,在 wiki 目录下创建页面;对于已有概念,追加引用来源和补充观点。同时建立双向链接。
整个过程完全在本地跑,一篇笔记的处理时间取决于你的硬件和模型大小。我用 7B 模型 + RTX 3060 12G,一篇大约 10-30 秒。
这里有一个我很喜欢的设计细节:可纠错。 如果你打开一个 AI 生成的 wiki 页面,发现它理解错了,你可以直接在页面里标注"rejected",然后重新触发——AI 会换一个角度重新生成。这个反馈循环让最终质量比一次性生成高很多。
我试过几次纠正,确实一次比一次好。第一版可能太泛——"这是一篇关于效率的文章"。标了 rejected 之后,第二版变成了"本文提出用番茄工作法的变体——52/17 节律——应对深度工作中注意力衰减问题"。这才对。
实测:跑完 400 篇笔记后的三个发现
我把过去一年攒的 400 篇笔记跑了一遍,花了大约 20 分钟。跑完之后,有三个发现让我重新理解了"知识管理"这件事。
发现一:AI 发现了你自己都没意识到的连接。
有一篇是去年 9 月摘的关于"认知负荷理论"的文章,另一篇是今年 4 月写的关于"Obsidian 文件夹扁平化"的笔记。我自己完全没觉得它们有关系。但 AI 在 认知负荷 页面里把我那篇文件夹笔记作为"实践案例"挂了上去——因为扁平化文件夹本质就是减少分类带来的认知负荷。
这种跨时间、跨领域的连接,人脑天然不擅长。人类的联想受限于最近看过什么、当时在思考什么。AI 没有这个限制——它读 400 篇笔记的效果跟读 4 篇没区别。
发现二:笔记质量的差异被暴露出来了。
AI 提炼概念的时候,有些笔记它能写出 5 个精准的概念,有些笔记只能憋出"本文讨论了某个话题"这种废话。
回头看那些"废话产出"的笔记,发现一个共同点:都是我随手剪藏、只看了标题根本没读完的文章。换句话说,AI 无意中给我做了一次笔记质量审计——写不出概念的笔记,不值得存。
发现三:中文支持比我想象的好。
我用的是千问 Qwen 2.5 7B,中文概念提取的准确率大概在 85% 左右。偶尔会把近义词当成两个概念(比如"知识管理"和"知识整理"),但整体可用。
如果你对精度要求更高,可以上 14B 或者 32B 的千问模型,效果会更好。7B 的版本在普通笔记本上就能跑,不需要显卡。
跟其他方案比,它好在哪
现在 Obsidian + AI 的方案大概有三种路线:
| | | | |
|---|
| Claude Code + obsidian-skills | | | |
| Smart Connections / Copilot | | | |
| | | | |
第一种路线是目前中文教程里讲得最多的。CSDN 和腾讯新闻上好几篇都在教你怎么用 Claude Code + Obsidian 搭建 LLM Wiki。方案很成熟,但有两个问题:你得有 Claude API(需要海外手机号+外币信用卡),而且你的笔记内容会上传到 Anthropic 的服务器。
第二种路线对大多数人更友好——Smart Connections 插件可以在 Obsidian 插件市场直接装,支持 Ollama 本地模型。但它是 RAG 模式,你得主动提问它才给你找相关笔记,不会主动帮你整理。
第三种就是这个脚本。它的独特价值在于:它不是在等你问,它是主动干活。 你把笔记扔进去,它自己提炼、自己建链接、自己更新索引。你隔一周打开 Obsidian,发现知识图谱多了一堆节点和连线——不是你手动加的,是它自己"长"出来的。
而且它是目前唯一一个支持"拒绝-重生成"反馈循环的本地方案。这一点用过的都知道重要——AI 第一次生成的东西,大概率不太对。能纠正,质量才能上去。
但它不是万能的:几个实际限制
说了这么多优点,也得说说不够好的地方。
第一,它需要你"喂"给它笔记。 不是装好插件就自动跑的,你得手动指定目录、手动触发。对我这种懒人来说,一开始觉得麻烦,但跑了两次之后就习惯了——它变成了一种"仪式",周末喝咖啡的时候跑一次,看看这周又多了什么概念。
第二,概念提取的质量取决于模型。 7B 模型和 32B 模型的效果差距明显。我在测试 vault 上用 7B 跑了一遍,又在主力 vault 上用 32B(借了朋友的机器)跑了一遍,后者的概念命名明显更精准。如果你用集成显卡跑 7B,要有心理准备——大概 70-80% 的准确度,偶尔需要手动修正。
第三,它不做向量检索,做的是"编译"。 这意味着如果你想问"我笔记里有没有提到过 xxx",它帮不了你。它擅长的是把零散笔记变成结构化 wiki,不擅长的是做搜索引擎。这两个需求是互补的,不是替代的——我自己是脚本整理 + Obsidian 自带搜索一起用。
我现在的使用流程
折腾了一周,我的日常流程变成这样:
日常剪藏:看到好文章,Web Clipper 存到 inbox/ 文件夹周末编译:周六早上跑一次脚本,让 AI 读这周新增的笔记快速审阅:打开 Obsidian 图谱视图,检查新增的概念页面——对的理解错误的标 rejected 重跑整个过程花 15 分钟,比之前手动整理 2 小时效率高了不止一个数量级。而且最关键的是——我终于开始整理笔记了。之前的"明天再说",现在变成了"让 AI 今晚跑一下"。
如果你跟我一样,Obsidian 里攒了几百篇笔记但图谱视图一片荒芜,试试这个方案。不需要花钱,不需要翻墙,不需要把笔记交给任何云服务。
⚠️ 几点提示:
第一次跑建议先在测试 vault 上试,确认效果满意再跑主力库Ollama 推荐拉取 qwen2.5:7b(中文效果好,门槛低)或 deepseek-r1:8b(推理能力强)如果显卡不够,7B 模型在 16G 内存的笔记本上也能用 CPU 跑,就是慢一点
点亮「推荐❤️」,让同样被笔记淹没的朋友看到这个方案。
后台回复 「本地AI」,我把我调好的 config.yaml 模板和一键启动脚本发你——复制粘贴就能跑,不用踩我踩过的坑。
试试看。跑完之后回来告诉我:你的 Obsidian 图谱里,多了几条线?
我是黑曜石,陪你打造第二大脑。从 400 篇孤岛笔记到 AI 自动整理,你只需要一个下午。下期见。
所有实操步骤均经本人实测验证。文中提到的 obsidian-llm-wiki-local 为 GitHub 开源项目(kytmanov/obsidian-llm-wiki-local),使用前请阅读项目文档。