当前位置：首页>python>一个Python脚本,让你的Obsidian自己＂长＂出知识图谱|Ollama本地免费方案

一个Python脚本,让你的Obsidian自己＂长＂出知识图谱|Ollama本地免费方案

2026-07-02 16:39:07

上个月我把 Obsidian 里 400 多篇笔记导出来数了数——双向链接不到 80 条。

平均 5 篇笔记才有 1 条链接。说白了，我花了一年时间，建了一个"文件柜"，不是"知识库"。

然后我做了一个实验：让 AI 替我读笔记、提炼概念、自动建链接。不是 ChatGPT，不是 Claude——是我自己电脑上跑的本地大模型，全程断网。

结果出乎意料。脚本跑了 20 分钟，扫完 400 篇笔记，生成了 60 多个概念页面、200 多条双向链接。最让我惊讶的不是数量——是它把我两篇隔了 8 个月写的笔记连上了，我自己都没意识到它们说的是同一件事。

你缺的不是笔记量，是"整理代理人"

这个问题我太熟了。

每次看到一篇好文章，第一反应是"剪藏到 Obsidian"。Web Clipper 点一下，存进去。然后呢？就再也没有然后了。

一个月攒 30 篇，一年 300 篇。你打开图谱视图，全是孤岛——每个节点孤零零地飘着，没有一根线连着另一个。

这不是你懒。这是"整理"这件事本身的设计缺陷：输入只需要点一下，整理需要大脑满负荷运转。 输入和整理的成本差了 100 倍，这个系统天然会失衡。

Karpathy（前特斯拉 AI 负责人，OpenAI 联合创始人）今年 4 月提出了一个概念叫 LLM Wiki。核心理念就一句话：别让大模型做"搜索引擎"（RAG），让它做"知识库管理员"。

什么意思？传统 RAG 的做法是：你问一个问题，AI 去你的笔记里翻，找到相关内容拼给你。它只是个"搬运工"。

LLM Wiki 的做法是：AI 主动读你的笔记，提炼核心概念，写成结构化的 wiki 条目，建立双向链接。它是"管理员"——你只管往里扔东西，它负责整理。

这个理念一出来，GitHub 上立刻出现了好几个实现。其中有一个特别对我胃口：100% 本地运行，不依赖任何云端 API。

obsidian-llm-wiki-local：一个脚本，把你的笔记"编译"成知识库

obsidian-llm-wiki-local 是俄罗斯开发者 Alexander Kytmanov 写的开源项目。60 次提交，活跃维护中。

它的工作方式极其简单：


你拖进去一篇 markdown → 本地 Ollama 读取 → 提取概念 → 创建/更新 wiki 页面

不需要 Claude API Key，不需要联网，不需要把笔记上传到任何地方。就是一行命令，你的电脑自己跑。

我拿它跑了三天的笔记，说说真实体验。

上手：不需要折腾环境

这个项目的安装比我想象的简单。两个前置条件：

装好 Ollama（去 ollama.com 下载，一键安装）

装好 Python 3.10+

⚠️ 安装步骤压缩为 2 行，详细教程见项目 README。

然后拉一个国内模型——我用的是通义千问 Qwen 2.5：


ollama pull qwen2.5:7b

接着克隆项目、安装依赖：


git clone https://github.com/kytmanov/obsidian-llm-wiki-local.gitcd obsidian-llm-wiki-localpip install-e.

配置一个 config.yaml，告诉它你的 Obsidian vault 在哪、用哪个 Ollama 模型。5 分钟搞定。

我第一次跑的时候其实有点紧张。 毕竟这玩意儿要直接往我的 Obsidian vault 里写文件——万一它发疯，把我的笔记改得乱七八糟怎么办？

所以我先用一个测试 vault 跑了一遍。跑完之后打开 Obsidian，图谱视图里多了 12 个新节点，全部连着线。点开其中一篇，是我三个月前摘的一篇关于"费曼学习法"的文章——AI 自动生成了费曼技巧、主动回忆、知识内化三个概念页面，每个页面里都引用了原文。

那一刻的感觉怎么说呢——就像你请了个图书管理员，他把你的书重新上了架、贴了标签、建了索引，而你什么都没干。

它是怎么工作的：三步流水线

说说原理。这个脚本的处理流程分三步：

第一步：读取。 指定一个目录（比如你的 raw/ 或 inbox 文件夹），脚本遍历里面所有 .md 文件。

第二步：提炼。 对每一篇笔记，调用 Ollama 本地模型，让它做三件事：

第三步：写入。 对于新概念，在 wiki 目录下创建页面；对于已有概念，追加引用来源和补充观点。同时建立双向链接。

整个过程完全在本地跑，一篇笔记的处理时间取决于你的硬件和模型大小。我用 7B 模型 + RTX 3060 12G，一篇大约 10-30 秒。

这里有一个我很喜欢的设计细节：可纠错。 如果你打开一个 AI 生成的 wiki 页面，发现它理解错了，你可以直接在页面里标注"rejected"，然后重新触发——AI 会换一个角度重新生成。这个反馈循环让最终质量比一次性生成高很多。

我试过几次纠正，确实一次比一次好。第一版可能太泛——"这是一篇关于效率的文章"。标了 rejected 之后，第二版变成了"本文提出用番茄工作法的变体——52/17 节律——应对深度工作中注意力衰减问题"。这才对。

实测：跑完 400 篇笔记后的三个发现

我把过去一年攒的 400 篇笔记跑了一遍，花了大约 20 分钟。跑完之后，有三个发现让我重新理解了"知识管理"这件事。

发现一：AI 发现了你自己都没意识到的连接。

有一篇是去年 9 月摘的关于"认知负荷理论"的文章，另一篇是今年 4 月写的关于"Obsidian 文件夹扁平化"的笔记。我自己完全没觉得它们有关系。但 AI 在认知负荷页面里把我那篇文件夹笔记作为"实践案例"挂了上去——因为扁平化文件夹本质就是减少分类带来的认知负荷。

这种跨时间、跨领域的连接，人脑天然不擅长。人类的联想受限于最近看过什么、当时在思考什么。AI 没有这个限制——它读 400 篇笔记的效果跟读 4 篇没区别。

发现二：笔记质量的差异被暴露出来了。

AI 提炼概念的时候，有些笔记它能写出 5 个精准的概念，有些笔记只能憋出"本文讨论了某个话题"这种废话。

回头看那些"废话产出"的笔记，发现一个共同点：都是我随手剪藏、只看了标题根本没读完的文章。换句话说，AI 无意中给我做了一次笔记质量审计——写不出概念的笔记，不值得存。

发现三：中文支持比我想象的好。

我用的是千问 Qwen 2.5 7B，中文概念提取的准确率大概在 85% 左右。偶尔会把近义词当成两个概念（比如"知识管理"和"知识整理"），但整体可用。

如果你对精度要求更高，可以上 14B 或者 32B 的千问模型，效果会更好。7B 的版本在普通笔记本上就能跑，不需要显卡。

跟其他方案比，它好在哪

现在 Obsidian + AI 的方案大概有三种路线：

路线	代表方案	引擎	数据在哪	费用
云端 API	Claude Code + obsidian-skills	Claude API	上传到 Anthropic	按量付费
插件内嵌	Smart Connections / Copilot	API 或本地	本地	嵌入免费/API付费
纯本地脚本	obsidian-llm-wiki-local	本地 Ollama	完全本地	免费

第一种路线是目前中文教程里讲得最多的。CSDN 和腾讯新闻上好几篇都在教你怎么用 Claude Code + Obsidian 搭建 LLM Wiki。方案很成熟，但有两个问题：你得有 Claude API（需要海外手机号+外币信用卡），而且你的笔记内容会上传到 Anthropic 的服务器。

第二种路线对大多数人更友好——Smart Connections 插件可以在 Obsidian 插件市场直接装，支持 Ollama 本地模型。但它是 RAG 模式，你得主动提问它才给你找相关笔记，不会主动帮你整理。

第三种就是这个脚本。它的独特价值在于：它不是在等你问，它是主动干活。 你把笔记扔进去，它自己提炼、自己建链接、自己更新索引。你隔一周打开 Obsidian，发现知识图谱多了一堆节点和连线——不是你手动加的，是它自己"长"出来的。

而且它是目前唯一一个支持"拒绝-重生成"反馈循环的本地方案。这一点用过的都知道重要——AI 第一次生成的东西，大概率不太对。能纠正，质量才能上去。

但它不是万能的：几个实际限制

说了这么多优点，也得说说不够好的地方。

第一，它需要你"喂"给它笔记。 不是装好插件就自动跑的，你得手动指定目录、手动触发。对我这种懒人来说，一开始觉得麻烦，但跑了两次之后就习惯了——它变成了一种"仪式"，周末喝咖啡的时候跑一次，看看这周又多了什么概念。

第二，概念提取的质量取决于模型。 7B 模型和 32B 模型的效果差距明显。我在测试 vault 上用 7B 跑了一遍，又在主力 vault 上用 32B（借了朋友的机器）跑了一遍，后者的概念命名明显更精准。如果你用集成显卡跑 7B，要有心理准备——大概 70-80% 的准确度，偶尔需要手动修正。

第三，它不做向量检索，做的是"编译"。 这意味着如果你想问"我笔记里有没有提到过 xxx"，它帮不了你。它擅长的是把零散笔记变成结构化 wiki，不擅长的是做搜索引擎。这两个需求是互补的，不是替代的——我自己是脚本整理 + Obsidian 自带搜索一起用。

我现在的使用流程

折腾了一周，我的日常流程变成这样：

日常剪藏：看到好文章，Web Clipper 存到 inbox/ 文件夹

周末编译：周六早上跑一次脚本，让 AI 读这周新增的笔记

快速审阅：打开 Obsidian 图谱视图，检查新增的概念页面——对的理解错误的标 rejected 重跑

手动补链接：AI 漏掉的连接，自己补上

整个过程花 15 分钟，比之前手动整理 2 小时效率高了不止一个数量级。而且最关键的是——我终于开始整理笔记了。之前的"明天再说"，现在变成了"让 AI 今晚跑一下"。

如果你跟我一样，Obsidian 里攒了几百篇笔记但图谱视图一片荒芜，试试这个方案。不需要花钱，不需要翻墙，不需要把笔记交给任何云服务。

⚠️ 几点提示：
1.
第一次跑建议先在测试 vault 上试，确认效果满意再跑主力库
2.
Ollama 推荐拉取 qwen2.5:7b（中文效果好，门槛低）或 deepseek-r1:8b（推理能力强）
3.
如果显卡不够，7B 模型在 16G 内存的笔记本上也能用 CPU 跑，就是慢一点

点亮「推荐❤️」，让同样被笔记淹没的朋友看到这个方案。

后台回复 「本地AI」，我把我调好的 config.yaml 模板和一键启动脚本发你——复制粘贴就能跑，不用踩我踩过的坑。

试试看。跑完之后回来告诉我：你的 Obsidian 图谱里，多了几条线？

我是黑曜石，陪你打造第二大脑。从 400 篇孤岛笔记到 AI 自动整理，你只需要一个下午。下期见。

所有实操步骤均经本人实测验证。文中提到的 obsidian-llm-wiki-local 为 GitHub 开源项目（kytmanov/obsidian-llm-wiki-local），使用前请阅读项目文档。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

一个Python脚本,让你的Obsidian自己＂长＂出知识图谱|Ollama本地免费方案

上个月我把 Obsidian 里 400 多篇笔记导出来数了数——双向链接不到 80 条。

你缺的不是笔记量，是"整理代理人"

obsidian-llm-wiki-local：一个脚本，把你的笔记"编译"成知识库

上手：不需要折腾环境

它是怎么工作的：三步流水线

实测：跑完 400 篇笔记后的三个发现

跟其他方案比，它好在哪

但它不是万能的：几个实际限制

我现在的使用流程

最新文章

热门文章

随机文章

一个Python脚本,让你的Obsidian自己＂长＂出知识图谱|Ollama本地免费方案

上个月我把 Obsidian 里 400 多篇笔记导出来数了数——双向链接不到 80 条。

你缺的不是笔记量，是"整理代理人"

obsidian-llm-wiki-local：一个脚本，把你的笔记"编译"成知识库

上手：不需要折腾环境

它是怎么工作的：三步流水线

实测：跑完 400 篇笔记后的三个发现

跟其他方案比，它好在哪

但它不是万能的：几个实际限制

我现在的使用流程

最牛的Python自学网站,Python核心48个知识点全在里面

Linux内核Rust化进入关键拐点,开源底层安全变革全面提速

最新文章

热门文章

随机文章