当前位置：首页>java>100行代码!实现一个基于私有知识库的RAG AI Agent

100行代码!实现一个基于私有知识库的RAG AI Agent

2026-07-04 16:14:43

核心痛点:ChatGPT再强,也读不懂你公司内部的文档、规章制度、产品手册...如何让AI拥有"企业大脑"?

前言:为什么企业AI必须要有RAG?

你是否遇到过这样的场景:

❌ 公司新人问AI"我们的报销流程是什么?",AI回答的是通用流程,跟公司实际完全不一样
❌ 产品经理问AI"我们的产品定价策略是什么?",AI一本正经地胡说八道
❌ 客服问AI"这个bug怎么解决?",AI给出的方案早已过时

原因很简单:ChatGPT等大模型虽然训练了海量数据,但它没有读过你的企业私有数据。

而RAG(Retrieval-Augmented Generation,检索增强生成)就是解决这个问题的杀手级技术。

什么是RAG?大白话版

想象一下你要参加考试:

没有RAG:你只能靠脑子里的记忆答题(就像纯LLM,只能基于训练数据回答)
有RAG:你可以开卷考试,先翻书找相关知识点,再结合理解答题(这就是RAG)

RAG的三个核心步骤:

索引阶段:把企业文档(PDF、Word、网页等)切成小段,转换成向量存入向量数据库
检索阶段:用户提问时,先把问题转成向量,在数据库中找最相关的文档片段
生成阶段:把找到的文档片段塞给LLM,让它基于这些信息回答

用户问题 → 向量化检索 → 找到相关文档 → 喂给LLM → 准确回答

为什么企业Agent必须要有RAG?

1. 解决"幻觉"问题

LLM最爱"一本正经地胡说八道"。有了RAG,AI被要求"只基于给定的文档回答",准确率直接飙升。

2. 知识实时更新

不用重新训练模型,只要把新文档加入向量库,AI立刻掌握新知识。

3. 数据安全可控

企业数据不用上传到OpenAI等第三方,本地部署,隐私有保障。

4. 成本低廉

不需要微调模型(动辄几十万美金),几千块就能搭建一套企业级知识库。

实战:用LangChain TypeScript手搓一个RAG Agent

技术栈选型

LangChain:目前最流行的LLM应用开发框架
TypeScript:类型安全,代码可维护性强
ChromaDB:轻量级向量数据库,开箱即用
智谱AI:国产大模型,性价比高,兼容OpenAI协议

关于langchain js的使用案例：

80行代码手写AI Agent，支持记忆和工具调用

项目初始化

# 创建项目mkdir rag-agent && cd rag-agent

修改package.json

{  "name": "rag-agent",  "version": "1.0.0",  "description": "",  "main": "index.js",  "type": "module",  "scripts": {    "test": "echo \"Error: no test specified\" && exit 1"  },  "keywords": [],  "author": "",  "license": "ISC",  "packageManager": "pnpm@10.24.0",  "dependencies": {    "@langchain/community": "^1.1.9",    "@langchain/core": "^1.1.17",    "@langchain/langgraph": "^1.1.2",    "@langchain/openai": "^1.2.3",    "@langchain/textsplitters": "^1.0.1",    "chromadb": "^3.2.2",    "jsonwebtoken": "^9.0.3",    "langchain": "^1.2.15",    "pdf-parse": "^1.1.4",    "zod": "^4.3.6"  },  "devDependencies": {    "tsx": "^4.7.0",    "typescript": "^5.1.6"  }}

安装依赖：

npm install

第一步:配置向量模型和LLM

创建src/model.ts:

import { ZhipuAIEmbeddings } from"@langchain/community/embeddings/zhipuai";import { ChatOpenAI } from'@langchain/openai'import { Chroma } from"@langchain/community/vectorstores/chroma";// 知识库向量模型,使用智谱的embedding-3模型exportconst embeddings = newZhipuAIEmbeddings({modelName: "embedding-3",apiKey: 'ZHIPU_API_KEY'// 替换你的智普API Key});// LLM配置,使用智谱GLM-4.7-Flashexportconst model = newChatOpenAI({modelName: "glm-4.7-flash",maxRetries: 0,timeout: 60000,configuration: {baseURL: "https://open.bigmodel.cn/api/paas/v4/"    },apiKey: 'ZHIPU_API_KEY',// 替换你的智普API Keytemperature: 0});// ChromaDB向量存储exportconst vectorStore = newChroma(embeddings, {collectionName: "company-docs",host: "localhost",port: 8000});

关键点解析:

embedding-3:将文本转换成向量的模型(768维数字数组)
Chroma:专门存储和检索向量的数据库,支持相似度搜索
temperature: 0:让AI回答更确定,减少随机性

第二步:知识库入库

创建src/rag/doc-init.ts:

import { PDFLoader } from"@langchain/community/document_loaders/fs/pdf"import { RecursiveCharacterTextSplitter } from"@langchain/textsplitters";import { vectorStore } from'../model.js'// 加载PDF知识库文档const loader = newPDFLoader("./幸福的婚姻.pdf")const docs = await loader.load()// 文档切分器const splitter = newRecursiveCharacterTextSplitter({chunkSize: 1000,      // 每块1000字符chunkOverlap: 200,    // 块之间重叠200字符(保证上下文连贯)});const allSplits = await splitter.splitDocuments(docs);console.log(`文档切分成${allSplits.length}块`)// 数据清洗(ChromaDB要求metadata必须是简单类型)allSplits.forEach(doc => {if (doc.metadata.pdf) {delete doc.metadata.pdf;    }for (const key in doc.metadata) {const value = doc.metadata[key];if (typeof value === 'object' && value !== null) {            doc.metadata[key] = JSON.stringify(value);        }    }});// 存入向量数据库await vectorStore.addDocuments(allSplits);console.log('✅ 文档保存到向量库成功')

为什么需要文档切分?

LLM有上下文窗口限制(比如8K tokens),无法一次读完整个PDF
切分成小块后,检索更精准(只找相关段落,而不是整本书)
overlap保证语义完整性(避免句子被截断)

第三步:实现RAG Agent

创建src/rag/rag-agent.ts:

import { createAgent, dynamicSystemPromptMiddleware } from"langchain";import { SystemMessage } from"langchain";import { vectorStore, model } from'../model.js'const agent = createAgent({    model,tools: [],middleware: [// 中间件:动态修改系统提示词dynamicSystemPromptMiddleware(async (state) => {// 1. 获取用户问题const lastMessage = state.messages[state.messages.length - 1];const lastQuery = typeof lastMessage.content === 'string'                ? lastMessage.content : "";// 2. 从向量库检索相似度最高的2条相关文档const retrievedDocs = await vectorStore.similaritySearch(lastQuery, 2);// 3. 提取文档内容const docsContent = retrievedDocs                .map((doc) => doc.pageContent)                .join("\n\n");// 4. 将查到的知识库内容构造系统提示词(强制AI只基于文档回答)const systemMessage = newSystemMessage(`你是一个专业的客服助手。请只基于以下上下文回答问题,不要编造信息:\n\n${docsContent}`            );console.log('📚 检索到的文档:', docsContent.slice(0, 100) + '...')return systemMessage;        })    ]});// 测试提问let response = await agent.invoke(    { messages: [{ role: "user", content: "怎样培养你的喜爱和赞美" }] });console.log('\n✅ AI 回答：', response.messages[1].content)response = await agent.invoke(    { messages: [{ role: "user", content: "如何改掉冷战的毛病" }] });console.log('\n✅ AI 回答：', response.messages[1].content)

核心原理拆解:

拦截用户问题:通过middleware在LLM调用前"劫持"对话
向量检索:用embedding模型把问题转向量,在ChromaDB中找最相似的文档
注入上下文:把检索到的文档塞进System Prompt
强制约束:System Prompt中明确要求"只基于上下文回答",避免幻觉

完整运行步骤

1. 启动ChromaDB服务

# 安装ChromaDB(如果还没装)npm install -g chromadb# 启动服务chroma run

启动成功后,默认运行在http://localhost:8000

2. 准备知识库文档

把你的PDF文档放到项目根目录(示例用的是《幸福的婚姻.pdf》)

3. 知识库入库

tsx src/rag/doc-init.ts

输出:

✅ 文档保存到向量库成功

4. 运行RAG Agent

tsx src/rag/rag-agent.ts

输出示例:

📚 检索到的文档: 培养喜爱和赞美的方法之一是...✅ AI 回答: 根据文档,培养喜爱和赞美的方法包括...📚 检索到的文档: 冷战会破坏婚姻关系...✅ AI 回答: 文档建议通过以下方式改掉冷战毛病...

进阶优化方向

1. 提升检索质量

混合检索:向量检索+关键词检索(BM25)
重排序(Reranking):用专门的模型对检索结果重新排序
查询扩展:用LLM把用户问题重写成多个查询,扩大召回范围

2. 多模态支持

支持图片、视频、音频等多媒体文档
用CLIP等模型处理图片向量

3. 分布式部署

生产环境推荐用Milvus、Qdrant等专业向量数据库
用Redis做缓存,加速常见问题查询

4. 监控与评估

记录每次检索的文档,人工评估相关性
用RAGAS等工具自动评测RAG系统质量

总结

通过RAG技术,我们只用不到100行代码就实现了:

✅ 让AI拥有企业私有知识库

✅ 大幅提升回答准确性(减少幻觉)

✅ 支持知识库实时更新

✅ 本地部署,数据安全可控

下一步行动:

把你公司的文档整理好,替换示例PDF
部署到服务器,包装成API供团队使用
接入企业微信/钉钉/Slack,做成智能客服

关注我,后台回复"RAG"领取完整项目代码!

关于作者:静远AI实战,专注AI落地与效率提升。帮助企业和个人用AI提升10倍效率。
我的服务:AI自动化实战 | 企业AI咨询 | AI应用开发 | 知识付费课程

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

项目初始化

修改package.json

100行代码!实现一个基于私有知识库的RAG AI Agent

前言:为什么企业AI必须要有RAG?

什么是RAG?大白话版

为什么企业Agent必须要有RAG?

1. 解决"幻觉"问题

2. 知识实时更新

3. 数据安全可控

4. 成本低廉

实战:用LangChain TypeScript手搓一个RAG Agent

技术栈选型

安装依赖：

相关代码

第一步:配置向量模型和LLM

第二步:知识库入库

第三步:实现RAG Agent

完整运行步骤

1. 启动ChromaDB服务

2. 准备知识库文档

3. 知识库入库

4. 运行RAG Agent

进阶优化方向

1. 提升检索质量

2. 多模态支持

3. 分布式部署

4. 监控与评估

总结

最新文章

热门文章

随机文章

100行代码!实现一个基于私有知识库的RAG AI Agent

前言:为什么企业AI必须要有RAG?

什么是RAG?大白话版

为什么企业Agent必须要有RAG?

1. 解决"幻觉"问题

2. 知识实时更新

3. 数据安全可控

4. 成本低廉

实战:用LangChain TypeScript手搓一个RAG Agent

技术栈选型

项目初始化

修改package.json

安装依赖：

相关代码

第一步:配置向量模型和LLM

第二步:知识库入库

第三步:实现RAG Agent

完整运行步骤

1. 启动ChromaDB服务

2. 准备知识库文档

3. 知识库入库

4. 运行RAG Agent

进阶优化方向

1. 提升检索质量

2. 多模态支持

3. 分布式部署

4. 监控与评估

总结

英伟达为Linux 桌面推出GeForce NOW测试版

谈C编程---函数的声明与定义

最新文章

热门文章

随机文章