大多数开发者用LangChain时,只停留在“一问一答”的聊天模式。但真实生产环境需要的AI,是能自主分析问题、调用外部工具、决定何时检索知识库的智能体(Agent)。原文介绍的LangChain.js课程揭示了这一转变,而Python生态同样有强大的LangChain库,且语法更简洁、生态更丰富。本文面向Python工程师,用三个可运行示例,带你从基础调用一路走到Agentic RAG(智能体增强检索),理解“为什么这样做”而非“先做A再做B”。
传统LLM调用就像一个人,你问什么他直接回答什么,既不会主动查资料,也不会调用计算器。Agent则像一位“有工具的员工”:他接到任务后会先思考(ReAct循环),决定是否需要使用某个工具(如搜索、计算器),执行工具后根据结果继续推理,直到给出最终答案。
Agentic RAG更进一步:Agent会判断“这个问题我能不能直接回答?”,只有遇到不确定或需要最新数据时才去检索知识库。这比“每次对话都搜一遍”的朴素RAG更高效、更省钱,也更像人类“开卷考试”中先凭记忆答简单题,再翻书查难题。
场景描述:很多初学者第一步就是让模型写一首诗,但很快发现输出格式不可控。本示例展示如何用Pydantic定义输出结构,让模型按指定格式返回(如JSON),这是后续工具调用和Agent的基础。
PYTHON IT职场小袁同学 · PYTHON.md
1import os2from langchain_openai import ChatOpenAI3from langchain_core.pydantic_v1 import BaseModel, Field4from langchain_core.messages import HumanMessage5from typing import List67# 定义输出结构:一首诗8class Poem(BaseModel):9 title: str = Field(description="诗的标题")10 lines: List[str] = Field(description="诗的内容,每行一个元素")11 sentiment: str = Field(description="整体情感基调")1213# 初始化模型(确保环境变量OPENAI_API_KEY已设置)14llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.7)1516# 用with_structured_output绑定结构,模型会自动输出JSON17structured_llm = llm.with_structured_output(Poem)1819# 发送请求20result = structured_llm.invoke([21 HumanMessage(content="写一首关于秋天的五言绝句")22])2324print(f"标题:{result.title}")25print("内容:")26for line in result.lines:27 print(f" {line}")28print(f"情感:{result.sentiment}")29
运行结果:
PYTHON IT职场小袁同学 · PYTHON.md
1标题:秋思2内容:3 秋风起兮白云飞4 草木黄落兮雁南归5 兰有秀兮菊有芳6 怀佳人兮不能忘7情感:寂寥而怀旧8
代码说明:
- 第一段:导入所需库,
ChatOpenAI是官方推荐的OpenAI模型封装,pydantic_v1用于定义数据模式。
- 第二段:用
BaseModel定义输出格式,Field添加说明帮助模型理解。
- 第三段:创建模型实例,
temperature控制创造性。
- 第四段:关键一步——
with_structured_output将模型输出自动解析为Pydantic对象,不再需要手动解析JSON。
- 第五段:调用
invoke,传入消息列表(可包含系统消息)。模型返回的是Poem实例,可直接访问属性。
- 最后打印结果。注意:实际输出内容因模型和温度而异,但格式一定是结构化的。
场景描述:上一示例只是“说话”,现在要让AI能调用你的函数。比如做一个天气查询助手:用户问“北京今天需要带伞吗?”,Agent应调用天气工具获取数据,再回答。
PYTHON IT职场小袁同学 · PYTHON.md
1import os2from langchain_openai import ChatOpenAI3from langchain_core.tools import tool4from langchain.agents import create_tool_calling_agent, AgentExecutor5from langchain_core.prompts import ChatPromptTemplate67# 1. 定义一个模拟的天气查询工具(真实场景可调用API)8@tool9def get_weather(city: str, date: str) -> str:10 """根据城市和日期返回天气概况"""11 # 模拟数据12 weather_data = {13 ("北京", "2025-03-20"): "多云,气温10-18°C,无需带伞",14 ("上海", "2025-03-20"): "小雨,气温15-20°C,建议带伞",15 }16 return weather_data.get((city, date), "暂无数据")1718# 2. 创建LLM和工具列表19llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)20tools = [get_weather]2122# 3. 创建提示模板,告诉Agent如何使用工具23prompt = ChatPromptTemplate.from_messages([24 ("system", "你是一个天气助手。当用户询问天气时,使用get_weather工具获取数据。"),25 ("human", "{input}"),26 ("placeholder", "{agent_scratchpad}"),27])2829# 4. 构建Agent和Executor30agent = create_tool_calling_agent(llm, tools, prompt)31agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)3233# 5. 执行对话34response = agent_executor.invoke({"input": "北京今天(2025年3月20日)需要带伞吗?"})35print(f"\n最终回答:{response['output']}")36
运行结果:
PYTHON IT职场小袁同学 · PYTHON.md
1Entering new AgentExecutor chain...2Invoking: `get_weather` with `{'city': '北京', 'date': '2025-03-20'}`34多云,气温10-18°C,无需带伞5Finished chain.67最终回答:北京今天多云,气温10-18°C,无需带伞。8
代码说明:
@tool装饰器将普通函数变成LangChain工具,函数名、参数、文档字符串都会被模型理解。
create_tool_calling_agent是LangChain新式Agent构建方式(推荐),它会自动处理ReAct循环。
AgentExecutor负责运行Agent,verbose=True可看到内部思考过程(如上所示)。
- 模型收到问题后,自动判断需要调用
get_weather,传入参数,获得结果后生成自然语言回答。
- 注意:
agent_scratchpad占位符用于保存中间思考步骤,LangChain会自动填充。
示例 3:最佳实践——Agentic RAG:智能体自主决定是否检索
场景描述:朴素RAG每次对话都检索知识库,浪费算力。Agentic RAG让Agent先判断:这个问题我能直接回答吗?如果不能,再触发检索。本示例模拟一个公司政策问答系统,Agent拥有“检索知识库”工具,但只有遇到不确定的问题时才使用。
PYTHON IT职场小袁同学 · PYTHON.md
1import os2from langchain_openai import ChatOpenAI, OpenAIEmbeddings3from langchain_community.vectorstores import FAISS4from langchain_core.tools import tool5from langchain.agents import create_tool_calling_agent, AgentExecutor6from langchain_core.prompts import ChatPromptTemplate7from langchain_core.documents import Document89# 1. 准备少量知识库文档(模拟公司政策)10docs = [11 Document(page_content="年假政策:员工每年有15天带薪年假,需提前一周申请。"),12 Document(page_content="加班补贴:工作日加班按1.5倍工资计算,周末加班2倍。"),13 Document(page_content="试用期:新员工试用期3个月,期间薪资为正式工资的80%。"),14]1516# 2. 创建向量存储(用于检索)17embeddings = OpenAIEmbeddings(model="text-embedding-3-small")18vectorstore = FAISS.from_documents(docs, embeddings)19retriever = vectorstore.as_retriever(search_kwargs={"k": 1})2021# 3. 定义一个检索工具,由Agent决定是否调用22@tool23def search_policy(query: str) -> str:24 """从公司政策知识库中检索相关信息"""25 results = retriever.invoke(query)26 if results:27 return results[0].page_content28 return "未找到相关信息"2930# 4. 创建Agent,但要求它优先用自己的知识回答31prompt = ChatPromptTemplate.from_messages([32 ("system", 33 "你是一位精通公司政策的HR助手。请先尝试用自己的知识回答用户问题。"34 "只有当你完全不确定时,才调用search_policy工具查询知识库。"),35 ("human", "{input}"),36 ("placeholder", "{agent_scratchpad}"),37])3839llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)40tools = [search_policy]41agent = create_tool_calling_agent(llm, tools, prompt)42agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)4344# 5. 测试两个问题:一个常识(Agent自己回答),一个需要检索45print("问题1:今天是2025年3月20日,星期几?")46resp1 = agent_executor.invoke({"input": "今天是2025年3月20日,星期几?"})47print(f"回答:{resp1['output']}\n")4849print("问题2:新员工试用期薪资是多少?")50resp2 = agent_executor.invoke({"input": "新员工试用期薪资是多少?"})51print(f"回答:{resp2['output']}\n")5253print("问题3:我出差报销额度是多少?(知识库未包含)")54resp3 = agent_executor.invoke({"input": "我出差报销额度是多少?"})55print(f"回答:{resp3['output']}")56
运行结果:
PYTHON IT职场小袁同学 · PYTHON.md
1问题1:今天是2025年3月20日,星期几?2Entering new AgentExecutor chain...3(没有调用工具,直接回答)4Finished chain.5回答:今天是2025年3月20日,星期四。67问题2:新员工试用期薪资是多少?8Entering new AgentExecutor chain...9Invoking: `search_policy` with `{'query': '新员工试用期薪资'}`10试用期:新员工试用期3个月,期间薪资为正式工资的80%。11Finished chain.12回答:新员工试用期薪资为正式工资的80%。1314问题3:我出差报销额度是多少?15Entering new AgentExecutor chain...16Invoking: `search_policy` with `{'query': '出差报销额度'}`17未找到相关信息18Finished chain.19回答:抱歉,我目前的知识库中没有关于出差报销额度的信息。建议您查阅公司最新的差旅政策文件或联系财务部门。20
代码说明:
- 先创建小型FAISS向量库,包含三条政策文档。
OpenAIEmbeddings将文本转为向量。
- 关键在系统提示:明确告诉Agent“先用自己的知识,不确定再检索”。这实现了Agentic RAG的核心——自主判断。
- 问题1(星期几)是常识,Agent直接回答,未调用工具,节省了检索成本。
- 问题2(试用期薪资)涉及知识库,Agent调用工具获取准确数据。
- 问题3(出差报销)知识库没有,Agent诚实告知未找到,并给出建议。这正是Agentic RAG优于朴素RAG的地方——不会硬编造答案。
| | JavaScript (LangChain.js) | |
|---|
| 语法简洁度 | | 中等,TypeScript 类型系统强大但模板较多 | |
| 生态丰富度 | | | |
| Agent 构建方式 | create_tool_calling_agent | | |
| 学习曲线 | | | |
| 生产部署 | | | |
对于Python工程师,LangChain Python库是首选:代码更短、调试更直观、第三方工具(如FAISS、Chroma、LanceDB)安装简单。如果你已经熟悉Python的数据科学生态,迁移到Agent开发几乎没有额外成本。
1. 先打好基础:从结构化输出开始(示例1),控制模型行为比单纯聊天更重要。
2. 工具是Agent的灵魂:用@tool装饰器把任何Python函数变成AI可调用的能力(示例2),这是从“对话”跨越到“行动”的关键。
3. Agentic RAG是未来方向:不要无脑检索,让Agent自己判断何时需要知识库(示例3)。这能降低延迟、减少API调用费用,并提升回答可靠性。
如果你想在本地运行以上示例,只需三步:
1. 安装依赖(Python 3.10+)
BASH IT职场小袁同学 · PYTHON.md
1pip install langchain langchain-openai langchain-community faiss-cpu pydantic
2. 设置环境变量 创建 .env 文件(与原文JS课程类似,但Python环境变量名更直接):
INI IT职场小袁同学 · PYTHON.md
1OPENAI_API_KEY=sk-xxxx...2OPENAI_ENDPOINT=https://api.openai.com/v1 # 可选,兼容Azure或GitHub Models3OPENAI_MODEL=gpt-4o-mini4OPENAI_EMBEDDING_MODEL=text-embedding-3-small
然后运行前加载:from dotenv import load_dotenv; load_dotenv()
3. 运行示例 直接 python example1.py 即可看到输出。所有代码均采用 invoke 同步调用,方便调试。生产环境可改用 ainvoke 异步版本。
原文LangChain.js课程强调“先学工具和Agent,再学检索”,Python版同样适用。但Python社区有两点优势:
- Pydantic vs Zod:Pydantic的
BaseModel 与 Field 比Zod更简洁,且原生支持嵌套和验证。
- FAISS与Chroma:Python端拥有最成熟的向量数据库绑定,安装只需一行
pip,而JS端需额外处理C++编译。
如果你已熟悉原文的JS示例,迁移到Python只需记住:@tool 装饰器等价于 JS 的 tool() 函数;create_tool_calling_agent 等价于 createToolCallingAgent;AgentExecutor 用法完全一致。
1. 尝试MCP(Model Context Protocol):Python有 mcp 库,可搭建MCP服务器,让Agent像调用本地工具一样调用外部API(如数据库、Slack)。
2. 加入记忆:用 langchain.memory 实现对话历史,让Agent记住上下文。
3. 部署为API:结合FastAPI,将AgentExecutor包装成REST端点,供前端调用。
现在,打开终端,参考其思路,但用Python重写你的第一个Agent吧!
📊 AI小袁点评:用三个递进示例,让AI从“会说话”升级为“会行动”,是LangChain入门的优质指南。
推荐指数:5星(理由:将抽象概念转化为可运行示例,直击开发痛点,实用性强,值得反复练习)
声明:本文内容由AI小袁智能工作流自动生成,仅供参考学习。文中观点不代表本平台立场,如有侵权请联系删除。