很多人第一次接触大模型时,最熟悉的用法就是“问一句,答一句”。
比如问它:
帮我分析一下这个销售数据。
普通大模型可能会直接给出一段泛泛而谈的分析建议,但它并不知道真实数据长什么样,也不会自动读取本地 CSV,更不会真正计算每个地区的销售额。
这就是普通聊天机器人和 Agent 智能体 的区别。
聊天机器人主要负责回答问题,Agent 则可以根据任务自动判断要不要调用工具,并利用工具完成具体操作。
比如这篇教程要做的事情很简单:
用户输入一句话:“帮我分析 sales.csv,看看哪个地区销售额最高,并生成一段总结。”
然后 Agent 自动完成:
这就是一个最基础的 数据分析 Agent。
一、案例背景
在实际的数据分析工作中,很多任务并不是“问答”就能完成的。
比如:
这些任务都需要真实执行。
大模型本身擅长理解语言和生成文本,但如果不给它工具,它并不能直接读取本地文件,也不能真正完成数据计算。
所以我们需要给大模型挂上工具。
可以把 Agent 理解成:
一个会理解任务、会选择工具、会根据工具结果继续生成答案的 AI 助手。
在这个教程里,我们就用 Python 搭一个小型 Agent,让它自动调用函数完成销售数据分析。
二、Agent 原理
一个最基础的 Agent 通常由三部分组成:
它的工作流程可以理解为:
用户提出任务↓模型理解任务↓判断是否需要调用工具↓调用 Python 函数↓函数返回真实结果↓模型基于结果生成最终回答
和普通问答相比,Agent 最大的变化在于:
它不是直接“编一个答案”,而是先通过工具获取结果,再根据结果组织回答。
三、代码思路
这篇教程使用一个简单的销售数据作为案例。
假设我们有一个 sales.csv 文件,里面记录了不同地区、不同产品的销售额。
示例数据如下:
我们希望用户只输入一句话:
请分析 sales.csv,看看哪个地区销售额最高,并生成一段简短总结。
Agent 能够自动判断:
因此,我们需要给 Agent 准备两个工具:
| |
|---|
read_sales_data() | |
summarize_sales_by_region() | |
四、核心代码展示
1. 安装依赖
先安装需要用到的 Python 包:
pip install openai-agents pandas python-dotenv
其中:
| |
|---|
openai-agents | |
pandas | |
python-dotenv | |
2. 配置 API Key
在项目目录中新建 .env 文件:
OPENAI_API_KEY=你的API密钥
这样代码运行时就可以自动读取密钥,不需要把密钥直接写进 Python 脚本。
3. 准备示例数据
先写一个脚本生成示例销售数据。
# create_demo_data.pyimport pandas as pddf = pd.DataFrame({ "date": [ "2026-01-01", "2026-01-02", "2026-01-03", "2026-01-04", "2026-01-05", "2026-01-06" ], "region": ["华东", "华南", "华北", "华东", "华南", "华北"], "product": ["A产品", "B产品", "A产品", "C产品", "A产品", "B产品"], "sales": [12000, 9800, 15300, 17600, 14200, 11800]})df.to_csv("sales.csv", index=False, encoding="utf-8-sig")print("示例数据已生成:sales.csv")
运行代码:
python create_demo_data.py
运行后,项目目录中会生成一个 sales.csv 文件。
4. 定义工具函数
接下来定义 Agent 可以调用的工具。
第一个工具用于读取 CSV 文件,并返回数据的基本结构。
import pandas as pdfrom agents import function_tool@function_tooldef read_sales_data(file_path: str) -> str: """ 读取销售数据,并返回数据的基本信息。 """ df = pd.read_csv(file_path) rows, cols = df.shape columns = list(df.columns) result = { "行数": rows, "列数": cols, "字段": columns, "前5行": df.head().to_dict(orient="records") } return str(result)
这段代码的作用是:
- 1. 用
pandas.read_csv() 读取数据; - 4. 返回前 5 行数据,方便 Agent 理解数据结构。
第二个工具用于按地区汇总销售额。
@function_tooldef summarize_sales_by_region(file_path: str) -> str: """ 按地区汇总销售额,并返回汇总结果。 """ df = pd.read_csv(file_path) if "region" not in df.columns or "sales" not in df.columns: return "数据中缺少 region 或 sales 字段,无法汇总。" summary = ( df.groupby("region", as_index=False)["sales"] .sum() .sort_values("sales", ascending=False) ) top_region = summary.iloc[0]["region"] top_sales = summary.iloc[0]["sales"] result = { "地区销售额汇总": summary.to_dict(orient="records"), "销售额最高地区": top_region, "最高销售额": int(top_sales) } return str(result)
这段代码主要完成三件事:
- 1. 检查数据中是否存在
region 和 sales 字段; - 2. 使用
groupby() 按地区汇总销售额;
5. 创建 Agent
工具定义好之后,就可以创建 Agent。
from agents import Agentsales_agent = Agent( name="销售数据分析助手", instructions="""你是一个数据分析助手。用户会给你一个 CSV 文件路径和一个分析任务。你需要根据任务自动判断是否调用工具:1. 如果需要读取数据,请调用 read_sales_data;2. 如果需要按地区汇总销售额,请调用 summarize_sales_by_region;3. 最后请用中文输出简洁、清楚的分析结论。注意:最终结论必须基于工具返回的真实结果。""", tools=[ read_sales_data, summarize_sales_by_region ])
这里最关键的是 instructions。
它相当于给 Agent 设定工作规则:
6. 运行 Agent
最后写一个主函数,让 Agent 执行任务。
from dotenv import load_dotenvfrom agents import Runnerload_dotenv()def main(): user_task = """ 请分析 sales.csv: 1. 先读取数据并说明数据结构; 2. 再按地区汇总销售额; 3. 找出销售额最高的地区; 4. 最后生成一段简短结论。 """ result = Runner.run_sync(sales_agent, user_task) print("\n===== Agent 输出结果 =====\n") print(result.final_output)if __name__ == "__main__": main()
运行:
python agent_demo.py
五、结果展示
运行后,Agent 会先自动读取数据,再调用汇总工具,最后输出类似结果:
===== Agent 输出结果 =====已读取 sales.csv 数据。该数据共有 6 行、4 列,字段包括 date、region、product 和 sales。按地区汇总后,销售额结果如下:1. 华东:296002. 华北:271003. 华南:24000从结果看,华东地区销售额最高,总销售额为 29600。整体来看,华东和华北的销售表现相对更强,后续可以进一步分析不同产品在各地区的销售贡献。
汇总结果可以整理成表格:
从结果可以看到,华东地区销售额最高,总销售额为 29600;其次是华北地区,总销售额为 27100;华南地区为 24000。
这个结果不是模型直接猜出来的,而是 Agent 调用 Python 工具后得到的真实计算结果。
六、结果解读
这个案例虽然简单,但已经展示了 Agent 的基本逻辑。
这里最重要的一点是:
Agent 的回答依赖工具结果,而不是只依赖模型生成。
这也是 Agent 相比普通聊天机器人的核心优势。
普通聊天机器人更适合回答知识性问题,而 Agent 更适合处理“需要执行步骤”的任务。
比如:
这些都可以通过工具扩展出来。
七、总结
这篇教程用一个简单的销售数据案例,演示了如何用 Python 搭建一个基础 Agent。
整个流程可以概括为:
自然语言任务→ Agent 判断需求→ 自动调用工具→ 工具返回结果→ 模型生成结论
在这个过程中,大模型不再只是回答问题,而是开始参与具体任务执行。
这也是 Agent 最有价值的地方:
让 AI 从“会聊天”变成“会干活”。
对于数据分析、科研辅助、企业报表、政策文本处理等场景来说,Agent 都可以继续扩展成更实用的工具。
比如:
这类应用的核心并不复杂:给大模型合适的工具,再让它根据任务自动选择工具。
从这个角度看,Agent 不是一个抽象概念,而是一种非常实用的自动化工作流。