利用大模型开发的过程中,百搭的 Python 库有哪些?
我给你整理一套做大模型开发时「几乎所有项目都能用上」的 Python 库,不分场景:推理、微调、API 封装、前端、部署、数据处理全都覆盖,直接拿来就能用。
大模型开发「百搭」Python 库
1. 核心大模型交互(必装)
- transformers
HuggingFace 标准库,加载几乎所有开源大模型
- torch / tensorflow
深度学习底层框架,99% 项目必用
- accelerate
多卡、分布式推理/训练,一行加速
- sentence-transformers
向量 embedding 标配,做检索、RAG 必备
2. RAG & 向量检索(现在最常用)
- faiss-cpu
高性能向量检索,轻量无依赖
- chromadb / qdrant-client
轻量向量数据库,开箱即用
- pypdf / python-docx / beautifulsoup4
解析 PDF、Word、网页,做知识库必装
3. API 服务 & 后端(一键上线)
- fastapi
现代、高性能 API 框架,大模型服务标配
- uvicorn
FastAPI 运行服务器
- pydantic
参数校验、结构体,非常稳
4. 数据处理 & 工具链
- pandas
数据清洗、表格处理万能
- numpy
数值计算基础
- tqdm
进度条,训练/处理数据必用
- python-dotenv
管理密钥、配置,安全不乱写
5. 流式输出 & 前端交互
- sse-starlette
大模型打字机流式返回(SSE)
- streamlit / gradio
快速做可视化 Demo,不用写前端
6. 日志、调试、部署
- loguru
超好用日志库
- python-multipart
文件上传
- docker + uvicorn
一键容器化部署
极简「万能安装清单」
bash
pip install torch transformers accelerate sentence-transformers \
faiss-cpu pandas fastapi uvicorn pydantic tqdm loguru \
pypdf beautifulsoup4 sse-starlette streamlit gradio