当前位置：首页>python>Python 库巡礼 | Requests‌:让HTTP请求回归人类语言

Python 库巡礼 | Requests‌:让HTTP请求回归人类语言

2026-07-01 19:22:38

很久很久之前写Python调接口或抓数据，得先跟 urllib2 搏斗一番，拼接参数、手动编解码、处理cookie、抓包看头信息……一套下来，胶水代码比业务逻辑还长。后来 Kenneth Reitz 在博客里留了一句：“HTTP请求本该简单得像说话一样。”然后就有了 requests。

📜 发展历程

时间节点	关键变化与社区动向
2011.02	Kenneth Reitz 发布首个版本，初衷是替代繁琐的 `urllib2`，主打“人类友好的API”
2012～2015	迅速成为Python事实标准，PyPI下载量破千万；引入 `Session` 对象、连接池与自动重试机制
2016～2019	底层全面切换至 `urllib3`，提升并发安全与HTTPS兼容性；文档生态完善，成为多数框架的默认HTTP客户端
2020～2022	停止大版本特性迭代，进入维护期；社区重心转向安全补丁与Python 3.7+ 兼容性适配
2023 至今	虽面临 `httpx` 等异步库冲击，仍稳居同步脚本与自动化运维首选；官方明确“稳定优先”路线，不盲目追新

🔍 把什么做简单了？

1. 直白的参数传递requests.get(url, params={"q": "test"}) 几乎就是自然语言。不用自己拼 query string，也不用手动设 Content-Type。传表单用 data，传JSON用 json，传文件用 files，库会帮你处理边界情况。

2. Session 与连接复用同一个 Session 实例会自动处理 cookie 持久化和 TCP 连接池。跑批量接口测试、需要登录态保持、或者频繁调用同一域名时，省去大量手动维护状态的代码。很多人不知道 requests.get() 底层每次都会新建连接，遇到性能瓶颈时才想起切到 Session。

3. 智能解码与容错内置编码推断逻辑，自动处理 gzip/br 压缩响应；超时控制 timeout=(connect, read) 明确区分建连和读数据两个阶段，比一刀切的超时更贴近真实网络抖动场景。

4. 流式响应不撑内存加一个 stream=True，配合迭代器逐块读取。下载大文件、处理长轮询或日志推送时，不会一次性把响应体塞进内存。新手常踩的 OOM 坑，往往就是忘了开这个开关。