Python统治了AI生态的每一个层面——模型训练、推理框架、应用编排、数据处理。但如果你仔细看基础设施层的最新信号,一个不太一样的故事正在发生。
Qdrant,一个完全用Rust写的向量数据库,GitHub星数从2023年中期的1万涨到2026年的1.5万以上,而且在公开的ANN基准测试中,过滤查询的延迟和QPS持续领先于Go和C++实现的竞品。
Python正在从AI基础设施层撤退,退居胶水层。Rust和Go正在接管底层。
这个趋势不是从向量数据库开始的。代码格式化工具领域,Rust写的Ruff正在取代Flake8和Black。数据处理领域,Polars(Rust)和DuckDB(C++)正在蚕食pandas的份额。推理服务器领域,vLLM和TensorRT-LLM正在成为生产环境的首选。AI基础设施的下一波红利不在算法创新,在"用高性能语言重写Python生态"。
向量数据库市场现在有四个主要玩家,每个代表了不同的技术路线:
Qdrant的优势不在某个单点性能指标,在Rust整个技术栈带来的系统性优势。没有GC意味着没有运行时暂停——这对低延迟搜索至关重要。零成本抽象和细粒度内存控制,让它在同等硬件上处理更大的索引。tokio异步运行时天然适合高吞吐、非阻塞的I/O密集场景。静态链接和最小运行时开销,让它可以作为单二进制文件部署到边缘节点。
这不是语言偏好的问题,是物理约束的问题。 Python的GIL和内存开销在基础设施层是不可接受的——GC暂停会让搜索延迟出现毛刺,内存碎片会让大规模索引的性能不可预测,解释型语言的启动时间让边缘部署不现实。Rust解决了所有这些问题,代价是开发门槛更高、生态更小。但在基础设施层,性能就是产品。
这种对“确定性性能”的追求,在边缘 AI 场景下被放大到了极致。隐私法规、离线要求和成本压力正在把 AI 工作负载推到设备和边缘节点。SQLite-vec 把向量索引带进了 SQLite,LanceDB 用 Rust 实现了嵌入式向量数据库,Qdrant 也提供了轻量级边缘部署模式。这些项目的共同诉求很明确:在资源受限的设备上,绝不能容忍 Python 那样的 GC 暂停和内存泄漏。
AI基础设施的架构正在分化为两层:Python负责模型层(训练、微调、评估),Rust/Go负责服务层(索引、路由、缓存、向量检索、API网关)。 这个分工不是意识形态的选择,是物理定律的要求。
这个趋势对技术决策者有两个直接意义。第一,评估向量数据库时,不要只看功能列表,用你自己的payload过滤负载跑基准测试。Qdrant在干净API和低延迟方面的优势,只有在你的实际查询模式下才能验证。第二,设计AI基础设施架构时,考虑Rust-based的边缘栈用于本地RAG,把云端资源留给训练和高并发推理。
Python不会消失,但它正在从基础设施层向应用层迁移。Rust正在成为AI基础设施的默认语言——不是因为开发者喜欢它,是因为物理定律要求它。
你的向量数据库,是用什么语言写的?
关注公众号,回复【进化】加入 AI 商业前沿交流群。关注变量引力,一起进化。