https://arxiv.org/pdf/2509.01245
这篇论文的野心:
让操作系统不再只靠人类写死的调度策略,而是让 AI 成为“懂业务语义的调度专家”。
论文提出了一个非常激进但克制的方向:Agentic OS(代理化操作系统) ——用 LLM Agent 作为 控制平面,自动生成、验证、部署 Linux 调度策略。
但要强调一句:
❗它不是“让 LLM 进内核跑推理”,❗而是“让 LLM 生成可执行、可验证的内核调度策略”。
论文核心问题:调度器语义鸿沟
传统 Linux 调度器(如 CFS/EEVDF):
所以核心问题是:
内核策略缺乏对应用语义(app-level intent)的理解,而这正是优化调度性能的关键。
论文提出 SchedCP 框架:用 LLM agent(大型语言模型) 来理解工作负载语义、自动生成调度策略。
其架构关键:控制平面与执行平面分离。
控制平面 vs 执行平面
控制平面(用户态)
LLM Agent
分析 workload
生成调度策略
执行平面(内核态)
只运行 已验证的 eBPF 调度逻辑
不跑 AI,不做推理
AI 负责“想”,内核负责“跑”。
SchedCP 的三个核心部件:
🧠 ① Workload Analysis Engine
📦 ② Scheduler Policy Repository
🛡 ③ Execution Verifier
论文强调:
使用 LLM 不是让它直接写内核代码,而是 解构 Scheduler 优化问题:
Goal-inference:理解“优化目标是什么”
Policy-synthesis:把目标转成可执行调度策略(eBPF 程序)
这两阶段分离非常重要:
sched-agent:多智能体系统实现
SchedCP 不是一个单一的 LLM,而是一个多 agent 协作体系:
sched-agent 的一次完整“工作周期”
eBPF 用法 & Kernel Inteface
论文中很清晰强调:
不是让 LLM 直接在内核运行推理而是把生成的 scheduler 逻辑输出成 eBPF 调度程序,然后安全地载入内核调度扩展 sched_ext。
论文做法是 LLM 生成内核策略,然后经过验证才运行。
实验亮点(定量数据)
论文给出了初步评估:
| |
|---|
| |
| 13× lower than naive agentic baseline |
| 对 Schbench (调度 benchmark) | P99 latency improved 2.11× |
| |
这说明:
AI 生成调度策略在某些场景下真的有意义;
简单策略(静态调参)无法达到这种效果。