五一假期期间,笔者下载和研究了几篇Linux的内核调度的论文,并对Linux内核的调度算法进行了详细学习和研究,也算是有所裨益,特此和大家分享一下。之前笔者在使用某商业的软PLC runtime,进行EtherCAT 主站进行开发的时候,当时笔者被建议,Linux系统要采用OSADL实验室发布的preempt 实时性补丁,将Linux 内核调度机制,改为抢占式调度。当时笔者也是照本宣科,打了补丁,修改了Linux的部分驱动,某些mux_lock 互锁机制,也做了修改,但还是没有刨析原理,没有触及到Linux的调度本质。所以假期时候,对此进行部分论文的学习。笔者看到了东北大学,北航等诸多高校,对Linux的调度算法,都发布了很多论文,笔者将自己相关的Linux Rate-Monotonic 调度算法,相关信息,展示给大家。Linux中的Rate Monotonic调度算法
概述
速率单调调度是实时系统中经典的静态优先级调度算法,其核心原则是:任务的周期越短,优先级越高。该算法由Liu和Layland于1973年提出,适用于周期性实时任务集。
理论模型
任务模型
一个周期性任务由三个参数定义:
可调度性条件
对于包含n个独立周期性任务的集合,若总CPU利用率U满足以下条件,则所有任务都能满足截止时间:
当n→∞时,
的极限约为ln2 ≈ 0.693。这意味着对于大量任务,当总CPU利用率低于69.3%时,RM调度理论上可以保证实时性。
Linux中的实现方式
1. 使用SCHED_FIFO模拟RM
Linux的SCHED_FIFO策略是静态优先级实时调度器,可以手动为任务分配优先级:周期越短,分配越高的优先级。FIFO策略下,高优先级任务会抢占低优先级任务,符合RM的抢占模型。
2. 实现内核模块(学术/实验性质)
一些操作系统课程提供了在Linux中实现RM调度器的实践:
核心组件:
3. 统计速率单调调度(SRMS)
SRMS是经典RM的扩展,专为执行时间变化较大的周期性任务设计。它通过聚合和平滑处理任务的资源需求变化,提供统计意义上的QoS保证。
SRMS包含两个核心组件:
注意事项
硬实时 vs 软实时:标准Linux内核本质上是软实时系统。即使正确设置RM优先级,也无法提供100%的硬实时保证,因为内核操作(如中断处理、锁竞争)可能导致高优先级任务被延迟。
性能考虑:实现RM调度器时应避免在内核中使用浮点运算,因为开销太大。
实际应用建议:对于现代Linux系统,如果需要严格的实时保证,更推荐使用原生的SCHED_DEADLINE策略,它提供了更完善的实时调度框架。
此外,要明确一点: Rate-Monotonic(RM)与抢占式调度并非同一层面的算法,不能进行“二选一”的对比。合理的对比应该是在"抢占式 + RM"(固定优先级抢占调度)与"非抢占式 + RM"或与其他调度算法(如EDF)之间进行。
Linux RM rate-monotonic 调度算法和preemption 抢占式调度算法如何结合?核心结合机制:优先级驱动的抢占
这是两者结合最核心、最直接的体现。RM算法分配给每个任务的优先级,直接作为抢占式调度器的唯一依据。
规则:调度器保证在任何时刻,CPU都执行当前就绪队列中优先级最高的任务。
结合方式:当一个更高优先级的任务(即周期更短的任务)变为就绪状态时,如果CPU正在执行一个低优先级的任务,抢占会立即发生。当前任务被挂起,其上下文被保存,CPU转而执行这个高优先级的紧急任务。
效果:这是确保所有任务(尤其是短周期、高频率任务)都能满足其截止时间的关键。
⏳ “抢占”的具体实现细节
除了基本的决策规则,两者的深度融合还体现在如何精确地管理抢占行为本身,这对系统的实时性有重要影响。
调度器的实现架构
在一个典型的实时操作系统(RTOS)或带有实时扩展的通用操作系统(如Linux + PREEMPT_RT)中,结合了RM和抢占机制的调度器工作流程如下:
任务创建时:系统为每个周期性任务分配一个静态优先级,其高低由任务的周期决定(周期越短,优先级越高)。
调度发生时:
任务就绪:当一个周期性的实时任务被定时器唤醒,变为就绪状态时,它会被放入一个按优先级排序的就绪队列中。
抢占判断:调度器检查新就绪任务的优先级是否高于当前正在运行的任务。
执行抢占:如果优先级更高,调度器会保存当前任务的上下文,并从队列中取出优先级最高的新任务开始执行。
上下文切换:CPU完成从低优先级任务到高优先级任务的切换。这个过程本身需要消耗时间,其开销在精确的实时分析中需要被考虑。
任务完成时:当一个任务执行完毕或被更高优先级任务抢占而挂起时,调度器会重新从就绪队列中选择下一个最高优先级的任务执行。
Linux preempt 抢占式调度的缺点是哪些???
在Linux的实践中,抢占式调度最主要的缺点,是在追求低延迟的同时,牺牲了系统的吞吐量和预测性。这种“延迟vs效率”的权衡,是工程师在进行系统设计时需要仔细斟酌的关键。
我将这些缺点归纳为以下三个核心方面,并结合具体场景进行分析。
性能开销增大
抢占式调度允许高优先级任务随时打断低优先级任务,这导致了额外的性能成本。
实时性与确定性难题
Linux虽然提供了抢占机制,但在天生为高吞吐量设计的通用操作系统上实现硬实时,面临着诸多挑战。
内核态抢占受限:当一个进程通过系统调用进入内核态后,即便是高优先级的实时任务,也无法在所有场景下进行抢占。它必须等待当前内核操作(尤其是在执行中断处理或持有自旋锁等关键资源时)完成,这引入了不可预测的延迟。
中断处理的优先级问题:在标准Linux中,中断处理程序的优先级高于任何进程。这意味着,即使一个高优先级的实时任务正在执行,一旦发生硬件中断,CPU也会立即转向执行中断服务例程,导致实时任务被延迟。
“优先级反转”风险:这是一个经典的实时系统问题。当高优先级任务等待一个已被低优先级任务持有的资源时,如果此时有个中优先级任务抢占了低优先级任务,就会导致高优先级任务被无限期阻塞。Linux虽然提供了优先级继承协议等解决方案,但这增加了系统的复杂性。
更高的系统复杂性
为了实现抢占,整个系统的设计变得更加复杂,对开发者也提出了更高的要求。
编程约束增强:在抢占式内核中,代码(特别是内核模块和驱动)必须是可重入的。开发者必须谨慎使用共享数据,并通过自旋锁、互斥锁等机制来保护临界区,否则抢占的发生很容易导致数据损坏。
调度器参数调优困难:Linux内核(如CFS调度器)提供了大量可调参数(如 sched_min_granularity_ns 和 sched_wakeup_granularity_ns)。最小粒度时间设得过长,会影响交互体验;设得过短,则又会因频繁抢占而增加切换开销。找到适合特定业务场景的最佳配置,往往需要深入的性能分析和反复测试。
划重点了,其优缺点如下(这部分咨询了某AI工具, 回复的比我专业):
另外,笔者也很好奇:preempt 补丁和望获Linux ,哪个实时性更好
众所周知,望获Linux,也是国产的商业Linux的佼佼者,笔者也很好奇其对比的结果,也咨询了AI工具,总结的比较客观。
坦白来说,差距的产生,源于两者完全不同的“基因”和使命。
PREEMPT_RT 是“改良者”:它的首要目标是不破坏现有生态。在尽量不改动Linux核心架构的前提下,通过“打补丁”的方式让它具备实时能力。这就像给一辆家用轿车改装悬挂,虽然能提升操控,但受限于原车架构,性能天花板有限。
望获是“重构者”:它从设计之初就是为了追求极致的实时性和确定性。它不惜采用更彻底的隔离技术,甚至重构底层中断处理逻辑,只为达到纳秒级的响应。这就像为赛道重新设计的F1赛车,性能极强,但开发和维护成本也极高。