Linux 的中断子系统,是整个内核实时响应机制的核心。无论是网卡收到数据包、串口接收到字符、定时器到期,还是 GPIO 电平变化,本质上都会转化成一次中断事件。很多开发者平时会调用 request_irq() 注册中断,却并不真正理解 Linux 内核内部是如何完成 IRQ 分发、上下文切换、中断屏蔽以及 handler 调度的。
实际上,从硬件触发 IRQ,到最终执行驱动中的中断处理函数,中间经过了完整的一套中断管理框架。Linux 为了兼容不同 CPU 架构、不同中断控制器以及 SMP 多核环境,又在这一过程中引入了 irq_desc、irq_chip、irq_domain、softirq、tasklet、threaded irq 等大量机制。
这篇文章系统分析 Linux 中断处理链路,从硬件 IRQ 信号开始,一直到驱动中的 interrupt handler 被执行为止。
第一章:什么是中断
1.1 为什么需要中断机制
在早期系统里,CPU 想知道外设是否有数据,只能不断轮询。例如串口控制器可能每隔几微秒检查一次寄存器,看是否收到字符。这种方式虽然简单,但会浪费大量 CPU 时间。
假设 UART 一秒钟只收到几个字符,而 CPU 却一直不停读取状态寄存器,那么绝大部分时间其实都在空转。随着设备数量增加,这种 polling 模型很快就无法扩展,于是硬件中断机制出现了,所谓中断,本质上是外设主动通知 CPU:我这里有事件需要处理。CPU 不再需要持续轮询,而是在真正发生事件时再进入处理逻辑。这样做有几个明显优势:
降低 CPU 空转
提高系统实时性
提升外设响应速度
支持并发设备管理
Linux 内核中的大量子系统都依赖中断:
网卡收包
串口接收
USB 插拔
键盘输入
DMA 完成
RTC 定时器
GPIO 变化
都是中断事件。
1.2 中断发生时 CPU 到底做了什么
当硬件产生 IRQ 信号后,CPU 会暂停当前执行流,转而进入中断上下文。这个过程并不是简单函数调用,而是 CPU 硬件级别的上下文切换。,CPU 会自动完成以下内容:
保存 PC
保存部分寄存器
切换特权级
切换栈
跳转到中断向量表
例如 ARM64 中:
用户程序运行在 EL0,一旦发生 IRQ:CPU 自动切换到 EL1,并跳转到异常向量表中的 IRQ entry,x86 中则会:
保存 RIP
保存 RFLAGS
切换到内核栈
跳转 IDT
此时 Linux 内核才真正开始接管中断,所以:中断并不是软件逻辑,它是 CPU 硬件行为,Linux 只是后续的软件处理中枢。
第二章:Linux IRQ 子系统架构
2.1 Linux 为什么需要统一 IRQ 框架
不同 SoC 的中断控制器差异巨大。
ARM GIC
RISC-V PLIC
x86 APIC
GPIO Controller
MSI/MSI-X
它们这些不同架构的有不同的特性:
Linux 不可能让每个驱动直接操作硬件中断控制器,否则驱动将无法跨平台,于是 Linux 引入 IRQ abstraction。
Linux 希望驱动只关心:自己申请一个 IRQ。
对于这些内容:
IRQ 如何映射
如何 mask
如何 ack
如何 EOI
如何路由 CPU
全部交给内核 IRQ 子系统,于是 Linux 建立了:
Device Driver ↓Generic IRQ Layer ↓irq_chip ↓Interrupt Controller
这就是 Linux 中断框架的核心分层。
2.2 irq_desc 是 Linux 中断核心对象
Linux 内核中,每个 IRQ 都对应一个 irq_desc,定义位于:
kernel/irq/irqdesc.cinclude/linux/irqdesc.h
它是 IRQ 的管理对象,内部包含:
struct irq_desc { struct irq_data irq_data; irq_flow_handler_t handle_irq; struct irqaction *action;};
其中irq_data保存 IRQ 配置,包括:
irq number
chip
affinity
state
handle_irq,中断流处理函数。例如:
handle_edge_irq
handle_level_irq
action:驱动注册的 handler 链表。即:request_irq()最终挂载的位置。
所以:irq_desc 是 Linux IRQ 管理中心,所有 IRQ 都会先找到 irq_desc,再进入真正 handler。
第三章:硬件 IRQ 如何进入 Linux
3.1 CPU 如何进入中断入口
当外设拉高 IRQ line 后,中断控制器首先感知中断,比如ARM GIC:
Device → GIC → CPU IRQ Line
CPU 检测到 IRQ pending 后会自动跳转:exception vector
ARM64 中:el1_irq最终进入:do_interrupt_handler()之后 Linux 开始读取ICC_IAR1_EL1获取:IRQ Number然后进入:generic_handle_domain_irq(),这个时候Linux 才真正知道:到底是谁触发了中断。
3.2 irq_domain 为什么重要
现代 SoC 中硬件 IRQ number 和 Linux IRQ number 往往不同,GIC 中:Hardware IRQ = 45, 在Linux 内部:Virtual IRQ = 128因此 Linux 引入irq_domain用于HW IRQ ↔ Linux IRQ映射,这样做有几个目的:
解耦硬件
支持级联中断控制器
支持 GPIO IRQ
支持 MSI 动态分配
Linux 获取 HW IRQ 后会先通过 irq_domain 查找virq,然后再找到irq_desc最终进入 handler。
第四章:request_irq 到底做了什么
4.1 驱动注册中断全过程
驱动中最常见代码:
request_irq(irq, handler, flags, name, dev);
这里不是简单的注册回调,注册以后内核会:
分配 irqaction
填充 handler
加入 irq_desc->action 链表
配置触发方式
设置共享属性
enable irq
IRQ Number ↓irq_desc ↓irqaction chain ↓driver handler
irqaction 定义:
struct irqaction { irq_handler_t handler; void *dev_id;};
handler:就是驱动里的中断函数。
4.2 为什么中断可以共享
Linux 支持:IRQF_SHARED,多个设备共享同一个 IRQ line。
熟悉的有 PCI。
irq_desc ↓irqaction list会形成链表。
IRQ 到来时:Linux 会遍历所有 handler:for_each_action_of_desc()
每个 handler 都会检查:是不是自己设备触发了中断。
所以驱动里通常会读取状态寄存器:
status = readl(...);if (!(status & MY_IRQ)) return IRQ_NONE;
否则会误处理中断。
第五章:Linux 中断上下文机制
5.1 为什么不能在中断里睡眠
中断运行于:Interrupt Context不是普通进程上下文。
它没有:
独立 task_struct
用户地址空间
可调度状态
所以中断期间不能 sleep。
在中断中执行阻塞相关的动作都会导致异常
mutex_lock()msleep()schedule()
都会导致:BUG: sleeping function called from invalid context因为中断上下文不可调度。
Linux 要求:中断 handler 必须:
否则会导致:
5.2 上半部与下半部
由于中断必须快速返回,所以Linux 将处理中断拆成:
上半部:立即执行,只做:
下半部:延后处理,Linux 提供:
例如网卡上半部:只收包 DMA descriptor。
下半部再进行协议栈解析,这样可以降低 IRQ 占用时间。
第六章:Threaded IRQ 与现代 Linux 中断
6.1 为什么 Linux 引入 Threaded IRQ
随着系统复杂度提高,很多中断处理越来越重,比如有:
如果全部放 IRQ context,会导致长时间关中断,所以 Linux 引入了
request_threaded_irq()机制。
中断会拆成:hardirq和irq thread
hardirq:只负责唤醒线程,真正处理是在线程上下文完成。
这样handler 内部甚至可以 sleep,这是 RT Linux 中极其关键机制。
6.2 Linux 中断未来趋势
现代 Linux 中断系统已经越来越“线程化”,尤其 PREEMPT_RT 中大量中断已经转化成:IRQ Thread,这样系统实时性更强,同时MSI/MSI-X、多队列网卡、CPU affinity、NUMA aware IRQ routing,也让 Linux IRQ 子系统越来越复杂。
今天的 Linux 中断已不是简单的“收到中断 → 调 handler”
这么简单了而是已经演变成了一个完整的流程
CPU 调度系统
并发管理系统
实时响应系统
硬件抽象系统
它连接着:硬件、CPU、调度器、驱动以及整个内核执行流。
结语
Linux 中断机制,本质上是 Linux 内核与硬件世界之间的第一层连接。
外设通过 IRQ 告诉 CPU:“现在需要你处理事件,”随后 Linux IRQ 子系统完成:
IRQ 映射
中断控制
handler 分发
上下文切换
延迟执行
SMP 路由
最终才执行驱动中的中断处理函数。
现在随着技术的更新:
这些技术的的发展,Linux IRQ 子系统也正在持续演进。
建了一个嵌入式Linux技术群,专门聊难题分析和求职面试,欢迎大家一起加入,共同解决工作中的疑难杂症问题