内存管理是Linux内核的关键模块之一,而I/O内存则是驱动与硬件对话的桥梁。二者共同决定了系统稳定性、设备交互效率与内存安全边界。
本文基于Bootlin官方文档,完整梳理物理/虚拟内存布局、内核分配器体系、MMIO机制、地址映射、时钟/电源与调试全链路知识,适合嵌入式开发、内核驱动工程师系统学习与实战查阅。
一、先搞懂根基:物理内存 vs 虚拟内存
Linux一切内存行为,都建立在物理地址与虚拟地址的分离设计上,这是理解内核内存与I/O操作的前提。
1.1 基本概念
- 物理内存(RAM):主板上真实的DRAM空间,CPU与硬件直接可见的地址。
- 虚拟内存:MMU(内存管理单元)提供的抽象层,每个进程拥有独立4GB(32位)或极大(64位)地址空间,互不干扰。
- 内核空间:所有进程共享的高地址区域,拥有最高权限,直接管理硬件与内存。
- 用户空间:低地址区域,进程独立,无法直接访问硬件与内核数据。
- 虚拟内存组织形式:
1、顶部四分之一空间保留给内核空间,其中:1) 包含内核代码与核心数据结构 ;2) 用于加载模块的分配区 ;3) 所有内核物理映射 ;4)所有地址空间中内容一致 ;
2、下半部分为用户进程独享的映射区域 ,其中:1)进程代码与数据(程序、栈等);2) 内存映射文件 ;3) 每个进程拥有自己的地址空间 ;
3、 实际使用的具体虚拟映射会在系统引导初期显示于内核日志中;
1.2 32位与64位地址空间划分
32位系统(典型布局)
如图所示的划分结构,在32位系统下存在以下限制:
- 只有不足1GB的内存可通过内核虚拟地址直接寻址 ;
- 若平台上存在更多物理内存,其中一部分将无法被内核空间访问,但可由用户空间使用;
将内存划分比例从 3GB/1GB 改为 2GB/2GB 或 1GB/3GB(配置项 CONFIG_VMSPLIT_2G 或 CONFIG_VMSPLIT_1G) ⇒ 会减少每个进程可用的总用户空间内存;
若体系结构支持,启用高端内存(highmem)支持:允许内核将其无法直接访问的部分内存进行映射。
64位系统(典型布局)
1.3 物理内存分区(Zone)
内核按硬件能力把物理内存划分为不同Zone,驱动必须按用途选择:
二、内核内存分配体系:4种内存分配函数,驱动该用谁?
内核不使用C标准库,提供一套专用分配函数,每一种都有严格场景限制。
2.1 页分配函数(Buddy伙伴系统)——底层基石
- 分配方式:仅支持2的幂次页数(1、2、4、8…页);
2.2 SLAB/SLUB分配函数——对象缓存
- 作用:减少频繁创建/销毁内核对象的开销(如inode、task_struct、sk_buff);
2.3 kmalloc——驱动最常用分配函数
这是驱动开发90%场景的首选。
void *kmalloc(size_t size, gfp_t flags);voidkfree(constvoid *objp);// 清零版本void *kzalloc(size_t size, gfp_t flags);
- GFP标志
GFP_KERNELGFP_ATOMICGFP_DMA
2.4 vmalloc——虚拟连续、物理可不连续
void *vmalloc(unsignedlong size);voidvfree(void *addr);
- 适用:内核模块加载、大缓冲区、不涉及硬件DMA的场景;
2.5 devm_系列——设备托管分配
现代驱动优先使用devm_*类,自动在设备卸载时释放内存,减缓内存泄漏。
// 托管版kmalloc/kzallocvoid *devm_kmalloc(struct device *dev, size_t size, gfp_t gfp);void *devm_kzalloc(struct device *dev, size_t size, gfp_t gfp);
- 原理:将分配与device绑定,probe成功后自动管理生命周期;
- 优势:卸载驱动无需手动free,大幅降低崩溃风险;
2.6 内存分配器选型速查表
| | |
|---|
| | |
| | |
| __get_free_pages / dma_alloc | |
| | |
| | |
三、I/O内存:驱动与硬件对话的唯一通道
3.1 什么是I/O内存(MMIO)
现代SoC/嵌入式系统几乎全部使用MMIO:
- 设备寄存器、FIFO、控制单元被映射到物理地址空间;
- CPU用普通load/store指令读写,等同于访问内存;
- 与普通RAM区别:有副作用(写控制位会触发硬件动作);
3.2 I/O内存标准流程
申请资源 → 地址映射 → 安全访问 → 释放映射/资源
第一步:申请I/O内存资源
防止多个驱动抢占同一硬件地址:
// 申请一段物理I/O地址struct resource *request_mem_region( unsigned long start, unsigned long len, char *name);// 释放voidrelease_mem_region(unsignedlong start, unsignedlong len);
- 查看系统已分配:
cat /proc/iomem ,如下图所示:
第二步:物理地址 → 内核虚拟地址映射
内核无法直接使用物理地址,必须映射:
// 映射物理地址到内核虚拟空间void __iomem *ioremap(phys_addr_t phys_addr, unsignedlong size);// 取消映射voidiounmap(void __iomem *addr);
注意:返回值带__iomem,是编译器安全检查,不可强转普通指针
第三步:托管式API
一步完成申请+映射,自动释放:
// 平台设备专用void __iomem *devm_platform_ioremap_resource( struct platform_device *pdev, unsigned int index);
3.3 I/O内存安全访问:绝对禁止直接指针解引用
错误写法(驱动BUG重灾区):
// 错误!直接读写ioremap地址void __iomem *base = ioremap(0x40000000, 0x1000);u32 val = *(u32*)base;
正确做法:使用内核提供的访问器函数,处理字节序、内存屏障、架构差异:
// 小端设备,带内存屏障u32 readl(constvolatilevoid __iomem *addr);voidwritel(u32 val, volatilevoid __iomem *addr);// 无屏障版本(性能优化)u32 readl_relaxed(constvolatilevoid __iomem *addr);
完整访问规则:
四、硬件必备:时钟、复位、电源与I/O内存联动
设备能被访问的前提:时钟开启、复位释放、电源上电。
4.1 时钟管理
几乎所有外设都需要时钟,按照如下方式进行使能:
// 获取时钟struct clk *devm_clk_get(struct device *dev, const char *id);// 使能时钟intclk_prepare_enable(struct clk *clk);// 关闭时钟voidclk_disable_unprepare(struct clk *clk);
4.2 复位控制
// 获取复位struct reset_control *devm_reset_control_get(struct device *dev, int index);// 释放复位(设备工作)intreset_control_deassert(struct reset_control *rstc);// 复位设备intreset_control_assert(struct reset_control *rstc);
4.3 电源/Regulator
// 获取并使能电源intdevm_regulator_get_enable(struct device *dev);
完整驱动probe模板(典型流程):
staticintxxx_probe(struct platform_device *pdev){ struct clk *clk; void __iomem *base; // 1. 使能时钟 clk = devm_clk_get(&pdev->dev, NULL); clk_prepare_enable(clk); // 2. 释放复位 reset = devm_reset_control_get(&pdev->dev, 0); reset_control_deassert(reset); // 3. 映射I/O内存 base = devm_platform_ioremap_resource(pdev, 0); // 4. 读写寄存器 writel(0x100, base + REG_CTRL); return 0;}
五、总结
Linux 内核内存管理以物理 / 虚拟地址分离为基础,驱动优先用 kmalloc 分配物理连续内存,vmalloc 不能用于 DMA。
I/O 内存必须通过 ioremap 映射,用 readl/writel 安全访问,且必须先开时钟、解复位、上电才能操作硬件。