本文约2400字,今天继续阅读《深入Linux内核架构》中文版关于“内存管理”章节第6,7小节的内容,这两节主要讨论slab分配器和处理器高速缓存和 TLB 控制, 本文为内存管理的第三篇学习笔记。前两篇参考《【深度剖析】: Linux内核之内存管理(一)||【深度剖析】: Linux内核之内存管理(二)》
关注公众号, 即可获得与Linux相关的电子书籍(含《深入Linux内核架构》)以及常用开发工具,文末有文档清单。
一 slab分配器
[1].slab分配的原理
slab分配器由一个紧密地交织的数据和内存结构的网络组成,基本上,slab缓存由下图3-44所示的两部分组成:保存管理性数据的缓存对象和保存被管理对象的各个slab。

slab分配器解决伙伴系统的局限性:
减少内部碎片:为小对象分配精确大小的内存
提高缓存利用率:对象着色优化CPU缓存性能
减少初始化开销:重用已初始化对象
调试支持:内置检测机制发现内存访问错误
基本术语:
缓存(Cache):特定类型对象的管理器
slab:一个或多个连续页组成的内存块
对象(Object):缓存中分配的基本单元
slab的三种状态:
满slab:所有对象都已分配
空slab:所有对象都空闲
部分满slab:部分对象已分配
[2]. 实现
数据结构层次
缓存的精细结构:

//缓存描述符(kmem_cache):struct kmem_cache {struct array_cache *array[NR_CPUS]; // 每CPU空闲对象数组unsigned int batchcount; // 批量传输对象数unsigned int limit; // 空闲对象上限struct kmem_list3 lists; // slab列表管理unsigned int objsize; // 对象大小unsigned int flags; // 缓存标志unsigned int num; // 每slab对象数// ... 其他字段};
slab的精细结构:

//slab描述符(struct slab):struct slab {struct list_head list; // slab链表unsigned long colouroff; // 着色偏移void *s_mem; // slab中第一个对象unsigned int inuse; // 已用对象数kmem_bufctl_t free; // 下一个空闲对象索引};
缓存类型:
专用缓存:
为内核常用数据结构预分配(如task_struct, inode等)
提高特定对象的分配效率
通过kmem_cache_create创建
通用缓存:
提供2的幂次大小的对象缓存
通过kmalloc/kfree接口使用
大小从32字节到128KB(可能更大)
slab分配算法:
快速路径分配:
//从每CPU缓存分配对象void *____cache_alloc(struct kmem_cache *cachep, gfp_t flags){// 1. 检查本地CPU缓存// 2. 如果有空闲对象,直接返回// 3. 否则批量填充缓存}
缓存填充过程:
从部分空slab获取对象
如无部分空slab,从空slab获取
如无空slab,创建新slab
缓存回收过程:
对象返回到每CPU缓存
当缓存超过限制时,批量返回到slab
空slab可被释放回伙伴系统
着色机制:
缓存行对齐优化:
通过偏移量使对象分散在不同缓存行
减少缓存行冲突(false sharing)
提高多处理器系统性能
// 着色计算colour_off = cachep->colour_next * cachep->colour_off;cachep->colour_next++;if (cachep->colour_next >= cachep->colour_range)cachep->colour_next = 0;
[3]. 使用接口
缓存管理函数
// 创建新缓存struct kmem_cache *kmem_cache_create(const char *name,size_t size, size_t align,unsigned long flags,void (*ctor)(void*));// 销毁缓存voidkmem_cache_destroy(struct kmem_cache *cachep);对象分配和释放:// 分配对象void *kmem_cache_alloc(struct kmem_cache *cachep, gfp_t flags);// 释放对象voidkmem_cache_free(struct kmem_cache *cachep, void *objp);

通用缓存接口:
// 通用内存分配void *kmalloc(size_t size, gfp_t flags);// 内存释放voidkfree(constvoid *objp);
大小限制:
最小分配32字节(保证对齐)
最大通常128KB(依赖配置)
更大分配直接使用伙伴系统
[4]. 调试功能
内存污染检测:
红色区域(Red Zoning):对象周围添加保护字节
对象毒化(Poisoning):用特定模式填充释放的对象
分配追踪:记录分配调用栈
调试标志:
// 常见调试选项#define SLAB_DEBUG_FREE 0x00000100UL // 释放时检查#define SLAB_RED_ZONE 0x00000400UL // 红色区域#define SLAB_POISON 0x00000800UL // 对象毒化#define SLAB_STORE_USER 0x00010000UL // 存储用户信息
二 内存管理的高级主题
[1]. 内存压缩
反碎片技术
可移动性分组:
不可移动页:内核核心数据,固定位置
可回收页:文件缓存等,可重新生成
可移动页:用户空间数据,可重定位
分组策略优势:
同类型页集中存放
减少分配时的碎片问题
提高大块连续内存可用性
虚拟可移动区域:
ZONE_MOVABLE机制:
// 内核命令行参数kernelcore=nn[KMG] // 指定不可移动内存大小movablecore=nn[KMG] // 指定可移动内存大小
实现原理:
物理隔离可移动和不可移动页
防止不可移动页碎片化内存
提高内存压缩效率
[2].内存热插拔
动态内存管理
热添加内存:
运行时添加物理内存
无需重启系统
动态扩展内存域
热移除内存:
安全移除内存模块
迁移受影响页到其他区域
更新内存拓扑信息
实现机制:
内存块操作:
// 内存块状态变化intadd_memory(int nid, u64 start, u64 size);intremove_memory(u64 start, u64 size);// 在线/离线内存intonline_pages(unsignedlong pfn, unsignedlong nr_pages);intoffline_pages(unsignedlong start_pfn, unsignedlong nr_pages);
[3]. 内存策略和控制组
NUMA内存策略
策略类型:
MPOL_DEFAULT:默认策略,使用当前节点
MPOL_BIND:绑定到特定节点
MPOL_PREFERRED:优先使用指定节点
MPOL_INTERLEAVE:在节点间交错分配
策略应用:
// 设置内存策略longset_mempolicy(int mode, constunsignedlong *nodemask,unsigned long maxnode);
控制组(cgroup)内存控制器
资源限制:
内存使用上限
交换空间限制
OOM控制策略
统计信息:
当前内存使用量
内存峰值使用量
交换使用情况
[4].透明大页
大页优势
性能提升:
减少TLB失效
提高地址转换效率
降低页表遍历开销
透明大页特性:
自动合并普通页为大页
应用程序无感知
动态调整大页使用
实现机制
大页合并:
扫描符合条件的普通页区域
尝试合并为2MB或1GB大页
更新页表映射
反碎片处理:
避免大页分配因碎片失败
必要时拆分大页满足分配
平衡性能和内存利用率
[5]. 内存压缩和回收
页面回收算法
LRU列表管理:
活动列表:最近访问的页
非活动列表:候选回收页
双链策略:防止颠簸
回收优先级:
回收slab缓存
交换可交换页
回收文件缓存
OOM终止进程
内存压缩
压缩时机:
直接回收路径
内核线程定期压缩
内存严重不足时
压缩效益:
减少交换I/O开销
降低内存碎片
提高大页分配成功率
[1].分层架构:物理/虚拟分离,伙伴/slab分层
[2].硬件抽象:统一接口屏蔽体系结构差异
[3].智能防碎:可移动性分组+虚拟内存域
[4].启动创新:临时自举分配器解决"先有鸡还是先有蛋"问题
[5].性能优化:slab缓存提升小对象分配效率
以上这些内存管理机制共同构成了Linux内核高效、灵活的内存管理系统,能够适应从嵌入式设备到大型服务器的各种工作负载需求。
以上为全文内容。
这里是女程序员的笔记本
15年+嵌入式软件工程师兼二胎宝妈
分享读书心得、工作经验,自我成长和生活方式。
希望我的文字能对你有所帮助