页块(Page Block)是Linux内核伙伴分配器的核心管理粒度,而迁移类型(Migrate Types)是基于页块实现的内存碎片化治理核心机制。二者协同实现了物理内存的“分类管理、动态适配”,既保障大order页块分配成功率,又平衡内存利用率与管理开销。本文将从页块基础、迁移类型设计、动态联动机制到实践意义,完整解析这一内核内存管理的核心逻辑。
一、页块:伙伴分配器的核心管理单元
页块是衔接“单个物理页”与“迁移类型隔离”“内存碎片化治理”的关键载体,其设计目标是为内存划分固定大小的管理单元,实现迁移类型的精准绑定。
1. 页块的核心定义
- • 本质:一个页块由固定数量的连续物理页组成,地址空间连续,且作为整体被伙伴分配器管理;
- 1. 物理连续性:页块内所有物理页地址连续,是伙伴分配器“合并空闲页”的基础;
- 2. 迁移类型唯一性:一个页块仅能绑定一种迁移类型,页块内所有页(无论order大小)均继承该类型。
页块大小的内核定义
页块大小由pageblock_order决定(默认对应2^10=1024个基础页,即4MiB@4KiB页大小),核心宏定义逻辑如下:
// 页块order的核心依赖链#ifndef CONFIG_ARCH_FORCE_MAX_ORDER#define MAX_PAGE_ORDER 10#else#define MAX_PAGE_ORDER CONFIG_ARCH_FORCE_MAX_ORDER#endif#ifndef CONFIG_PAGE_BLOCK_MAX_ORDER#define PAGE_BLOCK_MAX_ORDER MAX_PAGE_ORDER#else#define PAGE_BLOCK_MAX_ORDER CONFIG_PAGE_BLOCK_MAX_ORDER#endif#if defined(CONFIG_HUGETLB_PAGE)#ifdef CONFIG_HUGETLB_PAGE_SIZE_VARIABLEextern unsigned int pageblock_order;#else#define pageblock_order MIN_T(unsigned int, HUGETLB_PAGE_ORDER, PAGE_BLOCK_MAX_ORDER)#endif#elif defined(CONFIG_TRANSPARENT_HUGEPAGE)#define pageblock_order MIN_T(unsigned int, HPAGE_PMD_ORDER, PAGE_BLOCK_MAX_ORDER)#else#define pageblock_order PAGE_BLOCK_MAX_ORDER#endif
内核选择“页块级”而非“单页级”绑定迁移类型,核心是平衡“管理开销”与“碎片化治理效果”。
2. 页块的初始化
系统启动早期(boot阶段),所有页块通过memmap_init_zone_range()->memmap_init_range()->set_pageblock_migratetype()默认标记为MIGRATE_MOVABLE(可迁移),仅两类例外:
- • CMA预留区域:启用
CONFIG_CMA时,CMA预留区页块直接初始化为MIGRATE_CMA; - • 内核预留区域:内核镜像加载区、页表根区等关键内存页块,初始化为
MIGRATE_UNMOVABLE(不可迁移)。
3. 页块的核心作用
页块的设计弥补了伙伴分配器“按order管理”的局限性,核心作用集中在两类:
- 1. 迁移类型的最小绑定单元:内核以页块为单位标记迁移类型,存储在
struct zone的pageblock_flags数组中,伙伴分配器的分配/释放/合并均遵循“同迁移类型”原则; - 2. 内存规整的基本操作单位:内存规整线程(
kcompactd)按页块扫描,仅对MIGRATE_MOVABLE类型页块执行迁移操作,腾出连续空闲块; - • 小order(≤
pageblock_order):一个页块可拆分为多个小order块,共享迁移类型; - • 大order(>
pageblock_order):需多个连续同类型页块拼接,是内存规整的核心目标。
二、迁移类型:碎片化治理的核心机制
迁移类型是对“物理页块可迁移性”的标识,通过将页块按可迁移性分类管理,从源头规避不可迁移页导致的永久性碎片化。
1. 设计目标与动机
核心目标
- • 缓解内存碎片化:分离不可迁移/可迁移页,保障大order页块分配成功率;
- • 支撑内存规整:明确页块可迁移属性,提升规整效率;
- • 适配特殊场景:为CMA、内存热插拔等提供专用页块管理;
- • 平衡效率与利用率:支持类型回退机制,避免分类过细导致分配失败。
设计动机
伙伴分配器的“拆分-合并”仅能重组离散页块,但无法解决“不可迁移页切割连续内存”的问题:不可迁移页(如内核页表、DMA缓冲区)地址固定,分散在连续内存中会导致大order分配失败;迁移类型通过“分类隔离”规避该问题。
2. 核心分类与特性
内核预定义5种核心迁移类型,覆盖所有物理页场景:
| | | | | |
|---|
MIGRATE_UNMOVABLE | | 内核核心数据、页表、DMA缓冲区、不可回收内核模块数据 | | | |
MIGRATE_MOVABLE | | | | | |
MIGRATE_RECLAIMABLE | | 可回收内核页(slab缓存、目录项缓存、临时缓冲区) | | | |
MIGRATE_CMA | | | | | |
MIGRATE_ISOLATE | | | | | |
3. 存储与访问接口
迁移类型存储与访问需保证高效性,核心设计如下:
存储位置
- • 核心载体:
struct mem_section_usage->pageblock_flags[](每个页块对应一个元素); - • 存储粒度:迁移类型占用低4位(
MIGRATE_TYPE_MASK = 0x0F),其余位存储页块其他属性; - • 关联关系:与“段(section)-页块”强绑定,适配稀疏内存模型。
核心访问接口
| | |
|---|
| get_pageblock_migratetype(struct page *page) | O(1):通过PFN定位页块,读取pageblock_flags低4位 |
| set_pageblock_migratetype(struct page *page, int type) | |
| pageblock_migratable(struct page *page) | 判断是否为MOVABLE/RECLAIMABLE/CMA类型 |
三、页块迁移类型的动态调整与联动机制
页块的迁移类型并非固定不变,内核会根据内存用途动态修改,且全程遵循“拆分/合并同类型”规则;同时迁移类型深度嵌入伙伴分配器全流程。
1. 迁移类型动态修改的核心场景
内核修改页块类型的核心目标是“让类型匹配内存用途”,主要场景包括:
场景1:不可迁移内存分配(MOVABLE → UNMOVABLE)
内核申请不可迁移内存(如页表、DMA缓冲区)时,若无空闲UNMOVABLE页块,会将空闲MOVABLE页块改为UNMOVABLE,避免内存规整导致地址失效。
场景2:可回收内存分配(MOVABLE → RECLAIMABLE)
申请可回收内存(如页缓存、slab可回收缓存)时,若无空闲RECLAIMABLE页块,将空闲MOVABLE页块改为RECLAIMABLE,提升内存回收效率。
场景3:CMA页块的临时复用与恢复
- • 空闲时:
CMA页块改为MOVABLE,允许普通用户态内存分配(提升利用率); - • 需要时:改回
CMA,迁移走内部MOVABLE页,恢复连续空闲区。
场景4:内存规整/热插拔的临时隔离
- • 内存规整:
kcompactd将MOVABLE页块临时标记为ISOLATE,规整完成后改回; - • 内存热插拔:下线内存时将目标页块改为
ISOLATE,确保无新分配后释放资源。
2. 迁移类型修改的核心机制(不破坏规则)
内核修改页块类型时,严格遵循两大规则,确保不破坏“拆分/合并同类型”约束:
- 1. 页块级原子性:修改整个页块的类型,内部所有order块同步继承新类型;
- 2. 全空闲时修改:仅当页块内所有order块合并为完整页块(无已分配小order块)时才修改。
核心代码逻辑(简化版)
// 修改指定页块的迁移类型(确保页块全空闲)int change_pageblock_range(struct zone *zone, unsigned long start_pfn, unsigned long nr_pages, int new_type) { // 1. 检查页块是否全空闲(无拆分的小order块) if (!pageblock_is_free(zone, start_pfn)) { return -EBUSY; // 有已分配的小order块,暂不修改 } // 2. 计算页块索引 unsigned long block_idx = (start_pfn - zone->zone_start_pfn) / pageblock_nr_pages; // 3. 原子修改pageblock_flags中的迁移类型 set_bit_inv(block_idx, zone->pageblock_flags, new_type); // 4. 更新该页块所属的free_area链表(从旧类型链表移到新类型) move_pageblock_to_new_migratetype(zone, start_pfn, new_type); return 0;}
修改过程通过zone->lock加锁,若页块内有未合并的小order块,内核会等待其释放合并后再操作。
四、特殊迁移类型的细节与实践
1. MIGRATE_CMA:复用与恢复的平衡
- • 初始化:CMA预留区页块初始为
MIGRATE_CMA; - • 空闲复用:改为
MIGRATE_MOVABLE,允许普通内存分配; - • 按需恢复:设备驱动申请大连续内存时,改回
MIGRATE_CMA,迁移走内部MOVABLE页,恢复连续空间; - • 核心保障:修改前确保页块全空闲,无未合并的小order块。
2. MIGRATE_ISOLATE:临时隔离的支撑
- • 临时性:仅用于内存热插拔、规整、故障页处理,非持久化类型;
- • 隔离效果:标记为
ISOLATE的页块移出空闲链表,不参与分配/合并; - • 恢复机制:操作完成后通过
set_pageblock_migratetype()恢复原类型。
3. MIGRATE_UNMOVABLE:碎片化的核心管控
- • 分配限制:仅内核关键路径(页表创建、DMA初始化)可申请,用户态无法直接分配;
- • 碎片化管控:严格限制分配大小,避免占用过大连续块;
- • 热插拔适配:可标记为
ISOLATE后离线,实现物理内存动态移除。
五、核心总结与实践意义
1. 核心价值
- • 页块是迁移类型的载体,实现了“粗粒度管理、精准化绑定”,平衡管理开销与碎片化治理效果;
- • 迁移类型是解决“永久性碎片化”的关键,通过分类管理实现大order页块分配成功率与内存利用率的平衡;
- • 动态修改机制让页块类型匹配内存用途,同时严格遵循“页块级原子性+全空闲修改”,保障伙伴分配器规则不被破坏。
2. 实践意义
- • 排查大页分配失败:需检查
UNMOVABLE类型页块的分布、CMA区域复用状态; - • 优化内存碎片化:调整迁移类型回退优先级、CMA预留大小,或优化
kcompactd规整策略; - • 虚拟化/驱动场景:虚拟机内存标记为
MOVABLE提升规整效率,驱动大内存分配依赖MIGRATE_CMA的预留与恢复机制。
页块与迁移类型的协同设计,是Linux内核内存管理“高效分配+碎片化治理”的核心体现,理解其逻辑是优化系统内存性能、排查内存相关问题的基础。