struct page 核心解析:Linux 物理页管理的元数据中枢
struct page 是 Linux 内核管理物理内存的核心元数据结构,为每一个基础物理页(x86-64 下默认 4KiB)提供抽象描述,支撑物理页的分配、释放、映射、回收等全生命周期操作。本文从设计理念、内存布局、字段语义、核心机制等维度,解析其空间高效复用的设计逻辑与鲁棒性保障。
一、核心定位与设计理念
1. 核心定位
struct page 是「硬件物理内存」与「内核可管理内存对象」的核心桥梁:
- • 系统中每一个基础物理页对应一个
struct page 实例; - • 内核通过操作该结构体实现对物理页的所有管理动作。
2. 设计理念:极致空间利用率
struct page 实例数量等于物理内存的基础页总数(如 16GB 内存≈400 万个实例),单个结构体的微小开销会被百万倍放大,因此设计核心是「空间复用」:
| | |
|---|
| 单结构体适配所有物理页类型(基础页/复合页/slab页/页缓存页等) | 1. 联合体(union)复用内存偏移2. 指针低段位复用为标志位3. 类型强制转换4. 填充/置零规则保障语义准确 |
二、基础属性与内存布局
1. 核心物理属性(64 位系统)
| | |
|---|
| | 匹配 L1 缓存行大小,减少缓存未命中,是「最小管理开销」的折中结果 |
| | 确保每个 struct page 独占一个 L1 缓存行,避免多实例共享缓存行的竞争 |
| | 通过 vmemmap 数组映射,可通过 pfn_to_page()/page_to_pfn() 快速关联 PFN 与结构体 |
2. 整体内存布局
64 字节空间分为三大块,结构如下:
┌─────────────────────────────────────────────────────────────────────┐│ 核心固定字段(24 字节):flags + _refcount + memcg_data(通用) │├─────────────────────────────────────────────────────────────────────┤│ 元数据联合体(40 字节):按页面类型复用(复合页/页缓存/页表等专用) │├─────────────────────────────────────────────────────────────────────┤│ 填充字段(按需补充):内存对齐 + 语义鲁棒性保障 │└─────────────────────────────────────────────────────────────────────┘
三、核心字段解析
1. 通用固定字段(所有页面类型共享)
这类字段不参与复用,是 struct page 的「基础骨架」:
| | | |
|---|
flags | | 页面属性标志位(脏页/锁定/尾页/页缓存页等),包含 Zone/Node 归属信息 | 测试:PageXXX()(如 PageDirty())设置:SetPageXXX()清除:ClearPageXXX() |
_refcount | | 全局引用计数(0 时页面可释放),涵盖内核逻辑 + 页表的所有引用 | 增加:get_page()减少:put_page()原子减+判零:put_page_testzero() |
memcg_data | | 内存控制组(cgroup)关联数据(仅 CONFIG_MEMCG 开启时有效) | 间接访问:memcg_page_get()/memcg_page_put() |
示例:flags 操作接口定义(内核源码片段)
// include/linux/page-flags.h__PAGEFLAG(Locked, locked, PF_NO_TAIL)FOLIO_FLAG(waiters, FOLIO_HEAD_PAGE)FOLIO_FLAG(referenced, FOLIO_HEAD_PAGE) FOLIO_TEST_CLEAR_FLAG(referenced, FOLIO_HEAD_PAGE) __FOLIO_SET_FLAG(referenced, FOLIO_HEAD_PAGE)PAGEFLAG(Dirty, dirty, PF_HEAD) TESTSCFLAG(Dirty, dirty, PF_HEAD) __CLEARPAGEFLAG(Dirty, dirty, PF_HEAD)PAGEFLAG(LRU, lru, PF_HEAD) __CLEARPAGEFLAG(LRU, lru, PF_HEAD) TESTCLEARFLAG(LRU, lru, PF_HEAD)FOLIO_FLAG(active, FOLIO_HEAD_PAGE) __FOLIO_CLEAR_FLAG(active, FOLIO_HEAD_PAGE) FOLIO_TEST_CLEAR_FLAG(active, FOLIO_HEAD_PAGE)PAGEFLAG(Workingset, workingset, PF_HEAD) TESTCLEARFLAG(Workingset, workingset, PF_HEAD)PAGEFLAG(Checked, checked, PF_NO_COMPOUND) /* Used by some filesystems */
2. 元数据联合体(40 字节,核心复用区域)
这是struct page设计的核心,所有成员共享同一段内存空间,仅当前页面类型对应的成员有效:
| | |
|---|
compound_head | | 指向复合页头部页的 struct page 指针,尾页通过此字段关联头部页 |
lru | | 链接到 LRU 链表的节点,支撑「最近最少使用」内存回收调度 |
mapping | | 低 2 位为标志位,高 62 位为指针(详见「匿名页/页缓存页」小节) |
ptl | | 页表修改的自旋锁,保障多 CPU 下页表操作的原子性 |
slab_list | | 链接到 slab 缓存的链表节点,仅 slab 分配器使用 |
3. 易混淆专用字段:_mapcount
- • 核心语义:仅统计物理页被「页表直接引用」的次数(区别于
_refcount 的全局引用); - • 原子操作:
atomic_inc_and_test()(检测首次引用)、atomic_add_negative(-1)(检测最后一次引用释放)。
四、关键机制:类型复用与兼容性
1. 复合页(compound page)机制
高阶页(order-N,N≥1)由多个基础页组成,为避免元数据冗余,设计「头部页+尾页」模式:
- • 头部页(head page):存储整个复合页的元数据(
_refcount/flags 等); - • 尾页(tail page):仅存储
compound_head 指针(指向头部页),其余字段无效; - • 头部页获取:
compound_head(page)(兼容头部/尾页输入); - • 复合页创建:需设置
__GFP_COMP 标志。
2. struct page ↔ struct slab 类型转换
slab 分配器复用 struct page 空间存储自身元数据:
- • 内存对齐:
struct slab 与 struct page 的前 3 个字段(flags/_refcount/memcg_data)对齐; - • 类型转换:通过
(struct slab *)page 强制转换,覆盖联合体和 _mapcount 字段。
3. struct folio:消除尾页歧义的改进
历史痛点
早期函数接收 struct page* 时,需频繁调用 compound_head() 校验是否为尾页,增加开销且易出错。
解决方案:struct folio
- • 语义约束:仅代表「非复合页」或「复合页头部页」,杜绝尾页传入;
- • 非复合页:1 个
struct folio ↔ 1 个 struct page; - • 复合页:1 个
struct folio ↔ 复合页头部 struct page(尾页无对应 struct folio);
- • 兼容设计:与
struct page 二进制兼容(内部包含 union { struct page page; }),可通过 page_folio()/folio_page() 快速转换; - • 核心价值:从类型层面消除尾页歧义,替代被动校验的
compound_head()。
五、匿名页/页缓存页:联合体典型场景
1. 元数据联合体定义(内核源码片段)
union {struct { /* Page cache and anonymous pages */ /** * @lru: Pageout list, eg. active_list protected by * lruvec->lru_lock. Sometimes used as a generic list * by the page owner. */union {struct list_head lru; /* Or, free page */struct list_head buddy_list;struct list_head pcp_list;struct llist_node pcp_llist; };struct address_space *mapping;union { pgoff_t __folio_index; /* Our offset within mapping. */ unsigned long share; /* share count for fsdax */ }; /** * @private: Mapping-private opaque data. * Usually used for buffer_heads if PagePrivate. * Used for swp_entry_t if swapcache flag set. * Indicates order in the buddy system if PageBuddy * or on pcp_llist. */ unsigned long private; };};
2. mapping 字段:低 2 位标志决定指向类型
mapping 是最易混淆的字段,其真实指向由低 2 位标志位决定(需掩码 & ~3 获取真实指针):
| | | | |
|---|
| | struct address_space | | 关联文件 inode,管理「文件偏移→物理页」映射 |
| PAGE_MAPPING_ANON | struct anon_vma | | 管理反向映射(RMAP),支撑内存回收/COW 机制 |
| PAGE_MAPPING_MOVABLE | struct movable_operations | | |
| PAGE_MAPPING_KSM | | | |
六、鲁棒性保障:填充与置零规则
为抵消「极致空间复用」带来的语义歧义风险,内核制定了严格的鲁棒性规则:
1. 填充字段的作用
- • 清零尾页标志位:确保
compound_head 中的尾页标志位为 0,避免 PageTail() 误判; - • 置零
mapping 字段:预留空间确保 mapping 默认置空,避免低 2 位残留值导致页面类型误判。
2. 全局置零规则
- • 核心要求:初始化
struct page 时,除「在用字段」外,其余字段(尤其是联合体、mapping、compound_head)全量置零; - • 实现方式:
memset(page, 0, sizeof(struct page)) 后再初始化专用字段; - • 设计目的:消除页面类型切换时的字段残留干扰(如 slab 页转为页缓存页时,避免
slab_list 残留值影响 mapping 解析)。
七、设计权衡:优点与代价