当前位置：首页 > 系统教程 > 正文

深入浅出Linux页表机制（x86_64架构从入门到精通）

主机测评网
系统教程
2026-03-06
754

深入浅出Linux页表机制（x86_64架构从入门到精通）

在计算机系统中，内存管理是操作系统的核心功能之一。现代操作系统采用虚拟内存技术，为每个进程提供独立的地址空间，而虚拟地址到物理地址的转换则依赖于页表（Page Table）。本文将聚焦x86_64架构下的Linux页表机制，从基础概念到内核实现，带你彻底理解地址转换的全过程。

1. 为什么需要页表？

如果程序直接操作物理内存，会出现多个进程冲突、内存碎片、安全性差等问题。分页机制通过引入虚拟地址空间，让每个进程认为自己拥有连续的内存，而实际物理内存可能不连续。页表就是记录虚拟页到物理页框映射的“字典”。

2. x86_64页表硬件基础

x86_64架构目前使用4级页表（某些场景支持5级），分别是：页全局目录（PGD）、页上级目录（PUD）、页中间目录（PMD）、页表（PTE）。每个层级占用9位索引（4级共36位），加上12位页内偏移，构成48位虚拟地址。控制寄存器CR3保存顶级页表（PGD）的物理地址。

PGD（Page Global Directory）：CR3指向的页表，每个表项指向一个PUD页。
PUD（Page Upper Directory）：每个表项指向一个PMD页。
PMD（Page Middle Directory）：每个表项指向一个PTE页。
PTE（Page Table Entry）：每个表项指向最终的物理页框，并包含标志位（如存在位、读写位等）。

这一系列查表过程就是地址转换的核心。每次内存访问，CPU都会自动遍历这四级页表，最终得到物理地址。

3. Linux对页表的软件抽象

Linux内核将硬件页表进一步封装，提供通用的页表操作接口。在x86_64内存管理中，每个进程有独立的页表（内核线程共享内核页表）。创建进程时，通过复制父进程页表实现写时复制（COW），极大节省内存。

Linux定义了pgd_t、pud_t、pmd_t、pte_t等类型，并提供一组宏（如pgd_offset、pte_offset）来遍历页表。当发生缺页异常时，内核根据缺页地址查找页表，若页表项为空则分配新页框，并更新页表。

4. 页表项格式与标志位

以x86_64为例，一个64位的页表项包含物理页框基址（高位）和标志位（低位）。常见标志：P（存在位）、R/W（读写权限）、U/S（用户/超级用户）、A（访问位）、D（脏位）等。这些标志位控制着页面的访问行为和缓存策略。

    // 示例：页表项结构（简化）typedef struct {unsigned long present : 1;unsigned long rw : 1;unsigned long user : 1;unsigned long pwt : 1;unsigned long pcd : 1;unsigned long accessed : 1;unsigned long dirty : 1;unsigned long pat : 1;unsigned long global : 1;unsigned long ignored : 3;unsigned long pfn : 40; // 物理页框号} pte_t;