深刻理解虚拟内存机制

张开发
2026/4/6 21:33:52 15 分钟阅读

分享文章

深刻理解虚拟内存机制
注意页框和页大小一样只是为了区分物理和虚拟本文统称为页声明本文借鉴参考小林coding和鸭大坑导进行整合有些个人理解站在巨人的肩膀上学习文章目录为什么要有虚拟内存怎么解决上述问题内存分页机制多级页表TLB页表项的属性缺页异常总结虚拟地址到物理地址映射全流程为什么要有虚拟内存虚拟内存的本质是给每个进程提供一个独立、连续、受保护、可控制的抽象空间没有虚拟内存会发生什么进程无法天然隔离进程A可以访问某段物理地址进程B也能访问这段地址程序需要连续的空间但是物理内存是离散的真实物理内存长期运行一定会碎片化不能高效按需分配了怎么解决上述问题加个中间层进程 虚拟内存 物理内存把所有进程使用的地址隔离开让每个进程都有独立的一套虚拟地址每个进程都有大家自己使用自己的地址互不干扰现在每个进程就不会直接访问物理内存了OS提供一种机制把不同进程的虚拟地址和不同的物理内存进行映射虚拟地址通过MMU操作映射到真实的物理地址内存分页机制分页是把连续的虚拟地址空间映射到离散的物理页框上这个固定大小的内存空间叫做页针对虚拟内存或页框针对物理内存Linux下一页为4KB通过什么方式映射虚拟地址和物理地址通过页表连续的数组来映射页表存储在内存中MMU把虚拟地址转换成物理地址当进程访问的虚拟地址在页表中查不到时触发缺页异常系统进入内核分配物理内存更新页表最后返回用户空间回复进程运行具体怎么映射把虚拟内存地址切分成页号和页偏移量根据页号从页表里面查询对应的物理页号拿物理页号加上前面的偏移量得到真实物理地址一次映射有什么缺陷在32位操作系统一个进程看到的虚拟地址空间大小是​2 32 4 G B 2^{32} 4GB2324GB页表大小是4KB:​4 K B 2 12 4KB 2^{12}4KB212整个4GB空间会被分割成​2 32 ÷ 2 12 2 20 2^{32} \div 2 ^{12} 2^{20}232÷212220大约100万张页表使用一级页表每个虚拟页号对应一个物理页号就形成一个页表项映射关系一共有2 20 2^{20}220个页表项每个页表项4字节页表大小是2 20 × 4 字节 4 M B 2^{20} \times 4字节 4MB220×4字节4MB那么就会出现如下问题页表太大100个进程就要400MB了很多页表根本用不到虚拟地址空间是4GB但是一个进程并不会真的把4GB全用满了不管你用不用以及页表都会把整个4GB地址空间对应的页表项准备好浪费很多空间连续大的内存不好找页表是一个很大的线性数组分配管理不方便多级页表连续大的数组太难存就把数组打散把4MB的大表切割成1024个小表4KB散落在内存中—形成二级页表每个二级页表又包含1024个页表项拆完之后的结构一级页表页目录放1024个指针每个指针指向一个二级页表二级页表页表项放1024个真正的映射关系现在32位地址怎么拆分才能支持二级查找高20位虚拟页号前10位去一级页表找二级页表位置后10位去二级页表找对应物理页号低12位页内偏移—找到最终物理地址为什么多级页表会省内存原来的一级页表必须全部分配1024个小表每个小表4KB全部分配4MB二级页表是按需分配只给真正用到的虚拟地址分配对应的二级页表举个例子假设一个进程用了8MB虚拟空间​8 M B ÷ 4 K B 2 32 ÷ 2 12 2 11 2048 页 8MB \div 4KB 2^{32} \div 2^{12} 2^{11} 2048页8MB÷4KB232÷2122112048页每个二级页表可以管理1024页2048页只需要2个二级页表外加一个一级页表内存开销​4 K B 8 K B 12 K B 4KB 8KB 12KB4KB8KB12KB多级页表的本质就是按需分配TLB多级页表解决了空间问题现在多级页表之间的映射时间问题TLB来解决根据程序局部性原理在一段时间内整个程序的执行仅限于程序中的某个部分相应的执行所访问的存储空间页局限于某个内存区域CPU给MMU传新的虚拟地址之后MMU先去问TLB那边有没有有的话直接拿物理地址不用查表了。但是TLB容量较小难免会缓存未命中此时才走页表找到物理内存还没完TLB会把这条映射关系所在的页缓存后面利用局部性原理就能减少查表了页表项的属性上文中是为了宏观理解把页表项当作虚拟页号和物理页号的映射关系宏观上没有问题现在从微观角度剖析页表项由物理页号一组属性位构成具体的属性有有效位缺页异常的开关标识当前虚拟页对应的物理页是否在内存中程序访问某个地址时MMU查到有效位是0触发缺页异常内核去磁盘找对应的物理内存读写位标识这块内存的访问权限只读区域被写了触发缺页异常权限位标识这个页是用户态可以访问还是只有内核态才能访问用户态访问了内核态专属页触发缺页异常修改位标识这个页被加载到内存中有没有被修改过物理内存满了OS要把某页放回磁盘先看修改位修改位0说明没有修改过直接丢弃节省一次磁盘写操作修改位1老老实实写回磁盘更新缺页异常缺页异常的本质是MMU校验页表项属性不达标无法完成地址翻译向操作系统发送的求救信号分为三种缺页硬缺页场景程序启动加载大文件内存不够用数据被换到了磁盘上流程查表发现有效位为0内核判断是合法的地址但是数据在磁盘中OS发起次磁盘IO直到数据读完把物理页填到页表更新有效位重新执行上次中断的命令软缺页场景共享内存两个进程同时加载一个动态库A已经加载到内存了B访问触发缺页写时拷贝fork出子进程一开始和父进程共享物理内存只读两个进程有一个尝试写数据触发缺页流程查表发现有效位为0或者读写位不匹配内核判断数据已经在物理内存or触发写时拷贝逻辑不进行磁盘IO只修改页表映射关系共享内存或者复制物理页写时拷贝重新执行上次中断的命令无效缺页场景空指针解引用、操作野指针越界访问访问没有申请的虚拟地址权限错误写只读段、用户态访问内核态地址OS判断行为不合法直接发信号显示段错误杀死进程总结虚拟地址到物理地址映射全流程TLB命中TLB未命中属性校验通过属性校验不通过硬缺页软缺页无效缺页进程发起虚拟地址访问CPU将虚拟地址传递给MMUMMU查询TLB快表提取物理页号 页内偏移 → 拼接物理地址拆分虚拟地址高20位前10位后10位虚拟页号 低12位页内偏移访问物理内存一级页表页目录前10位索引找二级页表指针二级页表后10位索引找页表项校验页表项属性有效位/读写位/权限位等提取物理页号 页内偏移 → 拼接物理地址将该映射关系缓存到TLB触发缺页异常OS内核介入处理判定缺页类型确认地址合法-磁盘IO-更新页表项共享内存修改页表映射写时拷贝复制物理页更新映射更新页表项OS发送段错误信号 → 终止进程重新执行地址访问流程done~

更多文章