原理 - 缓存一致性 - 《并发编程》

0x1 cpu缓存体系结构

现代cpu缓存体系结构

现代cpu的运行速度远远超过了内存的访问速度，一次的内存访问与一次的cpu访问是2个数量级的区别，最终执行每条指令都需要等待内存加载，导致cpu流水线停顿。因此现代cpu在内存之上加了多级的高速缓存，缓解由于不对称带来的性能损耗。

缓存利用了程序的局部性原理，使得大多数的访问都能维持在高速缓存。

下图是一个32位的，具有16个Set，2个way，每个缓存行256字节的高速缓存。

缓存一致性 - 图3

缓存行定位策略	优点	缺点
tag/index为虚拟地址	访问无需经过页表的转换	1. 进程切换会导致缓存失效 1. 共享的内存需要保存多份
tag/index为物理地址	与虚拟地址相反
tag为物理地址，inde为虚拟地址（虚拟地址和物理地址具有相同的页内偏移，而且比高速缓存的index+offset大）	地址转换和高速缓存读取可以并行提高读取效率

缓存存在的回写策略
- write-back：只写缓存，只有缓存被淘汰的时候才需要写入内存
- write_through：同时写缓存和内存
缓存失效的写入策略
- 写分配：分配缓存，将所需要写的数据写入缓存
- 不按写分配：直接写入内存 | 回写策略 | 分配策略 | 当……时 | 写到…… | | —- | —- | —- | —- | | 写回 | 分配 | 命中 | 缓存 | | 写回 | 分配 | 失效 | 缓存 | | 写回 | 非分配 | 命中 | 缓存 | | 写回 | 非分配 | 失效 | 内存 | | 写通 | 分配 | 命中 | 快取和内存 | | 写通 | 分配 | 失效 | 快取和内存 | | 写通 | 非分配 | 命中 | 快取和内存 | | 写通 | 非分配 | 失效 | 内存 |