冯诺依曼架构

image.png
image.png
PC指向当前的要执行的指令
IR存储指令
image.png

不同层次的存储的访问速度

image.png

cuda不同类型变量的作用域和存储层次

image.png

举例实例

邻接差分

Memory access for twice
image.png
使用global_memory 要读取两次数组
image.png
image.png

Syncthreads

all threads in the block must wait before any is allowed to proceed

Dynamic shared memory

image.png