NVIDIA CUDA统一计算设备架构编程手册(三)

2009-6-18 作者: icuda 来源: icuda

关键字: NVIDIA GPU CUDA 手册 

  硬件实现

  3.1具有芯片共享内存的一组SIMD多处理器

  设备作为一组多处理器(multiprocessors)来实现,如图3-1所示。每个多处理器具有单指令多数据(SIMD)架构:在任何给定的时钟周期,多处理器的每个处理器执行相同的指令,但操作在不同的数据上。

  每个多处理器具有下列四种类型的芯片内存储器:

  1、每个处理器有一组本地32位寄存器

  2、并行数据高速缓存或称为共享内存(shared memory),由所有处理器共享并实现共享内存空间

  3、只读常量高速缓存(constant cache),由所有处理器共享并加速从常量内存空间的读取,实现为设备内存的只读区域

  4、只读纹理高速缓存(texture cache),由所有处理器共享并加速从纹理内存空间的读取,实现为设备内存的只读区域

  本地和全局内存空间为设备内存的读写区域,且无高速缓存。

  每个多处理器通过纹理单位(texture unit)访问纹理高速缓存,其中纹理单位实现2.3一节提到的各种寻址模式和数据筛选。

  具有芯片共享内存的一组SIMD多处理器。


图3-1. 硬件模型




责任编辑:熊东旭