GT300显卡架构详解

2009-10-12 作者: 艾炜翔 来源: IT世界

关键字: NVIDIA GT300 架构 

随着AMD在北京时间9月23日正式推出了Cypress(RV870),从而拉开了DX11时代的序幕《三大至尊特性 HD5800显卡发布会报道》,而作为老竞争对手,NVIDIA全新支持DX11技术的显卡Fermi(GT300)也在10月3日的国庆假期内在国外GPU技术会议上曝光《黄仁勋亲展示NV Fermi GT300实物卡》,那么这款NVIDIA的新一代显卡究竟有什么跨时代的技术呢,今天就让我们一起来看看。

  Fermi(GT300)架构详细介绍(一)CUDA技术

  如果往高了看,Fermi(GT300)架构的目的直接反映出目前NVIDIA的CUDA技术在向前发展。在这个程序中的执行模式有threads, thread blocks,和grids of thread blocks ,所有都是一种与众不同的内存访问和内核技术,完全和目前的技术不同。

  最核心的流处理器(Streaming Processor/SP)现在不但数量大增,而且还有了个全新的名字CUDA核心(CUDA cores per Shader Cluster)。而线程块(thread block)就是有能力相互合作和沟通的线程(thread)集合,通过每块共享内存组。每块可支持多达1536并发线程,各自有独立通道,独立记忆,计数器,etc等;其实每一个控制极(grids of thread blocks)都是一个线程块停止后在运行另外一个相同的线程块,但有能力从整个内存中阵列读写(但只有在内核范围同步)。

  这些软件技术与NVIDIA目前流媒体处理器和CUDA内核的GPU的形式匹配,在GPU本身对线程块控制极起到调配,每个SM(也可以说是SMs)的组合操作执行一个或多个线程块和CUDA核心(如NVIDIA公司他们现在所称的那样)执行线程。将32个线程组称为一个“Warp”,这样有助于提高GPU的效率。

  这一架构的首次实施,让我们相当盼望GT300的到来,并且会出现一些令人印象深刻的规格: GPU是由30亿个晶体管组成,并采用512个CUDA技术核心(也就是着色处理器)为16组32个流媒体处理器组。该记忆体架构是围绕一个新的GDDR5显存实施的,有6通道64bits,总数为384bits的显存带宽。新的显存系统可以在技术上支持的高达6GB的显存容量——这是高性能计算应用的关键。




<<首页 <上一页  1  2  3  4  5  6  下一页>  末页>>  
责任编辑:熊东旭