GT300显卡架构详解

2009-10-12 作者: 艾炜翔 来源: IT世界

关键字: NVIDIA GT300 架构 

随着AMD在北京时间9月23日正式推出了Cypress(RV870),从而拉开了DX11时代的序幕《三大至尊特性 HD5800显卡发布会报道》,而作为老竞争对手,NVIDIA全新支持DX11技术的显卡Fermi(GT300)也在10月3日的国庆假期内在国外GPU技术会议上曝光《黄仁勋亲展示NV Fermi GT300实物卡》,那么这款NVIDIA的新一代显卡究竟有什么跨时代的技术呢,今天就让我们一起来看看。

  Fermi(GT300)架构详细介绍(五)指令集架构

  除了这些原始的计算能力,当然NVIDIA公司希望Fermi(GT300)还有一些别的竞争优势。第一个就是是新的ISA(指令集架构),这是一个全新的技术,以支持目前最流行的编程语言C++。通过包括建立统一的寻址空间,简化为一种指令,内存地址取决于存储位置:最低位是本地,然后是共享,剩下的是全局。这种统一寻址空间是支持C++的必需前提。NVIDIA的架构可以支持对象和不受限制的无限指针位置面向对象编程模型的支持。仅此功能就可以帮助到CUDA和GPU计算的许多开发者。

  NVIDIA公司还指出,这一新的ISA完全是为了OpenCL和DirectCompute准备的。并且像线程,线程块和线程块控制器以及共享内存等等,都是为这些即将到来的计算语言做支持的。而且NVIDIA宣布了一个名为“Nexus”的插件,可以在Visual Studio里执行CUDA代码的硬件调试,相当于把GPU当成CPU看待,难度大大降低。能提高游戏和GPU计算代码的性能。该功能听起来非常类似于分支预测单元。

  Fermi(GT300)架构详细介绍(六)内存子系统创新

  前面我们已经讨论了共享内存和L1缓存的好处,其实从其他应用程序上来说共享内存有很大的灵活性。另外,L1将存储临时数据,从而可以提高整体内存访问时间。

  NVIDIA也包括了768KB的二级缓存,在16个SM中。二级缓存可改善了应用程序在32个CUDA技术核心和各个SM中连接的作用,工作效率大大提高。

  NVIDIA还采取新的技术,以执行ECC内存错误校验。虽然不是普通消费者的问题,但是对与服务器的处理有非常大的作用,ECC是一个稳定环境的重要组成部分。L1和L2缓存、和GDDR5内存控制器中都支持ECC。

  Fermi(GT300)架构详细介绍(七)GigaThread调度

  同时更新的线程调度是Fermi(GT300)值得讨论的新功能。首先是将切换功能低至10-20微秒。切换功能可以应用在GPU使用需要上,还可以应用在程序之间的交换,例如渲染和PhysX物理处理图形之间的转换上。这可能让开发人员可以使用GPU来做更多的计算能力应用这些非图形的目的。

  第二个主要的更新是与内核同时执行的,可以称为GPU的超线程。其实就是允许一个程序,只使用一个内核(以及它们控制的SMs和CUDA核心),超线程技术让GPU增加稍许的裸晶面积,就可以换来较高的效能提升。这样确实是对GPU技术的颠覆。




<<首页 <上一页  1  2  3  4  5  6  下一页>  末页>>  
责任编辑:熊东旭