GT300显卡架构详解

2009-10-12 作者: 艾炜翔 来源: IT世界

关键字: NVIDIA GT300 架构 

随着AMD在北京时间9月23日正式推出了Cypress(RV870),从而拉开了DX11时代的序幕《三大至尊特性 HD5800显卡发布会报道》,而作为老竞争对手,NVIDIA全新支持DX11技术的显卡Fermi(GT300)也在10月3日的国庆假期内在国外GPU技术会议上曝光《黄仁勋亲展示NV Fermi GT300实物卡》,那么这款NVIDIA的新一代显卡究竟有什么跨时代的技术呢,今天就让我们一起来看看。

  Fermi(GT300)架构详细介绍(二)双精度浮点

  每个SP都包括了32个CUDA技术处理内核(相当于GT200的4倍),可以看到上面也引入了一些新功能,以帮助提高性能。每个处理器包括一个完全流水线整数和浮点单元,它实现了都符合IEEE 754-2008浮点算法和完整的32位整数算法,。AMD公司的Cypress核心也实现了这一标准,因为它增加了对积和熔加运算(Fused Multiply-Add/FMA)的支持,每循环操作数单精度512个、单精度256个(G200仅支持单精度FMA)。所有一切都符合业界标准,计算结果不会产生意外偏差。

  此外,在每个SM包括16个加载和存储单元和4个特殊功能单元处理正弦和余弦计算(图形计算领域,所有可见图像都是由无数个三角形组成,所以正弦和余弦计算的能力也就是反映出了GPU的处理能力)。

  NVIDIA公司声称GT300架构双精度性能将大大超过现有GT200的设计改进。

  与NVIDIA声称Fermi(GT300)将要比GT200快4.25倍,这使其双精度预计可达660 GFLOPS的双精度性能的GT300,双精度浮点(FP64)性能大大提升,峰值执行率可以达到单精度浮点(FP32)的1/2,而过去只有1/8,AMD现在也不过1/5,比如Radeon HD 5870分别为单精度2.72TFlops、双精度544GFlops。由于最终核心频率未定,所以暂时还不清楚Fermi的具体浮点运算能力。




<<首页 <上一页  1  2  3  4  5  6  下一页>  末页>>  
责任编辑:熊东旭