NVIDIA顯卡新架構Fermi深入解讀與測試
Fermi,NVIDIA新一代顯卡架構代號,在這半年來亮相的頻率非常之高。“Fermi”一詞來自于著名意大利核物理學家Enrico Fermi,1938年諾貝爾物理獎得主,核反應堆技術的發明者。
在去年AMD發布DirectX 11顯卡Radeon HD 5000系列之后,NVIDIA面臨著非常大的壓力,一方面產品青黃不接,一方面Fermi架構顯卡遲遲不能推出。好在NVIDIA有著出色的市場宣傳與公關能力,消費者與品牌商們在對Fermi的無限期待中一天一天度過。
去年9月底的NVIDIA GTC大會上,也就是對手發布DirectX 11顯卡的一周后,NVIDIA CEO黃仁勛先生展示了Fermi架構的Tesla顯卡,這也是Fermi架構顯卡首度公開亮相。雖然后來因為展示的是實物還是樣卡引得一片軒然,但此舉無疑極大鼓舞了NVIDIA產品士氣,并引起全世界對Fermi的高度關注,Fermi也從此開始頻頻步入我們視野。
在隨后的CES(2010年1月)和CeBIT(2010年3月初)大會上,NVIDIA都高調展示了Fermi架構的桌面圖形卡,Fermi雖然姍姍來遲,但離我們也越來越近了。
終于在今天,2010年的3月27日,NVIDIA正式發布了它的全新桌面顯卡——Fermi架構GeForce GTX 480/470顯卡。
NVIDIA的Fermi會在視覺計算領域引發一場“核裂變”革命嗎?
◆ Fermi:新一代CUDA計算與圖形架構
在未來的游戲世界里,當顯卡的渲染速度足夠快后,真正能帶給玩家視覺震撼的是流光溢彩的表面效果和栩栩如生的物體動作,比如現在的光線追蹤和物理加速技術就是在朝著這個方向努力,然而這需要顯卡具備極強的計算能力(GPU Computing),不止是圖形渲染能力。
G80架構是NVIDIA公司最初的通用計算GPU架構,即可以做圖形渲染,也可以用來做并行計算,后來的GT200架構擴展了G80架構的特點和功能,性能得到進一步提升。新一代的Fermi架構則是繼G80架構后的又一重要GPU架構,它站在G80和GT200的肩上,幾乎是重新設計了并更注重通用計算的架構。
Fermi繼承了上代的特色,同樣也是雙架構設計,即CUDA計算架構和圖形架構,兩種架構可靈活切換,比如在游戲中需要進行物理計算時使用CUDA計算架構,需要進行渲染時使用圖形架構。
NVIDIA給Fermi的定義是:新一代CUDA計算與圖形架構。它采納了用戶在使用G80和GT200架構時給出的建議,針對雙精度運算、ECC內存容錯能力、Cache體系結構、上下文切換和原子讀寫操作等方面進行了全新的設計,通過新的架構設計不僅僅增加了計算能力,并且支持更好的可編程能力和計算效果。
Fermi架構的主要更新如下:
◎ 第三代Streaming Multiprocessor(SM)
• 每個SM包含32個CUDA Core,是GT200的4倍
• 8倍于GT200的雙精度浮點性能
• Dual Warp調度策略,一個周期內啟動兩個warp進行計算
• 每個SM有64KB的RAM,可靈活配置Shared Memory和L1緩存
◎ 第二代PTX ISA架構(PTX 2.0)
• 統一尋址空間,完整的支持C++特性
• 針對OpenCL和DirectCompute進行優化設計
• 完整支持IEEE 754-2008 32bit/64bit精度
• 通過Predication(斷言)來提高條件性能
◎ 改進的內存操作子系統
• 可配置的L1和統一的L2并行數據高速緩存
• 首個提供ECC內存支持的GPU
• 原子內存操作性能極大增強
◎ 第三代千兆線程引擎(GigaThread 3.0)
• 10倍于上一代的上下文切換能力
• 并發Kernel(核心程序)執行機制
GF100是首款采用Fermi架構的GPU,旗下的產品包括GeForce GTX 480和GTX 470,它們能夠實現所有的DirectX 11硬件特性,包括Tessellation和DirectCompute等,除了上面提到的領先的并行計算能力外,在游戲圖形性能方面也很大改善:
◎ 卓越的游戲性能
◎ 超一流的圖像質量
◎ 電影級的幾何真實效果
◎ 革命性的游戲計算架構
Fermi是相當復雜和龐大的,其晶體管數達到30億個,規模空前,這也是它遲遲不能推出的主要原因,它實在是太復雜了!