ATI 800 個串流處理器相當於nVidia多少SP

如果說

ATI 800 個串流處理器 是SP的話

那Nvidia 240 SP 豈不是輸給ATI

但有其它朋友說 ATI 800 個串流處理器 換算成 Nvidia 的SP

大約只有200 SP

請問這是怎麼算的? 有哪些依據嗎?

請各位大大讓小弟長知識吧 實在不懂~!!
2009-04-09 0:26 發佈
這是沒有根據的
而且兩家技術隨時在更動,隨時在進步
如果說ati800個SP相當於Nvidia 200個
那當年的9800XT vs 5900 又怎麼說?
未來的ATI5800系列 GTX300系列 又會怎樣? 沒有規律的

就像Q9550 L2 12MB
17卻只有 1MB L2
但i7卻比Q9000還強

產品一直在更新,這些資訊永遠追不完,你也不用去記,因為記了也沒用,明年就洗牌了
基本上兩家公司的顯卡架構不同..雖然自dx9之後..統一由sp負責影像計算生成..自然的..
sp的數量越多..顯卡的效能會越高..

不過,在nv的設計裡每個sp都是一個具備完整計算能力的核心.可以獨立進行任何的計算
但 ati的sp是以five way VLIW 的單元群組化為一 SIMD 陣列 ,簡單的說
裏面包含四個單元可以執行一個 FMAD 或一個整數加法,以及一個特殊單元可執行一個 FMAD 或一個整數乘法或一個超越函數 (正弦、餘弦、log、指數等)。所以,當顯卡執行的運算式需要特殊單元才具備的運算能力時,等於800/5=160 VLIW(sp)..所以若是嚴格說來48x0系列只相當於160sp..
但若不需要特殊單元時的運算其餘四個單元的確是具備更佳的計算能力..

總之這樣的換算並無實質意義..也無法據此比較..

不過,可以肯定的是..nv的設計不依賴底層程式碼(驅動)而提高了達到尖峰效能的機會
而ati對驅動程式的依賴就較深..但這種架構可以節省電晶體減少無謂的功耗
ATI的VLIW架構800SP每個都有辦法做FMAD,乘法或加法運算.
5Way VLIW X 160組 = 800SP
5Way VLIW = 5 SP 一組 = 4個簡單運算用SP + 1個特殊複雜運算用SP

它的5Way VLIW就是4+1個SP, 總共5 SP一組.
5SP 可以同時執行5個MAD或5個乘法或5個加......
4個是簡單SP, 只能算MAD,乘法,加法之類常用運算
+1個複雜SP, 甚麼都能算,包括某些不常用的運算例如sin,cos,或FP64運算.

800SP同時做MAD時, 0.8Ghz可以達到1.2Tflops.
800SP x 2Flops(MAD) X 0.8Ghz =1200Gflops
若Shader的運算大多是vec4的MAD(乘積運算)時,
ATI 800SP就真的是用800SP的峰值效能 ,1.2T flops的超高速在跑.....這時NV架構完全跟不上.
(NV架構240SP即使時脈高了1.6倍, 跑MAD峰值效能也只有0.6T flops)
但是某些不常用的運算,ATI的比較弱, 因為有些運算只有複雜SP能做效能會下降,
VLIW架構的指令執行效率也稍微差一點.


而nVidia的Scalar架構SP雖然比Ati少很多, 不過它SP時脈比較高, 比ATI的時脈高了1.6x倍以上.
所以NV 240SP數量約可以相當於400個Ati的SP數量來看.
且NV的SP可以"同時" .做1個MAD加1個額外的乘法.(ATI只能做1個MAD "或" 1個乘法)
所以以單一SP來說, 每cycle運算效率比ATI的好.
240SP同時做MAD+MUL時, 240SP跑1.3Ghz可以達到0.93Tflops.
240SP X (2+1)flops(MAD+MUL) x 1.3Ghz = 930Gflops
雖然這數據比較低, 不過由於它不分簡單SP複雜SP, 所以效能比較不受指令影響.
而且Scalar架構的指令執行效率也稍好一點.

其實VLIW和Scalar差異, 還影響驅動程式裡的Shader compiler的效率.
就這解釋起來又更複雜.....所以算了.

不同的運算資料, 有時ATI 800SP強, 有時NV 240SP強,
因為架構不一樣, 沒辦法說誰好誰壞,各有優點.

但以電晶體成本的運用效率來說, ATI的設計明顯比較好.
因為同面積Peak Performance比較高,而且是高很多!
NV的1個Scalar架構SP的電晶體數量, 竟然和ATI的1組VLIW的5個SP一樣大......
(Die photo上兩者SP總面積都佔6成, 除以SP數量.....)
雖然以單一SP來說性能很好, 但是成本上沒辦法比的上ATI,
而且ATI支援DX10.1, 而NV只支援DX10.0

RV770用956M電晶體就能有1.2T flops. ( 每1M電晶體平均提供1.25Gflops.)
而GT200多用了45%的電晶體成本, 總共1400M電晶體卻只有0.93Tflops.
(每1M電晶體平均只能提供0.66Gflops.)

雖然GT200的SP效率比較好,0.93Tflops通常能順利打平甚至小贏RV770的1.2Tflops.
但是成本上卻是大輸.

整體上是Ati的設計比較有效率, 它的RV770只有GT280的2/3電晶體.但是性能卻不會輸到1/3.
(或者說NV比Ati多用了45%的電晶體成本(成本影響價格), 效能上卻沒有辦法贏的很大.)
結果導致ATI可以用2個中高階晶片輕鬆打死1個最高階的NV產品.

ATI的設計是追求同樣電晶體成本時最高效率的設計,比較重視C/P值.
NV的設計是用最多的電晶體成本衝最高效能的設計, 在一個晶片的領域一定是卡王,

NV習慣的遊戲規則是,只要性能最好, 卡王價錢就任它開 , 所以硬體成本可以不管,
(就像股王的本益比不能照一般股票算)
就算要賣2萬,玩家也只能乖乖付錢.

但是遇到ATI這種改變遊戲規則的新設計方向, NV就很難對打,
因為這一次ATI根本擺明了放棄追求單一晶片卡王的封號, 利潤比面子重要...........
NV的設計單晶片效能雖然好,但是良率太低, 成本一直過高.
而ATI卻是連高階晶片都有很高良率,成本合理.
單晶片效能不是最好, 那就兩顆封裝成一顆!
之前, ATI就直接用兩顆成本較低的RV770晶片的單卡, 一樣把昂貴的單一大晶片GT280卡王打趴.

畢竟2個HD4850總共2.1 Tflops的效能要打掛只有0.93Tflops的GT280並不難,
就算NV的SP效率再怎麼好. 峰值效能落差大到這種程度也無能為力.
所以導致NV當時的最新GT200系列價格瞬間崩盤......
NV高階卡幾乎是賠錢賣, 而ATI高階卡兩顆晶片當一顆賣卻還有賺.

NV被逼得一直狂用Geforce9的舊設計來改名GT1xx GT2xx繼續賣,
也是因為舊的Geforce9核心反而比它新的GT280核心更能適應新的遊戲規則.

所以不必管幾SP或是甚麼架構, 直接看同樣成本(價錢).
哪一張卡花費的錢比較划算就對了, 跑某遊戲,每100美金能跑多少FPS.
就算同級產品中不是效能最好的,但是便宜很多, 那它就是最好的選擇.
Waffenss01 wrote:
ATI的VLIW架構...(恕刪)


大大這篇真是專業好文

解答了我心中的疑惑XDD

推一個


(可以借我保存下來看嗎QQ?
這看下來...

好像是CPU設計中 CISC v.s. RISC

上面那位網兄真的是解釋得非常詳盡,當然,我之前就已強調架構不同無法直接比較sp數量的多寡而
判別何者得效能或是架構較強,重點就是運算資料的不同就會造成差異..
所以,真的不要去迷信或有產品情結,還是須視自己平常使用的範圍(比方說多使用哪方面的功能或是玩哪些game)
然後參照各大測試網站的測試結果,才能真正買到適合自己的產品..

題外話ati這次顯示核心從rv600,700系列以來逐漸看到效能及價格兼具的新產品推出,顯示出ati目前發展的方向乃是朝著以最低成本開發出高效能產品不再與nv競逐單晶片效能網者的寶座,就目前結果看來似乎是個正確的方向
畢竟那些所謂效能王卡從來都不曾是市場主力產品,輸了面子但贏了裡子來的更加重要,也逼得nv不得不將其產品價格重新調整,然而,雖說如此,我之前也提過ati目前的顯卡架構的效能表現非常依賴於程式碼的編譯,也就是驅動程式的最佳化,才能將其效能完整呈現,然而當運算環境改變,而驅動程式未能完整支援時,就容易發生效能低落或是運算錯誤的結果,所以常常聽到有人抱怨ati的驅動程式不夠友善,而解決方法通常是要換掉驅動,但是可能一段時間後又會發生其他的問題..所以還是會讓一些躍躍欲試的玩家卻步,畢竟效能與穩定運作兩相權衡下,對一些非資深的玩家是寧可選擇穩定的,
Waffenss01 wrote:
ATI的VLIW架構...(恕刪)


這篇把兩家之間的差異 講的很詳盡 +5分........
Waffenss01 wrote:
ATI的VLIW架構...(恕刪)



大大篇的解說真是太驚人了@@

因為小弟也是從巫毒2系列就開始玩了

這中間N也好 A也好 使用不下數片

二家對於王者的爭奪從未停過 但我永遠是選CP最高的那邊

但這篇分析的太棒了

難怪大家都說 N卡 A卡 沒有絕對的勝負

如河選擇 還是選自己愛的 用爽就好啦~~

追求極致就N 追求高CP就A

這篇實在太中肯拉~~~
個人攝影Blog 歡迎參觀 http://album.blog.yam.com/solasky 愛車日記: http://www.wretch.cc/al
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?