KKscott wrote:浮點運算比NV的物理...(恕刪) Waffenss01 wrote:不一定.....要看...(恕刪) 我不是專門的,對這種專業術語是不懂的如果能有更簡單的說法讓我明白那最好了,不好意思
把GPU想成3C產品代工廠.TEX的數據(xxxtexel/s)相當於採購部進料的速度.SP的浮點運算數據(xxxGflops)相當於工廠生產線的產能.ROP的數據(xxxPixel/s)相當於包裝部出貨的速度,"頻寬"就是運貨卡車的運載量.不同遊戲就相當於不同產品,生產小手機和大台PC就需要完全不同的進料人力, 需要完全不同數量的組裝人力,需要不同的出貨人力, 與不同的卡車數量....所以你不能說生產線大是沒有用的, 大部份情形下, 生產線大的比較有機會達到高產能.但也不能說生產線大就一定萬事ok.....如果產品製程很簡單(=不需要太多浮點運算) , 那產能可能卡在進料或出貨,這時生產線大也沒用, 就算有640個作業員(640SP), 但是只能進一半的料出一半的貨.那只好叫作業員共體時艱,多多放無薪假....因為沒事做.產量是卡在哪個環節要視產品(遊戲)而定.工廠的人力配置(多少浮點運算,多少ROP多少TEX)是固定的, 不一定適合所有產品.所以產量瓶頸也是一直在變.
Waffenss01 wrote:TEX的數據(xxx...(恕刪) 喔~了解囉!謝謝大大囉!所以現在討論的256bit GDDR5和128bit GDDR3的頻寬和速度就會和進料(TEX的數據)與出貨(ROP的數據)息息相關囉!是這樣嗎?那不同的核心是不是代表不同的製程技術能力~比如4830是DDR2的製程技術能力而4770是DD3的製程技術能力所以不一定產能高就會好!製程技術能力也有關!?都是我的舛測啦~請大大指教囉!
所以只是去強調浮點運算有多猛,有用嗎?沒有.......很簡單,4870的浮點運算強過GTX280,可是遊戲表現勒?.......不是一個等級...再提醒一次4870浮點運算比GTX280強...但是遊戲表現卻不是同一個等級?為什麼?很多因素都會影響,所以浮點運算的能力可以單獨被拿出來說強,這張顯卡就強嗎?那是不能的...現在評價好學生的標準當然不一樣,但是不能說只會體育,就說這個學生五育均衡.....
>>很簡單,4870的浮點運算強過GTX280,可是遊戲表現勒?.......>>不是一個等級...再提醒一次4870浮點運算比GTX280強...>>但是遊戲表現卻不是同一個等級?廠商強調自己佔優勢的地方本來就是正常的.NV也是一樣強調自己的物理模擬? (其實Physx物理模擬也是靠浮點運算)ATI的宣傳從來沒有說過4870效能會壓勝GT280.他只是說其浮點運算比較高,也明確的公布了4870的頻寬小於GT280,ROP和TEX也都明白告訴你少很多.它並沒有隱瞞甚麼規格.各家廠商的硬體配置不同, 佔優勢之處也不同.為什麼4870浮點運算比GTX280強,但效能不是同等級?事實是"RV770核心和GT260本來就不是同量級的對手".~~~後者的規模整整是前者的"1.5倍"以上!4870只有956M電晶體,本來就是只比G92b(754M)多一點點而已.4870其實只比9800GT多一點電晶體而已,它是屬於G92b(9800GT)這等級的晶片.它能夠越級去打1400M電晶體的GT260, 已經是把高浮點運算發揮的淋漓盡致的結果了.否則它光靠16ROP怎麼可能威脅到擁有28ROP的GT260?如果浮點運算真的沒用, 以電晶體,ROP和TEX等規模來看,4870應該只能殺殺9800GT.但現實卻是超乎預期. 害的當初GT260才出一個月就大跳水.NV GT2x0當初何必降價應戰? 9800GT也一樣是16ROP阿,拿電晶體同級的55nm G92b核心(9800GT)來對抗4870阿!.....問題是根本無法對抗.NV就是因為浮點運算不如人,所以靠上位產品GT2x0的兩倍ROP和兩倍TEX來彌補運算效能.(浮點運算輸掉的部分, 改靠其他方面優勢追回來)所以, 浮點運算有用嗎?有.......浮點運算較高不代表產品效能一定較高, 但是以GPU核心的競爭力來說, 高浮點運算的確佔了不少優勢.48x0能越級打GT2x0, 而G92b卻只能乖乖當中階卡, 就是對照的最佳例子.4870有沒有勝過GT2x0倒無所謂, 光是RV770能用小晶片威嚇到大晶片GT2x0,AMD就已經笑得很開心了....畢竟這代表產品利潤比對手高.
Waffenss01你也不要激動,我當然知道4870跟280是不同等級的顯卡,但是你就是強調浮點運算的能力,前一頁你自己說的.......當然你自己後來也說了要補一堆東西之類的...一個學生段考要考 國語 數學 理化 英文,但是這個學生只有數學100分其他科都不及格.....另外一個學生,沒有一科100,但是4科平均85分...這兩位學生哪個學業成績好?其實你只是想凸顯浮點運算能力而已,但是我要告訴你的,就是這個概念.....4870跟280的例子就是這個...浮點運算280不如4870...但是實際遊戲表現280就是比4870好..100分的數學替學業成績的總平均是帶來了提昇..但是還不夠拿來稱讚學生是個學業成績很好的好學生,你卻拿來稱讚了........還有,實際的遊戲運用,你可以問問看....這一點我就不代答了......512的顯卡記憶體在高解析度遊戲下能有多大的表現?你自己也說了4770CF浮點運算強過4870,那4870 1G勒.........那實際遊戲表現勒?是不是又代表著什麼.....可以用浮點運算能力來看顯卡的強弱嗎?.......不行!!
>>100分的數學替學業成績的總平均是帶來了提昇..但是還不夠拿來稱讚學生>>是個學業成績很好的好學生,你卻拿來稱讚了........這比喻有點不恰當.對GPU核心來說沒有所謂數學,英文....分開計分的問題.每個pixel shader都是"同時"使用到SP,TEX,ROP......然後受限於其中一個瓶頸..不管有多少浮點運算,多少TEX,多少ROP.....最後只會有一個分數, 就是整體效能.也沒辦法所謂...五育均衡, 因為GPU跑的每個shader瓶頸不同.所以"永遠不會有均衡的硬體配置".只能盡量配置成到大多數情形下比較恰當的比例,(但是兩社認為的"恰當比例"不太一樣, 所以就有強大浮點運算和大量ROP&TEX的區別.)無論GPU硬體是怎麼配置, 只要"能用相對少的電晶體達到相對高的整體效能",這樣設計的配置就是比較接近所謂"五育均衡"的配置對我來說, 這就是優秀的設計.至於好設計是不是較好的產品(特定顯卡商品), 哪是另外一回事.因為C/P值的C價格一直在變動, 且較好的晶片設計不一定做成好商品, 也不一定有適當的價格,遊戲時GPU是在各種變動的效能瓶頸中完成所有運算,在有限的電晶體預算下,GPU廠商判斷該怎麼分配到GPU內的各種硬體,以達到單位電晶體成本下最好的效能.而ATI和NV社的判斷不同, 所以兩社同效能產品所需的電晶體也不同.如果一個設計能只用更少電晶體達到相對高效能, 難道這不是高效率的好設計?以相近的電晶體規模來說,4870在ROP和TEX或各方面, 並沒有輸給規模差距不大的G92b.所以也不太能用"只靠一項拉高分數"來形容.因為實際上以同規模的晶片來說,4870其它方面沒比較低阿.你是拿越級挑戰的GT280來比才顯得其他方面有所不足....能越級對抗更大晶片也不算好表現, 這標準....會不會太嚴苛了.如果這樣不是表現好, 那電晶體同級的G92b豈不是很尷尬.....因為他每方面都不高.>>可以用浮點運算能力來看顯卡的強弱嗎?.......不行!!>>4870跟280的例子就是這個...浮點運算280不如4870...但是實際遊戲表現280就是比4870好..沒人說可以只看浮點運算阿.只是說對GPU來說浮點運算影響很大.....以現在的趨勢是浮點運算高,比較容易得到較高整體效能(FPS)的設計.....(這不是說只看浮點運算高就是高效能)所以不管NV或ATI都努力加SP.>>實際的遊戲運用,你可以問問看......需要的話, 我可以馬上寫個實際遊戲常用的pixel shader給你看.我們有用shader analyzer分析效能瓶頸.這瓶頸是不固定的, 但是計算越複雜的shader,卡在浮點運算的比例越高.
不用想的太複雜了GPU的理論Tflops數值就是設計上可能達到的峰值性能,可以當作性能推算比較的基礎,至於實際驅動效率是看軔體跟軟體的配合度軟體業界內笑稱寫程式是一門藝術,同樣一套硬體不同人寫出的運作效率跟程式本身的擴充.堆疊能力可能就會有天壤之別,如此而已