AMD 中階的野心 Radeon HD4750 機密搶曝 (第3頁)

總統先生

總統先生
個人積分：200分
文章編號：11968047

200分

21樓

2009-05-14 19:37

KKscott wrote:
浮點運算比NV的物理...(恕刪)

Waffenss01 wrote:
不一定.....要看...(恕刪)

我不是專門的，對這種專業術語是不懂的 orz

如果能有更簡單的說法讓我明白那最好了，不好意思

Waffenss01

Waffenss01
個人積分：194分
文章編號：11968261

194分

22樓

2009-05-14 19:54

把GPU想成3C產品代工廠.
TEX的數據(xxxtexel/s)相當於採購部進料的速度.
SP的浮點運算數據(xxxGflops)相當於工廠生產線的產能.
ROP的數據(xxxPixel/s)相當於包裝部出貨的速度,
"頻寬"就是運貨卡車的運載量.
不同遊戲就相當於不同產品,
生產小手機和大台PC就需要完全不同的進料人力, 需要完全不同數量的組裝人力,
需要不同的出貨人力, 與不同的卡車數量....

所以你不能說生產線大是沒有用的, 大部份情形下, 生產線大的比較有機會達到高產能.
但也不能說生產線大就一定萬事ok.....
如果產品製程很簡單(=不需要太多浮點運算) , 那產能可能卡在進料或出貨,
這時生產線大也沒用, 就算有640個作業員(640SP), 但是只能進一半的料出一半的貨.
那只好叫作業員共體時艱,多多放無薪假....因為沒事做.

產量是卡在哪個環節要視產品(遊戲)而定.
工廠的人力配置(多少浮點運算,多少ROP多少TEX)是固定的, 不一定適合所有產品.
所以產量瓶頸也是一直在變.

阿勇喔

阿勇喔
個人積分：26分
文章編號：11968457

26分

23樓

2009-05-14 20:09

Waffenss01 wrote:
TEX的數據(xxx...(恕刪)

喔~了解囉!謝謝大大囉!
所以現在討論的256bit GDDR5和128bit GDDR3的頻寬和速度就會和進料(TEX的數據)與出貨(ROP的數據)息息相關囉!是這樣嗎?

那不同的核心是不是代表不同的製程技術能力~
比如4830是DDR2的製程技術能力而4770是DD3的製程技術能力
所以不一定產能高就會好!製程技術能力也有關!?
都是我的舛測啦~請大大指教囉!

KKscott

KKscott
個人積分：55分
文章編號：11969606

55分

24樓

2009-05-14 21:26

所以只是去強調浮點運算有多猛，有用嗎？沒有.......
很簡單，4870的浮點運算強過GTX280，可是遊戲表現勒？.......
不是一個等級...再提醒一次4870浮點運算比GTX280強...
但是遊戲表現卻不是同一個等級？
為什麼？
很多因素都會影響，所以浮點運算的能力可以單獨被拿出來說強，這張顯卡就強嗎？那是不能的...

現在評價好學生的標準當然不一樣，但是不能說只會體育，就說這個學生五育均衡.....

Waffenss01

Waffenss01
個人積分：194分
文章編號：11993381

194分

25樓

2009-05-16 0:04

>>很簡單，4870的浮點運算強過GTX280，可是遊戲表現勒？.......
>>不是一個等級...再提醒一次4870浮點運算比GTX280強...
>>但是遊戲表現卻不是同一個等級？

廠商強調自己佔優勢的地方本來就是正常的.
NV也是一樣強調自己的物理模擬? (其實Physx物理模擬也是靠浮點運算)
ATI的宣傳從來沒有說過4870效能會壓勝GT280.
他只是說其浮點運算比較高,也明確的公布了4870的頻寬小於GT280,
ROP和TEX也都明白告訴你少很多.
它並沒有隱瞞甚麼規格.
各家廠商的硬體配置不同, 佔優勢之處也不同.

為什麼4870浮點運算比GTX280強,但效能不是同等級?
事實是"RV770核心和GT260本來就不是同量級的對手".
~~~後者的規模整整是前者的"1.5倍"以上!
4870只有956M電晶體,本來就是只比G92b(754M)多一點點而已.
4870其實只比9800GT多一點電晶體而已,它是屬於G92b(9800GT)這等級的晶片.
它能夠越級去打1400M電晶體的GT260, 已經是把高浮點運算發揮的淋漓盡致的結果了.
否則它光靠16ROP怎麼可能威脅到擁有28ROP的GT260?

如果浮點運算真的沒用, 以電晶體,ROP和TEX等規模來看,4870應該只能殺殺9800GT.
但現實卻是超乎預期. 害的當初GT260才出一個月就大跳水.
NV GT2x0當初何必降價應戰? 9800GT也一樣是16ROP阿,
拿電晶體同級的55nm G92b核心(9800GT)來對抗4870阿!.....問題是根本無法對抗.
NV就是因為浮點運算不如人,所以靠上位產品GT2x0的兩倍ROP和兩倍TEX來彌補運算效能.
(浮點運算輸掉的部分, 改靠其他方面優勢追回來)

所以, 浮點運算有用嗎？有.......
浮點運算較高不代表產品效能一定較高, 但是以GPU核心的競爭力來說, 高浮點運算的確佔了不少優勢.
48x0能越級打GT2x0, 而G92b卻只能乖乖當中階卡, 就是對照的最佳例子.

4870有沒有勝過GT2x0倒無所謂, 光是RV770能用小晶片威嚇到大晶片GT2x0,
AMD就已經笑得很開心了....畢竟這代表產品利潤比對手高.

總統先生

總統先生
個人積分：200分
文章編號：11993384

200分

26樓

2009-05-16 0:05

這樣我就了解了，浮點運算能力什麼的還得配合一堆東西，不過4870跟280那個例子舉的好，我不是專門業界的，也看的懂

KKscott

KKscott
個人積分：55分
文章編號：11993641

55分

27樓

2009-05-16 0:19

Waffenss01

你也不要激動，我當然知道4870跟280是不同等級的顯卡，但是你就是強調浮點運算的能力，前一頁你自己說的.......

當然你自己後來也說了要補一堆東西之類的...

一個學生段考要考國語數學理化英文，但是這個學生只有數學100分其他科都不及格.....

另外一個學生，沒有一科100，但是4科平均85分...

這兩位學生哪個學業成績好？

其實你只是想凸顯浮點運算能力而已，但是我要告訴你的，就是這個概念.....

4870跟280的例子就是這個...浮點運算280不如4870...但是實際遊戲表現280就是比4870好..

100分的數學替學業成績的總平均是帶來了提昇..但是還不夠拿來稱讚學生是個學業成績很好的好學生，你卻拿來稱讚了........

還有，實際的遊戲運用，你可以問問看....這一點我就不代答了......512的顯卡記憶體在高解析度遊戲下能有多大的表現？

你自己也說了4770CF浮點運算強過4870，那4870 1G勒.........那實際遊戲表現勒？

是不是又代表著什麼.....

可以用浮點運算能力來看顯卡的強弱嗎？.......不行！！

Waffenss01

Waffenss01
個人積分：194分
文章編號：11994081

194分

28樓

2009-05-16 0:43

>>100分的數學替學業成績的總平均是帶來了提昇..但是還不夠拿來稱讚學生
>>是個學業成績很好的好學生，你卻拿來稱讚了........

這比喻有點不恰當.
對GPU核心來說沒有所謂數學,英文....分開計分的問題.
每個pixel shader都是"同時"使用到SP,TEX,ROP......然後受限於其中一個瓶頸..
不管有多少浮點運算,多少TEX,多少ROP.....最後只會有一個分數, 就是整體效能.

也沒辦法所謂...五育均衡, 因為GPU跑的每個shader瓶頸不同.
所以"永遠不會有均衡的硬體配置".
只能盡量配置成到大多數情形下比較恰當的比例,
(但是兩社認為的"恰當比例"不太一樣, 所以就有強大浮點運算和大量ROP&TEX的區別.)
無論GPU硬體是怎麼配置, 只要"能用相對少的電晶體達到相對高的整體效能",
這樣設計的配置就是比較接近所謂"五育均衡"的配置
對我來說, 這就是優秀的設計.

至於好設計是不是較好的產品(特定顯卡商品), 哪是另外一回事.
因為C/P值的C價格一直在變動, 且較好的晶片設計不一定做成好商品, 也不一定有適當的價格,

遊戲時GPU是在各種變動的效能瓶頸中完成所有運算,
在有限的電晶體預算下,GPU廠商判斷該怎麼分配到GPU內的各種硬體,以達到單位電晶體成本下最好的效能.
而ATI和NV社的判斷不同, 所以兩社同效能產品所需的電晶體也不同.
如果一個設計能只用更少電晶體達到相對高效能, 難道這不是高效率的好設計?

以相近的電晶體規模來說,4870在ROP和TEX或各方面, 並沒有輸給規模差距不大的G92b.
所以也不太能用"只靠一項拉高分數"來形容.
因為實際上以同規模的晶片來說,4870其它方面沒比較低阿.

你是拿越級挑戰的GT280來比才顯得其他方面有所不足....
能越級對抗更大晶片也不算好表現, 這標準....會不會太嚴苛了.
如果這樣不是表現好, 那電晶體同級的G92b豈不是很尷尬.....因為他每方面都不高.

>>可以用浮點運算能力來看顯卡的強弱嗎？.......不行！！
>>4870跟280的例子就是這個...浮點運算280不如4870...但是實際遊戲表現280就是比4870好..

沒人說可以只看浮點運算阿.
只是說對GPU來說浮點運算影響很大.....
以現在的趨勢是浮點運算高,比較容易得到較高整體效能(FPS)的設計.....(這不是說只看浮點運算高就是高效能)
所以不管NV或ATI都努力加SP.

>>實際的遊戲運用，你可以問問看......

需要的話, 我可以馬上寫個實際遊戲常用的pixel shader給你看.
我們有用shader analyzer分析效能瓶頸.
這瓶頸是不固定的, 但是計算越複雜的shader,卡在浮點運算的比例越高.

eclair_lave

eclair_lave
個人積分：9747分
文章編號：11998858

9747分

29樓

2009-05-16 12:54

不用想的太複雜了

GPU的理論Tflops數值就是設計上可能達到的峰值性能，可以當作性能推算比較的基礎，至於實際驅動效率是看軔體跟軟體的配合度

軟體業界內笑稱寫程式是一門藝術，同樣一套硬體不同人寫出的運作效率跟程式本身的擴充.堆疊能力可能就會有天壤之別，如此而已