• 3

請教高手_串流處理器Stream Processors的工作原理

Waffenss01 wrote:
ATI的SP之前在ATI某開發文件有看到遊戲實測的VLIW滿載率大約7~8成上下.
...(恕刪)


補充一下是這份文件,這是給遊戲開發者看的 ,
一般人可能只能看懂一部分.
http://ati.amd.com/developer/cgo/2008/Rubin-CGO2008.pdf
直接看第34頁.
---------------------------------------
5 way VLIW Packing Rate

LostPlanet: 83 ps 3.383631
Crysis: 284 ps 3.800968
Call of Juarez: 594 ps 3.922494
Bioshock: 2290 ps 4.222533

Best would be 5.0
---------------------------------------
白話一點的說法就是,
ATI的VLIW架構是4+1, 理論上全部湊滿是可以執行5個運算.
例如4元素指令和1元素的相同指令,可以湊在一起同時執行.
5個SP一起跑不浪費任何效能.
所以說Best would be 5.0. 但實際上不會總是湊到滿啦.

而Worst case是全部湊不到, 數字就會是1.
但那情形在遊戲幾乎不可能發生, 理由之前解釋過了.

上面的"PS", 是指Pixel Shader.
由於shader處理的頂點,向量,顏色....都是3元素向量,
在遊戲中通常VLIW Packing Rate至少可以達到3~4.
例如Crysis測試中用了284個Pixel shader. 而平均湊滿3.8個運算.

la小惡 wrote:
所以就是NV的sp是高效率,但成本很高,ATI是架構簡單,成本低,以量取勝的意思囉,...(恕刪)


以SP來說的確是這樣. 從die photo面積來看,
ATI的5個SP的成本, 差不多等於NV的1個2倍時脈SP.
就算遊戲shader的Pack Rate只有7成, 還是佔優勢.

其實ATI的設計也算是追求高效率, 但不是追求SP的運作高效率
而是追求每單位電晶體的運用高效率, 想用有限的電晶體達到最好的效能比.
這也是另一種效率的表現.
  • 3
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?