skysinger wrote:
至於你說的原生跟模擬並不是哪個性能比較好的主因,而是利用的效率問題,例如驅動等原因
舉個例子是NVIDIA在2016年推出1080採用原生FP16,不過當時實際測試,反而980模擬效率高很多
所以是不是原生根本不等於結果
回頭看FP16雖然A530沒提供,但是FP32確實就超越X1
你的問題在於,一昧的覺得支援就等於原生會倍增
看了你給的DATA有說到,可以透過軟體的方式使用FP16
但並沒有說到效能倍增,不用腦補....
你可以查看看支援原生FP16的,在估算上會將FP16數據補上
但模擬的呢?有關於程式的優劣難以估算,所以沒有數據可作為評估
再者你提到980用模擬FP16比1080原生FP16的強
這些說法是16年5月對岸寫的評測,就是1080剛推的時候的時間點
文章也寫到可以能歸咎於1080的驅動還沒完整,nvidia過去常透過driver更新
提升不少3D運算能力,這是nvidia的強項,高通比不上的
skysinger wrote:
而且我提到的S820使用 A5XX系列已經能做到這麼好的記憶體控制,你還認為他不足麼?
X1行動只能 157 - 196 (FP32),S820為了行動卻能上 407.4~498.5(FP32),你說打幾條街...
nvidia跟Adreno用的概念不同,我相信x1為了行動狀態,他的256 cores不到一半在跑
如果S820特化加倍運算的晶片面積,做主機模式,是反過來是S820特化版能打X1好幾條街
你一直不從基礎的半導體思考是我覺得你邏輯上的最大缺陷
另外盲點就是你一直提到的X1行動模式、就是NS在使用電池時
為了延長使用時間,會將Soc降頻,並不是X1的行動模式
就像筆電,透過電源管理的方式,來控制CPU的時脈
而你提到的S820的數據,都是全速下的估算值
若時脈降頻數據自然也會降低
真的要比,單純就是拿全速的狀況下表現來看
誰知道S820在降頻下,實際表現到底是多少?並沒數據可參考
一切都在你的假想下去批判,不是很搞笑嗎?
以最大值來看NS的X1是471(FP32)/942(FP16)、S820是498(FP32)/?(FP16)
一樣FP32下,兩者基本是同一等級的運算力,但若考量原生FP16的支援
若驅動程式能達到理想倍增,那的確是甩開S820好幾條街啊
而且你的考量只有在flops上,少了驅動程式與開發工具的支持
無視於架構設計的差異化、與效能峰值的持續性、都比你一直提的flops重要多了
你所執著的flops是純參考用的指標之一,並不能準確地反映效能差異
NS可以持續穩定的維持峰值,高通的Soc呢?
跑連續測試來看,數據一次不如一次,能穩定持續的運算能力到底多少?
以APPLE的A10 Fusion來看,GPU估算只有250Gflops左右
但實際上的遊戲表現呢?S820是輸給A10的....無庸置疑....