CREART wrote:
skysinger wrote:
目前高通都能做伺服器CPU,我相信高通作提升也不是問題
S820行動模式都能比X1好,那如果要求高通做出主機模式,應該遠比X1好很多
S820沒有所謂的行動模式還是主機模式,該說是任天堂將掌機與家機合併
出了NS這項產品,為了省電在使用電池時會降頻,接電源時才全速運作
就算如你所願望,任天堂用高通的核心,也得降頻來達到省電需求
至於先前貼的是在Android下進行的測試,都是全速狀態下進行的
全速S820的GPU效能就是輸給Tegra X1,X1的效能並不差但是並不省電
但S820在省電上也沒甚麼優勢,不用自行腦補
題外話我的客戶在美國IPC選用的也是X1,之前跟他們閒聊怎麼不用驍龍
他們說實際上測試X1強上許多,更別說N家有提供資源了
skysinger wrote:
我是建議他直接用高通,請高通特製更好GPU
要不然任天堂就要想辦法讓NVIDIA X2相對翻倍
我已沒苛求他耶
至少別落後當期手機
X1這東西出了到實際用在NS快兩年了...
再補充一項Tegra的強項,支援FP16半精度Gflops可以倍增
高通要到S845的時候才有原生FP16這項功能
NS在FP32下可達471Gflops的性能,而FP16半精度可以達到近942Gflops
Qualcomm Snapdragon Technical details
S820是407Gflops、S835是567Gflops
別忘記NS在2017/3月發售,於2016年底量產備貨時,高通的移動核心還是S820而已
以FP32來說不輸當時的旗艦核心S820,至於FP16的數據的話
則遠遠的甩掉S820與今年下半年的S835不知道幾條街...
因為上班,花了點時間寫
1. 我的意思是S820 一直都是行動模式就能比X1好
2. 那資料實際上我記得算過400GFLOPS是FP32的
用科學數據去思考是不錯的

不過就我認知不太相同
為了你的說法我有重新找資料重算
首先看表格
http://dench.flatlib.jp/opengl/gpuspecs

這資料比較早期Adreno 300系列
Adreno 300系列於Vertex只有highp模式相關知識可以看
https://community.arm.com/graphics/b/blog/posts/benchmarking-floating-point-precision-in-mobile-gpus
早年(4年前)認為不合適達到highp簡單來說就是認為跑不動,雖然Tegra 3能模擬FP32,實際上是FP16
不過他可能沒想到Adreno 300就能支援highp,可以跑 FP32( floating point range: -2^127 to 2^127, integer range: -2^23 to 2^23),應該說當年Adreno只能跑單精準,當然後來的Tegra X1 也能有效運算FP32
相關知識可以看
https://community.arm.com/graphics/b/blog/posts/at-home-on-the-range---why-floating-point-formats-matter-in-graphics
於ARM架構下的渲染運算考量下
highp = fp32
也順便看了一些資料
https://www.google.com.tw/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&uact=8&ved=0ahUKEwjQ7N_zjrvYAhUEwrwKHTu0DKMQFgg_MAI&url=https%3A%2F%2Fdeveloper.qualcomm.com%2Fqfile%2F33472%2F80-nb295-11_a.pdf&usg=AOvVaw1JqKmscVTErwV9rPtIYf9T
內文也有寫建議一半採用半精準,因為效能會倍增
於8.3章有說明,他的GPU是在OPEN CL部分狀況主要使用IEEE 754 single precision floating-point 所以唯有這種情況下就很明確是單精準(FP32)
會誤認Adreno只能跑單精準,應該是早年的知識來不急更新
早年Tegra 3還有FP16轉FP32
不過從前面文章知道高通那時不是
而且Adreno 300之前更可以肯定都是FP32
總之,目前實測的浮點數無疑就是FP32跟16並存
如果你不信的話
用算的也能驗證
不知道你會不會算
計算公式很多種
假設你知道他單一ALU的浮點運算
就可以算??? FLOPS/ALU × ??? MHz × ??? ALU
另一種就是用vertex shader 去看這個是可行的
S801那時期
adreno 330
128(ALU)/4 (Vec4 is Highp = FP32) * 9(2Vec4+1) * 0.55 GHz ≒ 150 FP32
不過adreno 400他的運算方式有大幅度改變
你提到的S835
adreno 500
https://www.anandtech.com/show/10948/qualcomm-snapdragon-835-kryo-280-adreno-540/2
其實他已經進入FP64時代
他渲染的方式應該有改進,只是我不是很確定原始是如何
所以如果我還是用256(ALU)/4 (Vec4) * 9(2Vec4+1) * 0.71 GHz(FP32) ≒ 408.96 FP32去計算應該是錯的
wiki跟大部分網站的資料來看,540是576 FP32
如果FP16就是兩倍,1152 Gflops
更快
Adreno 過去就是使用 FP32
NVIDIA在adreno 500推出之前還有個優勢,FP64
不過對上Adreno 500就沒有差異
目前NVIDIA用在NS最大的好處是有不錯的散熱
理論上S820之前的GPU降頻問題會遠遜於能有效散熱的X1
不過S835目前就是省電,GPU也表現不錯
我知道NV跟AMD都有愛好者
你買Switch也會把NVIDIA Tegra X1看得很好也正常
X1兩年前推出的時候我是很看好
不過兩年來也看到他缺點就耗電高熱
你說他沒放棄tegra我相信
因為他主要是在行動裝置上慢慢退出
事實就是他已經遜於adreno新一代運算能力,就算NVIDIA Tegra X1 在NS有效能改善
他實際驗證就是比較過時
希望他改進而已
我覺得NS當年不被看好情況下選Tegra X1 合情合理,下一代X2暴衝,要不就選高通,都OK阿
就別跟這代一樣,擺明過時的運算表現
雖然預算與時代脫節跟好不好玩沒差,但會造成一些未來遊戲發展限制
你不覺得有些遊戲不錯玩,但畫質就是看得出來不好很可惜麼?