任天堂應該反省關於NS以及下一代 (第20頁)

skysinger
個人積分：414分
文章編號：67000025

414分

191樓

2018-01-03 17:02

CREART wrote:
skysinger wrote:
目前高通都能做伺服器CPU，我相信高通作提升也不是問題
S820行動模式都能比X1好，那如果要求高通做出主機模式，應該遠比X1好很多

S820沒有所謂的行動模式還是主機模式，該說是任天堂將掌機與家機合併
出了NS這項產品，為了省電在使用電池時會降頻，接電源時才全速運作
就算如你所願望，任天堂用高通的核心，也得降頻來達到省電需求

至於先前貼的是在Android下進行的測試，都是全速狀態下進行的
全速S820的GPU效能就是輸給Tegra X1，X1的效能並不差但是並不省電
但S820在省電上也沒甚麼優勢，不用自行腦補

題外話我的客戶在美國IPC選用的也是X1，之前跟他們閒聊怎麼不用驍龍
他們說實際上測試X1強上許多，更別說N家有提供資源了

skysinger wrote:
我是建議他直接用高通，請高通特製更好GPU
要不然任天堂就要想辦法讓NVIDIA X2相對翻倍
我已沒苛求他耶
至少別落後當期手機
X1這東西出了到實際用在NS快兩年了...

再補充一項Tegra的強項，支援FP16半精度Gflops可以倍增
高通要到S845的時候才有原生FP16這項功能

NS在FP32下可達471Gflops的性能，而FP16半精度可以達到近942Gflops
Qualcomm Snapdragon Technical details
S820是407Gflops、S835是567Gflops

別忘記NS在2017/3月發售，於2016年底量產備貨時，高通的移動核心還是S820而已
以FP32來說不輸當時的旗艦核心S820，至於FP16的數據的話
則遠遠的甩掉S820與今年下半年的S835不知道幾條街...

因為上班，花了點時間寫

1. 我的意思是S820 一直都是行動模式就能比X1好
2. 那資料實際上我記得算過400GFLOPS是FP32的

用科學數據去思考是不錯的

不過就我認知不太相同
為了你的說法我有重新找資料重算

首先看表格
http://dench.flatlib.jp/opengl/gpuspecs

這資料比較早期Adreno 300系列
Adreno 300系列於Vertex只有highp模式相關知識可以看
https://community.arm.com/graphics/b/blog/posts/benchmarking-floating-point-precision-in-mobile-gpus
早年(4年前)認為不合適達到highp簡單來說就是認為跑不動，雖然Tegra 3能模擬FP32，實際上是FP16
不過他可能沒想到Adreno 300就能支援highp，可以跑 FP32( floating point range: -2^127 to 2^127, integer range: -2^23 to 2^23)，應該說當年Adreno只能跑單精準，當然後來的Tegra X1 也能有效運算FP32
相關知識可以看
https://community.arm.com/graphics/b/blog/posts/at-home-on-the-range---why-floating-point-formats-matter-in-graphics
於ARM架構下的渲染運算考量下
highp = fp32

也順便看了一些資料
https://www.google.com.tw/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&uact=8&ved=0ahUKEwjQ7N_zjrvYAhUEwrwKHTu0DKMQFgg_MAI&url=https%3A%2F%2Fdeveloper.qualcomm.com%2Fqfile%2F33472%2F80-nb295-11_a.pdf&usg=AOvVaw1JqKmscVTErwV9rPtIYf9T
內文也有寫建議一半採用半精準，因為效能會倍增
於8.3章有說明，他的GPU是在OPEN CL部分狀況主要使用IEEE 754 single precision floating-point 所以唯有這種情況下就很明確是單精準(FP32)

會誤認Adreno只能跑單精準，應該是早年的知識來不急更新
早年Tegra 3還有FP16轉FP32
不過從前面文章知道高通那時不是
而且Adreno 300之前更可以肯定都是FP32
總之，目前實測的浮點數無疑就是FP32跟16並存

如果你不信的話
用算的也能驗證
不知道你會不會算
計算公式很多種
假設你知道他單一ALU的浮點運算
就可以算??? FLOPS/ALU × ??? MHz × ??? ALU

另一種就是用vertex shader 去看這個是可行的
S801那時期
adreno 330
128(ALU)/4 (Vec4 is Highp = FP32) * 9(2Vec4+1) * 0.55 GHz ≒ 150 FP32

不過adreno 400他的運算方式有大幅度改變
你提到的S835
adreno 500
https://www.anandtech.com/show/10948/qualcomm-snapdragon-835-kryo-280-adreno-540/2
其實他已經進入FP64時代
他渲染的方式應該有改進，只是我不是很確定原始是如何
所以如果我還是用256(ALU)/4 (Vec4) * 9(2Vec4+1) * 0.71 GHz(FP32) ≒ 408.96 FP32去計算應該是錯的
wiki跟大部分網站的資料來看，540是576 FP32
如果FP16就是兩倍，1152 Gflops
更快

Adreno 過去就是使用 FP32
NVIDIA在adreno 500推出之前還有個優勢，FP64
不過對上Adreno 500就沒有差異
目前NVIDIA用在NS最大的好處是有不錯的散熱
理論上S820之前的GPU降頻問題會遠遜於能有效散熱的X1
不過S835目前就是省電，GPU也表現不錯
我知道NV跟AMD都有愛好者
你買Switch也會把NVIDIA Tegra X1看得很好也正常

X1兩年前推出的時候我是很看好
不過兩年來也看到他缺點就耗電高熱
你說他沒放棄tegra我相信
因為他主要是在行動裝置上慢慢退出
事實就是他已經遜於adreno新一代運算能力，就算NVIDIA Tegra X1 在NS有效能改善
他實際驗證就是比較過時
希望他改進而已
我覺得NS當年不被看好情況下選Tegra X1 合情合理，下一代X2暴衝，要不就選高通，都OK阿
就別跟這代一樣，擺明過時的運算表現

雖然預算與時代脫節跟好不好玩沒差，但會造成一些未來遊戲發展限制
你不覺得有些遊戲不錯玩，但畫質就是看得出來不好很可惜麼?

CREART

CREART
個人積分：388分
文章編號：67000724

388分

192樓

2018-01-03 17:58

skysinger wrote:
因為上班，花了點時...(恕刪)

只有一個重點原生FP16，Tegra支援這項功能
高通要到S845才有這項功能，所以沒有你假設的S835用FP16倍增的狀況
S835可以透過軟體模擬的方式對作FP16，但效能增加多少，並沒有數據
PS4也是Pro才對應原生FP16的功能，這些都可以去簡單的查到
GPU的gflops不用你來算給我，Wiki都有資訊，謝謝

另外Gflops只是一個參考的數據，並非絕對值
不然就不會有許多GPU的測試是X1贏過S820的狀況
16年時S820未必比nvidia特製的X1有優勢，不管是效能或廠商支援度
在這邊舉S835多強都沒用，S835是17年中的產品了

16年的時候高通GPU就是比nvidia的弱
以你最愛的Gflops來看，NS可以達到471Gflops(FP32)、942Gflops(FP16)
高於S820的407Gflops(FP32)

skysinger wrote:
NS是真的硬體落後太多了
而且NVIDIA已經沒有做新的ARM，真的不曉得為啥要用NVIDIA

一直會在這邊回覆，只是覺得你的說法都以主觀意識與有限資訊在看過去
很多資訊都不清楚，連nvidia有沒有持續再推ARM的Soc都不清楚...

skysinger wrote:
希望他改進而已
我覺得NS當年不被看好情況下選Tegra X1 合情合理，下一代X2暴衝，要不就選高通，都OK阿

若你覺得NS落後，可以不用玩，或是去官方網站
建議你覺得任天堂該"改進"的地方，會比在這邊高談闊論有效

skysinger

skysinger
個人積分：414分
文章編號：67000868

414分

193樓

2018-01-03 18:11

CREART wrote:
只有一個重點原生FP16...(恕刪)

"半精準倍增500系列就有，我給的文件已經有寫"

我還是回頭增加一些資料補充說明
雖然被酸沒有邏輯
或許我表達能力不足，寫文章可能其他人看2266
但是我還是覺得別乎巄
前面一長串資料算是精確由高通給的
Qualcomm® Snapdragon™ Mobile Platform OpenCL General Programming and Optimization
https://developer.qualcomm.com/qfile/33472/80-nb295-11_a.pdf
Qualcomm® Adreno™ OpenGL ES
reference PAGE 152
https://www.google.com.tw/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&uact=8&ved=0ahUKEwjOgpCi3b_YAhUGx7wKHfzfD04QFgg4MAI&url=https%3A%2F%2Fdeveloper.qualcomm.com%2Fqfile%2F28557%2F80-nu141-1_b_adreno_opengl_es_developer_guide.pdf&usg=AOvVaw1uhupVJVaKfaSyqW2f8bjh
Qualcomm Snapdragon's Adreno 4xx GPU supports native FP16 with double rate features
https://www.gamespot.com/forums/system-wars-314159282/nintendo-picked-the-best-possible-hardware-for-the-33388037/
於Optimal memory load/store部分就有寫到他強烈建議使用半精準，因為可以倍增運算
精準度還要考量記憶體速度，根據文件觀點其實300系列以後跑半精準倍增都沒問題
不過我之說500系列以後都沒問題原因很簡單
主要他還是附了一個Global跟Local memory使用上，能達成coalesced memory access支援的表格
最好狀況還是可進行Local memory coalesced load/store，速度最快，也就是A5XX
因為記憶體水平是不差的，所以可以預料S820 的530執行FP16也很不錯
目前遊戲使用上，Pixel Shader跟Vertex Shader主要使用FP32為主
FP16只有在Pixel Shader效能不夠用的時候會採用，相對認為自己效能不足，或者想偷偷增加假象的流暢會採用
自然FP16也會有產出品質犧牲
文件也有說到缺點
一般會利用FP16或FP8是為了AI運算
例如TPU的使用就是8bit
因為普遍認為AI於8bit以外的損失誤差是比較沒差的

至於你說的原生跟模擬並不是哪個性能比較好的主因，而是利用的效率問題，例如驅動等原因
舉個例子是NVIDIA在2016年推出1080採用原生FP16，不過當時實際測試，反而980模擬效率高很多
所以是不是原生根本不等於結果
回頭看FP16雖然A530沒提供，但是FP32確實就超越X1
而且我提到的S820使用 A5XX系列已經能做到這麼好的記憶體控制，你還認為他不足麼?
X1行動只能 157 - 196 (FP32)，S820為了行動卻能上 407.4~498.5(FP32)，你說打幾條街...
nvidia跟Adreno用的概念不同，我相信x1為了行動狀態，他的256 cores不到一半在跑
如果S820特化加倍運算的晶片面積，做主機模式，是反過來是S820特化版能打X1好幾條街
你一直不從基礎的半導體思考是我覺得你邏輯上的最大缺陷

性能或許妳認為不是任天堂該重視問題
不過這篇首發就是說下一代性能問題
就是談性能期望
我不希望掌機模式有鋸齒
我不希望他遊戲還是只能到這水平
我不希望帶出門沒電自找麻煩
更不希望每次買任天堂一直被譏笑硬體與時代脫節
而且重算一遍，重看一遍，確實就是不如時代
是該改進了吧

而且我寫這麼多
資料也很明確除了FP32，官方文件也建議300系以後可用半精準倍增
你還是把自己搞錯的地方用教育別人口吻
高高在上我是感到不悅
問題就是ns 2017推出
都2017了
你都知道x1不能用2017比較
你還是想辦法說ns不用上進
我是更感到不悅

CREART

CREART
個人積分：388分
文章編號：67000912

388分

194樓

2018-01-03 18:15

skysinger wrote:
而且我寫這麼多
資料也很明確FP32
你還是把自己搞錯的地方用教育別人口吻
高高在上我是感到不悅

你是打了很多FP32沒錯啊，但S820/S835就是沒支援原生FP16
需要透過程式來達到軟體支援FP16，透過軟體就有優化的差異性
不像支援原生FP16一樣，直接倍增性能，並沒甚麼搞錯的地方
另外你感到不悅干我屁事....你一直要人改進才好笑

skysinger wrote:
大家可能對手機硬體不熟悉
其實s820去年就很便宜，只是任天堂不是做硬體的，來不及應變

skysinger wrote:
你的手機到底是多老多便宜的
你這說法去問手機版應該會被笑...
近一年手機玩遊戲變化滿大的，除了某些牌子
反而我拿到switch玩薩爾達時候對他電力跟性能有些建議
我只是老實說，ns的效能跟電力真的不行

看看自己打過的文章吧
到底是誰高高在上的態度....好笑

skysinger wrote:
理論上S820之前的GPU降頻問題會遠遜於能有效散熱的X1
不過S835目前就是省電，GPU也表現不錯
我知道NV跟AMD都有愛好者
你買Switch也會把NVIDIA Tegra X1看得很好也正常

另外這段是你自己寫的，你前面說任天堂用過時的硬體
現在又寫S820的GPU降頻會遠遜於有效散熱的X1，不覺得臉痛痛的嗎？

買NS不太表把X1看得多強，我自己的手機也是S835，那照你的說法
我也要很熱愛高通囉？不需要去預設別人的立場
只覺得當時除了X2之外，X1的確算是好的選擇
比你一開始就高通高通的，拿17年的最新Soc去打15年人家規劃硬體
不覺得有點好笑嗎？

skysinger

skysinger
個人積分：414分
文章編號：67001092

414分

195樓

2018-01-03 18:33

CREART wrote:
你是打了很多FP32...(恕刪)

奇怪我寫s820 之前
之前就是指s820前的s810
不知道你為啥見獵心喜就開始攻擊人

我原本覺得你只是為了說ns不管怎樣都要說好的人
現在更無言了
你根本針對我攻擊:p
何必
收回前面讚美你科學看待

CREART

CREART
個人積分：388分
文章編號：67001132

388分

196樓

2018-01-03 18:37

skysinger wrote:
奇怪我寫s820之前
之前就是指s820前的s810
不知道你為啥見獵心喜就開始攻擊人

我原本覺得你只是為了說ns不管怎樣都要說好的人
現在更無言了

S810那爛東西就不用拿來說嘴了....高通歷年最爛的Soc就是810
你不檢討自己的口氣，只給別人貼標籤，也是服了你了

NS賣再好再壞，都與我無關，對我來說NS就是一台遊戲機而已
哪邊有我想玩的遊戲，我就買來玩，沒甚麼大不了
會一直回文只是覺得你的邏輯不通，就這樣

starfield

starfield
個人積分：842分
文章編號：67001945

842分

197樓

2018-01-03 20:08

kof8310 wrote:
任天堂都可以做出 ...(恕刪)

NS上老任1080p，60幀的遊戲應該不多，只有WiiU強化那幾款，其他像瑪莉歐奧德賽只有800p左右，掌機模式更低，好像最低是4百多p左右，而花枝2印象中家機模式是900p左右，最近的異度2也是900p左右，掌機更慘

Maasai

Maasai
個人積分：259分
文章編號：67003620

259分

198樓

2018-01-03 22:48

starfield wrote:
NS上老任1080p...(恕刪)

我比較想請教這位專門研究NS缺點的鍵盤評論家

NS的曠野之息是幾p
為何全世界的2017電玩年度大獎都落入曠野之息掌中
難道這些專業媒體都瞎了眼
看不出有許多遊戲的畫面都遠勝曠野之息

遊戲好玩最要緊
絕大多數玩家買主機單純就是為了要玩好玩的遊戲

或許這位鍵盤評論家都是單看硬體數據來挑主機

somebady

somebady
個人積分：24分
文章編號：67005629

24分

199樓

2018-01-04 7:41

starfield wrote:
NS上老任1080p...(恕刪)

東西可以亂吃，話不能亂講
你講的3個遊戲的解析度：全部都是錯誤的
http://nintendotoday.com/super-mario-odyssey-runs-at-1080p-docked/
http://nintendoeverything.com/splatoon-2-is-1080p-docked-60-fps/
奧德賽跟splatoon2底座都是1080p/60fps，掌機是720p/60fps
xenoblade2的解析度也不正確

要評論switch的遊戲時，麻煩先做好功課，google一下不難吧？
順便再補一下switch 1080p/60fps的遊戲還有：
arms
fifa18
海賊無雙3

Maasai

Maasai
個人積分：259分
文章編號：67008733

259分

200樓

2018-01-04 11:42

somebady wrote:
東西可以亂吃，話不...(恕刪)

那位仁兄明顯就是

視頻黨 + 鍵盤評論家

跟他較真簡直是浪費時間

任天堂應該反省 關於NS以及下一代

任天堂應該反省關於NS以及下一代