想問問nvidia有cuda那ATI有甚麼? (第6頁)

qbqbqb

qbqbqb
個人積分：13分
文章編號：18750938

13分

51樓

2010-04-13 0:10

哇~這篇被挖出來了...

tyy2010 wrote:
研究單位如果只做一年研究
那他可以寫個幾十萬行 cuda native code
如果想做長久的最好開始改 Open CL
每個 project leader 都知道的常識
(恕刪)

問題是,研究百百款,有先進的,有成熟的,有前瞻的,也有追隨人家腳步的
要怎麼做,不能從一而論,研究如果需要爭取經費,短期內要有結果,是先拿成熟好用的語言來寫?
還是要著眼搞不好經費明年就要被砍的將來?不同的情況就有不同的看法,
有興趣去看看台大物理趙教授,對他來說,為什麼選CUDA?難道不想做長久的研究?

東京工業大學用CUDA改寫WRF氣象模型
WRF模型之於氣象研究應該算是長久的project了吧?

tyy2010 wrote:
至於那些會叫的XX 為何大力推CUDA
一個原因是每年要消化預算第二是每年有一堆研X生要畢業
第三是反正程式不用他寫...
(恕刪)

研究不就是這樣?成功了,功成名就;不成功,成為別人的踏腳石,或是過往雲煙...
前面提到的天河一號,Linpack調一調後,想用OpenCL寫,Project leader搞不好
還挖洞給自己跳呢....

AMD Radeon HD 4000 series has ‘known performance issues’ with OpenCL

tyy2010 wrote:
真正企業應用 ..會以目前有的當練功(試金石) 然後等Open架構出來一舉推出新軟體
這樣才叫通吃..也許個人工作室或小軟體公司會急著推但是大又貴的軟體一定是慢慢等的
Windows 下面的軟體世界也許變得很快不過真正超級電腦應用的大咖軟體都好幾年甚至幾十年才改朝換代
(恕刪)

Adobe算大吧?CS5算貴吧?
Mercury playback engine
用CUDA寫的

真正超級電腦跑的軟體通常都是研究或是私人單位使用,很少會用在商業上,
能駕馭超級電腦運算能力的單位,也通常有自行coding的能力...所以我還是重複一下之前說的(要翻一下

)

消費性市場-->OpenCL/DirectCompute是趨勢,我沒否認過,我也說過...GPU運用越廣泛,對N社這種沒有CPU的公司來說,我看不出有啥壞處

但是別忽略了,還是有政府機關,學術單位,Oil/Gas/電影公司等等是有能力自行開發程式,且不需要銷售到市場,甚至是販售服務的(EX:ILM).對這些人而言,針對採購/既有的硬體去開發針適合的程式OpenCL等就不是唯一的選擇了,利用熟悉的語言開發才是首要考量...

qbqbqb

qbqbqb
個人積分：13分
文章編號：18751237

13分

52樓

2010-04-13 0:21

enm wrote:
以我所知, 硬體產業...(恕刪)

恕刪~
所以說了,市場自然會決定一切...CUDA如果不行,被潮流所淘汰,也只能說黃董下錯棋
對消費者來說,只是少了家公司...
但是如果黃董賭對,那對沒有CPU的N社,也是一帖良藥

這篇11月中沉下去,快半年後的今天又被挖出來...
CUDA還是活的好好的,Adobe還為它出了個引擎,東工大還用它來加速WRF模型...
睡覺前看看美國新聞,還逛到DivX新的H.264/AVC encoder

但是如同e大說的,先賺再說...等OpenCL成熟後自然有其作法...合情合理~

cyborg

cyborg
個人積分：281分
文章編號：18757832

281分

53樓

2010-04-13 11:00

enm wrote:
而且, 相對要付錢的 CUDA , OpenCL 的問題可能還在於技術支援性的不足

CUDA 免費
toolkit / SDK / 各種說明文件
都可以免費下載使用

http://developer.nvidia.com/object/cuda_3_0_downloads.html

所以才會有很多學術單位和研究機構採用
也有學生會自行練習開發

eola

eola
個人積分：3分
文章編號：18757836

3分

54樓

2010-04-13 11:00

OpenCL的"開放"方式不見得是萬靈丹

比如說,由於Apple會主導OpenCL compiler一定要使用LLVM實作compiler.
LLVM針對VLIW架構的效率就不如Brook,CUDA的直接使用Open64,
效率有差之外,還有OpenCL的compiler不太成熟,很多複雜的寫法下會產生比較多bug等.

OpenCL要吃下原本GPGPU的基礎還有很長的路要走...
如果還有很多HPC應用繼續沿用CUDA/Brook+而不採用OpenCL
是一點都不奇怪的事情

一般軟體應用以及更低階的嵌入式/手持系統,在上面會發展的比較快倒是可以預期的....

eola

eola
個人積分：3分
文章編號：18758241

3分

55樓

2010-04-13 11:16

AMD Radeon HD 4000 series has ‘known performance issues’ with OpenCL

這個大概可以猜到什麼原因...
由於DX10的規範,每組Unified Shader要有16KB的local memory
但是可以做成有任何的讀寫限制.這部份nVidia和ATI不但非常不同,而且ATI給的限制相對蠻詭異的.
nVidia是,這16KB被切成16 bank,每個thread可以讀寫其中一組,就是在一個cycle內可以讀寫其中的1/16.
ATI則是切成64塊,每一塊只針對一個thread是可寫入的,對其他63個thread是唯讀.

DX11的規範,除了這塊是32KB以外,就是不能有任何的讀寫限制跟效能差別.

這篇文章中說的"OpenCL是針對dx11硬體而做所以在dx10硬體上效果不好"是誤解
正解應該是說,OpenCL只幫你規定了底層硬體要有16KB Local memory,但是底層硬體的
讀寫限制跟效能差別,你要自己最佳化.

你的OpenCL程式沒針對這部份最佳化的話,在已經有更先進的DX11硬體上可以跑出很快樂的效能,
(在Fermi上應該會更快....)在限制較多的DX10硬體上效能就跟撞牆差不多..

如果你花很多心思最佳化,可以達成更理想的結果,但是就可以要讓ATI DX10和nVidia DX10
使用不同的runtime code了.....

tyy2010

tyy2010
個人積分：89分
文章編號：18774920

89分

56樓

2010-04-13 23:08

qbqbqb wrote:
東京工業大學用CUDA改寫WRF氣象模型
WRF模型之於氣象研究應該算是長久的project了吧?

這樣也算大型喔...
之前有個同事跳到 NASA 就是寫 OpenCL 用途我不知道
另外連 Adobe 賣的軟體也拿出來講
可見眼光不同啦...我現在用的軟體都數百萬美金起跳的
GPU 運算不是光給微軟系統下的轉媒體檔加速專用的
用途遠比想像的廣而且用CUDA只是冰山一角

qbqbqb

qbqbqb
個人積分：13分
文章編號：18776470

13分

57樓

2010-04-13 23:59

tyy2010 wrote:
這樣也算大型喔...
之前有個同事跳到 NASA 就是寫 OpenCL 用途我不知道
另外連 Adobe 賣的軟體也拿出來講
可見眼光不同啦...我現在用的軟體都數百萬美金起跳的
GPU 運算不是光給微軟系統下的轉媒體檔加速專用的
用途遠比想像的廣而且用CUDA只是冰山一角
(恕刪)

嗯嗯~不好意思~眼界真的不同~見笑了~

強者我同事嘛~我了解我了解~ ^++^

話說強者我朋友最近到光子力研究所跟兜十蔵博士一起研究,準備把マジンガーZ投射到宇宙,
跟NASA應該也會有合作,搞不好以後會遇到~再互相加油打氣吧!!

WRF wiki的介紹

JoyRex

JoyRex
個人積分：91分
文章編號：18784025

91分

58樓

2010-04-14 11:20

反正到最後因為作業系統的關係支援DX11就不用怕任何問題,所以廠商也沒必要針對CUDA另外設計一套運作方式...

所以CUDA再怎嚜說重要性只會漸漸的消散,而ATI我覺得是擺爛,只等著DX11和CL而已...根本不花心思,因為CPU已經搞的頭暈腦脹的說 orz

http://www.mobile01.com/topicdetail.php?f=501&t=3661465&p=4#47519520#47519520

psychokiller

psychokiller
個人積分：2分
文章編號：18786690

2分

59樓

2010-04-14 12:56

JoyRex wrote:
反正到最後因為作業系統的關係支援DX11就不用怕任何問題,所以廠商也沒必要針對CUDA另外設計一套運作方式...

什麼時候linux,unix會開始支援DX11???

JoyRex

JoyRex
個人積分：91分
文章編號：18791586

91分

60樓

2010-04-14 16:25

大部分的使用者用的事什麼作業系統?
哪一套作業系統賺的錢比較多?能為廠商賺大把的鈔票?

現階段看來,DX11出來後大多數的廠商會針對CUDA設計嗎?

http://www.mobile01.com/topicdetail.php?f=501&t=3661465&p=4#47519520#47519520