• 7

想問問nvidia有cuda那ATI有甚麼?

哇~這篇被挖出來了...

tyy2010 wrote:
研究單位如果只做一年研究
那他可以寫個幾十萬行 cuda native code
如果想做長久的 最好開始改 Open CL
每個 project leader 都知道的常識
(恕刪)


問題是,研究百百款,有先進的,有成熟的,有前瞻的,也有追隨人家腳步的
要怎麼做,不能從一而論,研究如果需要爭取經費,短期內要有結果,是先拿成熟好用的語言來寫?
還是要著眼搞不好經費明年就要被砍的將來?不同的情況就有不同的看法,
有興趣去看看台大物理趙教授,對他來說,為什麼選CUDA?難道不想做長久的研究?

東京工業大學用CUDA改寫WRF氣象模型
WRF模型之於氣象研究應該算是長久的project了吧?


tyy2010 wrote:
至於那些會叫的XX 為何大力推CUDA
一個原因是每年要消化預算 第二是每年有一堆研X生要畢業
第三是反正程式不用他寫...
(恕刪)

研究不就是這樣?成功了,功成名就;不成功,成為別人的踏腳石,或是過往雲煙...
前面提到的天河一號,Linpack調一調後,想用OpenCL寫,Project leader搞不好
還挖洞給自己跳呢....
AMD Radeon HD 4000 series has ‘known performance issues’ with OpenCL

tyy2010 wrote:
真正企業應用 ..會以目前有的當練功(試金石) 然後等Open架構出來一舉推出新軟體
這樣才叫通吃..也許個人工作室或小軟體公司 會急著推 但是大又貴的軟體 一定是慢慢等的
Windows 下面的軟體世界也許變得很快 不過真正超級電腦應用的大咖軟體都好幾年甚至幾十年才改朝換代
(恕刪)


Adobe算大吧?CS5算貴吧?
Mercury playback engine
用CUDA寫的

真正超級電腦跑的軟體通常都是研究或是私人單位使用,很少會用在商業上,
能駕馭超級電腦運算能力的單位,也通常有自行coding的能力...所以我還是重複一下之前說的(要翻一下)

消費性市場-->OpenCL/DirectCompute是趨勢,我沒否認過,我也說過...GPU運用越廣泛,對N社這種沒有CPU的公司來說,我看不出有啥壞處

但是別忽略了,還是有政府機關,學術單位,Oil/Gas/電影公司等等是有能力自行開發程式,且不需要銷售到市場,甚至是販售服務的(EX:ILM).對這些人而言,針對採購/既有的硬體去開發針適合的程式OpenCL等就不是唯一的選擇了,利用熟悉的語言開發才是首要考量...
enm wrote:
以我所知, 硬體產業...(恕刪)


恕刪~
所以說了,市場自然會決定一切...CUDA如果不行,被潮流所淘汰,也只能說黃董下錯棋
對消費者來說,只是少了家公司...
但是如果黃董賭對,那對沒有CPU的N社,也是一帖良藥

這篇11月中沉下去,快半年後的今天又被挖出來...
CUDA還是活的好好的,Adobe還為它出了個引擎,東工大還用它來加速WRF模型...
睡覺前看看美國新聞,還逛到DivX新的H.264/AVC encoder

但是如同e大說的,先賺再說...等OpenCL成熟後自然有其作法...合情合理~
enm wrote:
而且, 相對要付錢的 CUDA , OpenCL 的問題可能還在於技術支援性的不足



CUDA 免費
toolkit / SDK / 各種說明文件
都可以免費下載使用

http://developer.nvidia.com/object/cuda_3_0_downloads.html

所以才會有很多學術單位和研究機構採用
也有學生會自行練習開發

OpenCL的"開放"方式不見得是萬靈丹

比如說,由於Apple會主導OpenCL compiler一定要使用LLVM實作compiler.
LLVM針對VLIW架構的效率就不如Brook,CUDA的直接使用Open64,
效率有差之外,還有OpenCL的compiler不太成熟,很多複雜的寫法下會產生比較多bug等.

OpenCL要吃下原本GPGPU的基礎還有很長的路要走...
如果還有很多HPC應用繼續沿用CUDA/Brook+而不採用OpenCL
是一點都不奇怪的事情

一般軟體應用以及更低階的嵌入式/手持系統,在上面會發展的比較快倒是可以預期的....
AMD Radeon HD 4000 series has ‘known performance issues’ with OpenCL

這個大概可以猜到什麼原因...
由於DX10的規範,每組Unified Shader要有16KB的local memory
但是可以做成有任何的讀寫限制.這部份nVidia和ATI不但非常不同,而且ATI給的限制相對蠻詭異的.
nVidia是,這16KB被切成16 bank,每個thread可以讀寫其中一組,就是在一個cycle內可以讀寫其中的1/16.
ATI則是切成64塊,每一塊只針對一個thread是可寫入的,對其他63個thread是唯讀.

DX11的規範,除了這塊是32KB以外,就是不能有任何的讀寫限制跟效能差別.

這篇文章中說的"OpenCL是針對dx11硬體而做所以在dx10硬體上效果不好"是誤解
正解應該是說,OpenCL只幫你規定了底層硬體要有16KB Local memory,但是底層硬體的
讀寫限制跟效能差別,你要自己最佳化.

你的OpenCL程式沒針對這部份最佳化的話,在已經有更先進的DX11硬體上可以跑出很快樂的效能,
(在Fermi上應該會更快....)在限制較多的DX10硬體上 效能就跟撞牆差不多..

如果你花很多心思最佳化,可以達成更理想的結果,但是就可以要讓ATI DX10和nVidia DX10
使用不同的runtime code了.....
qbqbqb wrote:
東京工業大學用CUDA改寫WRF氣象模型
WRF模型之於氣象研究應該算是長久的project了吧?


這樣也算大型喔...
之前有個同事跳到 NASA 就是寫 OpenCL 用途我不知道
另外連 Adobe 賣的軟體也拿出來講
可見眼光不同啦...我現在用的軟體都數百萬美金起跳的
GPU 運算不是光給微軟系統下的轉媒體檔加速專用的
用途遠比想像的廣 而且用CUDA只是冰山一角

tyy2010 wrote:
這樣也算大型喔...
之前有個同事跳到 NASA 就是寫 OpenCL 用途我不知道
另外連 Adobe 賣的軟體也拿出來講
可見眼光不同啦...我現在用的軟體都數百萬美金起跳的
GPU 運算不是光給微軟系統下的轉媒體檔加速專用的
用途遠比想像的廣 而且用CUDA只是冰山一角
(恕刪)


嗯嗯~不好意思~眼界真的不同~見笑了~

強者我同事嘛~我了解我了解~

話說強者我朋友最近到光子力研究所跟兜十蔵博士一起研究,準備把マジンガーZ投射到宇宙,
跟NASA應該也會有合作,搞不好以後會遇到~再互相加油打氣吧!!

WRF wiki的介紹
反正到最後因為作業系統的關係支援DX11就不用怕任何問題,所以廠商也沒必要針對CUDA另外設計一套運作方式...

所以CUDA再怎嚜說重要性只會漸漸的消散,而ATI我覺得是擺爛,只等著DX11和CL而已...根本不花心思,因為CPU已經搞的頭暈腦脹的說
http://www.mobile01.com/topicdetail.php?f=501&t=3661465&p=4#47519520#47519520
JoyRex wrote:
反正到最後因為作業系統的關係支援DX11就不用怕任何問題,所以廠商也沒必要針對CUDA另外設計一套運作方式...

什麼時候linux,unix會開始支援DX11???
大部分的使用者用的事什麼作業系統?
哪一套作業系統賺的錢比較多?能為廠商賺大把的鈔票?

現階段看來,DX11出來後大多數的廠商會針對CUDA設計嗎?
http://www.mobile01.com/topicdetail.php?f=501&t=3661465&p=4#47519520#47519520
  • 7
內文搜尋
X
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 7)
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?