XEON Phi Coprocessor 協處理器

逛著網拍,突然想起這很久以前的卡,就買下來了。
再來是找驅動,驅動成功後,沒有出現很多CPU 框框。
也買了書來看 "Intel Xeon Phi協處理器高性能程序設計指南"
XEON Phi Coprocessor 協處理器


中間感覺走了很多彎路,就不說了。
就先練習累積多執行緒的程式經驗吧。

CPU G6900 + 電源 1000W
為了方便觀察,使用dead loop。
編譯兩次,專門給CPU 跑的跟PHI 跑的。

程式碼 1 :使用一個核心跑dead loop
XEON Phi Coprocessor 協處理器
輸出:CPU 一個核心100%
XEON Phi Coprocessor 協處理器
輸出:PHI 一個核心100%
XEON Phi Coprocessor 協處理器


程式碼 2 :所有核心跑dead loop
XEON Phi Coprocessor 協處理器
輸出:CPU 100%
XEON Phi Coprocessor 協處理器
輸出:PHI 100%
XEON Phi Coprocessor 協處理器


程式碼 3 : 指定PHI core 0 的四個執行緒
XEON Phi Coprocessor 協處理器
輸出: (一個執行緒是25%的高度)
XEON Phi Coprocessor 協處理器


程式碼 4 : 只允許PHI 執行緒 0 到 99 跑dead loop
XEON Phi Coprocessor 協處理器
輸出:
XEON Phi Coprocessor 協處理器


結論:
5110P 有60核240執行緒,有一核會被linux 拿去用。(程式回應236 threads)
7120P 有61核244執行緒,程式回應240 threads。
每執行一個phi 程式,需要用到一個CPU執行緒 去服務。
後面是P 代表無風扇版本,需要拿厚紙板剪裁黏一個進風口+風扇(或接風鼓)。


優缺點(跟Nvidia cuda 比較):
1. 一張PHI 待機要100W電源,GT 1030 待機 13 W(手上有的)。
2. FP32 (float) : PHI 的單浮點數2022G ,GT 1030 約一半出頭1127G。
3. 使用Nvidia cuda 計算需要額外的去學習Nvidia cuda 語法。
4. 聽說12代CPU之後要取消AVX512;PHI 每一個核心都有支援AVX512。
(AMD CPU 未來會內建AVX512 ?)
有使用到功能是優點,沒用到是缺點。

Intel AVX512 指令說明
(https://www.intel.com/content/www/us/en/docs/intrinsics-guide/index.html#expand=5159,5640,5159)
2022-12-26 0:28 發佈
文章關鍵字 XEON Phi Coprocessor
Phi計算卡,這個太........太冷門了.....

比“E5哥”的"洋垃圾e5"還冷門....

除非你所用的軟體有支援到phi......
個人搞美工的只能外行看熱鬧,
不過有測還是給個分

Phi系列記得只到第三代的樣子?
這算力想要跟GPU競爭真的蠻困難的,
不過也算是Intel敢於嘗試的作品...
自律努力讓自己變大隻
累積了一些小工具的程式碼。
(當初只是可以偷個懶,把瑣碎的事批量處理)

核心多了可以同時做的事也多了。
就加個兩行然後重新編譯,CPU可以把工作外包(offload)。


突然有個畫面出現
當兵時一堆兵拿鐮刀除草 VS 公園工人背除草機除草
(Phi 60核236緒 1.05 GHz VS 8核16緒 3.4GHz CPU)
ya19881217

鐮刀贏還是割草機贏?

2022-12-27 1:03
遇到大佬了
請問所有程序都能拆分成多執行續嗎?
例如 vivado (FPGA軟體,有時執行會只有一個線程在跑)
markyin
markyin 樓主

沒辦法把所有程序都改成多執行續,可以做到的話就使用硬體解決就好。不用學多執行序的語法了。

2023-01-12 23:34
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?