再來是找驅動,驅動成功後,沒有出現很多CPU 框框。
也買了書來看 "Intel Xeon Phi協處理器高性能程序設計指南"

中間感覺走了很多彎路,就不說了。
就先練習累積多執行緒的程式經驗吧。
CPU G6900 + 電源 1000W
為了方便觀察,使用dead loop。
編譯兩次,專門給CPU 跑的跟PHI 跑的。
程式碼 1 :使用一個核心跑dead loop

輸出:CPU 一個核心100%

輸出:PHI 一個核心100%

程式碼 2 :所有核心跑dead loop

輸出:CPU 100%

輸出:PHI 100%

程式碼 3 : 指定PHI core 0 的四個執行緒

輸出: (一個執行緒是25%的高度)

程式碼 4 : 只允許PHI 執行緒 0 到 99 跑dead loop

輸出:

結論:
5110P 有60核240執行緒,有一核會被linux 拿去用。(程式回應236 threads)
7120P 有61核244執行緒,程式回應240 threads。
每執行一個phi 程式,需要用到一個CPU執行緒 去服務。
後面是P 代表無風扇版本,需要拿厚紙板剪裁黏一個進風口+風扇(或接風鼓)。
優缺點(跟Nvidia cuda 比較):
1. 一張PHI 待機要100W電源,GT 1030 待機 13 W(手上有的)。
2. FP32 (float) : PHI 的單浮點數2022G ,GT 1030 約一半出頭1127G。
3. 使用Nvidia cuda 計算需要額外的去學習Nvidia cuda 語法。
4. 聽說12代CPU之後要取消AVX512;PHI 每一個核心都有支援AVX512。
(AMD CPU 未來會內建AVX512 ?)
有使用到功能是優點,沒用到是缺點。
Intel AVX512 指令說明
(https://www.intel.com/content/www/us/en/docs/intrinsics-guide/index.html#expand=5159,5640,5159)