Framework 推出自組式 Desktop 迷你電腦搭載 AMD Ryzen AI MAX 處理器與大容量記憶體劍指 AI 應用 (第3頁)

魯舌麵

魯舌麵
個人積分：127分
文章編號：91188057

127分

21樓

2025-02-26 17:18

yoyo0719 wrote:
看起來就是把顯卡包裝...(恕刪)

要看跑什麼模型，單卡4090跑r1-70b跟AI 395效能差不多，都是3~4 token/s，半斤八兩

shy guy

shy guy
個人積分：902分
文章編號：91189114

902分

22樓

2025-02-26 20:58

體積小效能高

阿速吉八

阿速吉八
個人積分：4509分
文章編號：91189346

4509分

23樓

2025-02-26 21:54

陳拔 wrote:
Framework Desktop...(恕刪)

迷你電腦我喜歡

現在用的是AIO

一般電腦主機太大，不喜歡

5430493

5430493
個人積分：604分
文章編號：91189364

604分

24樓

2025-02-26 21:59

試水溫的東西要再看看吧

kch008

kch008
個人積分：1965分
文章編號：91189639

1965分

25樓

2025-02-26 23:06

魯舌麵 wrote:
要看跑什麼模型，單卡4090...(恕刪)

這篇文章根本就是門外漢寫的
你會相信那表示你沒再玩單機AI
deepseek 70b 需要 44g RAM 或 VRAM
但單張4090只有24G VRAM不夠的記憶體只能放到RAM
DDR4 的速度&頻寬遠遠落後於 GDDR6
所以近20G放在RAM 表示幾乎被CPU拖累可以視為純 cpu的速度
24G VRAM 只適合跑32B 近40個token /s
4090 的速度應該是395+的3倍以上
所以395+跑32B應該 10 token/s 上下

70B 4090 48G雙卡速度應該在35-40 token/s
軟體平台的問題導致只有48G的VRAM
卻只有一個4090核心在工作所以速度降到15-20 token/s
395+ 約在3-5 token/s

Ghostwriter

雙卡4090張量並行會被通道頻寬拖累，速度變慢很正常，要玩通常都會搭伺服器多通道板來彌補記憶體。目前看起來 Framework 就是一個很有吸引力的玩具而已，搭著AI熱潮拉人買很貴的APU

2025-02-28 1:37

八幡

八幡
個人積分：1107分
文章編號：91191023

1107分

26樓

2025-02-27 9:55

陳拔 wrote:
Framework Desktop...(恕刪)

AI 的話題真的很熱~

亞甜莎

亞甜莎
個人積分：2577分
文章編號：91191161

2577分

27樓

2025-02-27 10:13

除了記憶體一開始就得選好這點比較可惜
其他真的是不錯啊
真要挑毛病的話就前面的熱插拔只給2個有點少大部分得接後面

stevenlee

stevenlee
個人積分：1015分
文章編號：91192631

1015分

28樓

2025-02-27 13:49

感覺不錯，只有文書、上網及影音需求，桌上型迷你電腦有興趣，希望價格親民

小智阿偉

小智阿偉
個人積分：1791分
文章編號：91195596

1791分

29樓

2025-02-27 23:37

其實有點搞不懂啦
但這個主機的外型好可愛蠻吸引我的

kch008

kch008
個人積分：1965分
文章編號：91196720

1965分

30樓

2025-02-28 9:44

八幡 wrote:
AI 的話題真的很熱...(恕刪)

因為deepseek 對硬體需求大降
讓AI可以走進個人家中

這一周來我在b站摸索的結果
有興趣的去b站走走

14B 約 VRAM 9G 上下
32B 約 VRAM 20G 上下
70B 約VRAM 43G 上下

個人要玩 48G 顯卡要12-16G ,8G的沒搞頭
二張魔改 2080TI 22G 一張NT 13000 含關稅台灣賣30000)
三張ARC 770 16G 或魔改RX580 16G(太舊AMD的麻煩不建議要花時間搞定一張NT3500 台灣有賣 NT3500)
四張 2060/3060 12G ( 4張 PCIE只能找工作站)
一堆舊計算卡都被挖出來了(雖然vram很大, 但計算力真的拉, 勸你放棄)
多張顯卡的要跑 linux ubuntu + vllm,
win10 的好像就一張，多張顯卡也是擴VRAM 但GPU還是跑一顆或分散跑卻跑不滿但總效率還是一顆
上下文調小一點速度可以增快但思考變短淺

實際應用10 token/s 才有應用價值不然看看一秒 1,2字你會等到瘋
再不濟也要6-8 tokens/s
395+ 32B只有3-4 token/s 買來玩AI 建議還是放棄買顯卡
用7b 14b還不如直接用網路連或直接買AM5 +DDR5 強力CPU運算即可速度也還可以
395+ 只適合 7b 14b

NVIDIA 還在搞24G 真的很拉給個96G不好嗎? 保證賣瘋
NVIDIA 等明年大容量推出才會業績變好
但顯卡還NVIDIA 的好支援最足(不足的就花時間花錢處理)
deepseek 本周還深挖 cuda 將 NVIDIA的效能再增加幾成

顯卡速度評估以我的3060 12g 跑 14b 大約 15-18 token
那跑7b 就會速度加倍 30-36 32b(假設單張3060 24G) 速度就為減半 6-8
也就是 bit 的比例數那滿血版 671b 就是0.3 tokens/s

所以 2 張 3060 12G token 跑32B 大概是12-16 token (假設完全發揮效能)
實際還有PCIE頻寬的限制

AI還沒大爆發只是正在走進家庭要玩大的在等5年以上
玩小的買顯卡比較快買二手的約10000可以玩32B
最建議的是 2080ti 22g 一張搞定

Ghostwriter

實際上 3090 24G 比較適合，然後你說的全是 int4、1.58bit 極度量化，正經使用不會用那種東西

2025-02-28 19:44

kch008

我說的都是q4版本, 不是q1.58, 我的3060 只有12G 只能跑32b q2 , 12.31G , 丟一些去ram跑還是可以的

2025-02-28 22:54

Framework 推出自組式 Desktop 迷你電腦 搭載 AMD Ryzen AI MAX 處理器與大容量記憶體劍指 AI 應用

Framework 推出自組式 Desktop 迷你電腦搭載 AMD Ryzen AI MAX 處理器與大容量記憶體劍指 AI 應用