• 5

Framework 推出自組式 Desktop 迷你電腦 搭載 AMD Ryzen AI MAX 處理器與大容量記憶體劍指 AI 應用

yoyo0719 wrote:
看起來就是把顯卡包裝...(恕刪)


要看跑什麼模型,單卡4090跑r1-70b跟AI 395效能差不多,都是3~4 token/s,半斤八兩

體積小效能高
陳拔 wrote:
Framework Desktop...(恕刪)


迷你電腦我喜歡

現在用的是AIO

一般電腦主機太大,不喜歡
試水溫的東西要再看看吧
魯舌麵 wrote:
要看跑什麼模型,單卡4090...(恕刪)


這篇文章根本就是門外漢寫的
你會相信 那表示你沒再玩單機AI
deepseek 70b 需要 44g RAM 或 VRAM
但單張4090只有24G VRAM不夠的記憶體 只能放到RAM
DDR4 的速度&頻寬 遠遠落後於 GDDR6
所以近20G放在RAM 表示幾乎被CPU拖累 可以視為純 cpu的速度
24G VRAM 只適合跑32B 近40個token /s
4090 的速度 應該是395+的3倍以上
所以395+跑32B應該 10 token/s 上下

70B 4090 48G雙卡 速度應該在35-40 token/s
軟體平台的問題 導致 只有48G的VRAM
卻只有一個4090核心在工作 所以速度降到15-20 token/s
395+ 約在3-5 token/s
Ghostwriter

雙卡4090張量並行會被通道頻寬拖累,速度變慢很正常,要玩通常都會搭伺服器多通道板來彌補記憶體。目前看起來 Framework 就是一個很有吸引力的玩具而已,搭著AI熱潮拉人買很貴的APU

2025-02-28 1:37
陳拔 wrote:
Framework Desktop...(恕刪)


AI 的話題真的很熱~
除了記憶體一開始就得選好這點比較可惜
其他真的是不錯啊
真要挑毛病的話就前面的熱插拔只給2個有點少 大部分得接後面
感覺不錯,只有文書、上網及影音需求,桌上型迷你電腦有興趣,希望價格親民
其實有點搞不懂啦
但這個主機的外型好可愛 蠻吸引我的
八幡 wrote:
AI 的話題真的很熱...(恕刪)


因為deepseek 對硬體需求大降
讓AI可以走進個人家中

這一周來 我在b站 摸索的結果
有興趣的去b站走走

14B 約 VRAM 9G 上下
32B 約 VRAM 20G 上下
70B 約VRAM 43G 上下

個人要玩 48G 顯卡要12-16G ,8G的沒搞頭
二張 魔改 2080TI 22G 一張NT 13000 含關稅 台灣 賣30000)
三張ARC 770 16G 或 魔改RX580 16G(太舊AMD的麻煩 不建議 要花時間搞定 一張NT3500 台灣有賣 NT3500)
四張 2060/3060 12G ( 4張 PCIE只能找工作站)
一堆舊計算卡 都被挖出來了(雖然vram很大, 但計算力真的拉, 勸你放棄)
多張顯卡的要跑 linux ubuntu + vllm,
win10 的好像就一張,多張顯卡也是擴VRAM 但GPU還是跑一顆 或分散跑卻跑不滿 但總效率還是一顆
上下文調小一點 速度可以增快 但思考變短淺

實際應用10 token/s 才有應用價值 不然看看一秒 1,2字 你會等到瘋
再不濟 也要6-8 tokens/s
395+ 32B只有3-4 token/s 買來玩AI 建議還是放棄 買顯卡
用7b 14b還不如直接用網路連 或直接買AM5 +DDR5 強力CPU運算即可 速度也還可以
395+ 只適合 7b 14b

NVIDIA 還在搞24G 真的很拉 給個96G不好嗎? 保證賣瘋
NVIDIA 等明年大容量推出 才會業績變好
但顯卡還NVIDIA 的好 支援最足(不足的就花時間 花錢處理)
deepseek 本周還深挖 cuda 將 NVIDIA的效能再增加幾成

顯卡速度評估 以我的3060 12g 跑 14b 大約 15-18 token
那跑7b 就會速度加倍 30-36 32b(假設單張3060 24G) 速度就為減半 6-8
也就是 bit 的比例數 那滿血版 671b 就是0.3 tokens/s

所以 2 張 3060 12G token 跑32B 大概是12-16 token (假設完全發揮效能)
實際還有PCIE頻寬的限制

AI還沒大爆發 只是正在走進家庭 要玩大的在等5年以上
玩小的 買顯卡比較快 買二手的約10000可以玩32B
最建議的是 2080ti 22g 一張搞定
Ghostwriter

實際上 3090 24G 比較適合,然後你說的全是 int4、1.58bit 極度量化,正經使用不會用那種東西

2025-02-28 19:44
kch008

我說的都是q4版本, 不是q1.58, 我的3060 只有12G 只能跑32b q2 , 12.31G , 丟一些去ram跑還是可以的

2025-02-28 22:54
  • 5
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?