高佳菁/核稿編輯
〔財經頻道/綜合報導〕中國AI新創公司DeepSeek以高性價比(CP值)方式,推出能夠媲美OpenAI性能的AI模型,震驚矽谷與科技界,輝達、台積電ADR、博通在週一(27日)亞洲早盤重挫逾5.5%,而輝達供應商日商愛德萬測試(Advantest)與軟銀股價週一盤中更暴殺逾8%。
DeepSeek一夕爆紅,公司20日對外正式發表新的AI模型DeepSeek-R1,因性能與OpenAI最新的o1相媲美,引發轟動。
根據財聯社報導,DeepSeek僅用2048組H800繪圖晶片(GPU)、耗時2個月,就訓練出了1個6710億參數的DeepSeek-V3。相較下,Meta訓練參數量4050億的Llama 3,用了16384組更強的H100顯示卡,耗費54天,這代表DeepSeek的訓練效率提升了11倍。
瑞聯銀行的常務董事Vey-Sern Ling表示,DeepSeek顯示出,用較低成本開發強大AI模型是可能的,這可能會破壞目前由少數幾家科技巨擘高額支出主導整個AI供應鏈的投資邏輯。
受此消息衝擊,日美科技股全面血崩,美股夜盤中輝達、台積電ADR與博通以低盤開出,開低走低,在台灣時間27日下午2點37分,輝達下挫6.56%、台積電ADR跌逾6.21%,博通也跌5.71%。
至於美股標普500指數期貨重挫逾1.2%,那斯達克100指數期貨大跌2.2%。
而亞股中,台、韓股休市,日股中輝達的半導體測試設備供應商愛德萬測試與軟銀股價盤中重挫8%,而東京威力科創(Tokyo Electron)跌逾4%、Disco下跌3.3%。
我知道怎樣處卑賤,也知道怎樣處豐富;在一切事上,在一切情況下,或飽足或飢餓或豐富或缺乏,我都得了秘訣
2025-01-27 17:11 發佈
brabus1518 wrote:
再怎樣還是需要台積電的晶片制造
早就過度反應了,之前的所有的算力預估都是以CloseAI講的為準,現在開源的DeepSeek用很低的算力就能超過 CloseAI,代表根本不需要囤積這麼多算力。所有市場的預估都要重洗…
而且影響了未來大模型開發走向,從堆積算力,轉回模型訓練演算優化,專注算法才是真正的軟體王道。未來其他新模型的走向也會轉為低算力優化… 不需要早前預估的這麼多算力。
內文搜尋

X