总部位于杭州的中国AI新创公司「深度求索」(DeepSeek),去年底1月20日先后发布了「DeepSeek-V3」和「DeepSeek-R1」两款大模型,由于成本低廉,性能与OpenAI相当,陆媒指此举引发硅谷震惊,甚至引发Meta内部焦虑。(取自DeepSeek官网)
总部位于杭州的中国AI新创公司深度求索(DeepSeek)近期先后发布「DeepSeek-V3」和「DeepSeek-R1」两款大模型,由于成本低廉,性能与OpenAI相当,让硅谷震惊,甚至引发Meta内部的恐慌。然而,一夕爆火的DeepSeek可能引发美国芯片调查,因市场传出DeepSeek拥有五万个已经被禁止出口至中国的辉达H100人工智能芯片。
美国AI新创公司Scale AI 首席执行官 Alexandr Wang 最近接受采访时爆料,Deepseek拥有大约五万个辉达最先进的H100 GPU,并指「但是很明显他们不能说出来,因为这违反了美国所实施的出口管制,我相信他们拥有比外界想像的更多,他们未来会被芯片管制,和出口管制所限制」。
财联社报导,甚至有投资者将辉达上周重挫3.12%的原因指向DeepSeek的一夜爆火。德国《世界报》知名市场评论员Holger Zschaepitz表示:「中国的DeepSeek可能代表对美国股市的最大威胁,因为该公司似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用尖端芯片。这让人质疑投入该行业的数千亿美元资本支出的实际效用。」
据报导,DeepSeek仅用2,048片H800显卡(GPU)、耗时两个月,就训练出了一个6,710亿参数的DeepSeek-V3。相较于Meta训练参数量4,050亿的Llama 3,用了16,384片更强的H100显卡,花了54天。Deepseek的训练效率提升了11倍。





























































































