2

華為晶片系統號稱超越輝達中國AI業打造「去美化」生態

nomo333

nomo333
個人積分：975分
文章編號：91930859

975分

11樓

2025-07-30 7:17

ionium007 wrote:
"半導體研究機構SemiAnalysis日前發布報告，指稱華為AI處理器-Ascend 910C雖號稱是「中國製」，事實上卻採用台積電7奈米晶片"

SemiAnalysis的報導內容是基於消息或間接揭露，並非透過拆解得知，並未附上切割斷面圖。

到目前為止
沒有權威機構
進行昇騰910C的切割分析報告

Techinsight最新切割的是麒麟X90
確認是中芯的工藝

落爪印

落爪印
個人積分：125分
文章編號：91931131

125分

12樓

2025-07-30 8:27

台灣又拿著全世界工業強國的產品碰瓷中國一國然後台灣自己高潮一國單挑全世界高科技產品不過跟台灣無關

tteffuB 特肥吧

tteffuB 特肥吧
個人積分：3253分
文章編號：91938595

3253分

13樓

2025-07-31 13:42

華為首次線下展出昇騰384顆自研芯AI方案
發佈日期：2025-07-28
來源：芯智訊
7月26日，2025世界人工智慧大會（WAIC）在上海世博中心啟幕，華為首次線下展出昇騰384超節點，即Atlas 900 A3 SuperPoD，支援單集群300PFLOPS算力輸出。

據介紹，該產品基於超節點架構，採用全對等（Peer-to-Peer）UB 總線，將384 顆 NPU + 192 顆鯤鵬 CPU 通過無阻塞 Clos 架構互聯，單跳時延 <200 ns，帶寬 392 GB/s，比傳統 RoCE 提升 15 倍。 3168 根光纖 + 6912 個 400 G 光模組實現百納秒級互聯，支援 2 m 以上長距部署，突破了銅纜距離限制。

這些大帶寬低時延互聯技術，解決了昇騰384超節點集群內計算、存儲等各資源之間的通信瓶頸，通過系統工程的優化，實現資源的高效調度，讓超節點像一台計算機一樣工作。具體性能上，昇騰384超節點單集群 BF16 稠密算力 300 PFLOPs，約為英偉達 GB200 NVL72 的 1.7 倍。

能效比（MFU）從行業平均 30% 提升到 45% 以上，已用於訓練 7180 億參數的盤古 Ultra MoE 大模型。

值得一提的是，在今年5月的鯤鵬昇騰開發者大會上，華為推出了昇騰超節點（CloudMatrix 384），成功實現業界最大規模的384卡高速總線互聯。昇騰超節點具備超大頻寬、超低時延、超強性能的三大優勢，包括多款訓練和推理產品，基於超節點創新架構，更好的滿足模型訓練和推理對低時延，大頻寬，長穩可靠的要求。

本月初，華為雲官微通過一段視頻展示了CloudMatrix 384超節點算力集群，並表示該超節點算力集群可實現業界最大單卡推理輸送量——2300Tokens/s; 業界最大集群算力——16萬卡，萬卡線性度高達95%; 雲上確定性運維-40天長穩訓練、10分鐘快速恢復。

華為雲表示，新一代昇騰AI雲服務，是最適合大模型應用的算力服務。

簡單來說，華為CloudMatrix並非簡單的“堆卡”，而是通過高頻寬全對等互聯（Peer-to-Peer）來設計，這也是CloudMatrix 384硬體架構的一大創新。

傳統的AI集群中，CPU相當於公司領導的角色，NPU等其它硬體更像是下屬，數據傳輸的過程中就需要CPU審批和簽字，效率就會大打折扣。

但在CloudMatrix384中，CPU和NPU等硬體更像是一個扁平化管理的團隊，它們之間的地位比較平等，直接通過UB網路通信直接對話，效率自然就上來了。

今年4月份，國際知名半導體研究和諮詢機構SemiAnalysis發佈專題報導稱，華為雲最新推出的AI算力集群解決方案CloudMatrix 384（簡稱CM384）憑藉其顛覆性的系統架構設計與全棧技術創新，在多項關鍵指標上實現對英偉達旗艦產品GB200 NVL72的超越，標誌著中國在人工智慧基礎設施領域實現里程碑式突破。

據SemiAnalysis披露，華為雲CM384基於384顆昇騰晶元構建，通過全互連拓撲架構實現晶元間高效協同，可提供高達300 PFLOPs的密集BF16算力，接近達到英偉達GB200 NVL72系統的兩倍。此外，CM384在記憶體容量和頻寬方面同樣佔據優勢，總記憶體容量超出英偉達方案3.6倍，記憶體頻寬也達到2.1倍，為大規模AI訓練和推理提供了更高效的硬體支援。

報導分析稱，儘管單顆昇騰晶元性能約為英偉達Blackwell架構GPU的三分之一，但華為通過規模化系統設計，成功實現整體算力躍升，並在超大規模模型訓練、即時推理等場景中展現更強競爭力。

SemiAnalysis也指出，華為的工程優勢不僅體現在晶元層面，更在於系統級的創新，包括網路架構、光學互聯和軟體優化，使得CM384能夠充分發揮集群算力，滿足超大規模AI計算需求。

此次華為雲CloudMatrix 384的發佈，標誌著中國在AI計算系統領域已具備與國際巨頭正面競爭的實力。

SemiAnalysis在報導中特別指出，華為的規模化解決方案「領先於英偉達和AMD目前市場上的產品一代」，並認為中國在AI基礎設施上的突破將對全球AI產業格局產生深遠影響。

PainterJ

尺寸重量遙遙領先[笑]

2025-07-31 13:56

tteffuB 特肥吧

大陸就是地大，綠電量大管飽又便宜。[笑][笑]

2025-07-31 16:25

nomo333

nomo333
個人積分：975分
文章編號：91939230

975分

14樓

2025-07-31 15:27

自主可控「上海方案」、384 超節點、萬卡推理集群、一體機…頭部算力廠商集中亮相|直擊 WAIC2025

2025-07-28 20:02 星期一

財聯社記者付靜

①Shanghai Cube國產高密度機櫃、昇騰384超節點真機首次公開展示；
②超節點是一大重要趨勢，或成為明年智算中心的主流產品；
③推理晶片為推動應用規模化部署的核心動力，普及需要技術夠強、成本夠低。

財聯社 7 月 28 日訊（記者付靜）一年一度的 AI 產業盛會世界人工智慧大會（WAIC）期間，一面由算力伺服器組成的「算力牆」吸引了眾多觀眾駐足。據悉，這是首次公開展示的 Shanghai Cube 國產高密度機櫃，由算豐資訊、沐曦集、雲合智網、道客、無問芯穹、復旦大學、創智學院、模合資訊等科研機構、企業共同打造，係自主可控 AI 全棧生態鏈的「上海方案」。

Shanghai Cube 國產高密度機櫃受訪者供圖

「簡單來說，Shanghai Cube 國產高密度機櫃就是把晶片、儲存、網路、管理節點等硬件，與作業系統、運算平台、調度軟體、AI 平台這些軟體，從頭到尾深度整合在一起的高效能運算系統。其 GPU 晶片、智慧網卡與網路交換晶片、資訊冷系統、作業系統調度平台等所有核心零件，全部由中國企業介紹。

據悉，上述機櫃的單一標準機櫃包含 128 張 GPU 模組，目前進入量產階段，其首套樣機已部署於復旦大學上海張江校區，並完成了對一些主流大模型的推理及訓練支持，以及與多個科學計算和算力調度平台的適配。

財聯社記者多方採訪獲悉，超節點是 AI 算力基礎設施的一大重要趨勢，其作為典型的匯聚算力產業鏈成果的整體方案，將為國內算力產業發展提供新機遇。

新華三高級副總裁、雲端與運算儲存產品線總裁徐潤安在 WAIC2025 期間做分享時表示，「怎樣的算力形態能夠滿足當下或未來的大模型使用需求？超節點已經成為了公認的答案。隨著模型規模擴大，我們需要更強大、更均衡的算力，帶來更高性能的大規模並行運算能力。

在此背景下，華為展台格外吸睛。 WAIC2025前夕，不少算力交流群內就已流傳出此次華為重點展出的「昇騰384超節點真機」照片。

財聯社記者獲悉，此次是華為首次線下展出昇騰384超節點真機，該方案由12個計算櫃和4個總線櫃構成，其規模目前為業界最大。根據媒體公開報道，昇騰超節點於5月的鯕鵬昇騰開發者大會上推出，旨在解決由伺服器、儲存、網路等設備堆疊而成的傳統集群，在大規模訓練時面臨的資源利用率低、故障頻傳等挑戰。

就在WAIC2025正式開幕前的25日，受昇騰超節點訊息影響，華為算力概念股異動拉升，其中直真科技（003007.SZ）開盤秒速漲停。 28日，直真科技實現2連板。

同時，財聯社記者從新華三方面獲悉，其UniPoD超節點單機櫃支援64卡，並可擴展到萬卡GPU集群。

財聯社記者在現場亦了解到，中興通訊（000063.SZ）為運營商和行業客戶提供涵蓋超節點伺服器、系列化智算伺服器/通算伺服器/高效能儲存及智算一體機等全端開放智算解決方案，以晶片、板卡、AI伺服器、超端節點以及超大規模全算力基等產品建構。

目前來看，已有許多廠商佈局超節點，更有算力從業人員預計，超節點會成為明年智算中心的主流產品。

徐潤安認為，透過scale up的網路打造的超節點產品，將高效能低延時的AI晶片集群互聯網絡從八卡擴展到了十卡、上百卡乃至千卡，且以整機櫃形態將計算、供電、製冷於一體，滿足大模型對算力的極致需求，成為了未來AI伺服器伺服器大必然的發展趨勢。

根據財聯社記者觀察，除了超節點伺服器，此次眾多頭部算力廠商還展出了推理卡、一體機、多款晶片和伺服器新品，備受業界關注。

WAIC2025現場，中國電子雲、中國長城（000066.SZ）、沐曦股份聯合發布三大AI一體機，產品集成中國電子雲AI能力、中國長城伺服器、沐曦股份GPU，由三方聯合進行訓推引擎優化。

財聯社記者多方採訪獲悉，推理晶片正成為推動AI應用規模化部署的核心動力。

WAIC2025期間，雲天勵飛（688343.SH）董事長兼CEO陳寧宣佈公司將策略聚焦推理晶片。他告訴財聯社記者，大模型技術達到新的成熟高度，模型調用成本顯著降低，使得AI從“專家工具”逐步演變為“全民基礎設施”，預示著推理算力需求將迎來爆發式增長。

燧原科技方面告訴財聯社記者，其人工智慧推理加速卡燧原S60截至去年底已在互聯網客戶和各地智算中心落地五萬卡，在“東數西算”節點甘肅慶陽建成國內首個萬卡推理集群。

燧原科技方面同時表示，公司自2019年起與騰訊開始人工智慧應用場景深度合作，目前已累計為騰訊提供數萬張人工智慧算力卡，在多個應用場景中大規模業務上線。

神州數碼（000034.SZ）旗下神州鯤泰發布了訓推一體伺服器KunTai R624 K2及推理伺服器KunTai R622 K2。記者獲悉，二者基於鯕鵬處理器，相較以往產品計算及資料傳輸效能顯著提升。

現場，一位從業人員向財聯社記者坦言，AI推理晶片的普及仍需要兩大要素：技術夠強、成本夠低。

近期國產晶片廠商集體衝刺IPO，加速佈局AI算力。這次的WAIC2025正是集中展示頭部算力廠商最新成果的重要窗口。多家廠商亦強調了產業生態合作的重要性。燧原科技創辦人趙立東稱，算力基礎設施正走向群聚化、系統化。相關軟硬體技術，包括超節點、網路技術、全光互聯、低精度、分散式並行運算、虛擬化等，已不再是一家公司可以單獨完成，而是需要多方聚力。

2

華為晶片系統號稱超越輝達 中國AI業打造「去美化」生態

華為晶片系統號稱超越輝達中國AI業打造「去美化」生態