• 2

華為晶片系統號稱超越輝達 中國AI業打造「去美化」生態

ionium007 wrote:
"半導體研究機構SemiAnalysis日前發布報告,指稱華為AI處理器-Ascend 910C雖號稱是「中國製」,事實上卻採用台積電7奈米晶片"



SemiAnalysis的報導內容是基於消息或間接揭露,並非透過拆解得知 ,並未附上切割斷面圖。

到目前為止
沒有權威機構
進行昇騰910C的切割分析報告

Techinsight最新切割的是麒麟X90
確認是中芯的工藝
台灣又拿著全世界工業強國的產品 碰瓷中國一國 然後台灣自己高潮 一國單挑全世界高科技產品 不過跟台灣無關
華為首次線下展出昇騰384顆自研芯AI方案
發佈日期:2025-07-28
來源:芯智訊
7月26日,2025世界人工智慧大會(WAIC)在上海世博中心啟幕,華為首次線下展出昇騰384超節點,即Atlas 900 A3 SuperPoD,支援單集群300PFLOPS算力輸出。

據介紹,該產品基於超節點架構,採用全對等(Peer-to-Peer)UB 總線,將384 顆 NPU + 192 顆鯤鵬 CPU 通過無阻塞 Clos 架構互聯,單跳時延 <200 ns,帶寬 392 GB/s,比傳統 RoCE 提升 15 倍。 3168 根光纖 + 6912 個 400 G 光模組實現百納秒級互聯,支援 2 m 以上長距部署,突破了銅纜距離限制。

這些大帶寬低時延互聯技術,解決了昇騰384超節點集群內計算、存儲等各資源之間的通信瓶頸,通過系統工程的優化,實現資源的高效調度,讓超節點像一台計算機一樣工作。 具體性能上,昇騰384超節點單集群 BF16 稠密算力 300 PFLOPs,約為英偉達 GB200 NVL72 的 1.7 倍。

能效比(MFU)從行業平均 30% 提升到 45% 以上,已用於訓練 7180 億參數的盤古 Ultra MoE 大模型。

值得一提的是,在今年5月的鯤鵬昇騰開發者大會上,華為推出了昇騰超節點(CloudMatrix 384),成功實現業界最大規模的384卡高速總線互聯。 昇騰超節點具備超大頻寬、超低時延、超強性能的三大優勢,包括多款訓練和推理產品,基於超節點創新架構,更好的滿足模型訓練和推理對低時延,大頻寬,長穩可靠的要求。

本月初,華為雲官微通過一段視頻展示了CloudMatrix 384超節點算力集群,並表示該超節點算力集群可實現業界最大單卡推理輸送量——2300Tokens/s; 業界最大集群算力——16萬卡,萬卡線性度高達95%; 雲上確定性運維-40天長穩訓練、10分鐘快速恢復。

華為雲表示,新一代昇騰AI雲服務,是最適合大模型應用的算力服務。

簡單來說,華為CloudMatrix並非簡單的“堆卡”,而是通過高頻寬全對等互聯(Peer-to-Peer)來設計,這也是CloudMatrix 384硬體架構的一大創新。

傳統的AI集群中,CPU相當於公司領導的角色,NPU等其它硬體更像是下屬,數據傳輸的過程中就需要CPU審批和簽字,效率就會大打折扣。

但在CloudMatrix384中,CPU和NPU等硬體更像是一個扁平化管理的團隊,它們之間的地位比較平等,直接通過UB網路通信直接對話,效率自然就上來了。

今年4月份,國際知名半導體研究和諮詢機構SemiAnalysis發佈專題報導稱,華為雲最新推出的AI算力集群解決方案CloudMatrix 384(簡稱CM384)憑藉其顛覆性的系統架構設計與全棧技術創新,在多項關鍵指標上實現對英偉達旗艦產品GB200 NVL72的超越,標誌著中國在人工智慧基礎設施領域實現里程碑式突破。

據SemiAnalysis披露,華為雲CM384基於384顆昇騰晶元構建,通過全互連拓撲架構實現晶元間高效協同,可提供高達300 PFLOPs的密集BF16算力,接近達到英偉達GB200 NVL72系統的兩倍。 此外,CM384在記憶體容量和頻寬方面同樣佔據優勢,總記憶體容量超出英偉達方案3.6倍,記憶體頻寬也達到2.1倍,為大規模AI訓練和推理提供了更高效的硬體支援。

報導分析稱,儘管單顆昇騰晶元性能約為英偉達Blackwell架構GPU的三分之一,但華為通過規模化系統設計,成功實現整體算力躍升,並在超大規模模型訓練、即時推理等場景中展現更強競爭力。

SemiAnalysis也指出,華為的工程優勢不僅體現在晶元層面,更在於系統級的創新,包括網路架構、光學互聯和軟體優化,使得CM384能夠充分發揮集群算力,滿足超大規模AI計算需求。

此次華為雲CloudMatrix 384的發佈,標誌著中國在AI計算系統領域已具備與國際巨頭正面競爭的實力。

SemiAnalysis在報導中特別指出,華為的規模化解決方案「領先於英偉達和AMD目前市場上的產品一代」,並認為中國在AI基礎設施上的突破將對全球AI產業格局產生深遠影響。
PainterJ

尺寸重量遙遙領先[笑]

2025-07-31 13:56
tteffuB 特肥吧

大陸就是地大,綠電量大管飽又便宜。[笑][笑]

2025-07-31 16:25
自主可控「上海方案」、384 超節點、萬卡推理集群、一體機…頭部算力廠商集中亮相|直擊 WAIC2025

2025-07-28 20:02 星期一

財聯社記者付靜

①Shanghai Cube國產高密度機櫃、昇騰384超節點真機首次公開展示;
②超節點是一大重要趨勢,或成為明年智算中心的主流產品;
③推理晶片為推動應用規模化部署的核心動力,普及需要技術夠強、成本夠低。

財聯社 7 月 28 日訊(記者付靜) 一年一度的 AI 產業盛會世界人工智慧大會(WAIC)期間,一面由算力伺服器組成的「算力牆」吸引了眾多觀眾駐足。據悉,這是首次公開展示的 Shanghai Cube 國產高密度機櫃,由算豐資訊、沐曦集、雲合智網、道客、無問芯穹、復旦大學、創智學院、模合資訊等科研機構、企業共同打造,係自主可控 AI 全棧生態鏈的「上海方案」。

Shanghai Cube 國產高密度機櫃受訪者供圖

「簡單來說,Shanghai Cube 國產高密度機櫃就是把晶片、儲存、網路、管理節點等硬件,與作業系統、運算平台、調度軟體、AI 平台這些軟體,從頭到尾深度整合在一起的高效能運算系統。其 GPU 晶片、智慧網卡與網路交換晶片、資訊冷系統、作業系統調度平台等所有核心零件,全部由中國企業介紹。

據悉,上述機櫃的單一標準機櫃包含 128 張 GPU 模組,目前進入量產階段,其首套樣機已部署於復旦大學上海張江校區,並完成了對一些主流大模型的推理及訓練支持,以及與多個科學計算和算力調度平台的適配。

財聯社記者多方採訪獲悉,超節點是 AI 算力基礎設施的一大重要趨勢,其作為典型的匯聚算力產業鏈成果的整體方案,將為國內算力產業發展提供新機遇。

新華三高級副總裁、雲端與運算儲存產品線總裁徐潤安在 WAIC2025 期間做分享時表示,「怎樣的算力形態能夠滿足當下或未來的大模型使用需求?超節點已經成為了公認的答案。隨著模型規模擴大,我們需要更強大、更均衡的算力,帶來更高性能的大規模並行運算能力。

在此背景下,華為展台格外吸睛。 WAIC2025前夕,不少算力交流群內就已流傳出此次華為重點展出的「昇騰384超節點真機」照片。

財聯社記者獲悉,此次是華為首次線下展出昇騰384超節點真機,該方案由12個計算櫃和4個總線櫃構成,其規模目前為業界最大。根據媒體公開報道,昇騰超節點於5月的鯕鵬昇騰開發者大會上推出,旨在解決由伺服器、儲存、網路等設備堆疊而成的傳統集群,在大規模訓練時面臨的資源利用率低、故障頻傳等挑戰。

就在WAIC2025正式開幕前的25日,受昇騰超節點訊息影響,華為算力概念股異動拉升,其中直真科技(003007.SZ)開盤秒速漲停。 28日,直真科技實現2連板。

同時,財聯社記者從新華三方面獲悉,其UniPoD超節點單機櫃支援64卡,並可擴展到萬卡GPU集群。

財聯社記者在現場亦了解到,中興通訊(000063.SZ)為運營商和行業客戶提供涵蓋超節點伺服器、系列化智算伺服器/通算伺服器/高效能儲存及智算一體機等全端開放智算解決方案,以晶片、板卡、AI伺服器、超端節點以及超大規模全算力基等產品建構。

目前來看,已有許多廠商佈局超節點,更有算力從業人員預計,超節點會成為明年智算中心的主流產品。

徐潤安認為,透過scale up的網路打造的超節點產品,將高效能低延時的AI晶片集群互聯網絡從八卡擴展到了十卡、上百卡乃至千卡,且以整機櫃形態將計算、供電、製冷於一體,滿足大模型對算力的極致需求,成為了未來AI伺服器伺服器大必然的發展趨勢。

根據財聯社記者觀察,除了超節點伺服器,此次眾多頭部算力廠商還展出了推理卡、一體機、多款晶片和伺服器新品,備受業界關注。

WAIC2025現場,中國電子雲、中國長城(000066.SZ)、沐曦股份聯合發布三大AI一體機,產品集成中國電子雲AI能力、中國長城伺服器、沐曦股份GPU,由三方聯合進行訓推引擎優化。

財聯社記者多方採訪獲悉,推理晶片正成為推動AI應用規模化部署的核心動力。

WAIC2025期間,雲天勵飛(688343.SH)董事長兼CEO陳寧宣佈公司將策略聚焦推理晶片。他告訴財聯社記者,大模型技術達到新的成熟高度,模型調用成本顯著降低,使得AI從“專家工具”逐步演變為“全民基礎設施”,預示著推理算力需求將迎來爆發式增長。

燧原科技方面告訴財聯社記者,其人工智慧推理加速卡燧原S60截至去年底已在互聯網客戶和各地智算中心落地五萬卡,在“東數西算”節點甘肅慶陽建成國內首個萬卡推理集群。

燧原科技方面同時表示,公司自2019年起與騰訊開始人工智慧應用場景深度合作,目前已累計為騰訊提供數萬張人工智慧算力卡,在多個應用場景中大規模業務上線。

神州數碼(000034.SZ)旗下神州鯤泰發布了訓推一體伺服器KunTai R624 K2及推理伺服器KunTai R622 K2。記者獲悉,二者基於鯕鵬處理器,相較以往產品計算及資料傳輸效能顯著提升。

現場,一位從業人員向財聯社記者坦言,AI推理晶片的普及仍需要兩大要素:技術夠強、成本夠低。

近期國產晶片廠商集體衝刺IPO,加速佈局AI算力。這次的WAIC2025正是集中展示頭部算力廠商最新成果的重要窗口。多家廠商亦強調了產業生態合作的重要性。燧原科技創辦人趙立東稱,算力基礎設施正走向群聚化、系統化。相關軟硬體技術,包括超節點、網路技術、全光互聯、低精度、分散式並行運算、虛擬化等,已不再是一家公司可以單獨完成,而是需要多方聚力。
  • 2
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?