(來源:科創100ETF基金)
前幾天,國家互聯網信息辦公室就H20算力晶元漏洞後門安全風險約談英偉達公司。
英偉達在隨後的自辯聲明中提到,晶元沒有「後門」,他們還專門提到了「Clipper晶片」 事件。
1992年,美國電話電報公司(AT&T)面向美國的商務人士推出了一款硬體設備,它可以對電話的語音傳輸進行加密,確保資訊安全。
這引發了美國政府的不滿。 很快,他們就要求美國電話電報公司(AT&T)在這個設備中換入一款新的微晶元——“Clipper晶元”。 它採用美國國家安全局(NSA)的加密演算法,由美國政府指定的承包商生產,包含一個“加密後門”。
這個「加密後門」,讓美國政府可以“解碼”設備上的通信資訊。
“Clipper晶片”推出後,受到各方的抵制,不到三年這個專案就宣告終止。 而美國政府也吸取了教訓,對於“加密後門”這種事,開始只做不說。
但就在今年,美國政府又開始堂而皇之地把「加密後門」這種事,拿到桌面上來講。 既然美國人這麼說了,我們就得從技術層面起底一下,美國如何給晶元安“後門”。
今年5月,美國眾議員比爾福斯特(14.140, 0.14, 1.00%)(603806)(Bill Foster)牽頭提出一項法案,要求美國商務部強制美國晶元企業在受出口管制的晶元中加入“後門”。
比爾. 福斯特是物理學博士,曾經有過晶元設計的工作經驗,所以他十分篤定地說,相關的技術十分成熟,完全可以實現。
比爾. 福斯特想要實現的,總結起來就是兩件事,一個是“追蹤定位”,一個是“遠端關閉”。
譚主從專業人士處瞭解到,比爾. 福斯特的判斷是準確的,這兩項功能,從技術上完全可以實現。
“後門”主要分為兩種,硬體“後門”和軟體“後門”。
硬體“後門”是晶片在設計或製造時留下的物理裝置,主要是具有“後門”功能的邏輯電路。
軟體“後門”可以理解為在軟體中植入具有“後門”功能的指令,通過運行軟體來對用戶的系統造成破壞、竊取機密等。
拿英偉達H20晶元舉例。
單從硬體“後門”角度考慮,就完全可以實現“遠端關閉”等功能。
H20晶元上有多個元件,包括:GPU核心、電源管理模組等。 只要在H20晶元的電源管理模組中植入「遠端關閉」電路,設定相應的觸發機制,就能在不依靠外部條件的情況下實現這一功能。 當晶片滿足以下條件:
激活時間達到提前設定的指標;
溫度、電壓等物理條件符合提前設定的指標。
H20晶元的電源管理模組就可以執行相應操作,包括:直接切斷晶元核心電源; 將電壓調整到不穩定區域,導致晶元功能異常等。 比如,最簡單直接的操作就是,賣給中國的晶元可以定時,設置用滿500個小時就自動關閉。
這樣一來,晶元直接無法使用,毫不誇張地說,所有的投入都相當於打水漂了。
另一種實現「遠端關閉」的硬體“後門”,是修改H20晶元的固件引導程式。 當晶元啟動時,引導程式會檢查特定條件(如地理位置資訊、授權狀態等),如果條件不滿足,就可以拒絕晶元啟動、啟動時禁用部分高級功能或限制晶元性能等。 目前H20幾乎是專供中國的,如果晶元里設置了“後門”,那麼“後門”的功能就具有高度的定向性,一旦啟動基本不會有“誤傷”。
奇安信(35.610, 0.56, 1.60%)威脅情報中心安全專家告訴譚主,從技術層面上來說,在生產階段,特定拒絕服務功能的硬體「後門」較好實現,但其實,這種方式的成本和代價都相對較高, 通過軟體設置或者軟硬體配合的方式安“後門”,才是最靈活的。
而利用軟體啟動“後門”,有一個很重要的抓手,就是CUDA。 CUDA(Compute Unified Device Architecture,統一計算設備架構),它不是一個產品,而是一種生態系統。
全球有超過400萬開發者在使用CUDA,它覆蓋了全球90%的人工智慧研究機構。 過去近20年間,它形成了一種正向迴圈:
越多開發者使用CUDA,就會催生出越多基於CUDA的應用程式,這些程式又吸引更多開發者和使用者加入CUDA。
也就是說,當你想使用CUDA的最新功能,就需要把更新的軟體導進系統里。 在這個更新驅動程式的環節中,晶元所在的系統,就有可能被加入啟動“後門”的指令,這個安“後門”的方式可以實現很多功能。
如果互聯網連接存在,通過動態地接收數據解密執行,就能實現「追蹤定位」功能,甚至更常規的檔收集、擊鍵記錄、螢幕截取等「後門」功能也可以實現。 也就是說,軟硬體“後門”配合下,信息洩露輕而易舉。
奇安信威脅情報中心安全專家告訴譚主,美國塑造人工智慧霸權的抓手,一個是硬體,一個是軟體生態系統。 對於其他國家來說,不僅要從硬體層面努力做到替代,也要建設起自主可控的軟體生態系統。
為了完成上述的這些佈置,美方曾經系統設計過一個機制——片上治理機制。 這個機制就提到,美國政府需要成立相關的部門,來協調晶元設計、生產、製造的各個環節,包括協調企業和盟友,來達到對人工智慧晶元的控制。
片上治理機制,能實現以下幾種功能:
一是許可鎖定。 若發現違規情況,廠商將立即停止簽發新的許可證,晶元則因無法更新而失效。
二是追蹤定位。 目標晶元與多個地標伺服器交互的回應速度,可以反映其大致位置。 晶元本身能實現主動查詢,只限制在特定地理區域運行。
三是使用監測。 內置硬體能夠記錄晶元狀態、訓練任務、計算量等關鍵資訊,要求使用者驗證晶元使用方式,確保開發符合美國的監管要求。
四是使用限制。 片上治理機制限制晶元在大型集群計算機和超級計算機中的使用,保護敏感數據訪問,並只允許晶元運行經過批准的代碼或模型。
在一份詳細介紹“片上治理機制”的報告中提到,英偉達的人工智慧晶元其實已經廣泛部署了片上治理所需的大部分功能,只不過有些還沒有啟動而已。
而如果晶元上還沒有這些功能,報告也特別提到,美國及其盟友掌握著最先進人工智慧晶元的產業鏈,因此,美國只需要“協調”好這些盟友,確保這些晶元都內置硬體,還是可以實現控制。
為了獲得晶元企業的配合,報告還建議,採取一些“激勵”措施,比如“預先市場承諾”——如果企業配合,滿足美國政府設置“後門”的要求,那美國政府可以將其排除在出口管制之外。 其中就特別提到,放寬對「中國低風險客戶」的出口。
結合這條資訊,再看美國政府允許英偉達出口H20到中國,不免有些細思極恐。
無論從哪個角度講,H20對於中國來說,都算不上是一款安全的晶元。
除了不安全,H20也不先進。
根據相關機構數據,相比於H20的標準版——H100,H20的整體算力只有約20%,其GPU核心的數量比H100減少41%,性能降低28%,這也導致H20無法滿足萬億級大模型訓練需求。
除了不先進,H20也不環保。
去年7月,國家發展改革委聯合有關部門印發了一個名叫《數據中心綠色低碳發展專項行動計劃》的檔。 《行動計劃》中提到,到2030年底,全國數據中心平均電能利用效率、單位算力能效和碳效達到國際先進水準。
一般來說,對於採用14nm以下工藝的伺服器GPU,節能水準的能效比需達到0.5TFLOPS/W,先進水準需達到1.0TFLOPS/W。
根據相關機構測算,H20的能效比大約為0.37TFLOPS/W,不滿足0.5TFLOPS/W的節能水準。
我們都知道,算力某種程度上也是電力,人工智慧的發展會新增大量的能源需求。 而這些新增的需求,也需要符合中國綠色轉型的節奏。
從這個角度來講,H20,當然不是一個好選擇。
當一款晶元,既不環保,也不先進,更不安全時,作為消費者,我們當然可以選擇,不買。 (玉淵譚天)
內文搜尋

X