英偉達周三表示,已經(jīng)收到美國政府要求其停止向中國出口兩款用于人工智能工作的頂級計算芯片的通知,此舉可能會削弱中國公司開展先進技術(shù)的能力。像圖像識別這樣的工作,阻礙了英偉達在中國的業(yè)務。
英偉達股價盤后下跌6.6%。該公司表示,該禁令影響了其旨在加速機器學習任務的A100和H100芯片,可能會干擾英偉達今年宣布的旗艦芯片H100的開發(fā)完成。
與此同時,英偉達的競爭對手AMD也向媒體表示,公司也已收到新的許可要求,將阻止其MI250人工智能芯片出口到中國,但它相信其MI100芯片不會受到影響。AMD表示,它不相信新規(guī)則會對其業(yè)務產(chǎn)生重大影響。受此消息影響AMD盤后下跌3.79%。
由于個人電腦需求下降,英偉達已經(jīng)面臨銷售下滑。在收到通知的前一天,該公司給出了令人失望的預測,稱需要削減出貨量以減少過剩的庫存?,F(xiàn)在英偉達又面臨了更大的麻煩。英偉達表示,如果該公司沒有獲得向中國銷售芯片的許可,可能會損失4億美元的銷售額。這約占第三財季收入的6.8%。
英偉達于美國時間8月31日披露了該通知,英偉達公司在一份電子郵件聲明中表示:“我們正在與中國客戶合作,以滿足他們計劃或未來購買替代產(chǎn)品的需求,并且可能會在替代產(chǎn)品不足的情況下尋求許可。新許可要求適用的唯一當前產(chǎn)品是A100、H100以及包含它們的DGX等系統(tǒng)。”
英偉達披露內(nèi)容如下:2022年8月26日,美國政府或USG通知NVIDIA,USG已對本公司未來向中國(包括香港)和俄羅斯的任何出口實施一項新的許可要求,立即生效。A100和即將推出的H100芯片,DGX或包含A100或H100芯片和A100X的任何其他系統(tǒng)也包含在新的許可要求中。許可要求還包括任何未來的NVIDIA芯片,其峰值性能和芯片到芯片的I/O性能等于或大于大致相當于A100的閾值,以及包括了這些芯片的任何系統(tǒng)。出口技術(shù)以支持或開發(fā)涵蓋產(chǎn)品需要許可證。USG表示,新的許可要求將解決涵蓋產(chǎn)品可能用于或轉(zhuǎn)用于中國和俄羅斯的“軍事最終用途”或“軍事最終用戶”的風險。
新的許可要求可能會影響公司及時完成H100開發(fā)或支持A100現(xiàn)有客戶的能力,并可能要求公司將某些業(yè)務轉(zhuǎn)移到中國以外。該公司與美國政府合作,并正在為公司的內(nèi)部開發(fā)和支持活動尋求豁免。
此外,公司正在與中國的客戶接觸,并尋求滿足他們計劃或未來購買公司數(shù)據(jù)中心產(chǎn)品的需求,產(chǎn)品不受新許可要求的約束。如果客戶需要新許可證要求所涵蓋的產(chǎn)品,公司可以為客戶尋求許可證,但不保證 USG 將向任何客戶授予任何豁免或許可證,也不保證 USG 將及時采取行動。
NVIDIA于2022年8月24日發(fā)布的第三財季展望包括約4億美元的潛在中國銷售,如果NVIDIA客戶不想購買公司的替代產(chǎn)品,或者如果USG沒有及時授予許可證或拒絕向NVIDIA重要客戶發(fā)放許可證,NVIDIA 可能因新的出口限制而損失 4 億美元的收入。
A100和H100有多強悍?
相比于英偉達前一代的Volta GPU,A100的性能提升了20倍,非常適合于人工智能、數(shù)據(jù)分析、科學計算和云圖形工作負載。該芯片由540億個晶體管組成,打包了第三代Tensor核心,并具有針對稀疏矩陣運算的加速功能,對于AI推理和訓練來說特別有用。此外,每個GPU可以劃分為多個實例,執(zhí)行不同的推理任務,采用Nvidia NVLink互連技術(shù)可以將多個A100 GPU用于更大的AI推理工作負載。
然而,這些在H100出現(xiàn)之后顯得略有不足了。在今年春季的發(fā)布會中,英偉達CEO黃仁勛發(fā)布了面向高性能計算(HPC)和數(shù)據(jù)中心的下一代Hopper架構(gòu),搭載新一代芯片的首款加速卡被命名為H100,它就是A100的替代者。
H100是一款針對大模型專門優(yōu)化過的芯片,使用臺積電5nm定制版本制程(4N)打造,單塊芯片包含800億晶體管。同時也是全球首款PCI-E5和HBM3顯卡,一塊H100的IO帶寬就是40 terabyte每秒。
Transformer類預訓練模型是當前AI領(lǐng)域最熱門的方向,英偉達以此為目標專門優(yōu)化H100的設計,提出了Transforme rEngine,集合了新的Tensor Core、FP8和FP16精度計算,以及Trans former神經(jīng)網(wǎng)絡動態(tài)處理能力,可以將此類機器學習模型的訓練時間從幾周縮短到幾天。
針對服務器應用,H100也可以虛擬化為7個用戶共同使用,每個用戶獲得的算力相當于兩塊全功率的T4GPU。此外,H100還實現(xiàn)了業(yè)界首個基于GPU的機密計算。
基于Hopper架構(gòu)的H100,英偉達還推出了機器學習工作站、超級計算機等一系列產(chǎn)品。8塊H100和4個NVLink結(jié)合組成一個巨型GPU—DGXH100,一共有6400億晶體管,AI算力32petaflops,HBM3內(nèi)存容量高達640G。
與此同時,得益于與Equinix(管理全球240多個數(shù)據(jù)中心的全球服務提供商)的合作,A100和H100的新型GPU通過水冷方式來節(jié)省用戶的能源成本。使用這種冷卻方法最多可以節(jié)省110億瓦時,可以在AI和HPC推理工作中實現(xiàn)20倍的效率提升。
今年5月份,英偉達曾開源了LinuxGPU內(nèi)核模塊代碼,未來是否還會有更多開源計劃,暫未可知。
從全球GPU整體市場格局來看,Intel得益于在筆記本電腦及傳統(tǒng)PC行業(yè)的優(yōu)勢,一直是集成GPU市場的龍頭,市場份額高達68.30%。但是,在獨立顯卡市場,則主要由英偉達和AMD兩家公司壟斷。
根據(jù)JonPeddie Research的數(shù)據(jù),2021年四季度,在全球獨立GPU市場,英偉達份額高達81%,其余19%則被AMD拿下。雖然近兩年英特爾推出了Xe系列獨立顯卡,但目前銷量仍相對有限,預計其最新的市場份額可能仍在5%以下。同樣,在面向數(shù)據(jù)中心的高端獨立GPU市場,也幾乎是由英偉達和AMD兩家壟斷。
北京半導體行業(yè)協(xié)會副秘書長朱晶對經(jīng)濟觀察網(wǎng)表示,根據(jù)消息,被封鎖的產(chǎn)品是有足夠雙精度計算能力的高端GPU,對于低端GPU不受影響。具備較高雙精度計算能力的高端GPU主要用于高性能計算領(lǐng)域,包括科學計算,CAE(計算機輔助工程),醫(yī)療等方面。就NVIDIA來說,是以A100算力為基準,比它先進的所有顯卡產(chǎn)品都會受限。
超算中心由數(shù)千甚至更多處理器組成,具備超高算力,主要滿足國家高科技領(lǐng)域和尖端技術(shù)研究的需求;普通的數(shù)據(jù)中心面向所有需要信息技術(shù)支撐的場景,包括互聯(lián)網(wǎng)應用。中國的電信運營商、互聯(lián)網(wǎng)公司都自建數(shù)據(jù)中心。朱晶表示,企業(yè)級數(shù)據(jù)中心經(jīng)常采購NVIDIA的A100、H100產(chǎn)品,這些產(chǎn)品都是有足夠雙精度計算能力的高端GPU,上述斷供行為如果落實,造成的波及范圍會比較大。