AI晶片大禮包不能單買? 輝達傳與大客戶微軟起衝突
據《The Information》報導,輝達在資料中心領域積極搶攻,不僅與全球伺服器大廠美超微(Super Micro)合作推出能支援最新架構Blackwell的伺服器、散熱解決方案,同時在多次演講強調,如今不會單獨考慮個別的GPU,而是把整個NVL72伺服器機櫃視為整體,一定程度也爭取到更多客戶採用輝達的規格,不僅增加營收,也讓自身的生態系擴大。
報導說明,過去客戶只要採購適合的伺服器機櫃就能打造資料中心,如今,輝達敦促這些客戶直接向他們購買各式機櫃,甚至整個AI資料中心基礎架構「DGX SuperPOD」都由輝達來提供,輝達聲稱,這能將GPU效能最佳化,考慮到連結到各個GPU、伺服器以及機櫃,甚至是DGX SuperPOD的介面,雖然一定程度也有其道理,但是也大大增加這些客戶的採購預算。
輝達執行長黃仁勳在本月5日接受全球媒體問答之際就提出,NVLink如今已經發展到第5代,並拿起展示品,說明NVLink如何以令人難以置信的速度連接,以眾多軟體與處理功能,連接起數量眾多的GPU,使其成為一個強大的運算單位。
輝達除了強大度CUDA運算軟體平台之外,根據輝達說明,NVLink是一種匯流排及其通訊協議,1.8TB/s的雙向、直接的GPU到GPU互連,可在伺服器內擴充套件多GPU輸入和輸出(IO)。輝達也在過去幾年,陸續推出一系列專屬高速I/O技術,包括GPUDirect、NVLink、NVSwitch等技術。
以GB200 NVL72 來說,連接 36 個 Grace CPU 和 72 個 Blackwell GPU,GB200 NVL72 還搭載液冷的機架級解決方案,擁有 72 個使用 NVLink 互聯的 GPU,能夠作為單一大型的 GPU 使用。這也使得客戶若只採購GPU,沒有採購整套系統,就會如輝達所述無法將效能最佳化。
不過,這也讓輝達副總裁Andrew Bell在說服大客戶微軟能採購專為B200 GPU設計的伺服器機櫃,因為微軟的機櫃規格與輝達所提供的產品有些硬體差異,但是微軟拒絕這項提議,因為這會讓微軟無法輕鬆交互使用的其他家的產品,例如AMD的AI伺服器處理器MI300X GPU。輝達所提供的MGX模組化系統,同時支援OCP開放式伺服器機櫃、美國電子工業聯盟(EIA)制定的標準19吋機櫃,微軟則是採用更先進的、密度更高的OCP機櫃,而且微軟現有的資料中心仍然運作良好,若是按照輝達提議,勢必得大幅提高建置成本。
最終,輝達妥協,允許微軟使用自家客製化的伺服器機櫃來安裝B200 GPU,但這可能不會是這兩家巨頭的最後一次爭執。早在先前,AMD、Google、微軟、英特爾、博通、思科等美國大型科技公司,推出Ultra Accelerator Link(UALink)聯盟,制定資料中心AI加速器晶片連接的行業標準,與輝達的NVLink對抗,然而,輝達在AI晶片市佔率高達9成,能否扭轉局勢還得觀察。
對此,黃仁勳也回應,在多年以後,市場才認識到NVLink功能對於資料中心運作相當重要,NVL72面對即時大型語言模型推論速度提高30倍,訓練提高4倍,並採用液冷散熱設計,讓成本與能耗降低25倍。至於UALink,黃仁勳認為,還需要很多年時間才能具備完全的能力,到時候NVLink都到7或8了。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:AI晶片大禮包不能單買? 輝達傳與大客戶微軟起衝突
地址:https://www.twnewsletter.com/article/42478.html