新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > AI 顛覆者 DeepSeek 的下一代模型因 Nvidia GPU 對(duì)中國出口限制而延遲——AI GPU 短缺阻礙開發(fā)

AI 顛覆者 DeepSeek 的下一代模型因 Nvidia GPU 對(duì)中國出口限制而延遲——AI GPU 短缺阻礙開發(fā)

作者: 時(shí)間:2025-06-27 來源:Tom‘s Hardware 收藏

Nvidia Hopper HGX H200(圖片來源:

本文引用地址:http://www.2s4d.com/article/202506/471787.htm

憑借其今年的 R1 模型吸引了大量關(guān)注,但似乎下一代 R2 模型的開發(fā)因中國 Nvidia H20 處理器的短缺而停滯,據(jù) 信息報(bào)道 。 本身尚未評(píng)論其 R2 模型的發(fā)布時(shí)間。

使用由其投資者 High-Flyer Capital Management 獲得的包含 50,000 個(gè) Hopper 的集群——其中包括 30,000 個(gè) H20、10,000 個(gè) H800 和 10,000 個(gè) H100——來訓(xùn)練其 R1 模型。尚不清楚 R2 是否已經(jīng)完全預(yù)訓(xùn)練。 信息 報(bào)道稱,DeepSeek 團(tuán)隊(duì)一直在 intensively 工作,但 CEO 梁文鋒尚未對(duì)其能力感到滿意。在模型獲得部署批準(zhǔn)之前,團(tuán)隊(duì)將繼續(xù)內(nèi)部工作以提升性能。

R1 已迅速且廣泛地被各類用戶采用,包括私營初創(chuàng)公司、大型企業(yè)和政府相關(guān)機(jī)構(gòu)。這些用戶大多在的 H20 處理器上運(yùn)行該模型?,F(xiàn)在 H20 的出貨受到限制,這已經(jīng)引發(fā)了問題,限制了 R1 當(dāng)前的使用,并使 R2 的推出準(zhǔn)備變得更加困難,據(jù) The Information 報(bào)道。

如果 DeepSeek 即將推出的 R2 模型的性能超過了目前可用的開源替代方案,預(yù)計(jì)其使用量將激增,超出中國云平臺(tái)的處理能力,據(jù)那些公司員工在被 The Information引用時(shí)表示。據(jù)說依賴早期 R1 模型的多數(shù)組織使用的是的 H20 處理器,而目前 H20 處于短缺狀態(tài)。

美國政府在 4 月中旬限制了英偉達(dá) H20 處理器用于 訓(xùn)練和推理的銷售。雖然該單元是流行 H100 的一個(gè)大幅簡化版本,但由于中國 公司對(duì)英偉達(dá)的 CUDA 軟件堆棧的依賴,H20 在中華人民共和國境內(nèi)非常受歡迎,英偉達(dá)每個(gè)季度都銷售了數(shù)十億美元價(jià)值的 H20 處理器。

據(jù)稱,DeepSeek 的人工智能軟件針對(duì)英偉達(dá)的硬件進(jìn)行了優(yōu)化,這使得該公司特別容易受到美國政策決策的影響。盡管該公司聲稱其模型的開發(fā)所使用的資源遠(yuǎn)少于 OpenAI 等美國公司,但最近的出口限制凸顯了一個(gè)關(guān)鍵弱點(diǎn):中國頂尖的人工智能公司仍然嚴(yán)重依賴美國硬件。與此同時(shí),OpenAI 私下指責(zé) DeepSeek 在 R1 的開發(fā)過程中使用了其專有模型,盡管該公司尚未公開回應(yīng)這些指控。




評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉