金融時報:DeepSeek 因華為芯片問題推遲新人工智能模型
英國《金融時報》周四援引三位知情人士的話報道稱,由于使用華為芯片的訓(xùn)練工作失敗,DeepSeek推遲了其新人工智能模型的發(fā)布。
據(jù)英國《金融時報》報道,這家中國人工智能初創(chuàng)公司在使用華為的昇騰芯片訓(xùn)練其 R2 模型時遇到了持續(xù)存在的技術(shù)問題,促使其使用 Nvidia 芯片進行訓(xùn)練,使用 Ascend 進行推理。
報告稱,這些問題是 Deepseek 備受期待的 R2 車型發(fā)布從 5 月推遲的主要原因。
英國《金融時報》的報道強調(diào)了中國人工智能開發(fā)商在減少對美國技術(shù)(特別是英偉達人工智能芯片)的依賴方面面臨的困難。DeepSeek及其同行早些時候受到北京的鼓勵,使用華為的昇騰芯片,尤其是在美國對華芯片出口成為今年的主要爭論點的情況下。
雖然美國確實允許英偉達在 7 月份恢復(fù)在中國銷售其 H20 芯片,但北京對在關(guān)鍵的中國人工智能開發(fā)中使用美國制造的芯片表示了安全擔(dān)憂。
推理——涉及使用經(jīng)過訓(xùn)練的人工智能模型來生成響應(yīng)——通常比訓(xùn)練需要更少的計算能力,訓(xùn)練涉及使用大量預(yù)先存在的數(shù)據(jù)來提高人工智能模型的能力。
英偉達的 H20 仍然是迄今為止中國最受歡迎的人工智能芯片,盡管華為和北京都在推動采用后者的 Ascend 系列。美國已將昇騰系列列入黑名單,理由是華為使用受限的美國技術(shù)來開發(fā)該芯片。
DeepSeek 的 R1 模型今年早些時候震撼了人工智能領(lǐng)域,主要使用 H20 芯片開發(fā)。這些芯片還被其他主要的中國人工智能開發(fā)商使用,包括字節(jié)跳動、騰訊控股有限公司(HK:0700)和 阿里巴巴集團(紐約證券交易所代碼:BABA)。
本周早些時候,中國要求當(dāng)?shù)亻_發(fā)商證明他們訂購英偉達芯片的合理性。
中國媒體報道稱,R2 型號將在未來幾周內(nèi)發(fā)布,因為 DeepSeek 落后于競爭對手的一系列高調(diào)發(fā)布。
評論