星云智聯(lián)發(fā)布S1400系列AI智算高速互聯(lián)網(wǎng)卡,適配 DeepSeek
近日,星云智聯(lián)正式發(fā)布國內(nèi)領(lǐng)先的S1400系列AI智算高速互聯(lián)網(wǎng)卡。該系列產(chǎn)品專為滿足人工智能大模型訓(xùn)練與推理等智算場景的極致需求而設(shè)計,憑借其全自研核心技術(shù)與卓越性能,為飛速發(fā)展的人工智能產(chǎn)業(yè)提供極致高效、穩(wěn)定可靠的全場景互聯(lián)解決方案與堅實的網(wǎng)絡(luò)底座。 目前,產(chǎn)品已成功適配DeepSeek的DeepEP開源通信庫,顯著提升AI計算集群的通信效率,為AI應(yīng)用創(chuàng)新注入強勁動力。
S1400系列AI智算高速互聯(lián)網(wǎng)卡具備1x400G或2x200G的網(wǎng)絡(luò)接口模式,采用PCIe Gen 5.0 x16接口,提供高達雙向100Mpps的RDMA消息速率。其關(guān)鍵特性包括:全面支持RoCEv2協(xié)議標準,并兼容NCCL、DeepEP,BCCL等主流集合通信庫,確保與現(xiàn)有AI生態(tài)的無縫對接。另外,S1400支持先進的GPUDirect技術(shù)(GDR、GDA)、用戶態(tài)MR(UMR)操作,為大規(guī)模AI計算集群提供了極致的低延遲和高帶寬。尤為突出的是,S1400系列AI智算高速互聯(lián)網(wǎng)卡自研NBL-SRP協(xié)議支持對所有RoCE v2操作(包括Write/Atomic/Send/Read等)的DDP方式的亂序接收和選擇性重傳,并針對GPU側(cè)Atomic操作和低延遲Local read進行了特別優(yōu)化,這些特性進一步彌補了國內(nèi)生態(tài)在此方面的不足。S1400系列AI智算高速互聯(lián)網(wǎng)卡大幅優(yōu)化了數(shù)據(jù)處理流程,顯著提升了AI智算場景下的互聯(lián)效率。
在擁塞控制方面,S1400系列搭載了星云智聯(lián)自研的NBL-CC算法。該算法基于RTT探測與丟包統(tǒng)計進行主動的端到端擁塞控制,不依賴交換機特定配置,具有參數(shù)少、部署便捷、性能優(yōu)異的特點,能實現(xiàn)快速啟動、快速收斂,并保持交換機低隊列深度與高吞吐量。實際測試數(shù)據(jù)顯示,NBL-CC相較于傳統(tǒng)的DCQCN算法,在平均性能上提升50%,99分位性能提升48%,尤其在短流場景下提升幅度高達60%-100%,有效保障了網(wǎng)絡(luò)的低隊列擁塞和持續(xù)高吞吐。配合自研的NBL-SRP協(xié)議(逐包多路徑、DDP亂序接收、選擇性重傳、快速重傳),S1400系列AI智算高速互聯(lián)網(wǎng)卡在AI主流場景及有損網(wǎng)絡(luò)下都能夠充分發(fā)揮接口帶寬潛力,其NCCL通信性能在多個關(guān)鍵指標上展現(xiàn)出持平并且部分超越業(yè)界標桿產(chǎn)品,并在特定業(yè)務(wù)場景時延測試中表現(xiàn)出與國際頂尖產(chǎn)品相媲美的168us優(yōu)異數(shù)據(jù)(GDR write 7M + atomic),展現(xiàn)了強大的市場競爭力。
在全球科技競爭日趨激烈的背景下,S1400系列的發(fā)布不僅是一次產(chǎn)品層面的突破,更體現(xiàn)了中國企業(yè)在核心技術(shù)領(lǐng)域的自主創(chuàng)新能力。S1400系列AI智算高速互聯(lián)網(wǎng)卡的推出,將為打造面向未來的高性能AI算力集群提供至關(guān)重要的網(wǎng)絡(luò)互聯(lián)支撐。星云智聯(lián)通過自研芯片和算法,成功打造出性能媲美國際水平的高端網(wǎng)絡(luò)產(chǎn)品,為國產(chǎn)化技術(shù)在AI領(lǐng)域的廣泛應(yīng)用奠定了基礎(chǔ)。這一成果不僅增強了國內(nèi)企業(yè)在全球市場的競爭力,也為AI產(chǎn)業(yè)的可持續(xù)發(fā)展提供了堅實的技術(shù)支撐。
星云智聯(lián)將堅定不移地加大研發(fā)投入,致力于以突破性技術(shù)創(chuàng)新驅(qū)動新質(zhì)生產(chǎn)力實現(xiàn)跨越式發(fā)展,強力助推客戶把握人工智能時代的戰(zhàn)略機遇,決勝未來。
訂購信息
S1400系列AI智算高速互聯(lián)網(wǎng)卡現(xiàn)已開放訂購。
評論