新聞中心

EEPW首頁(yè) > 網(wǎng)絡(luò)與存儲(chǔ) > 業(yè)界動(dòng)態(tài) > 鎧俠開(kāi)源軟件推動(dòng) AI RAG 的發(fā)展

鎧俠開(kāi)源軟件推動(dòng) AI RAG 的發(fā)展

作者: 時(shí)間:2025-07-04 來(lái)源: 收藏

通過(guò)優(yōu)化固態(tài)驅(qū)動(dòng)器 (SSD) 的使用,不斷努力提高檢索增強(qiáng)一代 (RAG) 系統(tǒng)中 AI 矢量數(shù)據(jù)庫(kù)搜索的可用性,株式會(huì)社宣布更新其 ?(帶產(chǎn)品量化的全存儲(chǔ) ANNS)軟件。

這個(gè)新的開(kāi)源版本引入了靈活的控制,允許系統(tǒng)架構(gòu)師定義搜索性能和向量數(shù)量之間的平衡點(diǎn),向量數(shù)量是系統(tǒng)中 SSD 存儲(chǔ)固定容量的對(duì)立因素。由此產(chǎn)生的好處使 RAG 系統(tǒng)的架構(gòu)師能夠微調(diào)特定工作負(fù)載及其要求的最佳平衡,而無(wú)需進(jìn)行任何硬件修改。

軟件于2025年1月首次推出,它采用了一種新穎的近似最近鄰搜索(ANNS)算法,該算法針對(duì)SSD進(jìn)行了優(yōu)化,無(wú)需將索引數(shù)據(jù)存儲(chǔ)在DRAM中。通過(guò)直接在 SSD 上實(shí)現(xiàn)矢量搜索并降低主機(jī)內(nèi)存要求,鎧俠 RAG 技術(shù)使矢量數(shù)據(jù)庫(kù)能夠擴(kuò)展,在很大程度上不受 DRAM 容量限制的限制。

當(dāng)系統(tǒng)中 SSD 的安裝容量固定時(shí),提高搜索性能 (每秒查詢(xún)數(shù)) 需要每個(gè)向量消耗更多的 SSD 容量。這會(huì)導(dǎo)致向量數(shù)量減少。相反,為了最大化向量的數(shù)量,需要減少每個(gè)向量的 SSD 容量消耗,這會(huì)導(dǎo)致性能降低。這兩種相反條件之間的最佳平衡因特定工作負(fù)載而異。為了找到合適的天平,鎧俠 AiSAQ 軟件引入了靈活的配置選項(xiàng)。最新更新使管理員能夠?yàn)?RAG 系統(tǒng)內(nèi)的各種工作負(fù)載選擇最佳平衡。此外,此次更新使鎧俠 AiSAQ 技術(shù)成為基于 SSD 的 ANNS,不僅適用于 RAG 應(yīng)用,還適用于其他需要向量的應(yīng)用,例如離線(xiàn)語(yǔ)義搜索。

隨著對(duì)可擴(kuò)展 AI 服務(wù)的需求不斷增長(zhǎng),SSD 為 DRAM 提供了一種實(shí)用的替代方案,用于管理 RAG 系統(tǒng)所需的高吞吐量和低延遲。鎧俠 AiSAQ 軟件能夠有效滿(mǎn)足這些需求,允許大規(guī)模生成式 AI,而不受有限內(nèi)存資源的限制。



關(guān)鍵詞: 鎧俠 開(kāi)源軟件 AI RAG AiSAQ

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉