OpenAI破天荒決策!CEO親證今夏將開放模型權重
4月1日消息,OpenAI首席執(zhí)行官薩姆·奧特曼(Sam Altman)本周一透露,OpenAI將在今夏發(fā)布一款“開放權重”的人工智能模型。
本文引用地址:http://www.2s4d.com/article/202504/468864.htm奧特曼在社交媒體平臺X上寫道,“我們未來幾個月內(nèi)將推出一款具有推理能力的全新開放權重語言模型,對此倍感振奮?!?/p>
此舉既是對中國DeepSeek R1模型迅猛成功的回應,也因應Meta的Llama系列模型日益流行的壓力。
今年1月份DeepSeek發(fā)布R1模型后不久,奧特曼曾公開反思,OpenAI在開放模型的問題上“站在歷史錯誤的一邊”,暗示戰(zhàn)略調(diào)整勢在必行。本周一,他表示公司醞釀開放權重模型已有時日,“現(xiàn)在已到了必須行動的時刻”。
鑒于DeepSeek宣稱其模型訓練成本僅為主流大模型的零頭,OpenAI或許需要證明其新模型的低成本訓練能力。
HuggingFace主營業(yè)務是托管開放模型。公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官克萊門特·德朗格(Clement Delangue)稱,“這無疑是振奮人心的消息。隨著DeepSeek的出現(xiàn),整個行業(yè)正在認識到開放權重的力量”
當前,OpenAI主要通過聊天機器人和云端服務提供其人工智能技術。而R1、Llama等開源權重模型不僅可以免費下載,還允許進行修改。所謂模型權重,指的是大型神經(jīng)網(wǎng)絡內(nèi)部的參數(shù)值——這些參數(shù)在模型訓練過程中確定。相較于閉源模型,開源權重模型使用成本更低,且能夠針對敏感場景進行定制,例如處理需要高度保密的信息。
OpenAI技術團隊成員史蒂文·海德爾(Steven Heidel)在轉(zhuǎn)發(fā)奧特曼的公告時補充說,“我們今年將發(fā)布一款可在自有硬件上運行的新模型?!?/p>
OpenAI負責人工智能安全研究的研究員約翰內(nèi)斯·海德克(Johannes Heidecke)也通過社交媒體平臺X強調(diào),公司將實施嚴格測試,確保開放權重模型不被濫用。一些人工智能研究人員擔心,開放權重模型可能助長網(wǎng)絡攻擊乃至生化武器研發(fā)的可能。對此海德克明確表示,“雖然開放模式帶來了獨特挑戰(zhàn),但會遵循我們的預備框架,確保開放權重模型不易被濫用?!?/p>
周一OpenAI還在官網(wǎng)發(fā)布信息,邀請開發(fā)者申請內(nèi)測即將發(fā)布的新模型。奧特曼透露,未來幾周公司將舉辦多場活動,向開發(fā)者展示新模型原型。
作為人工智能領域首個推行開放策略的頭部企業(yè),Meta于2023年7月發(fā)布Llama初代模型,此后開放權重模型(參數(shù)可公開)數(shù)量激增。然而研究人員指出,Llama等模型的透明度仍存爭議:其訓練數(shù)據(jù)與核心技術細節(jié)始終未公開。此外,Meta的許可協(xié)議明確限制第三方通過Llama衍生工具獲利,形成“技術開源、商業(yè)設限”的獨特模式。
評論