OpenAI放大招!GPT-4.1上線,編程戰(zhàn)力全開
4月15日消息,美國(guó)人工智能公司OpenAI本周一宣布推出一系列全新的人工智能模型,這些模型專為編程任務(wù)優(yōu)化,旨在應(yīng)對(duì)來(lái)自谷歌、Anthropic等公司日益激烈的競(jìng)爭(zhēng)。開發(fā)者現(xiàn)已可通過(guò)OpenAI的應(yīng)用程序編程接口(API)使用這些模型。
本文引用地址:http://www.2s4d.com/article/202504/469391.htmOpenAI此次發(fā)布三個(gè)版本模型:GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano。公司首席產(chǎn)品官凱文·韋爾(Kevin Weil)在直播活動(dòng)中表示,新模型在多方面超越當(dāng)前主流產(chǎn)品GPT-4o,在某些性能指標(biāo)上甚至優(yōu)于最強(qiáng)大的旗艦?zāi)P虶PT-4.5。
在權(quán)威的SWE-Bench編程基準(zhǔn)測(cè)試中,GPT-4.1獲得55%的得分,較其他OpenAI模型高出幾個(gè)百分點(diǎn)。韋爾稱:"這些新模型不僅擅長(zhǎng)編程,更能精準(zhǔn)執(zhí)行復(fù)雜指令,是開發(fā)'智能體'的絕佳選擇。"
近幾個(gè)月來(lái),人工智能模型的代碼生成能力顯著提升,推動(dòng)軟件原型開發(fā)自動(dòng)化與"智能體"能力升級(jí)。競(jìng)爭(zhēng)對(duì)手Anthropic和谷歌均已推出擅長(zhǎng)代碼生成的模型。此前業(yè)內(nèi)盛傳OpenAI將發(fā)布GPT-4.1,知情人士透露該公司曾以"Alpha Quasar"為代號(hào)在多個(gè)評(píng)測(cè)平臺(tái)進(jìn)行匿名測(cè)試。有Reddit用戶反饋該"匿名"模型"修復(fù)了其他大語(yǔ)言模型生成的所有不完整代碼"。
新模型能同時(shí)分析的代碼量是前代產(chǎn)品的八倍,代碼優(yōu)化與漏洞修復(fù)能力顯著提升。其遵循指令能力也大幅改進(jìn),用戶無(wú)需反復(fù)調(diào)整指令即可獲得預(yù)期結(jié)果。演示中,GPT-4.1僅憑自然語(yǔ)言提示便快速構(gòu)建出語(yǔ)言學(xué)習(xí)閃卡應(yīng)用等程序。
“開發(fā)者非??粗鼐幊棠芰Γ覀冎攸c(diǎn)提升了模型生成可執(zhí)行代碼的水平,”O(jiān)penAI后續(xù)訓(xùn)練團(tuán)隊(duì)負(fù)責(zé)人米歇爾·波克拉絲(Michelle Pokrass)透露。“我們持續(xù)改進(jìn)模型遵循多種編程格式的能力,使其能更深入地探索代碼庫(kù)、可靠運(yùn)行單元測(cè)試,并編寫可直接編譯的代碼。”
OpenAI表示,GPT-4.1較開發(fā)者最常用的GPT-4o提速40%,查詢輸入成本降低80%。
人工智能編程工具Windsurf的首席執(zhí)行官瓦倫·莫漢(Varun Mohan)在直播中表示,他們?cè)趯?duì)GPT-4.1進(jìn)行內(nèi)部基準(zhǔn)測(cè)試時(shí)發(fā)現(xiàn),新模型性能較GPT-4o提高60%。他透露,新模型錯(cuò)誤行為明顯減少,新模型錯(cuò)誤讀取和編輯無(wú)關(guān)文件所耗費(fèi)的時(shí)間顯著減少。
過(guò)去幾年中,OpenAI憑借2022年底推出的卓越聊天機(jī)器人ChatGPT引發(fā)的狂熱關(guān)注,將公眾興趣轉(zhuǎn)化為不斷擴(kuò)大的業(yè)務(wù),逐步構(gòu)建起包含多款先進(jìn)模型的商業(yè)版圖。上周,公司首席執(zhí)行官薩姆·奧特曼(Sam Altman)在TED訪談中透露,OpenAI每周活躍用戶已超過(guò)5億且持續(xù)快速增長(zhǎng)。
如今,OpenAI上線了種類繁多、功能各異、定價(jià)各不相同的模型。今年2月份公司發(fā)布最強(qiáng)大的旗艦?zāi)P虶PT-4.5,不過(guò)目前仍處于“研究預(yù)覽”階段。
此外,OpenAI還上線了具備模擬推理能力的o1和o3模型。這些模型能夠?qū)?wèn)題分解為多個(gè)部分解決,響應(yīng)用戶的耗時(shí)較長(zhǎng),且使用成本較高。
ChatGPT的成功使得競(jìng)爭(zhēng)對(duì)手近年來(lái)紛紛加大研發(fā)投入,力圖趕超OpenAI。據(jù)斯坦福大學(xué)本月發(fā)布的一份報(bào)告,谷歌、DeepSeek等公司開發(fā)的模型性能已經(jīng)比肩OpenAI。報(bào)告還指出,Anthropic、Meta以及法國(guó)創(chuàng)企Mistral等公司亦緊隨其后。
華盛頓大學(xué)名譽(yù)教授奧倫·埃齊奧尼(Oren Etzioni)表示,未來(lái)不太可能由單一模型或一家公司壟斷市場(chǎng)?!半S著成本下降、開源普及以及生物、芯片設(shè)計(jì)等專業(yè)領(lǐng)域的專用模型崛起,未來(lái)將呈現(xiàn)多元發(fā)展格局?!痹伟瑐惾斯ぶ悄苎芯克ˋI2)負(fù)責(zé)人的埃齊奧尼呼吁行業(yè)著眼大模型訓(xùn)練成本與環(huán)境影響。
面對(duì)盈利壓力,OpenAI正加速商業(yè)化步伐。今年2月份公司首席運(yùn)營(yíng)官布拉德·萊特卡普(Brad Lightcap)接受采訪時(shí)表示,每周活躍用戶雖已經(jīng)超過(guò)4億,較2024年12月份增長(zhǎng)30%,但由于持續(xù)重金投資研發(fā)和基礎(chǔ)設(shè)施建設(shè),OpenAI仍虧損數(shù)十億美元。今年1月份,OpenAI宣布將與軟銀、Oracle和MGX合作推進(jìn)“星際之門”計(jì)劃,承諾斥資5000億美元建設(shè)人工智能數(shù)據(jù)中心。
近期OpenAI持續(xù)推出新功能。上周,奧特曼宣布ChatGPT將升級(jí)“記憶”功能,使聊天機(jī)器人能更好地記住并調(diào)用此前的對(duì)話內(nèi)容;3月底,奧特曼宣布計(jì)劃今年夏季將推出一款開源權(quán)重模型,允許開發(fā)者免費(fèi)下載并修改,公司將在未來(lái)幾周內(nèi)開始測(cè)試。由于開放權(quán)重模型能夠根據(jù)不同用途進(jìn)行定制且使用成本更低,它們已受到研究人員、開發(fā)者和初創(chuàng)企業(yè)的廣泛歡迎。
評(píng)論