Meta推出開源AI模型Llama 4

作者：時間：2025-04-08 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

由于DeepSeek等競品引發(fā)壓力，Meta推出新一代AI 模型集合Llama 4。目前，Llama 4擁有Scout和Maverick兩個版本，均以開源形式發(fā)布。Meta在聲明中表示，Llama 4是一個多模態(tài)AI系統(tǒng)，能夠處理和整合文本、視頻、圖像、音頻等多種數(shù)據(jù)類型，并能在不同格式之間實現(xiàn)內(nèi)容轉(zhuǎn)換。

本文引用地址：http://www.2s4d.com/article/202504/469153.htm

Llama 4系列是Meta首款采用混合專家架構(gòu)（MoE）的模型，這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率，通過將模型劃分為多個專注于特定任務(wù)的“專家”子模型，實現(xiàn)精準(zhǔn)而高效的處理。中國AI實驗室DeepSeek開源模型的成功（其性能與Meta之前的旗艦Llama模型相當(dāng)甚至更優(yōu)）促使Llama開發(fā)進(jìn)入加速模式，據(jù)說Meta組建了緊急工作組，以破解DeepSeek如何降低R1和V3等模型的運(yùn)行和部署成本。

Scout版本配備170億活躍參數(shù)、16個“專家”模型及1090億總參數(shù)；而Maverick版本同樣擁有170億活躍參數(shù)，但“專家”模型數(shù)量增加至128個，總參數(shù)量飆升至4000億。此外，Meta還預(yù)告了Llama 4 Behemoth，稱其為“全球最聰明的語言模型之一，將作為未來模型訓(xùn)練的教師模型”。

Scout和Maverick已在Llama.com和Meta合作伙伴（包括AI開發(fā)平臺Hugging Face）上公開提供，而Behemoth仍在訓(xùn)練中。Meta表示，其AI助手Meta AI已在40個國家的WhatsApp、Messenger和Instagram等應(yīng)用中更新為使用Llama 4。多模態(tài)功能目前僅限美國地區(qū)使用英語。

Meta尚未發(fā)布的Behemoth將需要更強(qiáng)大的硬件，擁有2880億活躍參數(shù)、16位專家和近2萬億總參數(shù)。Meta的內(nèi)部基準(zhǔn)測試顯示，Behemoth在衡量數(shù)學(xué)問題解決等STEM技能的多項評估中優(yōu)于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro（但不及2.5 Pro）。

Llama 4模型系列中沒有一個是類似OpenAI的o1和o3-mini那樣的真正"推理"模型，推理模型會對其回答進(jìn)行事實檢查，通常對問題的回應(yīng)更可靠，但因此比傳統(tǒng)的"非推理"模型需要更長時間來提供答案。另外，Meta表示它調(diào)整了所有Llama 4模型，使其拒絕回答"有爭議"問題的頻率降低，表示Llama 4在處理它完全不會回應(yīng)的提示方面"平衡性大大提高"。

但是值得注意的是，Llama 4在內(nèi)部基準(zhǔn)測試中“表現(xiàn)不佳”，尤其是在數(shù)學(xué)處理能力和推理能力方面。雖然目前Llama 4仍需更多時間優(yōu)化，據(jù)稱扎克伯格此前給全員下了死命令，4月底是Llama 4交付最后期限。

新聞中心

Meta推出開源AI模型Llama 4

評論

相關(guān)推薦

技術(shù)專區(qū)