Meta推出開源AI模型Llama 4
由于DeepSeek等競(jìng)品引發(fā)壓力,Meta推出新一代AI模型集合Llama 4。目前,Llama 4擁有Scout和Maverick兩個(gè)版本,均以開源形式發(fā)布。Meta在聲明中表示,Llama 4是一個(gè)多模態(tài)AI系統(tǒng),能夠處理和整合文本、視頻、圖像、音頻等多種數(shù)據(jù)類型,并能在不同格式之間實(shí)現(xiàn)內(nèi)容轉(zhuǎn)換。
本文引用地址:http://www.2s4d.com/article/202504/469153.htmLlama 4系列是Meta首款采用混合專家架構(gòu)(MoE)的模型,這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過(guò)程中展現(xiàn)出更高效率,通過(guò)將模型劃分為多個(gè)專注于特定任務(wù)的“專家”子模型,實(shí)現(xiàn)精準(zhǔn)而高效的處理。中國(guó)AI實(shí)驗(yàn)室DeepSeek開源模型的成功(其性能與Meta之前的旗艦Llama模型相當(dāng)甚至更優(yōu))促使Llama開發(fā)進(jìn)入加速模式,據(jù)說(shuō)Meta組建了緊急工作組,以破解DeepSeek如何降低R1和V3等模型的運(yùn)行和部署成本。
Scout版本配備170億活躍參數(shù)、16個(gè)“專家”模型及1090億總參數(shù);而Maverick版本同樣擁有170億活躍參數(shù),但“專家”模型數(shù)量增加至128個(gè),總參數(shù)量飆升至4000億。此外,Meta還預(yù)告了Llama 4 Behemoth,稱其為“全球最聰明的語(yǔ)言模型之一,將作為未來(lái)模型訓(xùn)練的教師模型”。
Scout和Maverick已在Llama.com和Meta合作伙伴(包括AI開發(fā)平臺(tái)Hugging Face)上公開提供,而Behemoth仍在訓(xùn)練中。Meta表示,其AI助手Meta AI已在40個(gè)國(guó)家的WhatsApp、Messenger和Instagram等應(yīng)用中更新為使用Llama 4。多模態(tài)功能目前僅限美國(guó)地區(qū)使用英語(yǔ)。
Meta尚未發(fā)布的Behemoth將需要更強(qiáng)大的硬件,擁有2880億活躍參數(shù)、16位專家和近2萬(wàn)億總參數(shù)。Meta的內(nèi)部基準(zhǔn)測(cè)試顯示,Behemoth在衡量數(shù)學(xué)問(wèn)題解決等STEM技能的多項(xiàng)評(píng)估中優(yōu)于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro(但不及2.5 Pro)。
Llama 4模型系列中沒(méi)有一個(gè)是類似OpenAI的o1和o3-mini那樣的真正"推理"模型,推理模型會(huì)對(duì)其回答進(jìn)行事實(shí)檢查,通常對(duì)問(wèn)題的回應(yīng)更可靠,但因此比傳統(tǒng)的"非推理"模型需要更長(zhǎng)時(shí)間來(lái)提供答案。另外,Meta表示它調(diào)整了所有Llama 4模型,使其拒絕回答"有爭(zhēng)議"問(wèn)題的頻率降低,表示Llama 4在處理它完全不會(huì)回應(yīng)的提示方面"平衡性大大提高"。
但是值得注意的是,Llama 4在內(nèi)部基準(zhǔn)測(cè)試中“表現(xiàn)不佳”,尤其是在數(shù)學(xué)處理能力和推理能力方面。雖然目前Llama 4仍需更多時(shí)間優(yōu)化,據(jù)稱扎克伯格此前給全員下了死命令,4月底是Llama 4交付最后期限。
評(píng)論