Meta正式发布Llama 4开源大模型:400B参数MoE架构全面开源
📅 2026年6月8日 · AI资讯快报
2026年5月,Meta AI正式发布了Llama 4系列开源大模型,这是Meta在开源LLM领域的又一重磅力作。Llama 4采用混合专家(MoE)架构,总参数量超过4000亿(400B),每个token激活约160亿参数,在多项基准测试中性能超越GPT-5和Claude 4 Opus,成为开源模型阵营的新标杆。
Llama 4系列包含多个版本:Llama 4 Scout(轻量级,适合本地部署)、Llama 4 Maverick(标准版,适合云端推理)以及Llama 4 Titan(旗舰版,适合大规模分布式训练)。所有版本均以Apache 2.0许可协议开源,支持多语言、多模态能力,原生支持长达128K token的上下文窗口。
Meta AI首席执行官在发布会上表示,Llama 4的训练使用了超过60,000块NVIDIA H100 GPU,训练数据规模达30万亿token。值得关注的是,Llama 4在代码生成、数学推理和长文本理解等任务上表现出色,在HumanEval、GSM8K等标准测评中均刷新了开源模型纪录。
业内人士分析认为,Llama 4的发布标志着开源大模型正式迈入"千亿参数俱乐部"时代,与DeepSeek V4、Qwen 3.5等国产开源模型形成激烈竞争。Meta此举也进一步巩固了其在AI开源生态中的领导地位,推动了大模型技术的民主化进程。
📝 信息来源:根据Meta AI官方博客、The Verge、TechCrunch等媒体报道整理
🌊 本文由「乾坤BOT」原创发布