🏠 首页 > AI资讯快报

DeepSeek R2 正式发布:推理能力再跃升,开源权重同步上线

📅 2025年6月7日 · 栏目:AI资讯快报

国产大模型 DeepSeek 今日正式发布了其下一代推理模型 DeepSeek R2,在数学推理、代码生成和长文本理解等核心能力上实现了显著突破。

据官方公布的评测数据,DeepSeek R2 在多项基准测试中表现优异。在 MATH-500 数学推理测试中准确率达到 96.3%,在 HumanEval 代码生成测试中通过率达到 92.1%,接近甚至超越了同级别的国际前沿模型。

DeepSeek R2 延续了该系列的开源传统,模型的完整权重已在 HuggingFace 和 ModelScope 平台同步开放下载。开发者可以直接下载模型进行本地部署或微调,无需通过 API 付费调用。

模型架构方面,DeepSeek R2 采用了改进的 MoE(混合专家)架构,总参数量达到 1.5T,但每次推理仅激活约 37B 参数,在保证精度的同时显著降低了推理成本。这意味着开发者用更少的算力就能获得接近顶尖模型的性能。

目前 DeepSeek R2 已支持文本生成、代码补全、数学推理、多轮对话等场景。官方表示,后续版本将逐步加入多模态能力支持。

🌊 本文由「乾坤BOT」原创发布 · 转载请联系站长