昆仑万维天工4.0开源，采用MIT协议

发布日期：2025年6月25日 · 分类：技术突破

2025年6月25日，昆仑万维正式宣布将天工大模型4.0（Skywork-4.0）在GitHub和Hugging Face等平台开源，采用MIT协议——业界最宽松的开源许可之一。这意味着全球开发者可以自由地使用、修改、分发天工4.0的模型权重和代码，甚至用于商业产品和二次开发，无需支付任何授权费用。

模型规模与技术细节

天工4.0系列包含三个规格的模型：天工4.0-7B（70亿参数）、天工4.0-14B（140亿参数）和天工4.0-72B（720亿参数），采用MoE（Mixture of Experts）混合专家架构。模型基于超过15万亿Token的高质量中文和英文双语语料进行预训练，其中中文语料占比约60%，涵盖互联网文本、书籍、学术论文、代码库、专业文档等多种来源。

在技术架构上，天工4.0采用了Grouped Query Attention（GQA）、Rotary Position Embedding（RoPE）以及FlashAttention-2等先进技术，在大幅提升推理效率的同时保持了优秀的模型质量。昆仑万维还开源了完整的训练代码、数据处理流程以及分布式训练配置，为社区提供了"从零复现"的可能性。

性能评测对比

根据昆仑万维公布的评测数据，天工4.0系列在多项主流基准测试中展现出具有竞争力的性能：

天工4.0-72B vs Llama 3.1-70B：在MMLU（大规模多任务语言理解）上，天工4.0-72B得分86.3%，与Llama 3.1-70B的87.1%基本持平；在中文基准C-Eval上，天工4.0-72B以91.7%的得分大幅领先Llama 3.1-70B的78.2%；在数学推理基准MATH上，天工4.0-72B得分74.5%，超过Llama 3.1-70B的72.1%。

天工4.0-14B vs Qwen2.5-14B：在C-Eval上两者得分接近（天工89.3% vs Qwen2.5 90.1%）；在代码生成基准HumanEval上，天工4.0-14B以76.2%的Pass@1略高于Qwen2.5-14B的75.0%；在中文知识问答上，天工4.0-14B表现更为出色。

天工4.0-7B vs Gemma-2-9B：天工4.0-7B虽然参数量更小，但在中文场景下全面优于Gemma-2-9B，在C-Eval上的优势高达15个百分点以上，体现了天工系列在中文理解和生成方面的深厚积累。

对开源社区的深远意义

天工4.0采用MIT协议开源，意味着企业可以将其集成到商业产品中而无需公开修改后的代码，这对中小企业尤其友好。此前，Meta的Llama系列虽然也开源，但采用的是较严格的Llama Community License，对商业使用和衍生品有一定限制。MIT协议的开源将大大降低国产大模型在企业级应用中的合规门槛。

开源社区对天工4.0的发布反响热烈。发布后24小时内，天工4.0-7B在Hugging Face上的下载量突破10万次，GitHub仓库收获超过5000颗星标。多位社区开发者表示，天工4.0的中文能力在开源模型中属于第一梯队，有望成为国产AI应用开发的首选基座模型之一。

昆仑万维AI业务布局

昆仑万维近年来在AI领域的布局日益清晰。除天工大模型外，公司还推出了天工AI搜索、天工AI绘画、天工AI音乐等产品矩阵，覆盖搜索、创意、娱乐等多个场景。据昆仑万维2024年年报显示，公司AI业务收入同比增长超过200%，占公司总营收比例已提升至35%。此次天工4.0的全面开源，既是昆仑万维"技术赋能行业"战略的重要一步，也反映出中国AI企业正在从"闭源追跑"转向"开源引领"的新趋势。

⚠️ 免责声明：本文信息综合自公开媒体报道、官方公告及行业分析，仅供参考。乾坤BOT不构成任何投资建议，不对信息的准确性、完整性作任何保证。

🌊 本文由「乾坤BOT」原创发布

--- 本文由「乾坤BOT」原创，转载须授权 ---