🏠 首页 > AI资讯快报 > 技术突破 > 昆仑万维天工4.0开源

昆仑万维天工4.0开源,采用MIT协议

发布日期:2025年6月25日 · 分类:技术突破

2025年6月25日,昆仑万维正式宣布将天工大模型4.0(Skywork-4.0)在GitHub和Hugging Face等平台开源,采用MIT协议——业界最宽松的开源许可之一。这意味着全球开发者可以自由地使用、修改、分发天工4.0的模型权重和代码,甚至用于商业产品和二次开发,无需支付任何授权费用。

模型规模与技术细节

天工4.0系列包含三个规格的模型:天工4.0-7B(70亿参数)、天工4.0-14B(140亿参数)和天工4.0-72B(720亿参数),采用MoE(Mixture of Experts)混合专家架构。模型基于超过15万亿Token的高质量中文和英文双语语料进行预训练,其中中文语料占比约60%,涵盖互联网文本、书籍、学术论文、代码库、专业文档等多种来源。

在技术架构上,天工4.0采用了Grouped Query Attention(GQA)、Rotary Position Embedding(RoPE)以及FlashAttention-2等先进技术,在大幅提升推理效率的同时保持了优秀的模型质量。昆仑万维还开源了完整的训练代码、数据处理流程以及分布式训练配置,为社区提供了"从零复现"的可能性。

性能评测对比

根据昆仑万维公布的评测数据,天工4.0系列在多项主流基准测试中展现出具有竞争力的性能:

天工4.0-72B vs Llama 3.1-70B:在MMLU(大规模多任务语言理解)上,天工4.0-72B得分86.3%,与Llama 3.1-70B的87.1%基本持平;在中文基准C-Eval上,天工4.0-72B以91.7%的得分大幅领先Llama 3.1-70B的78.2%;在数学推理基准MATH上,天工4.0-72B得分74.5%,超过Llama 3.1-70B的72.1%。

天工4.0-14B vs Qwen2.5-14B:在C-Eval上两者得分接近(天工89.3% vs Qwen2.5 90.1%);在代码生成基准HumanEval上,天工4.0-14B以76.2%的Pass@1略高于Qwen2.5-14B的75.0%;在中文知识问答上,天工4.0-14B表现更为出色。

天工4.0-7B vs Gemma-2-9B:天工4.0-7B虽然参数量更小,但在中文场景下全面优于Gemma-2-9B,在C-Eval上的优势高达15个百分点以上,体现了天工系列在中文理解和生成方面的深厚积累。

对开源社区的深远意义

天工4.0采用MIT协议开源,意味着企业可以将其集成到商业产品中而无需公开修改后的代码,这对中小企业尤其友好。此前,Meta的Llama系列虽然也开源,但采用的是较严格的Llama Community License,对商业使用和衍生品有一定限制。MIT协议的开源将大大降低国产大模型在企业级应用中的合规门槛。

开源社区对天工4.0的发布反响热烈。发布后24小时内,天工4.0-7B在Hugging Face上的下载量突破10万次,GitHub仓库收获超过5000颗星标。多位社区开发者表示,天工4.0的中文能力在开源模型中属于第一梯队,有望成为国产AI应用开发的首选基座模型之一。

昆仑万维AI业务布局

昆仑万维近年来在AI领域的布局日益清晰。除天工大模型外,公司还推出了天工AI搜索、天工AI绘画、天工AI音乐等产品矩阵,覆盖搜索、创意、娱乐等多个场景。据昆仑万维2024年年报显示,公司AI业务收入同比增长超过200%,占公司总营收比例已提升至35%。此次天工4.0的全面开源,既是昆仑万维"技术赋能行业"战略的重要一步,也反映出中国AI企业正在从"闭源追跑"转向"开源引领"的新趋势。

⚠️ 免责声明:本文信息综合自公开媒体报道、官方公告及行业分析,仅供参考。乾坤BOT不构成任何投资建议,不对信息的准确性、完整性作任何保证。
🌊 本文由「乾坤BOT」原创发布
--- 本文由「乾坤BOT」原创,转载须授权 ---