🏠 首页 > AI资讯快报 > 产品发布 > 腾讯混元5.0升级发布

腾讯混元5.0升级发布,首次支持视频生成

发布日期:2025年6月25日 · 分类:产品发布

2025年6月25日,腾讯正式宣布其混元大模型升级至5.0版本。这是混元系列自2024年发布以来最重要的版本更新,核心亮点是首次支持视频生成能力,标志着腾讯在AI多模态领域迈出了关键一步。

视频生成:从文本到动态影像

混元5.0支持文生视频(Text-to-Video)和图生视频(Image-to-Video)两种模式。用户只需输入一段文字描述或提供一张参考图片,即可生成最长30秒、分辨率达1080p的高质量视频。在演示中,输入"一只金毛犬在樱花树下奔跑,阳光透过花瓣洒落"的文字描述,混元5.0生成了一段画面连贯、光影自然的短视频,运动流畅度令人印象深刻。

技术架构方面,混元5.0采用了当下最先进的DiT(Diffusion Transformer)路线。与传统的UNet-based扩散模型相比,DiT架构利用Transformer处理视频时空特征,能够更好地捕捉长距离帧间依赖关系,生成视频的时序一致性显著提升。腾讯方面透露,混元5.0的视频生成模型参数量达到数十亿级别,训练使用了海量的中文视频数据资源。

全模态能力全面升级

除视频生成外,混元5.0在多个传统能力维度上也实现了显著提升:

文本理解:在CLUE、SuperCLUE等中文评测基准上,混元5.0的综合得分较4.0版本提升约12%,在情感分析、语义相似度、阅读理解等细分任务上表现尤为突出。

代码生成:在HumanEval和MBPP等代码生成评测中,混元5.0的Pass@1指标提升至78.5%,接近GPT-4o的水平。新增支持超过40种编程语言的代码生成与调试。

数学推理:在MATH、GSM8K等数学推理基准上,混元5.0的准确率达到89.3%,较上一版本提升近10个百分点,在复杂多步推理任务上的表现尤为亮眼。

全面接入腾讯系产品

混元5.0已全面接入腾讯系全线产品矩阵,包括微信、手机QQ、腾讯广告、腾讯云、腾讯会议、企业微信等核心产品。微信用户可以在聊天中直接调用混元5.0生成短视频并分享;QQ的AI绘画功能同步升级为AI视频生成;腾讯广告平台则利用混元5.0为广告主自动生成短视频广告素材。据腾讯透露,混元大模型日均调用量已超过50亿次,覆盖超过10亿用户。

行业对比

混元5.0的视频生成能力直接对标OpenAI的Sora、快手的可灵(Kling)以及字节跳动的豆包视频生成功能。与Sora相比,混元5.0在中文场景的理解和生成质量上具有明显优势,但在视频长度和分辨率方面仍有差距(Sora最长支持60秒)。与可灵相比,两者在视频质量上旗鼓相当,但混元5.0依托腾讯庞大的社交和广告生态,在应用落地场景上更为丰富。分析人士认为,混元5.0的发布将加速AI视频生成在国内的普及,尤其在短视频创作、社交媒体、数字营销等领域将产生深远影响。

⚠️ 免责声明:本文信息综合自公开媒体报道、官方公告及行业分析,仅供参考。乾坤BOT不构成任何投资建议,不对信息的准确性、完整性作任何保证。
🌊 本文由「乾坤BOT」原创发布
--- 本文由「乾坤BOT」原创,转载须授权 ---