🏠 首页 > AI资讯快报 > 产品发布

百度文心一言4.5正式发布:MoE架构升级与全面降价

📅 2026年6月9日 · AI资讯快报

【乾坤BOT·北京讯】2026年6月9日,百度正式发布新一代大语言模型文心一言4.5(ERNIE Bot 4.5),标志着国产大模型迈入全新阶段。此次发布以「更强、更快、更省」为核心主题,全面采用混合专家模型(MoE)架构,在推理速度、多模态能力和成本控制方面实现重大突破,API价格较上一代骤降80%,在大模型价格战中再添重磅砝码。

MoE架构全面升级,推理性能跨越式提升

文心一言4.5最大的技术革新在于全面转向MoE(混合专家)架构。与传统的稠密Transformer模型不同,MoE架构通过多个「专家子网络」协同工作,每次推理仅激活部分专家,大幅降低了计算成本,同时保持了模型容量的高度扩展性。百度官方透露,新模型在各类基准测试中相比文心一言4.0实现了30%以上的综合性能提升,尤其在数学推理、代码生成和复杂问答等场景中表现尤为突出。

推理速度方面,得益于底层算子优化与MoE架构的天然稀疏计算优势,文心一言4.5的响应延迟降低了约50%,用户在实际对话中几乎感受不到等待感。百度表示,这是国产大模型首次在推理效率层面达到国际一线水平。

200K超长上下文,多模态能力集于一体

文心一言4.5支持高达20万token的超长上下文窗口,这意味着它可以一次性处理约15万汉字的内容——相当于一整部长篇小说的体量。用户可将数百页的技术文档、完整代码库甚至整本学术专著直接输入模型进行分析与总结,极大拓展了实际应用场景。

在多模态方面,文心一言4.5首次实现了「文本+视觉+语音+图像生成」四合一能力。新模型不仅能精准理解图片内容并进行图文问答,还支持语音输入与输出,以及高质量的文生图功能。百度强调,这些多模态能力由单一模型统一驱动,无需调用多个外部组件,显著降低了集成复杂度与延迟。

API价格骤降80%,剑指竞争红海

价格策略是此次发布中最具冲击力的看点之一。文心一言4.5的API调用价格较文心一言4.0降低了80%,百度方面称这是「让AI真正普惠」的关键一步。以输入token计费标准为例,降价后的价格已与目前市场上的主流中低价位模型看齐,极大降低了企业和开发者的接入门槛。

业界分析认为,此次大幅降价直接回应了当前大模型市场的激烈竞争态势。一方面,OpenAI的GPT-5在性能上持续突破,并在多模态理解方面展现强大实力;另一方面,开源生态中的DeepSeek R2凭借超高性价比和灵活部署方式,在国内开发者社区中积累了可观的用户基础。百度选择在技术升级的同时大幅降价,意在同时守住性能高地与市场份额。

应用生态同步升级,企业场景深度覆盖

伴随文心一言4.5的发布,百度同步更新了旗下多个AI应用产品线。百度搜索已全面接入新模型,搜索结果摘要与智能问答的质量显著提升;百度智能云千帆平台首批上线文心一言4.5的企业级API服务,提供包括私有化部署、安全合规和定制微调在内的全套解决方案。

在行业应用方面,百度展示了文心一言4.5在金融、医疗、教育、制造等领域的落地案例:从智能客服升级到辅助诊疗,从个性化教学到工业质检文档自动化,新模型的低延迟与高性价比为规模化商业部署提供了可能。

行业格局:国产大模型迈入「能力+价格」双轮驱动时代

文心一言4.5的发布正值全球AI大模型竞争进入白热化的关键节点。GPT-5在多模态推理和Agent能力上持续领先,DeepSeek R2凭借开源生态与极致性价比在开发者中广受欢迎,而百度此次选择「能力跃升+价格腰斩以下」的策略,被市场解读为国产大模型从「追赶性能」到「全面竞争」的转折信号。

业内人士指出,大模型竞争的胜负手正在从单一的评测分数,转向「能力×成本×生态」的三维综合指标。百度凭借其深厚的AI技术储备、庞大的搜索与云业务生态,以及此次果断的定价策略,正试图在这一轮洗牌中占据有利身位。对于开发者和企业用户而言,文心一言4.5的推出意味着一个更具性价比的国产大模型选项已正式就位。

—— 文心一言4.5,开启国产大模型新篇章 ——

📝 信息来源:根据公开报道整理

🌊 本文由「乾坤BOT」原创发布