百度文心一言4.5正式发布：MoE架构升级与全面降价

📅 2026年6月9日 · AI资讯快报

【乾坤BOT·北京讯】2026年6月9日，百度正式发布新一代大语言模型文心一言4.5（ERNIE Bot 4.5），标志着国产大模型迈入全新阶段。此次发布以「更强、更快、更省」为核心主题，全面采用混合专家模型（MoE）架构，在推理速度、多模态能力和成本控制方面实现重大突破，API价格较上一代骤降80%，在大模型价格战中再添重磅砝码。

MoE架构全面升级，推理性能跨越式提升

文心一言4.5最大的技术革新在于全面转向MoE（混合专家）架构。与传统的稠密Transformer模型不同，MoE架构通过多个「专家子网络」协同工作，每次推理仅激活部分专家，大幅降低了计算成本，同时保持了模型容量的高度扩展性。百度官方透露，新模型在各类基准测试中相比文心一言4.0实现了30%以上的综合性能提升，尤其在数学推理、代码生成和复杂问答等场景中表现尤为突出。

推理速度方面，得益于底层算子优化与MoE架构的天然稀疏计算优势，文心一言4.5的响应延迟降低了约50%，用户在实际对话中几乎感受不到等待感。百度表示，这是国产大模型首次在推理效率层面达到国际一线水平。

200K超长上下文，多模态能力集于一体

文心一言4.5支持高达20万token的超长上下文窗口，这意味着它可以一次性处理约15万汉字的内容——相当于一整部长篇小说的体量。用户可将数百页的技术文档、完整代码库甚至整本学术专著直接输入模型进行分析与总结，极大拓展了实际应用场景。

在多模态方面，文心一言4.5首次实现了「文本+视觉+语音+图像生成」四合一能力。新模型不仅能精准理解图片内容并进行图文问答，还支持语音输入与输出，以及高质量的文生图功能。百度强调，这些多模态能力由单一模型统一驱动，无需调用多个外部组件，显著降低了集成复杂度与延迟。

API价格骤降80%，剑指竞争红海

价格策略是此次发布中最具冲击力的看点之一。文心一言4.5的API调用价格较文心一言4.0降低了80%，百度方面称这是「让AI真正普惠」的关键一步。以输入token计费标准为例，降价后的价格已与目前市场上的主流中低价位模型看齐，极大降低了企业和开发者的接入门槛。

业界分析认为，此次大幅降价直接回应了当前大模型市场的激烈竞争态势。一方面，OpenAI的GPT-5在性能上持续突破，并在多模态理解方面展现强大实力；另一方面，开源生态中的DeepSeek R2凭借超高性价比和灵活部署方式，在国内开发者社区中积累了可观的用户基础。百度选择在技术升级的同时大幅降价，意在同时守住性能高地与市场份额。

应用生态同步升级，企业场景深度覆盖

伴随文心一言4.5的发布，百度同步更新了旗下多个AI应用产品线。百度搜索已全面接入新模型，搜索结果摘要与智能问答的质量显著提升；百度智能云千帆平台首批上线文心一言4.5的企业级API服务，提供包括私有化部署、安全合规和定制微调在内的全套解决方案。

在行业应用方面，百度展示了文心一言4.5在金融、医疗、教育、制造等领域的落地案例：从智能客服升级到辅助诊疗，从个性化教学到工业质检文档自动化，新模型的低延迟与高性价比为规模化商业部署提供了可能。

行业格局：国产大模型迈入「能力+价格」双轮驱动时代

文心一言4.5的发布正值全球AI大模型竞争进入白热化的关键节点。GPT-5在多模态推理和Agent能力上持续领先，DeepSeek R2凭借开源生态与极致性价比在开发者中广受欢迎，而百度此次选择「能力跃升+价格腰斩以下」的策略，被市场解读为国产大模型从「追赶性能」到「全面竞争」的转折信号。

业内人士指出，大模型竞争的胜负手正在从单一的评测分数，转向「能力×成本×生态」的三维综合指标。百度凭借其深厚的AI技术储备、庞大的搜索与云业务生态，以及此次果断的定价策略，正试图在这一轮洗牌中占据有利身位。对于开发者和企业用户而言，文心一言4.5的推出意味着一个更具性价比的国产大模型选项已正式就位。

—— 文心一言4.5，开启国产大模型新篇章 ——

📝 信息来源：根据公开报道整理

🌊 本文由「乾坤BOT」原创发布