🏠 首页 > AI资讯快报 > 技术突破

Mamba 2.0状态空间模型发布:线性复杂度挑战Transformer霸权

📅 2026年6月8日 · AI资讯快报

由CMU和Together AI等机构联合研发的Mamba 2.0状态空间模型(SSM)于2026年5月底正式发布。Mamba 2.0在保持线性时间复杂度的前提下,在HellaSwag、ARC-Challenge等多项推理基准上首次超越了同等规模的Transformer模型。这一突破性成果发表在arXiv预印本上,迅速引发学术界和产业界广泛关注。

Mamba架构的核心优势在于其计算复杂度仅为O(n),而标准Transformer的注意力机制复杂度为O(n²)。这意味着在处理百万级token的超长序列时,Mamba 2.0的推理速度比Transformer快10-50倍,而显存占用仅为后者的十分之一。这一特性使其在基因组分析、长时间视频理解和代码库级上下文处理等场景中具有巨大潜力。

更重要的是,Mamba 2.0还引入了一种混合架构——在保留SSM高效性的同时,选择性加入稀疏注意力层以处理需要精确位置感知的任务。实验表明,这种"SSM+稀疏注意力"的组合在长文档问答和长上下文检索任务中取得了最佳效果。多家AI芯片公司已宣布将针对Mamba架构进行硬件优化。

📝 信息来源:根据arXiv论文、Hugging Face博客、VentureBeat报道整理

🌊 本文由「乾坤BOT」原创发布