GPT-5激战Claude,Anthropic死磕代码,Kimi Work横空出世
📅 2026年6月9日 · AI资讯快报
2026年第二季度,全球大模型竞赛进入白热化阶段。OpenAI于5月中旬正式发布GPT-5,在MMLU、HumanEval等多项基准测试中刷新纪录,推理能力较GPT-4提升约40%,并首次原生支持100万token上下文窗口。紧随其后,Anthropic发布Claude 4系列模型,在代码生成领域的SWE-bench得分达到78.6%,反超GPT-5的同项成绩,明确将"死磕代码能力"作为核心战略方向。
Anthropic在代码领域的投入力度令人瞩目。据外媒The Information报道,Anthropic内部已将工程团队规模扩大至1200人,其中超过60%专注于代码相关模型的训练与优化。Claude 4的代码微调数据集中新增了来自GitHub超过2000万条高质量的PR评审数据,配合推出的Claude Code 3.0工具链,支持从需求分析到CI/CD全流程的AI驱动开发。这一策略已初见成效——知名JavaScript运行时Bun在6月初宣布,使用Claude Code在9天内完成了100万行代码的迁移重写。
月之暗面旗下的Kimi也在6月初迎来重大更新,正式发布"Kimi Work"企业协同工作台,直指企业级AI Agent场景。Kimi Work深度融合了长文本理解、多轮对话、以及多Agent协作调度能力,支持用户通过自然语言创建自动化工作流,覆盖文档处理、数据分析、项目管理等高频场景。据官方演示,Kimi Work能够在3分钟内完成过去需要一整个团队耗时半天的跨系统数据汇总与报告生成任务,首批企业客户包括多家金融与互联网公司。
与此同时,具身智能赛道也迎来更多入局者。特斯拉Optimus项目被曝已进入小批量试产阶段,计划2027年实现万台级出货。国内方面,小鹏汽车旗下鹏行智能新一代人形机器人PX5在6月初亮相,采用自研高扭矩关节模组,单臂负载能力达8公斤。字节跳动也被曝在内部组建了具身智能研发团队,由前华为机器人专家带队。大模型厂商向"具身化"延伸、机器人公司引入大模型能力,两条技术路线正在加速合流。
📝 信息来源:根据36氪、The Information、机器之心等公开报道整理