在科技界的万众瞩目下,Anthropic公司于今日凌晨震撼发布了其最新一代Claude模型——Claude 4。此次发布标志着AI技术在编程、推理及智能体任务执行领域迈出了重要一步。
Claude 4系列包含两款核心模型:Claude Opus 4与Claude Sonnet 4。据Anthropic官方介绍,这两款模型在代码生成能力、高级逻辑推理以及智能体任务执行效率上均树立了新的业界标杆。Claude Opus 4更是被誉为“全球顶尖编程模型”,专为处理复杂且耗时长的任务设计,能够自主运行数小时,甚至达到24小时不间断。
而Claude Sonnet 4相较于其前身Sonnet 3.7,在编程精准度和推理能力上实现了显著提升,更能够准确响应用户指令。这一系列更新不仅引发了业界对Anthropic与OpenAI之间竞争升级的关注,还因Claude 4在上线前测试中展现的“自主逃逸”等行为引发了广泛讨论。
尤其值得一提的是Claude Opus 4的长时间代码重构能力。据官方透露,该模型能够在执行《宝可梦》游戏任务的同时,连续进行代码重构,稳定运行时间长达7小时,甚至在某些场景下可达24小时,远超旧版Claude模型通常只能维持的1到2小时。这一突破意味着AI在编程辅助领域的实用性得到了大幅提升。
多家企业已对Claude 4进行了测试验证,反馈积极。日本科技公司Rakuten使用Claude Opus 4独立运行了一个高要求的开源重构任务,连续7小时性能稳定。开发者工具初创公司Cursor称赞其为“当前代码理解的最先进模型”,而提供云端开发环境的Replit则表示Claude 4在多文件复杂修改任务中展现了极高精度。区块链基础设施平台Block认为,Claude 4是首个能在代码编辑和调试中同步提升质量的模型。
基准测试结果同样令人瞩目。Claude Opus 4在SWE-bench与Terminal-bench测试中分别以72.5%与43.2%的成绩领先。Claude Sonnet 4在SWE-bench上的表现同样不俗,达到了72.7%,超越了其前代。
GitHub宣布将采用Claude 4作为其Copilot新智能体模型的底层引擎。Manus、iGent与Sourcegraph等公司也表示,Claude 4在复杂指令解析、逻辑推理及代码美感方面表现优异,特别是在大型项目中的导航错误率显著下降。Augment Code指出,Claude Sonnet 4的代码编辑更加精准细致,已成为其主力模型。
为了进一步提升用户体验,Anthropic在Claude 4中引入了一系列配套功能。其中包括“记忆”功能,允许模型在长时间会话中通过维护外部文件来存储关键信息,这类似于人类在长时间工作或会议中记笔记的行为。两款模型还引入了“思维摘要”功能,仅在约5%的情况下对复杂思路进行压缩显示,便于用户快速理解。
Claude 4还引入了Anthropic所谓的“使用工具进行延伸思考”功能,允许模型在模拟推理与调用外部工具(如网页搜索)之间交替运行。这一功能使得Claude 4能够在思考过程中灵活调用工具,直至找到最终答案。虽然Claude 3.7 Sonnet已具备较强的工具调用能力,但新模型能够在同一次响应中交错使用推理与工具调用,进一步提升了效率。
然而,随着Claude 4的强大功能一同而来的,还有对其潜在风险的担忧。Anthropic表示,Claude 4系列模型采用了更高级别的AI安全机制,如ASL-3,以确保模型在复杂能力下不会引发误用或异常行为。这一决策源于预发布测试阶段Claude Opus 4展现的一些令人不安的行为,如试图勒索开发者等。
尽管如此,Anthropic强调,在模型开发和发布过程中进行了大量测试与风险评估,以确保安全机制的有效性。同时,Claude 4的发布也标志着Anthropic朝着“长期运行、高连贯性”的虚拟协作伙伴形态迈出了关键一步。
Anthropic还将Claude Code(最早于2月推出)作为正式产品上线,支持VS Code与JetBrains IDE,并提供了Claude Code SDK,允许开发者基于相同框架构建自定义代理。GitHub上的Claude Code应用也已进入Beta阶段,支持处理PR评论、CI错误等协作任务。
Claude 4的发布迅速引发了开发者社区的高度关注,不少开发者对其强大功能表示赞叹。有开发者指出,Claude 4的训练数据截至时间为2025年3月,是目前所有主流模型中最新的。试用之下,有开发者反馈称Claude 4仅用30秒就制作出了一个CRM仪表板。
然而,Claude 4的上线也牵动了AI编程助手领域的竞争神经。本月初,OpenAI宣布将以30亿美元收购AI编程初创公司Windsurf,而Claude 4的发布无疑给这一领域带来了新的变数。Windsurf CEO Varun Mohan在Claude 4发布当日表达了不满,并宣布已在Windsurf中开放了对Claude Sonnet 4和Opus 4的自带密钥支持,适用于所有个人用户。
这一波操作引发了社区热议,有网友评论称Anthropic拒绝向Windsurf开放Claude 4的支持,导致Windsurf成为了唯一无法使用这两个模型的编码工具平台。也有不少用户心疼Windsurf,认为Claude 4的发布实际上加剧了与OpenAI之间的竞争。