滚动资讯

Claude 4强势登场！AI编码新纪元，但安全性引发开发者热议

时间：2025-05-25 08:59 来源：ITBEAR作者：陆辰风

在科技界的万众瞩目下，Anthropic公司于今日凌晨震撼发布了其最新一代Claude模型——Claude 4。此次发布标志着AI技术在编程、推理及智能体任务执行领域迈出了重要一步。

Claude 4系列包含两款核心模型：Claude Opus 4与Claude Sonnet 4。据Anthropic官方介绍，这两款模型在代码生成能力、高级逻辑推理以及智能体任务执行效率上均树立了新的业界标杆。Claude Opus 4更是被誉为“全球顶尖编程模型”，专为处理复杂且耗时长的任务设计，能够自主运行数小时，甚至达到24小时不间断。

而Claude Sonnet 4相较于其前身Sonnet 3.7，在编程精准度和推理能力上实现了显著提升，更能够准确响应用户指令。这一系列更新不仅引发了业界对Anthropic与OpenAI之间竞争升级的关注，还因Claude 4在上线前测试中展现的“自主逃逸”等行为引发了广泛讨论。

尤其值得一提的是Claude Opus 4的长时间代码重构能力。据官方透露，该模型能够在执行《宝可梦》游戏任务的同时，连续进行代码重构，稳定运行时间长达7小时，甚至在某些场景下可达24小时，远超旧版Claude模型通常只能维持的1到2小时。这一突破意味着AI在编程辅助领域的实用性得到了大幅提升。

多家企业已对Claude 4进行了测试验证，反馈积极。日本科技公司Rakuten使用Claude Opus 4独立运行了一个高要求的开源重构任务，连续7小时性能稳定。开发者工具初创公司Cursor称赞其为“当前代码理解的最先进模型”，而提供云端开发环境的Replit则表示Claude 4在多文件复杂修改任务中展现了极高精度。区块链基础设施平台Block认为，Claude 4是首个能在代码编辑和调试中同步提升质量的模型。

基准测试结果同样令人瞩目。Claude Opus 4在SWE-bench与Terminal-bench测试中分别以72.5%与43.2%的成绩领先。Claude Sonnet 4在SWE-bench上的表现同样不俗，达到了72.7%，超越了其前代。

GitHub宣布将采用Claude 4作为其Copilot新智能体模型的底层引擎。Manus、iGent与Sourcegraph等公司也表示，Claude 4在复杂指令解析、逻辑推理及代码美感方面表现优异，特别是在大型项目中的导航错误率显著下降。Augment Code指出，Claude Sonnet 4的代码编辑更加精准细致，已成为其主力模型。

为了进一步提升用户体验，Anthropic在Claude 4中引入了一系列配套功能。其中包括“记忆”功能，允许模型在长时间会话中通过维护外部文件来存储关键信息，这类似于人类在长时间工作或会议中记笔记的行为。两款模型还引入了“思维摘要”功能，仅在约5%的情况下对复杂思路进行压缩显示，便于用户快速理解。

Claude 4还引入了Anthropic所谓的“使用工具进行延伸思考”功能，允许模型在模拟推理与调用外部工具（如网页搜索）之间交替运行。这一功能使得Claude 4能够在思考过程中灵活调用工具，直至找到最终答案。虽然Claude 3.7 Sonnet已具备较强的工具调用能力，但新模型能够在同一次响应中交错使用推理与工具调用，进一步提升了效率。

然而，随着Claude 4的强大功能一同而来的，还有对其潜在风险的担忧。Anthropic表示，Claude 4系列模型采用了更高级别的AI安全机制，如ASL-3，以确保模型在复杂能力下不会引发误用或异常行为。这一决策源于预发布测试阶段Claude Opus 4展现的一些令人不安的行为，如试图勒索开发者等。

尽管如此，Anthropic强调，在模型开发和发布过程中进行了大量测试与风险评估，以确保安全机制的有效性。同时，Claude 4的发布也标志着Anthropic朝着“长期运行、高连贯性”的虚拟协作伙伴形态迈出了关键一步。

Anthropic还将Claude Code（最早于2月推出）作为正式产品上线，支持VS Code与JetBrains IDE，并提供了Claude Code SDK，允许开发者基于相同框架构建自定义代理。GitHub上的Claude Code应用也已进入Beta阶段，支持处理PR评论、CI错误等协作任务。

Claude 4的发布迅速引发了开发者社区的高度关注，不少开发者对其强大功能表示赞叹。有开发者指出，Claude 4的训练数据截至时间为2025年3月，是目前所有主流模型中最新的。试用之下，有开发者反馈称Claude 4仅用30秒就制作出了一个CRM仪表板。

然而，Claude 4的上线也牵动了AI编程助手领域的竞争神经。本月初，OpenAI宣布将以30亿美元收购AI编程初创公司Windsurf，而Claude 4的发布无疑给这一领域带来了新的变数。Windsurf CEO Varun Mohan在Claude 4发布当日表达了不满，并宣布已在Windsurf中开放了对Claude Sonnet 4和Opus 4的自带密钥支持，适用于所有个人用户。

这一波操作引发了社区热议，有网友评论称Anthropic拒绝向Windsurf开放Claude 4的支持，导致Windsurf成为了唯一无法使用这两个模型的编码工具平台。也有不少用户心疼Windsurf，认为Claude 4的发布实际上加剧了与OpenAI之间的竞争。