核心看点:
- 全面超越前代:Opus 4.7 在逻辑推理、代码生成、长上下文处理上全方位碾压 Opus 4.6。
- 价格不变,加量不加价:依然维持 $5 / 1M 输入 Tokens、$25 / 1M 输出 Tokens 的企业级良心定价。
- 专为复杂任务而生:从各大评测反馈来看,它几乎消灭了“无限死循环”和“工具调用失败”等企业级痛点。
Anthropic 就在刚刚投下了一枚重磅炸弹:Claude Opus 4.7 正式 GA (General Availability)。 这并非一次挤牙膏式的更新,而是一次真正意义上“生产力工具”的代际跃升。如果你之前因为 AI 在复杂工程里总是“掉链子”而感到绝望,那 Opus 4.7 就是为你准备的。
算力革命:从“聪明”到“可靠”
在过去,大模型的“聪明”往往带有不确定性。但根据 Anthropic 官方及多位早期测试企业(如 Databricks、Shopify、Replit)的反馈,Opus 4.7 的核心突破在于:极度稳定的长程执行能力。
- 代码能力 (Software Engineering): Opus 4.7 能够在不需要人类频繁介入的情况下,自主完成高难度的长周期代码任务。它学会了“在行动前先验证”——它会自动编写测试用例,运行并修复自己的错误。在 GitHub 的测试中,它将复杂 Bug 解决率提升了 13%,甚至自主从零用 Rust 撸出了一个完整的文本转语音引擎。
- 抗循环陷阱 (Loop Resistance): Genspark CTO Kay Zhu 提到,Opus 4.7 最大程度地解决了 Agent 经常出现的“死循环”问题。面对错误数据,它不会盲目重试,而是能够像人类一样察觉异常,汇报数据缺失,而不是提供“看似合理实则错误”的回答。
- 多模态分辨率升级 (Vision): 模型现在支持更高分辨率的视觉输入,能够精准识别复杂的化学结构式和高级工程架构图。
顶级公司的测评反馈
- Hex:低精度的 Opus 4.7 性能已经等同于高精度运算的 Opus 4.6。
- Notion:对于复杂的多步工作流,性能提升 14%,且工具调用错误率降低了三分之二。
- Databricks:在文档推理方面,相较前代错误率直降 21%,是目前处理企业级数据最强的大模型。
- Shopify:明显减少了无意义的占位符代码和外壳函数,这是从 Sonnet 3.7 到 4.x 系列以来最干净利落的一次跨越。
安全与开放:Project Glasswing 的首个实践
值得注意的是,Opus 4.7 并不是 Anthropic 手里最强的底牌——他们还有一个未完全公开的怪物级模型:Claude Mythos Preview。 因为 Mythos 的网络安全(甚至黑客级别的进攻)能力过于强大,Anthropic 决定在 Opus 4.7 上率先试验其新的网络安全护栏。模型会自动检测并拦截高风险的网络安全请求,但同时也为正规的白帽子黑客和渗透测试专家提供了专属的 Cyber Verification Program (网络验证通道)。
如何体验?
Opus 4.7 现已全面接入 Claude App、API 以及 Amazon Bedrock、Google Cloud Vertex AI 等主流云平台。
API 标识符为:claude-opus-4-7。
一句话总结:对于需要处理复杂、严肃、多步协作任务的开发者和企业而言,目前的王座,属于 Claude Opus 4.7。