深潮 TechFlow 消息,5 月 23 日,据Decrypt报道,Anthropic公司已发布Claude 4人工智能模型系列,包括Opus和Sonnet两个版本。据官方数据,Claude Opus 4在SWE-bench编码基准测试中得分72.5%,高于OpenAI的GPT-4.1(54.6%)和Google的Gemini 2.5 Pro(63.2%)。该模型可支持近7小时的连续编码任务,上下文窗口接近100万tokens,并具备在复杂推理过程中调用工具的能力。在定价方面,Claude Opus 4每百万输出tokens定价75美元,相比某些开源替代方案如DeepSeek R1的3美元有明显差距。此外,GitHub已确认Claude Sonnet 4将作为其Copilot新编码助手的基础模型。