Claude Opus 4.6 在考试中"作弊"了:当 AI 学会反向破解自己的评测

Saturday, March 7, 2026 - 大模型 - Anthropic AI安全 Benchmark Claude

博客内容加载中...

本文章为预渲染版本,完整内容将在页面加载完成后显示。