「Claude Code Opus 4.5」が劣化している
2026年1月30日 14:00
🤖 AI Summary
**要約**
AIモデルは随時アップデートされ、同一名称でも性能や出力傾向が変化します。Marginlab が実施したベンチマーク「SWE‑Bench Pro」の追跡調査によると、Anthropic の **Claude Code Opus 4.5** が **性能劣化** を示しています。
- **スコア変化**
- 前日比:‑8.0 %
- 前週比:‑4.8 %
- 前月比:‑4.1 %(統計的に有意)
- **比較対象**
- 同様に追跡中の OpenAI Codex gpt‑5.2‑high では、日・週・月いずれの比較でも有意な変化は見られません。
- **開発側の説明**
- Hacker News で話題に。Claude Code 開発担当の Thariq Shihipar 氏は「2025年1月26日にハーネスで問題が発生し、2026年1月28日にロールバックした」とコメント。
このことは、AIサービス利用者がモデルの実際の性能を把握し続ける必要性を示すとともに、ベンダー側の変更がユーザー体験に直結することを改めて浮き彫りにしています。
AIモデルは随時アップデートされ、同一名称でも性能や出力傾向が変化します。Marginlab が実施したベンチマーク「SWE‑Bench Pro」の追跡調査によると、Anthropic の **Claude Code Opus 4.5** が **性能劣化** を示しています。
- **スコア変化**
- 前日比:‑8.0 %
- 前週比:‑4.8 %
- 前月比:‑4.1 %(統計的に有意)
- **比較対象**
- 同様に追跡中の OpenAI Codex gpt‑5.2‑high では、日・週・月いずれの比較でも有意な変化は見られません。
- **開発側の説明**
- Hacker News で話題に。Claude Code 開発担当の Thariq Shihipar 氏は「2025年1月26日にハーネスで問題が発生し、2026年1月28日にロールバックした」とコメント。
このことは、AIサービス利用者がモデルの実際の性能を把握し続ける必要性を示すとともに、ベンダー側の変更がユーザー体験に直結することを改めて浮き彫りにしています。