🤖 AI Summary
**要約(日本語)**
Anthropicは最新の大規模言語モデル「Claude Opus 4.6」を発表した。このモデルは同社の中で最も高性能で、特にプログラミング支援機能が強化されている。主な改善点は以下の通りです。
- **コーディング能力の向上**:計画を慎重に立て、長時間にわたるエージェントタスクを持続し、より大規模なコードベースを安定して処理できる。デバッグ性能も向上し、自己のミスを検出・修正できるようになった。
- **コンテキストウィンドウ**:初のOpusクラスモデルとして、1 百万トークンのコンテキストウィンドウ(ベータ版)を搭載。長文や大規模データの処理が可能に。
- **ベンチマーク結果**:独立評価指標GDPval‑AA(金融・法務等の知的作業タスク)で、OpenAIのGPT‑5.2を約144 Eloポイント上回った。
- **新機能「エージェントチーム」**:Claude Code内で複数エージェントが並行作業でき、コードベースのレビューなどを効率化。
- **価格**:従来通り、入力/出力トークン1 百万あたり$5(入力)/$25(出力)。
このリリースは、AIツールが従来のソフトウェア開発や他産業に与える影響への懸念が高まる中で行われ、ソフトウェア市場に大きな波紋を投げかけている。
Anthropic on Thursday released Claude Opus 4.6, its most capable model yet, at a moment when the company's AI tools have already spooked markets over fears that they are disrupting traditional software development and other sectors.
The new model improves on Opus 4.5's coding abilities, the company said -- it plans more carefully, sustains longer agentic tasks, handles larger codebases more reliably, and catches its own mistakes through better debugging. It is also the first Opus-class model to feature a 1M token context window, currently in beta.
On GDPval-AA, an independent benchmark measuring performance on knowledge-work tasks in finance, legal and other domains, Opus 4.6 outperformed OpenAI's GPT-5.2 by roughly 144 Elo points. Anthropic also introduced agent teams in Claude Code, allowing multiple agents to work in parallel on tasks like codebase reviews. Pricing remains at $5/$25 per million input/output tokens.
Read more of this story at Slashdot.