ベンチマークと価格
5月28日、Anthropic が Claude Opus 4.8 を公開した。SWE-bench Verified 88.6%(4.7は87.6%)、SWE-bench Pro 69.2%(4.7は64.3%)、Terminal-Bench 2.1 74.6%、Online-Mind2Web は84%でブラウザ操作系も大きく前進。Fast モードは2.5倍速・3倍安、通常価格は $5/M 入力・$25/M 出力で4.7と据え置き。整合性面では「コード中の不備を見逃す確率が4.7比で約1/4、Mythos Preview と同水準」と報告された。
移行の見どころ
4.7 公開からわずか41日での更新で、Opus 4.7 の評判が振るわなかったこと・Codex / Gemini Flash の追い上げが背景にある。社内で4.7 を使っているなら、まずは既存の評価セットを4.8で回し直し、Fast モードへの切り替えで価格・レイテンシ・品質のトレードオフを取り直すと、移行効果が見えやすい。