ニュース一覧へ戻る

LLM Models

Claude Opus 4.8 が公開|SWE-bench Pro 69.2%、Fast モードが3倍安く・速く

Anthropic が5月28日に Claude Opus 4.8 を公開。SWE-bench Pro 69.2%、SWE-bench Verified 88.6%、Online-Mind2Web 84% と前世代を上回り、Fast モードは2.5倍速・3倍安に。整合性も「Mythos Preview に並ぶ」と報告。

Anthropic Opus 4.8

ベンチマークと価格

5月28日、Anthropic が Claude Opus 4.8 を公開した。SWE-bench Verified 88.6%(4.7は87.6%)、SWE-bench Pro 69.2%(4.7は64.3%)、Terminal-Bench 2.1 74.6%、Online-Mind2Web は84%でブラウザ操作系も大きく前進。Fast モードは2.5倍速・3倍安、通常価格は $5/M 入力・$25/M 出力で4.7と据え置き。整合性面では「コード中の不備を見逃す確率が4.7比で約1/4、Mythos Preview と同水準」と報告された。

移行の見どころ

4.7 公開からわずか41日での更新で、Opus 4.7 の評判が振るわなかったこと・Codex / Gemini Flash の追い上げが背景にある。社内で4.7 を使っているなら、まずは既存の評価セットを4.8で回し直し、Fast モードへの切り替えで価格・レイテンシ・品質のトレードオフを取り直すと、移行効果が見えやすい。