トピック

□ LLM Models

モデルの比較、価格変化、推論性能、オープンウェイトの現実的な使いどころをまとめています。

速報 LLM Models anthropics/anthropic-sdk-python

Claude Opus 4.8 が公開｜SWE-bench Pro 69.2%、Fast モードが3倍安く・速く

Anthropic が5月28日に Claude Opus 4.8 を公開。SWE-bench Pro 69.2%、SWE-bench Verified 88.6%、Online-Mind2Web 84% と前世代を上回り、Fast モードは2.5倍速・3倍安に。整合性も「Mythos Preview に並ぶ」と報告。

claudeopus-4-8anthropicswe-bench

Open Weights DeepSeek V4

速報 LLM Models deepseek-ai/DeepSeek-V4

DeepSeek V4 Pro/Flash登場｜1.6Tパラメータと低価格の二段構え

DeepSeekがV4をプレビュー公開。1.6TパラメータのProと小型・廉価のFlashを同時に出し、100万トークンのコンテキストとHuawei Ascendとの密結合を売りにする。

deepseekopen-sourcemoe

Claude Desk Opus 4.7 Arrives

速報 LLM Models anthropic/claude

Claude Opus 4.7が来た｜長時間コーディングに効く改善は何か

長時間にわたる複雑なコーディングと画像の高解像度認識が主な改善点。全製品と主要クラウドで利用可能になっている。

claude-opuscodingrelease

Model Pricing Price Reset 2026

速報 LLM Models market/model-pricing

モデル料金が下がっても総額が増える理由｜2026年春のコスト再点検

API単価の値下げが続く一方で、呼び出し回数の増加とワークフローの複雑化で請求額はむしろ膨らみやすくなっている。

pricingllmapi-cost

LLM Watch Small Models

分析 LLM Models open-weights/reasoning-stack

小型推論モデルはどこまで実務に入るのか

小型モデルは補助要員ではなく、実務ワークフローの第一走者として採用され始めている。品質、速度、コストの境界線を整理する。

small-modelsreasoninglatency