トピック
□ LLM Models
モデルの比較、価格変化、推論性能、オープンウェイトの現実的な使いどころをまとめています。
Anthropic Opus 4.8
Claude Opus 4.8 が公開|SWE-bench Pro 69.2%、Fast モードが3倍安く・速く
Anthropic が5月28日に Claude Opus 4.8 を公開。SWE-bench Pro 69.2%、SWE-bench Verified 88.6%、Online-Mind2Web 84% と前世代を上回り、Fast モードは2.5倍速・3倍安に。整合性も「Mythos Preview に並ぶ」と報告。
claudeopus-4-8anthropicswe-bench
Open Weights DeepSeek V4
DeepSeek V4 Pro/Flash登場|1.6Tパラメータと低価格の二段構え
DeepSeekがV4をプレビュー公開。1.6TパラメータのProと小型・廉価のFlashを同時に出し、100万トークンのコンテキストとHuawei Ascendとの密結合を売りにする。
deepseekopen-sourcemoe
Claude Desk Opus 4.7 Arrives
Claude Opus 4.7が来た|長時間コーディングに効く改善は何か
長時間にわたる複雑なコーディングと画像の高解像度認識が主な改善点。全製品と主要クラウドで利用可能になっている。
claude-opuscodingrelease
Model Pricing Price Reset 2026
モデル料金が下がっても総額が増える理由|2026年春のコスト再点検
API単価の値下げが続く一方で、呼び出し回数の増加とワークフローの複雑化で請求額はむしろ膨らみやすくなっている。
pricingllmapi-cost
LLM Watch Small Models
小型推論モデルはどこまで実務に入るのか
小型モデルは補助要員ではなく、実務ワークフローの第一走者として採用され始めている。品質、速度、コストの境界線を整理する。
small-modelsreasoninglatency