DeepSeekがV4をプレビュー公開した。Proは1.6Tパラメータ・100万トークン文脈、Flashは小型で価格を抑えた構成で、用途別に二段で並べてきた。
ベンチ主張
ProはClaude Opus 4.6・GPT-5.4・Gemini 3.1 Proに対しエージェント駆動コーディングと推論で互角以上を主張。Flashは性能を捨てる代わりに、トークン単価をオープン勢の最下層に置きにきている。
採用時の見方
Huawei Ascendとの最適化が前提なので、自前GPU運用なら効率は下がる可能性がある。長文脈での回帰、ツール呼び出し完遂率、Flashとの混在運用のコスト効率の3点で測ると差が見える。