AI Frontier Radar | AI開発ツール・モデル・エージェントの日本語速報

2026.05.29

5本

LiteLLM が MCP の OAuth ネイティブ対応へ｜Cursor 経由の認可フローを取り込み

BerriAI/litellm の5月リリース系列に、MCP の OAuth を Cursor 経由でネイティブに通す対応が入った。Google Interactions API ステップスキーマへの移行や Vertex AI 関連の修正も同梱され、AI ゲートウェイ層から外部MCPへの安全な接続が整いつつある。

MCP ゲートウェイを「LLM ゲートウェイの一機能」として運用する構成が選択肢に入る。

Anthropic Compliance API

速報 Security anthropics/anthropic-sdk-python

Anthropic が Claude Compliance API を拡張｜28社のセキュリティ・コンプライアンス基盤と直結

Anthropic は Claude Compliance API に CrowdStrike・Okta・Palo Alto・Wiz・Zscaler を含む28社の統合を追加。会話本文と Claude Enterprise / Platform の活動ログを SIEM・DLP・SASE・ID 管理基盤からプログラム的に取得できる前提が整った。

Claude を社内で広げる際、セキュリティ・法務との合意材料が公式に揃う。

OpenAI DeployCo

速報 AI Companies openai/openai-python

OpenAI が $4B 規模の「DeployCo」を分社化｜TPG 主導で19社が出資、Goldman・Bain・McKinsey が並ぶ

OpenAI は5月28日、企業向け導入コンサルを担う子会社「OpenAI Deployment Company（DeployCo）」を立ち上げ。TPG が主導する19社のコンソーシアムから40億ドル超の初期資本を調達し、Goldman Sachs・Bain Capital・McKinsey・Capgemini が共同出資者として並ぶ。

企業導入の主導権を「コンサル × モデル」軸で取りに来る動き。RFP 出し直しの引き金になり得る。

Claude Code v2.1.153

速報 Tools anthropics/claude-code

Claude Code v2.1.153 が公開｜skipLfs と MCP サーバ認証のセキュリティ修正、36変更

anthropics/claude-code v2.1.153 が5月28日にリリース。github/git プラグインに skipLfs を追加、MCP サーバ・API ゲートウェイの認証セキュリティ修正、status line に COLUMNS/LINES の環境変数提供、background agent の挙動改善など、合計36件の変更を含む。

MCPサーバを社内で運用しているなら、認証修正の取り込みは今週中に。

Anthropic Opus 4.8

速報 LLM Models anthropics/anthropic-sdk-python

Claude Opus 4.8 が公開｜SWE-bench Pro 69.2%、Fast モードが3倍安く・速く

Anthropic が5月28日に Claude Opus 4.8 を公開。SWE-bench Pro 69.2%、SWE-bench Verified 88.6%、Online-Mind2Web 84% と前世代を上回り、Fast モードは2.5倍速・3倍安に。整合性も「Mythos Preview に並ぶ」と報告。

コーディング常用モデルの基準値が一段上がる。社内の評価セット・コスト見積もりを更新するタイミング。

2026.04.29

1本

Managed Agents June GA

速報 Agent anthropics/anthropic-cookbook

Anthropic Managed Agents が6月GA｜長時間タスク運用の次段階へ

Anthropic が Managed Agents サービスを6月全般提供と公表。24時間以上の長時間自動実行、エラー時の自動リトライ、実行ログの監査機能が標準組み込み。

長時間エージェント運用の運用責任がClaudeに移る転機。

2026.04.27

3本

Workspace Studio No-Code Agents

解説 Practice google/agent-development-kit

Google Workspace Studio｜Gmail・Docs・Sheetsを跨ぐ自然言語自動化が一般入り

Google Cloud Next 2026で発表されたWorkspace Studioが、Gmail・Docs・Sheets・Drive・Meet・Chatを跨ぐ業務エージェントをノーコードで作れる土台に。「毎週金曜にトラッカーを更新せよ」と書けばGeminiが自動化を組む。

ノーコード業務エージェントの「権限と監査」をどこから決めるかが先取りで整理できる

Coding CLI Kimi Code K2.6

速報 Tools MoonshotAI/Kimi-K2

Moonshot Kimi Code K2.6が一般公開｜CLIでマルチステップ開発を回す中華系の対抗馬

MoonshotがKimi Code K2.6を全Kimi Code加入者に開放。K2.5基盤をコーディング向けに調整し、CLIから書き直し・デバッグ・リファクタ・複数ステップ実装を回す構成で、Claude Code・Codex・Gemini CLIに並ぶ第5の選択肢が立ち上がる。

コーディングCLIの選択肢に中華系が加わったことで、料金・データ所在の比較軸が立つ

Capital Move Google × Anthropic

速報 AI Companies anthropics/anthropic-cookbook

GoogleがAnthropicに最大400億ドル｜「クラウド両足」の構図が確定する

Googleが、Anthropicに最大400億ドルを投じる方針を発表。即時100億、残り300億は業績マイルストーン連動。Cloud Next 2026のGemini Enterprise発表と並び、自社モデルとAnthropicの両足で回す構図が確定する。

GoogleがGemini単体ではなくAnthropicと両足で進む選択が、調達と契約の前提を変える

2026.04.26

2本

Cloud Next 2026 Gemini Enterprise

速報 Agent google/agent-development-kit

GoogleがVertex AIをGemini Enterprise Agent Platformに改称｜A2A 1.2が本番150社へ

Google Cloud Next 2026でVertex AIがGemini Enterprise Agent Platformに改称。Agent Studio・Registry・Identity・Gatewayを一式で揃え、A2Aプロトコル1.2は本番150社で稼働。エンタープライズ・エージェント基盤の正面競合がそろう。

エンタープライズ・エージェント基盤の三つ巴（Google／OpenAI／Anthropic）の輪郭を確認できる

ChatGPT Business Workspace Agents

速報 AI Companies openai/openai-python

OpenAIがChatGPT Businessにワークスペースエージェント｜Slack・Gmailを横断する自動化

OpenAIがChatGPT Business・Enterprise・教育向けにワークスペースエージェントを公開。Slack・Gmailなどのツールを跨いだ作業を、エージェントとしてチームで作って共有できる。エンタープライズSaaS連携の主戦場が確定する。

Slack・Gmailを跨ぐ業務エージェントがチーム共有の単位として標準化する

2026.04.25

7本

Enterprise MCP Pinterest

分析 AI Connectors modelcontextprotocol/servers

Pinterestが本番MCPエコシステムを公開｜社内ツールを横断するエージェント運用

Pinterestがエンジニアリングチームで MCP サーバー群を本番投入したことを明らかに。社内ツールを横断したエージェント運用の構成と監視の置き方が、企業導入の参考実装になる。

MCPを社内に展開する時のレイヤ分けと監視の選び方が整理できる

Open Weights DeepSeek V4

速報 LLM Models deepseek-ai/DeepSeek-V4

DeepSeek V4 Pro/Flash登場｜1.6Tパラメータと低価格の二段構え

DeepSeekがV4をプレビュー公開。1.6TパラメータのProと小型・廉価のFlashを同時に出し、100万トークンのコンテキストとHuawei Ascendとの密結合を売りにする。

巨大コンテキストと低価格のどちらに賭けるかの判断材料が揃う

Active Threats 10 IPI Payloads

分析 Security owasp/llm-security

現実に出回る間接プロンプトインジェクション10種｜エージェント運用への直接の脅威

セキュリティ研究者が4月23日に、実環境のエージェントを狙った間接プロンプトインジェクションのペイロード10種を公開。API鍵窃取・データ破壊・金融詐欺を狙う具体例で、運用側の前提が崩れる。

実際に観測されたペイロードを基に、運用での防御線を引き直せる

AI IDE Cursor 3

速報 Tools getcursor/cursor

Cursor 3が並列エージェントIDEに踏み切る｜Composer 2とDesign Mode

Cursor 3が4月2日に登場。複数エージェントを並列で走らせるAgents Window、自社モデルComposer 2、UIを直接いじれるDesign Modeが目玉で、IDEの位置づけが変わる。

並列エージェントを前提にしたIDEに切り替える価値が見える

Claude Desk Ultraplan

解説 Tools anthropics/claude-code

Claude CodeにUltraplanとMonitor｜長尺タスクの設計と監視が一体化

Claude Codeの4月アップデートでUltraplanとMonitorが入った。CLIから出した計画をWebで編集してリモート実行に流せ、長時間タスクの背景イベントを会話上で追える。

ローカルとリモートを跨ぐエージェント運用の組み立て方が見える

Coding Agent Codex 2026

速報 Tools openai/codex

OpenAI Codexが大幅刷新｜プラグインとマルチモーダルでエージェント寄りに

OpenAIがCodexをアップデート。プラグイン拡張、マルチモーダル入力、より自律的なエージェントモードが入り、Claude CodeやCursor 3が並ぶエージェントIDE市場での反撃と位置づけられる。

Claude Code・Cursorと並ぶ三つ巴で、Codexの強みと弱みが整理できる

Agent Risk Sandbox Escape

分析 Security google/antigravity

Antigravity IDEで起きたサンドボックス脱出｜エージェントIDEの境界が問われる

Pillar SecurityがGoogleのAntigravity IDEでプロンプトインジェクション経由のサンドボックス脱出を報告。エージェントIDE全般で「境界の引き方」が再点検される。

エージェントIDE運用で何を境界にすべきかが整理できる

2026.04.24

5本

Claude Desk Opus 4.7 Arrives

速報 LLM Models anthropic/claude

Claude Opus 4.7が来た｜長時間コーディングに効く改善は何か

長時間にわたる複雑なコーディングと画像の高解像度認識が主な改善点。全製品と主要クラウドで利用可能になっている。

どのタスクで入れ替えると効くかの判断材料が揃う

OpenAI Lab GPT-5.5 Agent

速報 AI Companies openai/gpt-5-5

GPT-5.5はエージェント前提の設計｜乗り換え判断の見どころ

OpenAIがGPT-5.5を公開。複数ツールを自律的に切り替えるエージェント志向を前面に出した設計で、ベンチマークも競合を上回るとされる。

チャット品質ではなくツール連鎖の完遂率で判断する意味が見える

Protocol MCP Roadmap 26

分析 AI Connectors modelcontextprotocol/specification

MCP 2026ロードマップ｜企業導入で効く4つの優先領域

MCPの2026ロードマップが公開。Transport・エージェント間通信・ガバナンス・エンタープライズ対応の4領域に優先度が絞られている。

自社のMCP運用がどの優先領域と接続するかを読み取れる

Agent Stack AF 1.0 Ships

速報 Agent microsoft/agent-framework

Microsoft Agent Framework 1.0がGA｜AutoGen/Semantic Kernelを統合

MicrosoftがAgent Framework 1.0を本番対応で公開。Semantic KernelとAutoGenを1本のOSSに統合し、.NETとPythonを同じAPIで扱えるようになった。

既存のSemantic Kernel/AutoGen資産の移行判断に必要な情報が見える

Security Indirect Injection

分析 Security security/prompt-injection

間接プロンプトインジェクションが現実の事故になった話

PRの説明欄に埋めた命令からCopilotが任意コードを実行できたCVE-2025-53773と、Microsoft 365 CopilotのEchoLeakが、間接インジェクションを理論から実害側に動かした。

自社のエージェントがどこから命令を吸い込む設計かを見直せる

2026.04.19

5本

Model Pricing Price Reset 2026

速報 LLM Models market/model-pricing

モデル料金が下がっても総額が増える理由｜2026年春のコスト再点検

API単価の値下げが続く一方で、呼び出し回数の増加とワークフローの複雑化で請求額はむしろ膨らみやすくなっている。

単価ではなく運用設計が支出を左右することが見えてくる

Claude Desk Shared Memory

解説 Practice anthropic/claude-code

Claude Codeをチームで回すための共有メモ設計

個人利用では快適でも、チームで回し始めた瞬間に差が出るのが共有メモの持ち方。出力のばらつきとレビュー負荷を減らすための基本を整理する。

ツールそのものより、チーム運用の設計が定着率を決める

LLM Watch Small Models

分析 LLM Models open-weights/reasoning-stack

小型推論モデルはどこまで実務に入るのか

小型モデルは補助要員ではなく、実務ワークフローの第一走者として採用され始めている。品質、速度、コストの境界線を整理する。

小型モデルの役割を正しく切り分けるとコストと速度の両方が改善する

Agent Watch Inbox Agents

速報 Agent ops/inbox-agent-playbook

Inbox型エージェントが定着し始めた理由

リアルタイムの対話より、タスクがたまった時点でまとめて処理するInbox型の運用が増えている。人のリズムを壊さない使い方として注目される。

AIエージェントの運用が会話中心から業務中心へ移っていることが分かる

MCP Desk Permission Ledger

分析 AI Connectors mcp/permission-ledger

MCPサーバーが増えた時に最初に作るべき権限台帳

MCPはつなぐことより整理することの方が難しい。誰が何に触れるかを見える化する最小構成をまとめる。

導入の速さより、権限設計の透明性が重要だと分かる

2026.04.18

5本

Browser Ops Fail-safes

解説 Agent operator/browser-ops

ブラウザ操作エージェントの暴走を防ぐフェイルセーフ設計

ブラウザ自動操作は便利だが、速さより止め方の設計が重要。人の確認を残しながら事故率を下げるための基本を整理する。

自律操作の価値は止め方の設計とセットでしか出ない

OpenAI Desk First 3 Paths

解説 Practice openai/codex

OpenAI系ツールを仕事に入れる時の最初の3導線

すべてを置き換えるのではなく、下準備だけを任せるところから始める。OpenAI系ツールを実務に入れるための入口を整理する。

ツール導入を大きな変革ではなく小さな改善として始められる

RAG Guide Citation First

解説 Practice rag-lab/citation-first

引用が壊れないRAGを最短で組む：citation-first構成

RAGは検索速度より、根拠の見せ方を先に整えた方が信頼される。citation-firstの考え方と最小構成を整理する。

RAGの信頼性は検索精度だけでなく引用の壊れにくさで決まる

Tool Watch Spring Toolbelt

速報 Tools toolbelt/spring-2026

AI開発ツールの新定番12選｜2026年春版

万能な1本より、既存の作業を少しだけ速くする小さな道具が強くなっている。今の仕事に挟みやすいツールを整理する。

今の仕事に足しやすい道具ほど長く使われることが分かる

MCP Rollout Remote Onboarding

速報 AI Connectors mcp/remote-connectors

リモートMCPの社内展開で増えた初期トラブル5つ

接続方式より、標準構成と説明不足が混乱の原因になりやすい。社内展開の初期に起きる失敗をまとめる。

MCPの社内導入は接続より説明設計が重要だと分かる

2026.04.17

2本

Security Watch CLI Baselines

速報 Security security/cli-baselines

CLIアシスタントを安全に使うための最小セキュリティ基準

便利さを優先すると、ローカル権限と機密情報に近い分だけ事故も速い。チーム利用で最低限そろえたい基準を整理する。

便利さと安全性のバランスを現実的なラインで設計できる

Claude Teams Review Queue

分析 Practice anthropic/claude-code

Claude Codeのレビュー待ちを減らすチェックリスト運用

生成速度が上がるほど、次に詰まるのはレビュー工程。確認を速くするための観点整理と運用パターンをまとめる。

出力速度よりレビュー設計の方がボトルネックになりやすい

Claude Opus 4.8 が公開｜SWE-bench Pro 69.2%、Fast モードが3倍安く・速く

いま読まれている記事

GoogleがVertex AIをGemini Enterprise Agent Platformに改称｜A2A 1.2が本番150社へ

DeepSeek V4 Pro/Flash登場｜1.6Tパラメータと低価格の二段構え

Claude Opus 4.7が来た｜長時間コーディングに効く改善は何か

モデル料金が下がっても総額が増える理由｜2026年春のコスト再点検

いま押さえる速報

Claude Opus 4.8 が公開｜SWE-bench Pro 69.2%、Fast モードが3倍安く・速く

Claude Opus 4.7が来た｜長時間コーディングに効く改善は何か

モデル料金が下がっても総額が増える理由｜2026年春のコスト再点検

Inbox型エージェントが定着し始めた理由

CLIアシスタントを安全に使うための最小セキュリティ基準

背景ごと理解したいテーマ

Claude Codeをチームで回すための共有メモ設計

小型推論モデルはどこまで実務に入るのか

ブラウザ操作エージェントの暴走を防ぐフェイルセーフ設計

GoogleがVertex AIをGemini Enterprise Agent Platformに改称｜A2A 1.2が本番150社へ

テーマから追う

日付で追う

2026.05.29

LiteLLM が MCP の OAuth ネイティブ対応へ｜Cursor 経由の認可フローを取り込み

Anthropic が Claude Compliance API を拡張｜28社のセキュリティ・コンプライアンス基盤と直結

OpenAI が $4B 規模の「DeployCo」を分社化｜TPG 主導で19社が出資、Goldman・Bain・McKinsey が並ぶ

Claude Code v2.1.153 が公開｜skipLfs と MCP サーバ認証のセキュリティ修正、36変更

Claude Opus 4.8 が公開｜SWE-bench Pro 69.2%、Fast モードが3倍安く・速く

2026.04.29

Anthropic Managed Agents が6月GA｜長時間タスク運用の次段階へ

2026.04.27

Google Workspace Studio｜Gmail・Docs・Sheetsを跨ぐ自然言語自動化が一般入り

Moonshot Kimi Code K2.6が一般公開｜CLIでマルチステップ開発を回す中華系の対抗馬

GoogleがAnthropicに最大400億ドル｜「クラウド両足」の構図が確定する

2026.04.26

GoogleがVertex AIをGemini Enterprise Agent Platformに改称｜A2A 1.2が本番150社へ

OpenAIがChatGPT Businessにワークスペースエージェント｜Slack・Gmailを横断する自動化

2026.04.25

Pinterestが本番MCPエコシステムを公開｜社内ツールを横断するエージェント運用

DeepSeek V4 Pro/Flash登場｜1.6Tパラメータと低価格の二段構え

現実に出回る間接プロンプトインジェクション10種｜エージェント運用への直接の脅威

Cursor 3が並列エージェントIDEに踏み切る｜Composer 2とDesign Mode

Claude CodeにUltraplanとMonitor｜長尺タスクの設計と監視が一体化

OpenAI Codexが大幅刷新｜プラグインとマルチモーダルでエージェント寄りに

Antigravity IDEで起きたサンドボックス脱出｜エージェントIDEの境界が問われる

2026.04.24

Claude Opus 4.7が来た｜長時間コーディングに効く改善は何か

GPT-5.5はエージェント前提の設計｜乗り換え判断の見どころ

MCP 2026ロードマップ｜企業導入で効く4つの優先領域

Microsoft Agent Framework 1.0がGA｜AutoGen/Semantic Kernelを統合

間接プロンプトインジェクションが現実の事故になった話

2026.04.19

モデル料金が下がっても総額が増える理由｜2026年春のコスト再点検

Claude Codeをチームで回すための共有メモ設計

小型推論モデルはどこまで実務に入るのか

Inbox型エージェントが定着し始めた理由

MCPサーバーが増えた時に最初に作るべき権限台帳

2026.04.18

ブラウザ操作エージェントの暴走を防ぐフェイルセーフ設計

OpenAI系ツールを仕事に入れる時の最初の3導線

引用が壊れないRAGを最短で組む：citation-first構成

AI開発ツールの新定番12選｜2026年春版

リモートMCPの社内展開で増えた初期トラブル5つ

2026.04.17

CLIアシスタントを安全に使うための最小セキュリティ基準

Claude Codeのレビュー待ちを減らすチェックリスト運用

タグから横断して読む

五分で追い、十分で深める。