今日の変化だけを短く把握する
注目
いま読まれている記事
#2
GoogleがVertex AIをGemini Enterprise Agent Platformに改称|A2A 1.2が本番150社へ
速報 Agent#3
DeepSeek V4 Pro/Flash登場|1.6Tパラメータと低価格の二段構え
速報 LLM Models#4
Claude Opus 4.7が来た|長時間コーディングに効く改善は何か
速報 LLM Models#5
モデル料金が下がっても総額が増える理由|2026年春のコスト再点検
速報 LLM Models速報
いま押さえる速報
編集部撰
背景ごと理解したいテーマ
Claude Codeをチームで回すための共有メモ設計
個人利用では快適でも、チームで回し始めた瞬間に差が出るのが共有メモの持ち方。出力のばらつきとレビュー負荷を減らすための基本を整理する。
anthropic/claude-code小型推論モデルはどこまで実務に入るのか
小型モデルは補助要員ではなく、実務ワークフローの第一走者として採用され始めている。品質、速度、コストの境界線を整理する。
open-weights/reasoning-stackブラウザ操作エージェントの暴走を防ぐフェイルセーフ設計
ブラウザ自動操作は便利だが、速さより止め方の設計が重要。人の確認を残しながら事故率を下げるための基本を整理する。
operator/browser-opsGoogleがVertex AIをGemini Enterprise Agent Platformに改称|A2A 1.2が本番150社へ
Google Cloud Next 2026でVertex AIがGemini Enterprise Agent Platformに改称。Agent Studio・Registry・Identity・Gatewayを一式で揃え、A2Aプロトコル1.2は本番150社で稼働。エンタープライズ・エージェント基盤の正面競合がそろう。
google/agent-development-kit主題
テーマから追う
綴じ込み
日付で追う
2026.05.29
5本LiteLLM が MCP の OAuth ネイティブ対応へ|Cursor 経由の認可フローを取り込み
BerriAI/litellm の5月リリース系列に、MCP の OAuth を Cursor 経由でネイティブに通す対応が入った。Google Interactions API ステップスキーマへの移行や Vertex AI 関連の修正も同梱され、AI ゲートウェイ層から外部MCPへの安全な接続が整いつつある。
MCP ゲートウェイを「LLM ゲートウェイの一機能」として運用する構成が選択肢に入る。Anthropic が Claude Compliance API を拡張|28社のセキュリティ・コンプライアンス基盤と直結
Anthropic は Claude Compliance API に CrowdStrike・Okta・Palo Alto・Wiz・Zscaler を含む28社の統合を追加。会話本文と Claude Enterprise / Platform の活動ログを SIEM・DLP・SASE・ID 管理基盤からプログラム的に取得できる前提が整った。
Claude を社内で広げる際、セキュリティ・法務との合意材料が公式に揃う。OpenAI が $4B 規模の「DeployCo」を分社化|TPG 主導で19社が出資、Goldman・Bain・McKinsey が並ぶ
OpenAI は5月28日、企業向け導入コンサルを担う子会社「OpenAI Deployment Company(DeployCo)」を立ち上げ。TPG が主導する19社のコンソーシアムから40億ドル超の初期資本を調達し、Goldman Sachs・Bain Capital・McKinsey・Capgemini が共同出資者として並ぶ。
企業導入の主導権を「コンサル × モデル」軸で取りに来る動き。RFP 出し直しの引き金になり得る。Claude Code v2.1.153 が公開|skipLfs と MCP サーバ認証のセキュリティ修正、36変更
anthropics/claude-code v2.1.153 が5月28日にリリース。github/git プラグインに skipLfs を追加、MCP サーバ・API ゲートウェイの認証セキュリティ修正、status line に COLUMNS/LINES の環境変数提供、background agent の挙動改善など、合計36件の変更を含む。
MCPサーバを社内で運用しているなら、認証修正の取り込みは今週中に。Claude Opus 4.8 が公開|SWE-bench Pro 69.2%、Fast モードが3倍安く・速く
Anthropic が5月28日に Claude Opus 4.8 を公開。SWE-bench Pro 69.2%、SWE-bench Verified 88.6%、Online-Mind2Web 84% と前世代を上回り、Fast モードは2.5倍速・3倍安に。整合性も「Mythos Preview に並ぶ」と報告。
コーディング常用モデルの基準値が一段上がる。社内の評価セット・コスト見積もりを更新するタイミング。2026.04.29
1本2026.04.27
3本Google Workspace Studio|Gmail・Docs・Sheetsを跨ぐ自然言語自動化が一般入り
Google Cloud Next 2026で発表されたWorkspace Studioが、Gmail・Docs・Sheets・Drive・Meet・Chatを跨ぐ業務エージェントをノーコードで作れる土台に。「毎週金曜にトラッカーを更新せよ」と書けばGeminiが自動化を組む。
ノーコード業務エージェントの「権限と監査」をどこから決めるかが先取りで整理できるMoonshot Kimi Code K2.6が一般公開|CLIでマルチステップ開発を回す中華系の対抗馬
MoonshotがKimi Code K2.6を全Kimi Code加入者に開放。K2.5基盤をコーディング向けに調整し、CLIから書き直し・デバッグ・リファクタ・複数ステップ実装を回す構成で、Claude Code・Codex・Gemini CLIに並ぶ第5の選択肢が立ち上がる。
コーディングCLIの選択肢に中華系が加わったことで、料金・データ所在の比較軸が立つGoogleがAnthropicに最大400億ドル|「クラウド両足」の構図が確定する
Googleが、Anthropicに最大400億ドルを投じる方針を発表。即時100億、残り300億は業績マイルストーン連動。Cloud Next 2026のGemini Enterprise発表と並び、自社モデルとAnthropicの両足で回す構図が確定する。
GoogleがGemini単体ではなくAnthropicと両足で進む選択が、調達と契約の前提を変える2026.04.26
2本GoogleがVertex AIをGemini Enterprise Agent Platformに改称|A2A 1.2が本番150社へ
Google Cloud Next 2026でVertex AIがGemini Enterprise Agent Platformに改称。Agent Studio・Registry・Identity・Gatewayを一式で揃え、A2Aプロトコル1.2は本番150社で稼働。エンタープライズ・エージェント基盤の正面競合がそろう。
エンタープライズ・エージェント基盤の三つ巴(Google/OpenAI/Anthropic)の輪郭を確認できるOpenAIがChatGPT Businessにワークスペースエージェント|Slack・Gmailを横断する自動化
OpenAIがChatGPT Business・Enterprise・教育向けにワークスペースエージェントを公開。Slack・Gmailなどのツールを跨いだ作業を、エージェントとしてチームで作って共有できる。エンタープライズSaaS連携の主戦場が確定する。
Slack・Gmailを跨ぐ業務エージェントがチーム共有の単位として標準化する2026.04.25
7本Pinterestが本番MCPエコシステムを公開|社内ツールを横断するエージェント運用
Pinterestがエンジニアリングチームで MCP サーバー群を本番投入したことを明らかに。社内ツールを横断したエージェント運用の構成と監視の置き方が、企業導入の参考実装になる。
MCPを社内に展開する時のレイヤ分けと監視の選び方が整理できるDeepSeek V4 Pro/Flash登場|1.6Tパラメータと低価格の二段構え
DeepSeekがV4をプレビュー公開。1.6TパラメータのProと小型・廉価のFlashを同時に出し、100万トークンのコンテキストとHuawei Ascendとの密結合を売りにする。
巨大コンテキストと低価格のどちらに賭けるかの判断材料が揃う現実に出回る間接プロンプトインジェクション10種|エージェント運用への直接の脅威
セキュリティ研究者が4月23日に、実環境のエージェントを狙った間接プロンプトインジェクションのペイロード10種を公開。API鍵窃取・データ破壊・金融詐欺を狙う具体例で、運用側の前提が崩れる。
実際に観測されたペイロードを基に、運用での防御線を引き直せるCursor 3が並列エージェントIDEに踏み切る|Composer 2とDesign Mode
Cursor 3が4月2日に登場。複数エージェントを並列で走らせるAgents Window、自社モデルComposer 2、UIを直接いじれるDesign Modeが目玉で、IDEの位置づけが変わる。
並列エージェントを前提にしたIDEに切り替える価値が見えるClaude CodeにUltraplanとMonitor|長尺タスクの設計と監視が一体化
Claude Codeの4月アップデートでUltraplanとMonitorが入った。CLIから出した計画をWebで編集してリモート実行に流せ、長時間タスクの背景イベントを会話上で追える。
ローカルとリモートを跨ぐエージェント運用の組み立て方が見えるOpenAI Codexが大幅刷新|プラグインとマルチモーダルでエージェント寄りに
OpenAIがCodexをアップデート。プラグイン拡張、マルチモーダル入力、より自律的なエージェントモードが入り、Claude CodeやCursor 3が並ぶエージェントIDE市場での反撃と位置づけられる。
Claude Code・Cursorと並ぶ三つ巴で、Codexの強みと弱みが整理できるAntigravity IDEで起きたサンドボックス脱出|エージェントIDEの境界が問われる
Pillar SecurityがGoogleのAntigravity IDEでプロンプトインジェクション経由のサンドボックス脱出を報告。エージェントIDE全般で「境界の引き方」が再点検される。
エージェントIDE運用で何を境界にすべきかが整理できる2026.04.24
5本Claude Opus 4.7が来た|長時間コーディングに効く改善は何か
長時間にわたる複雑なコーディングと画像の高解像度認識が主な改善点。全製品と主要クラウドで利用可能になっている。
どのタスクで入れ替えると効くかの判断材料が揃うGPT-5.5はエージェント前提の設計|乗り換え判断の見どころ
OpenAIがGPT-5.5を公開。複数ツールを自律的に切り替えるエージェント志向を前面に出した設計で、ベンチマークも競合を上回るとされる。
チャット品質ではなくツール連鎖の完遂率で判断する意味が見えるMCP 2026ロードマップ|企業導入で効く4つの優先領域
MCPの2026ロードマップが公開。Transport・エージェント間通信・ガバナンス・エンタープライズ対応の4領域に優先度が絞られている。
自社のMCP運用がどの優先領域と接続するかを読み取れるMicrosoft Agent Framework 1.0がGA|AutoGen/Semantic Kernelを統合
MicrosoftがAgent Framework 1.0を本番対応で公開。Semantic KernelとAutoGenを1本のOSSに統合し、.NETとPythonを同じAPIで扱えるようになった。
既存のSemantic Kernel/AutoGen資産の移行判断に必要な情報が見える間接プロンプトインジェクションが現実の事故になった話
PRの説明欄に埋めた命令からCopilotが任意コードを実行できたCVE-2025-53773と、Microsoft 365 CopilotのEchoLeakが、間接インジェクションを理論から実害側に動かした。
自社のエージェントがどこから命令を吸い込む設計かを見直せる2026.04.19
5本モデル料金が下がっても総額が増える理由|2026年春のコスト再点検
API単価の値下げが続く一方で、呼び出し回数の増加とワークフローの複雑化で請求額はむしろ膨らみやすくなっている。
単価ではなく運用設計が支出を左右することが見えてくるClaude Codeをチームで回すための共有メモ設計
個人利用では快適でも、チームで回し始めた瞬間に差が出るのが共有メモの持ち方。出力のばらつきとレビュー負荷を減らすための基本を整理する。
ツールそのものより、チーム運用の設計が定着率を決める小型推論モデルはどこまで実務に入るのか
小型モデルは補助要員ではなく、実務ワークフローの第一走者として採用され始めている。品質、速度、コストの境界線を整理する。
小型モデルの役割を正しく切り分けるとコストと速度の両方が改善するInbox型エージェントが定着し始めた理由
リアルタイムの対話より、タスクがたまった時点でまとめて処理するInbox型の運用が増えている。人のリズムを壊さない使い方として注目される。
AIエージェントの運用が会話中心から業務中心へ移っていることが分かるMCPサーバーが増えた時に最初に作るべき権限台帳
MCPはつなぐことより整理することの方が難しい。誰が何に触れるかを見える化する最小構成をまとめる。
導入の速さより、権限設計の透明性が重要だと分かる2026.04.18
5本ブラウザ操作エージェントの暴走を防ぐフェイルセーフ設計
ブラウザ自動操作は便利だが、速さより止め方の設計が重要。人の確認を残しながら事故率を下げるための基本を整理する。
自律操作の価値は止め方の設計とセットでしか出ないOpenAI系ツールを仕事に入れる時の最初の3導線
すべてを置き換えるのではなく、下準備だけを任せるところから始める。OpenAI系ツールを実務に入れるための入口を整理する。
ツール導入を大きな変革ではなく小さな改善として始められる引用が壊れないRAGを最短で組む:citation-first構成
RAGは検索速度より、根拠の見せ方を先に整えた方が信頼される。citation-firstの考え方と最小構成を整理する。
RAGの信頼性は検索精度だけでなく引用の壊れにくさで決まるAI開発ツールの新定番12選|2026年春版
万能な1本より、既存の作業を少しだけ速くする小さな道具が強くなっている。今の仕事に挟みやすいツールを整理する。
今の仕事に足しやすい道具ほど長く使われることが分かるリモートMCPの社内展開で増えた初期トラブル5つ
接続方式より、標準構成と説明不足が混乱の原因になりやすい。社内展開の初期に起きる失敗をまとめる。
MCPの社内導入は接続より説明設計が重要だと分かる2026.04.17
2本索引
タグから横断して読む
読み方
五分で追い、十分で深める。
速報で変化をつかみ、気になる話題だけを解説で深く読む。継続して追う分野はテーマとタグに残して、必要なときだけ見返す。
比較や使いどころを読んで判断する
継続監視はテーマとタグに預ける