<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI Frontier Radar</title><description>AI企業、モデル、エージェント、開発ツール、コネクタの動きを日本語で短く追えるニュースアーカイブ。速報と解説を分けて、必要な話題だけ深掘りできる構成。</description><link>https://frontier-radar.com/</link><item><title>LiteLLM が MCP の OAuth ネイティブ対応へ｜Cursor 経由の認可フローを取り込み</title><link>https://frontier-radar.com/news/litellm-native-mcp-oauth-may-2026/</link><guid isPermaLink="true">https://frontier-radar.com/news/litellm-native-mcp-oauth-may-2026/</guid><description>BerriAI/litellm の5月リリース系列に、MCP の OAuth を Cursor 経由でネイティブに通す対応が入った。Google Interactions API ステップスキーマへの移行や Vertex AI 関連の修正も同梱され、AI ゲートウェイ層から外部MCPへの安全な接続が整いつつある。</description><pubDate>Fri, 29 May 2026 03:30:00 GMT</pubDate><content:encoded>&lt;h2 id=&quot;何が変わったか&quot;&gt;何が変わったか&lt;/h2&gt;
&lt;p&gt;BerriAI/litellm の v1.83 系の継続リリースに、MCP の OAuth を Cursor 経由でネイティブに通す対応が入った。これまで MCP サーバ側で OAuth を組む・別途プロキシを置く・各クライアント側で個別に認可フローを持つ、といった選択肢に分かれていた認可周りを、LLM ゲートウェイ層に吸収する形だ。同リリース系列では Google Interactions API のステップスキーマへの移行、Vertex AI 関連の修正、プロキシ機能のバグ修正もまとめて入っている。&lt;/p&gt;
&lt;h2 id=&quot;組み込み方の選択肢&quot;&gt;組み込み方の選択肢&lt;/h2&gt;
&lt;p&gt;既に LiteLLM をマルチプロバイダの中継として使っているなら、MCP の認可と LLM 呼び出しの両方を同じゲートウェイで束ねる構成が現実的になる。CrowdStrike / Okta / Zscaler 側のポリシーが LLM ゲートウェイの出入口に効くなら、MCP の経路も自動で同じ統制下に乗る。新規で MCP サーバを社外公開する案件では、認可は LiteLLM 側に寄せ、MCP サーバ自体は OAuth を直接組まずに済ませる、という設計が選べる。&lt;/p&gt;</content:encoded></item><item><title>Anthropic が Claude Compliance API を拡張｜28社のセキュリティ・コンプライアンス基盤と直結</title><link>https://frontier-radar.com/news/claude-compliance-api-28-integrations/</link><guid isPermaLink="true">https://frontier-radar.com/news/claude-compliance-api-28-integrations/</guid><description>Anthropic は Claude Compliance API に CrowdStrike・Okta・Palo Alto・Wiz・Zscaler を含む28社の統合を追加。会話本文と Claude Enterprise / Platform の活動ログを SIEM・DLP・SASE・ID 管理基盤からプログラム的に取得できる前提が整った。</description><pubDate>Fri, 29 May 2026 03:00:00 GMT</pubDate><content:encoded>&lt;h2 id=&quot;何が揃ったか&quot;&gt;何が揃ったか&lt;/h2&gt;
&lt;p&gt;Anthropic は Claude Compliance API に28社の統合を追加し、SIEM・DLP・SASE・ID 管理・eDiscovery・AI Observability の各カテゴリに対応した。新規連携は Cloudflare・Cribl・CrowdStrike・Cyera・Datadog・Forcepoint・Fortinet・IBM Guardium・Microsoft Purview・Mimecast・Netskope・Okta・Palo Alto・Proofpoint・Rubrik・SailPoint・Snyk・Sumo Logic・Tenable・Theta Lake・Trellix・Varonis・Wiz・Zscaler ほか。&lt;/p&gt;
&lt;h2 id=&quot;社内導入への効き方&quot;&gt;社内導入への効き方&lt;/h2&gt;
&lt;p&gt;取得できるデータは2系統。Claude Enterprise の会話本文・アップロード・プロジェクトと、Claude Enterprise / Platform 上の活動ログ（ログイン、管理者操作、構成変更）だ。社内で Claude を広げる際、これまで「他SaaSと同じ枠で監査できるか」が壁になっていた事案は、本リリースで一段ほぐれる。既に CrowdStrike・Okta・Palo Alto・Wiz・Zscaler を導入しているなら、Claude を新規 SaaS として登録し直すだけで、既存の検知ルール・ID ライフサイクル・DLP ポリシーを適用できる構成になる。&lt;/p&gt;</content:encoded></item><item><title>OpenAI が $4B 規模の「DeployCo」を分社化｜TPG 主導で19社が出資、Goldman・Bain・McKinsey が並ぶ</title><link>https://frontier-radar.com/news/openai-deployco-consulting-subsidiary/</link><guid isPermaLink="true">https://frontier-radar.com/news/openai-deployco-consulting-subsidiary/</guid><description>OpenAI は5月28日、企業向け導入コンサルを担う子会社「OpenAI Deployment Company（DeployCo）」を立ち上げ。TPG が主導する19社のコンソーシアムから40億ドル超の初期資本を調達し、Goldman Sachs・Bain Capital・McKinsey・Capgemini が共同出資者として並ぶ。</description><pubDate>Fri, 29 May 2026 02:30:00 GMT</pubDate><content:encoded>&lt;h2 id=&quot;何が起きたか&quot;&gt;何が起きたか&lt;/h2&gt;
&lt;p&gt;OpenAI は5月28日、企業向け AI 導入を専業で担う子会社 DeployCo を分社化したと公表した。TPG が主導する19社のコンソーシアムから40億ドル超の初期資本を調達し、Goldman Sachs・Bain Capital・McKinsey・Capgemini が共同出資者に並ぶ。多数派出資は OpenAI 側に残し、コンサル系の収益源を分離する建て付けだ。&lt;/p&gt;
&lt;h2 id=&quot;読みどころ&quot;&gt;読みどころ&lt;/h2&gt;
&lt;p&gt;企業導入は Anthropic × PwC / KPMG の同盟拡大が先行していたが、OpenAI も「モデルだけを売る会社」から「導入運用までを担う会社」へと輪郭を広げる。社内で OpenAI / Anthropic の RFP を回している場合、コンサル経由の導入提案・PoC 期間・サポート単価が一段組み替わる可能性が高い。次の更改タイミングで、コンサル × モデルの組み合わせを再見積もりしておくと、調達側の交渉余地が増える。&lt;/p&gt;</content:encoded></item><item><title>Claude Code v2.1.153 が公開｜skipLfs と MCP サーバ認証のセキュリティ修正、36変更</title><link>https://frontier-radar.com/news/claude-code-v2-1-153-mcp-auth-fixes/</link><guid isPermaLink="true">https://frontier-radar.com/news/claude-code-v2-1-153-mcp-auth-fixes/</guid><description>anthropics/claude-code v2.1.153 が5月28日にリリース。github/git プラグインに skipLfs を追加、MCP サーバ・API ゲートウェイの認証セキュリティ修正、status line に COLUMNS/LINES の環境変数提供、background agent の挙動改善など、合計36件の変更を含む。</description><pubDate>Fri, 29 May 2026 02:00:00 GMT</pubDate><content:encoded>&lt;h2 id=&quot;何が入ったか&quot;&gt;何が入ったか&lt;/h2&gt;
&lt;p&gt;Claude Code v2.1.153 がリリースされた（CHANGELOG 上で36件の変更）。中身は機能追加少なめ・既存挙動の修正中心で、運用に効くトピックが3つある。1つ目は github/git プラグインの &lt;code&gt;skipLfs&lt;/code&gt; オプション追加で、Git LFS のダウンロードを clone・update 時にスキップでき、CI でのリポジトリ取得時間と帯域を抑えられる。2つ目は MCP サーバ・API ゲートウェイ周りの認証セキュリティ修正。3つ目は status line コマンドに COLUMNS / LINES 環境変数が渡るようになり、ターミナル幅に応じた出力整形ができる。&lt;/p&gt;
&lt;h2 id=&quot;取り込みの優先度&quot;&gt;取り込みの優先度&lt;/h2&gt;
&lt;p&gt;MCP サーバを社内で運用しているチームは、本リリースの認証修正分が一番効くので、今週中に v2.1.153 以降へ揃えておきたい。CIランナーやnpm のグローバル導入が更新を取りこぼしている場合に、起動時に1回だけ通知が出るようになり、&lt;code&gt;/doctor&lt;/code&gt; で対処手順が見えるようになった。サブエージェントの自動補完にネイティブのスラッシュコマンド・skill が並ぶようになった点も、日々の打鍵を減らす副次的な利点だ。&lt;/p&gt;</content:encoded></item><item><title>Claude Opus 4.8 が公開｜SWE-bench Pro 69.2%、Fast モードが3倍安く・速く</title><link>https://frontier-radar.com/news/claude-opus-4-8-launch/</link><guid isPermaLink="true">https://frontier-radar.com/news/claude-opus-4-8-launch/</guid><description>Anthropic が5月28日に Claude Opus 4.8 を公開。SWE-bench Pro 69.2%、SWE-bench Verified 88.6%、Online-Mind2Web 84% と前世代を上回り、Fast モードは2.5倍速・3倍安に。整合性も「Mythos Preview に並ぶ」と報告。</description><pubDate>Fri, 29 May 2026 01:30:00 GMT</pubDate><content:encoded>&lt;h2 id=&quot;ベンチマークと価格&quot;&gt;ベンチマークと価格&lt;/h2&gt;
&lt;p&gt;5月28日、Anthropic が Claude Opus 4.8 を公開した。SWE-bench Verified 88.6%（4.7は87.6%）、SWE-bench Pro 69.2%（4.7は64.3%）、Terminal-Bench 2.1 74.6%、Online-Mind2Web は84%でブラウザ操作系も大きく前進。Fast モードは2.5倍速・3倍安、通常価格は $5/M 入力・$25/M 出力で4.7と据え置き。整合性面では「コード中の不備を見逃す確率が4.7比で約1/4、Mythos Preview と同水準」と報告された。&lt;/p&gt;
&lt;h2 id=&quot;移行の見どころ&quot;&gt;移行の見どころ&lt;/h2&gt;
&lt;p&gt;4.7 公開からわずか41日での更新で、Opus 4.7 の評判が振るわなかったこと・Codex / Gemini Flash の追い上げが背景にある。社内で4.7 を使っているなら、まずは既存の評価セットを4.8で回し直し、Fast モードへの切り替えで価格・レイテンシ・品質のトレードオフを取り直すと、移行効果が見えやすい。&lt;/p&gt;</content:encoded></item><item><title>Anthropic Managed Agents が6月GA｜長時間タスク運用の次段階へ</title><link>https://frontier-radar.com/news/anthropic-managed-agents-june-ga/</link><guid isPermaLink="true">https://frontier-radar.com/news/anthropic-managed-agents-june-ga/</guid><description>Anthropic が Managed Agents サービスを6月全般提供と公表。24時間以上の長時間自動実行、エラー時の自動リトライ、実行ログの監査機能が標準組み込み。</description><pubDate>Tue, 28 Apr 2026 23:00:00 GMT</pubDate><content:encoded>&lt;h2 id=&quot;managed-agents-の機能セット&quot;&gt;Managed Agents の機能セット&lt;/h2&gt;
&lt;p&gt;Anthropicが6月1日のGA予定を宣言。Claude Opus 4.6を基盤に、24時間を超える長時間実行、自動リトライ、実行ログ保存・監査が組み込まれる。&lt;/p&gt;
&lt;h2 id=&quot;企業導入のゲートウェイ&quot;&gt;企業導入のゲートウェイ&lt;/h2&gt;
&lt;p&gt;エージェント運用のスケーリング課題（監視・復旧・コスト管理）が製品側に押し付けられる。社内プロセス自動化の計画立案タイミングが変わる。&lt;/p&gt;</content:encoded></item><item><title>Google Workspace Studio｜Gmail・Docs・Sheetsを跨ぐ自然言語自動化が一般入り</title><link>https://frontier-radar.com/explain/google-workspace-studio-no-code-agents/</link><guid isPermaLink="true">https://frontier-radar.com/explain/google-workspace-studio-no-code-agents/</guid><description>Google Cloud Next 2026で発表されたWorkspace Studioが、Gmail・Docs・Sheets・Drive・Meet・Chatを跨ぐ業務エージェントをノーコードで作れる土台に。「毎週金曜にトラッカーを更新せよ」と書けばGeminiが自動化を組む。</description><pubDate>Sun, 26 Apr 2026 21:30:00 GMT</pubDate><content:encoded>&lt;p&gt;Google Cloud Next 2026で発表されたWorkspace Studioが、Gmail・Docs・Sheets・Drive・Meet・Chatを跨ぐ業務エージェントをノーコードで作る前提を整えた。「毎週金曜にトラッカーを更新せよ」と書けば、Geminiが必要な接続と起動条件を自動で組む。&lt;/p&gt;
&lt;h2 id=&quot;何が変わるか&quot;&gt;何が変わるか&lt;/h2&gt;
&lt;p&gt;業務エージェントの作成権限が、開発者から全社員ロールに開放される。OpenAIのChatGPT Workspace AgentsとAnthropicのClaude Managed Agentsに対する応手で、エンドユーザーの距離が一段近づく。&lt;/p&gt;
&lt;h2 id=&quot;入れる前に決めること&quot;&gt;入れる前に決めること&lt;/h2&gt;
&lt;p&gt;ノーコードで横展開できる前提なので、最初に決める3点がそのまま事故の有無を左右する。1）作成・公開のロール分離、2）エージェントが触れるツールの初期スコープ、3）運用ログの保管先。社内ヘルプデスクのように影響が小さい用途から始め、Vertex AI Identity・Gateway側で監査ログを束ねる構成にしておくと、後の権限拡張がやりやすい。&lt;/p&gt;</content:encoded></item><item><title>Moonshot Kimi Code K2.6が一般公開｜CLIでマルチステップ開発を回す中華系の対抗馬</title><link>https://frontier-radar.com/news/kimi-code-k26-coding-cli/</link><guid isPermaLink="true">https://frontier-radar.com/news/kimi-code-k26-coding-cli/</guid><description>MoonshotがKimi Code K2.6を全Kimi Code加入者に開放。K2.5基盤をコーディング向けに調整し、CLIから書き直し・デバッグ・リファクタ・複数ステップ実装を回す構成で、Claude Code・Codex・Gemini CLIに並ぶ第5の選択肢が立ち上がる。</description><pubDate>Sun, 26 Apr 2026 21:00:00 GMT</pubDate><content:encoded>&lt;p&gt;Moonshot AIが4月13日にKimi Code K2.6を全加入者に解放した。K2.5基盤をコーディング向けにチューニングし、ターミナルから自然言語で書き直し・デバッグ・リファクタ・マルチステップ実装まで回す構成になる。&lt;/p&gt;
&lt;h2 id=&quot;立ち位置&quot;&gt;立ち位置&lt;/h2&gt;
&lt;p&gt;Claude Code、OpenAI Codex 2026、Gemini CLI、GitHub Copilot CLIに次ぐ「5つ目」のターミナル発エージェント。中華系として価格・データ所在の議論を変える役割が大きい。&lt;/p&gt;
&lt;h2 id=&quot;比較の軸&quot;&gt;比較の軸&lt;/h2&gt;
&lt;p&gt;4強と並べるときは3点で見ると差が出る。1）レポジトリ全体の文脈追従、2）ツール呼び出しの完遂率、3）データ送信先と契約条件。日本拠点・データの国外送信が問題になる組織は、Moonshot側の地理的な配置とログ保持を確認した上で、検証用ブランチで限定的に使い始めるのが現実的。&lt;/p&gt;</content:encoded></item><item><title>GoogleがAnthropicに最大400億ドル｜「クラウド両足」の構図が確定する</title><link>https://frontier-radar.com/news/google-anthropic-40b-investment/</link><guid isPermaLink="true">https://frontier-radar.com/news/google-anthropic-40b-investment/</guid><description>Googleが、Anthropicに最大400億ドルを投じる方針を発表。即時100億、残り300億は業績マイルストーン連動。Cloud Next 2026のGemini Enterprise発表と並び、自社モデルとAnthropicの両足で回す構図が確定する。</description><pubDate>Sun, 26 Apr 2026 20:30:00 GMT</pubDate><content:encoded>&lt;p&gt;Googleが、Anthropicに最大400億ドルを投じると明らかにした。即時100億ドル、残り300億ドルは業績マイルストーン連動。Cloud Next 2026のGemini Enterprise Agent Platform発表と並走する形で、Googleの選択が「自社モデル単独」ではなく「両足」になることが確定する。&lt;/p&gt;
&lt;h2 id=&quot;何が読めるか&quot;&gt;何が読めるか&lt;/h2&gt;
&lt;p&gt;GCPのVertex AI上でGeminiとClaudeを横に並べる動線が、エンタープライズ顧客の標準導線として強化される。Amazon・Microsoftがそれぞれ独占的な提携を強めるなか、Googleは敢えて「並べて選ばせる」立ち位置を取り、Anthropic側は資本面の独立性を保ちやすい。&lt;/p&gt;
&lt;h2 id=&quot;採用判断への影響&quot;&gt;採用判断への影響&lt;/h2&gt;
&lt;p&gt;自社で「Geminiにするか、Claudeにするか」を比較中の企業は、GCP上での運用コスト・SLA・データ分離の3点でほぼ同条件で並べられる前提に近づく。クラウド固有のディスカウント条件はAWS／Azureより緩くなる可能性があり、3クラウドの料金条件を改めて取り直す価値がある。&lt;/p&gt;</content:encoded></item><item><title>GoogleがVertex AIをGemini Enterprise Agent Platformに改称｜A2A 1.2が本番150社へ</title><link>https://frontier-radar.com/news/google-gemini-enterprise-agent-platform/</link><guid isPermaLink="true">https://frontier-radar.com/news/google-gemini-enterprise-agent-platform/</guid><description>Google Cloud Next 2026でVertex AIがGemini Enterprise Agent Platformに改称。Agent Studio・Registry・Identity・Gatewayを一式で揃え、A2Aプロトコル1.2は本番150社で稼働。エンタープライズ・エージェント基盤の正面競合がそろう。</description><pubDate>Sat, 25 Apr 2026 22:30:00 GMT</pubDate><content:encoded>&lt;p&gt;Google Cloud Next 2026で、Vertex AIがGemini Enterprise Agent Platformに改称された。Agentspaceは統合され、Agent Studio・Registry・Identity・Gateway・Observabilityが一式で揃う構成になる。&lt;/p&gt;
&lt;h2 id=&quot;ぶつかる相手&quot;&gt;ぶつかる相手&lt;/h2&gt;
&lt;p&gt;AnthropicのClaude Managed AgentsとOpenAIのChatGPT Workspace Agentsに正面からぶつかる位置取り。Box・Workday・Salesforce・ServiceNowの公式エージェントが乗っており、SaaSとの結線で先行している。&lt;/p&gt;
&lt;h2 id=&quot;a2a-12の意味&quot;&gt;A2A 1.2の意味&lt;/h2&gt;
&lt;p&gt;Linux Foundationの傘下に移ったAgent2Agentプロトコルが1.2に到達し、本番運用150社に達した。署名付きAgent Cardでドメイン検証ができるようになり、社外エージェントとの会話を信頼設計の上で組める。MCP 2026ロードマップの監査・ゲートウェイと並走する流れで、自社のエージェント識別・記録の置き方を先取りで決めておく価値がある。&lt;/p&gt;</content:encoded></item><item><title>OpenAIがChatGPT Businessにワークスペースエージェント｜Slack・Gmailを横断する自動化</title><link>https://frontier-radar.com/news/openai-workspace-agents-chatgpt-business/</link><guid isPermaLink="true">https://frontier-radar.com/news/openai-workspace-agents-chatgpt-business/</guid><description>OpenAIがChatGPT Business・Enterprise・教育向けにワークスペースエージェントを公開。Slack・Gmailなどのツールを跨いだ作業を、エージェントとしてチームで作って共有できる。エンタープライズSaaS連携の主戦場が確定する。</description><pubDate>Sat, 25 Apr 2026 21:00:00 GMT</pubDate><content:encoded>&lt;p&gt;OpenAIがChatGPT Business・Enterprise・教育プラン向けにワークスペースエージェントを公開した。Slack・Gmail・Drive・Calendarなどを跨いで動くエージェントを作り、組織内で共有できる。&lt;/p&gt;
&lt;h2 id=&quot;競合との配置&quot;&gt;競合との配置&lt;/h2&gt;
&lt;p&gt;GoogleのGemini Enterprise Agent PlatformとAnthropicのClaude Managed Agentsに対する正面の応手。OpenAI側はChatGPT本体・Codex・GPT-5.5 APIを束ねた「アプリ寄り」の運用になり、業務寄りユーザーが直に触る形になる。&lt;/p&gt;
&lt;h2 id=&quot;自社の使い分け&quot;&gt;自社の使い分け&lt;/h2&gt;
&lt;p&gt;3社のエンタープライズ・エージェントは構成が似通ってきており、選定軸は3点に集約される。既存SaaS連携の網羅度、エージェント識別・監査の置き方、料金の単位（セッション時間 vs トークン vs 席）。GPT-5.5 Pro（API $5/$30 per 1M）の単価感を起点に、ChatGPT Business席課金との合算でコスト試算を組み直す価値がある。&lt;/p&gt;</content:encoded></item><item><title>Pinterestが本番MCPエコシステムを公開｜社内ツールを横断するエージェント運用</title><link>https://frontier-radar.com/explain/pinterest-mcp-production-deployment/</link><guid isPermaLink="true">https://frontier-radar.com/explain/pinterest-mcp-production-deployment/</guid><description>Pinterestがエンジニアリングチームで MCP サーバー群を本番投入したことを明らかに。社内ツールを横断したエージェント運用の構成と監視の置き方が、企業導入の参考実装になる。</description><pubDate>Sat, 25 Apr 2026 05:45:00 GMT</pubDate><content:encoded>&lt;p&gt;Pinterestのエンジニアリングチームが MCP サーバー群を本番運用に乗せたことを明かした。社内ツール連携を一本化し、エージェントが横断して動く土台を整えている。&lt;/p&gt;
&lt;h2 id=&quot;構成&quot;&gt;構成&lt;/h2&gt;
&lt;p&gt;ゲートウェイ層で認証とレート制限を一括処理し、各MCPサーバーは権限スコープごとに分けている。OpenTelemetryと組み合わせ、ツール呼び出し単位でトレースを取って監査ログに残す形。&lt;/p&gt;
&lt;h2 id=&quot;自前運用への示唆&quot;&gt;自前運用への示唆&lt;/h2&gt;
&lt;p&gt;企業導入で詰まりやすい3点を先取りしている。SSO統合の引き回し、操作ログの保全、サーバーごとの権限境界。MCP 2026ロードマップで来る監査・ゲートウェイ機能を待たずに似た構成を組める参考実装になる。&lt;/p&gt;</content:encoded></item><item><title>DeepSeek V4 Pro/Flash登場｜1.6Tパラメータと低価格の二段構え</title><link>https://frontier-radar.com/news/deepseek-v4-pro-flash-launch/</link><guid isPermaLink="true">https://frontier-radar.com/news/deepseek-v4-pro-flash-launch/</guid><description>DeepSeekがV4をプレビュー公開。1.6TパラメータのProと小型・廉価のFlashを同時に出し、100万トークンのコンテキストとHuawei Ascendとの密結合を売りにする。</description><pubDate>Sat, 25 Apr 2026 05:00:00 GMT</pubDate><content:encoded>&lt;p&gt;DeepSeekがV4をプレビュー公開した。Proは1.6Tパラメータ・100万トークン文脈、Flashは小型で価格を抑えた構成で、用途別に二段で並べてきた。&lt;/p&gt;
&lt;h2 id=&quot;ベンチ主張&quot;&gt;ベンチ主張&lt;/h2&gt;
&lt;p&gt;ProはClaude Opus 4.6・GPT-5.4・Gemini 3.1 Proに対しエージェント駆動コーディングと推論で互角以上を主張。Flashは性能を捨てる代わりに、トークン単価をオープン勢の最下層に置きにきている。&lt;/p&gt;
&lt;h2 id=&quot;採用時の見方&quot;&gt;採用時の見方&lt;/h2&gt;
&lt;p&gt;Huawei Ascendとの最適化が前提なので、自前GPU運用なら効率は下がる可能性がある。長文脈での回帰、ツール呼び出し完遂率、Flashとの混在運用のコスト効率の3点で測ると差が見える。&lt;/p&gt;</content:encoded></item><item><title>現実に出回る間接プロンプトインジェクション10種｜エージェント運用への直接の脅威</title><link>https://frontier-radar.com/explain/in-the-wild-ipi-payloads-april-2026/</link><guid isPermaLink="true">https://frontier-radar.com/explain/in-the-wild-ipi-payloads-april-2026/</guid><description>セキュリティ研究者が4月23日に、実環境のエージェントを狙った間接プロンプトインジェクションのペイロード10種を公開。API鍵窃取・データ破壊・金融詐欺を狙う具体例で、運用側の前提が崩れる。</description><pubDate>Sat, 25 Apr 2026 04:15:00 GMT</pubDate><content:encoded>&lt;p&gt;セキュリティ研究者が4月23日、実環境のAIエージェントに対し観測された間接プロンプトインジェクション（IPI）ペイロード10種を公開した。Anthropicの「Comment and Control」報告やGitHub CopilotのCVE-2025-53773（CVSS 9.6）と同系統で、攻撃が机上の話を抜けたことを示す。&lt;/p&gt;
&lt;h2 id=&quot;共通の狙い&quot;&gt;共通の狙い&lt;/h2&gt;
&lt;p&gt;API鍵抜き取り、リポジトリ破壊、外部送金トリガー、サードパーティAPIへの不正リクエスト。多くがイシュー本文・PRタイトル・READMEの注釈・Webページのhidden要素に埋め込まれた。&lt;/p&gt;
&lt;h2 id=&quot;防御の優先順位&quot;&gt;防御の優先順位&lt;/h2&gt;
&lt;ol&gt;
&lt;li&gt;ツール呼び出しの出力先を入力源と独立に絞る&lt;/li&gt;
&lt;li&gt;外部ドキュメント取り込みは別エージェントに分け、書き込み権限を切る&lt;/li&gt;
&lt;li&gt;敏感操作（決済・鍵発行・PRマージ）は人手レビューを必須にする&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;仕様修正待ちより、CIゲートと権限分離の二重化が現実的。&lt;/p&gt;</content:encoded></item><item><title>Cursor 3が並列エージェントIDEに踏み切る｜Composer 2とDesign Mode</title><link>https://frontier-radar.com/news/cursor-3-parallel-agents-ide/</link><guid isPermaLink="true">https://frontier-radar.com/news/cursor-3-parallel-agents-ide/</guid><description>Cursor 3が4月2日に登場。複数エージェントを並列で走らせるAgents Window、自社モデルComposer 2、UIを直接いじれるDesign Modeが目玉で、IDEの位置づけが変わる。</description><pubDate>Sat, 25 Apr 2026 04:00:00 GMT</pubDate><content:encoded>&lt;p&gt;Cursor 3はリポジトリ・ブランチ・実行環境を跨いで複数エージェントを同時に走らせるAgents Windowを中心に据えた。ローカル・クラウド・SSH先・git worktreeを並べて見られる。&lt;/p&gt;
&lt;h2 id=&quot;モデルとui&quot;&gt;モデルとUI&lt;/h2&gt;
&lt;p&gt;自社モデルComposer 2は200トークン/秒以上の生成速度と、CursorBenchで1.5から39%改善（44.2→61.3）を主張。UIをスクリーン上で直接編集するDesign Modeも入る。&lt;/p&gt;
&lt;h2 id=&quot;採用判断&quot;&gt;採用判断&lt;/h2&gt;
&lt;p&gt;Claude CodeやWindsurfと比べる軸は3つ。並列エージェントの取り回し、Composer 2を内製モデルに乗り換える価値、Design Modeが既存のFigma往復を実際に圧縮するか。料金は$20/月で並ぶ。&lt;/p&gt;</content:encoded></item><item><title>Claude CodeにUltraplanとMonitor｜長尺タスクの設計と監視が一体化</title><link>https://frontier-radar.com/explain/claude-code-ultraplan-monitor/</link><guid isPermaLink="true">https://frontier-radar.com/explain/claude-code-ultraplan-monitor/</guid><description>Claude Codeの4月アップデートでUltraplanとMonitorが入った。CLIから出した計画をWebで編集してリモート実行に流せ、長時間タスクの背景イベントを会話上で追える。</description><pubDate>Sat, 25 Apr 2026 03:30:00 GMT</pubDate><content:encoded>&lt;p&gt;4月のClaude Codeアップデートで2つの大きな機能が入った。Ultraplanはターミナルで草案を書き、Webエディタで編集・コメントしてからリモート実行、必要ならローカルに戻すワークフローを一本化する。初回起動でクラウド環境が自動で立つ。&lt;/p&gt;
&lt;h2 id=&quot;monitor&quot;&gt;Monitor&lt;/h2&gt;
&lt;p&gt;バックグラウンドのイベントを会話に流し込み、ログを横で読みつつ反応できる仕組み。&lt;code&gt;/loop&lt;/code&gt;は間隔指定を省くと自走ペースを調整し、&lt;code&gt;/team-onboarding&lt;/code&gt;は自分の使い方を再生可能なガイドに固める。&lt;/p&gt;
&lt;h2 id=&quot;運用の見方&quot;&gt;運用の見方&lt;/h2&gt;
&lt;p&gt;長時間タスクを「設計はUltraplan、実行はManaged AgentsやCloudflare、監視はMonitor」に切り分ける構図が現実的。チーム導入時は&lt;code&gt;/team-onboarding&lt;/code&gt;をテンプレ化して再生可能性を担保すると差が出る。&lt;/p&gt;</content:encoded></item><item><title>OpenAI Codexが大幅刷新｜プラグインとマルチモーダルでエージェント寄りに</title><link>https://frontier-radar.com/news/openai-codex-april-2026-upgrade/</link><guid isPermaLink="true">https://frontier-radar.com/news/openai-codex-april-2026-upgrade/</guid><description>OpenAIがCodexをアップデート。プラグイン拡張、マルチモーダル入力、より自律的なエージェントモードが入り、Claude CodeやCursor 3が並ぶエージェントIDE市場での反撃と位置づけられる。</description><pubDate>Sat, 25 Apr 2026 03:30:00 GMT</pubDate><content:encoded>&lt;p&gt;OpenAIがGPT-6を待つ間にCodexを大幅に刷新した。プラグイン機構、画像・音声を含むマルチモーダル入力、より自律的なエージェントモードが追加された。&lt;/p&gt;
&lt;h2 id=&quot;焦点&quot;&gt;焦点&lt;/h2&gt;
&lt;p&gt;プラグインで社内ツール接続を増やせる点はMCPと役割が重なるため、両方を抱えると重複する。マルチモーダルでデザイン画像から実装に進める動線が短くなり、Cursor 3のDesign Modeと正面からぶつかる。&lt;/p&gt;
&lt;h2 id=&quot;比較の見方&quot;&gt;比較の見方&lt;/h2&gt;
&lt;p&gt;Claude Code・Cursor 3との三つ巴で見るべき点は3つ。1人開発時の単発生成の速さ、リポジトリ全体の文脈追従、社内ツール接続の運用コスト。GPT-6本体の発表が「数週間先」とされる中で、Codexがどれだけ独立して使い物になるかが採用判断の軸になる。&lt;/p&gt;</content:encoded></item><item><title>Antigravity IDEで起きたサンドボックス脱出｜エージェントIDEの境界が問われる</title><link>https://frontier-radar.com/explain/antigravity-sandbox-escape-disclosure/</link><guid isPermaLink="true">https://frontier-radar.com/explain/antigravity-sandbox-escape-disclosure/</guid><description>Pillar SecurityがGoogleのAntigravity IDEでプロンプトインジェクション経由のサンドボックス脱出を報告。エージェントIDE全般で「境界の引き方」が再点検される。</description><pubDate>Sat, 25 Apr 2026 03:00:00 GMT</pubDate><content:encoded>&lt;p&gt;Pillar SecurityがGoogleのAntigravity IDEで、プロンプトインジェクションをきっかけにネイティブツールを悪用しサンドボックスから抜ける手口を4月22日に公開した。同種の課題はClaude CodeやGemini CLIでも先週「Comment and Control」として報告されている。&lt;/p&gt;
&lt;h2 id=&quot;何が共通か&quot;&gt;何が共通か&lt;/h2&gt;
&lt;p&gt;外部から取り込んだコメントやファイル内文字列が、モデルから見れば指示として通る。データと命令を区別する仕組みがない以上、IDE側の権限境界で防ぐ前提に切り替える話。&lt;/p&gt;
&lt;h2 id=&quot;自前運用で見る点&quot;&gt;自前運用で見る点&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;ツール呼び出しのスコープが入力源と独立に絞られているか&lt;/li&gt;
&lt;li&gt;リポジトリ外のネットワーク・ファイルアクセスを既定で禁止しているか&lt;/li&gt;
&lt;li&gt;エージェントの自律実行とレビュー必須の境目が明示されているか&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;仕様修正待ちより、IDE設定とCI側の二重化が現実的。&lt;/p&gt;</content:encoded></item><item><title>Claude Opus 4.7が来た｜長時間コーディングに効く改善は何か</title><link>https://frontier-radar.com/news/claude-opus-4-7-coding-jump/</link><guid isPermaLink="true">https://frontier-radar.com/news/claude-opus-4-7-coding-jump/</guid><description>長時間にわたる複雑なコーディングと画像の高解像度認識が主な改善点。全製品と主要クラウドで利用可能になっている。</description><pubDate>Thu, 23 Apr 2026 23:30:00 GMT</pubDate><content:encoded>&lt;p&gt;Claude Opus 4.7が一般提供に入った。Anthropicの全製品、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryで利用できる。&lt;/p&gt;
&lt;h2 id=&quot;主な改善&quot;&gt;主な改善&lt;/h2&gt;
&lt;p&gt;長時間動かすコーディング系タスクでの安定性と、画像を高解像度で扱えるビジョン周りの強化が中心。短い単発生成より、数十分以上のエージェント駆動や画面キャプチャを挟むワークフローで差が出やすい。&lt;/p&gt;
&lt;h2 id=&quot;切り替えの見方&quot;&gt;切り替えの見方&lt;/h2&gt;
&lt;p&gt;すでにOpus系で動いているパイプラインは、回帰テストを一度流して精度と所要時間を比較するだけで判断できる。新規採用なら、まず長時間タスクと画像入力の両方を含むケースで試すのが近道。&lt;/p&gt;</content:encoded></item><item><title>GPT-5.5はエージェント前提の設計｜乗り換え判断の見どころ</title><link>https://frontier-radar.com/news/gpt-5-5-agent-first-release/</link><guid isPermaLink="true">https://frontier-radar.com/news/gpt-5-5-agent-first-release/</guid><description>OpenAIがGPT-5.5を公開。複数ツールを自律的に切り替えるエージェント志向を前面に出した設計で、ベンチマークも競合を上回るとされる。</description><pubDate>Thu, 23 Apr 2026 22:40:00 GMT</pubDate><content:encoded>&lt;p&gt;OpenAIがGPT-5.5をリリースした。複数のツールを渡り歩きながら長めのタスクを自走させることを想定した「エージェントモデル」として位置づけられている。&lt;/p&gt;
&lt;h2 id=&quot;どこで効くか&quot;&gt;どこで効くか&lt;/h2&gt;
&lt;p&gt;単発のQAやライティングではなく、検索、コード実行、ファイル操作などを跨ぐワークフローで失敗しづらくなっているとされる。ベンチマークではGoogleやAnthropicの同時期モデルを上回る数値が並ぶ。&lt;/p&gt;
&lt;h2 id=&quot;採用時に見る軸&quot;&gt;採用時に見る軸&lt;/h2&gt;
&lt;p&gt;応答品質より、ツール呼び出しの完遂率と、途中で戻れるかどうかのリカバリ挙動を試した方が実務の差が見えやすい。既存エージェントの土台を入れ替える前に、失敗系のログで比較するのが近道。&lt;/p&gt;</content:encoded></item><item><title>MCP 2026ロードマップ｜企業導入で効く4つの優先領域</title><link>https://frontier-radar.com/explain/mcp-2026-roadmap-enterprise/</link><guid isPermaLink="true">https://frontier-radar.com/explain/mcp-2026-roadmap-enterprise/</guid><description>MCPの2026ロードマップが公開。Transport・エージェント間通信・ガバナンス・エンタープライズ対応の4領域に優先度が絞られている。</description><pubDate>Thu, 23 Apr 2026 21:50:00 GMT</pubDate><content:encoded>&lt;p&gt;Model Context Protocolの2026年ロードマップが更新された。日付ベースではなく、Working Groupごとに優先度を置く形に変わっている。&lt;/p&gt;
&lt;h2 id=&quot;4つの優先領域&quot;&gt;4つの優先領域&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Transportのスケーラビリティ&lt;/li&gt;
&lt;li&gt;エージェント間通信の仕様整備&lt;/li&gt;
&lt;li&gt;ガバナンスの成熟（メンテナ体制、参加ルール）&lt;/li&gt;
&lt;li&gt;企業導入に向けた要件（監査、SSO連携、ゲートウェイ、設定のポータビリティ）&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;体制の動き&quot;&gt;体制の動き&lt;/h2&gt;
&lt;p&gt;Den DelimarskyがCore MaintainerからLead Maintainerに昇格。MCPは AAIF（Agentic AI Foundation / Linux Foundation配下）への移管後、GooseやAGENTS.mdと並ぶ3プロジェクトのひとつになっている。&lt;/p&gt;
&lt;h2 id=&quot;読み方&quot;&gt;読み方&lt;/h2&gt;
&lt;p&gt;自社が現在ぶつかっている運用課題（監査ログが取れない、認証が割れるなど）がどのWorking Groupに載っているかを照らすと、待つべきか自前で補うかの判断がしやすい。&lt;/p&gt;</content:encoded></item><item><title>Microsoft Agent Framework 1.0がGA｜AutoGen/Semantic Kernelを統合</title><link>https://frontier-radar.com/news/ms-agent-framework-1-0-ga/</link><guid isPermaLink="true">https://frontier-radar.com/news/ms-agent-framework-1-0-ga/</guid><description>MicrosoftがAgent Framework 1.0を本番対応で公開。Semantic KernelとAutoGenを1本のOSSに統合し、.NETとPythonを同じAPIで扱えるようになった。</description><pubDate>Thu, 23 Apr 2026 21:05:00 GMT</pubDate><content:encoded>&lt;p&gt;Microsoft Agent Framework 1.0が本番対応のリリースとして公開された。“stable APIs and long-term support”を掲げ、Semantic Kernelと AutoGenの知見をひとつのOSSに統合した形になる。&lt;/p&gt;
&lt;h2 id=&quot;位置づけ&quot;&gt;位置づけ&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;.NETとPythonで同じ設計&lt;/li&gt;
&lt;li&gt;実験用途と企業導入の両方をカバー&lt;/li&gt;
&lt;li&gt;既存のSemantic Kernel、AutoGenユーザーの移行先&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;乗るかどうかの見方&quot;&gt;乗るかどうかの見方&lt;/h2&gt;
&lt;p&gt;すでにAzureやMicrosoft 365周辺でエージェントを回しているなら、APIが落ち着いた今がアーキテクチャ整理のタイミングになる。別ランタイムで動いているチームは、無理に寄せる必要はなく、エージェント間通信の仕様が固まる段階まで観察するのも合理的。&lt;/p&gt;</content:encoded></item><item><title>間接プロンプトインジェクションが現実の事故になった話</title><link>https://frontier-radar.com/explain/indirect-prompt-injection-reality-2026/</link><guid isPermaLink="true">https://frontier-radar.com/explain/indirect-prompt-injection-reality-2026/</guid><description>PRの説明欄に埋めた命令からCopilotが任意コードを実行できたCVE-2025-53773と、Microsoft 365 CopilotのEchoLeakが、間接インジェクションを理論から実害側に動かした。</description><pubDate>Thu, 23 Apr 2026 20:20:00 GMT</pubDate><content:encoded>&lt;p&gt;プロンプトインジェクションはOWASPのLLMリスク筆頭に居続けているが、2026年は直接入力ではなく、周辺データ経由の「間接」型の事故が目立つ。&lt;/p&gt;
&lt;h2 id=&quot;今年の代表例&quot;&gt;今年の代表例&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;CVE-2025-53773: Pull Requestの説明文に隠した命令からGitHub Copilotが任意コードを実行（CVSS 9.6）&lt;/li&gt;
&lt;li&gt;EchoLeak: Microsoft 365 Copilotでユーザー操作ゼロのまま企業データが流出&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;なぜ拾いにくいのか&quot;&gt;なぜ拾いにくいのか&lt;/h2&gt;
&lt;p&gt;LLMは、ユーザーが打った命令と、検索結果やツール出力に混ざった命令を同じ入力として扱う。現在の検知は高度な攻撃の23%しか捉えられていないという報告もある。&lt;/p&gt;
&lt;h2 id=&quot;現場での対策&quot;&gt;現場での対策&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;ツール出力やドキュメントは「データ」として囲い、命令として解釈させない前処理を挟む&lt;/li&gt;
&lt;li&gt;実行系ツールには人間の最終承認を残す&lt;/li&gt;
&lt;li&gt;何が入力されたかを記録し、事後に追えるログを必ず取る&lt;/li&gt;
&lt;/ul&gt;</content:encoded></item><item><title>モデル料金が下がっても総額が増える理由｜2026年春のコスト再点検</title><link>https://frontier-radar.com/news/model-price-reset-2026/</link><guid isPermaLink="true">https://frontier-radar.com/news/model-price-reset-2026/</guid><description>API単価の値下げが続く一方で、呼び出し回数の増加とワークフローの複雑化で請求額はむしろ膨らみやすくなっている。</description><pubDate>Sat, 18 Apr 2026 23:30:00 GMT</pubDate><content:encoded>&lt;p&gt;2026年春は単純な値下げよりも、小型モデルを前提にした再設計が広がっている。&lt;/p&gt;
&lt;h2 id=&quot;何が変わったか&quot;&gt;何が変わったか&lt;/h2&gt;
&lt;p&gt;多くのチームが、重いモデルを常時使う構成から、下書き、分類、評価を小型モデルへ逃がす構成へ切り替え始めた。結果として単価は下がっても総呼び出し回数は増え、月額は想定より膨らみやすい。&lt;/p&gt;
&lt;h2 id=&quot;先に見るべき指標&quot;&gt;先に見るべき指標&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;1タスクあたりの総トークン&lt;/li&gt;
&lt;li&gt;リトライ回数&lt;/li&gt;
&lt;li&gt;キャッシュ命中率&lt;/li&gt;
&lt;li&gt;人手確認の回数&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;実務での見方&quot;&gt;実務での見方&lt;/h2&gt;
&lt;p&gt;値下げニュースだけで判断するより、どの工程を軽いモデルに逃がすかを先に決めた方が効果が大きい。API単価ではなく、ワークフロー全体の設計を見直すタイミングに入っている。&lt;/p&gt;</content:encoded></item><item><title>Claude Codeをチームで回すための共有メモ設計</title><link>https://frontier-radar.com/explain/claude-code-shared-memory/</link><guid isPermaLink="true">https://frontier-radar.com/explain/claude-code-shared-memory/</guid><description>個人利用では快適でも、チームで回し始めた瞬間に差が出るのが共有メモの持ち方。出力のばらつきとレビュー負荷を減らすための基本を整理する。</description><pubDate>Sat, 18 Apr 2026 22:25:00 GMT</pubDate><content:encoded>&lt;p&gt;Claude Codeを個人利用からチーム利用へ広げると、最初に詰まるのはプロンプトより共有メモの持ち方だ。&lt;/p&gt;
&lt;h2 id=&quot;まず分けるもの&quot;&gt;まず分けるもの&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;変更してよい範囲&lt;/li&gt;
&lt;li&gt;承認が必要な操作&lt;/li&gt;
&lt;li&gt;参照すべきドキュメント&lt;/li&gt;
&lt;li&gt;レビュー時のチェック項目&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;共有メモの置き方&quot;&gt;共有メモの置き方&lt;/h2&gt;
&lt;p&gt;人ごとに長い指示を書くより、プロジェクト共通の運用メモを短く保ち、案件ごとの差分だけを別ファイルに分ける方が回りやすい。判断基準を一か所に寄せると、出力のばらつきが減る。&lt;/p&gt;
&lt;h2 id=&quot;向いているチーム&quot;&gt;向いているチーム&lt;/h2&gt;
&lt;p&gt;レビュー担当が固定で、同じ種類の変更を繰り返すチームほど効果が出やすい。反対に探索型の作業では、厳しすぎるルールが速度を落とす。&lt;/p&gt;</content:encoded></item><item><title>小型推論モデルはどこまで実務に入るのか</title><link>https://frontier-radar.com/explain/small-models-real-work/</link><guid isPermaLink="true">https://frontier-radar.com/explain/small-models-real-work/</guid><description>小型モデルは補助要員ではなく、実務ワークフローの第一走者として採用され始めている。品質、速度、コストの境界線を整理する。</description><pubDate>Sat, 18 Apr 2026 21:40:00 GMT</pubDate><content:encoded>&lt;p&gt;小型推論モデルは補助要員としてではなく、本番ワークフローの第一走者として採用され始めている。&lt;/p&gt;
&lt;h2 id=&quot;強い場面&quot;&gt;強い場面&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;要約&lt;/li&gt;
&lt;li&gt;分類&lt;/li&gt;
&lt;li&gt;差分抽出&lt;/li&gt;
&lt;li&gt;1ステップの問い合わせ&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;まだ弱い場面&quot;&gt;まだ弱い場面&lt;/h2&gt;
&lt;p&gt;長い依存関係をまたぐ設計判断や、複数ファイルを横断する改修では、精度の揺れが残る。小型モデルだけで完結させるより、重いモデルへ渡す前処理として使う方が安定する。&lt;/p&gt;
&lt;h2 id=&quot;判断の軸&quot;&gt;判断の軸&lt;/h2&gt;
&lt;p&gt;品質より速度が重要な工程、または人が最終確認する工程なら、小型モデルの利点が出やすい。レイテンシとコストを両方削りたいチームに向く。&lt;/p&gt;</content:encoded></item><item><title>Inbox型エージェントが定着し始めた理由</title><link>https://frontier-radar.com/news/inbox-agents-adoption/</link><guid isPermaLink="true">https://frontier-radar.com/news/inbox-agents-adoption/</guid><description>リアルタイムの対話より、タスクがたまった時点でまとめて処理するInbox型の運用が増えている。人のリズムを壊さない使い方として注目される。</description><pubDate>Sat, 18 Apr 2026 20:55:00 GMT</pubDate><content:encoded>&lt;p&gt;チャットを開いて毎回指示するより、タスクが溜まったタイミングで処理するInbox型のエージェント運用が増えている。&lt;/p&gt;
&lt;h2 id=&quot;どこで使われているか&quot;&gt;どこで使われているか&lt;/h2&gt;
&lt;p&gt;朝の要約、プルリクの一次確認、問い合わせの下書き、定型レポートの作成など、非同期で回しやすい業務に向いている。&lt;/p&gt;
&lt;h2 id=&quot;定着する理由&quot;&gt;定着する理由&lt;/h2&gt;
&lt;p&gt;人が常時見張らなくてよく、失敗時も差し戻しやすいからだ。リアルタイムの対話より、担当者のリズムを壊しにくい。&lt;/p&gt;
&lt;h2 id=&quot;導入時の注意&quot;&gt;導入時の注意&lt;/h2&gt;
&lt;p&gt;Inboxを増やしすぎると通知が新しい負担になる。何を自動化しないかを先に決めておく方がうまくいく。&lt;/p&gt;</content:encoded></item><item><title>MCPサーバーが増えた時に最初に作るべき権限台帳</title><link>https://frontier-radar.com/explain/mcp-permission-ledger/</link><guid isPermaLink="true">https://frontier-radar.com/explain/mcp-permission-ledger/</guid><description>MCPはつなぐことより整理することの方が難しい。誰が何に触れるかを見える化する最小構成をまとめる。</description><pubDate>Sat, 18 Apr 2026 19:50:00 GMT</pubDate><content:encoded>&lt;p&gt;MCPサーバーが3つを超えたあたりから、接続そのものより誰が何に触れるかの管理が難しくなる。&lt;/p&gt;
&lt;h2 id=&quot;先に台帳化する項目&quot;&gt;先に台帳化する項目&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;サーバー名&lt;/li&gt;
&lt;li&gt;接続先のデータ&lt;/li&gt;
&lt;li&gt;書き込み可否&lt;/li&gt;
&lt;li&gt;利用者&lt;/li&gt;
&lt;li&gt;承認の有無&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;よくある混乱&quot;&gt;よくある混乱&lt;/h2&gt;
&lt;p&gt;同じ名前のサーバーが複数環境に存在したり、読み取り専用のつもりが書き込み権限を持っていたりすると、現場で判断が止まる。台帳がないと、事故後の説明も難しい。&lt;/p&gt;
&lt;h2 id=&quot;最小構成&quot;&gt;最小構成&lt;/h2&gt;
&lt;p&gt;まずはスプレッドシートでもよいので、接続先と権限だけは一覧にする。そこから利用ログと更新履歴を足していくと、拡張しても壊れにくい。&lt;/p&gt;</content:encoded></item><item><title>ブラウザ操作エージェントの暴走を防ぐフェイルセーフ設計</title><link>https://frontier-radar.com/explain/browser-agent-failsafes/</link><guid isPermaLink="true">https://frontier-radar.com/explain/browser-agent-failsafes/</guid><description>ブラウザ自動操作は便利だが、速さより止め方の設計が重要。人の確認を残しながら事故率を下げるための基本を整理する。</description><pubDate>Sat, 18 Apr 2026 10:10:00 GMT</pubDate><content:encoded>&lt;p&gt;ブラウザ操作エージェントは便利だが、操作の速さより止め方の設計が重要だ。&lt;/p&gt;
&lt;h2 id=&quot;最低限入れたい止め方&quot;&gt;最低限入れたい止め方&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;危険操作前の確認&lt;/li&gt;
&lt;li&gt;ドメイン単位の許可&lt;/li&gt;
&lt;li&gt;スクリーンショット保存&lt;/li&gt;
&lt;li&gt;タイムアウト&lt;/li&gt;
&lt;li&gt;失敗時の巻き戻し手順&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;現場で効く工夫&quot;&gt;現場で効く工夫&lt;/h2&gt;
&lt;p&gt;すべてを自動化するより、フォーム入力や確認作業だけを任せる方が安定する。人が最後の送信だけ担当する構成は、事故率を大きく下げる。&lt;/p&gt;
&lt;h2 id=&quot;向いている業務&quot;&gt;向いている業務&lt;/h2&gt;
&lt;p&gt;定型入力、管理画面の巡回、スクリーンショット検証のように、成功条件が見た目で判断しやすい仕事に向いている。&lt;/p&gt;</content:encoded></item><item><title>OpenAI系ツールを仕事に入れる時の最初の3導線</title><link>https://frontier-radar.com/explain/openai-workbench-shortcuts/</link><guid isPermaLink="true">https://frontier-radar.com/explain/openai-workbench-shortcuts/</guid><description>すべてを置き換えるのではなく、下準備だけを任せるところから始める。OpenAI系ツールを実務に入れるための入口を整理する。</description><pubDate>Sat, 18 Apr 2026 07:35:00 GMT</pubDate><content:encoded>&lt;p&gt;OpenAI系のツールを現場へ入れるなら、最初から全部使おうとしない方がよい。&lt;/p&gt;
&lt;h2 id=&quot;先に試す3つの導線&quot;&gt;先に試す3つの導線&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;調査メモの下書き&lt;/li&gt;
&lt;li&gt;反復的なコード修正&lt;/li&gt;
&lt;li&gt;社内FAQの要約&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;うまくいく進め方&quot;&gt;うまくいく進め方&lt;/h2&gt;
&lt;p&gt;既存の仕事を置き換えるのではなく、時間のかかる下準備だけを任せる。短い成功体験を積むと、チーム内の抵抗が小さい。&lt;/p&gt;
&lt;h2 id=&quot;失敗しやすい例&quot;&gt;失敗しやすい例&lt;/h2&gt;
&lt;p&gt;期待値だけが先に上がり、評価基準が決まらないまま全社導入しようとするケースだ。最初は小さな担当範囲で十分。&lt;/p&gt;</content:encoded></item><item><title>引用が壊れないRAGを最短で組む：citation-first構成</title><link>https://frontier-radar.com/explain/rag-citation-first-stack/</link><guid isPermaLink="true">https://frontier-radar.com/explain/rag-citation-first-stack/</guid><description>RAGは検索速度より、根拠の見せ方を先に整えた方が信頼される。citation-firstの考え方と最小構成を整理する。</description><pubDate>Sat, 18 Apr 2026 04:20:00 GMT</pubDate><content:encoded>&lt;p&gt;RAGを使うなら、検索速度より先に引用の壊れにくさを整えた方が結果的に信頼される。&lt;/p&gt;
&lt;h2 id=&quot;citation-firstの考え方&quot;&gt;citation-firstの考え方&lt;/h2&gt;
&lt;p&gt;答えを生成する前に、どの文書のどの部分を根拠として使うかを必ず記録する。引用位置が曖昧なまま精度だけ上げても、運用で止まる。&lt;/p&gt;
&lt;h2 id=&quot;構成の基本&quot;&gt;構成の基本&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;文書単位のID&lt;/li&gt;
&lt;li&gt;チャンク単位の出典&lt;/li&gt;
&lt;li&gt;再ランキング&lt;/li&gt;
&lt;li&gt;返答時の引用表示&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;実務での利点&quot;&gt;実務での利点&lt;/h2&gt;
&lt;p&gt;ユーザーが間違いを指摘しやすく、修正も速い。最初の見栄えより、後から直せる構造を優先する方が長く使える。&lt;/p&gt;</content:encoded></item><item><title>AI開発ツールの新定番12選｜2026年春版</title><link>https://frontier-radar.com/news/toolbelt-spring-2026/</link><guid isPermaLink="true">https://frontier-radar.com/news/toolbelt-spring-2026/</guid><description>万能な1本より、既存の作業を少しだけ速くする小さな道具が強くなっている。今の仕事に挟みやすいツールを整理する。</description><pubDate>Sat, 18 Apr 2026 01:15:00 GMT</pubDate><content:encoded>&lt;p&gt;AI開発ツールは、単独で完結する製品より、既存の作業を少しだけ速くする小さな道具が増えている。&lt;/p&gt;
&lt;h2 id=&quot;目立つ流れ&quot;&gt;目立つ流れ&lt;/h2&gt;
&lt;p&gt;CLI補助、エディタ内レビュー、ブラウザ検証、要約用サイドカーなど、今の仕事に足しやすいツールが強い。&lt;/p&gt;
&lt;h2 id=&quot;選ぶ基準&quot;&gt;選ぶ基準&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;既存ワークフローに挟めるか&lt;/li&gt;
&lt;li&gt;学習コストが低いか&lt;/li&gt;
&lt;li&gt;失敗した時に人が戻せるか&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;使い分け&quot;&gt;使い分け&lt;/h2&gt;
&lt;p&gt;万能ツールを探すより、書く、調べる、確かめるの3工程で道具を分けた方が定着しやすい。&lt;/p&gt;</content:encoded></item><item><title>リモートMCPの社内展開で増えた初期トラブル5つ</title><link>https://frontier-radar.com/news/remote-mcp-onboarding/</link><guid isPermaLink="true">https://frontier-radar.com/news/remote-mcp-onboarding/</guid><description>接続方式より、標準構成と説明不足が混乱の原因になりやすい。社内展開の初期に起きる失敗をまとめる。</description><pubDate>Fri, 17 Apr 2026 23:05:00 GMT</pubDate><content:encoded>&lt;p&gt;リモートMCPの社内展開では、技術的な接続よりも、どのサーバーを誰が使うかの説明不足が失敗の原因になりやすい。&lt;/p&gt;
&lt;h2 id=&quot;初期トラブル&quot;&gt;初期トラブル&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;接続先が多すぎて選べない&lt;/li&gt;
&lt;li&gt;読み取り専用かどうか分からない&lt;/li&gt;
&lt;li&gt;権限申請の流れが見えない&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;先に決めること&quot;&gt;先に決めること&lt;/h2&gt;
&lt;p&gt;推奨サーバーを少数に絞り、チームごとの標準構成を先に作る。自由度を上げるのはその後で十分。&lt;/p&gt;
&lt;h2 id=&quot;導入のコツ&quot;&gt;導入のコツ&lt;/h2&gt;
&lt;p&gt;最初から全社共通にしようとせず、ユースケースの近いチーム単位で成功例を作ると広がりやすい。&lt;/p&gt;</content:encoded></item><item><title>CLIアシスタントを安全に使うための最小セキュリティ基準</title><link>https://frontier-radar.com/news/cli-security-baselines/</link><guid isPermaLink="true">https://frontier-radar.com/news/cli-security-baselines/</guid><description>便利さを優先すると、ローカル権限と機密情報に近い分だけ事故も速い。チーム利用で最低限そろえたい基準を整理する。</description><pubDate>Fri, 17 Apr 2026 10:30:00 GMT</pubDate><content:encoded>&lt;p&gt;CLIアシスタントは速いが、ローカル権限と機密情報に近いため、小さな設定漏れがそのまま事故につながる。&lt;/p&gt;
&lt;h2 id=&quot;最低限そろえたい基準&quot;&gt;最低限そろえたい基準&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;作業用アカウントの分離&lt;/li&gt;
&lt;li&gt;機密ファイルの除外&lt;/li&gt;
&lt;li&gt;コマンド実行の確認&lt;/li&gt;
&lt;li&gt;実行履歴の保全&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;事故の起き方&quot;&gt;事故の起き方&lt;/h2&gt;
&lt;p&gt;便利さを優先してフルアクセスを与えると、誤操作や想定外の自動化が広がりやすい。チーム利用では個人開発よりも基準を明文化した方が安全だ。&lt;/p&gt;
&lt;h2 id=&quot;まずやること&quot;&gt;まずやること&lt;/h2&gt;
&lt;p&gt;全員に完璧なルールを求めるより、危険な操作だけを止める最小ラインを先に作る。そこから徐々に厳しくする方が定着する。&lt;/p&gt;</content:encoded></item><item><title>Claude Codeのレビュー待ちを減らすチェックリスト運用</title><link>https://frontier-radar.com/explain/claude-review-queue/</link><guid isPermaLink="true">https://frontier-radar.com/explain/claude-review-queue/</guid><description>生成速度が上がるほど、次に詰まるのはレビュー工程。確認を速くするための観点整理と運用パターンをまとめる。</description><pubDate>Fri, 17 Apr 2026 07:10:00 GMT</pubDate><content:encoded>&lt;p&gt;Claude Codeを入れたチームで意外に大きいのが、生成速度ではなくレビュー待ち時間の増加だ。&lt;/p&gt;
&lt;h2 id=&quot;なぜ詰まるか&quot;&gt;なぜ詰まるか&lt;/h2&gt;
&lt;p&gt;出力が速くなるほど、確認する人の負荷が先に限界に来る。レビュー観点が曖昧だと、差し戻しも増える。&lt;/p&gt;
&lt;h2 id=&quot;効いた対策&quot;&gt;効いた対策&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;変更種類ごとのチェックリスト&lt;/li&gt;
&lt;li&gt;先に読むべきファイルの指定&lt;/li&gt;
&lt;li&gt;リスクの高い差分だけ人が見る運用&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&quot;結論&quot;&gt;結論&lt;/h2&gt;
&lt;p&gt;AIの速度を活かすには、レビューを速くする設計が必要だ。生成そのものより、確認の流れを整える方が効果が大きい。&lt;/p&gt;</content:encoded></item></channel></rss>