🤖 新作ゲーム公開
AIエージェント監査官
AIが今しようとしている行動、承認しますか?──全10ケースの判断訓練ゲーム
01
🤔 なぜこのゲームを作ったのか
AIに何を任せるか、誰もが判断者になる時代
ChatGPTやClaudeは、メールを送ったりファイルを読んだりと「実際に手を動かす」AIエージェントへと進化しています。便利になる一方で、AIが読み込んだ文書やツールの応答に紛れ込んだ「見えない指示」に操られてしまうリスクも生まれました。「このAIの行動、本当に承認していいのか?」という判断は、これからエンジニアだけでなく誰もが直面する問題になります。
このサイトは「実務者向けDFIR/OSINT」「AI×セキュリティ」「体験型」という3つの柱で運営していますが、AI×セキュリティの柱にはこれまで体験型コンテンツが一つもありませんでした。「AIエージェント監査官」はその記念すべき第一作です。
02
🔍 遊び方:証拠を見つけて判定する
承認するか、ブロックするか
AIが読み込んだWebページやツールの応答(左)と、AIが今しようとしている行動(右)を見比べ、怪しい部分をタップして証拠を集めます。集めた証拠をもとに「承認する」か「ブロックする」かを確信度付きで判定。正解しても油断は禁物、正規の行動を誤ってブロックしないことも同じくらい大切です。
CASE 1
要約のはずが、顧客リストの送信に
Webページの本文に紛れた指示文をAIが拾ってしまう、間接プロンプトインジェクション。
CASE 3
天気ツールの返事に、余計な一文が
外部ツールの応答結果にも指示は紛れ込む。悪性MCPサーバーの実例。
CASE 8
請求書の転送、これは正しい行動?
何でもブロックすればいいわけではない、正規ケースの誤検知トラップ。
CASE 10
複数の綻びが同時に見つかった
文書汚染・ツール応答汚染・権限昇格が重なる、最終ケース。
⚠ 注意
登場するAI・ツール・企業名はすべて訓練用の再現です。実際のAIモデルは一切呼び出していません。

コメント