AIはブラウザ操作をどこまで自動化できる?フォーム入力・予約・調査の現実
「AIに頼んだらブラウザを開いて勝手に調べてフォームまで入力してくれた」——2026年、エージェント型ブラウザ(ChatGPT Atlas/Claude for Chrome/Gemini・Chrome/Perplexity Comet)が一斉に登場した。では実際どこまで自動化できるのか。結論は3階層に分かれる。①調査・情報収集=実用レベル(実在サイトを測るWebVoyagerで上位エージェントは89〜98%とほぼ飽和、失敗しても被害が小さいのでまずここから任せる)②フォーム入力=できるが要確認(入力自体は各社対応するが項目取り違え・送信ミスがあり、下書きはAI・最終送信は人が安全。多くの製品が重要操作前に確認を求める設計)③予約・決済=まだ自分で(CAPTCHA・複雑なJS決済・二要素認証・セッション管理でつまずき、複雑な多段タスクのWebArenaは47〜68%で人間の目安78%に未達、OpenAIがOperator単体を2025/8/31に畳んだ主因も決済の信頼性不足)。本記事はまず「ブラウザ操作AI」の2方式(消費者向けのブラウザ・拡張内蔵/開発者向けのAPI・OSS)を整理し、2026年の主要プレイヤー一覧(Atlasは専用ブラウザでコード実行やパスワード参照は不可に制限、Claude for Chromeは拡張サイドパネル、GoogleのProject Marinerは2026/5/4終了しGemini・Chromeへ統合、OperatorはChatGPT AgentとAgents SDKへ、OSSのbrowser-useは7.8万スター超)を提示。予約で失敗する4つの壁(bot対策・複雑な決済・2FA・後戻りコスト)を解説し、最大の落とし穴である間接プロンプトインジェクション(Perplexity Cometでゼロクリックの認証情報窃取が実証され2026年2月に対策、対策前の攻撃成功率23.6%が基本防御で約11%・最強設定でも約1%と非ゼロ)に踏み込む。最後に安全に使う5原則(読むだけから始める/送信・決済は人が承認/パスワードは渡さない/信頼できないサイトで走らせない/権限は最小限・専用プロファイル)を提示。調べる相棒としては優秀、お金が動く操作はまだ自分で——この距離感を押さえれば時間を大きく節約できる。数値は各種公表資料・報道・企業発表の引用で傾向の参考。