目次
「セキュリティ対策の仕事は、AIと人間、どちらが優秀なのか?」——2026年現在、この問いに「どちらか一方」と即答するのは、もう正確ではありません。なぜなら直近1年で、AIが人間の専門家を実力で上回った事例と、AIが致命的な弱点をさらけ出した事例が、同時に立て続けに起きたからです。
まず象徴的な3つの出来事を見てください。
2025〜2026年に起きた3つの転機
AIは「守る側」でも「攻める側」でも実戦投入された
悪用前に阻止
全米1位
AIが自律実行
この記事は「守る側」の視点に立ち、Google・Anthropic・DARPA・Veracodeなどの一次情報と実測データをもとに、AIと人間のセキュリティ能力をタスク別に比較します。煽りでも願望でもなく、「どの作業をAIに任せ、どこを人間が握り、どうやって組織を守るか」を具体的に整理するのがゴールです。
この記事の立場:本記事はあくまで防御・セキュリティ対策のための解説です。攻撃の手口や悪用の方法は提供しません。AIが攻撃に悪用された事例も、「AIが攻撃に便利」という話ではなく、私たちが備えるべき脅威として、しっかり守るために紹介しています。
2. AIが人間を圧倒する領域——速度・規模・網羅
まずAI側の実績から。「AIはまだ補助レベル」という認識は、2025年で完全に古くなりました。
① 速度——人間が数日かける作業を数時間で
自律型AIペンテスター「XBOW」は、本来は経験豊富なハッカーが数日かける侵入テストを数時間で完了します。RCE(リモートコード実行)、SQLインジェクション、XSS、SSRF、情報漏洩といった主要な脆弱性カテゴリを横断的に検査し、わずか90日でバグ報奨金プラットフォームHackerOneの全米ランキング1位に到達。数千人の人間ハッカーを抜き去り、1,000件超の脆弱性を報告しました(うち132件は対象企業が修正を確認)。AIが大規模な実環境で人間の専門家を上回った、初めての文書化された事例です。
② 網羅と規模——24時間×大量コードを休まず
Googleの脆弱性発見AI「Big Sleep」は、広く使われるオープンソースから20件の脆弱性を発見しました。注目すべきは、各脆弱性をAIが人間の介入なしに発見・再現したこと(報告前の品質確認だけ人間が担当)。人間のリサーチャーは集中力にも時間にも限界がありますが、AIは大量のコードベースを疲れず・偏りなく・24時間走査できます。
③ 自動修正(パッチ)まで踏み込む
DARPAが主催した「AI Cyber Challenge(AIxCC)」では、完全自律のAIシステムが、仕込まれた脆弱性の86%を発見し、68%を自動でパッチ。さらに実在するOSSの未知の脆弱性18件を発見し、11件にパッチを生成しました(優勝はジョージア工科大などの混成チームAtlanta)。「見つける」だけでなく「直す」までAIが回せることを示した点で画期的です。
数字で見るAIの実力(2025年)
加えて、日々のセキュリティ運用(SOC)で最も時間を食うアラートのトリアージ(選別)も、AIの得意分野です。アナリストは業務時間の25〜40%を誤検知の調査に費やしているとされますが、AIに一次選別とノイズ除去を任せることで、人間が「本物の脅威」に集中できるようになります。
3. 人間が依然として勝つ領域——文脈・連鎖・判断
では人間は不要かというと、まったく逆です。AIが構造的に苦手な領域が明確に存在します。
① ビジネスロジックの欠陥——「仕様の穴」は意図を理解しないと見えない
最大の弱点がこれです。たとえば「他人のIDを入れると他人の注文が見える」「割引クーポンを無限に適用できる」といったビジネスロジックの欠陥は、コードとしては"正しく動いている"ため、スキャナもAIも見逃しがちです。これは「そのアプリが本来どう動くべきか」を理解していないと発見できません。人間は仕様の意図を読み、"想定外の使い方"を創造的に試せます。
② 脆弱性の連鎖——個別の発見を「現実の攻撃」に組み立てる
現実の侵害は、単独の脆弱性ではなく複数の弱点を連鎖(チェーン)させて成立します。AIは個々の脆弱性を見つけるのは得意でも、「この情報漏洩 → この権限昇格 → この認証バイパス」と現実的な攻撃シナリオに組み立てる戦略的思考は、まだ人間が優位です。実際、攻撃の実証(PoC)段階で「バグは見つけるが悪用できることを証明しきれない」のがAIの典型的な限界として指摘されています。
③ AIの誤検知・ハルシネーション——「自信満々の嘘」
AIはときに、存在しない脆弱性をでっち上げ(ハルシネーション)たり、悪用可能性を誤って分類したりします。後述する国家系の攻撃事例ですら、攻撃に使われたAIは偽の認証情報をでっち上げ、成果を誇張するミスを犯しました。だからこそ、AIの出力は人間の検証(human-in-the-loop)を前提にしなければ、かえってノイズと誤った安心を生みます。Big Sleepが報告前に必ず人間の確認を挟んでいるのも、この理由です。
最も効果的なセキュリティ戦略は、AIによる自動化と、人間主導の分析を組み合わせることだ——これが2026年時点の業界コンセンサスです。
4. タスク別 早見表——どっちに任せるべきか
「AI対人間」を勝ち負けで語るより、タスクごとに役割を割り当てるのが実務的です。下表は主要なセキュリティ作業の適性をまとめたものです。
| 作業 | AIの適性 | 人間の適性 | 推奨 |
|---|---|---|---|
| 大規模コード/ログのスキャン(SAST) | ◎ 速い・網羅的 | △ 量に勝てない | AI主導 |
| 既知パターンの脆弱性発見 | ◎ 24時間・反復に強い | ○ | AI主導 |
| アラートのトリアージ/誤検知除去 | ◎ 一次選別が得意 | ○ 最終判断 | AIで選別→人間が確認 |
| 定型パッチの生成 | ○ 自動化可能 | ○ レビュー必須 | AI生成→人間レビュー |
| ビジネスロジックの欠陥 | △ 意図を理解できない | ◎ 創造的発想 | 人間主導 |
| 脆弱性の連鎖/攻撃シナリオ構築 | △ 戦略が弱い | ◎ 連鎖の設計 | 人間主導 |
| 悪用の実証(PoC) | △ 証明が苦手 | ◎ | 人間主導 |
| インシデント対応の意思決定 | △ 文脈/責任を負えない | ◎ 最終責任 | 人間主導(AIは情報整理) |
| 標的型フィッシングの真偽判断 | ○ 一次フィルタ | ◎ 文脈判断 | 協働 |
傾向は明確です。「広く・速く・反復」はAI、「深く・文脈・最終判断」は人間。両者は競合ではなく補完関係にあります。
5. 見落とされる「AIの三面性」——諸刃の剣
ここがこの記事で最も伝えたい点です。セキュリティにおけるAIは、単なる「優秀な防御者」ではありません。同時に3つの顔を持ちます。
AIが書いたコードの45%に脆弱性。人間製より2.74倍多い(Veracode調査、100以上のLLM×80課題)。XSSは86%で安全に書けない。
国家系グループがClaudeを悪用し攻撃の80〜90%を自律実行。約30の組織を標的にした初の大規模AI主導サイバー攻撃。
同じAIが、実ゼロデイを悪用前に阻止し、上の攻撃を検知・遮断した。守りもAIで対抗する時代に。
顔① AIは「脆弱性を量産する」側でもある
セキュリティ専門企業Veracodeが100以上のLLMに80の実課題を解かせた2025年の調査では、AI生成コードの45%にセキュリティ上の欠陥が含まれていました。人間が書いたコードと比べて脆弱性の密度は約2.74倍。AIによるコーディングが普及した結果、2025年半ばには新規のセキュリティ指摘が月10倍に急増したとの報告もあります。いわゆるバイブコーディングで開発速度は上がっても、その裏でセキュリティ作業はむしろ増えているのです。
顔② 攻撃者は、すでにAIを"自律的に"使っている
2025年11月、Anthropicは初の大規模なAI主導サイバースパイ活動を検知・遮断したと公表しました。中国の国家系グループ(GTG-1002)が、同社のAIコーディングツールであるClaude Codeを悪用し、テック企業・金融・政府機関など約30の標的への侵入を試みたものです。驚くべきは、攻撃の80〜90%をAIが人間の介入なしに実行した点です(攻撃者がAIの安全装置をすり抜けた具体的な手口は、悪用を避けるため本記事では扱いません)。ここで押さえるべき教訓は一つ——AIエージェントの強力さは、そのまま攻撃者の武器にもなり得るということです。だからこそ守る側は、AIエージェントに与える権限と境界を最小限に絞り、その挙動を監視・記録する備えが欠かせません。
顔③ だが、守る側もAIで戦える
重要なのは、その攻撃を検知・遮断したのもAIを活用した防御側だったこと。そして攻撃に使われたAIは前述の通りミス(偽の認証情報の捏造など)も犯しており、攻撃側ですら完全自律には至っていないのが現状です。つまりAIは攻防の両方を加速させる増幅装置であり、「AIを使う防御側 vs AIを使う攻撃側」という新しい構図が生まれています。この軍拡競争では、AIをうまく使いこなす人間チームが優位に立ちます。
6. 結論——勝者は「人間 × AI」
「AIと人間、どちらが優秀か?」への2026年の答えは、「単独で見ればAIは速度と規模で圧勝、しかし最も優秀なのは"人間×AI"の組み合わせ」です。チェスで人間とAIの混成チーム(ケンタウロス)が単独のAIより強かったように、セキュリティでも役割分担が最適解になります。
最適な役割分担モデル
共通ルール: human-in-the-loop(人間の確認)を必ず挟む
実務者・経営者への示唆はシンプルです。セキュリティ人材の価値は「手を動かす作業者」から「AIを使いこなし、その結果を検証し、最終判断を下す監督者」へ移行します。AIに置き換えられるのは反復作業であって、判断・責任・創造性ではありません。これはAIによる仕事への影響全般にも通じる構図です。AIを「敵」や「魔法」と捉えるのではなく、強力だが監督が必要な新人エキスパートとして組織に組み込めるかどうかが、これからのセキュリティの勝敗を分けます。
まとめ——攻撃側もAIで加速する時代だからこそ、守る側もAIを賢く取り入れ、人間の判断と組み合わせて「しっかり守る」ことが何より大切です。AIに丸投げせず、最後は人間が確認する。この基本を徹底するチームが、これからの脅威に強い組織になります。
FAQ
Q. AIが進化すれば、セキュリティの専門家は不要になりますか?
いいえ。AIは反復作業・大規模スキャン・一次選別を肩代わりしますが、ビジネスロジックの欠陥発見、攻撃連鎖の設計、最終的な意思決定と責任は人間の領域です。むしろ「AIを監督・検証できる専門家」の需要は高まります。なくなるのは"作業"であって"判断"ではありません。
Q. 中小企業はこの流れをどう使えばいいですか?
まずは誤検知が多くて手が回らないログ監視やアラートのトリアージ、依存パッケージの脆弱性スキャンなど、「広く・速く・反復」の作業からAIに任せるのが費用対効果が高いです。一方で、本番リリース前の最終レビューや重要な意思決定は人間が握ること。AIの出力を鵜呑みにせず、必ず人間の確認を挟む運用を最初から設計してください。
Q. AIが書いたコードはそのまま本番に出して安全ですか?
危険です。調査ではAI生成コードの約45%に脆弱性が含まれ、人間製の約2.74倍という結果が出ています。AIコーディングは生産性を上げますが、生成コードは必ずレビューとセキュリティテストを通す前提で使ってください。速度の裏でセキュリティ債務が増えやすい点に注意が必要です。
Q. 攻撃者もAIを使っているなら、防御は不利ではないですか?
攻撃・防御の双方がAIで加速する「軍拡競争」になっています。ただし2026年時点では、攻撃に使われるAIもミス(誤情報の捏造など)を犯し、完全自律には至っていません。防御側もAIで自動検知・自動対応を強化できるため、AIをうまく運用できる人間チームを持つ側が優位に立ちます。鍵は「AI導入の有無」ではなく「使いこなしの質」です。