AIと人間、セキュリティで優秀なのは?

Q: Q. 中小企業はこの流れをどう使えばいいですか?

まずは誤検知が多くて手が回らないログ監視やアラートのトリアージ、依存パッケージの脆弱性スキャンなど、「広く・速く・反復」の作業からAIに任せるのが費用対効果が高いです。一方で、本番リリース前の最終レビューや重要な意思決定は人間が握ること。AIの出力を鵜呑みにせず、必ず人間の確認を挟む運用を最初から設計してください。

1. 結論を分けた2025〜2026年の3つの事件
2. AIが人間を圧倒する領域——速度・規模・網羅
3. 人間が依然として勝つ領域——文脈・連鎖・判断
4. タスク別早見表——どっちに任せるべきか
5. 見落とされる「AIの三面性」——諸刃の剣
6. 結論——勝者は「人間 × AI」
FAQ

「セキュリティ対策の仕事は、AIと人間、どちらが優秀なのか?」——2026年現在、この問いに「どちらか一方」と即答するのは、もう正確ではありません。なぜなら直近1年で、AIが人間の専門家を実力で上回った事例と、AIが致命的な弱点をさらけ出した事例が、同時に立て続けに起きたからです。

まず象徴的な3つの出来事を見てください。

2025〜2026年に起きた3つの転機

AIは「守る側」でも「攻める側」でも実戦投入された

実ゼロデイを
悪用前に阻止

Google「Big Sleep」

SQLiteのCVE-2025-6965をAIが単独発見

バグ報奨金で
全米1位

自律AI「XBOW」

HackerOne全米ランキングで人間を抜く

攻撃の80〜90%を
AIが自律実行

初のAI主導サイバー攻撃

Claudeを悪用した国家系スパイ活動

この記事は「守る側」の視点に立ち、Google・Anthropic・DARPA・Veracodeなどの一次情報と実測データをもとに、AIと人間のセキュリティ能力をタスク別に比較します。煽りでも願望でもなく、「どの作業をAIに任せ、どこを人間が握り、どうやって組織を守るか」を具体的に整理するのがゴールです。

この記事の立場：本記事はあくまで防御・セキュリティ対策のための解説です。攻撃の手口や悪用の方法は提供しません。AIが攻撃に悪用された事例も、「AIが攻撃に便利」という話ではなく、私たちが備えるべき脅威として、しっかり守るために紹介しています。

2. AIが人間を圧倒する領域——速度・規模・網羅

まずAI側の実績から。「AIはまだ補助レベル」という認識は、2025年で完全に古くなりました。

① 速度——人間が数日かける作業を数時間で

自律型AIペンテスター「XBOW」は、本来は経験豊富なハッカーが数日かける侵入テストを数時間で完了します。RCE(リモートコード実行)、SQLインジェクション、XSS、SSRF、情報漏洩といった主要な脆弱性カテゴリを横断的に検査し、わずか90日でバグ報奨金プラットフォームHackerOneの全米ランキング1位に到達。数千人の人間ハッカーを抜き去り、1,000件超の脆弱性を報告しました(うち132件は対象企業が修正を確認)。AIが大規模な実環境で人間の専門家を上回った、初めての文書化された事例です。

② 網羅と規模——24時間×大量コードを休まず

Googleの脆弱性発見AI「Big Sleep」は、広く使われるオープンソースから20件の脆弱性を発見しました。注目すべきは、各脆弱性をAIが人間の介入なしに発見・再現したこと(報告前の品質確認だけ人間が担当)。人間のリサーチャーは集中力にも時間にも限界がありますが、AIは大量のコードベースを疲れず・偏りなく・24時間走査できます。

③ 自動修正(パッチ)まで踏み込む

DARPAが主催した「AI Cyber Challenge(AIxCC)」では、完全自律のAIシステムが、仕込まれた脆弱性の86%を発見し、68%を自動でパッチ。さらに実在するOSSの未知の脆弱性18件を発見し、11件にパッチを生成しました(優勝はジョージア工科大などの混成チームAtlanta)。「見つける」だけでなく「直す」までAIが回せることを示した点で画期的です。

数字で見るAIの実力(2025年)

90日

XBOWがHackerOne全米1位に到達した期間

86% / 68%

AIxCCでAIが発見/自動修正した脆弱性の割合

数時間

AIが侵入テスト1件を完了する時間(人間は数日)

加えて、日々のセキュリティ運用(SOC)で最も時間を食うアラートのトリアージ(選別)も、AIの得意分野です。アナリストは業務時間の25〜40%を誤検知の調査に費やしているとされますが、AIに一次選別とノイズ除去を任せることで、人間が「本物の脅威」に集中できるようになります。

3. 人間が依然として勝つ領域——文脈・連鎖・判断

では人間は不要かというと、まったく逆です。AIが構造的に苦手な領域が明確に存在します。

① ビジネスロジックの欠陥——「仕様の穴」は意図を理解しないと見えない

最大の弱点がこれです。たとえば「他人のIDを入れると他人の注文が見える」「割引クーポンを無限に適用できる」といったビジネスロジックの欠陥は、コードとしては"正しく動いている"ため、スキャナもAIも見逃しがちです。これは「そのアプリが本来どう動くべきか」を理解していないと発見できません。人間は仕様の意図を読み、"想定外の使い方"を創造的に試せます。

② 脆弱性の連鎖——個別の発見を「現実の攻撃」に組み立てる

現実の侵害は、単独の脆弱性ではなく複数の弱点を連鎖(チェーン)させて成立します。AIは個々の脆弱性を見つけるのは得意でも、「この情報漏洩 → この権限昇格 → この認証バイパス」と現実的な攻撃シナリオに組み立てる戦略的思考は、まだ人間が優位です。実際、攻撃の実証(PoC)段階で「バグは見つけるが悪用できることを証明しきれない」のがAIの典型的な限界として指摘されています。

③ AIの誤検知・ハルシネーション——「自信満々の嘘」

AIはときに、存在しない脆弱性をでっち上げ(ハルシネーション)たり、悪用可能性を誤って分類したりします。後述する国家系の攻撃事例ですら、攻撃に使われたAIは偽の認証情報をでっち上げ、成果を誇張するミスを犯しました。だからこそ、AIの出力は人間の検証(human-in-the-loop)を前提にしなければ、かえってノイズと誤った安心を生みます。Big Sleepが報告前に必ず人間の確認を挟んでいるのも、この理由です。

最も効果的なセキュリティ戦略は、AIによる自動化と、人間主導の分析を組み合わせることだ——これが2026年時点の業界コンセンサスです。

4. タスク別早見表——どっちに任せるべきか

「AI対人間」を勝ち負けで語るより、タスクごとに役割を割り当てるのが実務的です。下表は主要なセキュリティ作業の適性をまとめたものです。

作業	AIの適性	人間の適性	推奨
大規模コード/ログのスキャン(SAST)	◎ 速い・網羅的	△ 量に勝てない	AI主導
既知パターンの脆弱性発見	◎ 24時間・反復に強い	○	AI主導
アラートのトリアージ/誤検知除去	◎ 一次選別が得意	○ 最終判断	AIで選別→人間が確認
定型パッチの生成	○ 自動化可能	○ レビュー必須	AI生成→人間レビュー
ビジネスロジックの欠陥	△ 意図を理解できない	◎ 創造的発想	人間主導
脆弱性の連鎖/攻撃シナリオ構築	△ 戦略が弱い	◎ 連鎖の設計	人間主導
悪用の実証(PoC)	△ 証明が苦手	◎	人間主導
インシデント対応の意思決定	△ 文脈/責任を負えない	◎ 最終責任	人間主導(AIは情報整理)
標的型フィッシングの真偽判断	○ 一次フィルタ	◎ 文脈判断	協働

傾向は明確です。「広く・速く・反復」はAI、「深く・文脈・最終判断」は人間。両者は競合ではなく補完関係にあります。

5. 見落とされる「AIの三面性」——諸刃の剣

ここがこの記事で最も伝えたい点です。セキュリティにおけるAIは、単なる「優秀な防御者」ではありません。同時に3つの顔を持ちます。

顔① 脆弱性の生成源

AIが書いたコードの45%に脆弱性。人間製より2.74倍多い(Veracode調査、100以上のLLM×80課題)。XSSは86%で安全に書けない。

顔② 攻撃の道具

国家系グループがClaudeを悪用し攻撃の80〜90%を自律実行。約30の組織を標的にした初の大規模AI主導サイバー攻撃。

顔③ 最強の防御者

同じAIが、実ゼロデイを悪用前に阻止し、上の攻撃を検知・遮断した。守りもAIで対抗する時代に。

顔① AIは「脆弱性を量産する」側でもある

セキュリティ専門企業Veracodeが100以上のLLMに80の実課題を解かせた2025年の調査では、AI生成コードの45%にセキュリティ上の欠陥が含まれていました。人間が書いたコードと比べて脆弱性の密度は約2.74倍。AIによるコーディングが普及した結果、2025年半ばには新規のセキュリティ指摘が月10倍に急増したとの報告もあります。いわゆるバイブコーディングで開発速度は上がっても、その裏でセキュリティ作業はむしろ増えているのです。

顔② 攻撃者は、すでにAIを"自律的に"使っている

2025年11月、Anthropicは初の大規模なAI主導サイバースパイ活動を検知・遮断したと公表しました。中国の国家系グループ(GTG-1002)が、同社のAIコーディングツールであるClaude Codeを悪用し、テック企業・金融・政府機関など約30の標的への侵入を試みたものです。驚くべきは、攻撃の80〜90%をAIが人間の介入なしに実行した点です(攻撃者がAIの安全装置をすり抜けた具体的な手口は、悪用を避けるため本記事では扱いません)。ここで押さえるべき教訓は一つ——AIエージェントの強力さは、そのまま攻撃者の武器にもなり得るということです。だからこそ守る側は、AIエージェントに与える権限と境界を最小限に絞り、その挙動を監視・記録する備えが欠かせません。

顔③ だが、守る側もAIで戦える

重要なのは、その攻撃を検知・遮断したのもAIを活用した防御側だったこと。そして攻撃に使われたAIは前述の通りミス(偽の認証情報の捏造など)も犯しており、攻撃側ですら完全自律には至っていないのが現状です。つまりAIは攻防の両方を加速させる増幅装置であり、「AIを使う防御側 vs AIを使う攻撃側」という新しい構図が生まれています。この軍拡競争では、AIをうまく使いこなす人間チームが優位に立ちます。

6. 結論——勝者は「人間 × AI」

「AIと人間、どちらが優秀か?」への2026年の答えは、「単独で見ればAIは速度と規模で圧勝、しかし最も優秀なのは"人間×AI"の組み合わせ」です。チェスで人間とAIの混成チーム(ケンタウロス)が単独のAIより強かったように、セキュリティでも役割分担が最適解になります。

最適な役割分担モデル

AIに任せる

大規模スキャン・既知パターン検出・一次トリアージ・反復作業・定型パッチの下書き・24時間監視

人間が握る

ビジネスロジックの検証・攻撃連鎖の設計・最終判断と責任・AI出力の検証・インシデント対応の意思決定

共通ルール: human-in-the-loop(人間の確認)を必ず挟む

実務者・経営者への示唆はシンプルです。セキュリティ人材の価値は「手を動かす作業者」から「AIを使いこなし、その結果を検証し、最終判断を下す監督者」へ移行します。AIに置き換えられるのは反復作業であって、判断・責任・創造性ではありません。これはAIによる仕事への影響全般にも通じる構図です。AIを「敵」や「魔法」と捉えるのではなく、強力だが監督が必要な新人エキスパートとして組織に組み込めるかどうかが、これからのセキュリティの勝敗を分けます。

まとめ——攻撃側もAIで加速する時代だからこそ、守る側もAIを賢く取り入れ、人間の判断と組み合わせて「しっかり守る」ことが何より大切です。AIに丸投げせず、最後は人間が確認する。この基本を徹底するチームが、これからの脅威に強い組織になります。

FAQ

Q. AIが進化すれば、セキュリティの専門家は不要になりますか?

いいえ。AIは反復作業・大規模スキャン・一次選別を肩代わりしますが、ビジネスロジックの欠陥発見、攻撃連鎖の設計、最終的な意思決定と責任は人間の領域です。むしろ「AIを監督・検証できる専門家」の需要は高まります。なくなるのは"作業"であって"判断"ではありません。

Q. 中小企業はこの流れをどう使えばいいですか?

まずは誤検知が多くて手が回らないログ監視やアラートのトリアージ、依存パッケージの脆弱性スキャンなど、「広く・速く・反復」の作業からAIに任せるのが費用対効果が高いです。一方で、本番リリース前の最終レビューや重要な意思決定は人間が握ること。AIの出力を鵜呑みにせず、必ず人間の確認を挟む運用を最初から設計してください。

Q. AIが書いたコードはそのまま本番に出して安全ですか?

危険です。調査ではAI生成コードの約45%に脆弱性が含まれ、人間製の約2.74倍という結果が出ています。AIコーディングは生産性を上げますが、生成コードは必ずレビューとセキュリティテストを通す前提で使ってください。速度の裏でセキュリティ債務が増えやすい点に注意が必要です。

Q. 攻撃者もAIを使っているなら、防御は不利ではないですか?

攻撃・防御の双方がAIで加速する「軍拡競争」になっています。ただし2026年時点では、攻撃に使われるAIもミス(誤情報の捏造など)を犯し、完全自律には至っていません。防御側もAIで自動検知・自動対応を強化できるため、AIをうまく運用できる人間チームを持つ側が優位に立ちます。鍵は「AI導入の有無」ではなく「使いこなしの質」です。