ファインチューニングとは？RAGとの違い・LoRA/QLoRA・使い分け

Q: ファインチューニングとRAG、どっちを選ぶ？

目的で決めます。最新・社内の&quot;知識・事実&quot;が必要ならRAG、&quot;振る舞い・型・口調&quot;を固定したいならファインチューニング。実務では両方を組み合わせるのが一般的です。まずはRAGとプロンプトから試しましょう。

ファインチューニングとは？RAGとの違い・LoRA/QLoRA・いつ使うかを初心者向けに解説

1. ファインチューニングとは
2. 何が得意で何が苦手？
3. RAG・プロンプトとの使い分け
4. 主な手法（フル・LoRA・QLoRA）
5. 必要なデータ・コスト・ツール
6. いつやるべき？（順番が大事）
まとめ
FAQ

「AIを自社専用にカスタマイズしたい」——そんなときに候補に挙がるのがファインチューニング（fine-tuning）だ。学習済みのLLMに追加で学習させ、特定の用途に"育てる"技術である。ただし、いきなり手を出すと高コストで失敗しやすい。本記事では、ファインチューニングとは何か・何が得意か・RAGやプロンプトとの使い分け・手法・必要なもの・始める順番までを初心者向けに整理する。

FINE-TUNING · モデルを自分専用に育てる

RAGは「知識」、FTは「振る舞い」

— まずプロンプトとRAG。最後の手段がファインチューニング

STEP 1

プロンプト

まず指示を工夫。無料で一番速い。

STEP 2

RAG（検索）

最新・社内知識はここで足す。

STEP 3

ファインチューニング

それでも足りない時の最終手段。

1. ファインチューニングとは

ファインチューニングとは、すでに学習を終えたAIモデル（ベースモデル）に、自分の用途に合わせたデータを追加で学習させ、専用モデルに作り替えること。例えば「自社の文体で回答する」「特定フォーマットで出力する」「専門分野の言い回しに強くする」——といった"クセ"や"型"をモデル自体に覚え込ませる。

イメージは「新人研修」だ。優秀な人材（ベースモデル）を採用しても、自社のやり方は知らない。そこで自社の事例で研修すれば、毎回細かく指示しなくても"自社流"で動けるようになる。モデルの重み（パラメータ）そのものを少し書き換えるのがファインチューニングだ。

💡 ひとことで：ファインチューニング＝「モデル自体に"型"を覚えさせる追加学習」。プロンプトやRAGが"その都度の指示・資料渡し"なのに対し、FTはモデルの性質を恒久的に変える。

2. 何が得意で何が苦手？

ここを誤解すると失敗する。ファインチューニングは「振る舞い（behavior）を変える」のが得意で、「最新の知識を覚える」のは苦手だ。

○ 得意（振る舞い）

決まった文体・口調で答える
特定フォーマットで出力する
専門分野の言い回しに馴染ませる
毎回の長い指示を不要にする

✕ 苦手（知識）

頻繁に変わる最新情報を覚える
社内文書を"事実"として正確に保持
覚えた内容の出典を示す
学習後の更新（その都度再学習が必要）

「最新情報や社内データを正しく扱いたい」なら、ファインチューニングよりRAG（検索して文脈に足す方式）が向く。逆に「常にこの口調・この形式で」という型の固定はファインチューニングの独壇場だ。

3. RAG・プロンプトとの使い分け

AIをカスタムする方法は3つあり、コストと役割が違う。まず全体像を表で押さえよう。

手法	役割	コスト	向いている用途
プロンプト	指示を工夫する	ほぼ無料	まず最初に試す。多くはこれで足りる
RAG	知識を検索して足す	中	最新・社内の"事実"が必要なとき
ファインチューニング	振る舞いを覚え込ませる	高	型・口調を固定、大量処理のコスト最適化

⚠️ よくある誤解：「精度が出ない＝ファインチューニングが必要」ではない。専門家いわく「"FTが要る"の8割は、検索（RAG）やプロンプトの改善で解決する」。順番を飛ばさないことが何より大事。

覚え方はシンプル。「事実・知識はRAG、性格・型はファインチューニング、まずはプロンプト」。実際の本番システムでは、RAGで事実・FTで振る舞いを担い、3つを組み合わせるのが2026年の定石だ。これはコンテキストエンジニアリングの考え方とも地続きになっている。

4. 主な手法（フル・LoRA・QLoRA）

ファインチューニングにはいくつかやり方がある。初心者がまず知るべきは次の3つだ。

フルファインチューニング

モデルの全パラメータを更新。最も強力だが、計算資源もコストも最大。個人や小規模には重い。

LoRA

本体は凍結し、小さな"アダプタ"だけを学習。更新する量がごく一部なので、軽く・安く済む（PEFTの代表）。

QLoRA（おすすめ）

LoRAに4bit量子化を組み合わせ、大きいモデルも控えめなGPUで学習可能。初心者の最初の一歩に最適。

ポイントは「まずQLoRAで試す」こと。専門家も「LoRA/QLoRAでうまくいかないなら、フルでもほぼうまくいかない」と言う。ローカルLLMと組み合わせれば、手元のPCで小さく試すことも可能だ。

5. 必要なデータ・コスト・ツール

ファインチューニングで一番大変なのは、実は学習そのものより「データ作り」だ。目安を押さえておこう。

データ量：高品質な例が500件以上欲しい。50件未満では学習の手がかりとして不足、とされる。質が量より効く。
準備の手間：収集・クリーニング・整形・品質確認に数週間〜数ヶ月かかることも。ここが本番。
コスト：本格的には5,000〜50,000ドル超の例も。OpenAIの追加学習は訓練トークンあたり約25〜100ドル/100万トークン（モデルによる）と公表されている。
ツール：OpenAIのファインチューニングAPI、Unsloth、Axolotl、Hugging Face、Together、Databricks など。手軽さ重視ならマネージド型から。

※数値はベンダー公表・各種ガイドの引用（2026年6月時点）。実際の費用はモデル・データ量・手法で大きく変動する。

6. いつやるべき？（順番が大事）

失敗を避ける鉄則は「順番を守る」こと。次の流れで、前段でダメだった時だけ次へ進む。

① プロンプトを磨く：プロンプトエンジニアリングで多くは解決。無料で即試せる。
② RAGを足す：最新・社内の事実が必要ならRAG。FTより安く更新も楽。
③ それでも型が安定しないならFT：「常にこの口調・形式」「大量処理でコスト最適化」が目的のときに初めて検討。

💡 判断の目安：「知識が足りない」→RAG。「言うことを聞かない・型が崩れる」→ファインチューニング。この切り分けができれば、無駄な投資を避けられる。

まとめ

ファインチューニングを3点に整理する。

正体：学習済みモデルに追加学習させ、振る舞い・型をモデル自体に覚えさせる技術。重みを書き換える。
使い分け：知識はRAG、振る舞いはFT、まずはプロンプト。"FTが必要"の多くは検索改善で解決する。
始め方：手法はQLoRAから。高品質データ500件以上が目安で、データ作りが本番。コストは高め。

結論、ファインチューニングは「最後の手段」。まずはプロンプトとRAGを試し、それでも型が安定しない時に検討しよう。関連してRAGやコンテキストエンジニアリングも読むと、AIカスタムの全体像がつかめる。

FAQ

Q. ファインチューニングとRAG、どっちを選ぶ？

A. 目的で決めます。最新・社内の"知識・事実"が必要ならRAG、"振る舞い・型・口調"を固定したいならファインチューニング。実務では両方を組み合わせるのが一般的です。まずはRAGとプロンプトから試しましょう。

Q. 個人でもファインチューニングできる？

A. できます。QLoRAなら控えめなGPUでも小型モデルを学習でき、ローカルLLMと組み合わせれば手元のPCでも試せます。まずは小さなデータと小型モデルで感覚をつかむのがおすすめです。

Q. データはどれくらい必要？

A. 目安は高品質な例が500件以上です。50件未満では学習の手がかりが足りません。ただし量より質が重要で、ばらつきのない丁寧なデータのほうが効果が高いとされます。

Q. ファインチューニングすれば最新情報も覚える？

A. 苦手です。学習した時点の内容は反映されますが、その後の更新には再学習が必要で、出典も示せません。頻繁に変わる情報や社内文書の正確な参照は、RAGの担当領域です。

ファインチューニングとは？RAGとの違い・LoRA/QLoRA・いつ使うかを初心者向けに解説

RAGは「知識」、FTは「振る舞い」

1. ファインチューニングとは

2. 何が得意で何が苦手？

3. RAG・プロンプトとの使い分け

4. 主な手法（フル・LoRA・QLoRA）

5. 必要なデータ・コスト・ツール

6. いつやるべき？（順番が大事）

まとめ

FAQ

関連記事

ChatGPT・Claude・Geminiの知識カットオフ日一覧｜主要8モデルを最新比較

生成AIとは？従来のAIとの違いをわかりやすく解説

生成AIの得意なこと・苦手なこと｜できること・できないことを具体例で解説

LLM（大規模言語モデル）とは？仕組み・主要モデル・活用法をわかりやすく解説

コメント

コメントを投稿