ローカルLLMを動かす環境が整ったら、次の悩みは「結局どのモデルを入れればいい?」だ。Llama・Qwen・Gemma・DeepSeek…と名前が多く、しかも作っている会社も国もバラバラ。本記事は、2026年時点の主要モデルを「開発元・出身国・用途・サイズ・ライセンス」で整理し、あなたのPCと目的に合う「最初の1つ」を選べるようにする。

大事な前提を先に。オープンモデルは更新が非常に速い(同じ名前でも版が次々上がる)。だから本記事は「ファミリー(系統)+用途別の選び方」を軸にする。これなら新版が出ても考え方は変わらない。具体的な最新版・ライセンス条件は配布元(Ollama / Hugging Face)で必ず確認してほしい。

LOCAL LLM · MODELS

「最強の1つ」ではなく「自分に合う1つ」

— 開発元・国・用途・サイズで候補は絞れる

🇺🇸

米国

Llama / Gemma / Phi

🇨🇳

中国

Qwen / DeepSeek / GLM

🇫🇷

欧州

Mistral

🇯🇵

日本

ELYZA / PLaMo ほか

1. 結論:万能の1つはない。用途×サイズ(+出身国)で選ぶ

先に結論を。「これさえ入れれば完璧」という万能モデルは存在しない。ローカルでは、次の3点で絞り込むのが正解だ。

💡 選び方の3軸:① サイズ(自分のVRAMに乗る上限)=候補の天井。② 用途(総合・コーディング・日本語・推論)=向く系統。③ 出身国・開発元(ライセンス・調達方針・言語の得意分野)=仕事で使うなら無視できない。

2. 主要モデルファミリー一覧(開発元・国つき)

2026年のローカルLLMは、いくつかの主要ファミリー(系統)に集約される。誰が・どの国で作っているかと合わせて押さえると、一気に選びやすくなる。その前に、表で出てくる用語を2つだけ。

📖 ミニ用語解説

B(パラメータ数)=モデルの規模を表す単位。B は「billion=10億」で、7B=70億、70B=700億パラメータの意味。大きいほど賢い傾向だが、重く(VRAMを多く消費)なる

MoE(混合エキスパート)=毎回すべてを動かすのではなく、入力ごとに一部の“専門家”だけが働く仕組み。総サイズは超巨大でも実際に動く分は軽めで効率が良い。

Qwen(クウェン)

🇨🇳 開発元:Alibaba(中国)/ライセンス:多くApache 2.0

総合力が高く日本語などCJK(漢字圏)に強い。3B〜数百B(MoE)までサイズ展開が広く、コーディング特化版も。多くの人の第一候補。代表:Qwen3 系。

Llama(ラマ)

🇺🇸 開発元:Meta(米国)/独自ライセンス(要確認)

最も普及し情報量が多い定番。作例・ノウハウが豊富で困ったとき調べやすい。汎用の安定株。代表:Llama 3.x/4 系。

Gemma(ジェマ)

🇺🇸 開発元:Google(米国)/Gemma ライセンス

軽量で効率が良く、小〜中型でも品質が高い。マルチモーダル対応版も。低スペックPCの有力候補。代表:Gemma 3 系。

DeepSeek(ディープシーク)

🇨🇳 開発元:DeepSeek(中国)/R1 は MIT 等

推論・コーディングが強い蒸留された小型版もあり、限られたVRAMで“賢さ”を狙える。代表:DeepSeek-R1/V3 系。

Mistral(ミストラル)

🇫🇷 開発元:Mistral AI(フランス/欧州)

中型で軽快かつバランスが良い。欧州の「ソブリンAI(自国AI)」の旗手。小型はApache 2.0が多い。代表:Mistral Small 等。

Phi(ファイ)

🇺🇸 開発元:Microsoft(米国)/MIT

超小型でも賢いのが売りの小型特化(SLM)。8GB級の非力なPCやノートでも動かしやすく、入門に最適。代表:Phi-4 系。

このほか、GLM(🇨🇳 Zhipu AI=清華大発・コーディング評価が高い)、Falcon(🇦🇪 UAEのTII)、Command(🇨🇦 Cohere・RAG向き)などもある。まずは上の主要系統から、用途に近いものを起点にするとよい。

3. 「出身国」で何が変わる?

「どの国のモデルか」は、性能だけでは見えない実務上の違いを生む。ここを誤解しないために、まず大前提を押さえておこう。

大前提:ローカルで動かす限り、入力データは外(=開発元の国)に送信されない。これがローカルLLM最大の利点だ。つまり「中国製モデル=入力が中国に送られる」ということはない(クラウドAPIとは別物)。出身国が効いてくるのは、主に下の3点だ。

⚖️

ライセンス・商用条件

開発元ごとに規約が違う。Apache 2.0/MITは寛容、独自ライセンスは規模・用途・表示の制限があることも。製品利用は要確認

🏛️

組織・政府の調達方針

官公庁や大企業では「特定国製AIの採用可否」を社内規定で定める場合がある。調達・コンプラ上の論点として確認を。

🗣️

得意な言語・文化

学習データの傾向で得意言語が変わる。中国系はCJKに強く、日本製は日本語の自然さ・文化理解で有利なことが多い。

ざっくりした「お国柄」はこうだ。🇺🇸 米国=エコシステム最大・情報豊富・概ね扱いやすい。🇨🇳 中国=性能と効率で先行・多くが寛容ライセンスだが、組織によっては採用可否の確認が必要。🇫🇷 欧州=規制重視の「ソブリンAI」志向でバランス型。🇯🇵 日本=日本語の質と国産志向(次章)。

4. 日本製(国産)ローカルLLMという選択肢

日本語を主に使うなら、国産(日本製)モデルも有力だ。日本語の自然さ・敬語・文化的文脈で強みを出しやすく、国産志向の組織でも採用しやすい。開発方針は大きく2つに分かれる。

フルスクラッチ系(ゼロから国産開発)

PLaMo(Preferred Networks)、CyberAgent CALM3Sarashina(SB Intuitions)、NTT tsuzumiLLM-jp など。日本語データ設計から作り込む。商用利用可なものも多い。

海外モデル+日本語強化系

ELYZA(Llamaに日本語追加学習・政府案件でも採用)、Swallow(Qwen等を日本語継続学習)、Rakuten AI など。海外の土台に日本語を上乗せして実用性を高める。

💡 使い分けの目安:純粋な総合力なら Qwen 等のグローバル系、日本語の自然さ・国産要件・公共/業務での説明しやすさを重視するなら国産系。両方を同じ質問で試して比べるのが確実だ(版・商用条件は各配布元で要確認)。

5. サイズ別おすすめ(具体モデル)

動かせるVRAMで選べる範囲が決まる。サイズ帯ごとの“狙い目”を、具体モデル例とともに(いずれもQ4量子化前提)。

〜4B(超小型)

VRAM 〜6GB / 入門・ノートPC

Phi-4 mini、Gemma 3 4B、Qwen3 4B、Llama 3.2 3B など。チャット・要約・軽作業向け。まず試すならここ。

7B〜14B(標準)

VRAM 8〜12GB / 日常の主力

Qwen3 7B/14B、Llama 8B、Gemma 12B など。実用品質と軽さのバランスが最良。最初の常用モデルに。

32B級(上位)

VRAM 24GB / しっかり実用

Qwen コーダー 32B、Mistral 中型、DeepSeek 蒸留版など。コーディングや込み入った作業で頼れる品質。

70B級+(本格)

VRAM 40GB+ / 大容量Mac・複数GPU

Llama 70B、DeepSeek 大型、ELYZA-JP 70B など。クラウド中位に迫る品質。

6. 用途別おすすめ

「何に使いたいか」で系統を選ぶ。代表的な用途ごとの“向いている系統”はこうだ。

🧩 総合・なんでも

Qwen(🇨🇳)か Llama(🇺🇸)。迷ったらこの2系統のサイズ違いから。情報も多く外れにくい。

💻 コーディング

Qwen コーダーDeepSeekGLM(いずれも🇨🇳が強い領域)。32B級が乗ると品質が一段上がる。

🗾 日本語・多言語

Qwen(CJK強)か、国産系(ELYZA/PLaMo/Swallow 等)。日本語の自然さ重視なら国産が有力。

🧠 推論・思考

DeepSeek の推論系や、各系統の「thinking(思考)」対応版。難問・段取りに強い。

🪶 低スペック・軽量

Phi(🇺🇸)や Gemma(🇺🇸)の小型、Qwen/Llamaの3〜4B。8GB級でも軽快。

📚 長い文章を扱う

長い文脈長対応の系統(例:Llama の長文脈版)。ただしメモリ消費に注意。

💡 多くの人の正解:日本語中心なら 「Qwen の自分のVRAMに乗る最大サイズ」、または国産系から始めるのが失敗しにくい。物足りなければ用途特化(コーダー等)や大きいサイズへ。

7. ライセンス(商用利用)の注意

仕事や製品で使うなら、見落とせないのがライセンスだ。同じ「オープン」でも条件が違う。商用利用の可否・条件は必ず配布元で確認すること。

✅ 寛容(商用しやすい)

Apache 2.0 / MIT 系(例:Qwen・Gemma※・Phi・DeepSeekの多く)。商用利用しやすく、製品組み込みの自由度が高い。

⚠️ 独自条件あり

一部は独自ライセンス(規模制限・用途制限・表示義務など)。Llama 系やGemma ライセンスは条項を要確認。商用前に必ず目を通す。

8. 選び方フローと導入

ここまでをまとめると、選び方は3ステップだ。

  1. サイズを決める:自分のVRAM上限から、乗る最大サイズを選ぶ(必要スペックの記事参照)。
  2. 用途+出身国で系統を選ぶ:総合=Qwen/Llama、コーディング=Qwenコーダー/DeepSeek/GLM、日本語=Qwen/国産系、軽量=Phi/Gemma。商用ならライセンスと調達方針も照合。
  3. 1つ落として試す:物足りなければ一段上のサイズor用途特化へ。同じ質問で複数を比べるのが一番早い。

💡 導入はかんたんOllama や LM Studio なら、モデル名を選んでダウンロードするだけ(例:ollama pull qwen3 のように数分)。複数を入れて同じ質問で比べると、自分に合う1つがすぐ見つかる。

まとめ

ローカルLLMのモデル選びは、次の3点で迷わない。

  • 万能はない・3軸で選ぶ:サイズ(VRAM上限)×用途×出身国(ライセンス・調達・言語)。
  • 系統+国で覚える:Qwen/DeepSeek/GLM(🇨🇳)、Llama/Gemma/Phi(🇺🇸)、Mistral(🇫🇷)、ELYZA/PLaMo/Sarashina ほか(🇯🇵)。版は更新が速いので系統で把握。
  • ローカルなら入力は外に出ない:出身国が効くのは主にライセンス・調達方針・得意言語。商用はライセンス確認が必須。

迷ったら、日本語中心なら「Qwen の自分のVRAMに乗る最大サイズ」か国産系から。あとは実際に動かして、クラウドとの違いも体感しながら、自分の用途にいちばん合う1つへ寄せていけばいい。導入手順はローカルLLMの始め方へ。

FAQ

Q. 結局、最初に入れるならどれ?

A. 日本語中心なら「Qwen(中国・Alibaba)の、自分のVRAMに乗る最大サイズ」か、国産系(ELYZAやPLaMoなど)がおすすめです。総合力・多言語・サイズ展開のバランスが良く外れにくい選択です。軽さ優先ならPhi(米Microsoft)やGemma(米Google)の小型も好相性です。

Q. 中国製モデルを使うと、入力が中国に送られるの?

A. いいえ。ローカルで動かす限り、入力データは外部に一切送信されません(自分のPC内で完結)。これはクラウドAPIとの決定的な違いです。出身国が関係するのは、主にライセンス(商用条件)・組織の調達方針・得意な言語であって、データ送信先ではありません。

Q. 日本語が得意なローカルモデルは?

A. CJKに強いQwen系が無難です。さらに自然な日本語や敬語・文化的文脈を重視するなら、国産系(ELYZA/PLaMo/Sarashina/CyberAgent CALM3/Swallow など)が有力です。用途に応じて両方を試して比べるとよいでしょう。

Q. 小さいモデルでも実用になる?

A. 用途次第で十分です。チャット・要約・下書き・分類などの日常作業なら、3〜7B級でも快適に使えます。複雑な推論や長い文脈が要る作業ほど、大きいサイズが有利になります。

Q. 仕事で使うとき気をつけることは?

A. ライセンスと調達方針の確認が最重要です。Apache 2.0やMITは商用利用しやすい一方、独自ライセンス(Llama系・Gemmaライセンス等)は規模・用途・表示などの条件が付くことがあります。また組織によっては特定国製AIの採用可否を定めている場合があるため、製品組み込み前に配布元の規約と社内規定の両方を確認してください。