2026年4月30日、Midjourney V8.1 がmidjourney.comで公開された。3月17日のV8からわずか1ヶ月半、標準生成が従来の4〜5倍速、2K HD(--hd パラメータ)が標準装備、複雑な複数被写体プロンプトの理解率が 95% まで上がった。「同じプロンプトでも、V7とV8では別物が出る」というのが、私が触ってみた感想だ。

同時に、Midjourneyは Discord 一本足だった時代を完全に脱した。Web App(midjourney.com)で全機能が使え、フォルダ管理・履歴検索・Moodboards(自分用スタイルプロファイル)まで揃った。「初心者が最初にDiscordサーバーに参加してbotにコマンドを打つ」という、あの謎の儀式はもう要らない。

私の立場を先に書く。「画像AIをこれから始める普通の人」には、いまでも Midjourney V8 が第一候補だ。Stable Diffusion は自由度で勝るがセットアップが重い、ChatGPT/Geminiの画像生成はインライン使い捨て向き、Adobe Fireflyは商用安全だがアート性で劣る。「綺麗な画像が、月$10から、最小手順で、毎月一定枚数」 という需要に最もきれいに刺さるのが MJ だ。本記事ではプラン選び・プロンプトの書き方・パラメータ・参照画像・落とし穴まで、V8.1時点の最新版で一気に整理する。

Midjourney V8.1 · 完全ガイド

使いこなすと差がつく4つのレバー

— プロンプト文章だけで終わらせない

① 構造化プロンプト
5層レイヤーで書く
Subject → Environment → Style → Lighting → Technical の順に並べる。V8は文脈理解が強いので順序で意味が変わる
② パラメータ
--ar / --stylize / --hd
縦横比・スタイル強度・2K HDの3つを最低限。文章だけで戦うのは初心者だけ
③ 参照画像
--sref / --oref
Style Reference(雰囲気)とOmni Reference(被写体そのもの)の2系統。キャラ一貫性は --oref
④ 個性化
Moodboards + Personalization
200枚以上を評価して自分専用プロファイル作成。V8はこの上で動かすと真価が出る

プロンプト1行で勝負する時代は終わった。「構造 × パラメータ × 参照画像 × 個性化」 の4軸で組むのがV8時代の標準。

1. 2026年4月、Midjourneyは「Discord必須」を卒業した

2022年7月のオープンベータ以来、Midjourneyの代名詞だった 「Discordサーバーに参加して`/imagine`コマンドを打つ」 という導線。これが2024年あたりからWeb App(midjourney.com)にシフトし、V8.1リリース時点で 全機能がWebで完結 するようになった。Discord botは「過去との互換のためにまだ残っている」位置づけだ。

同時にV8.1で起きた変化は速度。Fast モードの標準ジョブが 従来の4〜5倍速、複雑なプロンプトの理解精度が 95% 、--hd パラメータで 2K解像度ネイティブ生成(アップスケール不要)。「品質と速度の両取り」がここまで来た。

もう1つ大事な変化が Personalization の標準化 だ。200〜500枚の画像を評価(好き/嫌い)すると、自分専用のスタイルプロファイルが構築され、それ以降の生成は 「あなた好み」に最初から寄ってくる。「同じプロンプトを打っても、私と他人で違う画像が出る」のがV8.1時代。プロンプトで戦う時代から、プロファイルで戦う時代に移行した と私は考えている。

2. Midjourney とは——3行で言うと

3行解説:

① 何ができる
テキスト→画像生成。アート性・色彩・構図のクオリティが 業界トップクラス。動画機能(V1)も2025年から提供
② どこで使う
Web App(midjourney.com)が主、Discord botは互換用。スマホブラウザでも動く。APIは存在しない
③ いくらかかる
月$10〜$120の4プラン。無料枠は無い(過去に試用期間あったが廃止)。年払いで20%オフ

Midjourneyの強みは 「考えなくても綺麗に出る」 点に尽きる。Stable Diffusionが「パラメータ調整・LoRA選択・ControlNet設定の積み重ねで最高品質を引き出す」のに対し、MJは 素のプロンプト1行でも、業界平均より明らかに上の絵が返ってくる。設定地獄を経ずに結果が手に入る——これが月$10を払う最大の理由だ。

逆に弱点もはっきりしている。APIがない(個人開発者は組み込めない)商用契約は有料プランで「成果物の商用利用OK」になるだけで、ライセンスはMJ側が保持NSFW・暴力表現はSafetyレベルで強制制限。SDで当たり前にできることが、MJではできないことが多い。

3. 料金プラン——4階建ての「GPU時間」モデル

MJの料金体系は「画像枚数」ではなく Fast GPU時間(高速モードで何時間生成できるか)で区切られている。1枚あたり10〜60秒消費するので、3.3時間=約200〜1000枚という目安だ。

プラン 月額(年払い) Fast時間 Relax 想定ユーザー
Basic $10($8) 約3.3時間 なし 趣味・お試し
Standard $30($24) 15時間 無制限 フリーランス・ブロガー
Pro $60($48) 30時間 無制限 プロ・小規模スタジオ
Mega $120($96) 60時間 無制限 エージェンシー・大量生成

※ Fast枯渇後は $4/時間で追加購入可。商用利用権は Basic以上で全プラン同じ

私の率直な評価: 初心者は迷わずStandard($30) がコスパ最強。Basicは Relax モード(無制限ゆっくり生成)が無く、Fast枯渇=即停止なので、月50枚以上作る人にはストレスが大きい。Standard なら Fast 15時間 + Relax 無制限で 月500〜2000枚の実用域 に届く。Pro/Megaに上げるのは「動画機能をガチで使う」「業務で日次100枚以上」になってからで十分だ。

4. Fast / Relax モードの使い分け

これがMJ特有の概念で、最初は混乱する。整理する。

Fast モード
専用GPUで15〜60秒/枚
プラン枠を消費。アイデア検証・本気の1枚に使う
Relax モード
余ったGPUで数分〜時間/枚
無制限・無料枠扱い。試行錯誤・大量バリエ生成に使う

使い分けの基本: 最初はRelaxで構図/プロンプトを探る → 方向性が決まったらFastで完成度上げ。Fast を全部「とりあえず生成」に使うと、月の中旬で枯渇する

5. プロンプトの基本構造——5層レイヤーが効く

V8のプロンプトは 「単語の並び順」で意味が変わる。前に来た要素ほど影響度が高い。経験的に効くのが以下の5層構造だ。

① SUBJECT
主役。「a samurai」「young woman」「red sports car」など。具体的に
② ENVIRONMENT
背景・場所。「in a bamboo forest」「on a rainy Tokyo street」
③ STYLE
画風。「cinematic photography」「watercolor illustration」「cyberpunk anime」
④ LIGHTING
光源。「golden hour」「neon backlight」「soft studio lighting」
⑤ TECHNICAL
カメラ・レンズ・パラメータ。「shot on Hasselblad H6D, 85mm, shallow depth of field --ar 16:9 --stylize 750」

完成例: a samurai, in a bamboo forest, cinematic photography, golden hour, shot on Hasselblad, shallow depth of field --ar 16:9 --stylize 750

初心者がやりがちなのが 「a beautiful samurai」 のような感覚言葉で始めること。MJはこれを「主役の特徴」として処理してしまうので、「美しさ」の方向に引っ張られて構図が散る。感覚言葉ではなく具体名詞・固有名詞(Hasselblad、golden hour、85mm 等)で書くと、V8の解釈精度が一気に上がる。「写真用語を知っている人ほどMJが上手い」と言われる所以だ。

6. 必須パラメータ7選——--ar / --stylize / --chaos など

プロンプト末尾に付ける `--xxx` 形式のパラメータ。最低限知っておくべき7つを実例とともに整理する。

パラメータ 値の範囲 効果 使い所
--ar 1:1 / 16:9 / 9:16 / 3:2 等 縦横比 SNS横長は16:9、ストーリーは9:16
--stylize (--s) 0〜1000(既定100) アート解釈の強さ 写実=低(50-250)、アート=高(750-1000)
--chaos (--c) 0〜100(既定0) 4枚の差分の大きさ アイデア発散=高、決め打ち=低
--hd フラグ 2K HDネイティブ生成 印刷・大型表示用(V8.1)
--raw フラグ MJ独自フィルタを外す 写真的・忠実な表現が欲しいとき
--q (--quality) 1 / 2 / 4 細部の作り込み度 --q 4 は複雑シーン用(V8新規)
--no 単語 特定要素を除外 `--no text` で文字を消すなど

個人的に 「これだけは毎回使う」 のが `--ar` と `--stylize`。デフォルト1:1は SNS投稿ですら使いにくく、stylize 100 も平均的すぎる。「とりあえず `--ar 16:9 --stylize 500` を付ける癖をつける」 と、出力品質の底上げになる。`--chaos` は試行錯誤フェーズ専用、`--hd` は完成画像専用と棲み分ける。

7. 参照画像機能——--sref / --oref / Moodboards / Personalization

V8時代のMJで 「文章だけで戦う初心者」と「使いこなしている上級者」の差 はここで出る。4つの参照系機能を整理する。

--sref
Style Reference
参照画像の 「雰囲気・色合い・タッチ」 だけを継承。被写体は新しく作る。「この水彩画風で〜」
--oref
Omni Reference(V7+)
参照画像の 「被写体そのもの」 を新画像に置く。キャラ・物・乗物。--ow 0-1000 で強度
Moodboards
スタイルプロファイル
複数画像を集めて 「自分用美的プロファイル」 を作成。プロジェクトごとに分けられる
Personalization
アカウント学習
200〜500枚の「好き/嫌い」評価で あなた好みに自動チューニング。--stylize 1000 と最も相性が良い

選び方: 同じキャラを連作 → --oref。特定アーティスト風で量産 → --sref。プロジェクト全体の統一感 → Moodboards。自分のセンス育てる → Personalization

個人的に最も革命的だったのが --oref(Omni Reference、V7から導入)。「同じキャラクターで100枚作る」が、これ以前はLoRA訓練が必要で Stable Diffusion 一択だった。MJも 参照画像のURL貼り付け+強度指定だけで、ほぼ同じ顔の連作 が出せる時代になった。SDの優位性が1つ崩れた瞬間でもある。

8. ハマりやすい3つの落とし穴

落とし穴①: 文字描画はV8でも「マシ」止まり

V8でテキストレンダリングは大きく改善されたが、Ideogram V3 や GPT Image 2 ほどの精度は出ない。ロゴ・ポスター・看板の文字が必須の案件で MJ単独で完結させようとすると失敗する。実用解は「MJで背景+構図を作る → Photoshop/Figmaで文字を別レイヤーで重ねる」または「文字込みは Ideogram/GPT Image」と棲み分ける。MJ単体で「Logo with the text 〇〇」を期待してはいけない。

落とし穴②: 商用利用は「Basic以上で解禁」だが著作権はMJ保持

MJの規約は微妙にややこしい。有料プラン(Basic以上)なら生成画像を商用利用OK。だが 「画像の著作権はMJが保持し、ユーザーには利用ライセンスが与えられる」 という構造。Stability AI(SD)の「ユーザーが完全に所有」モデルとは違う。年商$1M超の企業はProプラン以上が必須、過去30日以内に作った画像も契約解除すると利用権が消える。広告制作で MJ画像を使うときはこの辺を法務確認すべき。

落とし穴③: APIがない=アプリ組み込み不可

SD・GPT Image・FLUX には API があり、アプリやワークフローに組み込める。MJには公式APIが無い(Web App と Discord bot のみ)。「自分のサービスにMJ画像生成を組み込みたい」なら、第三者ラッパー(UseAPIなど)を使うか、別の画像AIを選ぶことになる。これは過去6年変わっていないMJの方針で、おそらく今後も変わらない。「アーティスト個人が手で使うツール」 という位置づけを崩さない、というスタンスだ。

まとめ

プラン選び
初心者は迷わず Standard($30/月)。Basic は Relax 無しで枯渇即停止
プロンプト
5層レイヤー(Subject→Environment→Style→Lighting→Technical)+具体名詞で書く
パラメータ
毎回 --ar と --stylize。完成画像は --hd、試行錯誤は --chaos
差をつける
Personalization + --oref で「あなただけの画風 × 同じキャラ連作」が完成

Midjourneyは2022年から「画像生成AIの王」を維持し続けている数少ないツールだ。V8.1で速度・テキスト・参照画像が一段上がり、「Stable Diffusionでしかできなかったこと」も多くがカバーされた。「綺麗な絵を、最小手順で、毎月一定枚数」 という需要に対して、いまも最適解は MJ である。とはいえ、文字描画・API・キャラ完全一致・商用所有権——これらが必要な人は依然SDや他ツールに行く必要がある。万能ツールではなく「アート性に特化した有料サービス」 として腰を据えて付き合うのが、MJを長く使う秘訣だ。

FAQ

無料で試せますか?

いまは無料枠ありません。過去(2023年頃まで)は25枚程度の無料トライアルがありましたが、悪用増加で廃止されました。最低 Basic プラン $10/月から。年払いなら $8/月相当です。

DiscordとWeb Appどっちで使うべき?

Web App(midjourney.com)一択です。フォルダ管理・履歴検索・Moodboards・参照画像のドラッグ&ドロップなど、Webにしかない機能が多数。Discord botは2022年からの互換用で、新機能の追加は止まっています。

Stable Diffusion とどっちを選ぶべき?

用途が違います。「綺麗な画像を簡単に」「月額$10で完結」「設定地獄を回避したい」なら Midjourney「同じキャラを大量生成」「秘密データを混ぜたい」「電気代以外無料」「APIで組み込みたい」なら Stable Diffusion。両方持つプロも多いです。

商用利用は可能ですか?

Basic以上の有料プランで商用利用OK(広告・販売・クライアントワーク全て可)。ただし 著作権はMJ社が保持し、ユーザーには利用ライセンスが付与される という独特の構造。年商$1M超の企業はProプラン以上が義務付けられます。SDの「ユーザー完全所有」とは違う点に注意。

同じキャラクターを連作するには?

--oref(Omni Reference、V7+) が現状ベストです。基準キャラ画像のURLを `--oref [URL]` で指定、`--ow 100-400` で強度調整。これ以前は Stable Diffusion + LoRA一択だったので、革命的な改善でした。完璧な一致が必要なら依然SDが上ですが、95%似ていれば良いケースの大半は MJ で完結します。

Fast時間が切れたらどうなる?

Standard以上なら自動的に Relax モード(無制限・低速)に切り替わります。Basic は完全停止し、追加 Fast 時間を $4/時間で買うか、来月まで待つ必要があります。「Fast枯渇後の対応がない」のが Basic の最大の弱点で、Standard に乗り換えるべき最大の理由でもあります。