2026 年 4 月 30 日,Midjourney V8.1 在 midjourney.com 上线。距 3 月 17 日的 V8 仅六周,标准生成速度提升至原来的 4–5 倍,2K HD(--hd)成为标配,复杂多主体提示词的理解准确率达到 95%。"同样一条提示词,V7 与 V8 出来的东西完全不同"——这是实际使用后毫不夸张的体感。

与此同时,Midjourney 彻底摆脱了"只能在 Discord 上用"的过去。所有功能现在都能在 Web App(midjourney.com)里完成——文件夹管理、历史搜索、Moodboards(你自己的风格档案),一应俱全。那个让人迷惑的入门仪式——加入 Discord 服务器、给机器人贴指令——对新用户来说已经不再是必经之路。

先把立场摆出来。对于刚开始接触图像 AI 的普通人来说,Midjourney V8 仍然是首选。Stable Diffusion 自由度更高但搭建成本沉重,ChatGPT/Gemini 的图像生成适合随手用一用就丢,Adobe Firefly 商用安全但艺术质感偏弱。"漂亮的图、每月 10 美元起、步骤最少、每月配额固定"——这套需求至今依然由 MJ 接得最干净。本文涵盖套餐选择、提示词写法、参数、参考功能与陷阱,全部基于 V8.1 现状。

Midjourney V8.1 · 完全指南

拉开高手差距的四个杠杆

— 不要停留在"只会写提示词"

① 结构化提示词
分五层来写
主体 → 环境 → 风格 → 光线 → 技术。V8 会读取顺序——调换词语就会改变含义
② 参数
--ar / --stylize / --hd
宽高比、风格强度、2K HD——最低限度的三件套。只写散文是新手做派
③ 参考图
--sref / --oref
Style Reference(氛围)与 Omni Reference(主体本身)。角色一致性 = --oref
④ 个性化
Moodboards + Personalization
为 200+ 张图打分,构建你自己的档案。在档案之上跑 V8 才真正出彩

"一行提示词"的时代已经结束。"结构 × 参数 × 参考 × 个性化"才是 V8 的标准做法。

1. 2026 年 4 月——Midjourney 告别"必须用 Discord"的时代

自 2022 年 7 月公开测试以来,Midjourney 的标志性工作流一直是"加入 Discord 服务器并输入 `/imagine`"。这一格局自 2024 年起开始向 Web App(midjourney.com)转移,到 V8.1 已经实现所有功能在网页端完整可用。Discord 机器人如今处于"出于向后兼容仍然保留"的位置。

V8.1 带来的另一项变化是速度。Fast 模式标准任务提速 4–5 倍,复杂提示词准确率达到 95%,--hd 参数可直接生成原生 2K 分辨率(无需后续放大)。质量与速度,终于可以兼得。

第三项重大变化是 Personalization 的崛起。为 200–500 张图打分(喜欢/不喜欢),系统会构建一份贴合你品味的风格档案——此后每次生成都会从一开始就向你的偏好倾斜。"同一条提示词,你和我生成出的图就是不同的"——这在 V8.1 已是常态。我们已经从提示词时代迈入了档案时代,这是我的判断。

2. 三行读懂 Midjourney

三行概括:

① 它做什么
文生图。艺术质感、配色与构图水准在业界名列前茅。视频(V1)自 2025 年起也已上线
② 在哪里使用
Web App(midjourney.com)为主,Discord 机器人作为历史遗留。移动端浏览器也能用。没有 API
③ 多少钱
四档套餐,每月 10 至 120 美元。没有免费层(曾有试用,已下线)。年付可省 20%

Midjourney 的强项归结成一句话就是:"不太用动脑也能很好看。"当 Stable Diffusion 需要通过堆叠参数调整、LoRA 选型与 ControlNet 配置才能榨出顶级质量时,MJ 仅凭一行裸提示词,就能交出明显高于行业平均水准的结果。免去搭建地狱也能拿到结果——这就是你每月 10 美元买到的东西。

它的弱项同样清晰:没有 API(个人开发者无法嵌入自己的应用)付费套餐附带的商用授权允许商业使用生成结果,但版权仍归 MJ 所有NSFW 与暴力内容在 Safety 层被硬性限制。许多在 SD 上轻而易举的事,在 MJ 上根本不在菜单里。

3. 价格——四档"GPU 时长"模式

MJ 卖的不是"每月 X 张图",而是 Fast GPU 时长(你能以 Fast 模式生成的总时长)。每张图消耗 10–60 秒,所以 3.3 小时大致对应 200–1,000 张图。

套餐 月费(年付价) Fast 时长 Relax 适合谁
Basic 10 美元(8 美元) 约 3.3 小时 兴趣爱好 / 轻度尝鲜
Standard 30 美元(24 美元) 15 小时 无限 自由职业 / 博主
Pro 60 美元(48 美元) 30 小时 无限 专业人士 / 小型工作室
Mega 120 美元(96 美元) 60 小时 无限 代理机构 / 批量产出

注:Fast 用完后可按 4 美元/小时追加购买。Basic 及以上的商用权完全一致

我的真心话:新手请毫不犹豫地选 Standard(30 美元)——性价比最高。Basic 没有 Relax 模式,Fast 一旦用完就立刻停摆,对于每月要做 50 张以上的人来说会持续焦虑。Standard 给你 15 小时 Fast 加上无限 Relax,能轻松覆盖每月 500–2,000 张图。只有当你认真用视频,或工作上需要每天生成 100 张以上时,才升级到 Pro/Mega。

4. Fast 与 Relax——何时该用哪一个

这个概念是 MJ 特有的,常把新用户绕晕。我们来理清。

Fast 模式
独占 GPU,每张图 15–60 秒
消耗套餐配额。用于创意验证与正式定稿
Relax 模式
空闲 GPU,每张图数分钟到数小时
无限量,可视为免费。用于反复试错与批量变体

规则:先在 Relax 中探索构图与提示词,再切到 Fast 打磨定稿。如果一上来就用 Fast"先生成再说",月中就会见底

5. 提示词结构——真正奏效的五层框架

在 V8 中,提示词的词序会改变含义。靠前的词权重更高。从经验来看,下面这套五层结构最为奏效。

① 主体
画面主角。"a samurai"、"young woman"、"red sports car"。要具体
② 环境
场景设定。"in a bamboo forest"、"on a rainy Tokyo street"
③ 风格
艺术风格。"cinematic photography"、"watercolor illustration"、"cyberpunk anime"
④ 光线
光源。"golden hour"、"neon backlight"、"soft studio lighting"
⑤ 技术
相机、镜头、参数。"shot on Hasselblad H6D, 85mm, shallow depth of field --ar 16:9 --stylize 750"

完整示例:a samurai, in a bamboo forest, cinematic photography, golden hour, shot on Hasselblad, shallow depth of field --ar 16:9 --stylize 750

新手最常犯的错误是把感受性词汇放在最前面,比如 "a beautiful samurai"。MJ 会把 "beautiful" 当作主体的某种特征,把结果往"美感"上拽,构图就散掉了。把感受性词汇换成具体名词或专有名词(Hasselblad、golden hour、85mm 等),V8 对你的理解准确率会显著提高。"懂摄影的人往往更会用 MJ"——这是有道理的。

6. 七个必备参数——--ar / --stylize / --chaos 等

参数就是你接在提示词末尾的 `--xxx` 标记。下面这七个绝对要掌握,附上各自的适用场景。

参数 取值范围 作用 何时使用
--ar 1:1 / 16:9 / 9:16 / 3:2 等 宽高比 横版社交用 16:9,竖屏故事用 9:16
--stylize (--s) 0–1000(默认 100) 艺术化诠释强度 低(50–250)求写实,高(750–1000)求艺术感
--chaos (--c) 0–100(默认 0) 四宫格内的差异度 高值求发散创意,低值求方向收敛
--hd 开关 原生 2K HD 生成 用于印刷 / 大屏(V8.1)
--raw 开关 剥离 MJ 标志性滤镜 想要更摄影感、更如实的产出
--q (--quality) 1 / 2 / 4 细节处理力度 --q 4 适合复杂场景(V8 新增)
--no 词语 排除特定元素 例如 `--no text` 用于抑制文字

我个人每次都会用的两个:--ar 与 --stylize。默认的 1:1 即便用于社交也别扭,stylize 100 又是个不上不下的中间值。养成总是追加 `--ar 16:9 --stylize 500` 的习惯,你的产出基线质量就会上一个台阶。--chaos 留给探索,--hd 留给定稿——把车道分清楚。

7. 参考功能——--sref / --oref / Moodboards / Personalization

这里正是 V8 时代"还在和散文搏斗的新手"与"真正会用这个工具的进阶用户"之间差距浮现的地方。围绕参考的四个功能,逐个拆解。

--sref
Style Reference
只继承参考图的氛围、配色与笔触,主体则重新生成。"以这种水彩风格……"
--oref
Omni Reference(V7+)
把参考图的实际主体本身搬进新图。角色、物件、车辆。强度通过 --ow 0–1000 调节
Moodboards
风格档案
把多张图捆成"你个人的美学档案"。可按项目分别设立
Personalization
账号级学习
为 200–500 张图打喜欢/不喜欢,模型自动向你的品味微调。与 --stylize 1000 搭配最佳

怎么选:多张图里同一角色 → --oref。按某位艺术家氛围批量出图 → --sref。整个项目统一观感 → Moodboards。训练整体审美 → Personalization

我心中最具革命性的是 --oref(Omni Reference,自 V7 起)。"为同一角色生成 100 张图"过去需要 LoRA 训练,意味着只能用 Stable Diffusion。而现在 MJ 只需贴一张图片 URL 并设定强度,就能近乎同人物地批量产出。这正是 SD 的护城河之一被攻破的瞬间。

8. 三大常见陷阱

陷阱 ①:V8 的文字渲染是"更好了",而不是"够好了"

V8 在文字方面进步显著,但仍达不到 Ideogram V3 或 GPT Image 2 的精度。如果任务需要可靠的 logo / 海报 / 招牌文字,妄想只用 MJ 一个工具搞定就会翻车。实战做法是:用 MJ 生成背景与构图,文字另在 Photoshop / Figma 中叠加——或将对文字依赖度高的任务直接交给 Ideogram / GPT Image。别指望"Logo with the text XYZ"靠 MJ 一己之力实现。

陷阱 ②:商用从"Basic 起即解锁",但版权归 MJ 所有

MJ 的条款有些微妙。任何付费套餐(Basic 及以上)都允许商用生成图片。"图像版权归 MJ 所有,你获得的是使用授权"——这与 Stability AI 的"用户拥有一切"模式在结构上完全不同。年营收 100 万美元以上的公司必须使用 Pro 及以上,且取消订阅可能会令过去 30 天内创建的图像权利失效。如果你要把 MJ 产出用在广告创意里,务必让法务过一遍。

陷阱 ③:没有 API = 无法嵌入应用

SD、GPT Image、FLUX 都提供 API,可以被嵌入应用与工作流中。MJ 没有官方 API——只能用 Web App 与 Discord 机器人。若想在自家服务里嵌入 MJ 的图像生成,要么走第三方包装层(UseAPI 等),要么换一款图像 AI。这是 MJ 六年来的立场,几乎可以肯定不会改变。"由艺术家亲手使用的工具"——这个定位他们坚决不愿打破。

总结

套餐选择
新手:选 Standard(30 美元/月)。Basic 没有 Relax——Fast 一空就硬停
提示词
五层结构(主体→环境→风格→光线→技术)加上具体名词
参数
始终带上 --ar 与 --stylize。--hd 留给定稿,--chaos 留给探索
差距浮现之处
Personalization + --oref = "自己的风格 × 系列中角色保持一致"

Midjourney 是为数不多自 2022 年至今稳坐"图像生成 AI 王者"宝座的工具之一。V8.1 在速度、文字与参考方面又上了一个台阶,许多"过去只有 Stable Diffusion 能做"的事现在也被覆盖。对于"漂亮的图、最少的步骤、每月固定配额"这套需求,MJ 仍然是正确答案。话虽如此,如果你需要文字精度、API、完美的角色复刻或对产出的真正所有权,你还是会去 SD 或别的工具。这不是一个全能工具,而是一项以艺术质感为核心的付费服务——带着这个认知进入,才是长期与 MJ 相处的秘诀。

FAQ

可以免费试用吗?

如今没有免费层。曾经有大约 25 张图的免费试用(持续到 2023 年前后),但因被滥用而下线。最低门槛是每月 10 美元的 Basic 套餐——按年付折算相当于每月 8 美元。

Discord 还是 Web App——该选哪个?

如今唯一明智的选择是 Web App(midjourney.com)。文件夹管理、历史搜索、Moodboards、拖拽放入参考图,以及大多数新功能都是网页独占。Discord 机器人被冻结在 2022 年时期的功能集上,那里不再增加新能力。

Stable Diffusion 与 Midjourney——选哪个?

擅长的活不同。"漂亮的图、简单、10 美元封顶、无搭建地狱" → Midjourney"批量产出同一角色"、"混入私有数据"、"除电费外免费"、"通过 API 嵌入" → Stable Diffusion。不少专业人士会两者并用。

可以商用吗?

可以,任何付费套餐(Basic 及以上)——广告、销售、客户项目都允许。但是MJ 保留版权,授予你使用许可——这与 SD"你完全拥有"的结构不同。年营收 100 万美元以上的公司必须订阅 Pro 及以上。

如何让同一角色出现在多张图中?

--oref(Omni Reference,V7+)是当前最优路径。通过 `--oref [URL]` 传入参考图 URL,并以 `--ow 100–400` 调节强度。在此之前唯一的选项是"Stable Diffusion + 训练好的 LoRA",因此这是一项重大胜利。如果你需要精确复刻的保真度,SD 依然更强;但对于满足大多数需求的 95% 相似度场景,MJ 现已能胜任。

Fast 时长用完后会怎样?

在 Standard 及以上套餐下,会自动降到 Relax(无限,速度较慢)。在 Basic 下则完全停摆——按 4 美元/小时追加购买 Fast,或等到下个月。"Fast 一用完就无路可走"是 Basic 最大的短板,也是升级到 Standard 最有力的理由。