目录
2026 年 4 月 30 日,Midjourney V8.1 在 midjourney.com 上线。距 3 月 17 日的 V8 仅六周,标准生成速度提升至原来的 4–5 倍,2K HD(--hd)成为标配,复杂多主体提示词的理解准确率达到 95%。"同样一条提示词,V7 与 V8 出来的东西完全不同"——这是实际使用后毫不夸张的体感。
与此同时,Midjourney 彻底摆脱了"只能在 Discord 上用"的过去。所有功能现在都能在 Web App(midjourney.com)里完成——文件夹管理、历史搜索、Moodboards(你自己的风格档案),一应俱全。那个让人迷惑的入门仪式——加入 Discord 服务器、给机器人贴指令——对新用户来说已经不再是必经之路。
先把立场摆出来。对于刚开始接触图像 AI 的普通人来说,Midjourney V8 仍然是首选。Stable Diffusion 自由度更高但搭建成本沉重,ChatGPT/Gemini 的图像生成适合随手用一用就丢,Adobe Firefly 商用安全但艺术质感偏弱。"漂亮的图、每月 10 美元起、步骤最少、每月配额固定"——这套需求至今依然由 MJ 接得最干净。本文涵盖套餐选择、提示词写法、参数、参考功能与陷阱,全部基于 V8.1 现状。
拉开高手差距的四个杠杆
— 不要停留在"只会写提示词"
"一行提示词"的时代已经结束。"结构 × 参数 × 参考 × 个性化"才是 V8 的标准做法。
1. 2026 年 4 月——Midjourney 告别"必须用 Discord"的时代
自 2022 年 7 月公开测试以来,Midjourney 的标志性工作流一直是"加入 Discord 服务器并输入 `/imagine`"。这一格局自 2024 年起开始向 Web App(midjourney.com)转移,到 V8.1 已经实现所有功能在网页端完整可用。Discord 机器人如今处于"出于向后兼容仍然保留"的位置。
V8.1 带来的另一项变化是速度。Fast 模式标准任务提速 4–5 倍,复杂提示词准确率达到 95%,--hd 参数可直接生成原生 2K 分辨率(无需后续放大)。质量与速度,终于可以兼得。
第三项重大变化是 Personalization 的崛起。为 200–500 张图打分(喜欢/不喜欢),系统会构建一份贴合你品味的风格档案——此后每次生成都会从一开始就向你的偏好倾斜。"同一条提示词,你和我生成出的图就是不同的"——这在 V8.1 已是常态。我们已经从提示词时代迈入了档案时代,这是我的判断。
2. 三行读懂 Midjourney
三行概括:
Midjourney 的强项归结成一句话就是:"不太用动脑也能很好看。"当 Stable Diffusion 需要通过堆叠参数调整、LoRA 选型与 ControlNet 配置才能榨出顶级质量时,MJ 仅凭一行裸提示词,就能交出明显高于行业平均水准的结果。免去搭建地狱也能拿到结果——这就是你每月 10 美元买到的东西。
它的弱项同样清晰:没有 API(个人开发者无法嵌入自己的应用);付费套餐附带的商用授权允许商业使用生成结果,但版权仍归 MJ 所有;NSFW 与暴力内容在 Safety 层被硬性限制。许多在 SD 上轻而易举的事,在 MJ 上根本不在菜单里。
3. 价格——四档"GPU 时长"模式
MJ 卖的不是"每月 X 张图",而是 Fast GPU 时长(你能以 Fast 模式生成的总时长)。每张图消耗 10–60 秒,所以 3.3 小时大致对应 200–1,000 张图。
| 套餐 | 月费(年付价) | Fast 时长 | Relax | 适合谁 |
|---|---|---|---|---|
| Basic | 10 美元(8 美元) | 约 3.3 小时 | 无 | 兴趣爱好 / 轻度尝鲜 |
| Standard | 30 美元(24 美元) | 15 小时 | 无限 | 自由职业 / 博主 |
| Pro | 60 美元(48 美元) | 30 小时 | 无限 | 专业人士 / 小型工作室 |
| Mega | 120 美元(96 美元) | 60 小时 | 无限 | 代理机构 / 批量产出 |
注:Fast 用完后可按 4 美元/小时追加购买。Basic 及以上的商用权完全一致
我的真心话:新手请毫不犹豫地选 Standard(30 美元)——性价比最高。Basic 没有 Relax 模式,Fast 一旦用完就立刻停摆,对于每月要做 50 张以上的人来说会持续焦虑。Standard 给你 15 小时 Fast 加上无限 Relax,能轻松覆盖每月 500–2,000 张图。只有当你认真用视频,或工作上需要每天生成 100 张以上时,才升级到 Pro/Mega。
4. Fast 与 Relax——何时该用哪一个
这个概念是 MJ 特有的,常把新用户绕晕。我们来理清。
规则:先在 Relax 中探索构图与提示词,再切到 Fast 打磨定稿。如果一上来就用 Fast"先生成再说",月中就会见底
5. 提示词结构——真正奏效的五层框架
在 V8 中,提示词的词序会改变含义。靠前的词权重更高。从经验来看,下面这套五层结构最为奏效。
完整示例:a samurai, in a bamboo forest, cinematic photography, golden hour, shot on Hasselblad, shallow depth of field --ar 16:9 --stylize 750
新手最常犯的错误是把感受性词汇放在最前面,比如 "a beautiful samurai"。MJ 会把 "beautiful" 当作主体的某种特征,把结果往"美感"上拽,构图就散掉了。把感受性词汇换成具体名词或专有名词(Hasselblad、golden hour、85mm 等),V8 对你的理解准确率会显著提高。"懂摄影的人往往更会用 MJ"——这是有道理的。
6. 七个必备参数——--ar / --stylize / --chaos 等
参数就是你接在提示词末尾的 `--xxx` 标记。下面这七个绝对要掌握,附上各自的适用场景。
| 参数 | 取值范围 | 作用 | 何时使用 |
|---|---|---|---|
| --ar | 1:1 / 16:9 / 9:16 / 3:2 等 | 宽高比 | 横版社交用 16:9,竖屏故事用 9:16 |
| --stylize (--s) | 0–1000(默认 100) | 艺术化诠释强度 | 低(50–250)求写实,高(750–1000)求艺术感 |
| --chaos (--c) | 0–100(默认 0) | 四宫格内的差异度 | 高值求发散创意,低值求方向收敛 |
| --hd | 开关 | 原生 2K HD 生成 | 用于印刷 / 大屏(V8.1) |
| --raw | 开关 | 剥离 MJ 标志性滤镜 | 想要更摄影感、更如实的产出 |
| --q (--quality) | 1 / 2 / 4 | 细节处理力度 | --q 4 适合复杂场景(V8 新增) |
| --no | 词语 | 排除特定元素 | 例如 `--no text` 用于抑制文字 |
我个人每次都会用的两个:--ar 与 --stylize。默认的 1:1 即便用于社交也别扭,stylize 100 又是个不上不下的中间值。养成总是追加 `--ar 16:9 --stylize 500` 的习惯,你的产出基线质量就会上一个台阶。--chaos 留给探索,--hd 留给定稿——把车道分清楚。
7. 参考功能——--sref / --oref / Moodboards / Personalization
这里正是 V8 时代"还在和散文搏斗的新手"与"真正会用这个工具的进阶用户"之间差距浮现的地方。围绕参考的四个功能,逐个拆解。
怎么选:多张图里同一角色 → --oref。按某位艺术家氛围批量出图 → --sref。整个项目统一观感 → Moodboards。训练整体审美 → Personalization
我心中最具革命性的是 --oref(Omni Reference,自 V7 起)。"为同一角色生成 100 张图"过去需要 LoRA 训练,意味着只能用 Stable Diffusion。而现在 MJ 只需贴一张图片 URL 并设定强度,就能近乎同人物地批量产出。这正是 SD 的护城河之一被攻破的瞬间。
8. 三大常见陷阱
陷阱 ①:V8 的文字渲染是"更好了",而不是"够好了"
V8 在文字方面进步显著,但仍达不到 Ideogram V3 或 GPT Image 2 的精度。如果任务需要可靠的 logo / 海报 / 招牌文字,妄想只用 MJ 一个工具搞定就会翻车。实战做法是:用 MJ 生成背景与构图,文字另在 Photoshop / Figma 中叠加——或将对文字依赖度高的任务直接交给 Ideogram / GPT Image。别指望"Logo with the text XYZ"靠 MJ 一己之力实现。
陷阱 ②:商用从"Basic 起即解锁",但版权归 MJ 所有
MJ 的条款有些微妙。任何付费套餐(Basic 及以上)都允许商用生成图片。但"图像版权归 MJ 所有,你获得的是使用授权"——这与 Stability AI 的"用户拥有一切"模式在结构上完全不同。年营收 100 万美元以上的公司必须使用 Pro 及以上,且取消订阅可能会令过去 30 天内创建的图像权利失效。如果你要把 MJ 产出用在广告创意里,务必让法务过一遍。
陷阱 ③:没有 API = 无法嵌入应用
SD、GPT Image、FLUX 都提供 API,可以被嵌入应用与工作流中。MJ 没有官方 API——只能用 Web App 与 Discord 机器人。若想在自家服务里嵌入 MJ 的图像生成,要么走第三方包装层(UseAPI 等),要么换一款图像 AI。这是 MJ 六年来的立场,几乎可以肯定不会改变。"由艺术家亲手使用的工具"——这个定位他们坚决不愿打破。
总结
Midjourney 是为数不多自 2022 年至今稳坐"图像生成 AI 王者"宝座的工具之一。V8.1 在速度、文字与参考方面又上了一个台阶,许多"过去只有 Stable Diffusion 能做"的事现在也被覆盖。对于"漂亮的图、最少的步骤、每月固定配额"这套需求,MJ 仍然是正确答案。话虽如此,如果你需要文字精度、API、完美的角色复刻或对产出的真正所有权,你还是会去 SD 或别的工具。这不是一个全能工具,而是一项以艺术质感为核心的付费服务——带着这个认知进入,才是长期与 MJ 相处的秘诀。
FAQ
可以免费试用吗?
如今没有免费层。曾经有大约 25 张图的免费试用(持续到 2023 年前后),但因被滥用而下线。最低门槛是每月 10 美元的 Basic 套餐——按年付折算相当于每月 8 美元。
Discord 还是 Web App——该选哪个?
如今唯一明智的选择是 Web App(midjourney.com)。文件夹管理、历史搜索、Moodboards、拖拽放入参考图,以及大多数新功能都是网页独占。Discord 机器人被冻结在 2022 年时期的功能集上,那里不再增加新能力。
Stable Diffusion 与 Midjourney——选哪个?
擅长的活不同。"漂亮的图、简单、10 美元封顶、无搭建地狱" → Midjourney。"批量产出同一角色"、"混入私有数据"、"除电费外免费"、"通过 API 嵌入" → Stable Diffusion。不少专业人士会两者并用。
可以商用吗?
可以,任何付费套餐(Basic 及以上)——广告、销售、客户项目都允许。但是MJ 保留版权,授予你使用许可——这与 SD"你完全拥有"的结构不同。年营收 100 万美元以上的公司必须订阅 Pro 及以上。
如何让同一角色出现在多张图中?
--oref(Omni Reference,V7+)是当前最优路径。通过 `--oref [URL]` 传入参考图 URL,并以 `--ow 100–400` 调节强度。在此之前唯一的选项是"Stable Diffusion + 训练好的 LoRA",因此这是一项重大胜利。如果你需要精确复刻的保真度,SD 依然更强;但对于满足大多数需求的 95% 相似度场景,MJ 现已能胜任。
Fast 时长用完后会怎样?
在 Standard 及以上套餐下,会自动降到 Relax(无限,速度较慢)。在 Basic 下则完全停摆——按 4 美元/小时追加购买 Fast,或等到下个月。"Fast 一用完就无路可走"是 Basic 最大的短板,也是升级到 Standard 最有力的理由。