跳到内容
主题

设计

探索AI驱动的设计。图像生成、UI/UX设计、Logo创作和视觉设计技巧。

7 篇文章

排序文章以找到您需要的内容

AI 视频生成入门 [2026]——后 Sora 时代格局、Veo/Kling 与提示词技巧

AI 视频生成入门 [2026]——后 Sora 时代格局、Veo/Kling 与提示词技巧

输入一段文字,几秒钟就诞生一段带声音的视频——这在不久前还是科幻情节,到了 2026 年却变成现实,而局势正以惊人速度变化。曾主导话题的 OpenAI 的 Sora 已于 2026 年 4 月关停 App 与网页版(API 也将在 9 月跟进),取而代之的是 Google Veo、Kling 与 Runway 占据领先。这份截至当前(2026 年 6 月)、与具体工具无关的指南,涵盖什么是 AI 视频生成(从文字或图片生成动态影像,音频同步、1080p–4K 与图生视频已成标准)、2026 年的格局(Sora 关停——据报道背景为算力与成本压力及用户减少——以及当前领先者 Google Veo 3.1、Kling 3.0、Runway Gen-4.5,按秒计费为常态)、原理(扩散模型扩展到时间维度;文生视频与图生视频)、通用的 5 步流程(选工具、提示词/图片、设置时长/画幅/音频、生成并挑选、在剪辑中拼接)、核心的视频提示词技巧(主体 + 运动 + 运镜 + 风格 + 时长 + 音频,动词与运镜是关键,一镜一动、善用图生视频、多生成再挑选)、现在能做什么与还做不到什么(一次性做长片与完全一致性仍困难,按秒成本会累积),以及权利、水印与伦理要点(SynthID 与 C2PA 让 AI 来源标记成为无法移除的标准,纯 AI 输出受保护弱且各国有差异,商用取决于条款,真实人物的深度伪造是禁区)。不要追求一次性做出长片,而要做镜头再在剪辑中拼接。由于该领域变化迅速,请始终通过官方渠道确认最新信息。

AI 图像生成入门——原理、4 个步骤、图像提示词结构剖析与版权

AI 图像生成入门——原理、4 个步骤、图像提示词结构剖析与版权

"我不会画画,所以这跟我没关系"——这种对 AI 图像生成的成见恰恰说反了。只要用语言下达指令,几秒钟后你就能得到专业级的视觉作品。本篇跨工具指南讲解:什么是 AI 图像生成(用语言从零做出图像——考验的是表达沟通而非绘画的本领,可谓图像版的提示词工程);它的原理(扩散模型以你的提示词为线索,从随机噪点中雕刻出一幅画,每次都从零绘制,所以结果会抖动);在任何工具中都通用的 4 步工作流(选择工具、写提示词、生成并挑选、修整并完成——迭代是前提);核心的 6 部分图像提示词结构(主体、场景/背景、风格、光线/色彩、构图/视角、技术参数)外加负面提示词与画面比例——不过 GPT Image 和 Imagen 偏好平实的句子,而 Stable Diffusion 系列则吃词语罗列和负面提示词;7 个精通技巧(多跑几次、一点一点加、参考图、局部重绘、固定种子、放大、保存好用的提示词);AI 不擅长什么(手、文字、一致性、精细准确度)及其应对;以及工作中必备的版权、商用和伦理要点(依据美国版权局和 2025 年 Thaler 判例,纯 AI 产出的保护很弱,且各国有别;商用取决于各工具的条款;深度伪造和未经许可模仿画风是禁区;像 DALL-E 的 C2PA 来源元数据这样的标注正在普及)。该选哪个工具以及各工具的具体操作,链接到对比、Midjourney 和 Stable Diffusion 等文章。了解结构、多跑几次、把词语一点一点加上去——任何人都能逼近自己想要的那张图。

Midjourney 使用指南——V8.1 完全攻略:套餐、五层提示词、参数与参考

Midjourney 使用指南——V8.1 完全攻略:套餐、五层提示词、参数与参考

2026 年 4 月 30 日,Midjourney V8.1 在 midjourney.com 上线——Fast 生成速度提升 4–5 倍,--hd 提供原生 2K HD,复杂提示词准确率达到 95%,"必须用 Discord"的时代正式终结。本文涵盖套餐选择(Basic 10 美元 / Standard 30 美元 / Pro 60 美元 / Mega 120 美元,新手推荐 Standard)、Fast 与 Relax 模式、五层提示词结构(主体→环境→风格→光线→技术)、七大必备参数(--ar/--stylize/--chaos/--hd/--raw/--q/--no)、四项参考功能(--sref 氛围 / --oref 主体 / Moodboards / Personalization),以及三大陷阱(文字渲染、版权归 MJ 所有、无 API)。对于"漂亮的图、步骤最少"这套需求,2026 年的答案仍是 MJ。

什么是 Stable Diffusion——开源图像 AI 的工作原理、本地运行与商用授权全解

什么是 Stable Diffusion——开源图像 AI 的工作原理、本地运行与商用授权全解

2022 年 8 月 22 日,Stability AI 发布了一款图像生成模型的权重文件,图像 AI 从此不再是"云端背后的某种东西",而成了"在自己 PC 上运行的软件"。本文覆盖 Stable Diffusion 的工作原理(扩散模型)、版本谱系(SD1.5/SDXL/SD3.5 与 FLUX)、按 VRAM 档位看本地运行的真实情况、从 SD3 反弹到现行 Community License 100 万美元上限的授权演变,以及 Civitai/LoRA/ComfyUI/A1111/ControlNet 生态,再加上 Midjourney 与 SD 之间该如何取舍。最后给出三大陷阱:版权、NSFW,以及代际之间的兼容性割裂。读完你就能判断自己是"Midjourney 就够了"的人,还是"真的需要 SD"的人。

AI 设计工具横向对比——按使用场景看 Canva、Adobe Firefly、Figma AI 与 Recraft

AI 设计工具横向对比——按使用场景看 Canva、Adobe Firefly、Figma AI 与 Recraft

曾说"我不擅长设计"的人,如今半天就能产出十条社交帖子,顺带还能拿到 logo 提案——这就是 2026 年 AI 设计工具所处的位置。本文对比四大工具:Canva(量产营销、社交与幻灯片的最佳选择,免费–15 美元)、Adobe Firefly(与 Photoshop/Illustrator 集成且商用安全,9.99 美元起)、Figma AI(团队 UI/UX 与产品设计的标准,每位编辑者 15 美元起)、Recraft(矢量 logo 与图标,文字准确率 90%,10 美元起)。四款并非竞争关系,而是角色分工——收敛到契合最高频任务的那一款。与图像生成 AI 对比(Midjourney 等)不同:本文谈"基于图像做交付物",而非图像本身。含对比表、六大最佳选型场景,以及版权、品牌一致性、"AI 感"三大注意点。

图像生成 AI 八大工具——按用途分类对比

图像生成 AI 八大工具——按用途分类对比

2026 年 4 月,OpenAI 的 DALL·E 把接力棒交给 GPT Image 2;同月 Google 的 Imagen 4 Ultra 拿下写实冠军,3 月 Midjourney V8 已带来 5 倍速度与 2K 默认输出。Black Forest Labs 的 FLUX 1.1 Pro Ultra 以 0.04 美元/张反击,Ideogram V3 文字准确率 90–95%,Recraft V3 占据矢量与设计系统输出,Adobe Firefly Image 5 则打商用安全牌服务广告与出版。本文把 2026 年 5 月的八大主流图像 AI 工具按 5 大强项阵营(照片 / 文字 / 艺术 / 商用安全 / 设计系统)整理,梳理计费模式(订阅 vs 按张付费 vs 免费),给出 6 种用途的决策模式,并讲清商用与版权的常见陷阱——全部基于独立测评数据与实战视角。