AI绘图之Midjourney教程详版(建议收藏学习)
简介
随着 ChatGPT 的爆火,越来越多的人开始关注并尝试 AI 相关的应用。而图片生成就是其中一个备受瞩目的领域。
目前已经有许多图像生成工具,如Midjourney、Stable Diffusion、DALL-E、Firefly等。
本教程主要是以 Midjourney 为主,让你可以快速了解并学会使用文生图工具。
最新水平
Midjourney 的图片生成水平如何?
以下是我截取部份 Midjourney 官网上的例子。
如果你对 Midjourney 的了解仅仅停留在上面的话,那我可以很兴奋的告诉你实际上Midjourney能做的更多。
这里我直接展示几张 Midjourney V5算法生成的图片。
Midjourney 可用于各种垂直场景,包括但不限于logo、插图、漫画、海报、头像、人物摄影等等。
Discord 注册
Midjourney 目前是在Discord频道上运行。我们可以通过 Discord 的机器人进行指令操作,最终返回图片。
前往 Midjourney.com,选择加入 Beta,或直接前往Midjourney Discord。
我们可以直接点击进入Midjourney Discord频道。
当然如果你直接搜索进入Midjourney的官网,你同样可以通过点击右下角的绿色按钮Join the Beta来进入频道。
如果你在Discord注册过程遇到问题,你可以查看最新的官网注册教程。
加入 Newbies 新手频道
Midjourney 给新用户创建了 Newbies 新手频道,我们只需要在左侧栏选择任意一个 newbies- 频道:
在官方服务器上
选择newbies-左侧边栏中可见的任何频道。
在其他服务器上
您可以在任何已邀请 Bot 的服务器上使用 Midjourney Bot 生成图像。在您的服务器上查找有关在何处使用机器人的说明。
使用 /imagine 指令
在 Discord 上使用命令与 Midjourney Bot 互动。指令可用来创建图像,改变默认设置,监控用户信息,以及执行其他有用的任务。
该/imagine命令从简短的文本描述(称为 {{glossary.Prompt}})生成一个独特的图像。
输入 /imagine 或者输入/,从弹出窗口中选择/imagine
在"prompt"字段中输入你想创建的图像的文本描述。
回车以发送你的信息。
Midjourney Bot将会产生一个弹出窗口,要求你接受服务条款。你必须同意服务条款才能生成图片。
例如,我们输入:dog is playing ball, cute, fluffy
点击回车发送后,你会看到 Bot 在你原有输入的基础上添加了两个字段,一个是@"用户名",用于区分。一个是以百分比形式显示的进度fast。
如果您在键入命令时没有看到弹出窗口/imagine,请尝试注销,更新 Discord 应用程序,然后重新登录。
命令仅在机器人频道中有效。命令在trial-support 等常规渠道中不起作用。
Midjourney Bot 最适合使用清晰具体的句子来描述完成的工作。它不适用于对话式请求列表。
图片生成处理
需要大约一分钟的时间来生成四个选项。
生成图像会激活免费的 Midjourney 试用版。试用用户在需要订阅之前可以完成大约 25 个工作。
作业是使用 Midjourney Bot 的任何操作。工作包括使用/imagine命令创建图像网格、放大图像或创建图像变体,全部使用您的免费试用时间。
使用/info命令检查你的快速剩余时间查看您的剩余试用时间。
Upscale or Upscale Redo
在初始图像网格(四张图)生成完毕后,出现两排按钮:
U1U2U3U4
U 按钮放大图像,生成所选图像的更大版本并添加更多细节。
V1V2V3V4
V 按钮创建所选网格图像的细微变化。创建变体会生成与所选图像的整体风格和构图相似的新图像网格。
(重新滚动)重新运行作业。在这种情况下,它将重新运行原始提示,生成新的图像网格。
回到我们刚刚生成的小狗图像,让我们试着看看这两个按钮的实际效果。
U按钮将图像放大:生成所选图像的较大版本,并添加更多细节。
升级(放大)图像后,你会在图像下方看到一行按钮,可以选择使用不同的升级器模型重新升级。
Make Variations:创建放大图像的变体并生成包含四个选项的新网格;
Light /Beta Upscale:使用不同的升级器模型重做升级;
Web: 在Midjourney官网上打开图库中的图像;
常规(默认)Regular Upscale
默认升频器在平滑或细化细节的同时增加了图像尺寸。
Light Upscale
轻型升级器会创建一个 1024px x 1024px 的图像并添加适量的细节和纹理。
Beta Upscale
Beta Upscaler 创建了一个 2048px x 2048px 的图像,而没有添加许多额外的细节。Beta Uspcaler 适用于面部和光滑表面。
直接在prompt中使用升频器参数可达到同样的效果。添加--uplight,--upbeta或--upanime到提示的末尾。
Midjourney 首先为每个作业生成一个低分辨率图像选项网格。可以在任何网格图像上使用 Midjourney upscaler 来增加尺寸并添加更多细节。
有多种可用于放大图像的放大模型。
每个图像网格下方的按钮用于放大所选图像。U1 U2 U3 U4
官网最新的升级器参数细节
Create Variations
V按钮创建所选图像的轻微变体
创建一个新的图像网格,网络里面的图片与所选图像的整体风格和构图相似。
Re-roll
点击(re-roll)意味着重新运行原始提示,产生一个新的图像网格。
图片保存
点击图片以打开它的全尺寸视图,然后右击并选择保存图片。
在手机上,你可以长按图片,然后点右上角的下载图标。
邀请机器人到私人服务器
使用免费房间的缺点之一就是信息量太大,你生成的内容很容易被混在别人的消息当中。
这时我们可以把 Midjourney Bot 拉到我们自己的服务器上。
然而, 在私人服务器上产生的 Midjourney 图片仍然受到 Midjourney 社区准则的约束,而且生成的图像仍然是对 midjourney.com 上的其他用户可见。
一旦 Midjourney Bot 加入你的服务器,你就可以开始使用/imagine指令与其交互。
创建服务器
点击左侧栏的+按钮来创建服务器,然后点亲自创建,选择仅供我和我的朋友使用,创建服务器名称,头像可以是官方默认的,填写完成之后就可以进入我们的私人服务器。
对话 Bot
回到免费房间的对话列表当中点击 Midjourney Bot的头像,然后在弹出的窗口选添加至服务器
从列表当中选择要添加 Midjourney Bot 的服务器(你新建的私人服务器)
点击确认并通过人类验证后,你就可以在你的服务器上看到一只野生的 Midjourney Bot出现了
常用指令
指令名 | 功能 |
/ask | 得到一个问题的答案。 |
/blend | 将图像混合在一起,图像数量是2-5张 |
/imagine | 使用提示生成图像 |
/fast | 切换到快速模式,生成时间更短 |
/info | 查看帐户以及任何排队或正在运行的作业信息。 |
/subscribe | 生成帐户页面的个人链接,用于会员订阅 |
/settings | 查看或调整 Midjourney Bot 的设置 |
/stealth | 对于订阅用户:切换到隐身模式 |
/public | 对于订阅用户:切换到公共模式 |
/describe | 将图像转换为文字描述 |
/prefer suffix | 指定一个后缀,添加到每个提示的末尾 |
/prefer option set | 创建或管理一个自定义选项 |
/prefer option list | 查看你当前的自定义选项; |
基本设置和预设
/settings指令为模型版本、样式值、质量值和升级器版本等常用选项提供切换按钮。
备注
添加到提示末尾的参数将覆盖/settings中的设置。
模型版本
1️⃣ MJ Version 1
2️⃣ MJ Version 2
3️⃣ MJ Version 3
4️⃣ MJ Version 4
5️⃣ MJ Version 5
Niji Mode
MJ Test
MJ Test Photo
这些按钮可用于设置使用的模型版本。MJ Version 5只适用于有Midjourney订阅的用户
Midjourney 预设默认为最新型号。切换模型的方式有两种:
在提示后面添加--version [v1|v2|v3|v4|v5]。(version可以缩写成v)
使用/settings指令并选择型号版本。
V5
V5 模型是2023 年 3 月 15 日发布的最新最先进的模型。要使用此模型,将参数--v 5添加到提示末尾,或使用/settings指令并选择 5️⃣ MJ Version 5。该模型具有非常高的Coherency,擅长解释自然语言提示,分辨率更高。
vibrant California poppies--v 5
V4
V4 模型是我们现在用的最多的版本,它拥有更多关于生物、地点、物体等的知识。它更擅长正确处理小细节,并且可以处理包含多个角色或对象的复杂提示。
vibrantCalifornia poppies
v4 风格切换 4a,4b,4c
Midjourney Model Version 4 具有三种略有不同的风格,对模型的风格调整进行了细微调整。通过在 V4 提示末尾添加--style 4a、--style 4b或来试验这些版本。
--v 4 --style 4c是当前默认值,不需要添加到提示末尾。
--style 4a且--style 4b仅支持 1:1、2:3 和 3:2 纵横比。
--style 4c支持高达 1:2 或 2:1 的纵横比。
图片 | 提示 |
vibrant California poppies --style 4a | |
vibrant California poppies --style 4b | |
vibrant California poppies --style 4c |
Niji
该模型是 Midjourney 和 Spellbrush niji之间的合作,经过调整可以制作动画和插图风格。该模型对动漫风格和动漫美学有更多的了解。一般来说,它在动态和动作镜头以及以角色为中心的构图方面表现出色。
图片 | 提示 |
California poppies | |
California poppies --niji |
V5版 Niji
Niji Version 5 模型是最新和最先进的 Niji 模型。要使用此模型,你可以将--niji 5参数添加到提示的末尾,或使用指令/settings并选择5️ Niji version 5。Niji Model Version 5 还可以通过--style以实现独特的外观。尝试--style expressive或--style cute:
图片 | 提示 |
birds perching on a twig --niji 5 | |
birds perching on a twig --niji 5 --style expressive | |
birds perching on a twig --niji 5 --style cute |
图片质量
Half Quality
Base Quality
High Quality (2x cost)
Half Quality = --q .5, Base Quality = --q 1, High Quality = --q 2.
--quality指令(可简写为--q)是用于修改生成图像所需的时间。更高质量的设置需要更长的时间来处理并产生更多的细节。质量设置不影响分辨率。
图片 | quality |
--quality .25 | |
--quality .5 | |
--quality 1 |
--quality默认值为 1。
--quality接受以下值:.25、.5 和 1。较大的值将向下舍入为 1。
--quality仅影响初始图像生成。
--quality适用于模型版本1、2、3、4、5 和 niji。
更高的--quality并不总是更好。有时较低的--quality可以产生更好的结果
Remix
使用Remix模式更改提示、参数、模型版本或变体之间的纵横比。Remix 将采用起始图像的一般构图,并将其用作新工作的一部分。
使用/prefer remix指令
使用/settings命令并切换按钮激活混音模式 ️ Remix Mode
Remix的使用主要分为三个步骤
打开Remix模式,选择图像网格或者升级后的图像来Remix
选择Make Variations ,在弹出窗口中修改或输入新的提示。
Midjourney Bot 使用受原始图像影响的新提示生成图像。
个人觉得在复杂构图上比较好用。
隐私 & 生成速度
下面四个参数都属于订阅用户才能设置的。
♂️Public ️ Stealth
在公共模式和隐身模式之间切换。对应于/public和/stealth指令。公共模型下,你生成的照片所有人可见;隐身模型则相反。
Fast Relax
在 Fast 和 Relaxed 模式之间切换。对应于/fast和/relax命令。Fast 模式会消耗订阅用户的GPU使用时间。超过套餐内时长会自动切换成 Relax。
自定义首选项
使用 /prefer 指令创建自定义选项,以自动将常用参数添加到提示末尾。
/prefer auto_dm 完成的工作会自动发送到直接消息
/prefer option 创建或管理自定义选项。
/prefer option list查看你当前的自定义选项。
/prefer suffix 指定要添加到每个提示末尾的后缀。
偏好选项
/prefer optionset<name> <value>
创建可用于将多个参数快速添加到提示末尾的自定义参数。
第一步:创建自定义短语
第二步:使用/imagine prompt vibrant California poppies --mine, 将会被解释为/imagine prompt vibrant California poppies --hd --ar 7:4
列出所有自定义短语/prefer option list
列出使用创建的所有选项prefer option set. 用户最多可以有 20 个自定义选项。
删除自定义短语 要删除自定义短语,使用
/prefer optionset<nametodelete>
首选后缀
/prefer suffix在所有提示后自动附加指定的后缀。使用不带值的命令进行复位。
添加后缀示例:/prefer suffix --uplight --video
复位示例:/prefer suffix
常用参数
参数是添加到提示中的选项,可更改图像的生成方式,图像的纵横比,在 Midjourney模型版本之间切换,更改使用的 Upscaler 等等。
使用参数的好处是,我们可以用参数直接定制当前的图像的设置,而不需要调整全局设定。
Midjourney 的提示语与 ChatGPT 的不同。简单来说,你可以在ChatGPT中输入复杂的提示语,因为它可以读取语法,而Midjourney最好使用简单的提示语+关键词(词语之间用逗号连接)。
之所以将常用参数放在 Midjourney Prompt 的前面,是因为你可以将参数看作能够在图像生成中保持一致性的提示语/关键词。
如果你想实现的图像(如风格、构图等)已经有了相应的参数,那么我建议你优先使用该参数,而不是在提示中用复杂的语法来描述它。
/imagine 后缀参数
这里的参数适用于添加到提示的末尾。单个提示可以添加多个参数。
参数 | 中文名 | 功能 |
--aspect | 纵横比 | 调整图片的比例 |
--chaos | 混乱 | 改变结果的多样性。较高的值会产生更多不寻常和意外的结果 |
--no | 负面提示 | --no plants会尝试从图像中移除植物 |
--quality | 生成质量 | --q <.25, .5, 1, or 2>代表要花费多少渲染时间。默认值为 1。值越高渲染时间越高, 值越渲染时间越低 |
--seed | 随机数种子 | 随机数是为每个图像随机生成的。使用相同的种子编号和提示将产生相似的图像 |
--stop | 停止 | 使用--stop参数在流程中途完成作业。以较早的百分比停止作业会产生更模糊、更不详细的结果 |
--tile | 平铺 | 生成可用作重复拼贴的图像,以创建在织物、壁纸和纹理上常用的无缝图案 |
--version | 模型版本 | --v <1, 2, 3, 4, or 5> 使用不同版本的 Midjourney 模型 |
--style | 风格切换 | --style <4a, 4b, or 4c> V4模型风格切换;--style |
--stylize | 程式化 | 低程式化值生成的图像与提示非常匹配,但艺术性较差。高程式化值创建的图像非常具有艺术性,但与提示的联系较少 |
Aspect纵横比
用--aspect或者--ar更改生成图像的纵横比。纵横比是图像的宽高比。它通常表示为用冒号分隔的两个数字,例如 7:4 或 4:3。
正方形图像具有相等的宽度和高度,描述为 1:1 的纵横比。图片可以是 1000px × 1000px,或者 1500px × 1500px,纵横比仍然是 1:1。计算机屏幕的比例可能为 16:10。宽度是高度的 1.6 倍。所以图像可以是 1600px × 1000px、4000px × 2000px、320px x 200px 等。
默认纵横比为 1:1。
--aspect 必须使用整数。使用 139:100 而不是 1.39:1。 纵横比影响生成图像的形状和组成。
指令 | 详细说明 | V5 | V4 | niji |
vibrant california poppies --ar 5:4 | 常见的纵横比
| 支持任何纵横比 |
| 1:2 至 2:1 |
Chaos混乱
--chaos参数影响初始图像网格的变化程度。高 --chaos 值将产生更多不寻常和意想不到的结果和组合。较低的--chaos 值具有更可靠、可重复的结果。
--chaos 范围值 0–100。
默认 --chaos 值为 0。
低值
使用较低的 --chaos 值或不指定值将生成每次运行作业时略有不同的初始图像网格。
示例:imagine/ prompt watermelon owl hybrid
高值
--chaos 每次运行作业时,使用较高的值将产生更多变化和意外的初始图像网格。
示例:imagine/ prompt watermelon owl hybrid --c 50
超高值
每次运行作业时,使用极高的值将产生不同的初始图像网格,并且具有意想不到的构图或艺术媒介。
示例:imagine/ prompt watermelon owl hybrid --c 100
Tile 重复拼贴
--tile 参数生成可用作重复拼贴的图像,以创建织物、壁纸和纹理的无缝图案。
--tile 适用于模型 版本 1、2、3、5
示例: prompt scribble of moss on rocks --v 5 --tile
示例: prompt watercolor koi --v 5 --tile
Stylize 程式化
Midjourney Bot 经过训练后可以生成有利于艺术色彩、构图和形式的图像。--stylize (--s) 用于设置强度。低值生成的图像与提示非常匹配,但艺术性较差。高值创建的图像非常具有艺术性,但与提示的联系较少。
备注
--stylize 的默认值为 100,并且在使用默认 [V4 模型] 时接受 0-1000 的整数值。
示例: /imagine prompt illustrated figs --s 100
示例: /imagine prompt colorful risograph of a fig --s 100
Prompt 提示语基础结构
一个基本的提示可以简单到一个单词、短语或表情符号。非常短的提示将在很大程度上依赖于 Midjourney 的默认样式。
完整 prompt:可以包括一个或多个图像链接、多个文本短语或单词,以及一个或多个后缀参数
Image Prompts: 可以将图像 URL 添加到提示中以影响最终结果的样式和内容。图片 URL 始终位于提示的前面。
Prompt Text:你要生成的图像的文本描述。
Parameters:参数改变图像的生成方式。参数可以更改宽高比、模型、放大器等等。参数位于提示的末尾。
语法原则
Midjourney Bot 并不能像人类那样理解语法和句子结构。因此单词的选择十分重要。
在许多情况下,更具体的同义词效果更好。例如用gigantic, enormous, or immense来取代big。
尽可能精简单词。更少的词意味着每个词都有更强大的影响力。
使用逗号、括号和连字符来帮助组织你的想法。
Midjourney Bot 不考虑大小写。
最好描述你想要什么而不是你不想要什么。如果要确保某个对象不在最终图像中,请尝试使用--no参数。
V4 和V5 在解释句子结构方面略优于其他模型。
细节描述
尽量弄清楚重要的背景或细节:
主题:人、动物、人物、地点、物体等。| person, animal, character, location, object, etc.
媒介:照片、绘画、插图、雕塑、涂鸦、挂毯等。| photo, painting, illustration, sculpture, doodle, tapestry, etc.
环境:室内、室外、月球上、纳尼亚、水下、翡翠城等。| indoors, outdoors, on the moon, in Narnia, underwater, the Emerald City, etc.
照明:柔和、环境、阴天、霓虹灯、工作室灯等 | soft, ambient, overcast, neon, studio lights, etc
颜色:充满活力、柔和、明亮、单色、彩色、黑白、柔和等。| vibrant, muted, bright, monochromatic, colorful, black and white, pastel, etc.
情绪:稳重、平静、喧闹、精力充沛等。| Sedate, calm, raucous, energetic, etc.
构图:人像、爆头、特写、鸟瞰图等。|Portrait, headshot, closeup, birds-eye view, etc.
当你没有在提示里面说明时,对应的内容就会被随机化。在最初的时候可能会给你一些灵感,但如果你想减少随机性,可以使用提示模板将上面的元素一一补充。
指定艺术媒介
蜡笔、刮板、印刷机、闪光、墨水和彩色纸。生成图像的最佳方法之一是指定一种媒介。
/imagine prompt<anyartstyle>style cat
年份
不同的时代有不同的视觉风格。
/imagine prompt<decade>cat illustration
情感
/imagine prompt<emotion>cat
色彩
/imagine prompt<colorword>colored cat
环境
/imagine prompt<location>cat
图片提示 Image Prompts
你可以使用图像作为提示的一部分来影响生成图片的构图、风格和颜色。
图像提示可以单独使用,也可以与文本提示一起使用。
要将图像添加到提示中,请键入或粘贴在线存储图像的网址。地址必须以 .png、.gif 或 .jpg 等扩展名结尾。
上传图像
上传图像,要先单击消息输入框旁边的加号。选择上传文件,选择图像,然后发送消息。
要将此图像添加到提示中,首先输入/imagine。出现提示框后,将图片文件拖入提示框,添加图片的URL。
或者右键单击图像,选择复制链接,然后将链接粘贴到提示框中。
V5效果
每一个链接复制之后,必须空格一下,然后再复制第二个链接;
图片上传完成后,还需要输入提示文本;
/blend 指令是针对移动用户优化的简化图像提示过程。
权重参数
使用图像权重参数--iw来调整提示的图像与文本部分的重要性。
较高的--iw值意味着图像提示将对生成的图片产生更大的影响。
/imagine prompt flowers.jpg birthday cake--iw .5
多提示
在提示中添加双冒号::向 Midjourney Bot 表明它应该分别考虑提示的每个部分。
在下面的示例中,对于提示hot dog,所有单词都被放在一起考虑,Midjourney Bot 生成了热狗的图像。如果将提示分成两部分hot:: dog后,Midjourney Bot会将两个概念分开考虑,从而创建一只热的狗。
多提示权重
当使用双冒号::将提示分成不同的部分时,你可以在双冒号后立即添加一个数字,以分配提示的该部分的相对重要性。
在下面的示例中,提示hot:: dog生成了一只温暖的狗。
将提示更改hot::2 dog,使hot一词的重要性是dog一词的两倍,从而产生了一只火热的狗!
V1,v2,v3只接受整数作为权重
v4可以接受小数位权重
V5 提示模板
从头开始编写提示是一个非常有趣的过程,但很快就会让人感到疲倦 - 特别是较长的提示在 Midjourney V5 中的表现明显更好。
在这里我给出一个通用模板,你可以使用它来指导所有的提示:
主题 | 背景,环境,氛围 | 风格 | 参数 |
a botanical-bearded fairy prince, flowing hair, sky-eyes, symmetrical mossy antlers, intensely sad gaze, wearing a floral diadem, | magical details, twilight atmosphere, | in the style of ArtGerm, Alyssa Monks, Studio Ghibli, close-up, glamour shot | --v5 --aspect 9:16 |
之所以这样设置,是因为:
提示顺序很重要;
风格(style)在 V5 中比以往任何模型都重要。
如果不指定样式,我们将获得照片般的真实感,因为这是 Midjourney V5 的默认样式。
如果你想跳出这样的样式,我们可以参考艺术运动、艺术技巧、流派、媒体类型、游戏名称、导演、艺术家姓名、时间段等。
艺术运动是一种趋势或一种艺术风格,具有特定的目标和哲学,在可能跨越几个月到几年甚至几十年的特定时期内被一群艺术家采用和遵循。
艺术运动:包括Impressionism、Surrealism或Pop Art。
媒体类型:包括photography, illustration, comic, concept art, storyboard,sculpture等。
媒体: 我们可以调用自己熟知的媒体来影响最终结果。例如,from Spirited Away或from The Wizard of Oz或from Sid Meiers Civilization或from the video game Joust。
艺术家姓名:引用特定艺术家的姓名或作品将粗略地调用他们的独特风格。示例包括Vincent van Gogh、Frida Kahlo或Banksy。
媒介:切换不同的艺术媒介能将这种风格添加到图像中。示例包括impasto、pencil sketch、watercolor或digital art。
时间:例如,来自Renaissance、Baroque或Modernist时期的图像。
地理位置:地区和国家也会影响风格。示例包括Japanese Ukiyo-e prints、African tribal art或American Abstract Expressionism。
Prompt 自动生成
前不久,Midjourney 宣布支持图片转 prompt 功能。
原始图片
blueprint holographic design of futuristic Midlibrary--v 5
Prompt 生成
直接输入/describe指令
通过弹出窗口上传图像并发送,Midjourney 会根据该图像生成四种可能的提示。
点击图片下方的 1、2、3、4 按钮,可以直接发送 prompt。
technology researchandindustry backgroundconceptstock photo, in the style of fairy academia, illuminated interiors, hyper-realistic sci-fi, studyplace, light azure, bibliopunk, scientific diagrams --v5
优势
有了用/describe指令,你可以:
学习新的提示策略并扩展 MJ 词汇量: Midjourney 主要是用它认识的、可以直观解读的词语来描述图片。所以在大多数情况下,如果 /describe 使用了一个词、一个表达式或一个样式修饰符来描述图片,我们就可以在自己的提示中使用它。
探索新艺术家: Midjourney 在输入图像中识别出来的艺术家也是如此。输出提示中的每个名字都意味着(在大多数情况下)MJ 认识这位艺术家。
Remix的最佳工具:你可以看到 AI 重新诠释你的视觉艺术作品。你可以用新的角度审视它,或者从新的和独特的方式中获得灵感来进一步发展你的作品。在输入/describe之前打开Remix模式,你可以在后续发送之前进一步调整提示。
/describe生成的提示不能用于生成与上传的图像一样的图。
/describe会返回上传图像的纵横比。
案例:建筑结构
基础结构
这是一个非常适合在 V5 中的生产建筑的提示结构。
我们不妨先回顾通用模板:
主题 + 背景,环境,氛围 + 风格 + 参数
在建筑生成的设定下,我们可以使用
主题详细描述 + 周边环境 + 建筑风格或时期、建筑师、设计师和摄影师 + 参数
spiraling massive gothic monolothic structurewitharchesona cliff, crashing wavesanda sky tingedwiththe sun, hellenic, designedbyHidetaka Miyazaki, photographybyHélène Binet--ar 16:9 --c 3
提示语的顺序很重要。
越靠近提示的开头,一个词的影响就越强。因此,如果你真的想强调一个建筑师的风格,你可以把他们的名字放在第一位:
建筑师姓名 + 主题的详细描述 + 周围环境 + 其他风格,美学,设计师和摄影师 + 参数
Ludwig Mies van der Rohe, housewithglassandmirrorsandgridcolumns, lightandmodernandtranscendent, photographedbyEzra Stoller--ar 16:9 --c 2 --s 90
使用参数:
使用--ar 参数设置纵横比。--16:9(风景)和--9:16(肖像)适用于建筑摄影图像。
在摄影中,最常见的长宽比是 4:3、3:2,最近在现代相机中是 16:9。
混乱:--c参数使结果更加多样化(范围为 0-100,默认值为 0)。
程式化: --s 参数是生成倾向于模型默认样式的程度(范围是 0-1000,默认值为 100)
著名建筑师
扎哈·哈迪德 Zaha Hadid
已故的扎哈·哈迪德 (Zaha Hadid) 是有史以来第一位获得建筑界奥斯卡奖(普利兹克奖)的女性,她以采用弯曲、俯冲线条的未来主义设计而闻名。
Futuristic skyscraperwitha biomorphic design, lush vertical gardens,andsoaring glass facade, inspiredbyZaha Hadid, photographedbyCandida Höfer--ar 16:9 --c 3
勒·柯布西耶 Le Corbusier
勒·柯布西耶 (Le Corbusier) 原名 Charles-Édouard Jeanneret,是一位瑞士-法国建筑师、设计师和城市规划师,被广泛认为是现代建筑的先驱之一。
Minimalist concrete structurewithgeometric formsanddramatic shadows, inspiredbyawe, Brutaliststyle, Le Corbusier, photographedbyEzra Stoller--ar 16:9 --c 2
Kengo Kuma 隈研吾
隈研吾(1954年8月8日—),著名日本建筑师,曾获日本、意大利、芬兰等国之建筑奖。建筑作品散发日式和风与东方禅意,在业界被称为负建筑、隈研吾流;又以自然景观的融合为特色,运用木材、泥砖、竹子、石板、纸或玻璃等天然建材,结合水、光线与空气,创造外表看似柔弱,却更耐震、且让人感觉到传统建筑的温馨与美的负建筑。
largeinteriorbyKengoKuma,Harmoniousblendofnaturalelementsandmoderndesign,aneco-friendlystructure,poolsandfallingwater--ar16:9--c1
建筑摄影师
除了建筑师之外,摄影师也是很重要的一部份。如果你的提示语里面包含摄影师的话,我建议你加上-s程式化参数,并将值设置低于100(默认值为100)
海伦比奈 Hélène Binet
Hélène Binet 是一位瑞士和法国建筑摄影师。她以通过光线、阴影和纹理捕捉建筑空间的精髓而闻名。
photobyHélène Binet, upward angle, delicate balanceoflightandshadow, rich textures, soulandessenceofa space, very visually captivating --ar16:9
Candida Höfer
德国摄影师 Candida Höfer 以雄伟的广角摄影捕捉了大型空旷的公共和机构空间。
Captivatinggrandinterior,avastarchitecturalspace,photographybyCandidaHöfer,symmetry,color,andintricatedetails,--ar16:9--s50
Julius Shulman
Julius Shulman 是加州建筑摄影师。他以美化现代洛杉矶生活方式的照片而闻名,并且是记录美国现代主义 70 多年来发展的关键人物。
JuliusShulmanarchitecturalphotographyofahouseintheLAhillsoverlookingthecity,--ar16:9--c1--s90
建筑风格
现代主义
Modern Architectural Design, methodicaluseofspace, artistic, Modernism, photographedbyEzra Stoller, color photography--ar 16:9
哥特式建筑
Gothic architectural Design, flying exterior buttresses,longstained-glass windows, ribbed vaults, and spires, photobyHélène Binet --ar16:9
风格混合
使用提示符 Hybrid 来组合两种架构风格
新哥特式和野兽派建筑
HybridNeo-gothicandbrutalistarchitecturecombinationstyle--ar16:9
未来主义
提示语:hyperrealistic futuristic
hyperrealistic futuristic coffee shop, minimalist, morning sun, drive through, --q 2 --ar 3:2
案例:网页设计
快速开始
用web design for...或modern web design for..来快速开始你的提示。
webdesignforagenericSaaSstartup--ar3:2
否定提示-no
使用--no告诉 Midjourney 你不想要什么。Midjourney 的默认风格倾向于现实和详细。但这可能不适用于所有品牌。例如,如果你是一个更注重科技的品牌,你可能会想要更简单的图形和插图,因为这些已经成为现代品牌的标志。
Midjourney 的默认样式,有很多细节和阴影。
webdesign for a flight discount service
相同的提示,但带有否定提示:
webdesign for a flight discount service --noshading realism photo details
纵横比
适合网页设计的纵横比是--ar 3:2
正方形的构图看起来更像是信息图表。
webdesign for a plant database, minimal vector flat --nophoto detail realistic
当纵横比增加时,图像的内容会发生变化。
web design for a plant database, minimal vector flat --no photo detail realistic --ar 3:2
案例:Logo设计
Logo设计是一个充满挑战的任务,因为Logo是品牌重要价值的浓缩。
快速开始
直接使用logo design for...来获取灵感。
图像中生成文字在Midjourney中的效果还不是很好,但你可以用Canva编辑图片并替换自己的文字。
在提示中使用那些擅长你所寻找的风格的设计师和艺术家
Pictorial Mark Logo 图形标记
图形标记,也称为品牌标记,当你想到logo时,可能会想到它们。
否定提示--no
Midjourney的默认风格往往会变得复杂,因此你需要告诉它你不想要的元素。--no realistic photo details是一句很通用的提示。
图片 | 提示 |
vector graphic logo of panda, simple minimal --no realistic photo details | |
flat vector logo of deer head, minimal graphic, by Sagi Haviv --no realistic photo detail shading | |
vector graphic logo of frog, simple minimal, by Rob Janoff --no realistic photo details |
你可以以单词为单位,逐个列出你不要的元素。
Minimal Line Marks 线条图案
你可以用事物的几何形状和线条来作为Logo:
图片 | 提示 |
geometric minimal diamond, logo, line, simple | |
minimal line logo of a rose, vector |
Gradient Marks 色彩渐变
使用渐变标记会给你的品牌一种创新的感觉。你可以在提示中指定想要的颜色。
图片 | 提示 |
flat vector logo of square, blue purple orangegradient, simple minimal, by Ivan Chermayef | |
flat vector logo of circle,gradient, fox wrapped around earth, simple minimal, by Ivan Chermayeff |
字母Logo
字母标记是由字母组成的徽标,通常是品牌首字母:
图片 | 提示 |
letter A logo, lettermark, script typeface, vector simple, by Steff Geissbuhler --no shading detail realistic colo | |
letter P logo, flat round typography, simple, by Steff Geissbuhler --no shading detail photo realistic colors outline |
好用的关键词:- Serif- Slab- Calligraphic- Blackletter
Geometric Logo 几何标志
几何标志是一种特定类型的图形标志。
图片 | 提示 |
Flat geometric vector graphic logo of minimal circle, grayscale, simple, by Paul Rand | |
Flat geometric vector graphic logo of geometric flower, radial repeating, simple minimal, by Ivan Chermayeff | |
Flat vector graphic logo of square, simple minimal, by Rob Janoff --no realistic photo detail shading |
Mascot Logos 吉祥物
Midjourney 非常适合创建适合2D的吉祥物。
图片 | 提示 |
simplemascotfor a tire company, japanese style | |
simplemascotfor a chicken company, japanese style |
复用设计风格
你会注意到我们在上面的提示中使用了很多设计师。设计师能帮助我们在一开始能取得某种效果的图片
Paul Rand : IBM 和 ABC 徽标的设计师
Rob Janoff : Apple 标志的设计师
Sagi Haviv : 美国网球公开赛和国家地理标志的设计师
Steff Geissbuhler : NBC 和时代华纳徽标的设计师
案例:动漫设计
使用 Midjourney 生成动漫有两种方法:使用Niji模式或使用标准的 Midjourney 模型。Niji V5 是 Midjourney 的动漫专用模型。它建立在标准 Midjourney 模型的全新架构之上,更擅长生成命名的动漫角色。Niji V4于2023年12月发布,Niji V5于2023年4月1日发布。
控制程序化
我们可以使用--stylize获得更多有趣的变化,范围是--s 0到--s 1000。默认值为 100。降低风格化值,你会获得更多样、更有趣的结果。
使用质量标签
图片 | 提示 |
girl with black hair, looking at viewer, depth of field | |
girl with black hair, masterpiece, best quality, ultra-detailed, cinematic beautiful lighting, intricate details, looking at viewer, depth of field |
你可以尝试在提示使用其中一部分的关键词,但无需过度使用,它们的收益会递减。
角色生成
AI 动漫模型(NAI Diffusion、Anything 等)的大量训练数据都来源于 Danbooru 图像,因此 Danbooru 的角色标签计数是检查 Niji 是否可以生成角色的好方法。
下面是一些以Danbooru标签计数为特征的页面:
热门人物
顶级艺术家
图片 | 提示 |
90s anime still,asuka langley soryuwearing a red, neon genesis evangelion, watercolor illustration --ar 2:3 --niji 5 | |
In the center of a huge cloud swirl there is an anime beautiful girl in jk uniform and miniskirt, midscape, Son of Weather, Shinkai Makoto style, daub oil painting texture and Chinese painting style mix, braids, bangs, acrylic thick paint, intricate details, art oil painting, anime characters, comic style, Pixar style, abstract, flat, two-dimensional, Particle crushing effect, simple painting style --ar 2:3 --uplight --q |
复古动漫
你可以尝试以下设计师和导演来让你的图片更有复古风格:
Yoshiyuki Sadamoto - 新世纪福音战士的创始人
Hayao Miyazaki - 宫崎骏
Tsukasa Hojo - 城市猎人的创造者
Naoko Takeuchi - 美少女战士的创造者
直接用年代相关的关键词也能达到类似的效果:
1970s anime 1980s anime, 1990s anime
retro anime
retro anime screencap
80sanimestill,girlfixingamech,retrofashion,mutedretrocolors,styleofDragonsHeaven--ar3:2
角色设计和概念表
角色设计和概念表有助于设计师在不同的姿势、角度和表情中保持角色的一致性。
expression sheet
character design sheet
character turnaround sheet
dress-up sheet / fashion sheet
items sheet / accessories
character pose sheet
concept art sheet
上面的关键词可以进行两两搭配。
characterdesignsheet,magicalgirlbluehair--ar3:2
如果你有喜欢的插图的设计、构图、主题、姿势或颜色,你可以将其用作提示的一部分,Niji会将吸引人的元素应用到新图像中。
如果你喜欢这张图片的颜色和风格,并想创建一张类似的图片,比如来自新世纪福音战士的 Rei:
[LINK TO ORIGINAL IMAGE] ReifromEvangelion --ar3:2
要执行 img2img,请将图像链接粘贴为提示的第一部分。如果你只有本地的图片,你需要将原始图片发送给Midjourney。然后右键单击图像>复制链接。将此链接粘贴为提示的第一部分。
照片动漫化
你同样可以将现实世界的照片放到Niji里面,使得输出的图片具有动漫的风格。
gold color theme, masterpiece, stylish anime girlwithlongblonde hair, facing the camera, detailed pupils,depthoffield--ar 3:2
案例:游戏艺术
Midjourney 现在可以生成可直接在游戏中使用的资产。
像素艺术
游戏机
将像素艺术融入提示的最简单方法之一是参考旧游戏机。尝试将以下设备添加到你提示的前面:
NES | 红白机
SNES | 超级任天堂
PlayStation | 游戏机
Sega Genesis | 世嘉创世纪
Sega Dreamcast | 世嘉Dreamcast
x-bit
8 位/16 位/32 位最初是指这些控制台中使用的处理器,但现在可以用于指代那个时代的艺术/音乐。
8-bit pixel art
16-bit pixel art
24-bit pixel art
32-bit pixel art
游戏风格
当然,你还可以参考旧游戏的风格以获得出色的效果:
恶魔城 (1986)
第一个恶魔城由 Konami 于 1986 年为 NES 发行。它大受欢迎,成为任天堂最具影响力、最经典的游戏之一。该系列以其难度和新颖的机制以及其黑暗的哥特式艺术风格而闻名。Midjourney 擅长重现使恶魔城系列如此与众不同的哥特式视觉形象。
图片 | 提示 |
clean pixel art, greek temple with statue of apollo, style of castlevania 1986 | |
clean pixel art, moon base with rover, style of castlevania 1986 |
合金弹头 (1996)
最初的合金弹头于 1996 年在 Neo Geo 街机上发布。合金弹头以其块状和极端的细节水平而出名。
图片 | 提示 |
clean pixel art, house inside of a tree, style of metal slug | |
clean pixel art, inside of dungeon, style of metal slug 1996 --ar 3:2 |
像素背景
Owlboy (2016)
Owlboy 是一封写给像素艺术的情书 。
该游戏的开发历时 10 年。在此期间, Owlboy 团队不得不多次重新设计游戏,重新绘制美术资产,使游戏看起来永恒。
以下是在 Midjourney 中创建此样式的一些提示。它们非常适合背景艺术:
图片 | 提示 |
chinese gate, style of owlboy pixel art | |
castle on hill, style of owlboy pixel art | |
library of alexandria, style of owlboy pixel art |
案例:人物照片
V5 跟 V4 相比在人物生成的真实感上有了更大的进步。
21yearschinesegirl,inschool,beauty,longblackhair,sunlight,insanedetail,smoothlight,realphotographyfujifilmsuperia,fullHD,takenonaCanonEOSR5F1.2ISO10035MM--ar4:3--s750--q2
明星
V5 认识很多名人,你可以在描述主体的时候,加上名人的名字,就可以生成该名人的照片。
图片 | 提示 |
Young, handsome Keanu reeves In a black long leather coat walking down the street in the rain --ar 2:3 --uplight | |
Taylor Swift looking out the window wistfully, wearing a floral pastel linen blazer, natural afternoon light, side-angle view, 4k --ar 2:3 --stylize 1000 | |
actor jason momoa dressed as khal drogo drinking a mimosa isolated on a white background --s 250 |
现实生活中的虚构人物
通过 Midjourney, 你可以将你喜欢的虚构人物带到现实生活中来。
图片 | 提示 |
Photorealism, beautiful Asuka Langley Soryu in sci-fi armor in a futuristic city --ar 1:2 --q 2 --c 20 --s 750 | |
photorealism, beautiful, Rei Ayanami in sci-fi armor in a futuristic city --ar 1:2 --q 2 --c 20 --s 750 |
多角度
尝试从同一提示生成多个图像。Midjourney 现在可以为同一个人或事物创造多个角度。
realistic portrait photography of beautiful girl, pale skin, golden earrings, summer golden hour, kodak portra 800, 105 mm f1. 8; image split into 2, different angles of the girl --ar 2:1
案例:摄影艺术
想法和灵感
在开始一个项目之前,你可以探索 Pinterest、Tumblr、Flickr 和许多其他资源,从而了解其他艺术家在你之前所做的事情并寻求灵感。
时至今日,我们可以通过询问 Midjourney 来获得创意。
图片 | 提示 |
Chuck Palahniuk in diners mascot costume eating hamburgers on an empty parking lot behind the diner. Photograph by Gregory Crewdson --ar 3:2 | |
portrait of a famous physicist in his lab in 1960s style. Photograph by Anton Corbijn --ar 3:2 | |
Bjork as otherworldly floral elven alien in misty forest. Portrait by Aliza Razell --ar 3:2 --stylize 1000 |
混合想法
借助 Midjourney,你可以用你喜欢的艺术家的风格来拍摄一张照片,从而激发你的灵感。
原始图片 | 新图片 | 提示 |
[IMAGE PROMPT] as high concept fashion photoshoot by Karen Knoor --s 1000 | ||
[IMAGE PROMPT]business photoshoot by Richardson Avedon |
表格中的[IMAGE PROMPT]代表的是原始图片的图片提示。
预期可视化
预期可视化——一个寻找参考资料、组装情绪板、绘制草图、整理或渲染未来照片拍摄最终结果的过程——这是每个项目的关键阶段,可以让我们更好地设想我们的想法。
情绪板和参考图像
你要做的第一件事是寻找参考图片并制作情绪板。
通常,我会在互联网上搜索以找到确切图像来说明想法。我会尝试尽可能详细和精确地展示我如何看待背景、造型、姿势、灯光和化妆。
只需一个提示,你就可以在 Midjourney 上预想拍摄风格、地点、化妆概念、场景氛围等等。
图片 | 提示 |
portrait of fashion model in futuristic Japanese club. Intentional camera movement, wild mood | |
creative iridescent makeup with space floral patterns. Close-up portrait of a young female model. Contrasty lighting --s 910 |
你还可以通过直接询问 Midjourney 来概述情绪板页面。
情绪板(英语:mood board),是由图像、文本等数个样本组成视觉呈现或拼贴图。情绪板,用于传达对特定主题的想法或感受的演示工具。
平面设计师、室内设计师、工业设计师、摄影师、用户界面设计师和其他创意工作者多使用情绪板来直观地说明作品计划呈现的风格。情绪板在创作过程中,情绪板可以平衡协作与创作上的自由。
图片 | 提示 |
mood board props references page for noir themed photo shoot --ar 2:3 --stylize 350 | |
mood board location references page for rainbow themed photo shoot --ar 2:3 --stylize 50 |
布景设计
在复杂的肖像摄影类型中工作,你会希望为你的模特创造一个独特而令人难忘的世界,让你的模特栖息在你的画面中。
图片 | 提示 |
business themed set design by Annie Leibovitz --ar 3:2 | |
business themed set design by Annie Leibovitz --ar 3:2 | |
Tim Walkers set design for mystical photo shoot --ar 3:2 --stylize 75 |
我在所有提示中添加了--no people person man woman boy girl model我们只需要背景本身,如果不是那个小技巧,Midjourney 将始终生成人类。
造型和道具
通常,你必须寻找所需的道具或服装。打电话给电影或戏剧制作,去服装租赁,或者让造型师参与并将其委托给专业人士。在这种情况下, Midjourney 能生成非常出色的道具参考图片!
图片 | 提示 |
props for a magic themed photo shoot | |
gothic dress on clean backdrop. Prop for fashion photo shoot --stylize 300 | |
costume and props for photo shoot in style of Magic The Gathering |
摄影技巧
人像摄影的种类
我们可以从肖像摄影师最基本的东西开始,并尝试向 Midjourney 询问一些不同类型的肖像。
灯光
在 Midjourney 中,你可以设置光照的方向、质量和颜色。对于此测试,我对提示的文本部分使用了标准公式:Portrait shot with ...
为了简单起见,我只会在示例下方提及光线类型。
快门设置
快门速度的设置同样能影响最终的图片效果
构图
在 Midjourney 中,我们可以部分控制图片的构图。虽然目前 Midjourney 很难指定某些类型的构图(不对称、偏心、黄金比例等——似乎都不起作用),但你仍然可以成功地设置拍摄角度。
镜头
除了构图,你还可以使用不同的镜头来构成图片:
By Andrei Kovalev 和 Midlibrary 团队
End