承接上文:深入 Midjourney:Prompt 时的常见问题及优化(上)
6. 可以使用权重(双冒号)来创建一些特殊效果#
在本节中,我将向您展示如何处理场景和主题作为例子,这只是因为使用权重创建主题和场景是学习权重的一种有趣方式。
🤖创建主题
- 找到您感兴趣的主题词,例如:友谊、恐惧、安全、希望、战争、浪漫、破坏、英雄主义、沉默、心碎、虚荣、青春、未来主义、机器人、太空歌剧、神秘等。
- 用主题词写你的 Prompt,并根据你希望看到主题在你的其余视觉中所占的程度来衡量它(建议值为 1-3),然后像往常一样写你的提示。
- 主题就会影响你的 Prompt。以如下提示为例,然后制作您自己的提示。
Sentience::3 This is a picture of a chaotic mess of external wiring and plumbing on the walls of a brutalist architecture building in a busy city evening atmosphere. The colors are mainly midnight-blue and oak-brown. --ar 5:9
Sentience::3 这是一张在繁忙的城市夜晚氛围中,野兽派建筑的墙壁上外部布线和管道混乱的照片。颜色以午夜蓝和橡木棕为主。 --ar 5:9
(这里就强调了 Sentience 这个权重为 3)
🌳创建设置 / 场景 / 背景
- 设想一个背景或环境,并用 3-5 个词描述它,例如:“午夜森林空地” 或 “俯瞰大海的悬崖”。
- 用描述介绍您的提示并对其进行加权,以帮助它与提示的其余部分竞争(建议值为 1-3)。
- Prompt 就像一个 “舞台”,加权的越多越类似 “主角”,您的提示的其余部分将在其上呈现。尝试以如下提示作为示例,然后制作您自己的提示。
Twilight, vintage coffee house::1.5 Hipster female with blue eyes and long flowing brown hair poses wearing a floral tank and jeans, photorealistic edge-to-edge print in the style of Joe Ranft, Tom Ruegger, John Canemaker, Atelier Lulua --ar 5:7
暮光之城,老式咖啡馆::1.5 时髦女性,蓝眼睛,长长的飘逸的棕色头发,身着花卉背心和牛仔裤,照片级逼真的边到边印花,风格为 Joe Ranft、Tom Ruegger、John Canemaker、Atelier Lulua --ar 5:7
(这里给了 Twilight, vintage coffee house 这段 1.5 的权重)
🧮常见问题
Midjourney 根据事物最主要的标准特征来定义事物。偏离标准特征意味着 Midjourney 不 “认得” 它。要让 Midjourney “认识” 一些非标准的事物,就是把这些非标准事物转化成标准事物。例如,你不能得到 “一个绿色皮肤的女人”,但你可以得到 “一个绿色皮肤的女性人形生物”,因为对于 Midjourney,“女人” 不能拥有人类原型的绿色皮肤,而是一个人形生物根据非人类原型,可以拥有绿色皮肤。
另一个好方法是使用负权重。您可能需要使用负权重来做非标准的事物。例如,如果您正在努力为某些东西提供 “非标准” 特性,您可以尝试为您不想看到的特性赋予负权重。
在下面的这个例子中,我们想给猫一个非标准的第三只眼。我们允许 Midjourney 通过用 “felinoid” 替换 “猫” 原型来添加第三只眼,并通过给 “双眼” 赋予负权重来引导 Midjourney 不要过多关注 “两只眼”。
third-eye, felinoid::1 two eyes::-0.5
第三只眼,类猫科动物::1 两只眼睛::-0.5
(two eyes 给了 - 0.5 权重,减弱在图片中的影响)
7. 使用类似句子的片段,而不是单词列表。#
在 --v 5 中,写成类似句子的片段,而不是单词列表。 “一个年轻的女人走过校园” 比 “女人,年轻,走路,校园” 更有效。
“A young woman walks across campus” 比 “woman, young, walking, campus” 好
8. 风格化图像。#
在 --v 5 中,要生成摄影图像以外的内容,您需要参考艺术运动、艺术技巧、流派、媒体类型、游戏名称、导演、艺术家姓名、影响、时间段等。
要调用图像的美学风格,请尝试引用其中的两个或多个:
- 艺术运动:识别提示中的艺术运动将介绍其风格和技巧。例子包括印象派、超现实主义或波普艺术。
- 媒体类型:识别图像的媒体将决定其美感。示例包括摄影、插图、漫画、概念艺术、故事板、雕塑等。
- 媒体标题: - 识别媒体影响将影响其外观。例如,来自《千与千寻》或《绿野仙踪》或《席德梅尔的文明》或电子游戏《决斗》。
- 艺术家姓名:引用特定艺术家的姓名或作品将粗略地调用他们的独特风格。示例包括文森特・梵高、弗里达・卡罗或班克斯。
- 技术:参考技术会将这种风格添加到图像中。示例包括厚涂、铅笔素描、水彩或数字艺术。
- 时间段:识别图像的历史背景将调用其审美。例如,文艺复兴时期、巴洛克时期或现代主义时期的图像。
- 地理位置:参考地区和国家会影响风格。例子包括日本浮世绘版画、非洲部落艺术或美国抽象表现主义。
9. 图片比例#
不想要正方形了?将参数 --ar X 或 --aspect X 甚至 --h X --w Y 添加到提示的末尾。 (这三种方法都是表达同一事物的不同方式。)
以下纵横比可以放在提示的末尾:
正方形
--ar 1:1
人像
--ar 1:2 --ar 2:3 --ar 4:6 --ar 5:7 --ar 9:16
风景
--ar 2:1 --ar 3:2 --ar 6:4 --ar 7:5 --ar 16:9
即使您可以指定您喜欢的任何长宽比,Midjourney 实际上并不会产生所有长宽比的输出。仅允许某些分辨率值,Midjourney 将选择最接近您指定的长宽比。例如,如果您指定 --ar 850:1100 ,您将获得以下结果:
Initial grid: 4:5 (256x320)
Default Upscale: 4:5 (1024x1280)
Light Upscale: 4:5 (1024x1280)
Max Upscale: 11:14 (1408x1792)
Beta Upscale: 7:9 (1792x2304)
初始网格:4:5 (256x320)
默认高档:4:5 (1024x1280)
轻高档:4:5 (1024x1280)
最大高档:11:14 (1408x1792)
Beta 高档:7:9 (1792x2304)
附图最佳和最接近的 Midjourney 长宽比
10. 通过参数优化:风格,混乱,质量参数#
用参数来优化图片,这块内容参考官方文档就行
风格
https://docs.midjourney.com/docs/stylize
混乱
https://docs.midjourney.com/docs/chaos
质量
https://docs.midjourney.com/docs/quality