引言

在Stable Diffusion中,提示词(Prompts)是一种关键的功能,它允许用户通过文字描述来引导AI生成特定的图像。

这些提示词可以非常具体,也可以是模糊的,取决于用户想要的图像类型和风格。

要想获得一张好的图片,不仅需要反复调试,更需要极其复杂的提示词。

因此,我们把复杂的提示分成三大部分依次解释。分别为【基本结构】【中间结构】【高级结构】。

本文讲述的是【基本结构】。

基本结构的组成

一个基本的提示结构由四个修饰词组成:【媒介】【主题】【细节】【分辨率】。

每个修饰词都有特定的目的和重要性。

【媒介】

通常指的是用来描述预期图像的艺术形式或物理材料。举例来说,你可以指定希望图像看起来像是用油画、水彩、铅笔画、数字绘图等不同媒介创作的。

【主题】

这是图像的主要内容或焦点。例如,在提示词“一位中世纪骑士在森林中骑马”的情况下,“中世纪骑士”和“森林”就是主题。

【细节】

细节通常涉及整个图像的渲染质量、风格、色彩和纹理等方面。

比如,在描述一个场景时,你可能会使用“高分辨率、细腻的纹理、饱和的色彩”等词汇,这些词汇告诉SD模型你期望图像在整体上具有怎样的视觉特性。

【分辨率】

这指的是生成图像的尺寸和清晰度。在SD中,用户可以指定期望的图像分辨率,如“1024×768”或“高清”。

顺序影响

理解它们之间的规则也很重要。一般按照【媒介+主题+细节+分辨率】的顺序来编写提示。SD通常会把开头和结尾的【媒介】【分辨率】当成最重要的部分提示。

注意:并不是说非要将媒介放在开头,你也可以将分辨率放在开头,甚至打乱提示词的放置顺序。

使用常见的顺序编写提示词,能够为SD提供一条清晰的指导路径。这种方法更有可能产生准确和一致的结果,并且能够更好的控制图像的每个细节。

如果你的提示词是随意乱放的,没有遵循任何逻辑顺序,这可能会使模型难以解析哪些部分是最重要的,从而产生出乎意料或混乱的结果。

但是,提示词的混乱却也可能创造惊喜,它也可能带来一些创造性的、非预期的视觉效果,尤其是你在探索和实验新的图像。

所以你可以根据自己的喜好来设置提示词的顺序,个人建议还是按照较为正常的规则使用提示词,等熟练常用规则以后,再摸索其它规则。

修改提示词权重

如果你的提示过长,那么SD可能会忽略一些中间的【主题】和【细节】的提示。

如果中间部分确实有一些很关键的提示,我们可以使用之前说过的提升权重的方法(ctrl+方向键上下)来修饰提示,权重的范围1~1.5。

或者减少不重要的提示的权重,范围是0.1~0.9。

下面我们来详细介绍这四个修饰词。

媒介

在传统艺术中,媒介可以是油画、水彩、素描等,每种媒介都有其独特的表达方式和视觉效果。

SD技术将这一概念扩展到了数字领域。通过指定“媒介”,用户可以引导AI生成类似于具体艺术媒介风格的图像。

例如,如果选择“油画”作为媒介,生成的图像可能会展现出浓重的色彩和动态的笔触;

选择“铅笔画”则可能更注重线条的细腻和阴影的渲染。

常见的媒介有:

  1. 油画 – “Oil Painting”
  2. 水彩 – “Watercolor”
  3. 铅笔画/素描 – “Pencil Drawing/Sketch”
  4. 数字绘图 – “Digital Art”
  5. 版画 – “Printmaking”
  6. 雕塑 – “Sculpture”
  7. 粉彩/蜡笔 – “Pastel/Crayon”
  8. 壁画 – “Mural”

这是油画的苹果。

这是铅笔画的苹果。

主题

主题是指图像中表达的中心思想或主要内容。

一般由名词+动词组成。

主题的范围基本上包含一切,自然风景,历史和文化,城市和建筑,食物和饮料,人物,等等。

例如:

  • 一个宁静的山谷,在日落时分,天空被染成了橙红色。
  • 一位年轻女子,带着微笑,眼中闪烁着希望的光芒。
  • 一个黑魔法师,手持长杖,带着金色面具。
  • 一个典型的家庭聚餐场景,桌上摆满了各种美食。

细节

“细节”是非常关键的部分,因为它们直接影响生成图像的精确度和丰富性。

如果一个图像比较模糊,简化,抽象,那么可能就是细节不够。

如果你想生成一张图片,它具有某些特征,你可以输入与这些特征相关的关键词。

例如,如果你输入佳能单反相机和佳能m33作为关键词,SD会在数据库中寻找那些使用那些特定的相机型号捕捉的图片,然后它将分析相似之处,并生成一个共享相同特征的新图像。

具有高度细节的图像可以非常丰富,具备视觉吸引力。

常用的细节提示如下:

  • 高细节 – “High Detail”
  • 非常高的详细 – “Extremely Detailed”
  • 错综复杂的 – “Intricately Complex”
  • 现实的 – “Realistic”
  • 真实的 – “Authentic”
  • 真实的生活 – “Real Life”
  • 佳能M33 – “Canon M33”
  • 佳能数码单反相机 – “Canon Digital SLR Camera”
  • 超质量 – “Superior Quality”
  • 超详细 – “Ultra Detailed”

分辨率

图像的分辨率基本上是指图像的清晰度如何清晰而详细。

如果模糊或像素化,很难看清楚发生了什么。

但如果它清晰而锐利,你可以清楚地看到一切。

常用的分辨率如下:

  • 4K -(一种高清分辨率标准,通常指3840 x 2160像素)
  • 8K -(更高的分辨率标准,通常指7680 x 4320像素)
  • 16K – (更高的分辨率标准,通常是8K的两倍)
  • 32K – (极高的分辨率标准,通常是16K的两倍)
  • 高清 – “High Definition” 或 “HD”
  • 超高清 – “Ultra High Definition” 或 “UHD”
  • 高分辨率 – “High Resolution”
  • 百万像素 – “Megapixel” (常用于指摄像头或图像的分辨率)
  • 全高清 – “Full High Definition” 或 “Full HD” (通常指1920 x 1080像素)

综合使用案例

所以我们已经掌握了提示的基本结构公式:【媒介+主题+细节+分辨率】

我们来看实际运用一下:

英文:【(pencil sketch:1.4),a cute Labrador puppy laying on the bed,intricate, high detail,ultra high resolution, 8k】

中文:【媒介:(铅笔素描:1.4),主题:一只可爱的拉布拉多小狗躺在床上,细节:复杂,高细节,分辨率:超高分辨率,8k】

同时我们还要加上一些负面提示,防止生成畸形图片。

英文:【(worst quality, low quality:1.4), logo, textmonochrome,Deformity, Twisted limbs, Incorrectproportions, Ugliness, Ugly limbs, Deformed armDeformed fingers, Three hands, Deformed hand, 4fingers, 6 fingers, Deformed thigh, Twisted legs..】

中文:【最差质量,低质量:1.4标志文字单色变形扭曲的肢体不正确的比例丑陋丑陋的肢体 ,变形的手臂 ,变形的手指 ,三只手 ,变形的手4根手指6根手指 ,变形的大腿 ,扭曲的腿 】。

效果图:

你可能会注意到,尽管我使用了关键词“床”,图像中却没有产生床,这是因为图像尺寸被设置为512*512,SD相信一个床无法适应如此小的空间。所以它有选择性地忽略了关键词“床”

如果我们可以将宽度分辨率增加,关键词“床”的出现机会也会增加。