
引言
在Stable Diffusion中,提示词(Prompts)是一种关键的功能,它允许用户通过文字描述来引导AI生成特定的图像。
这些提示词可以非常具体,也可以是模糊的,取决于用户想要的图像类型和风格。
要想获得一张好的图片,不仅需要反复调试,更需要极其复杂的提示词。
因此,我们把复杂的提示分成三大部分依次解释。分别为【基本结构】【中间结构】【高级结构】。
本文讲述的是【基本结构】。
基本结构的组成
一个基本的提示结构由四个修饰词组成:【媒介】【主题】【细节】【分辨率】。
每个修饰词都有特定的目的和重要性。
【媒介】
通常指的是用来描述预期图像的艺术形式或物理材料。举例来说,你可以指定希望图像看起来像是用油画、水彩、铅笔画、数字绘图等不同媒介创作的。
【主题】
这是图像的主要内容或焦点。例如,在提示词“一位中世纪骑士在森林中骑马”的情况下,“中世纪骑士”和“森林”就是主题。
【细节】
细节通常涉及整个图像的渲染质量、风格、色彩和纹理等方面。
比如,在描述一个场景时,你可能会使用“高分辨率、细腻的纹理、饱和的色彩”等词汇,这些词汇告诉SD模型你期望图像在整体上具有怎样的视觉特性。
【分辨率】
这指的是生成图像的尺寸和清晰度。在SD中,用户可以指定期望的图像分辨率,如“1024×768”或“高清”。
顺序影响
理解它们之间的规则也很重要。一般按照【媒介+主题+细节+分辨率】的顺序来编写提示。SD通常会把开头和结尾的【媒介】【分辨率】当成最重要的部分提示。
注意:并不是说非要将媒介放在开头,你也可以将分辨率放在开头,甚至打乱提示词的放置顺序。
使用常见的顺序编写提示词,能够为SD提供一条清晰的指导路径。这种方法更有可能产生准确和一致的结果,并且能够更好的控制图像的每个细节。
如果你的提示词是随意乱放的,没有遵循任何逻辑顺序,这可能会使模型难以解析哪些部分是最重要的,从而产生出乎意料或混乱的结果。
但是,提示词的混乱却也可能创造惊喜,它也可能带来一些创造性的、非预期的视觉效果,尤其是你在探索和实验新的图像。
所以你可以根据自己的喜好来设置提示词的顺序,个人建议还是按照较为正常的规则使用提示词,等熟练常用规则以后,再摸索其它规则。
修改提示词权重
如果你的提示过长,那么SD可能会忽略一些中间的【主题】和【细节】的提示。
如果中间部分确实有一些很关键的提示,我们可以使用之前说过的提升权重的方法(ctrl+方向键上下)来修饰提示,权重的范围1~1.5。
或者减少不重要的提示的权重,范围是0.1~0.9。
下面我们来详细介绍这四个修饰词。
媒介
在传统艺术中,媒介可以是油画、水彩、素描等,每种媒介都有其独特的表达方式和视觉效果。
SD技术将这一概念扩展到了数字领域。通过指定“媒介”,用户可以引导AI生成类似于具体艺术媒介风格的图像。
例如,如果选择“油画”作为媒介,生成的图像可能会展现出浓重的色彩和动态的笔触;
选择“铅笔画”则可能更注重线条的细腻和阴影的渲染。
常见的媒介有:
- 油画 – “Oil Painting”
- 水彩 – “Watercolor”
- 铅笔画/素描 – “Pencil Drawing/Sketch”
- 数字绘图 – “Digital Art”
- 版画 – “Printmaking”
- 雕塑 – “Sculpture”
- 粉彩/蜡笔 – “Pastel/Crayon”
- 壁画 – “Mural”
这是油画的苹果。
这是铅笔画的苹果。
主题
主题是指图像中表达的中心思想或主要内容。
一般由名词+动词组成。
主题的范围基本上包含一切,自然风景,历史和文化,城市和建筑,食物和饮料,人物,等等。
例如:
- 一个宁静的山谷,在日落时分,天空被染成了橙红色。
- 一位年轻女子,带着微笑,眼中闪烁着希望的光芒。
- 一个黑魔法师,手持长杖,带着金色面具。
- 一个典型的家庭聚餐场景,桌上摆满了各种美食。
细节
“细节”是非常关键的部分,因为它们直接影响生成图像的精确度和丰富性。
如果一个图像比较模糊,简化,抽象,那么可能就是细节不够。
如果你想生成一张图片,它具有某些特征,你可以输入与这些特征相关的关键词。
例如,如果你输入佳能单反相机和佳能m33作为关键词,SD会在数据库中寻找那些使用那些特定的相机型号捕捉的图片,然后它将分析相似之处,并生成一个共享相同特征的新图像。
具有高度细节的图像可以非常丰富,具备视觉吸引力。
常用的细节提示如下:
- 高细节 – “High Detail”
- 非常高的详细 – “Extremely Detailed”
- 错综复杂的 – “Intricately Complex”
- 现实的 – “Realistic”
- 真实的 – “Authentic”
- 真实的生活 – “Real Life”
- 佳能M33 – “Canon M33”
- 佳能数码单反相机 – “Canon Digital SLR Camera”
- 超质量 – “Superior Quality”
- 超详细 – “Ultra Detailed”
分辨率
图像的分辨率基本上是指图像的清晰度如何清晰而详细。
如果模糊或像素化,很难看清楚发生了什么。
但如果它清晰而锐利,你可以清楚地看到一切。
常用的分辨率如下:
- 4K -(一种高清分辨率标准,通常指3840 x 2160像素)
- 8K -(更高的分辨率标准,通常指7680 x 4320像素)
- 16K – (更高的分辨率标准,通常是8K的两倍)
- 32K – (极高的分辨率标准,通常是16K的两倍)
- 高清 – “High Definition” 或 “HD”
- 超高清 – “Ultra High Definition” 或 “UHD”
- 高分辨率 – “High Resolution”
- 百万像素 – “Megapixel” (常用于指摄像头或图像的分辨率)
- 全高清 – “Full High Definition” 或 “Full HD” (通常指1920 x 1080像素)
综合使用案例
所以我们已经掌握了提示的基本结构公式:【媒介+主题+细节+分辨率】
我们来看实际运用一下:
英文:【(pencil sketch:1.4),a cute Labrador puppy laying on the bed,intricate, high detail,ultra high resolution, 8k】
中文:【媒介:(铅笔素描:1.4),主题:一只可爱的拉布拉多小狗躺在床上,细节:复杂,高细节,分辨率:超高分辨率,8k】
同时我们还要加上一些负面提示,防止生成畸形图片。
英文:【(worst quality, low quality:1.4), logo, textmonochrome,Deformity, Twisted limbs, Incorrectproportions, Ugliness, Ugly limbs, Deformed armDeformed fingers, Three hands, Deformed hand, 4fingers, 6 fingers, Deformed thigh, Twisted legs..】
中文:【最差质量,低质量:1.4 ,标志 ,文字 ,单色 ,变形,扭曲的肢体 ,不正确的比例 ,丑陋,丑陋的肢体 ,变形的手臂 ,变形的手指 ,三只手 ,变形的手,4根手指,6根手指 ,变形的大腿 ,扭曲的腿 】。
效果图:
你可能会注意到,尽管我使用了关键词“床”,图像中却没有产生床,这是因为图像尺寸被设置为512*512,SD相信一个床无法适应如此小的空间。所以它有选择性地忽略了关键词“床”
如果我们可以将宽度分辨率增加,关键词“床”的出现机会也会增加。
