对于对AI绘画感兴趣的小伙伴,除了选择好合适的软件和基础的一些参数调整以外,最为通用的知识就是提示词(俗称咒语)编写啦!下面我来免费分享我的原创教学攻略。
提示词(prompt)就是我们对AI的具体指令,告诉AI我们想要什么。
提示词主要有2类,分别是正向提示词和反向提示词。
1.正向提示词(prompt):
即对画面的描述,你想要出现在画面中的内容。
这代表什么呢?翻译成中文是这样的短语,它包含了画面整体的描述,主题内容,场景要求:
“最佳质量,杰作,高分辨率,一个女孩,中世纪盔甲,发饰,项链,珠宝,美丽的脸庞,身体上方,泰因德尔效应,逼真的照片效果,暗室摄影,边缘光照明,双色照明,(高度详细的皮肤:1.2),8K超高清,数码单反相机,柔和的光线,高质量,体积光照明,真实自然的摄影,高分辨率摄影,4K,8K,背景虚化。”
2. 反向提示词(Negative prompt):
指你不想在画面中出现的元素或属性,你不希望在画面中出现的内容。
这是一些常用的负面词汇清单,我就不再一一赘述,直接拿来用就可以。
3.如何使用提示词
提示词出来效果–采用majicmixRealistic模型
以下是两个基本规范需要注意:
1. 在Stable Diffusion软件中提示词需要采用全
英文,提示词中的标点符号也应全部使用英文符号。
2. 单词、短语和句子基本上是等价的。例如,“1boy、Lake、swimming”与“A Boy swimming in lake”在语义上是相同的,但是采用短语更加符合Stable Diffusion的语义习惯。
提示词出来效果–采用3Guofeng3模型
在给出正向提示词时,我们通常采用分类描述的方式。具体可以分为以下三类:整体描述、主体、场景。
在开始生成图片前,你需要好好考虑以下这些方面内容:
你需要的是一张照片还是一幅画作?
照片的主题是什么?人物?动物还是风景?
您希望添加哪些细节?环境和背景是什么?
是否使用特定的艺术风格?3D渲染、吉卜力工作室、电影海报
是否需要特定的照片类型?微距、长焦
考虑好以上内容后,我们需要把这些加入到整体描述提示词的中。
1.画面整体描述
通常我们需要首先考虑画面的整体质量,需要涵盖以下四个方面:
-
画质描述:可以分为高画质、中等画质或低画质,2k 、4k高清分辨率等。
-
艺术风格描述:CG、二次元、3D渲染、海报、真人照片、油画、水墨画等。
-
构图镜头描述:画面中人物的占比,是半身像还是全身像,正面、俯视还是侧面,是否需要摄影镜头。
-
光线或色调描述:自然光线、聚光、背光?鲜艳、暗淡、冷色调或暖色调。
2. 主体
以人物为例,主体的描述通常包括以下两个方面:特征、姿势。
-
特征:特征描述通常包括人脸上五官、年龄、皮肤、毛发、服饰及其他装饰细节特征等
-
姿势:即主体的动态,例如坐姿、立姿、跑步等。
3.场景
基本场景描述通常包括时间、地点、光线、天气、细节等描述,这一点根据实际画面需求进行调整。
提示词出来效果–采用revAnimated模型
仅仅有了提示词的想法还不够,我们还需要知道怎么把提示词重新组合成Stable Diffusion可以容易识别的格式。
1.分隔符
不同的提示词之间要采用英文逗号分隔,这样AI才能判断每一个单词的主体。
2.提示词顺序
文字的单词顺序很重要。提示词的重要性取决于其在句子中的位置,通常主要内容应该放在前面。因此建议应该尽可能将每个短语明确、分顺序列出,而不是试图把它们压缩成一个简单的英文短句,这样更加便于机器理解。
3.权重调整
我们还可以使用强化和弱化方式来调整提示词的重要性。
例如:(Masterpieces:1.1),这个形式代表的是(提示词短语:权重系数)。权重数值默认为1。数值小于1表示弱化,数值大于1表示强化,通常我们权重系数会设置在0.3~1.6之间。
4.()与[]区别
在提示词中使用()表示强化,使用[]表示弱化。可以使用多层嵌套来进一步增强或减弱提示词的重要性。例如:((Masterpieces))实际效果等于 (Masterpieces:1.1),每一个扩号等于乘以1.1权重。[Masterpieces]实际效果约等于 (Masterpieces:0.9)。
好了,通过以上的教程,你应该已经初步入门了,接下来就试着用刚刚教的内容初步生成一个画面吧。
5.prompt尝试
提示词出来效果–采用Ghostmix模型
尝试着用我这个这个prompt来绘制你的第一幅AI绘画作品吧,参数可以采用默认参数或者我下图显示的参数。
正面提示词:
负面提示词:
1.提示词顺序
提示词的顺序决定了AI出图时,分步骤时候考虑的内容顺序,后面的词的权重会相对较低。因此重要的提示词应该放在前面。
接下来我将用一个测试来进行详细说明,测试中包括了一个美女和一只狗狗的图片。当把提示词“1 girl”放在前面时,女孩明显占据画面整体部分,狗狗只有可怜的一小角。
而当我们把"1 dog"放前面的时候,狗狗在画面中的比重和细节都更加突出,甚至AI将狗的耳朵元素添加到了人物身上。
根据这个测试结果可以得出结论:提示词的顺序影响着画面的组织方式,放在前面的提示词对构图的影响更大。
我认为提示词的位置顺序更多影响的是语境,AI会按照顺序去理解你输入的语句,如果你前面的提示词已经构建了完整的画面,后面的提示词无法融入AI对画面的理解,AI就会弱化甚至忽略后面的内容。
当然,这个规律并非绝对有效,对于某些情况或者较为复杂的场景,可能会失效的情况。但是总的从多数图片来说,AI都会遵循这个规律,因此在编写提示词时,将重要想要表达的内容提前,更容易实现自己想要的场景。
按照以上的结论,我们在写提示词的顺序的时候,可以首先提及一些概念性、大范围的关键词,然后是描绘画面内容的关键词,最后是一些细节的描述。我觉得可以按照以下顺序进行编写:
prompt:
【画面质量提示词】+ 【画面主体内容】+【画面艺术风格】+【构图色调及光影】
2. 提示词类别
常用的关键词类别包括如下内容,可以根据画面需求增加或减少:
1.主体 是指想在图像中看到的主体,要尽可能详细描述以避免出现描述不足的问题。
2.画风 是指生成图片的画风,例如插画 illustration、油画 oil painting 或摄影风 photography 等
3.画家 是指用特定画家作为参考来生成他们风格的图像。当然也可以使用多个画家名字来生成混合风格。
4.分辨率 表示生成图像的清晰度和细节程度。例如“highly detailed, sharp focus”
5. 构图 是指主体在画面中的构图方式,拍摄角度。例如“looking at camera,Top view”
6.色调 是指通过添加颜色关键字来控制图像整体颜色,可以把颜色应用到某个物品上或者是整体色调。
7. 光影 是指图像里的光照描述,改变光照可以对图像效果产生巨大影响。例如“cinematic lighting, dark”
3、提示词权重
在模型中,每个词语都有自身的权重,这些权重可能因为在训练集中的出现频率不同而有所差异。
举例来说,如果某个关键词在训练集中出现较多,那么仅输入这个词就能对生成的内容产生较大的影响;相反,如果某个关键词在训练集中出现较少,那么即使输入多个相关词汇,对生成的内容的影响效果也可能有限。
因此,在提示词的写作中,关键词最好具有特异性,比如使用 “Disney” 可以清晰指向Disney迪士尼风格的动画,而使用 “Anime” 动漫这个词则相对泛化。在选择提示词时,最好使用具体的措辞,尽量避免使用抽象的措辞,以减少机器理解和解释的空间。
在对提示词的权重进行人工修改时,可以使用括号来指定权重的倍数。
例如,(red) 表示将该词的权重提高 1.1 倍,[red] 表示将该词的权重降低到原先的 90.91%。还可以使用 (red:1.5) 将该词的权重提高 1.5 倍,或者使用 (red:0.25) 将该词的权重减少为原先的 25%。
需要注意的是,建议不要将权重值调整超过 1.5。
最后再详细解释下括号的意义:括号的数量代表的是权重的倍数,例如 ( n ) 表示 n 的权重增加 1.1 倍,((n))代表的是n的权重公式可以理解为n*1.1*1.1即n的1.21倍,表示将该词的权重提高 1.21 倍(即原先的 1.1 倍的 1.1 倍),((( n ))) 则表示 n 的权重增加 至1.331 倍,以此类推。
有时候为了更好的控制画面,我们可能会要求在渲染步骤中,描绘的重点不同,以形成我们心目中的画面。
1.语法格式
[To:when] 意思是:在经过指定数量的步骤后,将位于 to 处的提示词添加到提示中。
[From::when] 意思是:在经过指定数量的步骤后,从提示中删除位于 from 处的提示词。
[From:to:when] 意思是:在经过指定数量的步骤后,将位于 from 处的提示词替换为 to 处的提示词。
2.语法详解
我来举个例子,我采用的提示词是:“a [handsome:strong:15] boy”, 共采用25步。
Stable Diffusion在一开始的时候运行的时候,他理解的提示词是 “a handsome boy”,经过 15 步之后,Stable Diffusion理解的提示词将被替换为 “a strong boy”。它将基于之前已经生成的第15步的"a handsome boy"的图像上进行继续计算。
接下来,我们来测试下更为复杂的用法,例如我采用提示词是:“a handsome boy wear[Medieval boots:Neon lights :0.25] and [Mechanical armor:cyberpunk clothes:0.75][ in foreground::0.6][ in background:0.25][shoddy:masterful:0.5],”,进行 100 步的采样。
一开始的提示词是 “a handsome boy wear Medieval boots and Mechanical armor in foregroundshoddy”。可以看到生成了一个穿着中世纪长靴和铠甲的人,质量不佳。
经过 25 步之后,提示词变为 "a handsome boy wear Neon lights and Mechanical armor in foreground in background shoddy "。提示词将中世纪长靴替换成了霓虹灯,质量不佳。
经过 50 步之后,提示词变为" a handsome boy wear Neon lights and Mechanical armor in foreground in background Masterful "。可以看到中世纪长靴已经变了,加入了霓虹灯元素,画质改善的作用也出来了。
经过 60 步之后,提示词变为 " a handsome boy wear Neon lights and Mechanical armor in background Masterful "。将霓虹灯元素转移至背景。
经过 75 步之后,提示词变为 " a handsome boy wear Neon lights and cyberpunk clothes in background Masterful "。最终加入的赛博朋克风的衣物展示了完整的效果,背景也顺利了加入了霓虹灯元素。
是不是很有趣呢?
3.提示词轮转
提示词也可以进行轮转来进行提示,采用的格式是[提示词一|提示词二]
例如 “[clouds|pig] in sky”,在第一步时,提示词为 "clouds in sky ";在第二步时,提示词为 “pig in sky”;在第三步时,提示词为 “clouds in sky”,以此类推, 不断重复轮转。
先生成云
再生成猪
再回到云
额,回不去了,就是云和猪
最终结果和我想象中有点区别,我本来是想生成一个猪猪状的云的……看来有点困难。不过原理大家都理解了吧~
除了自己构思,如果碰到日常配图,想要偷懒快速生成图片,我们也可以借助ChatGPT类的语言大模型来进行提示词生成。
接下来分享一个我自己摸索出来的非常实用的一个提示词语句,这个提示词是我自己在别人分享的prompt基础上,进行调整调试而做的二次创新,效果还可以,记得最后还得自己加上画质提示词进行优化哦。
prompt:
我采用文心一言做示意(不同大模型效果不一,可以多试一下),将结果分享给各位。
AI绘画如何使用正确的关键词,对于画面呈现的效果非常关键,学好提示词是掌握AI绘画的基础,小伙伴们,这篇文章如果对你们有用还请点赞支持下!文末扫码可获取更多详细资料噢~
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。