研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(下)
上篇反响不错,加快了我速更的意志,继续输出。
根据上篇讲了基础部分(增加元素细节),以及怎么去给提示,那么下篇要讲的还是脱离不了基础部分和提示,只是增加了人物连续性的复杂场景以及表情原理。
还是需要感谢这位伟大的作者:@AshutoshShrivastava,结尾附上该作者链接。
人物连续性场景变化
1.前期提示准备
在我们开始制作图像之前,有一些重要的考虑因素:
注意:我们将遵循类似的提示格式,但在这种情况下,我们为基本提示设置了巨大的差异。
Prompt: [Base Prompt] + [additional details / variationinformation]+identifer-1
提示:
[基本提示] +[额外细节/变量信息]+identifer-1
Chat GPT 叙述的场景以 室内/室外活动 命令(这很重要,所以不要忽视它。了解它为什么以这种方式构建)。
您可以向 Chat GPT 提供这个简洁的提示,指示它遵循这种格式,但使用新的基本命令。由于我们正在使用相同的聊天实例,所以无需输入整个命令。
<---提示开始--->
Now, we're going to work on the activity scene.We will set the base prompt as: 'Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun.Is that okay? In this case, you will have the freedom to update clothes and other details under the 'additional elements' section.Are you ready now?
现在,我们将处理活动场景。
我们将把基本提示设置为:“画一位名叫 Hope 的30岁美国女子,她留着卷曲的发型盘在发髻上。”
这个方式可以吗?在这种情况下,您将可以在“额外元素”部分自由更新服装和其他细节。
您准备好了吗?
<--- 提示结束 --->
ChatGPT的回应:
<--回应开始--->
是的,这听起来是一个很好的方法。将基本提示设置为:
“画一位名叫 Hope 的30岁美国女子,她留着卷曲的发型盘在发髻上。”
可以让您在不改变主要角色特征的情况下根据活动或场景调整服装和其他元素。我将确保只根据您指定的活动在“额外细节/变量信息”类别内进行修改。
感谢澄清,我已经准备好按照这种方式继续。请提供下一个您希望 Hope 参与的活动或场景。
<---回应结束--->
注意:这一调整是因为霍普穿着一件绿色T恤,我们不希望她到处都穿同样的衣服。这还演示了如何在不影响角色一致性的情况下轻微修改基本提示。
这次,我们是已经确定的基本提示,而不是图像。由于基本提示已设置并且 Chat GPT 已准备好,因此我们可以开始发布命令以构建我们的图像。
与上篇不同,我们不会使用(现在或制作)命令。相反,我们将简单地请求一个活动,然后 DALL-E 3 将创建图像。让我们看看它是如何工作的。
2.例子演示
1.如果我希望 Hope 去远足 (My command: Hope doing hiking ).
颜色提示:[基本提示] [额外细节/变量信息] +identifer-1
DALL-E Prompt for this image will be :Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, hiking in the mountains with appropriate attire and gear -0010
这张图片的DALL-E提示将是:
“画一位名叫 Hope 的 30 岁美国女子,她留着卷曲的发型盘在发髻上,穿着合适的装备 在山上远足。” -0010
观察:您可以看到它更新了一些细节,如山脉和合适的服装,这些是由 ChatGPT 提供的。
注意:术语“合适的装备”被用作概括性描述词,以使 DALL·E 3 生成的图像符合所提到活动常见着装。这为图像生成过程提供了一些灵活性。
2.如果我们想要确定 Hope 穿着的夹克颜色怎么办?我们当然可以指定这一点,但最好不要提供太多信息,让 DALL-E 3 处理细节。(My command: Hope doing hiking but I want her to wear white jacket and red backpack ).
DALL-E Prompt for this image will be :Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a white jacket and carrying a red backpack, hiking in the mountains -0011
这张图片的DALL-E提示将是:
“画一位名叫 Hope 的 30 岁美国女子,她留着卷曲的发型盘在发髻上,穿着白色夹克,背着红色背包,在山上远足。” -0011
观察:您可以看到它更新了一些细节,加入了白色夹克和背着红色背包。
3.假设现在我们希望 Hope 在冬季的环境中制作雪人(My command: Hope in a winter setting, making a snowman )
DALL-E Prompt for this image will be :Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, dressed in winter attire, in a snowy landscape making a snowman -0012
这张图片的DALL-E提示将是:
“画一位名叫 Hope 的 30 岁美国女子,她留着卷曲的发型盘在发髻上,穿着冬季服装,在多雪的风景中制作雪人。” -0012
4.如果要在活动中添加一些文本,我们看看它是如何工作的 (My Command :Hope is in the library, wearing a black t-shirt with 'HOPE' written on it)
DALL-E Prompt for this image will be :Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, seated comfortably in a library setting, wearing a black t-shirt with the word 'HOPE' written on it, engrossed in reading a book -0013
这张图片的DALL-E提示将是:
“画一位名叫 Hope 的 30 岁美国女子,她留着卷曲的发型盘在发髻上,坐在一个舒适的图书馆环境中,穿着一件上面印有“HOPE”字样的黑色T恤,专心阅读一本书。” -0013
3.表情原理
在使用类似照片的真实图片时,捕捉情感是很简单的,但在使用插图类型的主题时,要保持情感和一致性要困难得多。
当主题是插图时,为什么很难保持某些情感的一致性?
1.考虑像悲伤、愤怒、快乐、惊讶、怀疑、好奇和焦虑等情感。这些描述词富有表现力。当渲染成插图时,特别是如果被压缩成一个单词,DALL-E倾向于放大这些表情。这可能导致更加卡通或风格化的外观。
Prompt:Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, {emotion} -1
提示:画一位名叫 Hope 的 30 岁美国女子,她的卷曲波浪发型盘成发髻,穿着绿色T恤,{情感} -1
情感值可以是:愤怒,快乐,悲伤,惊讶(Angry,Happy,Sad,Surprised)等。
输出:看看这些图片,您会注意到它们都具有卡通(夸装)的特点。
2.对于照片风格的真实图片,这不是问题。让我们来看下面的结果(This is Hope in a photorealistic version)。
添加一个单词的描述词,比如悲伤、愤怒、快乐或惊讶,不会破坏一致性。
Prompt:Photoreaslitic portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, {emotion} -1
提示:30 岁的美国女性 Hope 的真实照片风格肖像,她的卷曲波浪发型盘成发髻,穿着绿色T恤,{情感} -1
情感值可以是:愤怒,快乐,悲伤,惊讶(Angry,Happy,Sad,Surprised)等。
3.对于梦幻、若有所思、好奇、自信和宽慰等情感,添加一个单词的描述词不会带来问题。因为这些情感没有那么生动和富有表现力。因此,DALL-E不会夸张这些表情,角色也不会显得卡通般。
Prompt:Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, {emotion} -1
提示:30 岁的美国女性 Hope 的插画风格肖像,她的卷曲波浪发型盘成发髻,穿着绿色T恤,{情感} -1
情感值可以是:梦幻、若有所思、好奇、自信和宽慰(dreamy, pensive, intrigued, confident, and relieved)。
输出:查看这些图像,您会发现一致性在整个过程中得以保持。
4.为了解决这个问题,我们需要巧妙地强调情感。最佳平衡的方法是使用“带有微妙但明显的{情感名称}表情”这种表述,找到这个完美的措辞是具有挑战性的。尝试了大约20种组合,只有这一种被证明是有效的。
Prompt:Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, with a nuanced yet evident {emotion} expression -1
提示:30 岁的美国女性 Hope 的插画风格肖像,她的卷曲波浪发型盘成发髻,穿着绿色T恤,带有微妙但明显的{情感}表情 -1
情感值可以是:生气、快乐、悲伤、惊讶(Angry,Happy,Sad,Surprised)。
输出:检查这些图像,您会发现情感存在,但角色的一致性仍然保持完好
参考地址:https://twitter.com/ai_for_success/status/1716792768352440725
近期文章
更多