1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

每天一个AI姬,AI绘画使用ComfyUI多层布局生成拟真电影海报实测

1987web2023-08-24人工智能AI107

每天一个AI姬,以飨关注者

ComfyUI 的多层叠加布局与多图混合布局,为AI绘画的精细化操作提供了无限的可能。

今天,就让我们来试一试,使用 ComfyUI 的多层叠加布局,来生成一张拟真的电影海报吧。

正好素材库中下载有著名电影演员汤唯的风格模板,所以这次海报的主题,就选了她的得奖影片《分手的决心》。特别说明:只为测试AI绘画之用,未有侵权之意,特此申明。


首先,就是基础模型的选用——dreamful_v10Light

看过电影的人们都知道《分手的决心》最后定格的画面,是落日西沉的一片海滩,所以基础模型必须要包含有【海滩】这一场景。而经过之前的测试,dreamful_v10Light 这个模型,对于海滩场景的处理,是非常出色的。

优秀的基础模型 dreamful_v10Light

上图即由基础模型 dreamful_v10Light 所绘,显示了 dreamful_v10Light 优秀的出画能力。


其次,就是人物风格模板的选用——tangwei_v1

尽管这个风格模板并不适用于绘制全身的大图,但就本次测图而言,也足够使用了。

风格模板 tangwei_v1 的预览图


最后,就是场景风格模板的选用——waves_v3

之所以需要选用一个场景风格模板,也是出于对影片最后结局氛围的一种拟真,仅使用基础模型的话,海滩上无法展示汹涌的海潮。

风格模板 waves_v3 的预览图


选定了各种模型模板,接下来就是使用 ComfyUI 来进行绘制了。

具体的操作方法就不做细论了,都非常简单,这里只展示一下 ComfyUI 的多层叠加布局绘图的界面。

其原理很简单,就是将画面分为远、中、近三个场景(当然也可以分的更细致,包括左中右都可以),然后分别给出提示词,再调整各个场景的画幅范围,最后再统一输出渲染。

ComfyUI 的提示词可以分轨工作,因此它的敏感性要远高于 WebUI 。

ComfyUI 的分层叠加布局非常直观,属于一看就会的直觉型操作界面。

ComfyUI 多轨提示词及多层叠加布局界面

基础模型,作为画面的背景,用于生成一个落日西沉中的美丽海滩。

人物模板,作为画面的主体,用于生成人物的具体形象。

场景模板,作为画面的氛围补充,用于产生一些特殊效果。


最一开始,我们得到的是下面这样的画面(采样=dpmpp_sde,步数=68,以下皆同)

首次出图结果

可以看出,人物脸部不够细致,应该是没有添加准确的面部提示词的原因。

修改人物提示词,添加聚焦于脸部这样的关键字,然后得到的下面这样的结果:

第二次出图结果

这次人物脸部尚可,可惜挡住了后面的场景,落日也不见了,继续加强落日提示词的权重。然后,我们就可以得到下面的结果:

糟糕,人物不见了

好吧,也许是对落日的权重提的太高,导致AI完全忽略了人物,而且画面割裂。继续调整,添加负面提示词,撇除不相关的元素。

然后,得出了基本符合我们需要的场景:

场景正确,氛围感不足

可惜,氛围感不足,海浪不够汹涌,人物的表情也失去了电影中的故事性。

继续调整海浪的权重,并对人物模板添加【沉思】与【非常严肃】等提示词,并且使之居于首行,以免AI自动忽略。然后,让我们看看出图结果吧:

合格画面出炉,可惜手部不完美

终于有了不错的氛围感,可惜还有手部的问题,继续添加负面提示词以避免出现手的画面,然后,得出了如下画面:

表情有点凶

还算不错的画面,只不过用于电影海报,又有点失去了亲和力,也少了一点动态,继续添加关键字,让人物有一个回头的动势。

最后终于出现了我们想要的那种氛围感十足,悲剧中又带有一点浪漫色彩的电影海报。

完美的电影海报


其实,出图的过程,还是挺花时间的,毕竟测试的显卡只有8G显存;不过,我们能够在几个小时之内,就完成一幅还算不错的电影海报,也算是颇感欣慰了。

当然,出图过程中也会有一些没有完全融合好的坏图,但这在AI绘画领域都是极为正常的,随着AI技术的不断发展,以及基础模型与风格模板的不断革新,相信在不久以后,让AI绘出类似的电影海报,应该只是一蹴而就的事。

ComfyUI 操作界面全景

因为整个产品都很简单,所以首页Dashboard中也没有具体的内容,只是促进使用的诱饵。

默认的Language options如果不改的话有点蠢,它会自动按Output language翻译为英文。

大部分的模板是营销或者电商的,看上去下面几个是作为产品经理的我后面可以深入使用的:

Feature to Benifit: 功能给客户带来什么价值的漂亮话一直是产品经理写得比较痛苦的。

Personal LinkedIn Post: 感觉可以把一些行业的洞见洗稿为个人的洞见。

Quora Answers: 无脑回答知乎问题。

Sentence Expander: 论文凑字数挺好。

Unique Value Proposition: 独特的价值主张。

BETA的chat功能感觉就是追热点,与主产品集成在于文档编辑时的Chat mode。

Document editor是Jasper最核心的功能了,第一眼看上去是个简单得不能再简单的在线文档编辑器。左侧的switch在培训里提过很多次,可以控制标题、描述这些是否对AI可见,可以切换来实验不同的生成效果。

右侧的6个分别是:Re-phrase选中后重新生成一段、Fix grammar(与Grammarly集成)、Explain it to a 5th grader(字面意思就是生成得通俗易懂,也有个同名的template)、Disable Grammerly、Plagiarism checker(剽窃检查)、Keyboard shortcuts and pro tips。

中间的4个分别是:Focus mode、Chat mode、SEO mode、Power mode。

Chat mode就比刚才首页的Chat菜单好用,可以在编辑文档的过程中随时提问然后粘贴过来。感觉更好的形态是悬浮的wizard、可以与其它mode共存。

SEO mode是与Surfer紧密集成的。Surfer居然不是freemium,只是对Jasper有个友情试用价。这真是美国SaaS和中国SaaS的巨大差别,中国SaaS这样绝对会被客户diss死,怎么着也得打包一个合同卖吧。我对SEO也不懂,就不深度试用了。

Power mode相当于专家模式,除了将之前的Chats和Template展示在左侧外,还有更强大的Workflow。以Email Campaign为例,包含Company Description、Target Audiences、Pain Points、Change Your Tone of Voice、Email、Email Subject Lines这6部分,每一部分都是根据一个模板生成的文字。

Recipes是比模板更specific的模板,核心是Command+一步步的指引,并且有大量的社区UGC。默认的Recipe有Cold Email, Blog Post等等,感觉比较适合我的是Product Review Blog Post,和这篇文章本身是差不多的。。看上去必须要配一个Youtube操作解说才能使用,门槛也高一些。