骚年,知道什么是AI绘图不
虽然我在标题和简介中写的是来了解AI绘图,但是其实只是想秀一下自己用AI生成的图片,所以这里不会告诉你AI为什么会画图(因为我也不知道丫)。AI绘图其实就是用文本描述你想要的图片,然后AI程序根据特定的采样算法和已训练好的模型,根据关键字通过迭代来叠放噪点,几十秒后你就可以获得一张你想象(或者超出你的想象)的图片,也就是文生图(txt2img)。比如下面这些图片,都是用AI画出来的:
通过AI画图,又被称为施法魔法。而各种不同的AI平台,就是你的魔法杖。通过吟唱魔法咒语(输入描述文本),就可以召唤想要的图片。越是复杂的咒语(复杂的文本描述),可以获得越精确的结果(越符合你想象的图片)。我不知道AI绘图对绘画行业的影响是好是坏,不过就个人来说,我一个完全没有学过画画的人,也可以有机会画出自己想要图片,还是感觉挺有趣的。当然,不用钱这一点确实很吸引人……
选择一根魔法杖(绘画平台)
现在AI绘画平台多种多样,有Niji-journey、Novel AI、Midjourney、Dall-E2、DreamStudio、阿里EasyNLP、文心ERNIE-ViLG、Stable Diffusion。说到Stable Diffusion,这其实是一个开源的算法框架,因为开源,有很多的绘画平台是基于它扩展,比如说我在这篇文章会用到的Novel AI 就是基于Stable Diffusion。因为Novel AI的模型针对二次元图片进行了大量的训练,所以更适合用来画二次元风格的图片。二次元(搞涩涩)的驱动力是灰常的强大,搜索Novel AI,你可以找到各种各样乱七八糟五花八门及其丰富的基础教程进阶教程高级教程。无论你愿意花小小的钱使用Noval AI官网施法、还是你想要在自己那个有niubility显卡的电脑上跑图、或者你像我一样贫穷得电脑还只有集显只能去白嫖云平台免费资源,花费一点点时间,都可以找到傻瓜教程获取自己的魔法杖。所以呢,如何选择平台、搭建平台、使用平台,什么官方平台、什么离线平台,什么NAIFU、WEB-UI、什么训练模型、ckpt、vae、pt, 我都一概不知道的呢。我就只是想简单地看看自己能用AI画出什么。
来试试念咒吧(怎么用文本描述图片)
如意如意,随我心意,快快显灵;阿瓦达索……额,不是这些咒语,不过,好像效果也差不多……
这里说的咒语指的是描述图片用的文字。AI通过关键字来构建图片,这些关键字的术语是prompt,不同的prompt用英文的逗号分割可以组成一长串的文本,用来描述你想要的图片。关键字大部分时候是英文,也可以是中文(不同的AI可平台能会识别不出来),甚至可以是表情符号。越多的prompt可以将图片描绘得越清楚,那么最后的成品就会越接近你的想象 -- 是的,你可能没有办法完全控制AI最后的成品是怎么样的,而这不正好也是一种开盲盒的快乐么,我曾经花了几个小时,跑了上千张图,就是为了追求一张能Hit到我的内心的图片……
比如我们来试试一个最简单的关键字 a girl
结果生成的图片可能超出你的想象,因为关键字太简单了,AI自己的发挥空间太大,并且会有一些缺陷存在,毕竟AI没有办法知道哪些特征是我们人类一眼看上去不可以接受的。这个时候我们可以通过添加一些负面关键词(nagative prompt)来告诉AI尽量避免在图片中加上奇奇怪怪的特征。首先我们加上更多的描述,告诉AI这个女孩长得怎么样(记得一定要加上衣服的描述,不然会出现各种奇奇怪怪的制服……):
a girl, long black hair, wearing a long white dress, detailed nice big eyes
然后加上一些通用的负面关键词:
lowres,bad anatomy,bad hands,text,error,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,missing arms,long neck,Humpbacked,missing fingers
这些负面关键词是为了尽量避免出现畸形的人物特征,比如不小心画多了一条手(腿)什么的……‘尽量’这个词的意思就说,即使加了这些负面关键词,并不保证最终结果就是合理的,出图的时候你还是要做好心理准备。
这个时候可以获得一个看起来简单的肖像图啦
抄学习别人的咒语
AI毕竟是程序,再怎么样,它们都会有一些固定的模式。有一些固有的关键词是通用(比如前面用到的那些负面关键词)。自己研究试验各种不同的关键词,固然可以保持新鲜的学习快乐,但是引用别人已经研究出来的关键词,可以节省我们自己试验的时间,也可以更好的描述我们想要的图片。比如扩展下我前面用到的咒语:(需要高质量清晰的图片效果,一个漂亮并且细节丰富的女孩,黑色的长头发,穿着白色长裙子,有漂亮的眼睛,全身像,需要描绘脸部和眼睛的细节)
best quality,highly detailed,masterpiece,ultra-detailed,illustration, a beautiful detailed girl, long black hair, wearing a long white dress, beautiful detailed eyes, full body, finaely detail, extremely_detailed_eyes_and_face
这次生成的图片细节就更加多了,甚至还画了背景:
到这里你可能发现了,我用的关键字明明包含了白色的裙子,但是画出来的人却穿着黑色的裙子。原因可能是因为我把黑色头发摆在了前面,而黑色占据了更大的权重,覆盖了后面的颜色。这个时候就需要进阶的知识来调整关键字了,比如修改头发的描述关键字,使得黑色固定指向头发:black_hair,然后还可以适当给白裙子增加加权重:(white dress:1.1)。
然后你还可能发现,为什么这些美女的小手手都看不到的?那是因为AI似乎不太擅长画手指,如果暴露出手掌的话,不小心就变形了……当然如果你愿意深入研究的话,你可能可以找到某些大师训练的手部优化模型,让你的AI可以画出漂亮的手。
召唤异世界降临
除了画人,我们也可以用AI画场景,比如我想画一个红月的场景图,点缀一些飞舞的叶子,我会尝试以下的描述:(需要高质量清晰的图片效果,类似高清CG的壁纸,自然画,有飞舞的叶子,透明光,全景镜头,夜晚,天上有红色的月亮)
best quality,masterpiece,ultra-detailed,illustration, (very detailed CG unified 8k wallpaper), natural, fly leaves, real, transparent, panorama, night, red moon in the sky
出来结果表明,AI确实能够把我的主题给表现出来,不过如果水中的倒影能有点波纹而不是简单的镜像可能会更好一点……
如果你对AI构图不满意的话,你也可以尝试用自己拍照的照片,交给AI帮你修改。比如这是我在海边拍的日月贝,原图是这样的:
使用下面这些标签,我本意是想给图片加上点科技风格的:
best quality,highly detailed,masterpiece,ultra-detailed,landscape/scenery,cityscape,best shadow,illustration,sandbeach,extremely detailed CG unity 8k wallpaper,starry sky,over the sea,science_fiction,crossover
在图生图的模式下可以设定AI的自由度(Denoising strength),如果限定一个较低的数值,生成图片会比较贴近原图:
而高自由度下画风变化多端,说实话我也不知道为什么画成了这样,可能AI有它自己的想法吧……
更好的把控你的魔法
知道更多的咒语(prompt),可以组合出更复杂的魔法,但这并不代表你可以掌控他们,关键字的顺序和不同的组合,加上AI绘图的些许不确定性,你施放的魔法可能并不符合你的要求,甚至有可能召唤出克总等不可直视的怪异,对你的心灵造成冲击……
既然你长得那么好看又看到了这里,说明你对这种神奇的AI魔法还是有点点兴趣,那么这里还有一些各路大魔导师(先行者)整理的魔法书、魔法典藏供你阅读了解。研读他人的经验能够让你更好的控制自己的魔力,并且抄写学习那些大魔导师的魔咒,可以让你轻松画出华丽的图片。不过在阅读练习的过程中,请注意节制,不要过于沉迷各种禁咒和大型魔法,如果不小心烧坏了设备,一定是和我没有任何关系的^^
元素同典:确实不完全科学的魔导书https://docs.qq.com/doc/DWFdSTHJtQWRzYk9k?&u=f95a8eba17834252b3cec2e01d2773a9
元素法典—— Novel AI 元素魔法全收录https://docs.qq.com/doc/DWHl3am5Zb05QbGVs?dver=&u=f95a8eba17834252b3cec2e01d2773a9
白嫖百度飞桨AI Studio来画图(每天8小时)https://aistudio.baidu.com/aistudio/projectdetail/4905623
白嫖 Kaggle来画图 (每周36小时)https://kaggle.com/code/toooajk/stable-diffusion-webui-kaggle