超简单-搭建自己的AI图片生成器
最近一段时间,使用 Stable Diffusion 等工具生成图片的资讯充斥着整个互联网,但是很多在线的 AI 图片生成工具,要么根本访问不了,要么就是需要付费,而且还巨慢。作为一个常年混迹于互联网的技术流玩家,我觉得有必要在自己本机搭一下无限制的 AI 图片生成工具。
本地搭建这东西我觉得还是很有用的,对于我来说,写博客,公众号的一些配图,完全可以用这东西生成。还有最重要的,我是想用在独立游戏开发中,让我做的那些垃圾文字游戏,可以多一点图片,增加哪怕一点点美感和吸引力。
我们用的工具是 Stable Diffusion。由于我的机器是 Mac M1 芯片的,所以教程也就是在此配置上去搭建,其他平台类似。
1. 确认 Python 环境
首先确保自己机器上的 Python3 版本是 3.10 以上,使用命令python3 --version
可以查看。如果还没有安装 Python3 则使用命令brew install python3
来安装。如果版本比 3.10 低,则使用brew upgrade python3
来升级到最新版本
2. 下载 Stable Diffusion 的 Web 工程
使用命令git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
来克隆 Stable Diffusion 的 web 工程,这个工程可以让我们在浏览器中使用 Stable Diffusion。
注意,这个过程可能会异常的慢,甚至可以失败,如果失败了,那就重新执行命令,或者采取一些科学的网络方式对其进行下速,反正相办法下载下来就行。
3. 下载模型文件,模型文件,可以理解为官方或其他人已经训练好的一些参数集合,有了这个,生成工具才知道怎么去生成一张图片。
先下载官方的基础 Model,这里使用的是 1.5 版本的,2.0 版本的不在此博客的讨论范围内,因为我也没用过。
点击这里下载v1-5-pruned.ckpt[1]
下载完成后,将这个文件放入stable-diffusion-webui/models/Stable-diffusion
目录下
4. 运行 Stable Diffusion
工程下载来下后,使用命令cd stable-diffusion-webui
进入工程的主目录。然后再执行运行命令./webui.sh
。注意,这个命令也是可能会非常的慢,或者失败,因为第一次运行,会下载一些其他的库,这个过程可能会失败很多次,取决于网络情况,我安装的时候,就装了好久。失败了就重新运行./webui.sh
即可,已经下载完的不会重复下载,放心好了。
命令运行可能需要一小会,不要着急,当看到终端输出下面的内容时,一般就说明行了
在浏览器中打开http://localhost:7860/
即可看到运行后的 Stable Diffusion Web 界面了。
5. 尝试生成一张图
在 web 界面中的第一个输入框中输入下面的 Prompt,也就是告诉 Stable Diffusion 要生成什么的关键词描述
oil painting with heavy impasto of a pirate ship and its captain, cosmic horror painting, elegant intricate artstation concept art by craig mullins detailed
其他的都不变,然后点击右边的Generate按钮,等待一会,右下角就会出现结果
看起来效果还行对不对。这只是最基本的用法,上面第一个框是输入关键词的,下面一个框是输入负面关键词(就是不想要的)的,如果你要问这些关键词从哪里来,嗯,很多网站都有,我一般是从下面几个网站去找想要的图的风格的 Prompt
https://arthub.ai/[2]
https://prompthero.com/[3]
6. 说一下模型
接下来说一下模型,上面我们用到的只是官方的最基本的模型,还有很多大神做的模型,比如用来生成好看小姐姐的,那么模型从哪里来呢?我一般从https://civitai.com/[4]这个网站来下载。
我理解的模型分为两种,一种可以理解成主模型,一种是依附于主模型才能使用的模型,例如比较流行的Lora模型,就是需要依附于主模型才能使用。我们先说主模型,主模型一般的大小都是好几个G,而像Lora这种需要依赖于主模型的模型,一般都是几百M。
主模型下载后,需要放在stable-diffusion-webui/models/Stable-diffusion
目录下。
而像Lora模型,则需要放在stable-diffusion-webui/models/Lora
目录下。
7. 下载一个非官方的模型试一下
我们在 civitai 这个网站上下载一个模型,例如这个国风3 GuoFeng3[5]。打开后,点击右边的 **Download Latest (5.19GB),即可下载。如果有一些模型需要登录才能下载,那就按网站的要求来。下载完后,把这个模型的文件放入stable-diffusion-webui/models/Stable-diffusion
目录下。然后重新运行./webui.sh
命令(先把之前运行的中止掉),这才 Stable Diffusion 才能加载我们新下载的模型。
重新运行后,打开 Web 界面,然后左上角 Stable Diffusion checkpoint 那里,选择刚下载的那个 GuoFeng3。然后在 Prompt 和负面 Prompt 中分别输入下面的关键词。
Prompt
best quality, masterpiece, highres, 1girl,china dress,Beautiful face,upon_body, photorealistic, (high detailed skin:1.2), 8k uhd, dslr, soft lighting, high quality, volumetric lighting, candid, Photograph, high resolution, 4k, 8k, Bokeh
Negative prompt
(((simple background))),monochrome ,lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, lowres, bad anatomy, bad hands, text, error, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, ugly,pregnant,vore,duplicate,morbid,mut ilated,tran nsexual, hermaphrodite,long neck,mutated hands,poorly drawn hands,poorly drawn face,mutation,deformed,blurry,bad anatomy,bad proportions,malformed limbs,extra limbs,cloned face,disfigured,gross proportions, (((missing arms))),(((missing legs))), (((extra arms))),(((extra legs))),pubic hair, plump,bad legs,error legs,username,blurry,bad feet
CFG scale 设置为 7 Steps 设置为 30 Sampler 设置为 Euler a Seed 设置为 1032908249
然后点击Generate结果如下
8. 试一下 Lora 模型
首先,我们去下载一个 Lora 模型,例如这个Fashion Girl[6]。点击右边的下载,下载后放在stable-diffusion-webui/models/Lora
目录下。然后重启 Stable Diffusion,也就是重新运行命令./webui.sh
。
Lora 模型不会出现在 Stable Diffusion checkpoint 那个选择框里,它是一个 Prompt 参数,告诉生成器要使用的 Lora 模型以及权重。
主模型我们还是使用上面的那个国风3模型,然后在此基础上,用上 Lora 模型。
首先输入之前的 Prompt,然后根据下图中的箭头,依次点击红框中的内容,即可看到在上面 Prompt 输入框中,多了一个指令
,这个就是告诉 Stable Diffusion 使用 Lora 模型,并且权重是1,我可以调整为其他的值,例如 0.8。
然后点击右边的Generate,生成结果如下。
以上就是在本地搭建 Stable Diffusion 生成器的全过程,我猜接下来你肯定是要去模型网站下载各种模型尝试了,加油。
对于文中提到的一些网站,不排除有的可能需要科学上网,此问题不在本文讨论范围内。
参考资料
[1]
v1-5-pruned.ckpt:https://cdn-lfs.huggingface.co/repos/6b/20/6b201da5f0f5c60524535ebb7deac2eef68605655d3bbacfee9cce0087f3b3f5/e1441589a6f3c5a53f5f54d0975a18a7feb7cdf0b0dee276dfc3331ae376a053?response-content-disposition=attachment%3B+filename%3DUTF-8%27%27v1-5-pruned.ckpt%3B+filename%3D%22v1-5-pruned.ckpt%22%3B&Expires=1680158334&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZG4tbGZzLmh1Z2dpbmdmYWNlLmNvL3JlcG9zLzZiLzIwLzZiMjAxZGE1ZjBmNWM2MDUyNDUzNWViYjdkZWFjMmVlZjY4NjA1NjU1ZDNiYmFjZmVlOWNjZTAwODdmM2IzZjUvZTE0NDE1ODlhNmYzYzVhNTNmNWY1NGQwOTc1YTE4YTdmZWI3Y2RmMGIwZGVlMjc2ZGZjMzMzMWFlMzc2YTA1Mz9yZXNwb25zZS1jb250ZW50LWRpc3Bvc2l0aW9uPSoiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2ODAxNTgzMzR9fX1dfQ__&Signature=VxNVuW0cImdmUrkDol35H8OxqJs7isbJAE%7EOygjrTQEuvjp7ijj87-VZ7peCZSYtoB5NEdwkfj2bO30P0CNozHN7wPXQbx7Q7PxvXzWo086HJslbKD1L6ArTVCgupJf7AH2uD%7EGnVQXIM-viUV8EzGUnjo08Cq2EL5wn-3Zph4R0nEAtuF64ehCvQmQgzKLk927asBf391MgvilIbdZj4-7BzXDTGV-y160XeqllcwSjQAIuKhxBICQskz6tUVkfCusw3p0XceCm1HL1Z-wyyN4nkmn8ihFZeQJspBIKUBIouEQHuHT2sk35EQhbonM4ePGxIl7Ek0Pl5PwxbA1sZA__&Key-Pair-Id=KVTP0A1DKRTAX*
[2]https://arthub.ai/:https://arthub.ai/
[3]https://prompthero.com/:https://prompthero.com/
[4]https://civitai.com/:https://civitai.com/
[5]国风3 GuoFeng3:https://civitai.com/models/10415/3-guofeng3
[6]Fashion Girl:https://civitai.com/models/8217/fashion-girl
点击下面名片,关注【萌一小栈】
-
上一篇
2、Arc Lab
免费好用的AI工具网站,值得尝试
自从ChatGPT爆火之后,各种AI工具层出不穷。AI的应用,对于各行各业都产生了重大影响,有的甚至是颠覆性的改变,比如电商模特配图、游戏原画制作等,逐渐被AI
-
下一篇
AI2.0市场预计将是移动互联网规模的10倍,期待能形成巨头、中小微创新企业一起发展的创新综合体。
未来,我认为最具革命性的AI2.0应用是AI-First。创新工场董事长李开复在演讲中说道。
什么是AI-First应用?就是指那些离开大模型就无法存在的应用。
5月28日,创新工场董事长兼首席执行官、创新工场人工智能工程院院长李开复在2023中关村论坛上,发表了题为《AI1.0到AI2.0的新机遇》的演讲。
他在演讲中针对那些对大模型发展存疑的声音,从大模型发展的商业价值、AI2.0对未来应用生态的影响以及中国大模型发展的展望等方面,给出了自己的见解。
他表示,即便是不完美的大模型,也存在几十万亿美元的商业价值。未来的AI2.0市场预计将是移动互联网规模的10倍,容纳得下巨头、中小企业、初创公司在三个层级的赛马。期待能形成巨头、中小微创新企业一起发展的创新综合体。
李开复演讲的精彩观点如下:
1. AI1.0时代每个应用都是一个孤岛,但有了大模型之后,一次性用海量的数据去训练一个基础大模型,再用这个模型去调适所需的应用,这样成本就降低了很多。
2. 即便一个非完美的大模型,它还是有相当大的商业价值,甚至是几十万亿规模的商业价值。这就看人类如何与它协作,也就是所谓的Human in the loop。
3. 我们完全可以想象今天的Word、PowerPoint、Excel、Photoshop等应用通通都会用AI大模型重写一次,而且重写之后它的用户体验会变,甚至商业模式也会变。
4. 当年如果要选择在移动互联网创业或者投资,那一定要选那些非有移动不可的APP,那么今天要在人工智能领域创业,就一定要做非有人工智能不可的APP。
5. 模型大小并非大模型发展的唯一决定因素,数据质量更重要。
6. AI2.0市场预计将是移动互联网规模的10倍,期待能形成巨头、中小微创新企业一起发展的创新综合体。
来源:视频截图
以下是李开复演讲全文(有删减)
李开复:AI大模型是不能错过的历史机遇