AI模型Midjourney,想象力的引擎,人工智能图像生成器的崛起
每天一个AI模型,让思维提前和未来同步。
一个机器蒸汽机,以惊人的速度沿着轨道疾驶,喷出五颜六色的烟雾云
AI生成的艺术作品正在悄然开始重塑文化。在过去的几年里,机器学习系统从文本提示生成图像的能力在质量、准确性和表达方面有了显著提高。诞生了DALL-E,Midjourney,Stable Diffusion等几个顶级图像生成AI。
创建这些艺术感浓烈的图片不仅棘手,而且代价不菲。AI需要访问数百万张用于训练系统的图像,并且进行大量的计算工作来生成模型参数。
今天介绍的Midjourney,区别于其他几个生成AI的最主要特点是他的与大众相联通的方式,通过Disscord——一个由兴趣而聚集在一起的社群。
在一个广场,完全开放浏览
之前介绍的DALL-E,Stable Diffusion都是类似于一个单机的程序,不论是你在官网Demo上体验,还是你通过复制源码使用自己的计算资源来生成,你在创造一个新事物的时候,是无法和其他人形成沟通的。正如Midjourney创始人David Holz在接受Verge采访的时候说:
很多人问我们,你为什么不做一个 iOS 应用程序,让你拍一张照片?
但人们想要一起创造事物,如果你在 iOS 上这样做,你就必须建立自己的社交网络。 这很难。 所以如果你想要自己的社交体验,Discord 真的很棒。
那Discord是什么呢,Discord是一款专为社群设计的免费网络实时通话软件与数字发行平台,主要针对游戏玩家、教育人士、朋友及商业人士,用户之间可以在软体的聊天频道通过消息、图片、视频和音频进行交流。
Discord就像是一个容纳了无数兴趣广场的地方,进入广场的人首先都是被某个招牌,也就是某个兴趣点吸引而来的人。
于是,你利用Midjourney创作的内容,会实时的展现给广场里所有的人。我认为这种公开的方式,也促使了人们展现自己善良一面的创造力。
加入Discord频道,只需要输入提示词,等待一会机会出现AI生成图片,并且是公开的
在加入Discord频道后,每时每刻都会有很多奇思妙想式的图片被创造出来
电影海报,皮克斯风格,mônica和朋友,可爱,海报皮克斯,3D
关于twitch 直播间的漂亮的网站界面
完全开放的广场,不仅促进了人们更友好的进行交流,并且也提供了大量的灵感触发。
机器的想象力会超过人类吗?
关于想象力,似乎在具象想象力这个方面,AI走在了我们的前面。但是——我们如何扩展人类的想象力? 那是什么意思? 当计算机比 99% 的人类更善于视觉想象时,这意味着什么?
这并不意味着我们将停止想象。 汽车比人类快,但这并不意味着我们停止步行。 当我们远距离运输大量物品时,我们需要发动机,无论是飞机、轮船还是汽车。我们将这项技术视为想象力的引擎。所以这是一件非常积极和人性化的事情。
所以现在很多的实验室和公司都在研究文本转化为图像的技术,Google 有 Imagen,OpenAI 有 DALL-E,还有一些像 Craiyon 这样的小项目。那么研究这个技术有什么用呢?
我有一个非常大的想象:在未来的某一个天,你买回一个带有高级AI处理器的Xbox,你不仅仅可以玩那些游戏厂商提前创建好的游戏,你可以自己想象你的游戏世界,然后根据的想象文本,AI快速帮你生成游戏空间,听起来简直太酷,好像在这一刻,你就是造物主一样。
下面这幅图就是在Midjourney上,使用提示词——详细的、技术图纸、展示了、革命性的、想象力引擎——生成的图片。
关于生成想象的机器的想象,看起来既复古又有未来感
想象力的提升,需要群体的智慧
我们很快发现大多数人不知道他们想要什么。
你说:这是一台你可以想象任何东西的机器——你想要什么?
他们说:狗。
你说:真的吗?
他们变成了说:粉红色的狗。
所以你给他们一张狗的照片,他们会说好,然后去做其他事情。
然而,如果你把他们放在一个组里,情况会发生本质的提升。
他们依然会说:狗,但是!
其他人会变成:太空狗
还有其他人会变成说:阿兹台克太空狗。
然后突然之间,人们明白了各种可能性,而你正在创造这种增强的想象力——一个人们可以利用这种新能力学习和玩耍的环境。所以人们真的很喜欢一起想象。
这也是为什么Midjourney制作了Discord,而且是巨大的,智能化的Discord社区来供人们想象。
AI生成图片前,所需要的训练数据来自于哪里呢?
其实这个问题,困惑了我很久,明显AI生成的图片有些具有非常强烈的艺术风格,并且不同模型根据相同提示词生成的图片也具有某种意义上的关联性(如果你的审美具有基本水平,我相信谁的可以发现)
后来发现,原来几乎所有的AI生成式模型使用的训练数据几乎都来自于互联网——这也是为什么Stable Diffusion等会面临被艺术家起诉的境地——因为AI未经授权,擅自使用了别人的作品。
当然,这也是AI生成的早期阶段,这就好像是这么多家公司,都使用的同一个文件夹里的图片——一个巨大的图片库。
但是,现在很多AI都面临的一个问题就是,通过互联网学习的AI会产生一些偏见,比如你让他画一个CEO,这个CEO通常是白人,而你让他画一个护士,这个护士总是一个女性,并且很大概率是有色人种。并且像Midjourney早期就非常喜欢使用蓝色和黄色色调。
最后一个思考,AI危险吗?
我觉得人们完全误解了人工智能是什么?有些鼓吹AI威胁论的人认为AI是一只老虎。老虎是很危险的,因为老虎可能会吃掉人。这是一个你死我亡的过程。
但是AI更有可能是水,水很危险,人可能会淹死在水中,但是流动的水的危险和老虎体现的危险不是同一个东西,我们可以在水中游泳,甚至可以造船,修建水电站,让水成为一种驱动力。
就像古话说的,水善利万物而不争,只要我们知道如何与水和平共处,我们会从中获益。
我认为这是一个机会,水没有意志,我们应该做好引导工作,而不是贸然行动淹死在里面。
最后,让Midjourney为我们生成一幅图,AI心目中,如何将人工智能描绘成水。
一个抽象的、详细的插图、将人工智能描绘成水、一种强大的力量、可以用来做好事、也可以用来作恶
有点类似神灵从水中跃出
中国进入百模大战,未来机会在哪?
来源 | AI黑马
作者 | 张沉浮
百模大战:最值得关注的100家AI大模型
有了产品就有了市场,有了江湖就有了竞争。
移动互联网时代的那场百团大战,还让很多从业者记忆犹新。
那会,无论是马云、马化腾还是李彦宏,整个互联网圈都还在喊:
AI领域“百模大战”开始了!这100家AI大模型最值得大家关注