未来可期|人工智能绘画:让每个人都成为艺术家
在过去的2022年,人工智能发展之快,有些超过了我们的想象。他们从处理信息过渡到了创造内容,这些内容和真人创造一样真实,难辨真伪。他们能完成撰写邮件、翻译、甚至写代码等任务(详见拙作《未来可期|ChatGPT到底厉害在哪?百科全书版聊天机器人已诞生》)。除了文字能力,他们的绘画能力也大幅提高,通过简单的效果预设,就可以生成一幅叹为观止的大师范绘画作品。
我想请澎湃科技未来可期专栏的各位读者,先看几幅我借助人工智能创作的画作。我分别使用了百度的AI艺术和创意辅助平台文心一格和西湖大学深度学习实验室研制的AI模型盗梦师。两者都是由用户输入一段简单的文字,即可快速获取智能生成的AI画作。操作非常简单,文本输入——>风格选择——>艺术家选择——>上传参考图——>尺寸选择——>分辨率选择——>数量选择,正所谓AI一下,妙笔生画。
第一幅画的主题词——城市:无锡;场景:太湖;时间:五百年后;画面:城市天际线。
人工智能模型盗梦师创作的绘画作品——五百年后无锡太湖的天际线。
人工智能平台文心一格绘制的五百年后无锡太湖的天际线。
第二幅画的主题词——城市:无锡;场景:城市运行管理中心;画面:从看见到预见;智慧城市。
人工智能模型盗梦师创作的绘画作品——无锡城市运行管理中心。
人工智能平台文心一格绘制无锡城市运行管理中心。
当我体验完AI绘画之后,我发现如今的人工智能生成内容(AIGC),已经进化到相当智能的程度,不再是此前简单的风格化滤镜。和Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比(有关概念可以参考本人拙文《未来可期|五个问答助你初步了解Web3.0》),AIGC正在成为新一种内容生产方式。
AIGC,即AI Generate Content,是一种利用人工智能技术自动生成内容的技术。它可以根据一定的规则和模型,自动生成文本、图像、音频等多种类型的内容。伴随着人工智能技术特别是自然语言处理技术的不断发展,近几年AIGC在质量、多样性、准确性和用户体验等方面都得到了飞速发展。越来越多的软件代码、数据分析报告、产品设计图、甚至音乐歌曲都由人工智能产出,AIGC已经从理解内容,走向了自动生成内容,并在新闻报道、广告创意、影视剧本创作等领域探索规模应用。
高德纳(Gartner)公司将AIGC列为2022年五大影响力技术之一,并预测到2025年,生成性AI所创造的数据可占到所有已生产数据的10%,也就是说,你每看十个新闻、图片或短视频,其中有一个就来自AI。根据《Generative AI:A Creative New World》的分析,AIGC有潜力产生数万亿美元的经济价值。
2023年1月10日,百度CEO李彦宏在百度2022 Create大会上,发出这样的断言,未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。
为此,你可以发现,这个春节,百度公司除了有类似集五福的集好运常规集卡活动外,还推出了一系列AIGC(人工智能自动生成内容)创新互动玩法,比如AI画头像一起变兔兔活动。你可以在百度APP自拍或者上传一张个人头像照片,人工智能将会捕捉你的五官比例和微表情,自动等比生成专属兔子版头像。很多用户都纷纷上传自己的兔子头像,让大家评论和本人的相似度有几分。
我们曾经以为,AI不会做有创意的工作,因为创意是人类最不可以取代的特质之一。在2018年,李开复讲述了人工智能有两件事情不能做:一件是有创意的事情,第二件是有温度的事情。有创意的事情,包括科学家,作家,艺术家,CEO等,在他看来,人工智能不擅长提出新概念。
不过,OpenAI创始人山姆·阿尔特曼(Sam Altma)提出了相反的论断:十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性的工作。现在看起来,它会以相反的顺序进行。
我问了ChatGPT同样的一个问题:人工智能不会做有创意的工作,你对此有什么观点?请列举六条。
他的回答是:
1.AI可以在许多领域实现创意,例如音乐制作、艺术创作和广告制作等。
2.AI可以通过学习和模仿人类创意来产生新的创意。
3.AI可以通过生成对抗网络(GANs)等技术来创造新的图像、音频和文本等内容。
4.AI可以通过计算机视觉和自然语言处理等技术来理解和分析人类创意,从而产生新的灵感。
5.AI可以通过机器学习算法来优化和升级现有的产品和服务。
6.AI可以通过分析大量的数据来发现新的市场机会和商业模式。
ChatGPT关于人工智能不会做有创意的工作的见解。
所以,你千万不要想当然,人工智能只能从事低水平的重复性劳动。2021年10月9日,由德克·卡夫腾(Dirk Kaftan)担任指挥的波恩贝多芬管弦乐团,首次演奏贝多芬与人工智能共同谱写的第十交响曲。这部曲子本是贝多芬的遗作,1827年贝多芬逝世时,第十交响曲只有几张手稿留存,部分是简短未竟片段。但是,人工智能在学习了贝多芬过往所有的作曲数据后,续写了这部曲子。
读到这里,你也许会好奇,那么作为普通人的我,如何借助人工智画出一幅好画?
我先给大家说一则新闻吧。2022年8月,有一幅名叫《太空歌剧院》的画作,战胜了诸多竞争对手,拿到了美国科罗拉多州博览会美术竞赛一等奖。作者杰森·艾伦(Jason Allen)却说,自己是个游戏设计师,这幅画并不是他亲手画的,而是用AI绘画工具Midjourney生成的。杰森的办法是:他先是想到了一个有创意的提示词,然后花费了80个小时,900多次迭代,来慢慢调整这个提示文本,比如添加堂皇奢华这样的关键词,来优化整幅画的基调和氛围。
得知这个消息后,那些在真实世界创作的艺术家们忿忿不平。我们画画,是在一步步调色,机器人作画,却是在一步步调关键词。比赛主办方最后维持原判,理由是杰森本来参加的就是数字艺术类别比赛,比赛规则并没有限制使用人工智能工具,而他在提交作品时也表明使用了Midjourney工具。最重要的一点,创作灵感属于杰森,只是他选用的素材不是传统的画笔和颜料,而是庞大的图像数据库。
《太空歌剧院(Théâtre D’opéra Spatial)》,作者:Jason M. Allen via Midjourney
杰森后来在Midjourney讨论区中表示:与其讨厌科技或应用它的人,我们不如承认它是一种强大的工具,并长久地运用它,这样我们才能向前迈进,而不是为此怨恨。对啊,要借助人工智能画出一幅佳作,依然需要人类对艺术作品的感知力、鉴赏力、想象力和创造力。
首先,你要了解有哪些画派,以及他们的风格,比如印象派重展现光影的改变,野兽派笔法率直奔放,新艺术的风格偏有活力、波浪形、流动的线条现实主义等等。
其次,你要知道关键词。这好比使用百度搜索,有的人可以快速精准搜索到自己想要的内容,有的人却只搜到一堆没用信息。如果只是靠常人都知晓的朴素语言,往往会生成不伦不类的学生级别的习作。使用好的提示语,才能让人工智能生成更符合要求、更赏心悦目的作品。
第三,你要熟悉人工智能画画的基本原理。例如,高手就会每个关键词加引号、加冒号、加减数字来让AI更准确地理解问题。更高阶的技术人员会使用生成对抗网络(GAN),来训练一个生成器生成新的图像,通过与一个鉴别器的博弈来提高生成图像的质量。
所以,现在多了一项新生意——提示语工程(prompt engineering),这也成了新的创业热点。美国旧金山初创公司PromptBase就推出了售价1.99美元一条提示语的服务,主要用于DALL-E2,ChatGPTGPT-3等人工智能模型。用户在该平台买卖提示词(Prompt),PromptBase则从卖家处抽成 20%。平台上已上架不少提示词,内容范围包括新闻标题、运动队标志、卡通T恤设计、现代黑白版公司标识等等。
PromptBase平台上开展的提示词买卖业务。
如果你觉得这些都太麻烦,万能的淘宝可以更加直接而粗暴地解决问题,你只需要像我一样,在淘宝输入Midjourney AI绘画代做,找到合适的买家,他们会直接把图做好了发给你,30元不到。
淘宝卖家的AI绘画代做业务。
曾经有一个高赞回答,显示出了人类对人工智能绘画的担忧:我们正在目睹艺术的消亡。可是,当我们每个人都可以善用技术,都成为艺术家的时候,为什么不可以说:我们正在目睹新一轮艺术的繁荣。如果它真的是一幅人见人爱,广为流传的作品,即使它是AIGC作品,又有何妨?
后记:本篇文章的部分图片和文字,由我和AI共同创作完成。
(作者胡逸,一个喜欢畅想未来的大数据工作者。未来可期是胡逸在澎湃科技开设的独家专栏。)