AI图像生成技术与人类的“智商税”
■ 图像时代的法律
AI在拼命学习,人类也不能放慢学习的脚步,AI只会淘汰那些不会使用AI的人,帮助会使用AI的人
吴志攀作品。
▶ 未经授权 不得转载
文 | 吴志攀
责任编辑 | 尹丽
有许多网民用ChatGPT生成名人的搞笑图像,如著名球星在蹬老式缝纫机、著名歌星在小镇路边卖烧烤、著名影星挑着竹筐走在街巷的路上等。
更有甚者,还有网民用AI生成美国警察抓捕前总统特朗普的各种图像。如果不仔细看图像中人物的手,只看人脸的话,我几乎难以分辨这是摄影师拍摄的照片还是AI生成的虚拟图像。
AI生成图像的能力正在接近真人
好在人类看图像不仅用眼睛,还用脑子。那时美国法院还没有发出传讯这位前总统的命令,时隔一周后特朗普才到纽约当地法院接受传讯。后来发生的事观众都看到了,特朗普是由律师陪同去法院的,并未拒绝出庭。
由于AI生成图像时关注的焦点是人脸,对人手的学习目前还比较欠缺。
在绘画和照片中,AI观看的焦点往往是人脸,人手处于次要位置。但人手在各种动态中十分生动,被称为第二表情,而且人手运动时的结构关系复杂,真人画家尚且需要长期练习才能把握要领,AI也不例外。除非人工智能经过较长时间的专门训练,否则其不会准确掌握。
这种情况也印证了那句老话:画人难画手,画虎难画走。
绘画和摄影创作的看点往往在那些不处于画心的其他局部细节。
当然,还有一种可能就是,AI已经具有准确表达人手的能力,只是人们在给AI指令时,没有具体关于手部的描绘造成了这种画面缺陷。
AI生成的图像还难以达到神似
AI生成图像的创作过程与真人画家或摄影师不同。真人艺术家创作的那些好的作品,通常不会是基于概念来创作的,因为那样会出现类似命题作文的效果,例如绘制(或拍摄)人物肖像,如果是基于某种概念来创作,画面效果往往缺乏生命力,也不感人,更不会神似。
真人画家和摄影师在创作时,没有算法,也不需要符号标注与组合,主要是见景生情,创作冲动占主导地位。教科书上将创作冲动叫做创作的动机。动机是艺术创作的基础,不仅是绘画和摄影,小说、诗歌、音乐、舞蹈、戏剧等也都是如此。动机大多不是理性的,是感性的,好像有一种无形的精神力量,催促着艺术家们抓起画笔或举起相机,迅速将这种动机捕捉住。如果此时不抓紧,搁置一会儿,再想画或拍摄时,冲动的兴奋点过去了,便机不可失,时不再来。也有人说,这是艺术创作的灵感,也就是突发奇想。
相比之下,AI生成图像既没有冲动,也没有灵感,而是依靠理性和逻辑的算法,按照程序执行概念化和描述性文字指令来生成图像的。
就这一点来说,AI生成的图像不可能代替真人绘画和摄影创作的作品,但可能在视觉效果上不断接近。这已经是人工智能十分了不起的进步,并足以作为图像设计的神级助手。它可以给真人设计师提供创作中所需要的各种可能性和效果图。我这样说也许低估了AI人工智能的潜力,因为如果那些真人画家和摄影师还在基于概念创作的话,如果真人艺术家的作品缺乏生命力的话,那就会被AI图像作品替代。
AI图像生成迭代发展的速度可能还会超过人们的预期,可以相信,照这个速度发展下去,在不久将来,只要地球上的电能能够满足,AI生成的图像一定会越来越接近真人画家和摄影师的创作。到那时,观众将难以分辨哪些是AI生成的作品,哪些是真人画家和摄影师创作的作品了。
这还不要紧,要紧的是我们因为不能分辨AI生成图像与真人艺术家的创作,误把AI作品当作真人创作的作品时,我们就很可能要为此交纳智商税了。
或许会出现图像真伪鉴别行业
智商税是一种比喻说法,形容人的智商被假象欺骗所付出的代价:浪费时间、精力和情感,或者浪费了人力、物力和财力等。例如,美国前总统特朗普任上,他看到前众议院议长佩罗西骂他笨蛋的短视频,竟然信以为真,立即在推特上转发并反击。
后来,人们又看到另一位前总统奥巴马在短视频中说特朗普是个笨蛋。这一次,包括特朗普本人在内的大部分网民都看出是恶搞把戏。当时看到上述短视频的网民,大多数不是从奥巴马口音和说话的口型上看出问题来的,因为深度伪造软件几乎能将这种短视频做到天衣无缝。网民们主要是根据奥巴马做人做事的一贯风格判断,认为这位前政要不会在公众场合说出这样粗鲁的词。在上述例子中,凡是看到上述深度伪造短视频信以为真的人,都被造假者收了智商税。
更早一些时候,微信有传美国某知名大学校长批评我国高校教育的演讲稿中译版。不熟悉高等教育的人很容易被这种虚假信息所迷惑。这位外国校长不会知道,自己在万里之外已经躺枪了。但是,从事高等教育和国际交流的人一看标题,就知道相关内容是国人伪造后,再盗用外国校长的名字发出来的。因为只有借用外国公众人物的口来说,才能吸引眼球。
有些高教和国际交流常识的人都知道,在公开场合,外国大学校长不会批评中国大学,反之亦然。因为这些高等教育界的公众人物在讲话时,非常注意礼貌和所在学校的形象,他们不想因为自己的言行对本校招生产生不利影响。即便是不熟悉高等教育,也不熟悉国际交流的人,只要他熟悉国内的话语体系和用词习惯,从这篇讲稿中也能感觉到外国人不会像国人这样说话。
就算是中译时选用国人习惯语言风格,也不可能在价值观和逻辑推理上没有国别文化差异。因为中译也无法将我们的价值观和逻辑推理强加给外国公众人物身上。这就好像哪怕中餐与西餐不加标签,但只要摆在我们面前,看上一眼,就能分辨出来。东西方公众人物讲话也是一样的道理。
随着AI图像生成技术的进步,人工智能生成的图像与真人绘制的图画或拍摄的照片越来越相似,以至于造成真假难辨和以假乱真的情况。如果到那时,观众中的一部分人由于知识、经验、价值观和方法等诸多方面的局限,分不清真假,导致以假当真,甚至还可能转发他人蒙蔽更多的人。还有一种恶劣的做法是:有些人欺负不懂得外语的国内网民,将外国政要的演讲配上杜撰出来的完全不相干的中文字幕,以达到不可告人的目的。这种情况让网络短视频的真实性大打折扣,让善良的观众为此白白付出时间和精力,甚至还付出情感。
或许,在不久的将来,图像真伪鉴别工作将成为一种类似鉴定师那样的职业。到那时,真的作品将越来越珍贵,不真或不对的作品就像现在艺术品市场中的赝品一样,只能糊弄没有经验的买家,但很难混过行家的法眼。
在现实中的文物市场上,有专门做文物鉴定的专家和机构,许多电视台也开办过鉴宝栏目。鉴定专家分工也越来越细。例如,有的专家擅长鉴定陶瓷,有的则擅长鉴定古代字画,有的专门做青铜器鉴定,有的对明代家具很有研究,有的则对古籍善本经验丰富。我认为,将来很可能会出现AI合成的绘画与AI合成的照片两大类鉴定,用以鉴定评判图像作品是AI生成的,还是真人所为。
而且在我看来,传统官方媒体的可信度依然比网络短视频高得多,并且官媒的公信力因为AI图像生成技术,不但不会削弱,反而会恢复和增强。此外,多学几门外语,也不是浪费时间。因为即便没学通,不能使用,但学过与没学过还是不同,至少用来辨别微信上的那些短视频真伪是足够的了。AI在拼命学习,人类也不能放慢学习的脚步,正像网上流行的人类如何处理与AI关系的一句话:AI只会淘汰那些不会使用AI的人,帮助会使用AI的人。
(作者系北京大学法学院教授。北京大学外国语学院孙建军教授对本文亦有贡献)
(作者系北京大学法学院教授。北京大学外国语学院孙建军教授对本文亦有贡献)
END
视觉编辑 | 王硕 马蓉蓉