1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

ChatGPT+Midjourney,一卷卫生纸拍出科幻大片!

1987web2023-05-08人工智能AI272
最近,AI跑得实在太快!国外大佬为一纸「AI不扩散条约」吵得不可开交。 国内这边,B站、爱奇艺等一众互联网企业也在成都视听大会上大讲特讲AIGC。其中,陈睿也在现场介绍了B站的AIGC内容

最近,AI跑得实在太快!

国外大佬为一纸「AI不扩散条约」吵得不可开交。  国内这边,B站、爱奇艺等一众互联网企业也在成都视听大会上大讲特讲AIGC。其中,陈睿也在现场介绍了B站的AIGC内容。

陈睿提到,随着AIGC时代的来临,我们每个人都身处科学技术加速变革的新时代:

年轻人们对于AI技术相关内容的需求急速增加,越来越多的UP主们也在制作各种ChatGPt、AIGC相关的内容。到目前为止,B站上ChatGPT相关的内容播放量已经达到了2亿。

陈睿预言,AIGC时代的来临,并不只是一场科技领域的革新,而是对整个互联网行业,甚至对整个社会都有颠覆性的影响。

在ChatGPT等AI技术爆炸式增长的年代,陈睿的判断并非空穴来风。

前段时间凭借「一对坐在屋顶的90年代中国情侣」出圈的AI作画神器Midjourney,更是不要太火。

一大波新用户涌入之后,直接挤爆了服务器,导致官方被迫叫停免费试用。

与此同时,各种神乎其技的AI绘画层出不穷——

有穿越到苏联工厂的马斯克,有看海棠的学妹,还有中国版的赫本等等。

来源:Cydiar

此处分享一个prompt,可以尝试尝试:

A Chinese 20-year-old Woman, looking like Audrey Hepburn, Black hair, standing on 2023 Tokyo street, hyper realistic portrait photography, pale skin, dress, wide shot, natural lighting, kodak portra 800, 105 mm f1. 8, 32k --ar 16:9 --v 5 --s 750 --q 2

而且,如此震撼的V5才刚推出没多久,更厉害的V6、V7、V8据说已经在路上了。

AI颠覆视频创作

在成都视听大会上,陈睿提到,AIGC的发展将极大地提高内容创作者的效率,就像2000年手机出现摄像头,让普通人也能随意拍摄一样,AIGC的出现也能让很多普通人,也能创作出过去只有专业人士才能创作的内容。

前段时间,一个外国小哥,就尝试了完全由AI主导,创作一条视频。这条视频从脚本,到导演、编剧、摄影、配乐的活,AI全包圆了。

而且这条视频,完全是用现在主流的AI工具做出来的,而这位小哥其实只是个AI的工具人(顺便出了个镜)。也就是说,我们现在就可以像他一样,完全操纵AI来创作视频了。

其中,脚本由ChatGPT编写,图像由Midjourney生成,然后使用Runway Gen-1,把图像风格应用到源视频中,最后,再由Boomy AI配乐。

首先,对ChatGPT说:「给我写一个脚本,生成一个由三个3秒剪辑组成的9秒视频。这个故事是,一个男人在他的客厅里,要以科幻为主题。」

ChatGPT生成了如下的脚本。

第二步,就可以根据脚本,在Midjourney中制作参考图像了。

prompt是「imagine sci-fi film still, medium shot, centered, side-angle view, a man sitting on a chair, holding a glowing orb in his hands, living room, new york, 4k --ar 16:9」 (想象一下科幻电影静止画面,中景,居中,侧角视角,一个男人坐在椅子上,手里拿着一个发光的球体,客厅,纽约,4k - -ar 16:9)。

在第三步,这位小哥重新布置了客厅里的一些家具,为了更好地匹配参考图像,来得到更清晰的输出。

然后,他用一部iPhone,就拍摄出了原始镜头。

第四步,他把视频和参考图像上传到Gen-1,它立马把视频变成了参考图像的风格。

这一步中,小哥没有使用文本提示,但添加了--interpolate 作为更平滑输出的参数。

第五步,就是把视频导入视频编辑器。

他用的是iMovie。导入视频后,修剪了一些片段,然后把它们连在一起。

第六步,小哥从Boomy中,根据自己想要的风格和情绪,生成了配乐。

他在选择了一首叫做「Trippy Harvester by Peaky Chicky」的曲子,与场景的气氛非常相配。

最后一步,添加音乐并导出。

非常幸运的是,不需要进行太多剪辑,因为视频和音乐完美地吻合。

就这样,经过了3个小时后,一段梦幻大片诞生了!

AI负责体力劳动,我来负责脑洞

无独有偶,国内的B站UP主「Mega会玩」,也通过几个AI工具,让乔布斯「复活」了。

在参观了乔布斯故居之后,Mega忽然有了一个想法,希望生成一段自己采访乔布斯的视频。

乔布斯的「大脑」,当然就来自ChatGPT。因为已经用1750亿参数训练过,它完全可以以对应人物的风格进行对话。

而乔布斯的声音,则是用一款Tacotron 2模型生成的。

Mega把乔布斯生前的语音素材进行分段处理、标记,训练了几天后,最终生成了乔布斯的AI语音模型。

而接下来,便来到了最有趣的一步——用AI克隆一个人。

如果2023年,乔帮主依旧活着,应该是一位年近七旬的老人。

Mega使用Midjourney,调整了各种参数和prompt之后,终于生成了一个理想的最终版本。

在下面这个视频中,我们看到了「复活」的乔布斯对于自己的重生这样描述道:

以这种方式回到世界会感觉有些奇妙,以AI这种方式重生虽然让我惊讶,但这不过是人类众多不可思议进步中的一个而已。

而在采访最后,Mega问出了自己最想问的那个问题: 你对于现在的苹果公司有什么感想吗?

「乔布斯」的回答可谓亮点满满:「我无法评价苹果当前的文化和践行,因为我已经不是他的一部分。但我真心希望,苹果可以一直铭记创新和突破现状的重要性。」

比高产更高产

除了可以凭空生出我们想要的内容外,AI还肩负着一项重要的「使命」:搞定制作过程中繁琐的「脏活累活」。

关于知名UP主半佛仙人,一直有着这样一个未解之谜:他的视频里,为什么能有这么多好笑的表情包?

瓜众们对这个问题实在太好奇了,以至于这个知乎问题已经有了43万的浏览量……

而在这个问题下,半佛仙人本人也出现了,解答了瓜众们的疑问——其实,这些素材就是用Python爬出来的……

另外半佛仙人表示,自己当然有团队,否则按这个产量,没有团队的话物理学都得被颠覆了。

那现在,有了AI工具,这些表情包甚至都不需要爬虫,可以自己量产了。

虽然目前,整合素材、寻找合适的音效和画面、加后期配音等过程都还需要人肉制作,但未来这些功能,很可能AI都能给我们包了。

比如最近,ChatGPT联网后,可以接入各种第三方插件了。

其中一个「代码解释器」插件,可以直接让我们用ChatGPT编辑视频了。

只要给出一个指令,ChatGPT就会对上传视频文件进行处理,稍等片刻之后,就可以直接下载了。没错,就是这么炸裂。

这么看来,未来在AI的加持下,人类创作者们可能真就只需要出个脑子,剩下那些不想做,或者麻烦的,都可以丢给AI去负责。

稳住不慌,弯道超车

看到这里,或许会有人惊呼,既然知识供给模式被完全颠覆了,那知识创造者的饭碗,岂不是也被砸了?

其实,还没到这一步。

让AI成为自己手中趁手的利器,远比忧心自己被AI淘汰了来得实际。

要知道,现在的许多人还没有提出需求的能力,也根本想不清楚自己「需要什么」。

比如,给你一个AI画图工具,你能用它画出什么?

它的上限,完全取决于你prompt能力的上限。

AI的能力,已经给你放在这儿了,你能如何驾驭它,用它大力出奇迹,则完全取决于你的指挥能力。

比如现在,让你生成一幅港口的照片,你会怎样去对Midjourney和Stable Diffusion去描述?

一个真正的prompt大师,能写出「港口、船只、日落、美丽的光线、黄金时刻……超现实主义、聚焦的、细节丰富的……电影画质,杰作」这样的提示,让AI画出一幅完美的画作。

而最近小编印象深刻的一个例子是,在必应的Image Creator里,我想试试画出《荷马史诗》的场景。

然而要输入prompt时,却忽然词穷了。

小编灵机一动,那让GPT-4教教我?

把GPT-4给出的prompt,放进Image Creator后,生成的画真是震撼我全家……

而去年在科罗拉多州博览会艺术比赛的获奖者、《太空歌剧院》的创作者,直接拒绝分享出自己在Midjourney所用的提示。

据说,他花了80多个小时,在900次迭代中,才完成了这幅画作。

这也就是为什么,外国的prompt工程师,年薪已经开到了36万美元。

从AI作画来说,一个优秀的提示工程师,必须拥有多学科的背景。经验丰富的工程师,和业余爱好者之中,存在着明显的门槛。

只有掌握了丰富的艺术史和平面设计等专业知识,才能写出「用 35 毫米胶片拍摄」「波斯……伊斯法罕的建筑」「法国画家Henri de Toulouse-Lautrec的风格」这样专业级别的prompt,生成如下画作。

从这一点来说,人和人的差别,在AI面前将被无限放大。

很明显,你本身需要是一个知识广度和深度都足够的人,你有多渊博,AI就有多出彩。

当信息可以被极度自由地获取,对信息的再加工也就随之变得更重要,在这一点上,我们每个人都是站在同一起跑线上的。

可以想见,在这种情况下,知识付费会是移动互联网催生出来的一大商机。

就在这几个月,我们亲眼见证了种种AIGC产品的光速迭代,成为「知识中介」这件事,也变得前所未有的简单。

随着AIGC技术的发展,做视频可能难度并不会比写文章高多少。内容创作者只需要出核心的创意,剩下的都可以交给AI来自动生成,视频制作的难度将会大幅度降低。

个人创作者的数量,可能也会迎来高速增长。

尤其利好的,可能就是B站知识类UP主这类创作者。毕竟剪视频的时间省了,找资料的时间也省了。只要有核心的创意点,做出优质视频就不是问题。

届时,优质创作者的内容创意潜力将被完全开发出来,视频将会成为绝对主流的内容。

对于创作者来说,这并不是某种遥不可及的预言,而是触手可及的近未来。

这也是为什么,B站上最近这几个月ChatGPT相关内容井喷,更是有很多UP主直接开始尝试用AI做视频。

也许不用多久,我们就能看到,越来越多独立创作者出现。他们不用再选择团队创作这种重工业模式,而是一两个主创+AI就可以轻装上阵,用比过往高十倍二十倍的效率创作,将那些本来没有能力做成视频的内容,畅快表达出来。

可以想象,随着AIGC的繁荣,知识类视频平台的发展,都会迎来一波水涨船高。

那么,在不久的将来,谁将被AI取代,而谁又会弯道超车?

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系