1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

ChatGPT给音乐行业带来的“震惊”,2023年将是生成式AI大量落地的一年

1987web2023-02-11人工智能AI180

音乐财经问:

请撰写一篇500字的文章描述华语乐坛的困境。

以下是ChatGPT撰写的回答:

华语乐坛曾在世界乐坛占据重要位置,但近年来,华语乐坛经历了前所未有的挫折。虽然它仍然受欢迎,但是这一行业正面临着一系列困难。

首先,华语乐坛的流数音乐版权受到破坏。政府和当地乐坛机构缺乏有效的版权保护措施,使原创者很难获取应有的版权报酬,而盗版歌曲也逐渐普及,这大大压缩了乐坛的利润。

其次,新技术和互联网日趋发达,让原来乐坛发展模式受到了严重冲击。各种免费网站和流媒体平台满天飞,使大多数人无需花钱就可以获取流行音乐。而后华语乐坛的唱片销量也大幅下降,从而影响了制作及发行新歌的投资成本。

此外,由于华语乐坛的艺人数量大量增加,其竞争令其竞争激烈,每个艺人都想分享有限的市场,这造成了很多流行歌曲的制作周期变短,艺人们面临着短暂的大众热潮,如何打破短期热潮成为一大难题。

此外,华语乐坛受到影视剧等娱乐节目的严重影响,这导致原创歌曲很难吸引到大众,艺人们不得不把精力放在歌曲创作之外,做一些其他方面的活动,以维持他们的知名度。

在此情况下,华语乐坛正处于一个困境中,未来发展仍然难以预料,需要政府、行业机构和乐坛本身的努力,共同维护、发展华语乐坛,使它再次成为世界乐坛的一股活力。

最近,OpenAI最新的聊天机器人ChatGPT在网上引起了争议,即使是那些一直关注人工智能最新发展的人,也会对ChatGPT文本生成的深度和准确性感到震惊。

2022年,Dalle-2、MidJourney和Stable Diffusion等生成图像服务证明,人工智能可以在几秒钟内创建出极为逼真的图像。因此,那些曾经受雇为创意总监勾勒人物和场景的概念美术师现在很容易被取代。

2023年1月26日,谷歌发表了一篇论文,描述了一个即将问世的名为MusicLM的文本转换音乐生成器。

这一切对音乐人来说意味着什么?随着人工智能的快速发展,机器学习算法已经可以根据提示生成任何类型的图像,用不了多久,大脑神经网络就会开始生成听起来像人类创作的音乐作品。

OpenAI已经发布了MuseNet和JukeBox等音乐生成类工具,到目前为止,这些应用程序更多的是出于对机器生成音乐的一种好奇,还不能对音乐人构成真正的威胁,因为它们并没有创作出逼真的高保真音乐。这在一定程度上是因为神经网络很难产生出一首完整歌曲的长期结构。

ChatGPT点燃了2023年的互联网世界,疯狂之后的故事通常会出现在科幻小说的下一章:ChatGPT获得了人类的感知能力,让我们长期信任的设备与我们对抗,AI最终征服了人类,奴役了人类。

尽管我们无法预知这需要多少年时间,尽管这个话题在音乐产业显得有点超前。但我们还是需要冷静下来,去思考在音乐领域,到底已经在哪些方面影响这个行业的内容生产了?

ChatGPT由人工智能研究公司OpenAI开发,基于一种最先进的语言模型——GPT-3.5,可用于文本生成和语言翻译等自然语言处理任务。该工具于2022年11月推出,自那以后便在互联网上引起了轰动,因为它对几乎所有问题都做出了非常详细且近似于人类的回答。

简而言之,你可以向ChatGPT询问任何问题,它将至少在理论上为你提供答案。

目前,ChatGPT可以免费使用,不过一些专业版本正在试用,并且收取月费。所以在你决定剁手之前,让我们先来看看这个最热门的人工智能聊天机器人在音乐创作方面的能力。

2022年12月,一些音乐制作人开始使用ChatGPT和另一个名为UberDuck的免费工具发布著名说唱歌手的搞怪视频。下面是它的工作原理:

1、用户为ChatGPT提供一个歌词提示,比如以xx艺人的风格写一首关于xx主题的抒情歌曲

2、找到你喜欢的歌词输出部分,并将其插入UberDuck

3、从Uberduck中导出音频,之后将其带入到你的DAW中

4、使用自动调音插件来应用旋律,如果你正在寻找一个免费的工具,可以试试GVST的GSnap VST

这是最受欢迎的ChatGPT音乐工作流程,但人们还做了一些其他有趣的实验。独立研究人员已经开始试验ChatGPT来生成基于文本的建议以改进现有的和弦进展。

以下是推特用户Jeffrey Emanuel向ChatGPT发出的音乐生成指令示例:

创作歌词

你可以用ChatGPT为歌曲创作歌词,也可以给它一个标题或主题来完成一首歌曲。例如:写一首关于xx主题的xxx艺人的歌曲、以xx艺人的风格写一首关于xx主题的抒情诗、为一首名为xx的歌曲填词等。

这种模式是将基于文本的和弦图表与AI歌词生成结合起来。输出的结果看起来很有说服力,但推特的其他用户对Jeffrey Emanuel的帖子做出了回应,并抱怨他们试图跟着歌词唱出旋律,但听起来却不尽人意。

修改和弦

Emanuel向ChatGPT发出指令:修改下面的进程,使其更像巴赫的音乐,并提供了一个基于文本的和弦图。

这些结果可能很有趣,但事实是ChatGPT的自然语言处理不是多模态的,这意味着它没有接受过音乐方面的训练,也无法给出关于音乐美学改进的诚恳意见。

一个训练有素的作曲家永远不会把ChatGPT的进程误认为是巴赫的音乐,并且最后一个和弦完全暴露了这一点,因为巴赫不会在sus2和弦上结束一首作品。所以对于巴洛克时代的作品来说,这首曲子的结尾太不和谐,也太难以解决。但有趣的是,它能很好地模拟最初的和弦图表输入。

生成吉他乐谱

吉他乐谱是ChatGPT如何使用迭代现有音乐的另一个有趣的例子。Emanuel输入了继续这种吉他模式,并提供了任何吉他手都能从Ultimate-Guitar等网站上识别出来的吉他乐谱。

这一次,人工智能又一次暴露了它的无知,它在升音和降音和弦上都使用了相同的斜杠符号。但在吉他谱中,向上滑弦用/表示,向下滑弦用\表示。第一个和弦从指板上升到第二个和弦,但使用了错误的斜杠。

由此看来,ChatGPT只是对吉他乐谱的模仿,并不具有实际的音乐思维。

但同样,这是人工智能首次能够响应创建表格的提示。如果你想尝试一下,它仍然是一个有趣的随机工具。

所以,如果ChatGPT不能真正理解音乐或生成有意义的内容,我们能否期待看到AI音乐有意义的改进?

简短的回答是肯定的——而且spotify可能会在这方面领先。

让我们回顾一下迄今为止最大的两个AI音乐和旋律生成器工具。

MuseNet于2019年4月发布,由一个在大型MIDI数据集上训练的深度神经网络提供支持。用户可以选择一组参数并提交他们的请求。但MuseNet只是对其服务器运行一个API调用,然后根据你的初始输入返回一组变量,整个过程大约需要1分钟。

MuseNet制作的音乐以钢琴卷格式显示,如上图所示。然后,用户可以下载MIDI文件,并开始在DAW中对其进行微调。

此外,MuseNet论文的作者将该架构与GPT-2进行了比较,GPT-2是OpenAI拥有的一种生成式预训练转换器模型,每年都在不断发展并变得更加强大。一个预先训练的模型使用深度学习来预测初始输入之后应该是什么样的音乐短句。

在发布MuseNet一年后的2020年4月,Jukebox推出了GPT-3架构。它们的应用程序通过一种新颖的编码、嵌入,然后运行解码器的过程来生成音乐,以产出更高质量的音频。与MuseNet的MIDI文件相比,Jukebox的音频输出是一个重大的改进,但只有最粗糙的音乐流派(死亡金属等)才能被准确捕捉。

另外,OpenAI的GPT-4目前计划于2023年发布,这就引出了一个问题:GPT-4能作曲吗?还是只专注于文本?

META原本希望发布一个与GPT-4类似的模型,名为Galactica,但在最初的演示中就受到了严厉的批评。GPT-4或任何其他大型语言模型都有可能用于生成音乐作品。自然语言处理任务旨在处理和生成文本,所以音乐可以用一系列符号表示说明这些符号可以用类似的方式进行处理。

话虽如此,但制作高质量的音乐是一项复杂的任务,涉及对音乐结构、理论和美学的深刻理解。目前还不清楚像GPT-4这样的语言模型是否具备完成这一任务所需的知识和专业技能。

关于Spotify的AI音乐工具,其中最令人印象深刻的工具之一是Basic Pitch,它可以让用户上传任何歌曲,并在一分钟内其转录到MIDI。这些MIDI文件可以从网站上免费导出,从而获得前所未有的原始音乐材料访问权限。

Spotify拥有近乎无限的GPU能力、庞大的音频数据库以及深度的用户指标,这使其最有可能成为在人工智能音乐领域发展的玩家。这可以解释为什么像Meta和OpenAI这样的公司对文本和图像生成更感兴趣。

Spotify旗下的DAW——Soundtrap,可能会管理这些API调用的技术方面,并通过使用音乐生成器实现盈利。这将使他们不仅可以筹集到最初购买音频工作站的资金,而且还可以为提供额外的音乐内容筹集资金。

关于AI混合和音乐提取工具,如Spleeter和SongMastr,它们可以检测现有音轨的混音,并尝试将其应用到歌曲中。所以很容易想象Spotify提供的音乐生成器服务将如何与混音工具相结合,以覆盖所有基础层面。

这意味着职业音乐人在短期内是安全的,但还是建议他们专注于建立人际关系和人际交往,而不是把自己关在工作室里。从长远来看,音乐家和音乐制作人的角色可能会转向人工智能,并管理其输出,以满足需要音乐的人的要求。

毫无疑问,人工智能将改变我们的世界。虽然ChatGPT可以生成音乐,但它也告诉我们,它不是音乐创作软件,也不是人类创造力或音乐知识的替代品。所以,未来会是什么样,我们还不得而知。

值得注意的是,前不久WaveAI/LyricStudio的联合创始人兼首席执行官Maya Ackerman博士在MBW的播客中讨论了人工智能和音乐的未来,尤其是在歌词创作方面的可能性。

在交流中,她回答了在音乐制作中使用生成式人工智能所带来的道德和艺术困境。

资料显示,Ackerman有丰富的资历,她是圣克拉拉大学计算机科学与工程系的人工智能教授,同时也是一名歌手、词曲作者和音乐制作人。她在滑铁卢大学获得了计算机科学博士学位,在加州理工学院和加州大学圣地亚哥分校获得了博士后奖学金,并发表了50多篇同行评审的研究论文。

这家总部位于加州的公司WaveAI旗下推出了LyricStudio,平台旨在为词曲作者制作模仿自己风格的原创歌词。从这个意义上说,它是辅助人工智能,是人类伴侣,也是灵感来源。

LyricStudio的网站吹嘘道:在治愈写作瓶颈方面,没有什么比LyricStudio更有用。词曲作者FLOSS恰当地总结道:这就像你有一个写歌的搭档,他有很棒的想法,你可以用,也可以不用,但你不能伤害他们的感情。

LyricStudio的受欢迎程度已经令人难以置信,迄今为止,它已经协助了100多万首歌曲的创作,这些歌曲来自100多万名词曲作者、音乐人和制作人。LyricStudio称,至少15%的用户是专业的音乐制作人。其中一位音乐人,说唱歌手Curtiss King去年夏天发布了一张在美国iTunes排行榜上排名第一的专辑,歌词由LyricStudio编写/协助。

LyricStudio是专门为歌词创作而建立。它不做任何其他事情,它会按照你的风格编写歌词,这是这家公司在算法上的一个非常独特的特点。这样的工具是否剥夺了音乐产业的创造性,或者在各区创作工具中剥夺了人类的想象力?

尽管很多人认为生成式AI本身就像一种乐器,是一种工具,音乐人可以依靠它来增强或改善他们正在制作的旋律或歌词。但公平地说,生成式AI本身非常复杂,有利有弊。在Ackerman看来,对于开发者而言,重要的是要承认这不是一个纯粹的乌托邦情况,并要对如何将技术推向市场负责任。就像任何真正强大的东西一样,人工智能本身没有好坏之分。

由于当今的生成式AI在没有人类干预的情况下,它还不能做到很好地写歌词,从头到尾,独立完成。正因为不能独立运作完成,所以LyricStudio扮演的角色是音乐人创作的辅助工具,当音乐人创作陷入困境时,它会完成基础工作,或者激发音乐人的想象力。

在谈到AI人声唱歌这个问题时,在Ackerman博士看来,目前完全自主创作音乐的技术还不成熟。所以很多公司都是让人类音乐人与人工智能合作,然后假装它是自主创作,或者至少他们掩盖了有任何人类参与的事实。

在声乐技术方面,几种亚洲语言在这个领域的发展肯定比英语快得多。但经常使用这种技术,就必须对它进行大量的修补。所以人工智能会帮助你让它听起来像一个人类音乐人的声音,但众所周知,这仍然是一件困难的事情。话虽如此,在声乐方面合作创造的机会会很大。

显然,随着生成式AI在音乐领域变得越来越普遍,更多使用人工智能制作音乐的公司能承认这种合作性质。如果人工智能平台的设计能够真正辅助培养人类的创造力和能力,甚至激发独立于机器的审美表达,那么大家会发现,完全自动化的人工智能音乐将越来越难真正超越人类创作的音乐。

Ackerman相信2023年将是生成式AI得到落地大量采用的一年。

在当今世界,从事创作艺术是一种反叛行为。在一个几乎所有生产环节都由大企业控制的社会中,人们很容易感觉到,我们只是机器中的齿轮,按照人们的要求消费和生产。我们穿着大公司生产的服装,家里堆满了大规模生产的物品。即使是在音乐方面,我们也常常局限于听少数由行业支持的艺术家创作的同一首歌。当我们试图学习一种乐器时,我们演奏别人的歌曲。

这正是LyricStudio公司宣扬的方向:创作民主化,个体反叛主流。

在这种情况下,完全依靠每一个人自己创造的一些东西就成了一种挑衅行为。通过制作自己的旋律和歌词,我们在一个经常感觉人为和大量生产的世界中找回了一种代理感和真实感。

在社会压力和资本主义制度的要求经常扼杀个人和创造力的时代,这一点尤为重要。在一个一切都在出售的世界里,为了适应和成功,顺从大规模生产充满了诱惑力。注重自我表达和个人经历的歌曲创作通常被认为具有一种特别强大的反叛能力,然而,AI歌曲创作或许使每一个人能够摆脱这些限制,与世界分享个人独特的声音和情感。

基于AI工具的音乐创作,降低了人类通过音乐表达情感的能力和门槛,人人都可以成为歌手,也可以根据自己的想法做一名原创音乐人。

所以,生成式AI最终导向的结果可能是人类在工具的基础上,注入自己对音乐的想象力和情感的表达能力,让每一个人都拥有借助音乐语言,连接、理解和改变世界的力量。

尽管如此,生成式AI的大量应用还是引发了普遍的对于失业的恐慌。最重要的是,ChatGPT目前的使用者已经超过一亿人,它可以在每次问答中不断学习进化,在下次回答同一个问题的时候给出更优化的答案。

当下一次版本迭代后,ChatGPT很有可能不仅能输出更为准确的文本,也能输出作曲和声音。在不断迭代的过程中,最终人类平庸的那部分创造力和想象力也能被AI取代。