干货丨ACGN可用「AIGC工具」盘点
从0到1。
预计阅读时间8分钟
AIGC的革命来得让人猝不及防,相比第一时间搭上技术快车的科技公司,多数ACGN相关的公司和从业者们尚处于焦虑和迷茫的状态,不知该如何出手,也不知这一变化对自身到底是好消息还是坏信号。
那么什么是AIGC?对于游戏、漫画、动画、网文企业来说,进行AIGC相关的尝试应该从何入手?靠谱二次元(公众号ID:kpACGN)尝试通过本文的干货盘点,尽量直白地为大家介绍AIGC目前对ACGN产业可适用的业务范围和常见工具,供大家参考。
技术的迭代速度常常超乎想象,后续我们也会持续关注这一前沿领域对产业带来的利好与风险。
何为AIGC?
AIGC,即AI Generated Content,指通过人工智能技术生成内容。作为一种通过电脑计算就能生成大量可直接参考的视听内容的方式,给未来文娱内容的爆发式增长提供了极大的想象空间。生成式AI工具在近两年频频出现,经过几代技术上的调优和智能模型的学习进步,ChatGPT、Midjourney等AIGC产品开始有望成为文娱领域的生产力。
AIGC在ACGN各相关环节的应用及常见工具
「文字」相关环节
概述:目前,文字生成领域是整个AIGC最受关注也是进步最快的一个部分。和过去工具缺乏创造力地从已有数据库里简单组合并生成内容相比,如今大部分采用大规模预训练语言模型(Large Language Model,LLM)的文字类AIGC工具,都已经拥有了一定的创意能力,目前已经可以根据使用者提供的参数和提示,生成相对合理的故事大纲、情节创意等内容。ACGN从业者还可以通过这些AIGC工具,生成包括风格化的营销文案、梗概提要等内容,也可以进行对文章的错字检测、语法优化等项目 。
但是,由于目前相关技术并非垂直应用于文艺创作领域,因此对于超过3000字的内容,AIGC的产出多有逻辑不连贯、关键信息缺失等问题,还需要优化和迭代。
「文字类」常见工具:
ChatGPT
编辑推荐:成熟且全面
NewBing
编辑推荐:支持搜索互联网内容
InstaNovel AI
编辑推荐:中短篇故事生成
一览运营宝
编辑推荐:基于GPT模型的中文AI编剧
「图片」相关环节
概述:和文字AIGC产品一样,图片类AIGC技术也在迅猛发展。相关产品先通过学习大量图片素材,将图片转译为文字关键字,并分解图片中的元素进行学习临摹,在使用者输入对应或相似文字描述时,再根据此前学习产生的模型进行相关图片内容的绘制,以生成新内容。
图片领域的AIGC应用场景目前已经极为丰富,包括学习知名画家的创作风格并出图,批量生成ACG场景和道具图。还有一些利用AIGC工具为动画漫画创作提供辅助,包括生成概念设计图、为漫画线稿上色、绘制封面等功能。
但图片领域涉及到学习素材库的收集,很容易产生版权、著作权的纠纷,陷入抄袭负面信息。对此类应用的可行性,目前业内还存在着一些争议。对于讲究创意的ACGN行业而言,如何合理运用图片AIGC工具,尚需一段时间的摸索。
「图片类」常见工具:
Midjourney
编辑推荐:艺术感更强
DALLE
编辑推荐:真实感更强
Stable Diffusion
编辑推荐:定制性更高
ControlNet
编辑推荐:线稿上色、人物姿势调整
Style2Paints
编辑推荐:AI上色辅助
无界AI
编辑推荐:中文AI生图
「视频」相关环节
概述:视频AIGC目前还处于探索期,以AI视频为关键词的工具层出不穷,最常见的是产品根据输入的文字,在视频数据库中检索对应的视频素材,再统一加入AI配音和视频模板合成视频的产品,鉴于其AI技术含量不高,且和ACG关系不大,本文将不进行详细讨论。在此主要介绍一些通过AI技术生成具有不同于输入内容,且包含一定原创性内容视频的工具。
由于视频就是由大量连贯图片串连而成,当下已公开的视频AIGC产品主要以生成大量有密切关系的图片后,进行拼接合成为主。但由于每张AI图片的绘制都具备一定的随机性,因此目前此类AIGC产品合成的视频并不足够稳定,还有极大进步的空间,但已经有公开的插件产品对不稳定的问题进行了一定的修正。
另外,还有一些AIGC产品是为已存在的视频画质补强而生,包括通过AI技术修复视频的画质缺损,增加视频画面的清晰度,提高视频的帧数、以及自动生成大批量低精度群演模型等功能,这类工具或将降低以往老工具效率低、人工干预程度高的问题,为一部分CG、动画的画质进行高效率的补强工作。
「视频类」常见工具:
Topaz Video AI
编辑推荐:视频补帧增强
Gen-1/Gen-2
编辑推荐:图片生成视频
mov2mov
编辑推荐:AI重绘视频
D-ID
编辑推荐:将人物静态图动态化
「编程」相关环节
概述:对于技术开发者而言,学习一门编程语言是一项系统性的过程,但现在的开发技术日新月异,对不少开发者的学习效率有了更高的要求。此外,由于不同开发者对于编程语言的代码习惯、编码规范的理解程度不同,在大型协同开发上时长会出现因编码规范不同造成低效、返工的情况。
编程类AIGC工具的出现,有望在一定程度上解决这类问题,此类工具在开源代码平台学习大量优秀的代码开发内容,经过顶级开发人员的训练后,拥有合理化的编码规范和高效率的编码逻辑,只需要使用者先在注释中输入接下来想要实现的功能,AIGC工具就能根据使用者的描述生成对应的代码块,使用者只需要略加修改,就能够完成相应的功能开发,提高开发者的编码效率。
另外还有一些编程类AIGC工具,可以通过学习优秀的算法与代码习惯,对使用者已经编写的代码进行算法优化和编码调优。
「编程类」常见工具:
Copilot
编辑推荐:AI代码生成
DeepCode
编辑推荐:代码优化
「配音」相关环节
概述:配音已经成为ACG作品的重要组成部分,不过,由于配音需要配音演员对内容有一定的理解,因此在内容创作过程中,往往配音演员需要在视觉内容创作完成后,才会进入配制工作。但动画、游戏作品在设计角色口型、分镜头等前中期流程就有对配音的需要,因此会由导演等相关制作人员进行草配。
在声音类AIGC工具出现后,这类草配的质量也会有所提高,制作人员不仅可以直接将剧本文字生成相应的语音,也可以将草配的声音进一步优化,供配音人员在工作时参考。在虚拟偶像领域,已经有部分厂商和个人通过AIGC直接生成声音,替代中之人进行部分声音演出。同理,也可以用于动态漫画内容的产出。
不过,由于相应AIGC工具的声学模型仍有一定的技术瓶颈,通过AI生成的声音模型即便经过大量训练调优,仍保留了一部分电子音和欠自然表现,并不能完全替代配音演员。
「声音类」常见工具:
VITS
编辑推荐:将文字生成对应音色的声音
DiffSVC
编辑推荐:歌声声线转换
so-vits-svc
编辑推荐:贴合声音生成对应声线的声音
Azure文本转语音
编辑推荐:常见的旁白解说配音工具
「配乐」相关环节
概述:文字、图片等AIGC工具当下已经可以为创作者提供创作思路,但是在音乐领域,AI目前能实现的创作还很初级。不过,对于一些个人动画、动态漫画、游戏项目开发者而言,音乐类AIGC产品有机会在未来取代无版权声音库,提供低成本音乐解决方案的同时,保持其作品中音乐的独特性和匹配度。
值得一提的是,在编曲领域,AI提供了更高效的解决方式,目前业内已经有通过对抗学习等AI算法,推出了快速扒谱、解构的工具,为音乐创作者进行音乐研究提供帮助。
「音乐类」常见工具:
mubert
编辑推荐:将文字转为音乐
AIVA
编辑推荐:根据输入参数生成音乐
RipX
编辑推荐:解构音乐