1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

AIGC(人工智能生成内容)白皮书

1987web2023-07-06人工智能AI111

打开凤凰新闻,查看更多高清图片

在当前数字世界和物理世界加速融合的大背景下,人工智能生成内容(Artificial Intelligence Generated Content,简称 AIGC)正在悄然引导着一场深刻的变革,重塑甚至颠覆数字内容的生产方式和消费模式,将极大地丰富人们的数字生活,是未来全面迈向数字文明新时代不可或缺的支撑力量。

人工智能生成内容的发展历程与概念

1950年,艾伦·图灵(Alan Turing)在其论文《计算机器与智能(Computing Machinery and Intelligence)》中提出了著名的图灵测试,给出了判定机器是否具有智能的试验方法,即机器是否能够模仿人类的思维方式来生成内容继而与人交互。

某种程度上来说,人工智能从那时起就被寄予了用于内容创造的期许。经过半个多世纪的发展,随着数据快速积累、算力性能提升和算法效力增强,今天的人工智能不仅能够与人类进行互动,还可以进行写作、编曲、绘画、视频制作等创意工作。

2018 年,人工智能生成的画作在佳士得拍卖行以 43.25 万美元成交,成为世界上首个出售的人工智能艺术品,引发各界关注。

随着人工智能越来越多地被应用于内容创作,人工智能生成内容(Artificial Intelligence Generated Content,简称 AIGC)的概念悄然兴起。

AICG历史沿革

结合人工智能的演进历程,AIGC 的发展大致可以分为三个阶段:

即:早期萌芽阶段(20 世纪 50 年代至 90 年代中期)、沉淀积累阶段 (20 世纪 90 年代中期至 21 世纪 10 年代中期),以及快速发展阶段 (21 世纪 10 年代中期至今)。

自2014年起,随着以生成式对抗网络(Generative Adversarial Network, GAN)为代表的深度学习算法的提出和迭代更新,AIGC 迎来了新时代,生成内容百花齐放,效果逐渐逼真直至人类难以分辨。

2017年,微软人工智能少女小冰推出了世界首部 100%由人工智能创作的诗集《阳光失了玻璃窗》。

2018年,英伟达发布的 StyleGAN 模型可以自动生成图片,目前已升级到第四代模型 StyleGAN-XL,其生成的高分辨率图片人眼难以分辨真假。

2019年,DeepMind 发布了 DVD-GAN 模型用以生成连续视频,在草地、广场等明确场景下表现突出。

2021年,OpenAI 推出了 DALL-E并于一年后推出了升级版本 DALL-E-2,主要应用于文本与图像的交互生成内容,用户只需输入简短的描述性文字,DALL-E-2 即可创作出相应极高质量的卡通、写实、抽象等风格的绘画作品。

AIGC 的概念与内涵

目前,对 AIGC 这一概念的界定,尚无统一规范的定义。

国内产学研各界对 于 AIGC 的理解是 继 专 业 生 成 内 容 ( Professional Generated Content, PGC)和用户生成内容(User Generated Content, UGC)之后,利用人工智能技术自动生成内容的新型生产方式。

在国际上对应的术语是人工智能合成媒体(AI-generatedMedia或 Synthetic Media),其定义是通过人工智能算法对数据或媒体进行生产、操控和修改的统称。

综上所述,我们认为AIGC 既是从内 容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用 于内容自动化生成的一类技术集合。

从发展背景方面来看,AIGC 的兴起源于深度学习技术的快速突 破和日益增长的数字内容供给需求。

一方面,技术进步驱动 AIGC 可 用性不断增强。

另一方面,海量需求牵引 AIGC 应用落地。随着数字经济与实体经济融合程度不断加深, 以及 Meta、微软、字节跳动等平台型巨头的数字化场景向元宇宙转 型,人类对数字内容总量和丰富程度的整体需求不断提高。

技术能力

从技术能力方面来看,AIGC根据面向对象、实现功能的不同可分为三个层次。

一是智能数字内容孪生

其主要目标是建立现实世界到数字世界的映射,将现实世界中的物理属性(如物体的大小、纹理、 颜色等)和社会属性(如主体行为、主体关系等)高效、可感知地进

二是智能数字内容编辑

其主要目的是建立数字世界与现实世界的双向交互。在数字内容孪生的基础上,从现实世界实现对虚拟数字世界中内容的控制和修改,同时利用数字世界高效率仿真和低成本试错的优势,为现实世界的应用提供快速迭代能力。

三是智能数字内容创作

其主要目标是让人工智能算法具备内容创作和自我演化 的能力,形成的 AIGC 产品具备类似甚至超越人的创作能力。以上三 个层面的能力共同构成 AIGC 的能力闭环。

应用价值

从应用价值方面来看,AIGC 将有望成为数字内容创新发展的新 引擎,为数字经济发展注入全新动能。

一方面,AIGC 能够以优于人 类的制造能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础 性机械劳动,从技术层面实现以低边际成本、高效率的方式满足海量个性化需求;同时能够创新内容生产的流程和范式,为更具想象力的内容、更加多样化的传播方式提供可能性,推动内容生产向更有创造 力的方向发展。

另一方面,AIGC 能够通过支持数字内容与其他产业 的多维互动、融合渗透从而孕育新业态新模式,打造经济发展新增长 点,为千行百业发展提供新动能。

2021年以来,元宇宙呈 现出超出想象的发展爆发力;作为数实融合的终极数字载体,元 宇宙将具备持续性、实时性、可创造性等特征,也将通过 AIGC 加速 复刻物理世界、进行无限内容创作,从而实现自发有机生长。

人工智能生成内容的技术体系及其演进方向

AIGC 技术升级步入深化阶段

人工智能算法的不断迭代是 AIGC 发展进步的源动力,从技术演 进的角度出发,可将 AIGC 技术可大致划分为传统基于模板或规则的 前深度学习阶段和深度神经网络快速发展的深度学习阶段。

AIGC 大模型架构潜力凸显

超级深度学习近年来的快速发展带来了深度神经网络技术在大模型和多模态两个方向上的不断突破,并为 AIGC 技术能力的升级提供了强力的支撑和全新的可能性。

AIGC 技术演化出三大前沿能力

AIGC 技术被广泛应用于音频、文本、视觉等不同模态数据,并构成了丰富多样的技术应用。分别是智能数字内容孪生能力,智能数字内容编辑能力和智能数字内容创作能力。

除了对各种模态数据内容的修复和增强,近年间,数字内容孪生中智能增强技术在三维视觉领域取得了快速地发展。

在数字内容孪生技术的基础上,智能数字内容编辑的相关技术构 建了虚拟数字世界与现实物理世界间的交互通道。

从技术角度看,智能数字内容编辑主要通过数字内容的语义理解 和属性控制两类技术来实现对内容的修改和控制。

资料来源:京东探索研究院

人工智能生成内容的应用场景

1.AIGC+传媒:人机协同生产,推动媒体融合。

在采编环节,一是实现采访录音语音转写,提升传媒工作者的工作体验。2022 年冬奥会期间,科大讯飞的智能录音笔通过跨语种的语音转写 助力记者 2 分钟快速出稿。

二是实现智能新闻写作,提升新闻资讯的 时效。

三是实现智能视频剪辑,提升视频内容的价值。2022 年冬奥会 期间,央视视频通过使用 AI 智能内容生产剪辑系统,高效生产与发 布冬奥冰雪项目的视频集锦内容,为深度开发体育媒体版权内容价值, 创造了更多的可能性。

在传播环节,AIGC 应用主要集中于以AI合成主播为核心的新 闻播报等领域。

AI 合成主播开创了新闻领域实时语音及人物动画合 成的先河,只需要输入所需要播发的文本内容,计算机就会生成相应 的 AI 合成主播播报的新闻视频,并确保视频中人物音频和表情、唇 动保持自然一致,展现与真人主播无异的信息传达效果。

2.AIGC+电商:推进虚实交融,营造沉浸体验。

随着数字技术的发展和应用、消费的升级和加快,购物体验沉浸化成为电商领域发展的方向。AIGC 正加速商品 3D 模型、虚拟主播 乃至虚拟货场的构建,通过和 AR、VR 等新技术的结合,实现视听等 多感官交互的沉浸式购物体验。

3.AIGC+影视:拓展创作空间,提升作品质量。

随着影视行业的快速发展,从前期创作、中期拍摄到后期制作的过程性问题也随之显露,存在高质量剧本相对缺乏、制作成本高昂以 及部分作品质量有待提升等发展痛点,亟待进行结构升级。

运用 AIGC 技术能激发影视剧本创作思路,扩展影视角色和场景创作空间,极大地提升影视产品的后期制作质量,帮助实现影视作品的文化价值与经 济价值最大化。

4.AIGC+娱乐:扩展辐射边界,获得发展动能

在数字经济时代,娱乐不仅拉近了产品服务与消费者之间的距离,而且间接满足了现代人对归属感的渴望,重要性与日俱增。

借助于 AIGC 技术,通过趣味性图像或音视频生成、打造虚拟偶像、开发 C 端用户数字化身等方式,娱乐行业可以迅速扩展自身的辐射边界,以更加容易被消费者所接纳的方式,获得新的发展动能。

5.AIGC+其他:推进数实融合,加快产业升级

除以上行业之外,教育、金融、医疗、工业等各行各业的 AIGC 应用也都在快速发展。

教育领域,AIGC 赋予教育材料新活力。金融领域,AIGC 助力实现降本增效。医疗领域,AIGC赋能诊疗全过程。工业领域,AIGC 提升产业效率 和价值。

总体来看,AIGC 正在发展成与其他各类产业深度融合的横向结合体, 其相关应用正加速渗透到经济社会的方方面面。

人工智能生成内容发展面临的问题

随着人工智能技术发展步入快车道,AIGC 因为其快速的反应能 力、生动的知识输出、丰富的应用场景,在社会生产和生活的方方面面发挥着重要的作用。

但与此同时,AIGC 的关键技术、企业核心能 力和相关法律法规尚未完善,围绕公平、责任、安全的争议日益增多。关键技术不够完全成熟,大规模推广落地尚存痛点、难点。

目前,AIGC 技术不断升级,进一步释放内容生产力,但其在人工智能关键 技术方面尚存在局限,掣肘产业发展进程。

一是人工智能算法存在固 有缺陷;二是 AIGC 内容编辑与创作技术不 够完善;三是企业风险治理能力尚未完善。

2022 年 5 月,最新出台的《关于 推进实施国家文化数字化战略的意见》,要求研究制定扶持文化数字 化建设的产业政策,强调各地要因地制宜制定具体实施方案,相关部门要细化政策措施。未来,各地、各部门政策的支持力度、推进落实 和动态调整情况将决定着技术与社会的相互建构程度,将对 AIGC 技 术在社会情境中的发展起到重要作用。

未来展望

从真实可控向多样组合发展

从技术层面上看,目前 AIGC 的相关算法已经具备了真实复刻和 创造某类既定内容的能力,同时相关模型对简单场景的内容生成也取 得了较好成果,但面对多样性变化和复杂场景内容生成的挑战,现有 AIGC 的算法能力仍需进一步提升。

从本地化集中式向大规模分布式发展

作为数字经济和实体经济深度融合的新模式,AIGC 通过应用大 量新型人工智能技术来创造和制作丰富的创新型、高质量、可交互的 数字内容,这给当前人工智能技术的研究带来了全新的挑战,针对大 规模分布式 AIGC 交互算法的研究是时下紧迫且热门的主题,也是 AIGC 技术未来的发展方向之一。

随着 AIGC 核心技术的不断发展,其内容孪生、内容编辑、内容 创作三大基础能力将显著增强。

目前,AIGC 已经在多个领域得到广泛应用,如金融、传媒、文 娱、电商等,未来应用场景会进一步多元化

生态建设日益完善

随着 AIGC 的不断成熟,以标准规范、技术研发、内容创作、行 业应用、资产服务为核心的生态体系架构将日趋完善,无论是以 AIGC 赋能产业升级还是以 AIGC 自主释放价值都将在此框架下健康有序 发展。

随着 5G、云计算、VR、AR 等 前沿技术的快速发展和新一代智能终端设备的研发创新,完整的 AIGC 生态链是未来释放数据要素红利、推动传统产业升级、促进数字经济 发展、构建数实融合一体、创造元宇宙世界最重要的推动力之一。