百度公开AIGC专利,让用户实现一语成画
近日,百度公开多项AIGC(AI Generated Content)专利,其中文生图相关专利的技术可以让用户实现AI作画。专利提出了一种基于AI跨模态生成大模型构建的新型交互式创作的解决方案,通过输入的文字描述内容获取图像,结合用户偏好风格进行图像调整,自动化生成既满足用户描述指令又贴切用户偏好风格的画作。此次披露的专利技术是百度AI作画产品文心一格的底层技术之一。
文心一格是百度推出的AI艺术和创意辅助平台,让用户实现一语成画,只需输入一段自己的创想文字,并选择期望的画作风格,即刻可以生成创意精美的画作。文心一格既能生产恢弘绚丽的艺术画,也能生产创意脑洞的超写实图,支持国风、动漫、插画、油画等十余种绘画风格和不同画幅的选择,让每个人都能展现个性化格调,享受艺术创作的乐趣。
文心一格的技术基础是百度文心知识增强跨模态理解大模型,具体而言,文心一格使用了百度文心ERNIE-ViLG 2.0作为AI绘画的大模型底座,ERNIE-ViLG 2.0采用知识增强算法和混合专家扩散模型建模,学习了海量优质文图数据,全面提升图像生成质量和语义一致性,在文图生成领域取得全球领先效果。
在强大的大模型技术基础上,文心一格的AI绘画全流程解决方案,通过语义理解+多画作风格适配+结果优化排序,有效解决AI绘画技术在实用中的三大难题:需求描述困难、多样化需求强、模型生成结果筛选难。首先,利用知识辅助可以更好地理解用户的输入,并自动丰富语义细节,有效降低用户输入描述成本;其次,根据不同的需求,灵活适配创意写实、恢弘构图或二者兼具的多风格画作生成能力;最后,基于跨模态匹配大模型对AI的多个生成结果自动排序,选出兼具美感与实用性的作品呈现给用户。
根据中国专利保护协会发布的《人工智能领域高价值专利分析报告》,中国AI技术发明专利价值、申请量、授权量排名中,百度均位列第一。作为文生图AIGC技术的支撑和文心一格强大的技术底座,百度的通用技术、语音技术、自然语言处理技术专利授权量和专利价值度排名第一,视觉技术专利授权量和专利价值度排名领先。百度在AIGC相关技术如图文转视频、高精度数字人生成和文生图等技术上均进行了专利布局,并有多项专利取得了专利授权。
让机器具备跨越文本、图像等多种模态的复杂场景理解与生成能力,是人工智能的重要目标之一,也让数字时代科技与产业深度融合创新,催生新业态新模式,加快产业智能化升级的新动能。人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新我们的认知,同时也让公众对科技与艺术及文化的融合创新有了更大的想象空间。文心大模型正在成为推动AIGC发展的新引擎,基于文心大模型的AIGC将会带来创新性的探索,并赋能到更广泛的行业领域。
-
上一篇
为什么需要备案域名交易?
在互联网时代,网站备案已成为网站运营的必要程序。备案是指将网站的相关信息提交给相关部门进行审核和备案登记,以确保网站的合法性和安全性。备案域
-
下一篇
图片来源@
文 | 光子星球,作者 | 吴先之 ,编辑 | 王潘
AIGC、NFT、VR共同构成元宇宙的三大基础设施,当下硬件设备普及过程中,普遍存在内容供给缺乏的情况,这也是AIGC为何在今年成为风口的主要原因。
光子星球独家获悉,眼下百度MEG正在筹划新一轮组织架构调整,重心是将图文与视频部门单独成立的内容事业群。新事业群的地位与体量无法与MEG、ACG、IDG相提并论,毕竟后三大事业群的话事人都为Estaff成员,而且有相对独立的商业模式。
分拆内容板块,单独整合为新的事业群组,显然是加码AIGC。同时,组织架构调整后百家号、好看视频两大业务板块的地位与话语权有了史无前例的提升。
这不仅意味着百度重回内容市场,种种迹象表明,这次调整相比过去几年围绕信息流、短视频、数字人的修修补补不同,似乎有更为充分的准备。
是素材库还是试验田?
如何定位新的内容事业群是当下最重要的问题。到底是做MEG的素材库,还是独立的AIGC试验田,将影响其业务形态。
日前,Open AI发布的AI聊天机器人ChatGPT依靠智能对话功能,将蠢蠢欲动的AIGC推向风口。人们利用这款工具应用,进行维特根斯坦实践(语言哲学式推导)时,国内AIGC已经来到爆发前夜。
眼下腾讯、阿里、字节、百度等巨头,或是昆仑万维、科大讯飞、天娱数科等细分领域企业都已涉足。上述企业推广其AIGC产品大多围绕提高生产效率,尤其是降低创作成本高与重复劳动展开。
百度隐藏的AIGC野心