1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

人人都能打造“数字人”!腾讯杀入AIGC创作领域

1987web2023-05-18人工智能AI326
原标题:人人都能打造数字人!腾讯杀入AIGC创作领域

原标题:人人都能打造数字人!腾讯杀入AIGC创作领域

随着腾讯智影的出现,AIGC创作领域或迎来加速时刻。

01

AI智能创作助手 腾讯智影来了

"大家好,我是数字人大亨,很荣幸能够与大家探讨一个备受关注的话题:AIGC(AIGC即AIGenerated Content,是指利用人工智能技术来生成内容)是否能代替人类进行创作?历史证明,人类的创造力和创作风格是随着时代和技术革新不断演进的。在内容创作,尤其是创作优质个性化内容方面,AIGC和人类的协同是非常必要的一环。

3月底,在2023新榜大会上,腾讯内容平台部副总经理姚天恒通过他的数字人"大亨做了这样的演讲开场。令人关注的是,这个数字人不仅在形象上高度逼真,而且在语音、语调、唇动等方面也非常真实,甚至连姚天恒惯常的表情和动作都毫不马虎地模拟了出来。

数字人大亨是以姚天恒真人为原型打造,采用腾讯智影最新人工智能技术,通过深度学习他本人少量的真实音频、视频数据生成的分身模型。借此机会,腾讯也正式对外发布了全新的AI智能创作助手腾讯智影,通过为内容创作者提供一系列的智能创作工具,帮助创作者在内容创作时提质增效。

02

藏在微信里的AIGC工具

腾讯在AI领域的动作很快,距离腾讯在2022全年业绩财报电话会上坦言AI非常令人兴奋,并表态未来可能将AI纳入微信和QQ,刚刚过去一周时间,腾讯就分别在博鳌亚洲论坛2023年年会下一代互联网论坛上透露正在研发类ChatGPT聊天机器人,并且集成集成到QQ、微信,以及腾讯云的版本都会有,以及正是在2023新榜大会上发布腾讯智影。

然而,很多人都没想到腾讯智影发布的第一时间,人们久可以在微信小程序中找到并体验,与此同时,用户还可以使用PC浏览器登陆zenvideo.qq.com开启腾讯智影平台,以获得更便利的操控体验。

在官方主页可以看到,腾讯智影主要提供人声影三个方面的能力。其中在人的方面,智影数字人是腾讯智影最核心的功能。用户可通过输入文本或音频内容,即可生成数字人播报视频。根据用户差异化的应用需求和场景,腾讯智影又细分为视频剪辑、文本配音、数字人播报、视频审阅等多个功能。

具体而言,在人的方面,智影数字人是腾讯智影最核心的功能。用户可通过输入文本或音频内容,即可生成数字人播报视频;在声的方面,腾讯智影则提供了文本配音、音色定制、智能变声等功能;在影的方面,通过腾讯智影文章转视频能力,创作者可以直接将自己撰写的文字转化为视频内容,无需进行繁琐的素材收集和处理;此外,腾讯智影分段式的素材呈现方式,让创作者可以快速处理分镜、添加卡点、滤镜、特效等,从而大大缩短视频制作的周期和成本。

如此强大的功能,再凭借腾讯微信小程序的覆盖面,自然在第一时间成为市场关注的焦点。

03

让人人都能实现数字人自由

相较其他视频剪辑工具,智影数字人是腾讯智影最核心的功能。用户只需要输入文本或音频内容,几分钟内即可生成数字人播报视频,极大降低了数字人生成门槛,也成为本次体验的重点。

在腾讯智影主界面点击数字人播报后即可打造属于自己的数字人主播。用户首先需要选择相应的数字人形象(提供2D和3D两个类别可供选择)后,即可进入数字人创作界面。

这里要提醒大家的是腾讯智影需要在Chrome浏览器进行访问,即便是腾讯QQ浏览器也会提示PC用户更换浏览器进行工作。在3D主播生成界面可以看到,左侧主要是工具栏界面,数字人、背景、配乐等细节都可以单独编辑,以数字人编辑为例,用户可以对3D主播的形象及动作、画面、字幕等细节进行个性化打造。

从服装样式、服装颜色、人物姿势到动作,腾讯智影都提供了预设模式给用户选择,用户只需要根据个人偏好进行点选即可,上手非常快。

追求易用性的同时,腾讯智影在细节上并没有完全放权。用户可以选择3D数字人各种动作表达,配合文字内容形成自然、连贯的播报,但数字人具体发型、面部表情其实是没办法做个性化定制的,不过在高级编辑中,用户还是可以上传自己的视频、音频和图片资料,进而强化数字人主播内容的差异化。

不过目前腾讯智影只对免费用户开放了部分体验功能,其余大部分需要用户付费使用。如免费版,可以获得每个月5分钟的免费数字人生成视频时长,每天3次的智能工具使用等;398元一的年高级会员是每个月10分钟的数字人生成视频时长或高级+专业音色的文本配音服务二选一,以及每天50次的智能工具等。而在数字人定制上,目前照片定制数字人形象的价格为首年3999元,视频定制数字人形象的价格为首年7999元。

值得一提的是腾讯智影内部已经嵌入了金币体系,部分服务需要使用金币付费,而金币除了注册时赠送的1000金币外,还可通过签到等活跃行为获得。

04

强悍的工具属性

抛开数字人的打造,腾讯智影本身是一款影音剪辑工具,对于不少小白用户而言,其在文本配音、视频剪辑等方面的工具属性更具实用性。

在腾讯智影主界面中点击文本配音后进入相应编辑界面,在顶部菜单栏找到导入文本的选项,平台支持doc、docx、txt等格式的文本,默认文本上限 8000个字,注意满足半小时左右的配音需求了。

不同于其他视频剪辑软件,用户能对配音的节奏(整体速度、局部速度),发音等等进行调教,最为强大的地方是智影文本配音支持不同句,不同字添加不同配音的,比如旁白、开场、小会的话都可以选用不同的人声。

除配音功能非常人性化外,文本配音本身预置了舒适款配音素材可选,用户可以根据视频配音、文章播报、新闻播报、有声小说、语音助手等分类快速选择最适合自己的配音模板,而且顶部还有语气和情绪的分类,再加上百变标签人物下的方言选项,足以为用户带来灵活多变的文本配音。

而对于高阶玩家,文本配音还提供了定制专属音色服务,系统可根据用户上传音色进行声音复刻,从而打造独一无二的配音。

除了极其强悍的配音功能外,视频剪辑也是腾讯智影的基础功能。从素材到音轨,从转场到特效,腾讯智影的视频剪辑功能可以说是相当强大,无论是初学者还是专业剪辑师都能快速上手。

素材和快捷键可以说是腾讯智影剪辑功能的一大特色,在轨道区进行创作,免不了对素材进行雕琢,智影目前已具备十余种种素材调整操作功能,而且右上角的快捷键栏也上线30余个预设快捷键,极大提升了剪辑效率。

05

趣味十足的微信小程序

相对功能强悍的PC版,微信腾讯智影小程序同样能够实现数字人、智能配音等热门功能,但受限于手机操作空间,视频剪辑等功能并非其主打,而是引入了当下最热门的AI绘画。

进入AI绘画页面后,发现腾讯智影在绘图方面支持文本生图和图生图两种生成方式,其中图生图只能生成动漫风格一种风格,但可以额外添加文字修饰,以更加准确地生成自己想要的效果。

而文本生图支持的风格则比较多元,有2D动漫、2.5D动漫、国风、彩漫、素描、线稿、人像特写、油画、印象派共9种,比较遗憾的是暂时只支持生成人像。从最终生成效果来看,AI绘画最终成像效果还是比较让人满意了。

总体而言,腾讯智影本身并非全新产品,本次在AI上的升级,让其不仅兼顾了市场上已有的功能,而且更是从一个视频创作工具升级为智慧的创作助手,无疑能进一步解放短视频创作者生产力,更让入门级用户也能通过数字人践行自己的想法,极大推动了AIGC内容产业落地。

06

迎接人工智能的下一个时代

从引爆AI作画领域的DALL-E 2、StableDiffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。

AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。

AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。

而只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。