云剪指南|“虚拟数字人”教程来了!教你将虚拟人运用到业务场景
原标题:云剪指南|虚拟数字人教程来了!教你将虚拟人运用到业务场景
本文为阿里云智能媒体服务IMS「云端智能剪辑」实践指南第二期,讲述围绕效率化内容生产需求,运用数字人视频合成能力,实现高效、便捷的数字人视频制作体验。
欧叔|作者
随着虚拟数字人技术的发展,越来越多的企业把虚拟人应用到自己的业务场景中,通过创新的内容形态,提升制播效率和智能化水平。
比如:将虚拟人用于内容播报、讲解;创建企业虚拟形象(数字员工)代替传统文本式互动;驱动虚拟主播角色,实现7*24小时不间断直播……虚拟数字人在视频内容生产环节的应用也越来越多。
IMS云端智能剪辑已将数字人能力集成到了智能时间线Timeline中,客户可以通过使用IMS基础剪辑能力、调用IMS数字人视频合成接口、智能时间线Timeline。
本文,我们将围绕4大主要场景,展现从无到有合成出数字人成片。
场景一
数字人视频+绿幕抠图+文字/背景图
如果客户数字人视频是常见的带绿幕的mp4素材,可以使用IMS云端智能剪辑时间线中的绿幕抠图功能,给数字人视频添加AI_Matting效果,即可跟背景视频、文案做合成。
这是该场景中使用的素材示例:
绿幕抠图功能按照颜色相似度进行主体识别,数字人身上尽量不要使用与绿色相近的颜色。
Timeline示例:
成片效果视频:https://v.youku.com/v_show/id_XNTk5MTc5OTE3Mg==.html
本时间线示例中添加了字幕、背景图。此外,还有一些小技巧:
lWidth:1、Height:1 的意思是素材的宽高分别占成片的100%,当客户指定的成片分辨率有变化时,背景素材也会跟着成片的分辨率变化。
lType:GlobalImage是全局图片,全局图片不需要设置出、入场时间,图片默认从成片开始展示到成片结束,在背景图、水印、Logo场景中经常使用。
场景二
带透明通道的数字人视频 + ASR + 背景视频
场景二中,如果客户已有的数字人视频是一个带透明通道的webm格式视频,这类素材的是可以直接与背景图片叠加进行合成,IMS云端智能剪辑的数字人合成接口也可以输出webm格式的数字人视频。
数字人播报场景通常需要展示口播字幕,且字幕要跟随数字人人声播放。在剪辑中可以为数字人视频添加AI_ASR特效,剪辑合成中会识别视频中的人声,并作为字幕合成到成片里,客户还可以修改字幕在视频中的位置、样式等。
这是该场景中使用的素材示例:
成片效果视频:https://v.qq.com/x/page/b3525u1xuvv.html
Timeline示例:
本时间线示例中,还使用了一些小技巧:
l如果我们使用的背景视频是横屏的,而我们所需的成片是竖屏的短视频,那么在剪辑中可以设置素材的适配模式。AdaptMode:Cover是将素材等比缩放填满画布区域,不会对素材拉伸,同时很好得适配了竖屏短视频。
l如果视频中有两个视频轨,我们可以把数字人视频作为主轨道,这样其他轨道默认向数字人轨道对齐,客户无需手动设置其他轨道的时长。
场景三
智能时间线+IMS官方数字人形象
在场景三中,客户可以直接使用阿里云IMS的官方数字人形象,将时间线中的视频Clip类型设置为AI_Avatar,设置数字人朗读的文本和数字人ID,即可生成数字人视频,并通过智能时间线Timeline将数字人合成到成片中。
这是该场景中使用的素材示例:
成片效果视频:https://v.youku.com/v_show/id_XNTk5NDIyMzcxMg==.html
Timeline示例:
lTips:使用AI_Avatar的同时还可以修改数字人的音色(VoiceId)、语速(SpeechRate)、音调(PitchRate)、音量(Volume)等。
场景四
综合使用多轨合成、转场、字幕合成数字人
在实际生产中,也存在数字人播报常伴随着主视频、背景内容的变化的复杂场景,在IMS云端智能剪辑中,客户可以通过一个Timeline将这些需求完整表达出来,仅提交一个剪辑任务即可得到想要的成片。
本场景使用多个素材视频、背景图片,同样使用智能时间线Timeline进行数字人视频合成。
这是该场景中使用的素材示例:
成片效果视频:https://v.youku.com/v_show/id_XNTk5NjA4OTAxNg==.html
Timeline示例:
l该示例中数字人使用了人声克隆训练的个性化人声(CustomizedVoice)。结合客户的具体场景,还可以拼接更复杂的时间线提交合成。
智能媒体服务IMS(Intelligent Media Services)是2021年5月正式商业化的一款云产品,其中的云剪辑功能主打视频生产能力,通过组织剪辑需要的时间线(Timeline)结构,即可在云端对用户的音视频素材进行剪辑,可以理解为IMS云剪辑就是一款API版的iMovie。
本篇主要讲解数字人在云端智能剪辑中的使用,除此之外,IMS云剪辑还融入了众多AI智能能力,助力提高开发者的视频生产效率。
当前,IMS人声克隆已进入商业化,客户可训练自己的人声在剪辑合成中使用。大众版数字人训练即将上线,敬请期待!
其他文档参考:
提交剪辑合成任务:https://help.aliyun.com/document_detail/441147.html
提交数字人渲染任务:https://help.aliyun.com/document_detail/2260302.html
Timeline配置说明:https://help.aliyun.com/document_detail/198823.html
智能时间线集成数字人最佳实践:https://help.aliyun.com/document_detail/2259918.html