您现在的位置是：首页 > 人工智能AI > 正文

人工智能AI

5分钟为你破解超火的虚拟数字人如何制作？

1987web2023-10-07人工智能AI178

虚拟人概念从早期动漫领域的初音未来用一首《甩葱歌》让绿色双马尾的歌姬形象火出圈，到洛天依登上央视春晚舞台，再到众多虚拟歌手、虚拟主播、KOL、代言人等活跃于各种情境中。

去年以来，元宇宙和虚拟人技术进入全球科技产业的聚光灯下，国内也涌现出了很多新的虚拟人形象。2021年10月，虚拟美妆达人柳夜熙将虚拟数字人推向了更多普通用户。

要知道，具有数字化外形的虚拟人，与具备实体的机器人是不同的，虚拟人依赖显示设备存在，且具备以下三方面特征：

一、拥有人的外观，具有特定的相貌、性别和性格等人物特征；

二、拥有人的行为，具有用语言、面部表情和肢体动作表达的能力；

三、拥有人的思想，具有识别外界环境、并能与人交流互动的能力。

虚拟人可以根据角色类型分为三种：

1、写实/超写实类角色虚拟人，比如柳夜熙、翎ling、AYAYI等；

2、二次元角色虚拟人，比如洛天依、初音未来、星瞳等；

3、卡通/吉祥物角色虚拟人，比如海尔兄弟、京东狗、苏格拉宁等。

为了更好地理解虚拟人，可以对其制作环节进行拆解。

虚拟人制作环节拆解

虚拟人的实现主要由建模、驱动、渲染、呈现与互动，5大环节组成。

其中建模、驱动、渲染环节主要依靠影视CG、VFX技术与游戏引擎等实现：

首先，3D建模为构建虚拟人形象的基础，重点在于实现细节的精细还原；

其次，通过将捕捉采集的动作迁移至虚拟人是目前3D虚拟人动作生成的主要方式，核心技术是动作捕捉；

最后，渲染技术用于提升虚拟人的逼真程度，实时互动亦需要实现实时渲染。

根据Unity技术开放日公布的流程，Unity制作虚拟人先要根据FaceCode标准扫描真人的极限表情，接着要进行模型清理、BlendShap拆分，并修补细节、修贴图和血流图等，之后继续进行Rigiging（包括重定位等）和模型捕捉（使用第三方提供的高精度结果来驱动模型或者真人驱动等），最终渲染完成，形成虚拟人。

Unity技术开放日

而呈现环节可以分为实时与非实时两类。实时的可在全息表演、AR等技术的成熟发展下，不断提升效果质量；相较于非实时（视频、照片）的虚拟人互动性更强、发展潜力更大。

虚拟人的交互又可分为智能驱动型和真人驱动型两种：

智能驱动型可以通过智能系统自动读取并解析识别外界输入信息，根据解析结果决策虚拟人后续的输出文本，然后驱动人物模型生成相应的语音与动作来使虚拟人跟用户进行互动。人物模型是预先通过AI技术训练得到的，可通过文本驱动生成语音和对应动画，在业内次模型称为TTSA(TextToSpeech&Animation)人物模型。

另外，智能驱动作为虚拟人的一条探索方向，还意图通过深度学习技术打造永不塌房、不知疲倦的虚拟人。

真人驱动型是通过真人来驱动，主要原理是真人根据视频监控系统传来的用户视频，与用户实时语音，同时通过动作捕捉采集系统真人的表情、动作呈现在虚拟数字人形象上，从而与用户进行交互。