您现在的位置是：首页 > 人工智能AI > 正文

人工智能AI

华商好奇心丨我的视频+你的视频+导入软件揭秘AI视频换脸过程

1987web2023-08-10人工智能AI328

前段时间，一个视频换脸App引发了公众对个人生物信息安全问题的极大关注。视频换脸是如何实现的，这样的技术会带来什么？在给用户提供娱乐的同时，可能会带来什么样的风险？本期《好奇心》，一起来关注人工智能（AI）、大数据以及5G网络技术大背景下个人生物信息保护问题。

■实验时间：9月16日

■实验地点：西安电子科技大学科技楼

■实验人员：博士研究生郝毅、华商报

■实验顾问：西安电子科技大学通信工程学院ISN国家重点实验室教授、博士生导师王楠楠

>>实验

谁动了我的脸？

■操作

手机拍摄两段小视频

数小时后实现换脸

视频换脸究竟是如何实现的？

在西安电子科技大学，博士研究生郝毅现场向华商报演示了这种视频换脸技术。

首先，郝毅和用手机各拍了一段十几秒的视频，两人对着镜头各自随意说了几句话。

随后，两段视频被导入电脑后，郝毅打开电脑上的一个软件，先后提取了两段视频中含有人物形象的每一帧静态画面中的人物面部图像，放到两个文件夹。郝毅介绍，视频是由一帧一帧连续变化的静态图像构成，尽管拍摄的视频只有短短十几秒，但两个文件夹中提取的面部图像帧数都在四百张左右。

接下来，点击选择生成方式并进行相应操作后，便开始了人工智能模型（AI模型）的训练过程。软件界面上开始成排、成列地出现和郝毅两人的面部图像，经过一系列的训练，这些图像最终呈现出两个人面部的混合特征。整个换脸过程，从上午10：50进行到下午3时才完成。最终生成的视频中，合成人像的身上还是的着装，但却有着郝毅的面部特征。此外，说话声音、面部表情、嘴型变化及发型，基本都和一致。

将这段视频拿给身边同事看，大家都觉得很惊讶，总的感觉是既熟悉又陌生。

打开凤凰新闻，查看更多高清图片

■揭秘

面部被有意训练和代换

导致A的表情B的脸

郝毅介绍，视频换脸也可以说是一种人脸重构或生成技术。它由两个结构相同的子系统组成，每个子系统分别包含一个编码器和一个解码器。把一张人脸图像输入到编码器后得到一堆数据，把它们通过解码器解码就会重新生成一张人脸图像。在这个过程中可以对人像进行扭曲。

把A、B两人的人脸信息分别输入编码器后，然后再分别通过解码器就可以重新生成各自的图像。在这个过程中，编码器是不分A、B的，完全用的是同一个编码器；但到了解码器这块，解码器A由人脸的特征数据只能生成A的人脸图像A，解码器B则只能将特征数据解码为B的人脸图像B。

这时，如果把经过编码的A的面部图像数据输入到解码器B，由于解码器B只能将特征数据解码为B的人脸图像，最终就会生成一个跟A的面部图像表情类似的B的人脸图像。当把视频中每一帧A的脸都换成B的脸，全部串联起来就会生成一个新视频，在这个视频中，就会是A的声音和着装，却是B的脸。当然，相同的原理，也可以把B的脸换成A的脸。

和一些图片制作软件对静态图片进行的修改对比，这种技术不但用B的脸换掉了A的脸，同时还会把A的表情及嘴型变化等面部信息也都融合呈现在B的脸上，所以在换脸视频中，人物表情和嘴型都是自然变化的。如果做得足够精细，很难一下子看出破绽。郝毅说。

不过被公众高度关注的换脸App，按其功能介绍，只需一张照片就可以很快实现换脸，这是为什么？

郝毅介绍，从原理来讲应该是一样的，但作为商业化的产品，该App应该是对算法进行了优化，对模型进行了改进。那些已有的视频模板相当于已经训练好的模型，而其编码器还可以用已有图像对人脸进行训练。人数足够多的话，利用大量的人物面部图像可以训练出很好的编码-解码系统。当你提交一张清晰的正面照给App，后台只需要使用这张正面照片对模型进行微调，即可完成换脸的操作。

来源：华商网-华商报