带你揭开AI换脸技术的秘密

demi 在周五, 03/12/2021 - 10:58 提交

前不久，社交媒体平台上一款名为“蚂蚁呀嘿”的特效火爆全网，许多网友都将自己的照片导入换脸软件Avatarify中，照片便可以被算法驱动，生成一段表情夸张扭曲且跟着节奏晃动的换脸短视频。

魔幻的特效让这类的视频迅速侵袭社交平台，网友惊呼：简直就像捅了蚂蚁窝。

例如：马云、马化腾、马斯克等大佬们，正在集体演唱神曲《蚂蚁呀嘿》。

例如，李开复老师便友情上演了一首《Only You》。

这项技术可以完成在给定一张源图片和一个目标动作视频，将目标视频的表情和动作迁移到源图片上，使得源图片中的人物做出目标视频相同的表情动作。

那么AI换脸技术的原理是什么？

生成式对抗网络（GAN）技术

其实最早实现换脸是通过修图(Photoshop)的方式实现的，不仅耗时耗力，其换脸效果也不佳。而目前比较流行的换脸软件，实际上是运用了生成式对抗网络（GAN）技术，这是深度学习模型中的一种。

简单来说，就是机器通过事先采集大数据中的人脸表情特征，再结合换脸人本身的一些特征信息，通过“对抗博弈”的方式不断进化，最终生成我们所希望得到的换脸视频。这种方式不仅可以快速地实现自动换脸，其生成的图像也更逼真。

尽管生成式对抗网络中包含“网络”一词，但它和我们通常所说的“互联网”并不是一回事，它本质上是一个数学算法。由于生成式对抗网络采用的是深度学习中的神经网络学习算法，故而保留了“网络”两个字。

生成式对抗网络框架通过让两个神经网络相互博弈的方式进行学习，其中一个是生成器，另一个是判别器。生成器根据预置的规则尝试生成数据，而判别器则会去判别是否是真实数据，并把判别结果反馈给生成器，生成器会根据反馈信息进行调整，从而输出新的数据，两者反复博弈直到判别器将生成器生成的数据判别为真实数据为止。

例如当我们想生成一个笑脸时，判别器会自动识别生成器随机生成的表情是否为笑脸；如果不是，此信息会被驳回，生成器会根据反馈重新调整生成数据，经过层层判别，最终输出的人脸里既会包含换脸人本身的特征，同时也包含我们所期望的笑脸表情。

值得注意的是，机器前期采集的喜怒哀乐等通用表情信息主要来源于大数据图库，而并非换脸人的个人表情信息。这也就意味着，利用对抗生成网络技术实现的换脸仅需要不多的个人人脸照片即可。该换脸技术诞生最初大概需要300-500张换脸人的图片，而随着近年技术的不断改进，现在仅仅需要3-5张相关照片就可以生成需要的换脸照片或者视频。

在机器学习中，生成式对抗网络的应用非常多，其最主要的用途就是生成我们想要的数据。目前大部分应用集中于视频和图像创造，例如我们在拍摄中需要一些动画或者特定场景，原本可能需要制作道具或者耗费人工进行手绘，而现在利用这一技术，则可以变得非常高效。

换脸是否会造成个人隐私泄露？

就目前而言，通过App下载的换脸图片或者视频，由于计算量有限，其图像质量还比较差，仔细观察后还是存在面部不自然等问题。而那些图像质量高到可以欺骗人眼的换脸图片和视频，在相关检测算法的判别下通常也都会“原形毕露”。

以上内容、图片均根据网络资料整理，如有侵权请联系删除

人脸识别，边界何在?	2021年十大人工智能创新趋势	预计到2028年面部识别市场规模将达到134亿美元
安全VS便利人脸识别技术之辨	基于梯度编辑的鲁棒性人脸识别方法SFace	指纹识别和人脸识别应用差异分析

最新文章

最新文章