带你揭开AI换脸技术的秘密

前不久,社交媒体平台上一款名为“蚂蚁呀嘿”的特效火爆全网,许多网友都将自己的照片导入换脸软件Avatarify中,照片便可以被算法驱动,生成一段表情夸张扭曲且跟着节奏晃动的换脸短视频。

魔幻的特效让这类的视频迅速侵袭社交平台,网友惊呼:简直就像捅了蚂蚁窝。

例如:马云、马化腾、马斯克等大佬们,正在集体演唱神曲《蚂蚁呀嘿》。


例如,李开复老师便友情上演了一首《Only You》。


这项技术可以完成在给定一张源图片和一个目标动作视频,将目标视频的表情和动作迁移到源图片上,使得源图片中的人物做出目标视频相同的表情动作。

那么AI换脸技术的原理是什么?

生成式对抗网络(GAN)技术

其实最早实现换脸是通过修图(Photoshop)的方式实现的,不仅耗时耗力,其换脸效果也不佳。而目前比较流行的换脸软件,实际上是运用了生成式对抗网络(GAN)技术,这是深度学习模型中的一种。

简单来说,就是机器通过事先采集大数据中的人脸表情特征,再结合换脸人本身的一些特征信息,通过“对抗博弈”的方式不断进化,最终生成我们所希望得到的换脸视频。这种方式不仅可以快速地实现自动换脸,其生成的图像也更逼真。


尽管生成式对抗网络中包含“网络”一词,但它和我们通常所说的“互联网”并不是一回事,它本质上是一个数学算法。由于生成式对抗网络采用的是深度学习中的神经网络学习算法,故而保留了“网络”两个字。

生成式对抗网络框架通过让两个神经网络相互博弈的方式进行学习,其中一个是生成器,另一个是判别器。生成器根据预置的规则尝试生成数据,而判别器则会去判别是否是真实数据,并把判别结果反馈给生成器,生成器会根据反馈信息进行调整,从而输出新的数据,两者反复博弈直到判别器将生成器生成的数据判别为真实数据为止。


例如当我们想生成一个笑脸时,判别器会自动识别生成器随机生成的表情是否为笑脸;如果不是,此信息会被驳回,生成器会根据反馈重新调整生成数据,经过层层判别,最终输出的人脸里既会包含换脸人本身的特征,同时也包含我们所期望的笑脸表情。


值得注意的是,机器前期采集的喜怒哀乐等通用表情信息主要来源于大数据图库,而并非换脸人的个人表情信息。这也就意味着,利用对抗生成网络技术实现的换脸仅需要不多的个人人脸照片即可。该换脸技术诞生最初大概需要300-500张换脸人的图片,而随着近年技术的不断改进,现在仅仅需要3-5张相关照片就可以生成需要的换脸照片或者视频。


在机器学习中,生成式对抗网络的应用非常多,其最主要的用途就是生成我们想要的数据。目前大部分应用集中于视频和图像创造,例如我们在拍摄中需要一些动画或者特定场景,原本可能需要制作道具或者耗费人工进行手绘,而现在利用这一技术,则可以变得非常高效。

换脸是否会造成个人隐私泄露?

就目前而言,通过App下载的换脸图片或者视频,由于计算量有限,其图像质量还比较差,仔细观察后还是存在面部不自然等问题。而那些图像质量高到可以欺骗人眼的换脸图片和视频,在相关检测算法的判别下通常也都会“原形毕露”。


以上内容、图片均根据网络资料整理,如有侵权请联系删除

最新文章