据外媒报道,先想象一只橙色的猫,现在想象一下这只猫只长了黑色的皮毛,然后再想象一只猫在中国的长城上昂首阔步。这一系列的想想会让你大脑中神经元的快速激活根据你之前对世界的认识想出各种各样的图片。换言之,作为人类,很容易想象一个具有不同属性的物体。
然而尽管深度神经网络在某些任务上取得了跟人类相当或超过人类的表现,但计算机在人类特有的“想象力”技能方面仍在做着苦苦的挣扎。
现在,南加州大学(USC)一个由计算机科学教授Laurent Itti、博士生Yunhao Ge、Sami Abu-El-Haija和Gan Xin组成的研究团队开发出了一种人工智能,这种AI能够通过使用类似人类的能力来想象出一个具有不同属性的从未见过的物体。
“我们受到人类视觉泛化能力的启发,试图在机器上模拟人类的想象力,”该研究的论文首席作者Ge说道,“人类可以通过属性(如形状、姿势、位置、颜色)来分离他们所学到的知识,然后将它们重新组合以想象一个新的物体。我们的论文试图用神经网络来模拟这一过程。”
AI的泛化问题
假设你想创建一个生成汽车图像的AI系统。理想情况下,你可以为算法提供一些汽车的图像,这样它就可以从多个角度生成各种颜色的汽车。
这是AI长期追求的目标之一:创造出能进行外推的模型。这意味着,只要给出几个例子模型就应该能够提取出基本的规则并将它们应用到它以前没有见过的大量新例子中。但机器通常是在样本特征上训练的,如像素,而不会去考虑对象的属性。
想象力的科学
在这项新研究中,研究人员试图用一种叫做消纠缠(disentanglement)的概念来克服这个限制。消纠缠可以用来产生深度伪造。Ge指出,通过这样做,“人们可以合成新的图像和视频来用另一个人的身份代替原来的人,但却能保持原来的运动。”
类似地,新方法采用一组样本图像--而不是像传统算法那样一次采集一个样本--并挖掘它们之间的相似性以实现所谓的“可控解消纠缠表征学习”。
然后,它重新组合这些知识以实现“可控的新图像合成”或可以称之为想象力的东西。”这类似于我们人类的推断:当一个人从一个物体看到一种颜色时我们可以很容易地把它应用到其他物体上,通过用新的颜色替换原来的颜色。研究小组通过利用他们的技术生成了一个包含156万张图像的新数据集,这可能有助于该领域未来的研究。
理解这个世界
虽然“消纠缠”并不是一个新概念,但研究人员表示,他们的框架可以跟几乎任何类型的数据或知识兼容。这扩大了应用的机会。如将种族和性别相关知识从等式中移除敏感属性从而创造出更公平的AI。
在医学领域,它可以帮助医生和生物学家发现更多有用的药物以将药物的功能从其他属性中分离出来,然后重新组合从而合成新的药物。赋予机器想象力还可以帮助创造更安全的AI,如让自动驾驶汽车想象并避免在训练中看不到的危险场景。
Itti说道:“深度学习已经在许多领域展示了卓越的性能和前景,但这往往是通过浅层模仿发生的,它没有对使每个对象独特的单独属性拥有更深入的了解。这种新的分离方法,第一次真正释放了AI系统的新想象力从而让它们更接近人类对世界的理解。”