作者 | 斯坦福大学工程学院
原文链接:https://news.stanford.edu/2022/08/18/new-chip-ramps-ai-computing-efficiency/
译者 | 陈甜静 责编 | 屠敏
出品 | CSDN(ID:CSDNnews)
声明:本文为CSDN翻译,转载请注明来源。
当前,AI芯片已成为最热门的投资领域,各种AI芯片如雨后春笋般冒出。从广义上讲,只要能够运行人工智能算法的芯片都叫做AI芯片。但是通常意义上的AI芯片指的是针对人工智能算法做了特殊加速设计的芯片。
1、解决能源问题很关键
人工智能驱动的边缘计算在我们的生活中无处不在。无人机、智能可穿戴设备和工业物联网传感器等设备都配备了人工智能芯片,因此计算可以在数据发源地之互联网的“边缘”进行,可以实时处理并保证数据隐私。
在今天的人工智能芯片中,数据处理和数据存储在计算单元和内存单元中。这些单元之间频繁的数据移动消耗了人工智能处理过程中的大部分能量,而微型边缘设备上的人工智能功能会受到电池容量的限制。因此减少数据移动是解决能源问题的关键。
为解决这一问题,斯坦福大学的工程师于近日发布了一款新颖的电阻式随机存取存储器(RRAM)芯片。此芯片特点是在内存内进行AI处理,消除计算单元和内存单元之间的分离。虽然体积很小但是效率很高。
“在芯片上完成计算过程,而不是从云端发送与接收信息。能够实现更快、更安全、更便宜、更具可扩展性的能力”,H.-S Philip Wong工程学院的Willard R.和Inez Kerr Bell教授谈道。
“通过我们的芯片,展示了如何应对移动中的低效问题。”刚从斯坦福大学毕业的Weier Wan补充道。
他们在Nature杂志最近的一篇文章中介绍了NeuRRAM。虽然内存计算已经存在了几十年,但该芯片是第一个在硬件上实际演示广泛的AI应用程序的芯片,不仅仅是通过模拟。
2、将计算能力放在设备上
为了克服数据移动瓶颈,研究人员实现了一种内存计算(CIM),这是一种新颖的芯片架构,可以直接在内存中而不是在单独的计算单元中执行AI计算。NeuRRAM使用的存储技术是电阻式随机存取存储器(RRAM),这是一种非易失性存储器,其特点是即使断电也能保留数据,目前其已经应用于商业产品中。RRAM可以在小面积内存储大型AI模型,并且功耗极低,非常适合小尺寸和低功耗的边缘设备。
NeuRRAM论文的共同资深作者Wong表示:“这是将大量内存直接集成到神经网络芯片上并呈现所有基准测试结果,通过硬件测量的首批实例之一。”
NeuRRAM的架构是与加州大学圣地亚哥分校的Gert Cauwenberghs实验室合作设计的,该实验室开创了低功耗神经形态硬件设计的先河。此架构允许芯片以低功耗和紧凑面积的方法执行模拟内存计算,还支持数据流方向的可重构性以及各种AI工作负载映射策略,并且可以与不同类型的AI算法一起工作。
为了展示NeuRRAM人工智能能力的准确性,该团队测试了它在不同任务中的运作方式。他们发现MNIST数据集的字母识别准确率为99%,CIFAR-10数据集的图像分类准确率为85.7%,谷歌语音命令识别准确率为84.7%,贝叶斯算法的图像重建错误减少了70%。
“效率、多功能性和准确性都是应用该技术时要考虑的重要方面,但要同时实现它们并不简单。关键在于要从硬件到软件整个堆栈共同优化。”Wan表示道。
3、推动未来的边缘计算
目前,NeuRRAM只是一种物理概念层面的验证,但要转化为实际的边缘设备则需要更多开发。
这种结合效率、准确性和执行不同任务的能力充分展示了芯片的潜力。Wan说:“也许目前它只用于执行简单的人工智能任务,例如关键字定位或人体检测,但未来它可以实现完全不同的用户体验。我们需要继续改进设计并将RRAM扩展到更先进的技术节点。”
电气工程助理教授Priyanka Raina谈道:“这项工作为RRAM设备工程、内存计算的编程模型和神经网络设计的未来研究开辟了多种途径,同时能够使该技术可扩展并供软件开发人员使用。”
如果成功,像NeuRRAM这样的RRAM内存计算芯片具有几乎无限的潜力。它们可以嵌入农田进行实时人工智能计算,根据当前土壤条件调整灌溉系统。他们也可以将VR眼镜从功能有限的笨重形态变成更类似于Tony Stark在钢铁侠和复仇者联盟电影中的虚拟屏幕。“大规模生产这些芯片会更加便宜,且适应性强、功耗低,可以用于改善我们的日常生活,如用于家庭健康监测的医疗设备。也可用于解决从气候变化到粮食安全的各种问题。”Wong总结道。