Imagination PowerVR NNA入门介绍

什么是神经网络加速器?

现在我们所能看到很多技术都在变得更加的 “智能”,从手机到音箱,我们的设备变得原来越聪明,它们能够识别我们的面孔并且回答提问,还能帮助我们安排旅行行程,这一切都归功于众所周知的人工智能技术(AI)。

尽管这些让人联想起超级智能机器或机器人的形象,但如今技术中的“智能”实际上是非常狭义上的人工智能技术,主要是负责完成一些具体的任务,比如图像或语音识别。这些是通过一种叫做深度学习的技术来实现的,深度学习是机器学习的一个子集,它使用的算法属于神经网络的一部分。

神经网络的优势在于它们非常善于模式识别,这使得它们能够很好的理解现实世界,而不需要专门编程来做到这一点,这也是它们能够让设备变得更加“智能”的原因。

要识别某些东西,比如猫,首先要做的就是训练神经网络,这是在离线状态下完成的,通过向神经网络系统提供大量的数据,它才可以知道什么是猫,什么不是猫。一旦经过训练,神经网络系统就会分析它以前从未见过的新数据,无论是视觉上的还是听觉上的,并对它所看到或听到的做出判断,这个过程叫做推理。因此基于大量数据训练过的系统它就能够很好地识别一个对象,即使它从未见过这个对象。

与图形处理单元(GPU)加速3D计算一样,采用专用的硬件平台也可以加速神经网络推理过程,在Imagination公司我们称其为神经网络加速器或NNA。

在这种专用硬件出现之前神经网络是采用CPU或者GPU平台来运行的,然而专用硬件具有多方面的优势,包括性能、功耗等。

虽然GPU运行神经网络的速度大约是CPU的4-25倍,但我们推出的PowerVR Series3NX NNA的运行速度是CPU的100-200倍。在运行神经网络时其效率提升了一个数量级,大大提高了电池寿命,这在单元有限的设备中是非常重要的,最后NNA器件要比CPU或GPU尺寸小得多,随着器件成本的增加采用我们推出的NNA器件可以最大限度的提高神经网络系统的效益。

采用NNA的另一个关键优势是可以将智能或AI技术应用到终端设备中,这意味着虽然许多智能设备可以通过互联网发送数据并在云服务器上执行推理操作,但是NNA的处理操作是在设备端侧完成的,这会有很多的好处,比如降低处理延迟、降低功耗、保证数据安全,因为不需要将数据传输给云服务器这个过程。

神经网络应用于哪些方面?

神经网络在很多场景得到了广泛的应用,人脸识别就是常用的一种技术,它有很多用途。它可以让你的智能手机或应用程序通过人脸识别来解锁,通过使用智能监控摄像头识别嫌疑人从而提高安全性,还可以实时监控驾驶员的状态确保他们在行驶过程中保持专注的状态。

神经网络也被用于场景识别,例如你想在你的手机中找到猫的照片,你可以在搜索框中进行搜索,它会弹出所有猫的照片。同样的技术也可以用于工业领域:联合收割机可以在收割小麦时分析小麦的状态,从而区分出小麦的好坏。神经网络在物体识别方面也表现的很出色,因此它也被用来分析自动驾驶汽车多个摄像头采集到的数据,这将有助于进一步提升自动驾驶的水平。此外该技术还应用到每一家的电视产品中,能够使低分辨率的视频变得更清晰从而更好的匹配屏幕的分辨率,还可以识别用户的语音让音箱能够响应用户的命令。

最后神经网络的应用还要取决程序设计人员的创造性,使应用能够与强大的硬件平台无缝的协调工作,充分发挥和利用硬件平台的强大性能——这也是PowerVR NNA神经网络加速器的作用所在。

Imagination的不同之处在于什么?

Imagination推出的PowerVR NNA神经网络加速器在目前市场的一个显著优势是它可以支持低精度的神经网络——8位、4位甚至更低。通常神经网络训练采用的是32位或16位精度,这虽然提供了最高的精度水平,但是产生的网络模型是非常大的,同时也使训练后的神经网络不能应用于终端设备,这会受到功率、内存容量和带宽的限制。借助我们的神经网络工具开发人员可以很容易的缩小神经网络的规模以便它们可以有效的在嵌入式设备上进行存储和运行,同时保证性能的最大化以及更高的准确性。

Imagination推出的NNA神经网络加速器具有广泛的性能,PowerVR AX3595是我们推出的最大规模单核NNA加速器,每秒最多能够完成10TOPS,但是器件尺寸要比一般的GPU器件小的多,我们推出的最小处理核心PowerVR AX3125尺寸非常的小,但是能够提供每秒最多0.6 TOPS,这比当今绝大多数智能手机所采用的神经网络性能要高得多。

Imagination还提供了相关开发软件帮助开发人员能够很容易的使用我们推出的IP,我们的计算软件开发工具包将让开发人员能够获得他们自己理想的神经网络模型,并将其移植到他们自己的应用程序中,然后再部署到我们的硬件平台上来运行。

开发人员还可以利用Imagination深度学习API(称为IMG DNN)或者借助更高级的软件抽象结构(比如SYCL)生成器等开发工具,这让开发人员只要编写一次应用程序代码就可以实现跨平台使用,包括PowerVR内核、GPU以及NNA等硬件平台。

NNA(神经网络加速器)的未来

嵌入式人工智能系统对于更高性能的需求只会不断的增加,正因为如此PowerVR Series3NX的设计是灵活且可扩展的,未来的版本将会采用多核设计,这样将能够提供更高的性能,从而满足自动驾驶等应用场景的需求。

我们推出的神经网络加速器(NNA)的另一个扩展版本成为PowerVR Series3NX-F,它赋予开发人员更多的自主性,可以直接对硬件进行编程从而运行他们所需要的任何神经网络模型,这个特性对于希望可以不断修改或重新设计应用的开发者来说是非常有用的。

最后无论人工智能(AI)领域有哪些发展,PowerVR平台都会跟上脚步,让SoC厂商能够制造出价格合理的器件,从而让开发者设计的应用能够在最高的性能和功效平台上运行,将人工智能(AI)带来的好处惠及到每个人。

声明:本文为原创文章,转载需注明作者、出处及原文链接,否则,本网站将保留追究其法律责任的权利。

最新文章