PowerVR Series2NX:提高嵌入式AI门槛

作者:Benny Har-Even

随着去年9月Series2NX神经网络加速器(NNA)的推出,Imagination改变了嵌入式AI加速领域的游戏规则,现在,我们自豪的发布两款核心产品:PowerVR AX2185面向高端市场,AX2145面向中档市场(下面我们将详细的向大家介绍)。

正如我们在之前文章中提到过的,神经网络作为解决问题以及驱动多领域新型应用的工具正变得越来越流行,不妨查看我们之前的博客“简单介绍:神经网络是什么以及它是如何工作的”。

PowerVR Series2NX:提高嵌入式AI门槛

现在你每天都要使用的很多设备都利用了神经网络,在智能手机中它们对照片搜索功能提供支持,还用于人脸识别帮助大家使用人脸解锁手机,他们可以通过识别车牌了解你驾车驶入或离开拥堵区。它们足够的“聪明”,能够检测一个人的肢体语言——这对监控系统非常的有用,它们也被应用到带摄像头的AV系统中,可以识别每个人并让系统提供个性化的内容服务,在汽车上涉及的应用包括车道偏离预警、司机状态监控等,此外,通过大量实验和应用证明神经网络比人类更擅长检测皮肤癌——可见神经网络的应用既广泛又多样。

PowerVR Series2NX:提高嵌入式AI门槛

虽然神经网络可以进行离线训练,但是在进行推断处理时——运行神经网络实时识别和处理对象——有必要将这些技术转移到终端设备中,而不是将这些任务放在云端进行处理。举一个例子:无人机,它们的飞行速度可以超过150mph(英里每小时),神经网络可以驱动碰撞检测系统,然而如果没有专门的硬件来进行图像处理,无人机将需要看到前方10-15米的物体才能避开障碍物。由于发送和接收信息所需的延迟和带宽,云服务器并不是合适的解决方案。搭建专用PowerVR NNA的无人机能够以每小时150英里的速度飞行,并且避开1米以内的障碍物,这大大提高了响应能力和安全性,并增强这类应用的创造性。

PowerVR Series2NX:提高嵌入式AI门槛

我们将专用神经网络硬件视为SoC集成的下一步,在20世纪80年代除了早期的桌面CPU之外还集成了数字协同处理器,而且很快就成为了这类设计的标准。虽然很多计算机任务已经从CPU转移到GPU上来,但这对于工作来说仍然不是最有效的设计工具,将它们转移到专用的本地硬件才是符合逻辑的解决方案,性能优势是显而易见的,采用高端GPU检索1000张图片需要60秒,但是使用我们的NNA只需要2秒,之前的方案对这些图片进行分类要消耗1%的电量,但是NNA消耗1%的电量可以处理42万8千张图片,这是非常具有说服力的。

PowerVR Series2NX:提高嵌入式AI门槛

去年9月份我们推出的Series2NX加速器是基于神经网络推理而构建的,是目前业界性能最好的解决方案,同时我们还为所有的主要卷积神经网络层提供支持,比如Inception、ResNet,框架包括Tensorflow、Caffe2和PyTorch等。

我们的解决方案一个关键的区别在于它提供了灵活的精度,使用由16位数据组成的经过训练的网络可以达到非常高的准确度,然而使用较低的精度训练网络意味着仍然可以保持较高的精度,而且其优势是可以显著降低功耗和带宽。在实际情况中这使得将NNA集成到智能相机、智能手机等嵌入式设备中可以花费较低的成本同时保持较高的实用性。查看我们的博客了解更多关于采用高效推理训练神经网络的处理过程和好处。

下表展示了精度灵活性的好处,简而言之采用4位精度你可以大幅度降低功耗和带宽(内存)需求,精确度仅下降1%,这在大多数实际情况下对于设备的效率没有明显的影响。

PowerVR Series2NX:提高嵌入式AI门槛

PowerVR AX2185

我们的Series2NX已经在市场上取得了成功并且已经授权给多家厂商,今天我们正在不断扩大市场的选择,首先我们增强原始核心推出了PowerVR AX2185,其次发布另一个版本即PowerVR AX2145。一个关键的新特性是这两款核心都增加了对Android NN API的硬件支持,使得开发人员能够开发更多基于深度学习的应用,大大丰富了安卓市场应用。

PowerVR Series2NX:提高嵌入式AI门槛

从性能角度来看,PowerVR AX2185面向的是高端嵌入式市场,它集成了8个全位宽计算引擎,能够提供每秒最多可达4.1兆赫的运算,在目前市场上其每平方毫米性能参数是最高的。实际上这个水平是最新的桌面GPU性能的3.5倍。对于那些正在使用功耗较高的GPU进行神经网络训练的公司来说,这是非常具有吸引力的,尤其是汽车领域。与友商提供的硬件解决方案相比,基于4位数据的网络AX2185仅需要50%的带宽,而与基于DSP的竞争厂商的方案相比则降低了75%。

PowerVR Series2NX:提高嵌入式AI门槛

虽然高端设备已经具备了人脸解锁等诸多功能,但是我们看到这些功能正在迅速的更新迭代,设备制造商希望以更低的价格提供这些功能,当然消费者也想为他们的手机支付更少的钱但同时还能拥有相同甚至更好的功能,比如智能相机确保家庭安全、智能手机的人脸解锁等。是的,消费者也想分享这个蛋糕。

PowerVR AX2145

如何在内存有限的设备上保持这种用户体验呢?答案是PowerVR AX2145。它为性能效率而调整了整体性能,此外它高度调优了矢量计算,卷积引擎结合了优化的内核存储结构,能够提供明显的最大性能参数,而且与AX2185相比每平方毫米面积的推理性能提升了50%,同时降低了系统峰值内存带宽(以GB/s计算)。我们为其实现的性能和效率之间的平衡而感到骄傲,我们认为这对于成本敏感的设备是非常理想的选择。

PowerVR Series2NX:提高嵌入式AI门槛

当然硬件本身并不能算是解决方案,我们还提供了PowerVR AI工具包,这大大简化了用户的部署流程,调试和网络分析都非常的简单,此外,它还支持对训练后的网络进行优化。我们的API支持包括IMG DNN和Android DNN,提供GPU和NNA之间无缝的互操作性。

PowerVR Series2NX:提高嵌入式AI门槛

总结

随着这两款新核心产品的推出,我们将能够在终端设备上实现低成本的AI功能,为消费者提供更多新型的AI应用程序。通过这些核心将能够满足开发人员创建应用程序所需的性能要求,真正实现人工智能带来的变革,我们期待这些提升变成现实,它将涉及多个应用市场比如智能手机、智能相机和汽车等。未来的可能性是无限的,唯一需要的就是一点儿想象力。

原文链接: https://www.imgtec.com/blog/powervr-series2nx-raising-the-bar-for-embedd...

声明:本文为原创文章,转载需注明作者、出处及原文链接,否则,本网站将保留追究其法律责任的权利

--电子创新网--
粤ICP备12070055号