Imagination Andrew Grant:PowerVR可将移动AI提速199倍 | GTIC2019

智东西(公众号:zhidxcom)
文 | 心缘

3月15日,上海,由智东西主办、AWE 和极果联合主办的 GTIC 2019 全球 AI 芯片创新峰会成功举办!峰会现场延续上一届的火爆场景,全场从开幕到下午结束座无虚席,而且有不少热情观众坚持站着听完峰会全程。

20位海内外 AI 芯片业界大咖齐聚一堂,围绕 AI 芯片在架构创新、生态构建、场景落地等方面的技术前景和产业趋势“华山论剑”。

本届峰会报名参会的观众覆盖了近4500家企业,到会观众极为专业,其中总监以上级别占比超过62%,现场实际到会人数超过1800位。

▲Imagination Technologies 视觉及 AI 部门高级总监 Andrew Grant 现场演讲

众所周知,GPU 是 AI 浪潮爆发的重要推动力,20多年来,全球移动 GPU 的龙头 Imagination Technologies 一直深耕于 GPU 内核的研发和设计,拥有超过1500个 GPU 专利,在人工智能(AI)的架构设计和系统设计方面积累了独特的优势。

此前 Imagination 曾是苹果昔日的御用图形技术提供商,在 GPU 和手机基因的基础上,Imagination 通过提供软件、IP、嵌入式系统、计算平台和解决方案等一系列产品,逐渐拓展到汽车、安防等AI技术落地的重要垂直市场。

Imagination 的经典产品 PowerVR GPU 架构已经推出了10代,这是一种基于分块延迟渲染技术(TBDR)专利优势的架构,内核出货量超过60亿,其功耗、性能、面积(PPA)特性均在市场上领先。其中在2017年9月推出的 PowerVR 2NX 是市面上唯一支持16bit~4bit位宽的解决方案。

在 GTIC 2019 峰会现场,Imagination Technologies 视觉及AI部⻔⾼级总监 Andrew Grant 发表了题为《专⽤神经⽹络加速器助⼒实现端侧智能应⽤》的演讲。Andrew 主要谈及自动驾驶、智慧城市和安全三个方面的思考,并分享了 Imagination 为了推动这些领域的智能化产品所研发的一些产品及相关进展。

Andrew表示,Imagination 的 AI 芯片方案可以面向智能监控摄像头、智能汽车乃至智慧城市的边缘设备进行拓展。

比如,在智能网联汽车上,Imagination 的 PowerVR 可以支持车外环境感知、行人道路标志识别、导航、车内驾驶员感知(比如疲劳检测)等功能,当车云互联、车路协同等逐步实现,智慧交通将成为可能。

而汽车要从 ADAS 走向 L5 的自动驾驶,需求的算力将从 100Gflops 涨至 500+Tops。在 PowerVR 为终端赋能的能力上,PowerVR 的处理速度将达到移动 CPU AI运算的100倍以上。Imagination 的 PowerVR 3NX IP 的单核设计支持0.6到 10TOPS 计算性能,而多核结构意味着最多提供高达 160TOPS 的计算性能,可以满足对算力要求高的汽车领域需求。

附:Imagination Technologies 视觉及AI部门高级总监 Andrew Grant演讲实录

Andrew Grant:你好,很高兴见到你们。

首先非常高兴能够在这里与大家分享一些关于边缘神经网络加速器(NNA,Neural Network Acceleration)的思考和进展。很多的演讲嘉宾刚才讲的非常精彩,比如说如何赋能云端,我接下来讲的不仅仅是云端的工作,更多讲述一下边缘的工作,以及我们如何通过云端和边缘的加速器,助力 AIoT 设备运行。

AIoT可以赋能我们新的世界,我们想展示一些这方面的发展愿景,因为我们希望共同努力创造一个更美好的未来。Imagination 在手机领域深耕多年, 深刻意识到 性能、功耗和面积(PPA,Performance、Power、Area)的重要性,为了实现边缘低功耗,我们一直努力降低成本,让我们的客户和合作伙伴的最终速率得到很大的提升。

我认为在于IoT、手机、工业机器人、消费电子、自动驾驶、智能监控等领域,机会是无止尽的,今天,我们将会聚焦在其中的三个领域。


第一个例子是自动驾驶。现如今,智能汽车可以说是炙手可热的话题。为什么汽车设备智能化如此重要,从 ADAS、汽车自动化到雷达、多路摄像头,汽车上多种设备需要相互协作,进行物体检测、分割以及神经网络训练,然后通过推理判断人行道上的某个小孩可能往哪条路上走。因为事关生死,这些神经网络需要以最佳方式相互协作。

当我们谈论汽车时,我们会想到将车与云连接,让云端做出决策。通过这样的方式,我们可以让汽车实时做出决策,使汽车变得更加智能化。如果将云边结合,我们有可能让性能实现指数性的增长。


如果车不仅可以连接到云,还可以做出自己的数据驱动的决策,而且同时能和其他车,以及和交通信号灯、路标、路灯、灯柱等基础设施连通,汽车就会自己做出判断应该走哪一条路才能更快前往目的地。只有当汽车配备智能设施,V2V、V2X 等才能实现。

下面我们来思考一下,在电子座舱中,我们的智能技术如何助力汽车自动化?我们用 GPU 作引擎,在边缘端配备有 NNA,以支持自动驾驶的路径规划、路标识别、导航、司机疲劳检测、语音识别等各种功能。


除了显示分辨率外,我们还常常与业内人士讨论 ADAS、AVP等场景的的算力要求,以及如何达到完全的高级自动驾驶。显示分辨率、ADAS 和自动驾驶能力从最低级到最高级的发展,对 GPU 和 NNA 有了有越来越高的要求,算力的需求也从一开始的 10TOPS 涨到 500+TOPS。

因此,我们现在就应当开始规划,不仅要和半导体产业人士交流,同时还要和应用开发者讨论如何才能让他们的神经网络在边缘最好地运行。


接下来,我们来看看 AIoT 如何使能智慧城市,这些例子本身可能就是商业机遇。比如,以前机场是由人来管理,以后可能只需提供你的护照就可以上飞机了;以前零售店当中需要人来结算,以后机器可以自动结算……

未来我们的工作场景也会变得更加智能,我们将会有很多的智能机器人,他们可以做搬运、制造产品等工作,还有越来越多的办公室机器人,它们需要理解人们的需求到底,并让人们的工作环境变得更加安全。这里我想感谢 BCG 给我们这张图和这些信息。


智能摄像机城市基础设施会将是一个重要市场,许多 AI 技术将发挥关键作用,比如面部识别技术辅助行人追踪,场景识别协助监控道路车辆,物体检测发现可疑行为。

我们不妨思考一下,假设没有这些边缘设备和云端大脑,当我们要运输非常重要数据时,将发生什么事情?


一个标准摄像机会传输所有视频帧,传输的数据量非常大;一个配有运动传感器的摄像机,只需传输有价值的视频帧,但它无法去判别可疑的人或车辆;而一个内置 GPU 和 NNA 的智能摄像机,可以将原始视频数据转换成结构化数据,这意味着视频中有谁、在做什么都会被分析和记录。

这就是我们让边缘更加强大的方式。所以,边缘需要云端的帮助,同时边缘也可以帮助云端。

同样,在 AIoT 世界确保安全的未来也至关重要。这是来自一个中国智库 CAICT 的图表,他们在建立 AI 安全系统框架方面做得很好。


我们一起来思考一下信息安全。首先,算法十分关键,我们不想改变算法。而考虑到数据,除了数据的隐私性非常重要外,别人能否篡改这些数据也非常重要。我们必须要去思考到底应该怎样去保护这些信息,尤其是当我们在边缘运行这些 AI 模型的时候。

我们最不想看到的事情就是信息被盗取。我们需要在以保护隐私安全为优先原则的基础上,去研发先进的安全技术,保护这些数据、模型以及第三方的数据。

这就意味着我们要保护所有的信息。比如说,你希望自己的自动驾驶汽车中的视频流数据得到保护,不希望因为面部识别的支付技术导致你的面部信息被盗取。

我们正在做的一件事就是保障自动驾驶上的数据安全,做到这一点的一个实例就是 PowerVR 硬件虚拟化解决方案。


PowerVR 硬件虚拟化解决方案的主要优点是实现安全且经济高效的车载系统和自动驾驶功能,提供更好的服务质量、信息交换性能和灵活性。

当汽车显示和工作负载越来越多时,PowerVR 硬件虚拟化解决方案可以确保汽车的智能任务正常运行。它可以通过8个独立的虚拟机去划分处理器,每个虚拟机有不同优先级,如果其中一个机器被破坏了,或者某个应用程序已经崩溃了,我们还可以从其他的虚拟机调用 GPU 资源。


我们一起来看看我们如何为边缘赋能。在 CPU、DSP、ASIC 等各种形式的处理器中,但是我们认为的 GPU 和 NNA 的结合能带来更出色的效果,因为它在特定领域具有灵活的特性,同时能带来很好的解决方案。

我们可以看下它在实际应用中的表现。配置 16bit PowerVR 2NX NNA 可将移动 CPU 的 AI 运算提速106倍,配置 4bit PowerVR 2NX NNA 可将移动 CPU 的 AI 运算提速199倍。同时我们也支持很多主流的机器学习平台和工具,比如 TensorFlow、Caffe、百度的 PaddlePaddle、Chainer、PyTorch、Cognitive、MxNet等。


什么样边缘设备可以应用 NNA 呢?这里有一些用户案例,当然实际上用户案例非常多,不能够在一张图上显示完全。

我们也有一系列不同的IP设计去适合不同的需求。比如,0.6TOPS 算力相对比较小,适用于 AIoT 解决方案,因为它的功耗非常低;再比如 5-10TOPS 适用于到汽车应用。Imagination PowerVR 3NX IP 的单核设计支持 0.6 到 10TOPS 计算性能,而多核结构意味着最多提供高达 160 TOPS 的计算性能,可以满足智慧城市中汽车领域等对算力要求高的领域的需求。


因此现在我们正期望一起合作,去看怎样的应用可以被开发,可以利用各种强大的边缘处理,降低模型大小和功耗。我们有很多进一步开发探索的机遇。

凭借 PowerVR 2NX NNA,我们已经获取了多项殊荣,比如2018年度团队奖、2018年度最佳设计团队奖、2018年度最佳IP产品奖、国家技术奖(National Technology Awards)、BEEA奖(British Engineering Excellence Award)和世界电子成就奖(World Electronics Achievement Award)。

最后,我们希望共同搭建神经网络生态,我们相信以后我们会有一个更好的未来。非常感谢主办方邀请我来到这里,感谢各位观众,希望大家能够喜欢我的演讲。

来源:智东西

推荐阅读