AI迅猛普及,如何解决算力灵活性挑战?

作者:张国斌

人工智能应用迅速普及,从小的物联网节点到大型医疗辅助分析,都有AI的身影,各种应用算力各不相同,如何应对算力灵活性挑战?

在3月29日ASPENCORE举办的主题为《世界都在看中国》的2019 IC领袖峰会上,众多半导体专业人围绕目前的人工智能技术应用分享洞见,如士中国半导体行业协会副理事长、设计分会理事长魏少军教授就提出AI芯片应该要自我学习自我演进的方向,详见《魏少军:未来AI芯片要自我学习自我演进》,而来自Imagination中国的资深市场拓展经理郑魁则分析了嵌入式智能(EI)在向边缘化,端侧渗透过程遇到的挑战及应对方案。


他指出,在计算从云到端以及边云协同的发展中,由于端侧应用的多样化,对计算能力的可扩展性提出了更高的要求,同时,AI算法的快速迭代对AI算法的灵活性和标准化都提出了新的要求,“我们认为未来AI应用的落地,关键应该是在软件,在这些应用上面。我们提供的硬件平台需要对应用开发者更加友好,让开发者去掌控他所需的算力。因此,在做芯片设计时,需要考虑的不仅仅是性能、功耗、面积这样传统的维度,还需要考虑灵活性这种新的维度。”郑魁表示。


如何提升灵活性?他认为网络加速器是一种较好的选择,让开法者灵活配备自己的算力,实际上,Imaginagion基于统一的软件架构,于2017年就推出了基于PowerVR传统的GPU、计算机视觉和AI加速器的组合,希望通过这样的异构架构,为应用开发提供更灵活的算力。


从计算灵活性来看,CPU是最灵活的但是其效率很低,而神经网络加速器不但有高的效率更有好的灵活性。

“利用最新的神经网络加速器(NNA),可以支持最通用的网络,同时在PPA上达到最佳的平衡。通过GPU,包括通过利用可编程的标准接口,我们给开发者很大的开发空间,让他们开发自己新的网络,进行算法迭代。”


这是Imaginagion第一代NNA提升算力上的对比,跟CPU相比,其性能提升了199倍(4bit)能量效率提升了850倍!


而且NNA支持各种最新的神经网络框架


2018年12月,Imagination发布了其面向人工智能应用的最新神经网络加速器(NNA)架构PowerVR Series3NX,相比前一代的Series2NX产品,Series3NX在性能、灵活性和可扩展性等方面均实现了大幅提升。

Series3NX算力范围从0.6TOPS覆盖到160TOPS,可以支持针对汽车、手机、消费类电子设备、智能视频监控、智能家居和物联网边缘设备等一系列嵌入式AI应用。

得益于包括无损权重压缩等架构性增强,Series3NX架构的性能可在相同的芯片面积上较上一代产品提升40%,使SoC制造商可在性能效率方面提高近60%,且带宽需求降低了35%,每秒推理次数最高可提高70%!单位面积上的推理能力最高可提高40%!


灵活算力应用案例

他以汽车智能化详解了灵活算力的应用案例,他指出针对汽车的智能化可以分成三个领域:首先是智能驾舱,也就是传统的HMI,其次是ADAS,还有未来的自动驾驶。这三个领域对算力的要求各不相同。


如智能驾舱以及HMI对算力的需求更多是来自于交互以及对屏的渲染。对仪表盘可能只需要渲染1K像素的算力。当然,未来随着汽车多屏显示需求如中控屏、甚至外部需要屏,这就需要虚拟GPU技术。

随着多模交互技术的成熟,在语音、唇语以及表情手势识别上面的算力可能会跟ADAS有一部分的重叠。在ADAS领域,算力需求可能从10~100+GFLOPS,而未来在自动驾驶行业演进到L5时,至少需要500或者1000GFLOPS。

在过去十几年中,Imagination和汽车电子半导体供应商有紧密合作,例如和瑞萨就有很多深入合作,这样的经验可以帮助到很多进入这个领域的中国半导体厂家。


例如汽车仪表盘需要高的抗锯齿需求,也需要高帧率,而Imagination的GPU可以满足这类需求。此外,针对一些ADAS应用需求,NNA可以很好地支持环境感知的算法,比如车辆、行人、路障以及交通标志等。


“在一些安全交互比较频繁的场景如环视拼接以及AR导航,最能发挥GPU+NNA异构计算平台的优势。”他指出,“在智慧城市的应用中,这样的场景更广泛,而且更加碎片化,因而可以更加充分地发挥我们的GPU+NNA更灵活、可扩展的算力需求。”他指出。


不过他同时也指出,随着AI应用的普及,安全性日益重要了,Imagination最新的网络加速器不仅可以保护网络模型包括权重和中间数据,还可以保护算法公司的成果,同时可以保护内容。


据介绍,基于PowerVR的GPU虚拟技术,通过硬件可以提供8个虚拟机,完全满足了汽车智能驾舱的主控屏、仪表盘以及后座椅分屏的显示。Imagination会提供足够的安全保障,当一个屏有问题的时候不会影响其他屏的工作。

而针对AI芯片中的异构发展趋势,Imagination现有的IP组合恰好可以构成一个完美的异构计算架构。


声明:本文为原创文章,转载需注明作者、出处及原文链接,否则,本网站将保留追究其法律责任的权利。

最新文章