2021年9月16日,展锐举办“UP · 2021展锐线上生态峰会”,邀请来自行业组织、科研机构、领先企业的生态伙伴,共话数字生态的发展与创新。
Imagination作为展锐的长期合作伙伴参加了本次峰会,公司中国区市场总监郑魁在“5G+AI时代芯片设计的技术发展”技术论坛上发表题为“先进IP架构助力5G+AI赋能数字化未来”的精彩演讲。
如今,AIoT(人工智能物联网)技术已经渗透到很多行业应用中,智能化场景越来越丰富,从智慧城市到智能家居再到智慧出行。那么,这些智能化应用对芯片提出了哪些具体要求呢?
对此,郑魁认为主要有三点要求:“第一,非常强大的计算能力,无论计算或渲染都需要强大的计算能力作为支撑;第二,灵活的可扩展架构,未来的软件发展非常快,应用创新也非常快,只有具备高灵活性的可扩展架构才可以支持未来的发展;第三,低延迟,在视频监控、自动驾驶等诸多行业应用中对延迟的要求越来越高,因为低延迟意味着更安全。”
这些恰恰是Imagination的优势所在。作为一家拥有30多年历史的半导体IP公司,Imagination的图形处理器(GPU)和神经网络加速器(NNA)两大产品线的融合,可以在算力、架构以及诸如延迟等性能方面,提供行业领先的解决方案。
“Imagination创新的AI协同(AI Synergy)技术可以充分融合并发挥GPU和NNA的能力。通过GPU虚拟化技术,可以虚拟出8个GPU,分别执行不同的渲染和计算任务;而NNA则可以加速当前的大部分神经网络,并实现最佳的性能功耗比。”郑魁介绍道。GPU和NNA组合形成的异构计算平台,可以高效、灵活地支持各种显示和计算融合的场景。
基于GPU+NNA架构,Imagination已在不同市场上实现了广泛的产品落地。在AIoT市场,基于1 TOPS算力的NNA,可以满足对人和物的识别,以及对场景中烟和火的识别;在DTV/STB市场,GPU和NNA搭配使用,在播放4K高清晰度媒体文件的同时,可以针对媒体场景中的人和物进行识别;在手机市场,可以针对美颜、语音等智能化交互体验进行充分的优化;在汽车市场,无论在娱乐域还是主动安全域,GPU+NNA异构平台正在发挥越来越大的作用,可以满足从智能驾舱到L4/L5级自动驾驶的广阔算力需求。
郑魁在演讲中还重点介绍了NNA产品。到目前为止,Imagination共推出了2NX、3NX、4NX三代NNA产品。其中,3NX单核可以覆盖从1 TOPS到10 TOPS的算力区间,目前已经在AIoT等市场上实现了广泛应用。而4NX则进一步实现了多核架构,极大地提高了扩展能力,可以提供高达500 TOPS的算力。
4NX可以由不同数量的单核构成一个集群,由8个单核构成的集群可以提供100 TOPS的算力,在5nm工艺节点上,可以实现每瓦30 TOPS的算力能耗比,轻松满足ADAS的需求。而为了满足L4甚至更高级别的自动驾驶需求,Imagination还开发了多集群架构,从而可以提供200、400甚至500 TOPS的算力。
对算力的优化和使用是一个系统性的方案,除了IP或芯片层面,Imagination在软件栈上也有很多优化方案,以满足不同应用的落地。
例如,在多任务调度方面,可以通过编程将不同任务放在不同的核上执行,甚至可以将一个任务的层拆分到多个核上同时执行,这样可以极大优化多任务的计算,降低整个系统的开销,尤其是系统的延迟。
又如,为了解决内存墙的问题,Imagination推出了自己的Tensor Tiling(张量分块)技术,通过该技术可以极大降低对DDR访问带宽的使用,有效减少90%的带宽需求。