ChatGPT的火热,持续催生着包括人工智能、大数据等应用的火热。在不断兴起的新应用的背后,需要更复杂的计算方式,而异构计算概念也因此诞生。将不同的计算任务进行分解,利用包括GPU、CPU、NPU等不同的架构及指令集处理不同的计算需求,是实现高效计算的关键所在。
“后摩尔时代,当算力和功耗不能再遵循摩尔定律线性变化的时候,异构架构成为芯片计算架构的发展方向。”Imagination中国区总经理刘国军日前在出席由阿里巴巴平头哥举办的首届玄铁RISC-V生态大会上表示。
在刘国军看来,Imagination可以提供的包括 GPU + CPU + NNA(神经网络加速器)在内的各项产品,十分适合异构计算不同场景的需求。
RISC-V的确给Imagination的异构计算战略带来了重要补充。2017年,Imagination将MIPS部门出售,而到了2021年底,公司正式宣布重新进入CPU IP市场,推出Catapult系列处理器,并已发布。
除此之外,2022年Imagination又成为了RISC-V基金会高级会员。在RISC-V基金会中,Imagination可以为不断发展的RISC-V生态提供支持,除此之外,也可以为RISC-V产品提供GPU,甚至是NNA,从而不断扩大Imagination的生态系统。
一个典型的成功案例,是平头哥去年推出的曳影1520,采用了Imagination的GPU和NNA,结合最高主频可达2.5GHz的4核玄铁C910内核 ,实现了4K视频处理能力,同时含有丰富的异构计算和高速IO资源,以及4TOPS@int8 AI 算力。
在Imagination为RISC-V,为异构计算带来新活力的同时,RISC-V也正在为Imagination注入新活力。
如今,随着异构计算的需求不断提升,Imagination都做了哪些准备?刘国军给出了一些他的理解。
异构计算需要广泛的IP产品组合
刘国军表示,Imagination的IP组合基本都支持多核架构,从而可以覆盖从低功耗小算力到并行大算力,从入门到高阶的不同需求,并且所有产品组合都会推出相应的车规级认证。
具体到CPU而言,正如上所述,Imagination正在通过RISC-V,重塑自己在CPU领域的地位。同时也正在帮助RISC-V的生态伙伴使用更多的先进产品。
比如在GPU方面,公司已连续四年以每年一代的速度推出GPU IP,分别为A/B/C/D系列GPU。其中B系列GPU在包括汽车ADAS、国产显卡芯片等众多领域落地。而C系列GPU,则是业界首款在手机平台硬件光线追踪的产品。
公司2021年推出的IMG DXT系列GPU,在2022年又得到了进一步的优化与提升,提供了50%的性能增加和计算能力增加,标配达到了2.25T浮点运算能力,72GB像素填充能力,9TB的AI推理能力。同时把D4光线追踪技术进行可配置化、可扩展化,搭配光线追踪一起使用。“开创性的光追GPU将为所有移动设备用户带来最先进的图形技术,包括移动、汽车、桌面数据中心等广泛的市场带来全新体验。”刘国军表示。
在AI加速器方面,Imagination的单核NNA可以覆盖1.5Tops到12.5Tops的算力,并且可以通过多核架构,迅速扩展至上百Tops。目前Imagination的NNA已成功商用在包括视觉处理、语音识别、自动驾驶等领域。
而正如曳影1520所呈现的,Imagination的GPU和NNA的IP组合,为平头哥的产品带来了无限的AI及视觉可能。
刘国军表示,基于Imagination的3种核心计算IP技术的组合,并结合先进的互联和存储技术,Imagination可以支持客户构建灵活的多核异构架构满足不同的需求。
比如在汽车智能座舱或ADAS场景中,GPU+NNA的组合可以提供强大算力,并支持计算和显示渲染的融合。在自动驾驶领域,GPU+CPU+AI所构成的大型异构系统,可以满足从感知,定位到路径规划的各个阶段的大规模高并发低延迟的计算要求,同时也可以用于数据中心计算和智能NIC等场景中。NNA+CPU的组合可满足广泛的智能化场景,从AIOT到消费电子,从智慧工业到智慧城市的方方面面。而对于云游戏的远程渲染,可以应用GPU+CPU的异构计算。
总而言之,丰富的IP产品组合加持下,Imagination可以一站式为客户提供越来越全面的处理器IP解决方案。
不断扩充的生态圈
RISC-V之所以迅速成长,一个最重要的共识就是开源,Imagination也正在以开源的姿态,打造着各类生态。
刘国军表示,自2015年加入Imagination之后,公司中国员工已经由不到10名增长到60余名,透过本地研发和服务,使Imagination的中国客户群实现了快速成长。
在GPU上,Imagination一方面提供了标准的GPU软件栈,另外也提供了全面的开源软件,包括firmware、kernel space driver以及user space driver等,以更好地支持客户软件定制化的需求。“我们把GPU软件栈定制化的灵活性充分给到了客户,客户可以根据需求选择闭源或者开源。”目前在Chromebook上,Imagination已经发布了基于开源Mesa Vulkan Driver的Demo。
在AI方面,Imagination同样是积极扩大生态朋友圈,共建开放的AI生态,通过提供高效灵活的NC-SDK软件协议栈,实现软件+IP的软硬件紧耦合方案。2022年, Imagination和百度飞桨共同建立了model zoo,在Imagination的IP上适配并深度优化产业界有代表性的网络模型,并且已经在github上发布。
探索芯片未来的四大竞争力
刘国军表示,未来计算芯片的竞争力将主要体现在以下四个方面:可扩展性和可重用性,可编程性,高效性,灵活性。
首先,在可扩展性和可重用性方面,需要支持基于核心的计算架构,通过在多个维度上进行扩展,满足匹配工作负载的算力需求。
在可编程方面,支持行业标准的框架、语言和API的前提下,对芯片计算架构进行高度的优化。同时,应具备完善的可视化工具、调试工具和建模能力。赋能OEM进行系统级的开发。
在高效性方面,需要先进的稀疏和编译器优化手段,降低计算开销。并可在高度集成的计算IP之中,细粒度的对任务进行分配和调度。
在灵活性上,芯片可通过对处理器IP组合、连接和编程,以支持动态结构、稀疏性和创建执行单元,从而构建SoC。并且应该采用先进的互联和存储技术,从而减少系统带宽并降低功耗。
实际上,Imagination公司的产品发展轨迹,正是沿着这四个方向进展中。而RISC-V生态系统也正因为有更多像Imagination这样善于洞悉产业需求的商业公司参与,才在异构计算需求越来越强的当下,变得日益健壮。
引用RISC-V首席执行官Calista最近所说的一句话,这(RISC-V正在加速发展)是一个“必然的趋势”。