Imagination荣获“年度产业贡献IP公司奖——边缘 AI 大规模落地:实现高效推理的架构选择

近日,在Aspencore主办的IIC 国际集成电路展览会期间,Imagination Technologies荣获“2026中国IC设计成就奖——年度产业贡献IP公司奖”。今年是AspenCore连续第24年举办IC设计调查及奖项评选,中国IC设计成就奖是中国电子业界最具影响力的技术奖项之一。

Imagination Technologies荣获“2026中国IC设计成就奖——年度产业贡献IP公司奖”

同期,Imagination受邀参加大会“边缘AI 与算力芯片”论坛,并围绕边缘 AI架构发展趋势发表主题演讲。Imagination产品总监郑魁在演讲中提出,随着AI从云端走向终端,行业竞争正从“算力规模”转向“部署效率”。


Edge AI加速落地,AI进入“真实世界”

过去几年,人工智能的快速发展主要依赖云端大模型训练能力的提升。然而,随着应用不断向汽车、机器人、AI PC以及各类终端设备延伸,AI正在从“云端能力”转变为“产品内生能力”。

在这一过程中,不同应用场景对计算架构提出了截然不同的要求。例如,IoT设备和移动终端对功耗和面积高度敏感,而AI PC则更强调通用计算能力和软件生态;汽车和机器人则需要处理更复杂的环境感知任务,并具备更高的实时性和可靠性要求。正如演讲中所提到的,AI是一个覆盖极广的应用领域,很难用单一架构满足所有需求。


核心挑战:AI不仅要能运行,更要“跑得久”

与云端相比,Edge AI面临更加严苛的现实约束。系统不仅需要在有限的功耗和散热条件下运行,还要应对内存资源不足、带宽受限以及软件生态复杂等问题。同时,很多边缘设备还需要长期稳定运行,这对系统可靠性提出了更高要求。

因此,Edge AI的关键问题已经发生转变:AI模型不仅要“能跑”,更要在真实环境中“跑得稳、跑得久”。

从架构设计角度来看,这一挑战可以归结为四个核心要素的平衡,即计算效率、内存体系、功耗控制以及软件生态能力。这些因素共同决定了AI系统在实际应用中的表现。


从TOPS到效率:评价体系正在重构

长期以来,TOPS(每秒万亿次运算)被视为衡量AI芯片性能的重要指标,但在Edge AI场景中,这一指标的局限性正在显现。在实际系统中,性能瓶颈往往首先出现在内存带宽而非算力本身,同时数据搬运所带来的能耗也远高于计算过程。

这意味着,单纯提升峰值算力并不能直接提升系统性能,真正重要的是在现实约束条件下的“有效算力”。换句话说,行业正在从“算力竞赛”走向“效率竞赛”。


三层效率:理解Edge AI的关键路径

围绕Edge AI的实际需求,Imagination在演讲中提出了一个三层效率框架,从模型、系统以及部署三个层面重新定义架构优化方向。

在模型层面,AI正在朝着更小型化、多模态化和可部署化发展。量化与压缩技术被广泛用于降低模型对计算和存储资源的需求,但这些技术的有效落地依赖于底层硬件对不同数据格式的支持能力,因此模型与硬件之间需要更加紧密的协同设计。

在系统层面,内存问题成为制约性能的关键因素。随着AI工作负载的并行度不断提升,数据搬运带来的开销迅速放大,而在边缘侧,“内存永远不够用”几乎成为行业共识。因此,如何提升数据局部性、优化内存访问路径、减少不必要的数据移动,成为架构设计的核心方向。

在部署层面,Edge AI系统通常需要同时处理AI推理、图形渲染以及各类信号处理任务,不同任务之间还存在优先级和安全等级差异。这使得系统必须具备更强的调度能力和资源隔离能力,同时支持长期演进的软件生态,从而保证系统在复杂场景中的稳定运行。


GPU架构的新机会:从图形走向通用计算

在这一背景下,GPU正在被重新审视其在Edge AI中的角色。GPU最初由图形和游戏需求驱动,但其高并发计算能力、灵活的调度机制以及良好的可扩展性,使其天然适合处理多任务并行的AI工作负载。

演讲中郑魁指出,GPU可以通过统一计算架构承载更多类型的工作负载,从而减少不同处理单元之间的数据搬运,提高整体系统效率。GPU具备大规模寄存器和本地共享内存,可以在一定程度上缓解内存带宽压力,并通过动态调度机制提升资源利用率。

此外,GPU还具备良好的扩展能力,可以从单核扩展到多核甚至多芯片系统,以适应不同规模的应用需求。这种灵活性,使其在多样化的Edge AI场景中具备独特优势。


架构演进方向:围绕效率进行系统优化

在最新一代GPU架构中,Imagination围绕效率进行了多方面优化,引入全新爆发式处理器(Burst Processors)技术,在 AI 推理、游戏和用户界面等工作负载下平均功耗效率大幅提升。该技术通过缩短流水线深度、减少数据在GPU内部的移动实现能效提升;多核版本还可以利用额外的核心来提升性能或增强灵活性。E系列GPU在多任务处理能力上实现了显著增强,将具备硬件加速且零开销的虚拟机数量从8个翻倍至16个,提供先进QoS支持,并通过优先级调度机制实现多任务并发执行。


Edge AI进入“效率时代”

随着Edge AI进入规模化落地阶段,行业竞争逻辑正在发生深刻变化。未来的关键不再是单纯提升算力,而是在有限资源条件下实现更高的效率与更稳定的部署能力。

从模型到系统再到部署,全栈效率优化正在成为核心竞争力。可以预见,在这一趋势下,能够在性能、功耗、内存以及软件之间实现平衡的架构,将在下一阶段的Edge AI竞争中占据优势。


最新文章