Imagination荣获“年度产业贡献IP公司奖——边缘 AI 大规模落地：实现高效推理的架构选择

demi 在周三, 04/01/2026 - 19:59 提交

近日，在Aspencore主办的IIC 国际集成电路展览会期间，Imagination Technologies荣获“2026中国IC设计成就奖——年度产业贡献IP公司奖”。今年是AspenCore连续第24年举办IC设计调查及奖项评选，中国IC设计成就奖是中国电子业界最具影响力的技术奖项之一。

同期，Imagination受邀参加大会“边缘AI 与算力芯片”论坛，并围绕边缘 AI架构发展趋势发表主题演讲。Imagination产品总监郑魁在演讲中提出，随着AI从云端走向终端，行业竞争正从“算力规模”转向“部署效率”。

Edge AI加速落地，AI进入“真实世界”

过去几年，人工智能的快速发展主要依赖云端大模型训练能力的提升。然而，随着应用不断向汽车、机器人、AI PC以及各类终端设备延伸，AI正在从“云端能力”转变为“产品内生能力”。

在这一过程中，不同应用场景对计算架构提出了截然不同的要求。例如，IoT设备和移动终端对功耗和面积高度敏感，而AI PC则更强调通用计算能力和软件生态；汽车和机器人则需要处理更复杂的环境感知任务，并具备更高的实时性和可靠性要求。正如演讲中所提到的，AI是一个覆盖极广的应用领域，很难用单一架构满足所有需求。

核心挑战：AI不仅要能运行，更要“跑得久”

与云端相比，Edge AI面临更加严苛的现实约束。系统不仅需要在有限的功耗和散热条件下运行，还要应对内存资源不足、带宽受限以及软件生态复杂等问题。同时，很多边缘设备还需要长期稳定运行，这对系统可靠性提出了更高要求。

因此，Edge AI的关键问题已经发生转变：AI模型不仅要“能跑”，更要在真实环境中“跑得稳、跑得久”。

从架构设计角度来看，这一挑战可以归结为四个核心要素的平衡，即计算效率、内存体系、功耗控制以及软件生态能力。这些因素共同决定了AI系统在实际应用中的表现。

从TOPS到效率：评价体系正在重构

长期以来，TOPS（每秒万亿次运算）被视为衡量AI芯片性能的重要指标，但在Edge AI场景中，这一指标的局限性正在显现。在实际系统中，性能瓶颈往往首先出现在内存带宽而非算力本身，同时数据搬运所带来的能耗也远高于计算过程。

这意味着，单纯提升峰值算力并不能直接提升系统性能，真正重要的是在现实约束条件下的“有效算力”。换句话说，行业正在从“算力竞赛”走向“效率竞赛”。

三层效率：理解Edge AI的关键路径

围绕Edge AI的实际需求，Imagination在演讲中提出了一个三层效率框架，从模型、系统以及部署三个层面重新定义架构优化方向。

在模型层面，AI正在朝着更小型化、多模态化和可部署化发展。量化与压缩技术被广泛用于降低模型对计算和存储资源的需求，但这些技术的有效落地依赖于底层硬件对不同数据格式的支持能力，因此模型与硬件之间需要更加紧密的协同设计。

在系统层面，内存问题成为制约性能的关键因素。随着AI工作负载的并行度不断提升，数据搬运带来的开销迅速放大，而在边缘侧，“内存永远不够用”几乎成为行业共识。因此，如何提升数据局部性、优化内存访问路径、减少不必要的数据移动，成为架构设计的核心方向。

在部署层面，Edge AI系统通常需要同时处理AI推理、图形渲染以及各类信号处理任务，不同任务之间还存在优先级和安全等级差异。这使得系统必须具备更强的调度能力和资源隔离能力，同时支持长期演进的软件生态，从而保证系统在复杂场景中的稳定运行。

GPU架构的新机会：从图形走向通用计算

在这一背景下，GPU正在被重新审视其在Edge AI中的角色。GPU最初由图形和游戏需求驱动，但其高并发计算能力、灵活的调度机制以及良好的可扩展性，使其天然适合处理多任务并行的AI工作负载。

演讲中郑魁指出，GPU可以通过统一计算架构承载更多类型的工作负载，从而减少不同处理单元之间的数据搬运，提高整体系统效率。GPU具备大规模寄存器和本地共享内存，可以在一定程度上缓解内存带宽压力，并通过动态调度机制提升资源利用率。

此外，GPU还具备良好的扩展能力，可以从单核扩展到多核甚至多芯片系统，以适应不同规模的应用需求。这种灵活性，使其在多样化的Edge AI场景中具备独特优势。

架构演进方向：围绕效率进行系统优化

在最新一代GPU架构中，Imagination围绕效率进行了多方面优化，引入全新爆发式处理器（Burst Processors）技术，在 AI 推理、游戏和用户界面等工作负载下平均功耗效率大幅提升。该技术通过缩短流水线深度、减少数据在GPU内部的移动实现能效提升；多核版本还可以利用额外的核心来提升性能或增强灵活性。E系列GPU在多任务处理能力上实现了显著增强，将具备硬件加速且零开销的虚拟机数量从8个翻倍至16个，提供先进QoS支持，并通过优先级调度机制实现多任务并发执行。

Edge AI进入“效率时代”

随着Edge AI进入规模化落地阶段，行业竞争逻辑正在发生深刻变化。未来的关键不再是单纯提升算力，而是在有限资源条件下实现更高的效率与更稳定的部署能力。

从模型到系统再到部署，全栈效率优化正在成为核心竞争力。可以预见，在这一趋势下，能够在性能、功耗、内存以及软件之间实现平衡的架构，将在下一阶段的Edge AI竞争中占据优势。

元宇宙算力新基建如何构建，这83位大佬这样看	GPU领域再迎重大创新——全新Imagination DXTP GPU将功效提升20%	Imagination：边缘AI是半导体市场重要增长引擎，E-Series 架构恰逢其时
“行业领袖看2024半导体产业”之Imagination：2024三个热点激发半导体需求	Imagination与Telechips通过硬件虚拟化提升汽车显示器的多样性	光线追踪全球创意赛进行时万元大奖等你拿 \| IMG Originals

Imagination荣获“年度产业贡献IP公司奖——边缘 AI 大规模落地：实现高效推理的架构选择

最新文章

最新文章