
作者:Eleanor Brash
根据 Grandview Research 的预测,到 2030 年全球云游戏市场将超过 200 亿美元,其中亚太地区将占据约 45% 的市场机会。然而,目前主流的 GPU 解决方案主要是为数据中心计算而设计的,并不适用于云游戏独特的经济模型。云游戏的盈利能力依赖于在保持高质量用户体验的前提下,每颗 GPU 能支持的高并发用户数量。
对于正在开发云游戏硬件的公司而言,选择合适的 GPU IP 将决定其产品能否快速成功进入市场,或因延迟而承担巨大成本。Imagination 的 E 系列采用经过验证且可扩展的架构,帮助团队以更低风险、更佳投资回报率(ROI)打造差异化产品、加速上市。
任何新硬件若想在激烈竞争中站稳脚跟,必须在性能、特性与成本上找到正确平衡。关键要求包括:可扩展并持续稳定的性能、满足多用户服务场景的能力、对目标应用的全面支持,以及在小面积(降低晶体管成本)与低功耗(降低运维成本)下实现上述能力。
Imagination 是著名的 PowerVR GPU 架构的研发公司。尽管 Imagination 的 IP 起源于移动、消费电子和汽车领域,但近年来越来越多的云计算与个人计算定制显卡厂商采用其 GPU IP。例如,芯动科技的风华系列显卡便采用了 Imagination 的 GPU 技术。
今年早些时候,Imagination 推出了全新的E 系列 GPU 内核:一款高能效的 GPU IP,集成 32 TOPS INT8 的片上 AI 加速能力,并支持每核 16 个虚拟环境。本文将介绍云游戏显卡厂商如何基于 E 系列实现产品差异化。
云游戏的持续帧率表现
用于桌面市场的 Imagination GPU 每核可实现 72 GPixel/s 的性能,并可通过多核技术进一步扩展(稍后会详细介绍)。持续性能得益于一系列最大化 GPU 利用率并降低热降频的架构基础设计:
- 高效的 SIMT 执行模型:多线程执行相同指令提升吞吐量,降低控制开销;同时共享指令获取与解码阶段,提高资源利用率。Imagination 最新 GPU 在每个着色集群中可支持 128 条并行线程。
- 先进的调度能力:细粒度调度机制确保着色器核心保持忙碌,避免停顿,即使在游戏负载变化时也能维持高利用率。
- 强调本地存储访问:将中间计算结果存储在快速本地存储中,可减少外部 DRAM 往返,从而在复杂视觉效果中提供更高性能。
- 基于 Tile 的延迟渲染(TBDR)技术:将画面分成更小的 tile 并在芯片内部处理,可最大程度降低外部内存带宽使用;减少 overdraw 可在高几何复杂度场景中提升效率。(欲了解 TBDR 在桌面与数据中心市场的适用性,请参考相关博客文章。)
- 先进压缩技术:减少系统中数据传输量可大幅降低功耗,并提升帧率持续性。
这些特性相互配合,为云游戏用户提供稳定、无抖动(jitter-free)的体验。它们还与全新的高能效 E 系列 Burst Processor(爆发处理器)协同工作,大幅提升性能并降低功耗,使图形管线始终保持高效运行。
爆发处理器(Burst Processor)改变了计算逻辑单元处理任务的方式。它不再每个周期切换任务,而是将操作以不可分割的单元提交至计算逻辑单元,从而避免任务中断,并减少对寄存器存储器低效读写操作的次数。该方案还允许在ALU内部存储中间数据,进一步减少寄存器存储器的读写操作量。通过降低对寄存器存储器的整体需求,GPU能有效提升利用率并持续更长时间保持高性能——这正是云游戏需要持久性能表现的理想方案。
为计算密集型特效提供额外性能
无论是3A大作还是休闲游戏,如今都越来越多地包含计算密集型细节。诸如模糊和景深等流行特效需要GPU执行复杂的数据采样和数学运算。为高效处理此类特效,GPU最初演进出了通用计算着色器,而E系列在此基础上更进一步。
E系列的GPU内置AI加速功能,在执行低精度运算(如FP16或INT8)时,速度比D系列同类产品快4倍。在1GHz频率下,单颗E系列GPU可提供:
- 传统着色器工作负载:2 FP32 TFLOPS
- AI加速渲染:16 FP16 TFLOPS
- AI工作负载与渲染:32 TOPS INT8

最核心的设计在于:E系列GPU将矩阵乘法加速功能集成于计算逻辑单元(ALU)内部。相较于在远离着色集群的位置增设独立加速单元,这种集成式设计显著减少数据移动,从而在降低带宽消耗和功耗的同时提升性能。开发者可通过主流GPU API和行业标准扩展轻松调用这些额外性能。
基于E系列GPU的显卡由此能高效运用AI技术加速渲染流程的关键环节。云游戏公司可借助超级分辨率等主流解决方案,更快更高效地生成高分辨率帧,从而实现单张GPU承载更多玩家的目标。
无缝扩展
我们的GPU可通过提升时钟频率实现更高性能;更重要的是——这对云游戏显卡设计师至关重要——它们能构建成多核解决方案。
Imagination创新的多核架构无需直接依赖中央处理单元连接,即可灵活实例化任意数量的GPU核心。这有别于传统GPU可扩展性方案——后者受限于所有着色器核心必须连接至单一集中化模块,该模块包含集中式内存数据路径、任务管理器及几何切片引擎。传统方案常遭遇拥塞与布局灵活性问题。
我们的多核扩展流程采用去中心化松耦合架构,既为芯片设计师提供布局与设计自由度,又实现带宽效率最大化。精心设计确保图形工作负载能在不同核心间无缝扩展,最大限度减少瓶颈。例如,不同核心上的E系列分块加速器可同时处理非依赖性几何工作负载,使GPU能快速渲染复杂的AAA级游戏。
欲了解Imagination GPU高效扩展的更多原理,请参阅此博客。
对于云游戏显卡而言,这首先意味着E系列GPU可扩展至服务商期望的性能水平。Imagination的多核解决方案还具备额外优势:每个核心作为独立GPU,可动态重配置为协同工作(实现单用户性能最大化)或独立运行(实现多租户灵活性最大化)。


通过灵活的多用户能力,使收入最大化
云服务提供商通常会设置不同的价格等级,以最大化其收入来源。因此,不同的用户需要不同级别的图形性能,而云游戏 GPU 则必须具备高度灵活的工作负载分配能力来满足这些差异化需求。
为此,我们的 GPU IP 集成了一个智能固件处理器,能够直接处理 GPU 事件。它负责管理与其他 GPU 核心及第三方处理器之间的交互、对渲染任务进行优先级排序,以及处理错误与调试。这与许多依赖 CPU 和驱动栈进行调度的 GPU IP 供应商不同,后者无法提供同等水平的灵活性。
这个智能固件处理器使 E 系列 GPU 能够支持多种云游戏场景:从在单颗 GPU 核心上运行多个容器,到将多个核心组合并动态协调跨核心的工作负载,以提供最大化的单用户体验。
虚拟化是云环境中另一项关键的多任务技术。它可以用于保障高端用户的安全与隐私,或支持远程桌面等使用场景。对于服务提供商来说,在一颗 GPU 上承载多个虚拟机(VM)也有助于实现故障隔离,避免其中一个虚拟机的崩溃影响到其他玩家。
E 系列 GPU 提供先进的基于硬件的虚拟化方案(HyperLane),每核可运行多达 16 个不同的操作系统,并实现完整的内存隔离、无干扰、服务质量(QoS)保障和任务优先级控制。由于 HyperLane 是硬件级方案,其性能更高、软件复杂度更低,相比其他软件虚拟化方式具有明显优势。
想了解更多关于 Imagination 独特虚拟化技术的信息,请参阅相关白皮书。
以 ROI 为导向的设计
Imagination 的产品可以扩展至云级性能,但我们的 GPU 架构即便在高性能条件下也保持其著名的面积效率和功耗效率。我们坚持“以更少实现更多”的理念,这在云市场中尤为关键。对面积敏感的架构可以降低定制芯片的开发成本,提高新方案的竞争力;低功耗产品则有助于服务商控制能源成本。
E 系列进一步提升了 Imagination 的效率水平:
- 提供超过 D 系列 3 倍的计算性能密度
- 在采用神经核(Neural Cores)和爆发处理器(Burst Processors) 后功耗效率提升最高可达 35%
- 成熟的软件生态体系
云游戏平台可以放心依赖 Imagination GPU 提供强大的软件支持,以运行当今最具挑战性的游戏大作。随着云端 Android 休闲游戏在市场上占据主导,Imagination 在 Android 生态中的深厚积累——基于多年来在移动领域的领先经验——使其成为值得信赖的选择。
我们的 GPU 完整支持 Khronos Group 的主流移动图形 API:
- Vulkan™
- OpenGL® ES
确保从设备到云端顺畅、可扩展的游戏体验。
在 PC 游戏方面,我们最新一代 GPU 增加了对DirectX®的硬件级支持,而 E 系列进一步扩展至支持DirectX 12,并提供高性能 PC 游戏的参考驱动。对于较老的游戏,E 系列也通过 ZINK 框架支持OpenGL 4.6。
结语
随着云游戏的快速增长,特别是在中国等关键市场,硬件设计者需要一种在性能、可扩展性与能效之间取得平衡、没有妥协的 GPU IP。Imagination 的 E 系列 GPU 架构提供了极具吸引力的解决方案——将强大的图形渲染、AI 加速、多用户能力与功耗优化设计融为一体。
无论您面向的是大众休闲云游戏市场,还是高端 AAA 游戏体验,E 系列都具备足够的灵活性和强大能力,帮助您的产品实现差异化,并加速上市进程。凭借在多个行业中的成熟部署与对主流 API 的广泛支持,E 系列是下一代云游戏硬件的不二之选。
如需了解有关 E 系列的更多信息,请阅读预览白皮书,或联系 Imagination 团队安排评估。
英文链接:https://blog.imaginationtech.com/building-custom-graphics-cards-for-cloud-gaming
声明:本文为原创文章,转载需注明作者、出处及原文链接。





