本文作者:付斌
来源:半导体行业观察
曾经,我们只能在PC或主机端体验到画面细腻精致和流畅的3A游戏,而现在,手机厂商大力投入自研芯片,将光线追踪等技术做到手机里,移动GPU处理性能也越来越强劲。
ABI在2022年的调查显示,手机游戏用户会从26亿增长到2030年的39亿,至2026年85%的游戏玩家首选在手机上玩游戏。显然,光线追踪成为手机征服玩家的利器。
纵观当前市场上的光线追踪方案,针对PC端,英伟达最新发布的Ada Lovelace架构,在光追方面做了不少重大更新;英特尔Arc Alchemist GPU 无论是光追功能还是游戏性能,都给足了玩家期待。
在移动端,三星Exynos 2200 属于较早落地的支持光追的手机,其采用了AMD RDNA 2 架构;高通全新 Adreno GPU 加入了专门的移动光线追踪加速单元;同时以 Imagination、 ARM 为代表的芯片 IP 供应商,陆续推出支持移动光追的 GPU 架构。其中 Imagination 的PowerVR Photon 架构被称为业界首个移动端硬件级光追架构,采用Photon架构的IMG CXT GPU成为了首个在移动端实现桌面级视觉效果的GPU IP。其后一年内ARM 也推出了其首款支持光追硬件加速的GPU IP。
目前来看,可真正落地的移动端光追方案还在初期,但不管是 SoC 芯片商还是手机厂商,包括游戏开发商,都对在移动端上实现光线追踪跃跃欲试。就在今年1月初Imagination 宣布推出IMG DXT 系列 GPU,这款开创性的光追 GPU 将加速该技术的落地和普及,并应对不断增速的手机游戏市场。
▎应对手机游戏的画质革命
现如今,手机游戏有三个趋势值得重点关注:
- 其一,玩家对游戏沉浸感的体验要求越来越高;
- 其二,对手机性能要求越来越高,任何用户都不可能喜欢在只有5~10帧的场景下游玩游戏;
- 其三,手机功耗引发的电量焦虑需要引起重视,一直在充电或者快速掉电对手机玩家来说都是不可接受的。
Imagination DXT系列GPU为满足手机游戏需求,在设计之初便关注到了上述手机游戏趋势。为了加快光线追踪在移动端的普及,推出了更具设计扩展性的GPU。在IMG DXT图形处理单元中引入了基于PowerVR Photon架构的光线加速集群(RAC)的演变。DXT的重点是通过引入片段着色率(FSR)功能和增强的后处理技术来提高效率,同时改变布局,为光线追踪提供可扩展性和灵活性。
DXT系列GPU的三款产品面向三种机型:主流机更在意单位面积性能,高端机在于更高的性能实现,旗舰机追求更高性能和手机整体表现,Imagination提供不同的算力, 像素填充力和光线追踪的可选RAC (Ray Acceleration Cluster)。
光线追踪可以说是Imagination GPU IP的招牌技术之一,该技术可以让3D游戏场景中的光照更加贴近真实生活中的折射和反射。但实现这样的光线折射和漫反射却需要很大的资源开销,早期甚至高端的服务器也需要一定时间来“烘焙”这些画面,而现在,对桌面级GPU渲染实时光追已不再是难题,Imagination推出的高效可扩展光追技术使得主流手机也都能使用此项技术。
▎光线追踪等级
并非所有形式的光线追踪支持都是相同的。现实情况是,任何具有计算能力的GPU都可以执行光线追踪,但它们之间的区别在于可以执行光线追踪的效率和可以达到的性能水平。因此,Imagination引入了光线追踪等级系统(RTLS)的概念,以突出各种等级光线追踪的效率。
需要强调的是,Imagination提供的是第4级别的硬件级光线追踪,且是可扩展的高级光线追踪技术。
在移动端实现光线追踪并非易事,因为移动端的能耗和运算带宽本身受到的限制就比较大,目前市面上绝对大多数光线追踪都是L1、L2级别的。L1级别的光线追踪是纯软件光线追踪,需要消耗大量的CPU资源,L2级别的解决方案中具有判断光线和物体边框及三角形是否相交的检测器,但所有其它RT处理仍保留在着色器代码中,也就还需要额外的GPU计算资源,而到了 L3级以上都需要具有硬件BVH的分类、相关性的回溯处理等专门的光线处理模块。Imagination的CXT和DXT系列提供的都是L4级别的光线追踪。
当然,需要强调的是游戏市场上存在一定误区,很多人认为只要是使用硬件光线追踪,帧率一定会下降,游戏运行一定会更慢,其实这是不正确的一种想法。因为现在游戏中或多或少一定都是用了传统的技术进行光影的渲染,哪怕不加任何新的光线追踪效果,只是把原来的光影效果从传统的渲染方式替换成实时光线追踪,让硬件承担这部分的工作,从而使整体的运算结果更快,让帧率也更高。
▎集大成之作的性能飞跃
IMG DXT系列产品拥有6个关键技术值得关注:
- Vulkan® 片段着色率(FSR):IMG DXT为 Vulkan 提供了片段着色率 (FSR-Fragment Shading Rate) 支持,为开发者带来了性能上的裕量。FSR在尽可能不影响视觉质量的前提下,减少了处理的片段数量,并大幅提高图形性能。光线追踪技术能很好地和FSR技术结合在一起,配合可扩展RAC,可用更小的RAC实现这个场景下的游戏光追效果,为用户带来更好的沉浸式体验;
- 2D 双速率纹理处理(Dual-Rate Texturing):在其纹理处理单元 (TPU) 中拥有创新的专利特殊模式,可为后处理效果创建“快速通道”。在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。
- 提高纹理和计算性能:采用全新的着色器处理单元 (SPU) 设计。DXT GPU 每个 SPU 的高端计算和纹理 (ALU/TPU) 性能提高 50% 以上,这要归功于全新的三重通用着色器集群(SPU)设计(3个ALU/TPU 单元),而以前的架构只侧重于双USC设计(2个ALU/TPU单元)。
- 流水线数据主控器:改进流水线后,当前场景正在渲染时,无需任何间隙和等待,数据主控器现在就可以开始为下一个 3D 场景创建工作负载。在提高性能和能效的同时,实现工作负载生成的流水线。
- ALU 寄存器组性能翻番:统一存储的改进提升了 ALU 寄存器组的吞吐量。而且,IMG DXT GPU的ALU寄存器组数量是上一代的两倍。
- RISC-V固件处理器:长期以来,Imagination的GPU一直得益于集成的固件处理器,实现了许多独特的功能,如虚拟化,系统安全隔离等。DXT升级采用了在汽车系列中经过芯片级验证的RISC-V CPU,同时性能提升了40%。因为固件处理器是绘图任务调度的核心,它的升级给DXT带来了全方位的性能改进。
▎Imagination的深谋远虑
与移动端GPU相比,云游戏正在兴起,那么移动端的GPU和放在数据中心中的GPU到底会是什么关系?
Imagination 公司技术产品管理高级总监Stephen Barton认为,Imagination其实也有相应的产品,比如B系列的多核系列产品,具有虚拟化的技术,可以八核对应8个以上的玩家,都享受到服务器端的运算能力,这样可以让大家在自己的设备玩到以服务器的运行性能跑出来的游戏画面表现和品质。
设备端GPU的使用方式与本地跑游戏不同,会是用一种流式传输,更像是放视频的方式,在这种情况下有一个问题在于大家不想去用非常高分辨率的原始画质传输到手持设备上,无论是带宽、流量还是流量费用都会成为一个比较大的负担,会影响到云游戏的发展。云游戏中本地设备上的GPU可能有些新的应用场景,数据中心服务器把一个较低分辨率的游戏内容传到设备上,设备GPU负责把这个画面进一步处理,能够在高分辨率屏幕上看起来也没有那么低的画质,这是未来云游戏在GPU方面产生的变化。
Imagination 公司首席营销官David Harold认为,很多技术路线都还没有明确哪一种会成为最终的赢家,云游戏也是一样的。GPU应用在云游戏中有多个方向可以发展,比如大家最常见、认可最多的云游戏方式就是在本地部署一个轻量级的设备,服务器端有比较强力的运算能力,通过这种方式进行云游戏,但事实上我们也可以把GPU升级部署在本地或者部署在边缘节点,可以是在手机和云端同时具有一个镜像规格的GPU配对,从而进一步加强云游戏的体验,这也都是可能的。
关键的一点是,无论是GPU、AI还是其它的云计算等等方面,都要有相应的技术储备,比如云计算的过程中的数据传输需要应用到压缩的算法,这样的技术储备我们做好了,无论这项技术在市场上怎样发展,我们都有相应的机会抓住。
简单解释来说,就是移动端GPU和数据中心GPU将会是协同的向上的,同时Imagination也在两方面均有布局。
值得一提的是,Imagination一直持续深耕中国市场,据Imagination 公司副总裁兼中国区总经理刘国军介绍,在中国生态建设上,不仅包括整机厂商,还包括各大游戏厂商;公司的生态团队在国内周期性、规律性地举办各种培训以及会议,与主流游戏厂商,GPU相关开发者面对面或线上交流。