芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西7月20日报道,19日,知名半导体IP公司Imagination Technologies和开放、非盈利联盟Khronos Group在上海联合举办Khronos & Imagination技术研讨会。
这场开发者活动重点关注快速发展的软硬件生态系统以及GPU技术、开源标准和开放API接口在移动游戏、汽车和云领域的机会。芯动科技、腾讯、Unity等多家双方合作伙伴的嘉宾代表参加了本次活动并发表主题演讲。
在圆桌论坛环节,阿里巴巴云游戏事业部元境资深技术专家刘昊辰、vivo芯片技术部高级芯片产品总监谭凤林、Khronos中国区副总裁傅世雄、南京睿悦信息CTO曹峻玮围绕VR/AR、云端协同等议题,探讨了未来数字世界可能面临的技术挑战。
一、IMG:更高能效背后的技术创新
研讨会期间,Imagination产品市场副总裁Trina Watt、Imagination前瞻技术副总裁Kristof Beets在演讲中分享了Imagination的主要市场、光追GPU解决方案,以及创新GPU产品背后的驱动因素,尤其是如何实现功耗和性能的平衡。
“GPU产品和移动应用是我们的战略核心。”Trina Watt说,“我们拥有完整的产品线,以覆盖不同的移动市场,从入门款的主流产品到可以支持旗舰款设备达到最高图形体验的高端产品。”
Imagination去年发布的CXT是其首款在移动平台支持光线追踪技术的产品。光线追踪让阴影更平滑,让反射更真实,全面提升用户与游戏的交互体验,使得移动设备端的游戏体验更加真实。
截至今年,Imagination申请了超过3000项专利,是英国最大的IP贡献者。
Kristof Beets谈道,单纯依靠新一代工艺节点所带来的提升是不足以提高竞争优势的,带宽本身就是一个限制条件,同时也受功耗和散热的影响,带宽和存储的线性扩张做起来很容易,但实则效率低下。
“我们的确应该对芯片存储器做点文章了。”Kristof Beets说,“如何处理芯片接口和本地存储器之间的不同延迟?我们其实有很多复杂的带宽问题都没解决。”他也特别强调安全问题,很多存储在云端的私人数据都很容易被入侵,作为安全数据链的重要一环,必须确保GPU本身不出漏洞。
从技术角度来说,Imagination采用了模块化和层级化的方法进行扩展,从普通的移动设备,到高端GPU,再到采用了多核技术甚至多用例的服务器和云计算市场。
“我们从搭载了一个光线追踪模块的8*256手机解决方案开始。8代表的是贴图能力,256代表了每时钟周期的浮点处理能力。我们以此为基础进行逻辑放大,从单模块到性能翻倍的双模块,以此类推扩展至3倍、4倍,甚至更高性能。”Kristof Beets分享道。
这些是单核用例的逻辑放大和性能的线性扩展。实现可扩展性还需要考虑新的技术革新。晶粒是确保功耗效率的重要技术,将多个同样的芯片封装到一起并构建出更大尺寸的用例和GPU,这种基于逻辑模块的构建方法也获得了很多关注。Imagination便采用了这一逻辑来设计多核产品。
分块渲染的一个优势是带宽,排序后Imagination会逐一处理分块贴图,很多处理流程可以利用芯片上的暂存存储器完成,功耗效率和处理效率更高,对闪存和存储器子系统也更友好。
它的另一个优势是支持工作负载在大型GPU的高效分布,易将每个分块贴图分配给GPU的不同部分来处理,可实现高效的线性性能扩展,不仅支持传统芯片,也同样适用于晶粒堆栈。
压缩也是解决方案中的重要一环。Imagination一直在开发创新的压缩技术,希望将数据压缩到尽可能小。压缩技术也会对几何构型产生影响,基于硬件的压缩技术将浮点数据压缩至几何模块,并执行后续的逻辑运算。将相对屏幕贴图的位置数据进行存储时,压缩技术具有很大优势,可以帮助实现最高的带宽效率。
压缩跨越了GPU处理和系统,Khronos的标准化则是另一个优势。以纹理压缩为例,开发者经常会高比例压缩纹理到ASTC等高质量格式,但也不能忽视功耗和带宽效率。几何图形压缩通常不需要开发者担心,它是在后台进行的,开发者无需参与,也不需要任何扩展程序,Imagination就在研发渲染对象的随时压缩,并利用帧缓冲显示器实现显示器外的渲染。
这样做需要很高的读写带宽,IMGIC则是其中的一项核心技术。这项技术不仅支持无损压缩,也支持有损压缩,图像质量会收到少量影响,但可以显著降低带宽需求。所以,开发者可以按需平衡带宽、功耗和图像质量。
“对比其他解决方案,我们可以将带宽需求降低20%-40%。”Kristof Beets说。
他也谈到其GPU长期搭载的关键创新是固件,隐藏在GPU下的微内核能处理本地事件,承载一部分主CPU的负载,更多性能还可以用于优化应用或游戏负载。固件处理器对纠错同样很有用,可以用在功能性安全的故障分析和功耗管理。
二、GPU技术开启数字新世界,提升VR体验需解锁哪些难关?
在圆桌论坛环节,阿里巴巴云游戏事业部元境资深技术专家刘昊辰、vivo芯片技术部高级芯片产品总监谭凤林、Khronos中国区副总裁傅世雄、南京睿悦信息CTO曹峻玮围绕“GPU技术如何开启数字新世界”主题进行探讨。
谈到VR领域需突破的方向,vivo芯片技术部高级芯片产品总监谭凤林说,他从不怀疑芯片技术的提升将带来更好体验,但我们可能还要另一个角度来看问题——人对一些感知的变化。
比如,理论上延时低于20毫秒,人就不会感到眩晕,高通XR设备专用芯片骁龙XR2已能将延时降低到16毫秒,但时间一长,人还是会有眩晕感,为什么?这可能是人体对一些日常动作跟大脑的反应不协调导致的。这一方向也需要做更多探索。
南京睿悦信息CTO曹峻玮认为,从“看”到“交互”,是一个叠进的过程。目前交互方式方面,已经有手势、手柄、戒指、脑机接口、手环等各种尝试,但从仿真角度来讲还差很多。在他看来,如果实现交互和感官双重突破,我们可能进入一个很真实的世界。
阿里巴巴云游戏事业部元境资深技术专家刘昊辰判断,未来VR/AR场景下,头显设备不断缩小,本地芯片的发热和功耗问题会更加苛刻,本地能做的渲染在一定程度上会受到限制。而云端资源理论上可以无限横向扩展,比如支撑万人同屏的场景,这对GPU架构也是一个技术挑战。
刘昊辰说,云原生渲染场景需要的GPU能力,更多是可以快速根据当前场景需求去扩缩计算能力的模式,对GPU的虚拟化、跨GPU核之间的协同和传输等能力,都提出了一些新的要求。
在谭凤林看来,边缘设备也能提供强大的计算能力,它的算力比端侧强,延时又比云低,在像VR场景对延时可能更加敏感的场景,能够兼顾对高算力和低延时的需求,其网络链路也会较短。
另外在端侧,当电池没有本质性突破时,要运行一个大算力东西,即便制程不停迭代,手机待机时间是不会提高的,如果需要更高算力,也可以连到端侧设备上。要有突破,电池供电可能是未来的一个关键之处,解决的也许是单电池电芯容量,也许是一个无所不在的无线充电的世界。
南京睿悦信息CTO曹峻玮也认同电池亟待突破,算力越高,手机续航则越用越短,电池的突破跟不上芯片的突破。他认为未来可能先有的场景,是家里有一台供家人共同使用的服务器,作为边缘计算节点,来供给所有在家庭使用的算力。
Khronos中国区副总裁傅世雄补充说,目前所有VR眼镜支持的云端功能都是通过Wi-Fi,因为目前5G还不能支持这么大的量,所以在室外移动场景中用到5G,同样存在技术瓶颈。