
最近,Imagination GPU驱动完成了重大更新。Imagination客户现已可通过合作伙伴门户(Partner Portal)获取最新版Linux 与 Android 驱动开发套件(DDK)。我们整理了本次更新的重点内容。
Vulkan 协作矩阵(Cooperative Matrix)支持
为加速图形后处理、神经着色器、物理仿真以及 GPU 上的机器学习推理,DDK 25.2 引入了对 VK_KHR_cooperative_matrix 扩展的支持。该扩展为 Vulkan 开发者提供了一种标准化、广泛兼容的方式来处理协作矩阵运算,尤其适用于在计算着色器(compute shader)中实现高性能矩阵乘法(matmul)操作。
协作矩阵类型是一种中等规模的矩阵,主要在计算着色器中使用,其矩阵存储在特定范围内的所有执行实例(invocation)之间分布。不同实例协同执行矩阵乘法,实现并行化和优化的运算方式。这种机制与 Imagination 新一代 E 系列 GPU 中深度集成的 AI 加速模块完美契合。
Vulkan 管线编译架构重构
随着 Vulkan 的不断演进,开发者需求也随之变化,使得早期“预编译完整管线与着色器对象”的模式逐渐不再适用。许多新扩展体现了这一趋势,引入了更灵活、动态的管线行为。然而,这些变化也对依赖静态管线状态的传统架构提出了挑战。
为应对这一变化,我们对 Vulkan 驱动的着色器与管线编译流程进行了大幅重构。此次改进引入了:模块化编译框架;更流畅的开发工作流;更高效的管线变体管理。通过改进缓存与哈希机制,显著减少了运行时卡顿;同时,新引入的后期着色器链接与重新编译能力,为未来的 Vulkan 创新和新一代应用需求奠定了基础。
OpenCL 内存管理优化
开发者现在可以通过 CL_USE_HOST_PTR 和 CL_ALLOC_HOST_PTR 使用固定内存(pinned memory),这对于带宽密集型应用、重复性数据传输或受限于内存带宽的场景尤其有效。
此外,我们还引入了将外部分配内存(如通过 DMA-BUF 文件描述符 共享的缓冲区)导入 OpenCL 作为统一共享虚拟内存(SVM)的功能。这使得 OpenCL与其他支持 DMA-BUF 的组件(如视频解码器、摄像头驱动或其他计算 API)之间能够实现零拷贝数据共享。
通过将外部内存映射至 OpenCL SVM 空间,应用程序可实现:
- 避免子系统间冗余内存拷贝;
- 降低延迟并提升数据密集型流程的吞吐率;
- 在主机与设备间保持统一的内存访问语义。
虚拟化系统中的更优电源管理
虚拟化是当前广受欢迎的特性,尤其在汽车市场中——多域控制器中的 GPU 需同时支持车载娱乐系统、仪表盘及高级驾驶辅助系统(ADAS)等多个操作系统。采用 GPU 虚拟化的客户现在可在平台上使用 GPU 动态电压与频率调节(DVFS) 功能,实现更高能效与性能平衡。
Imagination 持续为 Android、Windows 以及 Linux(开源与专有版本)驱动提供定期更新,使客户能够及时获得对最新操作系统、API(及其常用扩展)的支持,同时享受持续的性能优化。
本次发布的25.2 RTM1版本将获得至少一年的维护支持,涵盖漏洞修复与安全更新。如需了解更多信息,欢迎与我们深入沟通。
英文链接:https://blog.imaginationtech.com/driver-update-adds-support-for-vulkan-and-opencl-extensions
声明:本文为原创文章,转载需注明作者、出处及原文链接。