GPU缓存的分类

demi 在周二, 08/26/2025 - 17:30 提交

GPU缓存结构

L1缓存是片上缓存（On-Chip），每个Shader核心都有独立的L1缓存，访问速度很快。移动GPU还会有TileMemory，也就是片上内存（On-Chip Memory）。

L2缓存是所有的Shader核心共享的。属于片外缓存，离Shader核心略远，所以访问速度较L1缓存要慢。

DRAM是主存（系统内存，可以叫做System Memory，Global Memory或Device Memory），访问速度是最慢的。FrameBuffer是放在主存上的。

以下是对 L1 缓存、L2 缓存、DRAM 和 FrameBuffer 的详细解释，以及它们在 GPU 中的作用和特性。

GPU 缓存架构

1. L1 缓存

片上缓存（On-Chip Cache）：
L1 缓存是每个 Shader 核心（如 CUDA Core 或 Shader Core）独立拥有的高速缓存。由于其位于芯片内部，L1 缓存的访问速度非常快，能够显著减少数据访问延迟。

功能：
L1 缓存主要用于存储频繁访问的数据和指令，帮助提高计算效率。由于每个 Shader 核心都有独立的 L1 缓存，多个核心可以并行访问各自的缓存，减少了竞争和延迟。

2. Tile Memory

片上内存（On-Chip Memory）：
Tile Memory 是移动 GPU 中的一种特殊片上内存，通常用于存储图形渲染过程中需要的纹理和数据块。它的设计旨在优化图形处理，尤其是在处理大规模数据时。

功能：
Tile Memory 可以减少对主存的访问需求，提高数据的局部性，从而加快渲染速度。它通常与光栅化和纹理映射等操作密切相关。

3. L2 缓存

共享缓存：
L2 缓存是所有 Shader 核心共享的缓存，通常位于片外（Off-Chip），因此访问速度相较于 L1 缓存要慢一些。尽管如此，L2 缓存仍然比主存（DRAM）快得多。

功能：
L2 缓存用于存储更大范围的数据，帮助减少对主存的访问频率。由于多个 Shader 核心共享 L2 缓存，它可以有效地提高数据的重用率，降低延迟。

4. DRAM（主存）

系统内存：
DRAM 是 GPU 的主存，也称为系统内存（System Memory）、全局内存（Global Memory）或设备内存（Device Memory）。它是 GPU 和 CPU 之间共享的内存，通常用于存储大规模数据和程序。

访问速度：
相较于 L1 和 L2 缓存，DRAM 的访问速度是最慢的。尽管如此，DRAM 提供了更大的存储容量，适合存储大量数据，如纹理、顶点缓冲区和帧缓冲区。

5. FrameBuffer

帧缓冲区：
FrameBuffer 通常存储在主存（DRAM）中，用于保存渲染结果的图像数据。它是 GPU 渲染管线的最后一步，负责将最终图像输出到显示设备。

功能：
FrameBuffer 存储每个像素的颜色、深度和模板信息，确保在显示时能够正确呈现图像。由于 FrameBuffer 通常需要频繁更新，因此其性能对整体渲染速度有重要影响。

总结

GPU 的缓存架构通过 L1 缓存、Tile Memory、L2 缓存和 DRAM 的层次结构，优化了数据访问速度和效率。L1 缓存和 Tile Memory 提供了快速的片上存储，L2 缓存则在多个核心之间共享数据，而 DRAM 则提供了大容量的主存储。理解这些缓存的特性和作用，对于优化 GPU 性能和开发高效的图形应用至关重要。

版权声明：本文为CSDN博主「你一身傲骨怎能输」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/qq_33060405/article/details/147182708

科普：iOS 渲染	渲染技术与渲染服务：一段精彩的发展历史和趋势	OpenGL渲染管线
URP渲染管线初步解析	Unity 内置渲染管线中的延迟着色渲染路径	开发者模式之GPU渲染模式分析

最新文章

最新文章