OpenGL 渲染管线 (pipeline)

demi 在周四, 01/06/2022 - 09:43 提交

一、OpenGL的基本概念

OpenGL 的结构可以从逻辑上划分为下面 3 个部分：

图元（Primitives）
缓冲区（Buffers）
光栅化（Rasterize）

图元（Primitives）

在 OpenGL 的世界里，我们只能画点、线、三角形这三种基本图形，而其它复杂的图形都可以通过三角形来组成。

所以这里的图元指的就是这三种基础图形：

点：点存在于三维空间，坐标用（x,y,z）表示。
线：由两个三维空间中的点组成。
三角形：由三个三维空间的点组成。

缓冲区（Buffers）

OpenGL 中主要有 3 种 Buffer：

帧缓冲区（Frame Buffers）
帧缓冲区：这个是存储OpenGL 最终渲染输出结果的地方，它是一个包含多个图像的集合，例如颜色图像、深度图像、模板图像等。

渲染缓冲区（Render Buffers）
渲染缓冲区：渲染缓冲区就是一个图像，它是 Frame Buffer 的一个子集。

缓冲区对象（Buffer Objects）
缓冲区对象就是程序员输入到 OpenGL 的数据，分为结构类和索引类的。前者被称为“数组缓冲区对象”或“顶点缓冲区对象”（“Array Buffer Object”或“Vertex Buff er Object”），即用来描述模型的数组，如顶点数组、纹理数组等；后者被称为“索引缓冲区对象”（“Index Buffer Object”），是对上述数组的索引。

光栅化（Rasterize）

在介绍光栅化之前，首先来补充 OpenGL 中的两个非常重要的概念：

Vertex
Vertex 就是图形中顶点，一系列的顶点就围成了一个图形。

Fragment
Fragment 是三维空间的点、线、三角形这些基本图元映射到二维平面上的映射区域，通常一个 Fragment 对应于屏幕上的一个像素，但高分辨率的屏幕可能会用多个像素点映射到一个 Fragment，以减少 GPU 的工作。

而光栅化是把点、线、三角形映射到屏幕上的像素点的过程。

着色器程序（Shader）

Shader 用来描述如何绘制（渲染），GLSL 是 OpenGL 的编程语言，全称 OpenGL Shader Language，它的语法类似于 C 语言。

OpenGL 渲染需要两种 Shader：Vertex Shader 和 Fragment Shader。

Vertex Shader 顶点着色器：对于3D模型网格的每个顶点执行一次，主要是确定该顶点的最终位置。

Fragment Shader 片元着色器：对光栅化之后2D图像中的每个像素处理一次。3D物体的表面最终显示成什么样将由它决定，例如为模型的可见表面添加纹理，处理光照、阴影的影响等等。

二、OpenGL ES在屏幕产生图片的过程

当我们买一个手机的时候，我们会非常关注这个手机的分辨率。分辨率代表着像素的多少，比如我们熟知的 iphone6 的分辨率为 1334×750，而 iphone6 plus 的分辨率是1920×1080。

手机屏幕上的图片，是由一个一个的像素组成,那么可以计算出来，一个屏幕上的图片，是由上百万个像素点组成。而每个像素点都有自己的颜色，每种颜色都是由 RGB 三原色组成。三原色按照不同的比例混合，组成了手机所能显示出来的颜色。

每个像素的颜色信息都保存在 buffer 中，这块 buffer 可以分给 RGB 每个通道各 8bit 进行信息保存，也可以分给 RGB 每个通道不同的空间进行信息保存，比如由于人眼对绿色最敏感，那么可以分配给 G 通道 6 位，R 和 B 通道各 5 位。这些都是常见的手机配置。假如使用 RGB888 的手机配置，也就是每种颜色的取值从 0 到 255，0 最小，255 最大。那么红绿蓝都为 0 的时候，这个像素点的颜色就是黑色，红绿蓝都为 255 的时候，这个像素点的颜色就是白色。当红为 255，绿蓝都为 0 的时候，这个像素点的颜色就是红色。当红绿为 255，蓝为 0 的时候，这个像素点的颜色就是黄色。当然不是只取 0 或者 255，可以取 0-255 中间的值，100，200，任意在 0 和 255 中间的值都没有问题。那么我们可以算一下，按照红绿蓝不同比例进行搭配，每个像素点可以显示的颜色有 255255255=16581375 种，这个数字是非常恐怖，所以我们的手机可以显示出来各种各样的颜色。

这里在延伸的科普一下，我们看到手机可以显示那么多种颜色了，但是是不是说我们的手机在颜色上就已经发展到极致了呢？其实是远远没有的，在这个手机配置下，三原色中每一种的取值可以从 0 到 255，而在现实生活中，它们的取值可以从 0 到 1 亿，而我们人类的眼睛所能看到的范围是从 0 到 10 万。所以手机硬件还存在很大的提升空间。而在手机硬件提升之前，我们也可以通过 HDR 等技术尽量的在手机中多显示一些颜色。所以，讲到这里，我们知道了，手机屏幕上显示的图片是由这上百万个像素点以及这上百万个像素点对应的颜色组成的。

用程序员的角度来看，就是手机屏幕对应着一块 buffer，这块 buffer 对应上百万个像素点，每个像素点需要一定的空间来存储其颜色。如果使用更加形象的例子来比喻，手机屏幕对应的 buffer 就好像一块巨大的棋盘，棋盘上有上百万个格子，每个格子都有自己的颜色，那么从远处整体的看这个棋盘，就是我们看手机的时候显示的样子。这就是手机屏幕上图片的本质。

通过我们对 EGL、GLSL、OpenGL ES 的理解，借助一张图片，从专业的角度来解释一下手机屏幕上的图片是如何生成的。

首先，通过 EGL 获取手机屏幕，进而获取到手机屏幕对应的这个棋盘，同时，在手机的 GPU 中根据手机的配置信息，生成另外一个的棋盘和一个本子，本子是用于记录这个棋盘初始颜色等信息。

然后，OpenGL ES 就好像程序员的画笔，程序员需要知道自己想画什么东西，比如想画一个苹果，那么就需要通过为数不多的基本几何图元(如点、直线、三角形)来创建所需要的模型。比如用几个三角形和点和线来近似的组成这个苹果 (图形学的根本就是点、线和三角形，所有的图形都可以由这些基本图形组成，比如正方形或者长方形就可以由两个三角形组成，圆形可以由无数个三角形组成，只是三角形的数量越多，圆形看上去越圆润)。

根据这些几何图元建立数学描述，比如每个三角形或者线的顶点坐标位置、每个顶点的颜色。得到这些信息之后，可以先通过 OpenGL ES 将 EGL 生成的棋盘 (buffer)进行颜色初始化，一般会被初始化为黑色。然后将刚才我们获取到的顶点坐标位置通过矩阵变化的方式进行模型变换、观察变换、投影变换，最后映射到屏幕上，得到屏幕上的坐标。这个步骤可以在 CPU 中完成，也就是在 OpenGL ES 把坐标信息传给 Shader 之前，在 CPU 中通过矩阵相乘等方式进行更新，或者是直接把坐标信息通过 OpenGL ES 传给 Shader，同时也把矩阵信息传给 Shader，通过 Shader 在 GPU 端进行坐标更新，更新的算法通过 GLSL 写在 Shader 中。这个进行坐标更新的 Shader 被称为 vertex shader，简称 VS，是 OpenGL ES2.0也是 GLSL130 版本对应的最重要两个 shader 之一，作用是完成顶点操作阶段中的所有操作。经过矩阵变换后的像素坐标信息，为屏幕坐标系中的坐标信息。在 VS 中，最重要的输入为顶点坐标、矩阵(还可以传入顶点的颜色、法线、纹理坐标等信息)，而最重要的运算结果就是这个将要显示在屏幕上的坐标信息。VS 会针对传入的所有顶点进行运算，比如在 OpenGL ES 中只想绘制一个三角形和一条线，这两个图元不共享顶点，那么在 VS 中，也就传入了 5 个顶点信息，根据矩阵变换，这 5 个顶点的坐标转换成了屏幕上的顶点坐标信息，从图上显示，也就是从左上角的图一，更新成了中上图的图二。

再然后，当图二生成之后，我们知道了图元在屏幕上的顶点位置，而顶点的颜色在 VS 中没有发生变化，所以图元的顶点颜色我们也是知道的。下面就是根据 OpenGL ES 中设置的状态，表明哪些点连成线，哪些点组成三角形，进行图元装配，也就是我们在右上角的图三中看到的样子。这个样子在 GPU 中不会显示，那几条线也是虚拟的线，是不会显示在棋盘 buffer 中的，而 GPU 做的是光珊化，这一步是发生在从 VS 出来，进入另外一个Shader (Pixel shader，也称 fragment shader)之前，在 GPU 中进行的。作用是把线上或者三角形内部所有的像素点找到，并根据插值或者其他方式计算出其颜色等信息(如果不通过插值，可以使用其他的方法，这些在 OpenGL ES 和 GLSL 中都可以进行设置)。也就生成了下面一行的图四和图五。

我们大概可以看到在图 4 和图 5 种出现了大量的顶点，大概数一下估计有 40 个点左右，这些点全部都会进入 PS 进行操作，在 PS 中可以对这些点的颜色进行操作，比如可以只显示这些点的红色通道，其他的绿蓝通道的值设置为 0，比如之前某个点的 RGB 为 200，100，100。在 PS 中可以将其通过计算，更新为 200，0，0。这样做的结果就是所显示的图片均为红色，只是深浅不同。这也就好像戴上了一层红色的滤镜，其他颜色均为滤掉了。所以用 PS 来做滤镜是非常方便的。再比如，假如一盏红色的灯照到了苹果上，那么显示出来的颜色就是在苹果原本的颜色基础上，红色值进行一定的增值。

所以，总结一下，经过 VS 和 PS 之后，程序员想要画的东西就已经被画出来了。想要绘制的东西也就是左下角图五的样子。然后再根据 OpenGL ES 的设置，对新绘制出来的东西进行 Depth/Stencil Test，剔除掉被遮挡的部分，将剩余部分与原图片进行 Blend，生成新的图片。最后，通过 EGL把这个生成的棋盘 buffer 和手机屏幕上对应的棋盘 buffer 进行调换，让手机屏幕显示这个新生成的棋盘，旧的那个棋盘再去绘制新的图片信息。周而复始，不停的把棋盘进行切换，也就像过去看连环画一样，动画就是由一幅幅的图片组成，当每秒切换的图片数量超过 30 张的时候，我们的手机也就看到了动态的效果。这就是屏幕上图片的产生过程。

在这里再进行一下延伸，这个例子中，VS 计算了 5 个顶点的数据，PS 计算了大概 40 个顶点的数据，而我们刚才说过，手机中存在上百万个像素点，这上百万个像素点都可以是顶点，那么这个计算量是非常大的。而这也是为什么要将 shader 运算放在 GPU 中的原因，因为 GPU 擅长进行这种运算。

我们知道 CPU 现在一般都是双核或者 4 核，多的也就是 8 核或者 16 核，但是 GPU 动辄就是 72 核，多的还有上千核，这么多核的目的就是进行并行运算，虽然单个的 GPU 核不如 CPU 核，但是单个的 GPU 核足够进行加减乘除运算，所以大量的 GPU 核用在图形学像素点运算上，是非常有效的。而 CPU 虽然单个很强大，而且也可以通过多级流水来提高吞吐率，但是终究还是不如 GPU 的多核来得快。但是在通过 GPU 进行多核运算的时候，需要注意的是:如果 shader 中存放判断语句，就会对 GPU 造成比较大的负荷，不同 GPU 的实现方式不同，多数 GPU 会对判断语句的两种情况都进行运算，然后根据判断结果取其中一个。

我们通过这个例子再次清楚了 OpenGL ES 绘制的整个流程，而这个例子也是最简单的一个例子，其中有很多 OpenGL ES 的其他操作没有被涉及到。比如，我们绘制物体的颜色大多是从纹理中采样出来，那么设计到通过 OpenGL ES 对纹理进行操作。而 OpenGL ES 的这些功能，我们会在下面一点一点进行学习。

三、OpenGL管线(pipeline)

EGL 是用于与手机设备打交道，比如获取绘制 buffer，将绘制 buffer 展现到手机屏幕中。那么抛开 EGL 不说，OpenGL ES 与 GLSL 的主要功能就是往这块 buffer 上绘制图片。

所以，我们可以把OpenGL ES和GLSL的流程单独拿出来进行归纳总结，而这幅流程图就是著名的 OpenGL ES2.0 pipeline。

首先，最左边的 API 指的就是 OpenGL ES 的 API，OpenGL ES 其实是一个图形学库，由 109 个 API 组成，只要明白了这 109 个 API 的意义和用途就掌握了OpenGL ES 2.0。

然后，我们通过 API 先设定了顶点的信息，顶点的坐标、索引、颜色等信息，将这些信息传入 VS。

在 VS 中进行运算，得到最终的顶点坐标。再把算出来的顶点坐标进行图元装配，构建成虚拟的线和三角形。再进行光珊化(在光珊化的时候，把顶点连接起来形成直线，或者填充多边形的时候，需要考虑直线和多边形的直线宽度、点的大小、渐变算法以及是否使用支持抗锯齿处理的覆盖算法。最终的每个像素点，都具有各自的颜色和深度值)。

将光珊化的结果传入 PS，进行最终的颜色计算。

然后，这所谓最终的结果在被实际存储到绘制 buffer 之前，还需要进行一系列的操作。这些操作可能会修改甚至丢弃这些像素点。

这些操作主要为 Alpha Test、Depth/Stencil Test、Blend、Dither。

Alpha Test 采用一种很霸道极端的机制，只要一个像素的 alpha 不满足条件，那么它就会被 fragment shader 舍弃，被舍弃的 fragments 不会对后面的各种 Tests 产生影响;否则，就会按正常方式继续下面的检验。Alpha Test 产生的效果也很极端，要么完全透明，即看不到，要么完全不透明。

Depth/stencil test 比较容易理解。由于我们绘制的是 3D 图形，那么坐标为 XYZ，而 Z 一般就是深度值，OpenGL ES 可以对深度测试进行设定，比如设定深度值大的被抛弃，那么假如绘制 buffer 上某个像素点的深度值为 0，而 PS 输出的像素点的深度值为 1，那么 PS 输出的像素点就被抛弃了。而 stencil 测试更加简单，其又被称为蒙版测试，比如可以通过 OpenGL ES 设定不同 stencil 值的配抛弃，那么假如绘制 buffer 上某个像素点的 stencil 值为 0，而 PS 输出的像素点的 stencil 值为 1，那么 PS 输出的像素点就被抛弃了。

既然说到了 Depth/stencil，那么就在这里说一下绘制 buffer 到底有多大，存储了多少信息。按照我们刚才的说法，手机可以支持一百万个像素，那么生成的绘制 buffer 就需要存储这一百万个像素所包含的信息，而每个像素包含的信息，与手机配置有关，假如手机支持 Depth/stencil。那么通过 EGL 获取的绘制 buffer 中，每个像素点就包含了 RGBA 的颜色值，depth 值和 stencil 值，其中 RGBA 每个分量一般占据 8 位，也就是 8bit，也就是 1byte，而 depth 大多数占 24 位，stencil 占 8 位。所以每个像素占 64bit，也就是 8byte。那么 iphone6 plus 的绘制 buffer 的尺寸为 1920×1080×8=16588800byte=16200KB=15.8MB。

下面还有 blend，通过 OpenGL ES 可以设置 blend 混合模式。由于绘制 buffer 中原本每个像素点已经有颜色了，那么 PS 输出的颜色与绘制 buffer 中的颜色如何混合，生成新的颜色存储在绘制 buffer 中，就是通过 blend 来进行设定。

最后的 dither，dither 是一种图像处理技术，是故意造成的噪音，用以随机化量化误差，阻止大幅度拉升图像时，导致的像 banding(色带)这样的问题。也是通过OpenGL ES 可以开启或者关闭。

经过了这一系列的运算和测试，也就得到了最终的像素点信息，将其存储到绘制 buffer 上之后，OpenGL ES 的 pipeline 也就结束了。

整个pipeline中，纵向按照流水线作业，横线按照独立作业，多级并行、提高渲染性能。

参考链接：
1. Android Display System(2)
2. OpenGL ES 2.0 知识串讲

作者：夜行过客
来源：https://www.cnblogs.com/yongdaimi/p/11245726.html

OpenGL/OpenGL ES 渲染流程以及固定存储着色器	【视频】在Imagination GPU 上运行 OpenGL® 4.6	渲染管线优化方法论：从瓶颈定位到优化策略（上篇）
你相信光吗？高清渲染管线光照权威指南	OpenGL-光源位置的控制	渲染管线优化方法论：从瓶颈定位到优化策略（下篇）

最新文章

最新文章