计算 - 实例化 - 《OpenGL》

”只要场景中有很多重复的形状，都能够使用实例化渲染来提高性能。“

与绘制顶点本身相比，使用glDrawArrays或glDrawElements函数告诉GPU去绘制重复的顶点数据会消耗更多的性能，因为OpenGL在绘制顶点数据之前需要做很多准备工作（比如告诉GPU该从哪个缓冲读取数据，从哪寻找顶点属性，而且这些都是在相对缓慢的CPU到GPU总线(CPU to GPU Bus)上进行的）。所以，即便渲染顶点非常快，命令GPU去渲染却未必。
我们通过顶点缓冲对象(Vertex Buffer Objects, VBO)管理这个内存，它会在GPU内存（通常被称为显存）中储存大量顶点。使用这些缓冲对象的好处是我们可以一次性的发送一大批数据到显卡上，而不是每个顶点发送一次。从CPU把数据发送到显卡相对较慢，所以只要可能我们都要尝试尽量一次性发送尽可能多的数据。当数据发送至显卡的内存中后，顶点着色器几乎能立即访问顶点，这是个非常快的过程。
缓冲区保存在GPU内存中，它们提供高速和高效的访问，但在GPU中更新数据常常需要重新加载整个对象，在系统内存和GPU内存之间来回移动数据可能是一个缓慢的过程_上千个渲染函数调用却会极大地影响性能。