8.4 本章总结

本章旨在表示OpenCL在具体架构上的映射关系。本章中,我们简单的比较了一下CPU和GPU架构的不同,不同的矢量宽度带来的巨大的性能差异(NVIDIA的GPU矢量宽度为32位,AMD的GPU矢量宽度是64位,CPU则小的多),还有不同的线程管理和指令调度。本书中我们不能覆盖所有市面上的架构,不过本章中我们给出了一些例子。所以,编程者在以某个OpenCL设备作为目标设备时,就需要仔细研究对应平台架构的相关文档,这样才能在对应平台上获得最优的性能。