NVIDIA Visual Profiler(NVVP)是NVIDIA推出的跨平台的CUDA程序性能分析工具。
- 随CUDA安装,不需要额外安装。
- 可自定义配置+图形化界面,可以快速找到程序中的性能瓶颈。
- 以时间线的形式展示CPU和GPU操作。
- 可以查看数据传输和kernel的各种软件参数(速度,kernel启动时间等)和硬件参数(L1 cache命中率等)。
图形化界面用法
Windows linux通用
nvprof -o cuda_bin.nvvp ./cuda_bin
,将cuda_bin.nvvp传回windows,使用NVVP打开cuda版本要一致
使用 nvprof 进行远程分析