NVIDIA Visual Profiler(NVVP)是NVIDIA推出的跨平台的CUDA程序性能分析工具。

  • 随CUDA安装,不需要额外安装。
  • 可自定义配置+图形化界面,可以快速找到程序中的性能瓶颈。
  • 以时间线的形式展示CPU和GPU操作。
  • 可以查看数据传输和kernel的各种软件参数(速度,kernel启动时间等)和硬件参数(L1 cache命中率等)。

图形化界面用法

Windows linux通用

  1. 打开nvvp
  2. File->New Session
  3. 在File里选择CUDA程序bin
  4. 选择执行

    Linux命令行用法

  5. nvprof ./cuda_bin

image.png

  1. nvprof -o cuda_bin.nvvp ./cuda_bin,将cuda_bin.nvvp传回windows,使用NVVP打开

    cuda版本要一致

  2. 使用 nvprof 进行远程分析