CUDA tips

发布时间:2024年01月17日
  • 命令行查看核函数消耗的寄存器和共享内存数量
nvcc --ptxas-options=-v reduce_sum.cu

  • nvprof 使用

由于 8.0 及以上计算能力的显卡用不了 nvprof,官方建议用 nsight system 和 ncu,但是如果只想命令行打印表格查看 kernel 概况感觉还是 nvprof 方便,使用方法:

nsys nvprof ./reduce_sum

?

文章来源:https://blog.csdn.net/qq_55621259/article/details/135638567
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。