cuda学习笔记_1005
nvcc的编译以及cuda的计算能力
1. cuda版本的计算能力
2. nvcc编译器的工作过程
当使用nvcc编译cu文件时,头文件会自动被包含,无需类似于在vs平台上手动添加各个头文件。
编译时,代码会被自动分割成主机代码(c++形式)及设备代码(PTX,并行线程执行)两部分,后者被嵌入至cubin binary(立方二进制)。
从设备代码导入至PTX代码时,需通过对虚拟框架进行指定;
-arch=compute_70
从PTX代码导入至cubin binary时,需对显卡真实框架进行指定:
-code=sm_60
因而,合并起来,有:
$ nvcc -arch=compute_70 -code=sm_60 xxx.cu