cuda学习笔记

    科技2022-08-09  124

    cuda学习笔记_1005

    nvcc的编译以及cuda的计算能力

    1. cuda版本的计算能力

    2. nvcc编译器的工作过程

    当使用nvcc编译cu文件时,头文件会自动被包含,无需类似于在vs平台上手动添加各个头文件。

    编译时,代码会被自动分割成主机代码(c++形式)及设备代码(PTX,并行线程执行)两部分,后者被嵌入至cubin binary(立方二进制)。

    从设备代码导入至PTX代码时,需通过对虚拟框架进行指定;

    -arch=compute_70

    从PTX代码导入至cubin binary时,需对显卡真实框架进行指定:

    -code=sm_60

     因而,合并起来,有:

    $ nvcc -arch=compute_70 -code=sm_60 xxx.cu

     

    Processed: 0.012, SQL: 8