Tag: NVCC
Tengo un código en CUDA c++. Estoy realizando algunas operaciones con OpenCV en este código. Compilo el programa con el siguiente comando: nvcc file.cu -o o2 `pkg-config –libs –cflags opencv4` Me pregunto cuáles serían las mejores, eficientes y útiles banderas de optimización de nvcc. Gracias de antemano.
Instalé pytorch y torchvision en mi entorno de conda con el comando pip install torch==1.5.1+cu101 torchvision==0.6.1+cu101. Según mi comprensión, esto significa que la biblioteca pytorch está compilada con cuda10.1. Al ejecutar nvcc –version, obtengo la siguiente salida: nvcc: controlador del compilador de NVIDIA (R) Cuda Derechos de autor (c) 2005-2017 . . . Read more
Para simplificar el proceso de construcción en un proyecto, me gustaría compilar varios archivos de origen en código PTX de dispositivo, y tener todos estos módulos en un archivo único .fatbin para vincularlos más tarde. Actualmente, puedo lograrlo compilando cada archivo individualmente a .ptx, o compilando todos simultáneamente mientras uso . . . Read more