Tag: CUDA-ARRAYS
Para simplificar el proceso de construcción en un proyecto, me gustaría compilar varios archivos de origen en código PTX de dispositivo, y tener todos estos módulos en un archivo único .fatbin para vincularlos más tarde. Actualmente, puedo lograrlo compilando cada archivo individualmente a .ptx, o compilando todos simultáneamente mientras uso . . . Read more
Estoy tratando de transferir algunas manipulaciones de datos de la CPU a la GPU (CUDA), pero hay una pequeña parte que requiere que se ejecuten las instrucciones en un orden específico. En principio, podría hacer las primeras partes en paralelo, luego transferir los resultados al host para la parte serial, . . . Read more
Escribí el siguiente código en Python: import tvm ctx = tvm.device(“cuda”, 0) print(“ctx: “, ctx.exist) <code> La salida es </code> ctx: False <code> Sin embargo, instalé cuda y el controlador de cuda. El resultado de `nvidia-smi` es, </code> NVIDIA-SMI 495.44 Driver Version: 495.44 CUDA Version: 11.5 <code> Utilicé `lspci -vnn . . . Read more
Algunos dispositivos CUDA admiten diferentes tamaños de bancos de memoria compartida (4 bytes, 8 bytes); otros admiten sólo uno (típicamente/siempre 4 bytes). Como he llegado a darme cuenta, no obtendré un error al intentar establecer el tamaño del banco en un valor no admitido… eso simplemente será ignorado. Entonces, ¿cómo . . . Read more