Tag: CUDA-ARRAYS
Estoy tratando de comparar los tiempos totales de ejecución tomados por las versiones administradas y no administradas de la gestión de memoria de CUDA. En el siguiente código de muestra, tengo dos funciones que hacen exactamente lo mismo. La única diferencia está en su gestión de memoria. Una función utiliza . . . Read more
Estoy perfilando un código de prueba presentado en el artículo Memoria Unificada para Principiantes de CUDA en el foro de desarrolladores de NVIDIA. Código: #include <iostream> #include <math.h> // CUDA kernel to add elements of two arrays __global__ void add(int n, float* x, float* y) { int index = blockIdx.x . . . Read more
Estoy intentando entender cómo paralelizar un cálculo recursivo. De manera serial, el cálculo toma la siguiente forma: for (int i = 2; i<size; i++) { result[i] = oldarray[i] + k * result[i-2]; } para el índice i-1 hay una solución en una pregunta anterior mía: https://stackoverflow.com/questions/70085324/cuda-force-instruction-execution-order/70116462?noredirect=1#comment123966566_70116462 quiero modificar esto para . . . Read more
Estoy intentando obtener el tiempo de inicio del kernel con el siguiente código, pero la salida de este código no es correcta. Quiero el tiempo de inicio de la función del kernel en relación al tiempo de inicio de este programa. Es decir, si consideramos el tiempo de inicio de . . . Read more
¿Existe alguna forma de desactivar la compilación Just-In-Time del código PTX a ensamblador GPU al ejecutar una aplicación? Existen ciertos escenarios en los que uno desea ejecutar una aplicación habilitada para GPU en modo solo-CPU. Si la aplicación es lo suficientemente grande y es la primera ejecución de esa versión . . . Read more