Tag: CUDA-ARRAYS

DispositivoAHost y HostADispositivo tiempos en caso de Memoria Unificada CUDA.

11 Jun, 2023 Programación 0

Estoy tratando de comparar los tiempos totales de ejecución tomados por las versiones administradas y no administradas de la gestión de memoria de CUDA. En el siguiente código de muestra, tengo dos funciones que hacen exactamente lo mismo. La única diferencia está en su gestión de memoria. Una función utiliza . . . Read more

Los Profilers (nvvp y nvprof) no muestran información de “Fallo de página”.

11 Jun, 2023 Programación 0

Estoy perfilando un código de prueba presentado en el artículo Memoria Unificada para Principiantes de CUDA en el foro de desarrolladores de NVIDIA. Código: #include <iostream> #include <math.h> // CUDA kernel to add elements of two arrays __global__ void add(int n, float* x, float* y) { int index = blockIdx.x . . . Read more

Recursión de segundo orden de CUDA con inclusive_scan de thrust.

06 Jun, 2023 Programación 0

Estoy intentando entender cómo paralelizar un cálculo recursivo. De manera serial, el cálculo toma la siguiente forma: for (int i = 2; i<size; i++) { result[i] = oldarray[i] + k * result[i-2]; } para el índice i-1 hay una solución en una pregunta anterior mía: https://stackoverflow.com/questions/70085324/cuda-force-instruction-execution-order/70116462?noredirect=1#comment123966566_70116462 quiero modificar esto para . . . Read more

¿Cómo puedo obtener el tiempo de inicio del kernel en CUDA?

05 Jun, 2023 Programación 0

Estoy intentando obtener el tiempo de inicio del kernel con el siguiente código, pero la salida de este código no es correcta. Quiero el tiempo de inicio de la función del kernel en relación al tiempo de inicio de este programa. Es decir, si consideramos el tiempo de inicio de . . . Read more

Deshabilitar la compilación JIT de PTX a binario de CUDA.

05 Jun, 2023 Programación 0

¿Existe alguna forma de desactivar la compilación Just-In-Time del código PTX a ensamblador GPU al ejecutar una aplicación? Existen ciertos escenarios en los que uno desea ejecutar una aplicación habilitada para GPU en modo solo-CPU. Si la aplicación es lo suficientemente grande y es la primera ejecución de esa versión . . . Read more

1 … 8 9 10

es.davy.ai

¿Tienes una pregunta?