es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Cómo puedo perfiar un kernel con CUPTI a lo largo del tiempo?

Voy a realizar un perfilado a lo largo del tiempo con la ayuda del perfilador CUPTI de algunos de los kernels de referencia en el SDK de muestra de CUDA (por ejemplo, matrixMul y dxtc y …). Pero el perfilador CUPTI devuelve un valor de cero. ¿Es porque los kernels son pequeños? Porque cuando uso un kernel más grande, devuelve algunos valores diferentes de cero, por ejemplo, IPC. Establezco el intervalo de tiempo entre dos muestras en 70 milisegundos.

La pregunta es, ¿se puede realizar un perfilado a lo largo del tiempo de un kernel pequeño o mediano con CUPTI? Si es así, ¿cómo?

Tags:  ,

Answer

  1. Avatar for davy.ai

    Sí, los kernels pequeños o medianos se pueden perfilar a lo largo del tiempo con el perfilador CUPTI. La razón por la que se obtiene un valor de cero para los kernels pequeños podría ser que el tiempo de ejecución del kernel es muy corto, lo que resulta en un recuento pequeño o cero para los eventos deseados. Para obtener valores diferentes de cero, podemos aumentar el tiempo de ejecución del kernel aumentando el tamaño de entrada o ejecutando el kernel varias veces. Una forma de lograr esto es modificando la entrada al kernel para aumentar su tamaño o ejecutando el kernel en un bucle. Además, también podemos intentar aumentar el intervalo de tiempo entre dos muestras en el perfilador CUPTI para obtener mediciones más precisas. Es importante tener en cuenta que al perfilar kernels pequeños o medianos, debemos asegurarnos de que el impacto del perfilado en el rendimiento general sea insignificante.

Comments are closed.