es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Error de CUDA al entrenar YOLOv4-tiny en Colab: no hay imagen de kernel disponible para ejecución en el dispositivo.

Estaba siguiendo este tutorial para entrenar un modelo YOLOv4-tiny para detectar objetos personalizados: https://www.youtube.com/watch?v=NTnZgLsk_DA

Sin embargo, cuando intento entrenar el modelo, obtengo este mensaje de error:

Estado de CUDA: Error: archivo: ./src/blas_kernels.cu : () : línea: 841 : hora de compilación: 7 de enero de 2022 - 12:01:41 

Error de CUDA: no hay una imagen de kernel disponible para la ejecución en el dispositivo
Error de CUDA: no hay una imagen de kernel disponible para la ejecución en el dispositivo: El archivo existe

Estaba ejecutando el código en Colab, no localmente. La GPU utilizada para el entrenamiento es Tesla K80.

Una respuesta común es configurar los valores de ARCH en compute_37, code_37, pero ¡ya los he configurado de esta manera y sigo obteniendo el mismo error! Entonces, ¿qué debo hacer para que este código se ejecute?

Enlace a mi notebook de Colab: https://colab.research.google.com/drive/16EQ6I67OOs1I7rF6PHgBHp1eVHMXXvyO#scrollTo=QyMBDkaL-Aep

¡Cualquier ayuda sería apreciada!

Tags:  ,

Answer

  1. Avatar for davy.ai

    El mensaje de error sugiere que hay algún problema con la instalación de CUDA en la GPU Tesla K80 que estás utilizando para el entrenamiento. Aquí tienes algunas posibles soluciones que podrías probar:

    1. Reiniciar el tiempo de ejecución de Colab: A veces, reiniciar el tiempo de ejecución de Colab puede resolver problemas relacionados con CUDA. Podrías intentar reiniciar el tiempo de ejecución y ejecutar el código nuevamente para ver si el error desaparece.
    2. Verificar las versiones de CUDA y CuDNN: Verifica que estás utilizando la versión correcta de CUDA y CuDNN que son compatibles con YOLOv4-tiny. Puedes verificar qué versión de CUDA y CuDNN está instalada en tu instancia de Colab utilizando los siguientes comandos:

    !nvcc --version
    !cat /usr/local/cuda/version.txt
    

    Asegúrate de que las versiones coincidan con los requisitos del modelo YOLOv4-tiny que estás entrenando. Si no coinciden, podrías intentar instalar las versiones correctas utilizando los siguientes comandos:

    !wget https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux
    !sudo sh cuda_10.0.130_410.48_linux --override
    
    !wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.4.15/11.4_20211215/Ubuntu20_04-x86_64/libcudnn8_8.2.4.15-1%2Bcuda11.4_amd64.deb
    !sudo dpkg -i libcudnn8_8.2.4.15-1+cuda11.4_amd64.deb
    
    1. Cambiar el tiempo de ejecución de la GPU: La GPU Tesla K80 es una GPU más antigua y podría no ser completamente compatible con las últimas versiones de CUDA y CuDNN. Podrías intentar cambiar a un tiempo de ejecución de GPU diferente con una GPU NVIDIA más nueva que sea totalmente compatible con CUDA y CuDNN. Para hacer esto, haz clic en la pestaña “Tiempo de ejecución” en tu bloc de notas de Colab, selecciona “Cambiar tipo de tiempo de ejecución” y elige una GPU diferente en “Acelerador de hardware”.

    Esperemos que una de estas soluciones resuelva el error que estás encontrando.

Comments are closed.