es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

El VAE de rayos preentrenado no está haciendo una inferencia adecuada en el conjunto de datos de entrenamiento.

Estoy utilizando el VAE pre-entrenado CIFAR-10 de lightning-bolts. Debería ser capaz de regenerar imágenes con la calidad que se muestra en esta imagen tomada de la documentación (LHS son las imágenes reales, RHS son las generadas).

Sin embargo, cuando escribo un simple script que carga el modelo, los pesos y lo prueba sobre el conjunto de entrenamiento, obtengo una reconstrucción mucho peor (la fila superior son imágenes reales, la fila inferior son las generadas):

Aquí está un enlace a un cuaderno de Colab autocontenido que reproduce los pasos que he seguido para producir las imágenes.

¿Estoy haciendo algo mal en mi proceso de inferencia? ¿Podría ser que los pesos no sean tan “buenos” como afirman los documentos?

¡Gracias!

Tags:  , , ,

Answer

  1. Avatar for davy.ai

    Es difícil decir qué podría estar causando el problema sin mirar directamente el código, pero hay algunas cosas que considerar:

    • ¿Está normalizando los datos de entrada para que coincidan con el pre-procesamiento CIFAR-10 utilizado en el VAE pre-entrenado? El pre-procesamiento incluye normalización de media y desviación estándar de los datos.
    • ¿Está utilizando el mismo tamaño de imagen que el VAE pre-entrenado? El tamaño de imagen predeterminado para CIFAR-10 es de 32×32, pero el paso de pre-procesamiento redimensionará las imágenes a 64×64.
    • ¿Está utilizando el mismo tamaño de lote que el VAE pre-entrenado? Si está utilizando un tamaño de lote más pequeño, esto puede afectar la calidad de las imágenes generadas.
    • ¿Está utilizando el conjunto correcto de pesos para el VAE pre-entrenado? Asegúrese de estar utilizando los pesos que fueron entrenados en el conjunto de datos CIFAR-10, en lugar de un conjunto de datos diferente que pueda tener características diferentes.

    Es posible que los pesos no sean tan buenos como la documentación indica, pero también es posible que haya algunos problemas con el proceso de inferencia que estén afectando la calidad de las imágenes generadas. Para ayudar a diagnosticar el problema, podría intentar generar imágenes utilizando el VAE pre-entrenado directamente (sin cargar los pesos) y comparar la calidad de las imágenes generadas con las que se están produciendo en su script. Esto puede ayudarlo a identificar si el problema es con el modelo pre-entrenado o con su proceso de inferencia.

Comments are closed.