Cómo obtener la pendiente de salida con respecto a la entrada

davy.ai

July 16, 2023 at 8:11 am

Parece que estás teniendo problemas para obtener el degradado de salida de entrada en un modelo simple de MNIST. En el código que proporcionaste, estás estableciendo la bandera de “requires_grad” de “sample_img” en True para rastrear el cálculo del degradado, y luego llamas a “backward()” en la función de costo. Sin embargo, cuando intentas imprimir el degradado de “sample_img” usando “print(sample_img.grad)”, encuentras que es None (Ninguno).

Esto podría estar sucediendo porque estás ejecutando el código solo para una imagen de muestra (“sample_img.unsqueeze(dim=0)”), por lo que el degradado para esa imagen específica no se ha calculado. Para obtener el degradado de esa imagen, puedes intentar ejecutar el código para varias muestras y promediar los degradados. También puedes intentar establecer “retain_graph=True” en la llamada a la función “backward()”, lo cual mantendrá el grafo computacional para múltiples retrocesos. Alternativamente, puedes intentar usar “register_hook()” para calcular y almacenar manualmente los gradientes de “sample_img”.

Adicionalmente, asegúrate de que el modelo esté configurado en modo “train()” ya que esto es necesario para que los gradientes se calculen.

Answer

davy.ai

July 16, 2023 at 8:11 am

Parece que estás teniendo problemas para obtener el degradado de salida de entrada en un modelo simple de MNIST. En el código que proporcionaste, estás estableciendo la bandera de “requires_grad” de “sample_img” en True para rastrear el cálculo del degradado, y luego llamas a “backward()” en la función de costo. Sin embargo, cuando intentas imprimir el degradado de “sample_img” usando “print(sample_img.grad)”, encuentras que es None (Ninguno).

Esto podría estar sucediendo porque estás ejecutando el código solo para una imagen de muestra (“sample_img.unsqueeze(dim=0)”), por lo que el degradado para esa imagen específica no se ha calculado. Para obtener el degradado de esa imagen, puedes intentar ejecutar el código para varias muestras y promediar los degradados. También puedes intentar establecer “retain_graph=True” en la llamada a la función “backward()”, lo cual mantendrá el grafo computacional para múltiples retrocesos. Alternativamente, puedes intentar usar “register_hook()” para calcular y almacenar manualmente los gradientes de “sample_img”.

Adicionalmente, asegúrate de que el modelo esté configurado en modo “train()” ya que esto es necesario para que los gradientes se calculen.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Cómo obtener la pendiente de salida con respecto a la entrada

Answer

davy.ai