¿Cómo puedo obtener la suma de gradientes inmediatamente después de loss.backward()?

davy.ai

August 5, 2023 at 10:53 pm

Sí, es posible obtener los gradientes solo a partir de la “pérdida” utilizando el paquete de diferenciación automática de PyTorch llamado “autograd”. Después de calcular la pérdida para cada muestra de entrenamiento, puedes llamar a la función “.backward()” en el tensor de pérdida, lo cual llenará el atributo “.grad” de cada tensor de parámetros en el modelo con su gradiente. Para obtener la suma de gradientes correspondiente a cada muestra de entrenamiento, puedes llamar al atributo “.grad” del tensor de entrada correspondiente después de llamar a “.backward()” en el tensor de pérdida.

Aquí tienes un ejemplo de código:

import torch

# definiendo la función de pérdida
loss_fn = torch.nn.CrossEntropyLoss()

# iterando a través de cada muestra de entrenamiento
for input, target in data_loader:
    # estableciendo requires_grad=True en todos los tensores de entrada
    input.requires_grad = True

    # calculando la pérdida
    output = model(input)
    loss = loss_fn(output, target)

    # calculando los gradientes
    loss.backward()

    # obteniendo la suma de gradientes para esta muestra
    sample_gradient_sum = input.grad.abs().sum()

    # haciendo un seguimiento de las muestras importantes
    importance_samples.append((sample_gradient_sum.item(), (input, target)))

    # poniendo los gradientes a cero para la próxima iteración
    model.zero_grad()

En este ejemplo, estamos calculando la suma de gradientes para cada muestra de entrenamiento llamando al atributo “.grad” del tensor de entrada correspondiente, el cual está configurado como “requires_grad=True”. También estamos poniendo los gradientes a cero para la próxima iteración utilizando la función “zero_grad()” en el modelo. Finalmente, estamos almacenando las muestras importantes en una lista junto con sus sumas de gradientes correspondientes para ordenarlas al final.

Answer

davy.ai

August 5, 2023 at 10:53 pm
Sí, es posible obtener los gradientes solo a partir de la “pérdida” utilizando el paquete de diferenciación automática de PyTorch llamado “autograd”. Después de calcular la pérdida para cada muestra de entrenamiento, puedes llamar a la función “.backward()” en el tensor de pérdida, lo cual llenará el atributo “.grad” de cada tensor de parámetros en el modelo con su gradiente. Para obtener la suma de gradientes correspondiente a cada muestra de entrenamiento, puedes llamar al atributo “.grad” del tensor de entrada correspondiente después de llamar a “.backward()” en el tensor de pérdida.

Aquí tienes un ejemplo de código:
```
import torch

# definiendo la función de pérdida
loss_fn = torch.nn.CrossEntropyLoss()

# iterando a través de cada muestra de entrenamiento
for input, target in data_loader:
    # estableciendo requires_grad=True en todos los tensores de entrada
    input.requires_grad = True

    # calculando la pérdida
    output = model(input)
    loss = loss_fn(output, target)

    # calculando los gradientes
    loss.backward()

    # obteniendo la suma de gradientes para esta muestra
    sample_gradient_sum = input.grad.abs().sum()

    # haciendo un seguimiento de las muestras importantes
    importance_samples.append((sample_gradient_sum.item(), (input, target)))

    # poniendo los gradientes a cero para la próxima iteración
    model.zero_grad()
```
En este ejemplo, estamos calculando la suma de gradientes para cada muestra de entrenamiento llamando al atributo “.grad” del tensor de entrada correspondiente, el cual está configurado como “requires_grad=True”. También estamos poniendo los gradientes a cero para la próxima iteración utilizando la función “zero_grad()” en el modelo. Finalmente, estamos almacenando las muestras importantes en una lista junto con sus sumas de gradientes correspondientes para ordenarlas al final.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

¿Cómo puedo obtener la suma de gradientes inmediatamente después de loss.backward()?

Answer

davy.ai