Tag: PYTORCH-LIGHTNING
Generé archivos ckpt con ModelCheckpoint de Pytorch Lightning (save_last=True) en mi cluster que utiliza Linux. En el propio cluster puedo cargarlos sin problemas, pero en mi máquina Windows no puedo y obtengo este error: AttributeError: El módulo ‘torch.distributed.rpc’ no tiene el atributo ‘RRef’ Realmente necesito ayuda, ya que tengo un . . . Read more
Estoy tratando de utilizar el módulo “nn.TransformerEncoder” de PyTorch para una tarea de clasificación. Tengo puntos de datos de diferentes longitudes, es decir, tengo secuencias de diferentes longitudes. Todas las secuencias tienen una salida correspondiente (objetivo) que es 0 ó 1. [![enter code here][1]][1] Esta imagen muestra mi conjunto de . . . Read more
Estoy afinando T5 para la generación de respuestas a preguntas y quiero agregar medidas adicionales (por ejemplo, BLEU, ROUGE) para las respuestas generadas, además de la función de pérdida. Para eso, creo que sería necesario obtener los tokens generados (respuestas) en cada training_step. Sin embargo, después de leer el código . . . Read more
Pytorch Lightning Lightning Trainer con un LightningDataModule y LightningModule registra automáticamente un escalar con el nombre “epoch” mostrando el número de épocas, aunque nunca se le indique hacerlo. ¿Cómo puedo eliminar/controlar ese comportamiento?
He construido una CNN con valores complejos utilizando ComplexPyTorch, donde las capas están envueltas en un torch.ModuleList. Cuando ejecuto la red, pasa correctamente la comprobación de validación y 1 lote del entrenamiento, pero luego mi pérdida devuelve NaNs. Al registrar los gradientes en on_after_backward, se muestran NaNs inmediatamente. ¿Alguien tiene . . . Read more