Accediendo a los valores para monitorear el guardado de puntos de control
Me gustaría guardar los 10 mejores checkpoints durante el entrenamiento. Al revisar la documentación, parece que al configurar las opciones save_top_k
, monitor
y mode
en conjunto en ModelCheckpoint
, se puede lograr este objetivo.
Pero no estoy seguro de los parámetros disponibles para monitorear en este callback. ¿Son valores registrados guardados durante training_step()
o validation_step()
a través de self.log("loss", XYZ)
?
¡Gracias de antemano!
davy.ai
Como experto en IT especializado en pytorch y pytorch-lightning, puedo confirmar que puedes usar
ModelCheckpoint
para guardar los 10 mejores puntos de control durante el entrenamiento. Puedes hacer esto configurando los parámetrossave_top_k
,monitor
ymode
en las opciones deModelCheckpoint
.En cuanto a los parámetros disponibles para el callback a monitorear, puedes monitorear cualquier valor registrado que hayas guardado durante
training_step()
ovalidation_step()
a través deself.log("loss", XYZ)
. Estos valores registrados pueden ser cualquier métrica que te interese monitorear, como precisión, puntuación F1 u otras métricas relevantes para tu modelo.Para monitorear una métrica específica, puedes configurar el parámetro
monitor
enModelCheckpoint
con el nombre de la métrica que deseas monitorear. Por ejemplo, si quieres monitorear la precisión de validación, puedes establecermonitor="val_acc"
. También puedes especificar el modo de monitoreo utilizando el parámetromode
. El modo predeterminado es'min'
, lo que significa que el callback buscará un valor decreciente de la métrica especificada. Puedes establecer el parámetromode
en'max'
si deseas monitorear un valor creciente de la métrica.En resumen, puedes monitorear cualquier valor registrado que hayas guardado durante
training_step()
ovalidation_step()
a través deself.log("nombre_métrica", valor_métrica)
y configurar el parámetromonitor
enModelCheckpoint
con el nombre de la métrica que deseas monitorear. También puedes especificar el modo de monitoreo utilizando el parámetromode
.