Tag: GPYTORCH
Estoy intentando implementar algunos cálculos, pero no puedo descubrir cómo vectorizar mi código y no usar bucles. Déjame explicar: tengo una matriz M[N,C] de 0 o 1. Otra matriz Y[N,1] que contiene valores de [0, C-1] (mis clases). Otra matriz ds[N,M] que es mi conjunto de datos. Mi matriz de . . . Read more
He entrenado un modelo BERT utilizando pytorch con alrededor de un millón de datos de texto para una tarea de clasificación. Después de probar este modelo con nuevos datos, obtengo Falsos Positivos y Falsos Negativos. Ahora quiero volver a entrenar el modelo existente solo con los FN y FP. No . . . Read more
Estoy tratando de escribir una función de activación por partes cuya pendiente entre -6 y 0 es 0.1 y en los demás lugares es uno. Y el tamaño de entrada (X) es (B, C, H, W). Así que llegué a la conclusión de que la mejor manera es el código . . . Read more
Estoy usando Python 3.8.5 y Ray 1.8.0 para utilizar la GPU fraccional. Específicamente, quiero paralelizar mi función de pérdida personalizada en el proceso de entrada y salida. (puede haber 4 trabajadores cuando num_gpus=0.25…) El tensor de salida incluye grad_fn, pero mi código no actualiza los pesos, por lo que la . . . Read more
Estoy tratando de entrenar un modelo utilizando PyTorch. Al comenzar el entrenamiento del modelo, obtengo el siguiente mensaje de error: “RuntimeError: CUDA sin memoria. Se intentó asignar 5.37 GiB (GPU 0; capacidad total de 7.79 GiB; 742.54 MiB ya asignados; 5.13 GiB libres; 792.00 MiB reservados en total por PyTorch)” . . . Read more