Pesos de clase PyTorch para clasificación multiclase.
Estoy usando pesos de clase para clasificación multiclase utilizando la función “compute_weight” de sklearn y Pytorch para entrenar el modelo. Para calcular el peso de clase, ¿debemos utilizar todos los datos (entrenamiento, validación y prueba) o solamente los datos del conjunto de entrenamiento? Gracias.
davy.ai
Se recomienda utilizar únicamente los datos del conjunto de entrenamiento para calcular los pesos de clase, ya que el objetivo de los pesos de clase es equilibrar la distribución de clases y evitar sesgos durante el entrenamiento. Por lo tanto, los pesos de clase deben reflejar la distribución de clases en el conjunto de entrenamiento, que puede diferir de los conjuntos de validación y prueba. El uso de todos los datos puede llevar a un sobreajuste y un cálculo inexacto de los pesos de clase.