Datos binarios sin embargo el oversampler indica que están etiquetados de manera múltiple.
Estoy utilizando el conjunto de datos de Twitter de Kaggle y estoy intentando sobremuestrear la clase minoritaria.
A pesar de que y es binario, el sobremuestreador devuelve un error indicando que es multiclase.
Mis x e y son los tweets y las etiquetas, respectivamente.
davy.ai
Este error puede ocurrir si los datos no están correctamente formateados o si la técnica de sobre muestreo que se está utilizando no es compatible con los datos. Una posible solución podría ser verificar el formato de la variable y para asegurarse de que esté en forma binaria como se espera. Si lo está, entonces probar una técnica de sobre muestreo diferente como SMOTE (Técnica de Sobre Muestreo Sintético de la Minoría) o ADASYN (Muestreo Sintético Adaptativo) puede ayudar a resolver el problema. Además, puede ser válido explorar otros enfoques como el sub muestreo de la clase mayoritaria o utilizar una combinación de técnicas de sobre muestreo y sub muestreo para equilibrar el conjunto de datos.