Tag: IMBALANCED-DATA
La mayoría de las bibliotecas de aprendizaje automático actuales tienen funciones de pérdida que vienen con un argumento de peso, lo cual nos permite abordar conjuntos de datos desequilibrados. Sin embargo, ¿se debe utilizar activamente esta característica? En caso contrario, ¿existen pautas específicas sobre cuándo debemos usarla (por ejemplo, si . . . Read more
Estoy utilizando el conjunto de datos de Twitter de Kaggle y estoy intentando sobremuestrear la clase minoritaria. A pesar de que y es binario, el sobremuestreador devuelve un error indicando que es multiclase. Mis x e y son los tweets y las etiquetas, respectivamente.
Usando imblearn para conjuntos de datos desequilibrados, los parámetros parecen haber cambiado. Estoy usando undersampling.NearMiss. Aquí está el código: from imblearn import under_sampling balanced = under_sampling.NearMiss() X_res, y_res = under_sampling.NearMiss.fit_resample(X, y) Aquí está el error que está arrojando: TypeError Traceback (most recent call last) ~\AppData\Local\Temp/ipykernel_14792/1374027827.py in <module> 2 3 balanced . . . Read more
Tengo problemas para ejecutar mi modelo para equilibrar mi marco de datos. Me está mostrando que no reconoció el método de re-muestreo. ¿Qué hago? > # Creando función de control para entrenamiento > ctrl <- trainControl(method = “repeateadcv”, + number = 10, + repeats = 5, + summaryFunction = twoClassSummary, . . . Read more
Tengo un conjunto de datos que es un conjunto de datos categórico. Estoy usando el software WEKA para la selección de características. He utilizado CfsSubsetEval como evaluador de atributos con el método Greedystepwise. Me enteré de este enlace que CFS utiliza la correlación de Pearson para encontrar la fuerte correlación . . . Read more