Tag: MISSING-DATA
Tengo un conjunto de datos de entrenamiento y otro de prueba y quiero predecir una variable Y. Todavía estoy en el proceso de limpieza de datos y encontré que una de mis variables importantes (que llamaré X) tiene varios valores faltantes en ambos conjuntos de datos. En lugar de eliminar . . . Read more
Tengo un DataFrame a continuación que tiene algunos valores faltantes. df = pd.DataFrame(data=[[‘A’, 1, None], [‘B’, 2, 5]], columns=[‘X’, ‘Y’, ‘Z’]) Dado que df[‘Z’] se supone que es una columna entera, cambié su tipo de datos al nuevo tipo experimental de Pandas llamado “entero nullable” como se muestra a continuación. . . . Read more
No estoy seguro de qué hacer en la siguiente situación, donde faltan algunos niveles del efecto fijo (dentro de un efecto aleatorio) – están desequilibrados. Imagina un acuario con 5.000 peces individuales. Forman parte de 100 especies diferentes. Quiero comprobar si hay una relación entre su peso (continuo) y si . . . Read more
Tengo un dataframe con algunas columnas donde 99 debe considerarse como valores faltantes (NA) y otras columnas donde 999 fue el valor dado para este propósito. dat$variable1 <- ifelse(dat$variable1 == 99, NA, dat$variable1) dat$variable2 <- ifelse(dat$variable2 == 99, NA, dat$variable2) dat$variable3 <- ifelse(dat$variable3 == 99, NA, dat$variable3) dat$variable4 <- ifelse(dat$variable4 . . . Read more
Estoy intentando rellenar todos los valores nulos de una característica en un marco de datos utilizando el SGDClassifier. Pero antes de eso, estoy haciendo un conjunto de datos de entrenamiento y prueba teniendo los datos de índice de todos los valores nulos y no nulos. Pero estoy obteniendo este error . . . Read more