Tag: DATA-CLEANING
Estoy intentando calcular porcentajes, hacer gráficos, etc. con mi DataFrame, pero muchos de los valores faltantes no están marcados como NaN, sino como ‘0::Desconocido’, ‘|Desconocido’, etc. Esto, por supuesto, hace que todo sea muy desordenado. Solo quiero incluir las respuestas “Sí/No”, que existen, pero están en menor cantidad que los . . . Read more
Tengo un conjunto de datos con dos columnas. ¿Cómo puedo convertirlo al formato mostrado a continuación usando Python?
Ver consulta a continuación que devuelve aproximadamente 38 mil filas. Cuando se elimina la unión ‘phone’ y la columna, se reduce a las 15.5 mil filas correctas. SELECT tc.customer_no ,fdn.display_name_short ‘name’ ,tc.cont_amt ,tc.ref_no ,tc.cont_dt ,tc.cont_type ,tca.fyear ,(ISNULL(street1, ‘none’) + ‘ ‘ + ISNULL(city, ‘none’) + ‘ ‘ + ISNULL(state, ‘none’) . . . Read more
Tengo un gran conjunto de datos que analiza el consumo de oxígeno de sujetos que hacen ejercicio a lo largo del tiempo (x = Tiempo, y = VO2). Estos datos se ajustan a una función monoexponencial. Aquí hay un breve ejemplo de un marco de datos de muestra: ”’ VO2
Tengo esta cadena que contiene caracteres especiales, no puedo eliminar estos caracteres del marco de datos principal. Sin embargo, cuando preparé un objeto separado mediante dft y luego usé el siguiente código, pude eliminar los caracteres especiales. dft <- “rt shibxwarrior hodl trust processsome great things horizon folks shib shib . . . Read more