Tag: DATA-CLEANING
Tengo una carpeta de archivos de texto y quiero extraer textos específicos de ellos y organizarlos en columnas separadas en un nuevo marco de datos. Hice el código para un archivo, pero no puedo editarlo para que funcione en un bucle que se ejecute en todos los documentos de mi . . . Read more
Tengo un dataframe con ~ 500,000 observaciones, algunas de las columnas tienen espacios en blanco, por ejemplo, un nombre faltante. Sin embargo, los nombres corresponden a un ID, a veces el nombre o el ID están presentes, pero a veces uno u otro falta. ¿Hay alguna forma de buscar en . . . Read more
Tengo un df en R que contiene datos sobre el comportamiento de voto de los partidos políticos en la Duma rusa. Ver la foto adjunta. ¡Haz clic aquí para ver la foto! Cada columna actualmente contiene el porcentaje y el número de votos. Por ejemplo, en la primera fila de . . . Read more
En mi conjunto de datos, las columnas A y B están fuertemente correlacionadas y el gráfico de dispersión es el siguiente: ggplot(df, aes(x = B, y = A)) + geom_point() + geom_smooth() La columna A es inversamente proporcional a B y forma una línea no lineal perfecta. Sin embargo, en . . . Read more
Tengo un conjunto de datos con ID de personajes que quiero convertir en números. Sé que puedo escribir cada ID de personaje y volver a codificarlos, pero como no me importa usar números específicos, ¿hay una manera más rápida de elegir al azar un número único para cada ID de . . . Read more