crear un marco de datos a partir de texto en R
Tengo un archivo de texto con más de un millón de líneas de texto. Hay tres columnas: persona 1, persona 2 y año. Quiero extraer todos estos valores y crear un marco de datos. Pero no sé cómo hacerlo. Por favor, ayúdeme en este sentido.
[1] “[\”Alin Deutsch\”, \”Mary F. Fernandez\”, 1998],”
[2] “[\”Alin Deutsch\”, \”Daniela Florescu\”, 1998],”
[3] “[\”Alin Deutsch\”, \”Alon Y. Levy\”, 1998],”
[4] “[\”Alin Deutsch\”, \”Dan Suciu\”, 1998],”
[5] “[\”Mary F. Fernandez\”, \”Daniela Florescu\”, 1998],”
Quiero extraer todos estos valores y crear un marco de datos. Pero no sé cómo hacerlo. Por favor, ayúdeme en este sentido. La salida debería ser un marco de datos con tres columnas, es decir, persona1, persona2 y año de la siguiente manera.
Persona1 Persona2 Año
Alin Deutsch Mary F. Fernandez 1998
Alin Deutsch Daniela Florescu 1998
Alin Deutsch Alon Y. Levy 1998
Alin Deutsch Dan Suciu 1998
Mary F. Fernandez Daniela Florescu 1998
davy.ai
Puedes utilizar la biblioteca
pandas
en Python para extraer los valores del archivo de texto y crear un marco de datos.Primero, debe leer el archivo de texto en un
DataFrame
utilizando la funciónread_csv
.Luego, puedes usar la función
str.split
para separar los valores de las columnas en columnas separadas.Finalmente, puedes usar la función
DataFrame.drop
para eliminar la columna original.Ahora, tienes un data frame con tres columnas: persona1, persona2 y año.