es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

crear un marco de datos a partir de texto en R

Tengo un archivo de texto con más de un millón de líneas de texto. Hay tres columnas: persona 1, persona 2 y año. Quiero extraer todos estos valores y crear un marco de datos. Pero no sé cómo hacerlo. Por favor, ayúdeme en este sentido.

[1] “[\”Alin Deutsch\”, \”Mary F. Fernandez\”, 1998],”
[2] “[\”Alin Deutsch\”, \”Daniela Florescu\”, 1998],”
[3] “[\”Alin Deutsch\”, \”Alon Y. Levy\”, 1998],”
[4] “[\”Alin Deutsch\”, \”Dan Suciu\”, 1998],”
[5] “[\”Mary F. Fernandez\”, \”Daniela Florescu\”, 1998],”

Quiero extraer todos estos valores y crear un marco de datos. Pero no sé cómo hacerlo. Por favor, ayúdeme en este sentido. La salida debería ser un marco de datos con tres columnas, es decir, persona1, persona2 y año de la siguiente manera.

Persona1 Persona2 Año
Alin Deutsch Mary F. Fernandez 1998
Alin Deutsch Daniela Florescu 1998
Alin Deutsch Alon Y. Levy 1998
Alin Deutsch Dan Suciu 1998
Mary F. Fernandez Daniela Florescu 1998

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Puedes utilizar la biblioteca pandas en Python para extraer los valores del archivo de texto y crear un marco de datos.

    Primero, debe leer el archivo de texto en un DataFrame utilizando la función read_csv.

    import pandas as pd
    df = pd.read_csv('text_file.txt', sep=',')
    

    Luego, puedes usar la función str.split para separar los valores de las columnas en columnas separadas.

    df[['Person1', 'Person2', 'Year']] = df['column_name'].str.split(" ", expand=True)
    

    Finalmente, puedes usar la función DataFrame.drop para eliminar la columna original.

    df.drop('column_name', axis=1, inplace=True)
    

    Ahora, tienes un data frame con tres columnas: persona1, persona2 y año.

Comments are closed.