Cómo comparar celdas con formatos de cadena en un archivo .csv y devolver las cinco mayores en Python.

davy.ai

July 12, 2023 at 7:30 am

Para crear una lista de los 5 autores más valorados a partir de los datos recopilados, puedes hacer lo siguiente:

Crear un diccionario para almacenar los nombres de los autores y sus puntuaciones.
Recorrer cada fila en el archivo CSV y actualizar el diccionario con la puntuación para cada autor.
Ordenar el diccionario por valor en orden descendente.
Escribir los 5 autores principales y sus puntuaciones en un nuevo archivo CSV.

Aquí está el código modificado con estos pasos implementados:

import csv

# Paso 1: Crear un diccionario para almacenar los nombres de los autores y sus puntuaciones
autores = {}

with open('goodreads-book.csv', 'r') as archivo_csv:
    lector_csv = csv.reader(archivo_csv)

    next(lector_csv)

    # Paso 2: Recorrer cada fila y actualizar el diccionario de autores
    for linea in lector_csv:
        autor = linea[0]
        puntuacion = linea[1]
        puntuacion = float(puntuacion[19:-8].replace(',', ''))  # convertir cadena a flotante

        if autor in autores:
            autores[autor] += puntuacion
        else:
            autores[autor] = puntuacion

# Paso 3: Ordenar el diccionario por valor en orden descendente
autores_top = sorted(autores.items(), key=lambda x: x[1], reverse=True)[:5]

# Paso 4: Escribir los 5 autores en un nuevo archivo CSV
with open("TopCincoAutoresValorados.csv", 'w', newline='') as nuevo_archivo:
    escritor_csv = csv.writer(nuevo_archivo)
    escritor_csv.writerow(['Autor', 'Puntuación Total'])

    for autor, puntuacion in autores_top:
        escritor_csv.writerow([autor, puntuacion])

Explicación:

En el paso 2, extraemos el nombre del autor y la puntuación de cada fila y actualizamos el diccionario autores. Si el autor ya existe en el diccionario, sumamos la nueva puntuación a su puntuación existente. Si no, agregamos el autor y su puntuación al diccionario.
En el paso 3, ordenamos el diccionario autores por valor (la puntuación total) en orden descendente y solo mantenemos los 5 autores principales mediante el uso de segmentación de listas.
En el paso 4, escribimos los 5 autores principales y sus puntuaciones totales en un nuevo archivo CSV llamado “TopCincoAutoresValorados.csv”. Primero escribimos la fila del encabezado, luego recorremos los autores principales y escribimos el nombre de cada autor y su puntuación total en una nueva fila.

Ten en cuenta que convertimos la puntuación de una cadena a un flotante y eliminamos las comas en el paso 2 para poder comparar las puntuaciones numéricamente.

Answer

davy.ai

July 12, 2023 at 7:30 am
Para crear una lista de los 5 autores más valorados a partir de los datos recopilados, puedes hacer lo siguiente:
1. Crear un diccionario para almacenar los nombres de los autores y sus puntuaciones.
2. Recorrer cada fila en el archivo CSV y actualizar el diccionario con la puntuación para cada autor.
3. Ordenar el diccionario por valor en orden descendente.
4. Escribir los 5 autores principales y sus puntuaciones en un nuevo archivo CSV.
Aquí está el código modificado con estos pasos implementados:
```
import csv

# Paso 1: Crear un diccionario para almacenar los nombres de los autores y sus puntuaciones
autores = {}

with open('goodreads-book.csv', 'r') as archivo_csv:
    lector_csv = csv.reader(archivo_csv)

    next(lector_csv)

    # Paso 2: Recorrer cada fila y actualizar el diccionario de autores
    for linea in lector_csv:
        autor = linea[0]
        puntuacion = linea[1]
        puntuacion = float(puntuacion[19:-8].replace(',', ''))  # convertir cadena a flotante

        if autor in autores:
            autores[autor] += puntuacion
        else:
            autores[autor] = puntuacion

# Paso 3: Ordenar el diccionario por valor en orden descendente
autores_top = sorted(autores.items(), key=lambda x: x[1], reverse=True)[:5]

# Paso 4: Escribir los 5 autores en un nuevo archivo CSV
with open("TopCincoAutoresValorados.csv", 'w', newline='') as nuevo_archivo:
    escritor_csv = csv.writer(nuevo_archivo)
    escritor_csv.writerow(['Autor', 'Puntuación Total'])

    for autor, puntuacion in autores_top:
        escritor_csv.writerow([autor, puntuacion])
```
Explicación:
- En el paso 2, extraemos el nombre del autor y la puntuación de cada fila y actualizamos el diccionario autores. Si el autor ya existe en el diccionario, sumamos la nueva puntuación a su puntuación existente. Si no, agregamos el autor y su puntuación al diccionario.
- En el paso 3, ordenamos el diccionario autores por valor (la puntuación total) en orden descendente y solo mantenemos los 5 autores principales mediante el uso de segmentación de listas.
- En el paso 4, escribimos los 5 autores principales y sus puntuaciones totales en un nuevo archivo CSV llamado “TopCincoAutoresValorados.csv”. Primero escribimos la fila del encabezado, luego recorremos los autores principales y escribimos el nombre de cada autor y su puntuación total en una nueva fila.
Ten en cuenta que convertimos la puntuación de una cadena a un flotante y eliminamos las comas en el paso 2 para poder comparar las puntuaciones numéricamente.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Cómo comparar celdas con formatos de cadena en un archivo .csv y devolver las cinco mayores en Python.

Answer

davy.ai