Resumiendo todos los valores repetidos en un conjunto de datos.

davy.ai

June 15, 2023 at 2:58 pm

Sí, hay formas de hacer esto tanto en Python como en R.

En Python, una posible solución implicaría utilizar un diccionario para realizar un seguimiento del pago total de cada persona. Podemos recorrer cada fila en el conjunto de datos y actualizar el total de pago para la persona correspondiente en el diccionario. Aquí hay un código de muestra:

data = [
    ['Ann', 100],
    ['John', 200],
    ['Matt', 150],
    ['John', 150],
    ['John', 150],
    ['Ann', 300],
    ['Erik', 150]
]

totals = {}  # crear un diccionario vacío para almacenar los pagos totales

for row in data:
    name, payment = row  # extraer el nombre y el pago de la fila actual

    if name in totals:
        totals[name] += payment  # si hemos visto a esta persona antes, agregamos el pago a su total
    else:
        totals[name] = payment  # de lo contrario, creamos una nueva entrada de diccionario con el pago como total inicial

# crear una lista de tuplas a partir del diccionario, ordenado en orden descendente por el total de pago
sorted_totals = sorted(totals.items(), key=lambda x: x[1], reverse=True)

for name, total in sorted_totals:
    print(name, total)

Esto imprimirá la siguiente lista:

John 500
Ann 400
Matt 150
Erik 150

En R, un enfoque similar implicaría utilizar un data.frame y la función aggregate() para agrupar por la columna name y sumar la columna payment. Aquí hay un código de muestra:

data <- data.frame(
  name = c('Ann', 'John', 'Matt', 'John', 'John', 'Ann', 'Erik'),
  payment = c(100, 200, 150, 150, 150, 300, 150)
)

totals <- aggregate(payment ~ name, data, sum)

# ordenar el data.frame por pago en orden descendente
sorted_totals <- totals[order(totals$payment, decreasing = TRUE), ]

print(sorted_totals)

Esto imprimirá la siguiente lista:

  name payment
2 John     500
1  Ann     400
3 Matt     150
4 Erik     150

Ambas soluciones deberían poder manejar conjuntos de datos más grandes y agruparse automáticamente por nombre sin necesidad de definir cadenas específicas para cada nombre.

es.davy.ai

¿Tienes una pregunta?

Resumiendo todos los valores repetidos en un conjunto de datos.

Answer

davy.ai