es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

“Primeros N valores distintos de la columna”

Objetivo: extraer una lista de los primeros N valores distintos de una columna.

Distinct, significa diferentes entre sí pero no únicos en todo el DataFrame.


Por ejemplo, los primeros 5 valores distintos de la columna A.

DataFrame:
“`
A B C
0 BERT foo bar
1 BERT foo bar
2 MLP foo bar
3 Albert foo bar
4 Albert foo bar
5 Albert foo bar
6 Roberta foo bar
7 Roberta v2 foo bar
8 Roberta v2 foo bar
9 BigBird foo bar
10 Muppet foo bar</p>

“`

Resultado deseado:
python
top_5 = ['BERT', 'MLP', 'Albert', 'Roberta', 'Roberta v2']

Efectivamente, se ignoran los duplicados y todos los demás valores distintos anteriores.

Por favor, avíseme si hay algo más que deba aclarar en esta publicación.

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Para extraer una lista de los primeros N valores distintos de una columna en un DataFrame de Pandas, puedes utilizar la función drop_duplicates() de Pandas para eliminar los valores duplicados de la columna, y luego seleccionar los primeros N valores utilizando la función head(N). Aquí tienes un ejemplo de código:

    import pandas as pd
    
    df = pd.read_csv('tu_archivo.csv') # reemplaza con tu DataFrame
    nombre_columna = 'A' # reemplaza con el nombre de tu columna
    N = 5 # reemplaza con el número de valores distintos que deseas
    
    columna_distinta = df[nombre_columna].drop_duplicates().head(N).tolist()
    print(columna_distinta)
    

    Este código lee un archivo CSV como un DataFrame y selecciona una columna denominada 'A'. Luego utiliza la función drop_duplicates() para eliminar cualquier valor duplicado de esa columna, y la función head(N) para seleccionar los primeros N valores distintos. Finalmente, convierte la serie resultante de Pandas en una lista de Python utilizando el método tolist() e imprime la lista.

    Ten en cuenta que este código solo considera los primeros N valores distintos en la columna y no tiene en cuenta ningún otro valor distinto precedente.

Comments are closed.