Obtener nombre si los valores del rango son verdaderos en Python

davy.ai

August 5, 2023 at 11:40 am

Para obtener el resultado deseado, podrías usar el siguiente código:

import pandas as pd

# Leyendo el dataframe
df = pd.read_csv('tu_data.csv')

# Creando una función para obtener la década de un año
def obtener_decada(año):
    return int(str(año)[:3] + '0')

# Comprobando si el año está dentro de su década desde 1960 hasta ahora
df['Década'] = df['año'].apply(obtener_decada)
df['EnRango'] = (df['Década'] >= 1960) & (df['Década'] <= 2020)

# Agrupando por Nombre y seleccionando aquellos que tengan al menos un EnRango verdadero
resultado = df.groupby('Nombre')['EnRango'].any()
print(resultado[resultado].index.tolist())

Explicación:

Primero, leemos el DataFrame utilizando pd.read_csv('tu_data.csv'), asumiendo que los datos están almacenados en un archivo CSV.
A continuación, creamos una función llamada obtener_decada que recibe un año como entrada y devuelve la década de ese año como un entero. Por ejemplo, obtener_decada(1985) devuelve 1980. Aplicaremos esta función a la columna año para crear una nueva columna llamada Década.
Luego, creamos una nueva columna llamada EnRango, que es el resultado de una expresión booleana que verifica si la Década se encuentra entre 1960 y 2020 (inclusive).
Después de eso, agrupamos el DataFrame por Nombre y seleccionamos solo los grupos donde al menos un elemento de la columna EnRango es verdadero utilizando resultado[resultado]. Finalmente, utilizamos index.tolist() para obtener la lista de nombres únicos de esos grupos.

La salida de este código será ['a', 'b'], que es lo que esperábamos.

Answer

davy.ai

August 5, 2023 at 11:40 am
Para obtener el resultado deseado, podrías usar el siguiente código:
```
import pandas as pd

# Leyendo el dataframe
df = pd.read_csv('tu_data.csv')

# Creando una función para obtener la década de un año
def obtener_decada(año):
    return int(str(año)[:3] + '0')

# Comprobando si el año está dentro de su década desde 1960 hasta ahora
df['Década'] = df['año'].apply(obtener_decada)
df['EnRango'] = (df['Década'] >= 1960) & (df['Década'] <= 2020)

# Agrupando por Nombre y seleccionando aquellos que tengan al menos un EnRango verdadero
resultado = df.groupby('Nombre')['EnRango'].any()
print(resultado[resultado].index.tolist())
```
Explicación:
- Primero, leemos el DataFrame utilizando pd.read_csv('tu_data.csv'), asumiendo que los datos están almacenados en un archivo CSV.
- A continuación, creamos una función llamada obtener_decada que recibe un año como entrada y devuelve la década de ese año como un entero. Por ejemplo, obtener_decada(1985) devuelve 1980. Aplicaremos esta función a la columna año para crear una nueva columna llamada Década.
- Luego, creamos una nueva columna llamada EnRango, que es el resultado de una expresión booleana que verifica si la Década se encuentra entre 1960 y 2020 (inclusive).
- Después de eso, agrupamos el DataFrame por Nombre y seleccionamos solo los grupos donde al menos un elemento de la columna EnRango es verdadero utilizando resultado[resultado]. Finalmente, utilizamos index.tolist() para obtener la lista de nombres únicos de esos grupos.
La salida de este código será ['a', 'b'], que es lo que esperábamos.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Obtener nombre si los valores del rango son verdaderos en Python

Answer

davy.ai