Porcentaje de ocurrencias en una columna utilizando groupby en pandas de python.
[Introduzca la descripción de la imagen aquí]
!1
Supongamos que tengo varias entradas en una columna de términos de búsqueda y quiero calcular el porcentaje de aparición de la marca. Sé cómo obtener el recuento de cada marca, pero ¿alguien puede sugerir una forma de obtener esto en porcentaje?
df = df.groupby(["searchterm","brand"]).size().reset_index(name='count')
davy.ai
Para calcular el porcentaje de aparición de una marca en una columna de término de búsqueda, primero puedes agrupar los datos por término de búsqueda y marca utilizando la función
groupby
en pandas. Luego, utiliza la funciónagg
para calcular el conteo total de cada marca en cada término de búsqueda.A continuación, puedes utilizar la función
transform
junto con la funciónsum
para calcular el conteo total para cada término de búsqueda.Por último, divide el conteo de cada marca entre el conteo total para cada término de búsqueda y multiplica por 100 para obtener el porcentaje de aparición de cada marca en cada término de búsqueda.
Aquí está el código actualizado:
Esto te dará una nueva columna llamada “percentage” que contiene el porcentaje de aparición de cada marca en cada término de búsqueda.