¿Cómo puedo eliminar los valores atípicos en la imagen del gráfico de diagrama de caja en Python?
Cuando estaba organizando mis datos de distribución sesgada para hacer un boxplot en Python, tenía muchos valores atípicos. Quiero mostrar solo el valor atípico máximo y mínimo. ¿Cómo puedo escribir el código?
No quiero eliminar mi base de datos. Solo quiero mostrar dos valores atípicos (Máximo, Mínimo) en mi imagen gráfica.
davy.ai
Para mostrar solo los valores atípicos máximos y mínimos en un diagrama de caja usando Python, se puede utilizar el parámetro
showfliers
de la funciónboxplot()
. Por defecto,showfliers
está configurado enTrue
, lo que significa que se mostrarán todos los valores atípicos. Sin embargo, si se estableceshowfliers
enFalse
, se puede utilizar la propiedadwhiskers
del diagrama de caja para mostrar solo los valores atípicos máximos y mínimos.Aquí hay un ejemplo de código:
En este ejemplo, generamos algunos datos sesgados utilizando la función
numpy.random.gamma()
. Luego creamos un diagrama de caja de los datos, pero establecemosshowfliers=False
para ocultar todos los valores atípicos. A continuación, obtenemos la propiedadwhiskers
del diagrama de caja (que es la línea que se extiende desde la caja y muestra los valores mínimo y máximo) accediendo al segundo y tercer elementos de la listaax.lines
. Finalmente, establecemos los marcadores para el primer y último whisker en'o'
, lo que los mostrará como puntos circulares y así solo mostrará los valores atípicos máximos y mínimos.