es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Cómo eliminar valores atípicos utilizando la desviación estándar?

Tengo un conjunto de resultados de consulta que se ven un poco como esto:

customer|sales_growth_percentage
--------|-----------------------
A       |0,00
B       |0,00
C       |0,00
D       |15,05
E       |20,00
F       |25,10
G       |30,00
H       |500,00
I       |600,20

Lo que quiero hacer es calcular lo siguiente, excluyendo cualquier valor atípico estadístico en el crecimiento de las ventas (por ejemplo, clientes H e I):

count(customer),
sum(sales_growth_percentage) 

Sé que puedo calcular la desviación estándar usando la función STDDEV, que para el ejemplo anterior me da 224,84. ¿Alguien sabe cómo usar esto para excluir los valores atípicos por favor? ¿Son los valores atípicos literalmente cualquier cosa con un crecimiento de ventas superior a 224.84?

Presumo que podría guardar la desviación estándar como una variable, guardar mis resultados de consulta en una tabla temporal y luego seleccionar de la tabla temporal donde el porcentaje de crecimiento de ventas sea <=224.84? ¿Es esta la mejor manera de hacerlo o hay un método más efectivo?

¡Cualquier ayuda sería apreciada!

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Sí, se puede utilizar la desviación estándar para excluir valores atípicos. Los valores atípicos son aquellos que se encuentran significativamente por encima o por debajo del resto de los datos. En este caso, se considerarían valores atípicos cualquier valor por encima de 224,84.

    El método que sugirió es una buena manera de hacerlo. Puede guardar la desviación estándar como una variable, guardar los resultados de su consulta en una tabla temporal y luego seleccionar de la tabla temporal donde el porcentaje de crecimiento de las ventas sea <=224,84. Esto le dará el recuento y la suma de los porcentajes de crecimiento de ventas excluyendo los valores atípicos.

Comments are closed.