es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: OUTLIERS

Eliminación de valores atípicos en Spark con el rango intercuartílico resulta en un error.

Tengo la siguiente función recursiva que determina el valor atípico utilizando el método del rango intercuartílico: def interQuartileRangeFiltering(df: DataFrame): DataFrame = { @scala.annotation.tailrec def inner(cols: List[String], acc: DataFrame): DataFrame = cols match { case Nil => acc case column :: xs => val quantiles = acc.stat.approxQuantile(column, Array(0.25, 0.75), 0.0) // . . . Read more

Cómo iterar cada variable de un marco de datos haciendo referencia a ella dinámicamente?

Es posible hacer referencia a una columna de un dataframe si conoces su nombre (por ejemplo: dataframe1.time). Quiero iterar cada variable de un dataframe y llamarla de la siguiente manera: ‘por cada x, dataframe1.x’ numeric_vars = [‘CO_Mean’,’CO_Min’,’CO_Max’,’CO_Std’,’NO2_Mean’, ‘NO2_Min’, ‘NO2_Max’,’NO2_Std’, ‘O3_Mean’,’O3_Min’, ‘O3_Max’, ‘O3_Std’, ‘PM2.5_Mean’, ‘PM2.5_Min’, ‘PM2.5_Max’, ‘PM2.5_Std’, ‘PM10_Mean’, ‘PM10_Min’, ‘PM10_Max’, ‘PM10_Std’, . . . Read more

Implementando Sn y Qn (Rousseeuw y Croux) para la detección de valores atípicos en Postgres.

Estoy revisando y experimentando con estrategias para detectar valores atípicos y me encuentro constantemente con referencias a Sn y Qn de Rousseeuw y Croux en el documento “Alternativas a la Desviación Absoluta Mediana”. http://web.ipac.caltech.edu/staff/fmasci/home/astro_refs/BetterThanMAD.pdf Suenan excelentes y parecen ser ampliamente utilizados en estadísticas académicas y aplicadas en diferentes disciplinas. He . . . Read more