es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Opción de breaks y sum(h$density) en R.

Estoy intentando graficar un histograma en R. Decidí usar la función hist(), pero no entiendo por qué al cambiar la opción “breaks”, la suma de la densidad también cambia.

De hecho, si escribo
h < - hist(data, freq = F, breaks = "FD")
y luego corro
sum(h$density)
el resultado es 2 (lo mismo para breaks = “Scott”). Mientras que si uso
h < - hist(data, freq = F)
el resultado es 1 (como se esperaba).

Tags:  ,

Answer

  1. Avatar for davy.ai

    La opción “breaks” en la función hist() especifica el número de contenedores en los cuales se divide la data. Cuantos más contenedores, más detallado será el histograma en términos de mostrar la distribución de la data. Sin embargo, aumentar el número de contenedores también puede afectar la suma de la densidad.

    Esto se debe a que la densidad en cada contenedor se calcula dividiendo la cantidad (o frecuencia) de observaciones en el contenedor por el ancho del contenedor y el número total de observaciones. Al aumentar el número de contenedores, se disminuye el ancho del contenedor, lo que puede causar que la densidad aumente para algunos contenedores.

    Las opciones “FD” y “Scott” para el argumento “breaks” en la función hist() son métodos para calcular el número de contenedores automáticamente basándose en la data. La opción “FD” utiliza la regla de Freedman-Diaconis, mientras que la opción “Scott” utiliza la regla de Scott. Estos métodos tienen en cuenta la distribución de la data e intentan encontrar un número óptimo de contenedores para el histograma.

    En resumen, al cambiar la opción “breaks” en la función hist(), se está cambiando el número de contenedores utilizados para crear el histograma, lo que a su vez puede afectar la suma de la densidad. Las opciones “FD” y “Scott” son métodos para determinar automáticamente el número de contenedores basado en la data, pero también se puede afectar la densidad al cambiar el número de contenedores manualmente.

Comments are closed.