es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

El ejemplo de la Distribución Normal Multivariante de Numpy no está claro.

No estoy seguro si esta pregunta corresponde a usuarios de numpy o matemáticos. No entiendo cómo funciona el ejemplo de numpy.random.multivariate_normal.

En la parte inferior de la documentación, se generan unos cuantos valores aleatorios dados una media y una matriz de covarianza:

mean = (1, 2)
cov = [[1, 0], [0, 1]]
x = np.random.multivariate_normal(mean, cov, (3, 3))

y luego dice:

Lo siguiente probablemente sea cierto, dado que 0.6 es aproximadamente dos veces la desviación estándar. list((x[0,0,:] - mean) < 0.6)

Entiendo que esto proviene de la regla empírica, pero no sé cómo la desviación estándar es 0.3. Dado que la varianza es 1 en cada eje, la desviación estándar (raíz cuadrada de la varianza) también debería ser 1, no 0.3.

Además, para variables multivariadas, esta regla del 95% ya no se cumple.

¿Alguien puede ayudarme con esto?

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Como experto en TI especializado en numpy, covarianza, distribución normal y desviación estándar, puedo explicar la confusión mencionada anteriormente.

    La desviación estándar de 0.3 mencionada en el ejemplo se deriva de la matriz de covarianza, donde los elementos diagonales representan las varianzas de cada eje. En este caso, la varianza de los ejes x e y es 1, y la desviación estándar es la raíz cuadrada de la varianza, que también es 1. Sin embargo, los elementos fuera de la diagonal en la matriz de covarianza representan la covarianza entre los dos ejes. Si estos elementos no son cero, significa que los dos ejes están correlacionados y la desviación estándar debe tener en cuenta eso.

    En este ejemplo en particular, la matriz de covarianza es la matriz identidad, lo que significa que los dos ejes no están correlacionados. Por lo tanto, los elementos fuera de la diagonal son cero y la desviación estándar sigue siendo 1 en ambos ejes.

    En cuanto a la regla empírica, es cierto que no se aplica a variables multivariadas, por lo que el ejemplo en la documentación no es del todo preciso. La regla empírica solo se puede aplicar a distribuciones normales univariadas, donde la media y la desviación estándar describen completamente la distribución. Para las distribuciones normales multivariadas, la forma y orientación de la distribución también juega un papel, lo que complica la comparación con la regla empírica.

    En resumen, el ejemplo en la documentación de numpy no es del todo preciso y la desviación estándar debería ser de 1 en lugar de 0.3. Además, la regla empírica no se puede aplicar directamente a distribuciones normales multivariadas.

Comments are closed.