es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Por qué el valor p / 2 para una prueba de t unicaudal es correcto?

Tengo una pregunta específica sobre el caso de una prueba de T-de-una-cola en Python.

En muchos artículos puedo leer la afirmación como esta:

En scipy no hay una forma directa de indicar que queremos ejecutar una variante unicaudal de la prueba. Sin embargo, para obtener los resultados deseados ajustamos el resultado por nosotros mismos. En el caso de esta configuración, simplemente necesitamos dividir el valor de p por 2 (el estadístico de prueba permanece igual).

Por ejemplo, aquí en https://towardsdatascience.com/one-tailed-or-two-tailed-test-that-is-the-question-1283387f631c

Y realmente no entiendo por qué la división por 2 funciona correctamente?

Veamos el histograma para unidireccional/bidireccional: aquí

Allí sólo hay la misma área bajo la curva pero de un lado. Y después de la transformación z no tenemos la misma distancia de std. (esto es 1.645, no 1.96).

Entonces, finalmente, la pregunta es: ¿Por qué si comprobamos la misma área bajo la curva y la distancia std es diferente, dividir por 2 es correcto?

PD: Si tienen alguna prueba matemática, ¡estaría muy agradecido!

Tags:  , , ,

Answer

  1. Avatar for davy.ai

    Al ejecutar una prueba de t de una cola en Python utilizando scipy, no hay una manera directa de indicarlo. Para obtener los resultados deseados, necesitamos ajustar la salida nosotros mismos. Específicamente, dividimos el valor p por 2.

    ¿Pero por qué dividir el valor p por 2 funciona correctamente?

    Consideremos el ejemplo de una prueba de una cola con una hipótesis nula de que la media es menor o igual a cierto valor. La hipótesis alternativa es que la media es mayor que este valor. En este caso, nos interesa saber si la media de la muestra es significativamente mayor que el valor hipotético.

    El área bajo la curva en una prueba de una cola corresponde a la probabilidad de obtener una estadística de prueba tan extremada o más extremada que el valor observado, suponiendo que la hipótesis nula es verdadera. Ahora, si observamos una prueba de dos colas, podemos ver que el área total bajo la curva se divide por igual entre las dos colas, y cada cola tiene un área igual a la mitad del área total.

    En este caso, como solo nos interesa el área correspondiente a la cola derecha, dividimos el valor p por 2 para obtener la probabilidad de obtener una estadística de prueba tan extremada o más extremada que el valor observado solo en la cola derecha. Esto se debe a que el área total bajo la curva en una prueba de una cola es igual al área bajo la cola derecha en una prueba de dos colas.

    En conclusión, dividir el valor p por 2 funciona correctamente porque nos da la probabilidad de obtener una estadística de prueba tan extremada o más extremada que el valor observado en la cola derecha de una prueba de dos colas, lo que equivale al área total bajo la curva en una prueba de una cola.

Comments are closed.