es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Prueba t para dos grupos en Python.

Estoy realizando un agrupamiento de k-means y quiero probar si los grupos resultantes son estadísticamente diferentes. En un agrupamiento de nivel 3, primero pruebo el grupo 0 con el grupo 1 y luego con el grupo 2. Luego pruebo el grupo 2 con el grupo 3. Intenté aplicar el agrupamiento de prueba-t como se muestra en el siguiente código. Los grupos tienen longitudes diferentes como ya sabes. ¿Estoy confundido acerca de la lógica? ¿Debo usar p>0.05 o p<0.05? ¿Entonces dónde poner True y False?

def compare_2_groups(ar1, ar2):
    s, p = ttest_ind(ar1, ar2)
    #if p>0.05:
    if p<0.05:
        return False
    else:
        return True
Tags:  , ,

Answer

  1. Avatar for davy.ai

    Basado en el escenario descrito, parece que estás tratando de comparar las medias de los grupos obtenidos a partir de la agrupación k-means para determinar si son estadísticamente diferentes. En este caso, puedes utilizar una prueba t, que compara las medias de dos grupos y determina si son significativamente diferentes.

    El código que proporcionaste muestra una función compare_2_groups que toma dos arreglos ar1 y ar2 como entradas, realiza una prueba t utilizando ttest_ind y devuelve True si el valor p es mayor a 0.05, lo que indica que las medias de los dos grupos no son significativamente diferentes, y devuelve False en caso contrario.

    Para aplicar esta función a tu escenario, primero necesitarías obtener los datos de cada grupo y crear los arreglos ar1 y ar2 para cada comparación par a par. Dado que los grupos tienen longitudes diferentes, deberías decidir cómo manejar las muestras desiguales. Una opción es muestrear aleatoriamente el grupo más grande para igualar el tamaño del grupo más pequeño antes de realizar la prueba t.

    Una vez que hayas realizado todas las comparaciones par a par, puedes informar los resultados en una matriz o tabla, donde cada celda representa el resultado de comparar el i-ésimo grupo con el j-ésimo grupo.

    En cuanto a la interpretación de los resultados, si eliges p>0.05, esto significaría que consideras que las medias no son significativamente diferentes si el valor p es mayor a 0.05. Alternativamente, si eliges p<0.05, esto significaría que consideras que las medias son significativamente diferentes si el valor p es menor a 0.05. La elección del umbral depende de tu pregunta de investigación y de tu hipótesis.

    En general, si rechazas la hipótesis nula (p<0.05), esto significa que las medias de los dos grupos son significativamente diferentes, mientras que no rechazar la hipótesis nula (p>0.05) significa que no hay una diferencia significativa entre las dos medias.

Comments are closed.