Tag: DATA-SCIENCE
Tengo un dataframe con las columnas: Tiempo, ID, Medicamento y Valor. Aquí está mi código sobre cómo realizo el análisis de varianza de dos vías y las pruebas múltiples. #bibliotecas import pandas as pd import statsmodels.formula.api as sm from statsmodels.stats.anova import anova_lm from statsmodels.stats.multitest import multipletests import os df = . . . Read more
Tengo un dataframe que tiene los atributos “key”, “name” y “value”. Para cada grupo de “key”, quiero que los atributos “name” se guarden en un array. El valor de cada nombre se guardaría entonces en su propia columna llamada “_value”. Por ejemplo: key name value 0 A Patton 2 1 . . . Read more
¿Cuál es la funcionalidad exacta de get_blob_client()? get_blob_client(container, blob, snapshot=None) Entiendo que esta función crea automáticamente el blob si este aún no está disponible. Mi problema es: Anteriormente utilicé get_blob_client(container, blob, snapshot=None) para crear NUEVOS blobs. Ahora ni muestra errores ni crea el blob. Nota: Cuando intento utilizar download_blob(), aparece . . . Read more
Tengo un modelo de clasificación RandomForest entrenado con datos (30000 x 164) (entrenamiento-70%, prueba-30%). RandomForestClassifier(n_estimators= 200, max_features= ‘sqrt’, random_state=40) Resultados de prueba= Sensibilidad – 75, Especificidad – 99 Debido a que tengo clases desequilibradas (1s-10%, 0s-90%), tuve que obtener las probabilidades y extraer las clases basándome en un valor de . . . Read more
Tengo un Dataframe con la lista de estados y la lista de salarios en cada estado. Necesito agrupar por estado y averiguar cuántas entradas hay en cada rango de salarios (hay 3 rangos de salarios en total), crear un Dataframe y ordenar el resultado según el nombre del estado. ¿Existe . . . Read more