Tag: TEXT-CLASSIFICATION
Estoy tratando de entender la salida de mi trabajo textcat_multilabel. Tengo 4 categorías de texto y estoy utilizando la versión 3.2.0 de spacy (Las metodologías han cambiado mucho recientemente y no entiendo realmente la documentación). E # PÉRDIDA TEXTC… CATS_SCORE SCORE 0 0 1.00 51.86 0.52 0 200 122.15 52.90 . . . Read more
Mi prueba de entrada es “SriRam”. Esto debe ser clasificado usando un modelo de aprendizaje automático para determinar si es un nombre masculino o femenino. Entonces, después de guardar el modelo: Importar joblib Importar numpy como np Importar pandas como pd Desde sklearn.feature_extraction.text importar CountVectorizer Gender_model = open(‘Gender_model.pkl’,’rb’) clf = . . . Read more
Quiero comparar el rendimiento entre ELMo y word2vec como embeddings de palabras utilizando el modelo CNN al clasificar 4000 datos de tweets en cinco etiquetas de clase, pero los resultados muestran que ELMo proporciona un peor rendimiento que word2vec. Utilicé ELMoformanylangs para ELMo y 1 millón de tweets pre-entrenados para . . . Read more
Quiero crear un clasificador de texto, la entrada al modelo contiene dígitos junto con el texto que contiene información importante (no creo que pueda simplemente desechar los dígitos). ¿Hay alguna manera de tokenizar este tipo de entrada? La entrada se ve así: entrada: ——- Por favor, eche un vistazo al . . . Read more
Tengo el dataframe que tiene 3 columnas (Reseñas positivas, Negativas y Puntuación): Tengo el siguiente código: from sklearn.feature_extraction.text import TfidfVectorizer<br> df_x = train_df[“Positive”]<br> df_y = train_df[“Score”]<br> cv = TfidfVectorizer()<br> df_xcv = cv.fit_transform(df_x)<br> a = df_xcv.toarray()<br> cv.get_feature_names() El cual está dando un error: AttributeError: el objeto ‘lista’ no tiene el atributo . . . Read more