Tag: TEXT-CLASSIFICATION

Entendiendo la salida del clasificador de múltiples etiquetas de Spacy (textcat_multilabel).

31 Jul, 2023 Programación 0

Estoy tratando de entender la salida de mi trabajo textcat_multilabel. Tengo 4 categorías de texto y estoy utilizando la versión 3.2.0 de spacy (Las metodologías han cambiado mucho recientemente y no entiendo realmente la documentación). E # PÉRDIDA TEXTC… CATS_SCORE SCORE 0 0 1.00 51.86 0.52 0 200 122.15 52.90 . . . Read more

Cómo pasar la entrada de texto al clasificador MultinomialNB después de guardar el modelo.

29 Jul, 2023 Programación 0

Mi prueba de entrada es “SriRam”. Esto debe ser clasificado usando un modelo de aprendizaje automático para determinar si es un nombre masculino o femenino. Entonces, después de guardar el modelo: Importar joblib Importar numpy como np Importar pandas como pd Desde sklearn.feature_extraction.text importar CountVectorizer Gender_model = open(‘Gender_model.pkl’,’rb’) clf = . . . Read more

¿Por qué mi modelo ELMo-CNN ofrece un rendimiento inferior al de Word2vec?

27 Jul, 2023 Programación 0

Quiero comparar el rendimiento entre ELMo y word2vec como embeddings de palabras utilizando el modelo CNN al clasificar 4000 datos de tweets en cinco etiquetas de clase, pero los resultados muestran que ELMo proporciona un peor rendimiento que word2vec. Utilicé ELMoformanylangs para ELMo y 1 millón de tweets pre-entrenados para . . . Read more

Tokenizar texto que contenga dígitos

23 Jul, 2023 Programación 0

Quiero crear un clasificador de texto, la entrada al modelo contiene dígitos junto con el texto que contiene información importante (no creo que pueda simplemente desechar los dígitos). ¿Hay alguna manera de tokenizar este tipo de entrada? La entrada se ve así: entrada: ——- Por favor, eche un vistazo al . . . Read more

Uso de TfidfVectorizer en un dataframe.

22 Jul, 2023 Programación 0

Tengo el dataframe que tiene 3 columnas (Reseñas positivas, Negativas y Puntuación): Tengo el siguiente código: from sklearn.feature_extraction.text import TfidfVectorizer df_x = train_df[“Positive”] df_y = train_df[“Score”] cv = TfidfVectorizer() df_xcv = cv.fit_transform(df_x) a = df_xcv.toarray() cv.get_feature_names() El cual está dando un error: AttributeError: el objeto ‘lista’ no tiene el atributo . . . Read more

1 2

es.davy.ai

¿Tienes una pregunta?