es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: TEXT-CLASSIFICATION

Cómo pasar la entrada de texto al clasificador MultinomialNB después de guardar el modelo.

Mi prueba de entrada es “SriRam”. Esto debe ser clasificado usando un modelo de aprendizaje automático para determinar si es un nombre masculino o femenino. Entonces, después de guardar el modelo: Importar joblib Importar numpy como np Importar pandas como pd Desde sklearn.feature_extraction.text importar CountVectorizer Gender_model = open(‘Gender_model.pkl’,’rb’) clf = . . . Read more

Tokenizar texto que contenga dígitos

Quiero crear un clasificador de texto, la entrada al modelo contiene dígitos junto con el texto que contiene información importante (no creo que pueda simplemente desechar los dígitos). ¿Hay alguna manera de tokenizar este tipo de entrada? La entrada se ve así: entrada: ——- Por favor, eche un vistazo al . . . Read more

Uso de TfidfVectorizer en un dataframe.

Tengo el dataframe que tiene 3 columnas (Reseñas positivas, Negativas y Puntuación): Tengo el siguiente código: from sklearn.feature_extraction.text import TfidfVectorizer<br> df_x = train_df[“Positive”]<br> df_y = train_df[“Score”]<br> cv = TfidfVectorizer()<br> df_xcv = cv.fit_transform(df_x)<br> a = df_xcv.toarray()<br> cv.get_feature_names() El cual está dando un error: AttributeError: el objeto ‘lista’ no tiene el atributo . . . Read more