Tag: COUNTVECTORIZER

CountVectorizer no procesa mis datos de texto. Continuamente me arroja un AttributeError: el objeto ‘list’ no tiene el atributo ‘lower’.

20 Jul, 2023 Programación 0

He creado la función process_textData que toma una columna de texto de un DataFrame de pandas y realiza lo siguiente: 1. Convierte el texto a minúsculas y elimina toda la puntuación. 2. Opcionalmente, aplica el stemming. 3. Aplica la tokenización por n-gramas. 4. Devuelve el texto tokenizado como una lista. . . . Read more

Problema al insertar los resultados del vectorizador de conteo en el dataframe.

20 Jul, 2023 Programación 0

Tengo un dataframe con forma (4237, 19) y luego otro dataframe con forma (4237, 6), necesito combinar ambos dataframes por columna, por lo que el dataframe resultante debería tener forma (4237, 25), pero obtengo (5524, 25). No puedo entender el problema. Código que he utilizado. social_media_vectorizer = CountVectorizer(lowercase=True) train_social_media_vector = . . . Read more

CountVectorizer no es capaz de detectar palabras.

07 Jun, 2023 Programación 0

final_vocab = {‘Amazon’, ‘Big Bazaar’, ‘Brand Factory’, ‘Central’, ‘Cleartrip’, ‘Dominos’, ‘Flipkart’, ‘IRCTC’, ‘Lenskart’, ‘Lifestyle’, ‘MAX’, ‘MMT’, ‘More’, ‘Myntra’} vect = CountVectorizer(vocabulary=final_vocab) token_df = pd.DataFrame(vect.fit_transform([‘Big Bazaar’,’Brand Factory’]).todense(), columns=vect.get_feature_names()) ¿Por qué todas las salidas son cero? ¿Para Big Bazaar y Brand Factory no deberían venir los valores 1?

es.davy.ai

¿Tienes una pregunta?

Tag: COUNTVECTORIZER

CountVectorizer no procesa mis datos de texto. Continuamente me arroja un AttributeError: el objeto ‘list’ no tiene el atributo ‘lower’.

Problema al insertar los resultados del vectorizador de conteo en el dataframe.

CountVectorizer no es capaz de detectar palabras.