es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: COUNTVECTORIZER

CountVectorizer no procesa mis datos de texto. Continuamente me arroja un AttributeError: el objeto ‘list’ no tiene el atributo ‘lower’.

He creado la función process_textData que toma una columna de texto de un DataFrame de pandas y realiza lo siguiente: 1. Convierte el texto a minúsculas y elimina toda la puntuación. 2. Opcionalmente, aplica el stemming. 3. Aplica la tokenización por n-gramas. 4. Devuelve el texto tokenizado como una lista. . . . Read more

CountVectorizer no es capaz de detectar palabras.

final_vocab = {‘Amazon’, ‘Big Bazaar’, ‘Brand Factory’, ‘Central’, ‘Cleartrip’, ‘Dominos’, ‘Flipkart’, ‘IRCTC’, ‘Lenskart’, ‘Lifestyle’, ‘MAX’, ‘MMT’, ‘More’, ‘Myntra’} vect = CountVectorizer(vocabulary=final_vocab) token_df = pd.DataFrame(vect.fit_transform([‘Big Bazaar’,’Brand Factory’]).todense(), columns=vect.get_feature_names()) ¿Por qué todas las salidas son cero? ¿Para Big Bazaar y Brand Factory no deberían venir los valores 1?