Tag: GENSIM
Quiero adaptar vectores de palabras ya existentes (por ejemplo, de Spacy) y volver a entrenarlos en un conjunto de datos específico de un dominio bastante limitado. El problema es que no puedo encontrar una forma de tomar los vectores ya entrenados y adaptarlos a mis nuevos datos. Hasta ahora he . . . Read more
Tengo un conjunto de modelos de temas generados por el modelo LDA de Gensim. Me gustaría que se etiqueten automáticamente para poder elegir etiquetas significativas para cada tema más fácilmente. Me he encontrado con una función en el paquete textmineR del lenguaje R llamada LabelTopics, que creo que hace lo . . . Read more
Creé una nueva lista de palabras en la que se eliminaron las palabras vacías de ‘text8’, para entrenar un Modelo LDA. Sin embargo, recibí el error “TypeError: el objeto ‘int’ no es subscribible”, suponiendo problemas con el corpus y no puedo encontrar las soluciones. Aquí está el código: import gensim . . . Read more
TL;DR: ¿Existe alguna forma en Gensim de utilizar el Embedding existente y ampliar su vocabulario + aprendizaje al entrenarlo nuevamente en un conjunto de datos personalizado? Uno puede simplemente entrenar su propio Embedding en Gensim de la siguiente manera: from gensim.models import FastText # o cualquier otro modelo corpus = . . . Read more
Me gustaría descargar y cargar el pre-entrenado word2vec para analizar texto en coreano. Descargo el pre-entrenado word2vec aquí: https://drive.google.com/file/d/0B0ZXk88koS2KbDhXdWg1Q2RydlU/view?resourcekey=0-Dq9yyzwZxAqT3J02qvnFwg desde el Github Pre-trained word vectors of 30+ languages: https://github.com/Kyubyong/wordvectors Mi versión de gensim es 4.1.0, por lo tanto usé: KeyedVectors.load_word2vec_format('./ko.bin', binary=False) para cargar el modelo. Pero hubo un error que . . . Read more