Tag: GENSIM

Transferencia de aprendizaje de vectores de palabras

01 Aug, 2023 Programación 0

Quiero adaptar vectores de palabras ya existentes (por ejemplo, de Spacy) y volver a entrenarlos en un conjunto de datos específico de un dominio bastante limitado. El problema es que no puedo encontrar una forma de tomar los vectores ya entrenados y adaptarlos a mis nuevos datos. Hasta ahora he . . . Read more

¿Existe una función de Gensim o cualquier otro paquete de Python para generar automáticamente una etiqueta para modelos de temas?

31 Jul, 2023 Programación 0

Tengo un conjunto de modelos de temas generados por el modelo LDA de Gensim. Me gustaría que se etiqueten automáticamente para poder elegir etiquetas significativas para cada tema más fácilmente. Me he encontrado con una función en el paquete textmineR del lenguaje R llamada LabelTopics, que creo que hace lo . . . Read more

Entrenamiento de un modelo LDA en gensim: el objeto ‘int’ no es subscriptable.

28 Jul, 2023 Programación 0

Creé una nueva lista de palabras en la que se eliminaron las palabras vacías de ‘text8’, para entrenar un Modelo LDA. Sin embargo, recibí el error “TypeError: el objeto ‘int’ no es subscribible”, suponiendo problemas con el corpus y no puedo encontrar las soluciones. Aquí está el código: import gensim . . . Read more

¿Existe alguna forma de ampliar el tamaño del vocabulario de los embeddings pre-entrenados (volver a entrenar los embeddings de palabras en un conjunto de datos personalizado sobre los existentes)?

28 Jul, 2023 Programación 0

TL;DR: ¿Existe alguna forma en Gensim de utilizar el Embedding existente y ampliar su vocabulario + aprendizaje al entrenarlo nuevamente en un conjunto de datos personalizado? Uno puede simplemente entrenar su propio Embedding en Gensim de la siguiente manera: from gensim.models import FastText # o cualquier otro modelo corpus = . . . Read more

No se puede cargar el modelo pre-entrenado de word2vec en el idioma coreano.

27 Jul, 2023 Programación 0

Me gustaría descargar y cargar el pre-entrenado word2vec para analizar texto en coreano. Descargo el pre-entrenado word2vec aquí: https://drive.google.com/file/d/0B0ZXk88koS2KbDhXdWg1Q2RydlU/view?resourcekey=0-Dq9yyzwZxAqT3J02qvnFwg desde el Github Pre-trained word vectors of 30+ languages: https://github.com/Kyubyong/wordvectors Mi versión de gensim es 4.1.0, por lo tanto usé: KeyedVectors.load_word2vec_format('./ko.bin', binary=False) para cargar el modelo. Pero hubo un error que . . . Read more

1 2 … 4

es.davy.ai

¿Tienes una pregunta?