Tag: GENSIM

Mis datos de entrenamiento contienen saltos de línea; ¿cómo puedo trabajar con el formato LineSentence de Gensim para el parámetro corpus_file?

17 Jul, 2023 Programación 0

De acuerdo con la documentación de Gensim, el registro de cambios y respuestas previas en StackOverflow, sé que pasar datos de entrenamiento en el formato LineSentence al parámetro corpus_data puede acelerar drásticamente el entrenamiento de Any2Vec. La documentación sobre el formato LineSentence indica lo siguiente: Itera sobre un archivo que . . . Read more

Error de instalación del paquete Gensim/word2vec no reconocido.

17 Jul, 2023 Programación 0

from gensim.models import Word2Vec da como resultado el siguiente error ImportError: no se puede importar el nombre ‘Word2Vec’ de ‘gensim.models’ (ubicación desconocida) from gensim.models.word2vec import Word2Vec da el mismo error Después de eliminar todas las instalaciones de este paquete de Conda, desinstalar gensim con pip, instalar gensim con pip e . . . Read more

Extraer puntajes de temas para documentos LDA Gensim Python

16 Jul, 2023 Programación 0

Estoy tratando de extraer las puntuaciones de tema para los documentos en mi conjunto de datos después de usar un modelo LDA. Específicamente, he seguido la mayor parte del código de aquí: https://www.machinelearningplus.com/nlp/topic-modeling-gensim-python/ He completado el modelo de tema y tengo los resultados que quiero, pero el código proporcionado solo . . . Read more

Cómo trazar tsne en word2vec (creado desde gensim) para los 20 casos más similares?

14 Jul, 2023 Programación 0

Estoy utilizando TSNE para graficar un modelo entrenado de word2vec (creado con gensim): labels = [] tokens = [] for word in model.wv.vocab: tokens.append(model[word]) labels.append(word) tsne_model = TSNE(perplexity=40, n_components=2, init=’pca’, n_iter=2500, random_state=23) new_values = tsne_model.fit_transform(tokens) x = [] y = [] for value in new_values: x.append(value[0]) y.append(value[1]) plt.figure(figsize=(50, 50)) for . . . Read more

Gensim Word2vec, ¿cómo funciona el parámetro “shrink_windows”= true en el estilo cbow?

28 May, 2023 Programación 0

Vi aquí https://radimrehurek.com/gensim/models/word2vec.html que la clase Word2Vec tiene un parámetro llamado shrink_windows y estoy tratando de entender cómo funciona para la arquitectura CBOW. ¿Qué hace específicamente? ¿Utiliza el relleno para asegurarse de tener contextos finales de la misma longitud?

1 2 3 4

es.davy.ai

¿Tienes una pregunta?