Tag: GENSIM
De acuerdo con la documentación de Gensim, el registro de cambios y respuestas previas en StackOverflow, sé que pasar datos de entrenamiento en el formato LineSentence al parámetro corpus_data puede acelerar drásticamente el entrenamiento de Any2Vec. La documentación sobre el formato LineSentence indica lo siguiente: Itera sobre un archivo que . . . Read more
from gensim.models import Word2Vec da como resultado el siguiente error ImportError: no se puede importar el nombre ‘Word2Vec’ de ‘gensim.models’ (ubicación desconocida) from gensim.models.word2vec import Word2Vec da el mismo error Después de eliminar todas las instalaciones de este paquete de Conda, desinstalar gensim con pip, instalar gensim con pip e . . . Read more
Estoy tratando de extraer las puntuaciones de tema para los documentos en mi conjunto de datos después de usar un modelo LDA. Específicamente, he seguido la mayor parte del código de aquí: https://www.machinelearningplus.com/nlp/topic-modeling-gensim-python/ He completado el modelo de tema y tengo los resultados que quiero, pero el código proporcionado solo . . . Read more
Estoy utilizando TSNE para graficar un modelo entrenado de word2vec (creado con gensim): labels = [] tokens = [] for word in model.wv.vocab: tokens.append(model[word]) labels.append(word) tsne_model = TSNE(perplexity=40, n_components=2, init=’pca’, n_iter=2500, random_state=23) new_values = tsne_model.fit_transform(tokens) x = [] y = [] for value in new_values: x.append(value[0]) y.append(value[1]) plt.figure(figsize=(50, 50)) for . . . Read more
Vi aquí https://radimrehurek.com/gensim/models/word2vec.html que la clase Word2Vec tiene un parámetro llamado shrink_windows y estoy tratando de entender cómo funciona para la arquitectura CBOW. ¿Qué hace específicamente? ¿Utiliza el relleno para asegurarse de tener contextos finales de la misma longitud?