Tag: TOPIC-MODELING
Estoy intentando ejecutar un modelo de temas estructurales en R utilizando el paquete stm. El corpus es una colección de discursos en ruso. El problema que tengo es que las palabras en ruso no están siendo preprocesadas correctamente. Aquí está el código que he escrito hasta ahora: library(stm) # Paquete . . . Read more
Creé una visualización de LDA usando pyLDAvis y me preguntaba qué significa “token” en el título del gráfico de barras (es decir, Tema 3 (14% de tokens)). Leí la documentación de pyLDAvis, pero no pude encontrar una explicación. ¿Significa esto que el 14% de todos los documentos en el corpus . . . Read more
Tengo un conjunto de modelos de temas generados por el modelo LDA de Gensim. Me gustaría que se etiqueten automáticamente para poder elegir etiquetas significativas para cada tema más fácilmente. Me he encontrado con una función en el paquete textmineR del lenguaje R llamada LabelTopics, que creo que hace lo . . . Read more
Estaba interesado en ejecutar el modelo de tema anclado (también conocido como modelo de tema Corex) y lo ejecuté con éxito utilizando mi conjunto de datos. Pero cuando asigné probabilidades de tema a cada documento, descubrí que esas probabilidades se convirtieron casi en 1 o 0. Por ejemplo, vea la . . . Read more
Estoy trabajando en DIM (Modelo de Influencia de Documentos), y me pregunto cómo mostrar el ID del tema dominante para cada documento. No veo ninguna API lista para usar para eso. ¿Alguien puede ayudar?