Tag: WORD2VEC
Tengo una base de datos de varias miles de enunciados. Cada registro (enunciado) es un texto que representa una descripción del problema que un usuario ha enviado a un servicio de asistencia. A veces también se incluye la respuesta del agente de servicio. El lenguaje es altamente técnico y contiene . . . Read more
Necesito guardar/acceder/obtener tanto los vectores de contexto como los vectores de objetivo cuando ajusto/entreno mi modelo. Más claramente, Word2vec entrena dos capas de pesos también conocidos como vectores de contexto y vectores de objetivo. Parece que solo puedo guardar/acceder a los vectores de contexto. Aquí está mi código: from Pyspark.ml.feature . . . Read more
Quiero usar Word2Vec para representar palabras por vectores. Si hay 2 palabras idénticas en la entrada de Word2Vec, ¿es posible obtener una representación diferente para ellas? ¿Existen diferentes métodos para resolver este problema?
Soy nuevo en procesamiento del lenguaje natural (NLP). Estoy aprendiendo sobre word2vec y tratando de entender cuándo es útil y cuándo no. En este caso, estoy tratando de averiguar si word2vec sería útil para analizar nuevas palabras/úsos a medida que se desarrollan. Me gustaría saber aproximadamente cuántas instancias/muestras (en contexto) . . . Read more
Vi aquí https://radimrehurek.com/gensim/models/word2vec.html que la clase Word2Vec tiene un parámetro llamado shrink_windows y estoy tratando de entender cómo funciona para la arquitectura CBOW. ¿Qué hace específicamente? ¿Utiliza el relleno para asegurarse de tener contextos finales de la misma longitud?