¿Por qué mi modelo ELMo-CNN ofrece un rendimiento inferior al de Word2vec?
Quiero comparar el rendimiento entre ELMo y word2vec como embeddings de palabras utilizando el modelo CNN al clasificar 4000 datos de tweets en cinco etiquetas de clase, pero los resultados muestran que ELMo proporciona un peor rendimiento que word2vec. Utilicé ELMoformanylangs para ELMo y 1 millón de tweets pre-entrenados para . . . Read more