Tag: ALLENNLP
Estoy tratando de calcular una matriz de similitud a partir de una lista de palabras de 12k elementos. Estoy utilizando una similitud de WordNet utilizando la herramienta Sematch. Con algunas palabras, estoy utilizando esta línea de código: wns_matrix = [[wns.word_similarity(w1, w2, ‘li’) for w1 in words] for w2 in words] . . . Read more
¿Existe alguna forma de convertir y utilizar el universal-sentence-encoder de Google (disponible a través de TF hub) en pytorch?
Entonces estoy utilizando un modelo de lenguaje pre-entrenado para la clasificación binaria. Ajusto el modelo mediante entrenamiento con datos específicos de mi tarea en particular. Los resultados son buenos, casi un 98% de medida-F. Sin embargo, cuando elimino una frase similar específica de los datos de entrenamiento y la añado . . . Read more
Por ejemplo, “India” es detectado como verdadero pero “india” es falso. d = Hunspell() d.spell(‘india’) Out[59]: False d.spell(‘India’) Out[60]: True ¿Cómo logro que Hunspell los detecte a ambos como verdaderos?
Estoy utilizando el conjunto de datos de Twitter de Kaggle y estoy intentando sobremuestrear la clase minoritaria. A pesar de que y es binario, el sobremuestreador devuelve un error indicando que es multiclase. Mis x e y son los tweets y las etiquetas, respectivamente.