¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: ALLENNLP

Obtener una matriz de similitud cuadrada a partir de una lista de palabras.

26 Jul, 2023 Programación 0

Estoy tratando de calcular una matriz de similitud a partir de una lista de palabras de 12k elementos. Estoy utilizando una similitud de WordNet utilizando la herramienta Sematch. Con algunas palabras, estoy utilizando esta línea de código: wns_matrix = [[wns.word_similarity(w1, w2, ‘li’) for w1 in words] for w2 in words] . . . Read more

Transforma TF universal-sentence-encoder a torch.

26 Jul, 2023 Programación 0

¿Existe alguna forma de convertir y utilizar el universal-sentence-encoder de Google (disponible a través de TF hub) en pytorch?

Cómo mejorar el modelo de lenguaje, por ejemplo BERT, en textos no vistos durante el entrenamiento

26 Jul, 2023 Programación 0

Entonces estoy utilizando un modelo de lenguaje pre-entrenado para la clasificación binaria. Ajusto el modelo mediante entrenamiento con datos específicos de mi tarea en particular. Los resultados son buenos, casi un 98% de medida-F. Sin embargo, cuando elimino una frase similar específica de los datos de entrenamiento y la añado . . . Read more

Hunspell para Python detecta palabras únicamente como inglés si la primera letra está en mayúscula.

25 Jul, 2023 Programación 0

Por ejemplo, “India” es detectado como verdadero pero “india” es falso. d = Hunspell() d.spell(‘india’) Out[59]: False d.spell(‘India’) Out[60]: True ¿Cómo logro que Hunspell los detecte a ambos como verdaderos?

Datos binarios sin embargo el oversampler indica que están etiquetados de manera múltiple.

25 Jul, 2023 Programación 0

Estoy utilizando el conjunto de datos de Twitter de Kaggle y estoy intentando sobremuestrear la clase minoritaria. A pesar de que y es binario, el sobremuestreador devuelve un error indicando que es multiclase. Mis x e y son los tweets y las etiquetas, respectivamente.

1 … 9 10 11 … 30