Tag: ALLENNLP
Quiero adaptar vectores de palabras ya existentes (por ejemplo, de Spacy) y volver a entrenarlos en un conjunto de datos específico de un dominio bastante limitado. El problema es que no puedo encontrar una forma de tomar los vectores ya entrenados y adaptarlos a mis nuevos datos. Hasta ahora he . . . Read more
Quiero crear un NER para obtener las entidades de la oración (persa-farsi) y Spacy no tiene el idioma persa, la oración se ve así: en –> ‘Compré 5 manzanas a Richard por $45’ fa –> ‘من ۵ تا سیب از ریچارد خریدم به قیمت ۴۵ دلار’ output = { ‘producto’: . . . Read more
Estoy utilizando la implementación por defecto y básica de Clasificación de Texto como sigue: tokenizer = Tokenizer(num_words=tamaño_vocabulario, filters=filtros) tokenizer.fit_on_texts(list(train_X)) train_X = tokenizer.texts_to_sequences(train_X) val_X = tokenizer.texts_to_sequences(val_X) train_X = pad_sequences(train_X, maxlen=longitud_maxima) val_X = pad_sequences(val_X, maxlen=longitud_maxima) def obtener_coeficientes(palabra,*arr): return palabra, np.asarray(arr, dtype=’float32′) #Para cargar el Embedding embeddings_index = dict(obtener_coeficientes(*o.split(” “)) for o in . . . Read more
Actualmente estoy trabajando en la construcción de un analizador de sentimientos basado en entidades, que, al proporcionarle un fragmento de texto, detectará las entidades y dará un puntaje de sentimiento para cada entidad. Por ejemplo, consideremos el siguiente texto: ICICI bank informó pérdidas en el primer trimestre del FY 2022. . . . Read more
He pasado todo el día en esto y no puedo encontrar mi error. Estoy seguro de que alguien más podrá detectarlo en un segundo (por lo cual estaré agradecido). Tengo algunos archivos de texto que necesito analizar; no importa lo que haya en ellos (usa Lorem Ipsum como ejemplo reproducible). . . . Read more