Tag: ALLENNLP
Estoy trabajando en un proyecto de texto y necesito contar la ocurrencia de palabras específicas por conversación. Tengo un bucle for que contará la ocurrencia para una fila pero tengo dificultades para agregar los resultados como columnas en el conjunto de datos. Este es el bucle que estoy usando: # . . . Read more
Intenté extraer tablas de PDF que no están en el formato adecuado según creo. Las tablas en estos PDF tienen formato de tabla pero no están cerradas correctamente con bordes verticales. Adjuntaré el pdf de muestra y la salida con ambas bibliotecas. Cuando intenté utilizar tabula para la detección de . . . Read more
Intenté seguir el ejemplo de tokenización siguiente: tokenizer = BertTokenizer.from_pretrained(MODEL_TYPE, do_lower_case=True) sent = “Me desagrada esto. No aquello.”, _tokenized = tokenizer(sent, padding=True, max_length=20, truncation=True) print(_tknzr.decode(_tokenized[‘input_ids’][0])) print(len(_tokenized[‘input_ids’][0])) La salida fue: [CLS] Me desagrada esto. No aquello. [SEP] 9 Observe el parámetro max_length=20 de tokenizer. ¿Cómo puedo hacer que el tokenizador de . . . Read more
Actualmente estoy escribiendo mi propio asistente de voz en Python utilizando nltk para preprocesamiento y pytorch para procesar los datos. Después de muchas horas buscando cualquier método, no puedo encontrar una manera de extraer el título de una canción de otro texto hablado. Entonces, lo que quiero lograr es por . . . Read more
Estoy intentando ajustar un modelo BERT preentrenado de HuggingFace. Estoy importando lo siguiente: from transformers import (AutoTokenizer, AutoConfig, AutoModelForSequenceClassification, TrainingArguments, Trainer) y obtengo el siguiente error: no se puede importar el nombre ‘TrainingArguments’ de ‘transformers’ Tampoco puedo importar ‘Trainer’. Actualmente tengo instalados tensorflow 2.2.0, pytorch 1.7.1, y transformers 2.1.1.