Tag: ALLENNLP

Intentando contar el número de palabras en un corpus y agregar el recuento como una columna en el conjunto de datos.

31 May, 2023 Programación 0

Estoy trabajando en un proyecto de texto y necesito contar la ocurrencia de palabras específicas por conversación. Tengo un bucle for que contará la ocurrencia para una fila pero tengo dificultades para agregar los resultados como columnas en el conjunto de datos. Este es el bucle que estoy usando: # . . . Read more

Tablas no detectadas con Tabula y Camelot.

30 May, 2023 Programación 0

Intenté extraer tablas de PDF que no están en el formato adecuado según creo. Las tablas en estos PDF tienen formato de tabla pero no están cerradas correctamente con bordes verticales. Adjuntaré el pdf de muestra y la salida con ambas bibliotecas. Cuando intenté utilizar tabula para la detección de . . . Read more

¿Cómo funciona el relleno de espacios (padding) en el tokenizer de huggingface?

30 May, 2023 Programación 0

Intenté seguir el ejemplo de tokenización siguiente: tokenizer = BertTokenizer.from_pretrained(MODEL_TYPE, do_lower_case=True) sent = “Me desagrada esto. No aquello.”, _tokenized = tokenizer(sent, padding=True, max_length=20, truncation=True) print(_tknzr.decode(_tokenized[‘input_ids’][0])) print(len(_tokenized[‘input_ids’][0])) La salida fue: [CLS] Me desagrada esto. No aquello. [SEP] 9 Observe el parámetro max_length=20 de tokenizer. ¿Cómo puedo hacer que el tokenizador de . . . Read more

Detectando el título de la música dentro de una cadena.

30 May, 2023 Programación 0

Actualmente estoy escribiendo mi propio asistente de voz en Python utilizando nltk para preprocesamiento y pytorch para procesar los datos. Después de muchas horas buscando cualquier método, no puedo encontrar una manera de extraer el título de una canción de otro texto hablado. Entonces, lo que quiero lograr es por . . . Read more

No se puede importar el nombre ‘TrainingArguments’ de ‘transformers’.

29 May, 2023 Programación 0

Estoy intentando ajustar un modelo BERT preentrenado de HuggingFace. Estoy importando lo siguiente: from transformers import (AutoTokenizer, AutoConfig, AutoModelForSequenceClassification, TrainingArguments, Trainer) y obtengo el siguiente error: no se puede importar el nombre ‘TrainingArguments’ de ‘transformers’ Tampoco puedo importar ‘Trainer’. Actualmente tengo instalados tensorflow 2.2.0, pytorch 1.7.1, y transformers 2.1.1.

1 … 25 26 27 … 30

es.davy.ai

¿Tienes una pregunta?

Tag: ALLENNLP

Intentando contar el número de palabras en un corpus y agregar el recuento como una columna en el conjunto de datos.

Tablas no detectadas con Tabula y Camelot.

¿Cómo funciona el relleno de espacios (padding) en el tokenizer de huggingface?

Detectando el título de la música dentro de una cadena.

No se puede importar el nombre ‘TrainingArguments’ de ‘transformers’.