es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: HUGGINGFACE-TRANSFORMERS

Conjunto de datos clave perdido durante el entrenamiento utilizando el entrenador de Hugging Face.

Estoy siguiendo el material del curso de Hugging Face: https://huggingface.co/course/chapter7/3?fw=pt (por cierto, excelente material). Sin embargo, ahora me encuentro con un problema. Cuando ejecuto el entrenamiento y la evaluación utilizando el datacollator predeterminado, todo va bien. Pero cuando uso el datacollator personalizado de enmascaramiento de palabras completas, no funciona porque . . . Read more

Cómo reducir el tiempo de ejecución para la traducción utilizando mBART-50 y Hugging Face?

Estoy utilizando mBART-50 y Hugging Face para traducir entre hindi e inglés. Pero lleva mucho tiempo cargar la biblioteca. ¿Hay alguna manera de optimizarlo? “` from transformers import MBartForConditionalGeneration, MBart50TokenizerFast modelo = MBartForConditionalGeneration.from_pretrained("facebook/mbart-large-50-many-to-many-mmt") tokenizer = MBart50TokenizerFast.from_pretrained("facebook/mbart-large-50-many-to-many-mmt", src_lang="hi_IN") texto = "मैं ठीक हूँ।" inputs_modelo = tokenizer(texto, return_tensors="pt") tokens_generados = modelo.generate(**inputs_modelo, forced_bos_token_id=tokenizer.lang_code_to_id["en_XX"]) . . . Read more

“Clave no válida: 0. Por favor, seleccione primero una división. Por ejemplo: `my_dataset_dictionary[‘train’][0]`. Divisiones disponibles: [‘train’].”

Intenté utilizar el API de conjunto de datos cargado con mis propios datos para entrenar el modelo de hunggingface. Este es mi código: train_data = datasets.load_dataset(‘csv’, data_files=”/gdrive/MyDrive/project/train.csv”) test_data = datasets.load_dataset(‘csv’, data_files=”/gdrive/MyDrive/project/test.csv”) train_data DatasetDict({ train: Dataset({ features: [‘Post’, ‘Label’], num_rows: 174 }) }) Pero en el entrenador, obtengo este mensaje de . . . Read more

Entrenar modelo de transformador con bajo rendimiento.

Estoy siguiendo este tutorial para intentar entrenar datos para la traducción de un lenguaje, pero utilizando solo mi CPU, tengo que esperar 5 horas para entrenar los datos (y después de estas 5 horas, se mata el proceso porque utiliza demasiados recursos). Aquí está mi configuración: – Sistema operativo: Ubuntu . . . Read more