¿Cómo volver a descargar el tokenizer para Hugging Face?
Tengo el mismo problema exacto que https://github.com/huggingface/transformers/issues/11243, excepto que solo no funciona en Jupyter Lab. Sí funciona en Python en mi shell. EDICIÓN: ahora tampoco funciona en la shell después de cerrarla y abrirla de nuevo.
Descargué el modelo cardiffnlp/twitter-roberta-base-emotion
usando:
model_name = "cardiffnlp/twitter-roberta-base-emotion"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
Guardé el modelo con model.save_pretrained(model_name)
y ahora no puedo cargar el tokenizador. Si ejecuto:
tokenizer = AutoTokenizer.from_pretrained(model_name)
da el error:
OSError: No se puede cargar el tokenizador para 'cardiffnlp/twitter-roberta-base-emotion'. Asegúrese de que:
- 'cardiffnlp/twitter-roberta-base-emotion' es un identificador de modelo correcto que figura en 'https://huggingface.co/models'
(asegúrese de que 'cardiffnlp/twitter-roberta-base-emotion' no es una ruta hacia un directorio local con algo más, en ese caso)
- o 'cardiffnlp/twitter-roberta-base-emotion' es la ruta correcta hacia un directorio que contiene archivos de tokenizador relevantes.
Como guardé el modelo y no el tokenizador ayer, ya no puedo cargar el tokenizador. ¿Qué puedo hacer para solucionarlo? No entiendo cómo guardar el tokenizador si no puedo cargar el tokenizador.
davy.ai
Parece que hay un problema con la carga del tokenizador después de guardar el modelo con
model.save_pretrained()
. El mensaje de error sugiere que el identificador del modelo es incorrecto o que los archivos del tokenizador no están ubicados en el directorio correcto.Para solucionar este problema, puedes intentar lo siguiente:
cardiffnlp/twitter-roberta-base-emotion
está en la página de modelos de Hugging Face: https://huggingface.co/models. Si no está en la lista, es posible que debas usar un identificador de modelo diferente.Comprobar si los archivos del tokenizador están presentes: asegúrate de que los archivos del tokenizador estén en el mismo directorio que el modelo guardado. Puedes comprobar esto navegando hasta el directorio donde se guarda el modelo y verificando si hay un archivo de tokenizador presente.
Cargar el tokenizador usando una ruta local: si los pasos anteriores no funcionan, puedes intentar cargar el tokenizador usando una ruta local. Primero, navega hasta el directorio donde se guarda el modelo y determina la ruta al archivo del tokenizador. Luego, puedes usar el siguiente código para cargar el tokenizador:
from_pretrained()
. Para hacer esto, primero elimina los directorios del modelo y el tokenizador guardados. Luego, puedes usar el siguiente código para volver a descargar el modelo y el tokenizador:Ten en cuenta que esto volverá a descargar tanto el modelo como el tokenizador, por lo que puede llevar algún tiempo dependiendo del tamaño del modelo.