es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Aprendizaje automático, Transformador, Clasificación multiclase, el número de clases es inconsistente en los datos de prueba y los datos de entrenamiento.

Por ejemplo, supongamos que estoy construyendo un modelo transformer (de huggingface) y hay 20 clases en los datos de entrenamiento, sin embargo, solo hay 5 clases en los datos de prueba. Para configurar el modelo transformer de huggingface, por ejemplo, BertConfig, necesitamos proporcionar un parámetro: numlabels. ¿Debo establecer numlabels en 20 o 5 debido a que solo hay 5 clases en los datos de prueba?

Tags:  , ,

Answer

  1. Avatar for davy.ai

    En este escenario, se recomienda establecer el parámetro num_labels en 20, que es el número de clases en los datos de entrenamiento. Esto se debe a que el modelo se entrena con las 20 clases, y establecer el parámetro en 5 no proporcionaría suficiente información para que el modelo prediga con precisión las 5 clases en los datos de prueba. Además, establecer el parámetro en 20 asegura que el modelo pueda predecir con precisión las 20 clases, incluso si no están presentes las 20 clases en los datos de prueba.

Comments are closed.