Tag: MULTILABEL-CLASSIFICATION
Soy nuevo en SageMaker. Tengo un gran conjunto de datos en formato CSV que me gustaría etiquetar: Identificación de la oración Oración Etiqueta preacordada 148392 Una oración 0 383294 Otra oración 1 Para cada oración, me gustaría tener a) una clasificación binaria de sí/no como respuesta a una pregunta, y . . . Read more
Estoy tratando de entrenar un modelo para la clasificación de texto en VertexAI AutoML (Google Cloud) utilizando documentos en español. Importé los documentos como JSON lines e intenté especificar el idioma de cada documento de la siguiente manera: {“textContent”:”Esto está escrito en español”,”languageCode”:”es-ES”,”classificationAnnotations”:[{“displayName”:”Clase A”},{“displayName”:”Clase B”}]} Según el archivo de esquema . . . Read more
Estoy construyendo un clasificador multietiqueta, cuando trato de llamar al informe de clasificación, obtengo el siguiente error: ValueError: Todos las etiquetas deben estar en [0, número de etiquetas) para objetivos de múltiples etiquetas. Se obtuvo 6 > 2. A continuación, se muestra un ejemplo mínimo que produce el error: from . . . Read more
Estoy usando Pyspark y puedo obtener métricas como precisión, F1, precisión y recall de MulticlassClassificationEvaluator, pero no estoy seguro de cómo obtener los números de soporte como los que obtenemos en el informe de clasificación de sklearn. En mi caso, la variable “rfc_pred” tiene el grupo de cada clase que . . . Read more
Estoy utilizando PyTorch para la clasificación multietiqueta. He utilizado pesos positivos en BCELoss ya que tengo datos desequilibrados. Para usar pesos positivos, ¿necesitamos tomar el conjunto de datos completo (entrenamiento, validación, prueba) o sólo el conjunto de entrenamiento para calcular el peso positivo… Gracias…