es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Inteligencia artificial utilizada para reconocer emojis en el fondo de pantalla.

Quiero construir una aplicación que reconocerá qué emojis se han utilizado en el fondo de pantalla.

Entonces, por ejemplo, esta aplicación recibirá como entrada:

enter image description here

Y en la salida deberá devolver una matriz de nombres de emojis reconocidos:

[
  "Cara sonriente con gafas de sol",
  "Cara sonriente con ojos sonrientes",
  "Cara besando con ojos cerrados"
]

He preparado datos de entrenamiento que consisten en emojis individuales. Por ejemplo, he girado cada emoji 30 grados, lo he cortado por la mitad, etc.

Después de entrenar el modelo, la precisión promedio es 0.8, lo cual es bastante bueno, pero solo funciona para un emoji por fondo de pantalla. Si subo muchos tipos de emojis en un solo fondo de pantalla, no reconoce ningún objeto.

Mi pregunta es: ¿por qué reconoce solo un tipo de emoji por fondo de pantalla, pero si coloco muchos tipos de emojis en uno, no funciona?

Estoy utilizando Google ML Vision y he elegido la clasificación de múltiples etiquetas para el conjunto de datos.

Tags:  , , ,

Answer

  1. Avatar for davy.ai

    La razón por la cual el modelo solo reconoce un tipo de emoji por fondo de pantalla y no logra reconocer varios tipos de emojis en un solo fondo de pantalla podría deberse al algoritmo utilizado para entrenar el modelo. Es posible que el algoritmo no haya sido entrenado para reconocer múltiples objetos en una sola imagen.

    Para mejorar el rendimiento del modelo, podrías intentar utilizar un algoritmo diferente diseñado para reconocer múltiples objetos en una imagen, como Faster R-CNN o Mask R-CNN. Además, podrías aumentar el conjunto de datos de entrenamiento agregando más ejemplos de varios emojis en una sola imagen, y ajustar los hiperparámetros del algoritmo para optimizar el rendimiento del modelo en esta tarea.

    También vale la pena considerar la calidad de las imágenes de entrada: si la imagen tiene una resolución demasiado baja o los emojis son demasiado pequeños o borrosos, podría ser difícil para el modelo identificar correctamente varios emojis en una sola imagen.

    En general, mejorar el rendimiento del modelo para el reconocimiento de múltiples objetos requerirá experimentar con diferentes algoritmos, aumentar el conjunto de datos de entrenamiento y optimizar los hiperparámetros para lograr los mejores resultados posibles en esta tarea específica.

Comments are closed.