es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Pase parámetros junto con la imagen para el reconocimiento de imágenes.

Necesito etiquetar una imagen dada con una solución de reconocimiento de imágenes, y luego examinar los resultados en función de otro parámetro.
Por ejemplo, puedo pasar la foto del Ayuntamiento de una determinada ciudad, y el algoritmo me devolvería etiquetas que identifican los posibles ayuntamientos, como Ayuntamiento de Bologna, Ayuntamiento de Modena, etc., y luego, en función de otro parámetro, la ubicación, me daría la etiqueta correcta, por ejemplo, si el parámetro es Modena, seleccionar el Ayuntamiento de Modena como la solución correcta.

En un caso donde el rendimiento es muy importante, ¿cómo estructurarías esto?
¿Tener un modelo enorme entrenado con todas las fotos y luego examinar los resultados?
¿Tener un modelo diferente para cada ciudad y seleccionar el correcto gracias al parámetro?
También hablé sobre esto con mi profesor y me sugirió crear un modelo de reconocimiento de imágenes que también tome el parámetro como entrada para que considere automáticamente solo la foto de esa ciudad, pero no he encontrado ninguna forma de hacer esto.
Mi primera solución fue entrenar un modelo utilizando la API de Firebase AutoML, pero si esto no se puede hacer, puedo hacer una solución personalizada desde cero utilizando Python o F#.

Tags:  , , ,

Answer

  1. Avatar for davy.ai

    Para lograr un alto rendimiento en este escenario, sería mejor seguir la sugerencia de su profesor y crear un modelo de Reconocimiento de Imágenes que tome el parámetro de ubicación como entrada. Esto permitiría que el modelo considere automáticamente solo las fotos de la ciudad específica y, por lo tanto, reducir el número de etiquetas posibles, lo que resultaría en resultados más rápidos y precisos.

    Un enfoque sería entrenar un modelo separado para cada ciudad, pero esto podría llevar mucho tiempo y requerir una gran cantidad de datos de entrenamiento. En cambio, podría considerar entrenar un modelo único que tome el parámetro de ubicación como una entrada adicional e incorporarlo a la arquitectura general del modelo. Dependiendo de los detalles de su caso de uso, esto podría implicar modificar un modelo preentrenado existente o construir una solución personalizada completamente desde cero.

    Otro factor a considerar es el tamaño y la complejidad del modelo. Si bien un modelo grande puede ser más preciso, también puede ser más lento de ejecutar y consumir más recursos. Por lo tanto, puede ser necesario encontrar un equilibrio entre el tamaño del modelo, la precisión y el rendimiento en función de los requisitos específicos de su aplicación.

    En general, es importante considerar cuidadosamente los compromisos y requisitos de su caso de uso específico y elegir un enfoque que maximice el rendimiento y cumpla con sus necesidades en términos de precisión, velocidad y consumo de recursos.

Comments are closed.