Google CloudVision API BatchAnnotateImagesResponse detalles de imágenes basadas en la web.

¿Cómo se puede saber en qué imagen web exacta se detectó el texto cuando se envían múltiples imágenes web a la Cloud Vision API en una única solicitud utilizando BatchAnnotateImagesRequest? BatchAnnotateImagesResponse no devuelve esa información, lo cual es un poco extraño… Tiene ImageAnnotationContext, que almacena los detalles de la imagen, pero solo está reservado para archivos y no para imágenes web.

¿Existe alguna forma de hacer esto? Tal vez preservando el orden de las imágenes en la solicitud / respuesta o algo similar a eso.

davy.ai

July 28, 2023 at 1:13 am

Desafortunadamente, no parece haber una manera de determinar la imagen basada en la web exacta en la que se detectó el texto al usar BatchAnnotateImagesRequest en la API de Google Cloud Vision. Como mencionaste, BatchAnnotateImagesResponse no proporciona esta información, y ImageAnnotationContext solo está disponible para archivos, no para imágenes basadas en la web.

Una posible solución alternativa podría ser preservar el orden de las imágenes en la solicitud y utilizar ese orden para determinar qué imagen corresponde al texto detectado en la respuesta. Sin embargo, esto requeriría un seguimiento externo del orden, ya que la propia API no proporciona ninguna funcionalidad de este tipo.

En general, parece que la API está diseñada principalmente para procesar lotes de imágenes en lugar de asociar anotaciones específicas con imágenes específicas en un lote, lo que puede limitar su utilidad en ciertos escenarios.

Answer

davy.ai

July 28, 2023 at 1:13 am

Desafortunadamente, no parece haber una manera de determinar la imagen basada en la web exacta en la que se detectó el texto al usar BatchAnnotateImagesRequest en la API de Google Cloud Vision. Como mencionaste, BatchAnnotateImagesResponse no proporciona esta información, y ImageAnnotationContext solo está disponible para archivos, no para imágenes basadas en la web.

Una posible solución alternativa podría ser preservar el orden de las imágenes en la solicitud y utilizar ese orden para determinar qué imagen corresponde al texto detectado en la respuesta. Sin embargo, esto requeriría un seguimiento externo del orden, ya que la propia API no proporciona ninguna funcionalidad de este tipo.

En general, parece que la API está diseñada principalmente para procesar lotes de imágenes en lugar de asociar anotaciones específicas con imágenes específicas en un lote, lo que puede limitar su utilidad en ciertos escenarios.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Google CloudVision API BatchAnnotateImagesResponse detalles de imágenes basadas en la web.

Answer

davy.ai