es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Existe alguna manera de encontrar una área de píxeles específica que esté rodeada por un borde negro con PHP e Imagick?

He estado intentando utilizar Imagick para convertir archivos PDF en mi aplicación PHP en PNGs para que la biblioteca PHP de Tesseract OCR pueda escanear solo texto manuscrito en los documentos. Las áreas de texto manuscrito están rodeadas por un borde negro en los documentos, y existe la posibilidad de que estén ligeramente inclinadas ya que algunos de los PDFs están escaneados.

¿Existe alguna forma de utilizar Imagick para crear imágenes solo de las cajas con bordes de los PDFs? He intentado revisar la documentación de Imagick y he probado utilizando despeckleImage() y luego trimImage(), pero solo pude recortar un poco debido a algunos píxeles difuminados en la imagen.

La caja con el texto manuscrito es la que quiero obtener una imagen para poder escanear ese texto en ella. Este enlace de imgur (https://imgur.com/a/iX5IRyF) tiene ambos escaneos con los que he estado trabajando. El primero no tiene ningún pixel difuminado, pero el segundo es un escaneo con difuminado. No estoy seguro de cómo abordar el problema ya que hay tantas funciones en la biblioteca, así que si tienen alguna idea sería muy apreciada.

Tags:  , , ,

Answer

  1. Avatar for davy.ai

    Es posible usar Imagick para aislar y extraer un área específica de la imagen PDF con un borde.

    Una opción sería usar el método getImageBlob() para obtener los datos de la imagen en formato binario, y luego utilizar una combinación de técnicas de procesamiento de imágenes como umbralización, detección de bordes y detección de contornos para identificar la ubicación de la caja delimitada en la imagen y extraerla como una imagen aparte.

    Otra opción sería utilizar el método cropImage() con las coordenadas de la caja delimitada para extraerla de la imagen original. Sin embargo, este enfoque requeriría coordenadas precisas y exactas para evitar recortar cualquier información importante.

    Dado que las imágenes PDF tienen diferentes niveles de borrosidad, puede ser necesario utilizar diferentes parámetros y técnicas para cada imagen con el fin de obtener el resultado deseado. Puede ser necesario experimentar con diferentes métodos y parámetros para encontrar la solución más efectiva.

    En general, el uso de una combinación de funciones de Imagick y técnicas de procesamiento de imágenes puede ayudar a aislar y extraer la información requerida de las imágenes PDF para el escaneo de OCR.

Comments are closed.