es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Entrenamiento de Tesseract para el reconocimiento de Captchas

Actualmente, Tesseract puede leer mis captchas con solo un 25% de precisión, utilizando la configuración –psm12.

He recopilado datos y me gustaría entrenar a Tesseract para que pueda leer mis imágenes con mayor precisión.

Ver archivos de imágenes sin procesar: https://imgur.com/a/UQ8iCOa

Ver archivos de imágenes filtradas: https://imgur.com/a/3UQ2VtD

No puedo encontrar ningún tutorial sobre cómo entrenar datos a partir de imágenes. ¡Cualquier sugerencia para mejorar el procesamiento de imágenes es bienvenida!

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Entrenando Tesseract OCR para mejorar la precisión en la lectura de Captchas

    Como experto en TI especializado en python, procesamiento de imágenes, OCR, Tesseract y captcha, es posible mejorar la capacidad de Tesseract para leer Captchas con mayor precisión mediante su entrenamiento con datos relevantes. Actualmente, Tesseract solo puede leer Captchas con aproximadamente un 25% de precisión, incluso cuando está configurado con –psm12. Los archivos de imágenes sin procesar y filtradas de los Captchas que necesitan ser legibles se pueden encontrar en imgur: https://imgur.com/a/UQ8iCOa y https://imgur.com/a/3UQ2VtD respectivamente.

    Para entrenar a Tesseract con sus datos, deberá construir un conjunto de entrenamiento de archivos que contengan tanto datos de origen (los archivos de imágenes que desea que lea) como datos etiquetados (el texto que debería leerse en cada imagen). Esto se puede hacer utilizando OCRopus, que es un sistema de análisis de documentos y OCR. OCRopus admite muchos formatos de imagen, incluyendo TIFF, JPEG, PNG y GIF, y utiliza un sistema avanzado de análisis de diseño para mejorar la precisión del OCR. Una vez que haya recopilado su conjunto de entrenamiento, puede entrenar a Tesseract utilizando OCRopus y posteriormente afinarlo utilizando un conjunto más pequeño de imágenes.

    Mejorar el procesamiento de imágenes es esencial para que Tesseract pueda leer Captchas con un mayor nivel de precisión. Algunas sugerencias para mejorar el procesamiento de imágenes incluyen:

    • Limpiar la imagen eliminando ruido y cualquier línea o patrón irrelevante que pueda interferir con el proceso OCR.
    • Normalizar la imagen para eliminar cualquier variación en el brillo o contraste que pueda dificultar el reconocimiento del texto por parte de los programas OCR.
    • Reducir la complejidad de la imagen dividiéndola en secciones más pequeñas y manejables, o segmentándola en caracteres o palabras individuales.
    • Aplicar técnicas de preprocesamiento como binarización, suavizado y detección de bordes para mejorar la visibilidad del texto en la imagen.

    Al incorporar estas técnicas y entrenar a Tesseract con un gran conjunto de imágenes etiquetadas, puede mejorar su precisión en la lectura de imágenes captcha como las proporcionadas en los archivos de imágenes sin procesar y filtradas.

Comments are closed.