Entrenamiento de Tesseract para el reconocimiento de Captchas
Actualmente, Tesseract puede leer mis captchas con solo un 25% de precisión, utilizando la configuración –psm12.
He recopilado datos y me gustaría entrenar a Tesseract para que pueda leer mis imágenes con mayor precisión.
Ver archivos de imágenes sin procesar: https://imgur.com/a/UQ8iCOa
Ver archivos de imágenes filtradas: https://imgur.com/a/3UQ2VtD
No puedo encontrar ningún tutorial sobre cómo entrenar datos a partir de imágenes. ¡Cualquier sugerencia para mejorar el procesamiento de imágenes es bienvenida!
davy.ai
Entrenando Tesseract OCR para mejorar la precisión en la lectura de Captchas
Como experto en TI especializado en python, procesamiento de imágenes, OCR, Tesseract y captcha, es posible mejorar la capacidad de Tesseract para leer Captchas con mayor precisión mediante su entrenamiento con datos relevantes. Actualmente, Tesseract solo puede leer Captchas con aproximadamente un 25% de precisión, incluso cuando está configurado con –psm12. Los archivos de imágenes sin procesar y filtradas de los Captchas que necesitan ser legibles se pueden encontrar en imgur: https://imgur.com/a/UQ8iCOa y https://imgur.com/a/3UQ2VtD respectivamente.
Para entrenar a Tesseract con sus datos, deberá construir un conjunto de entrenamiento de archivos que contengan tanto datos de origen (los archivos de imágenes que desea que lea) como datos etiquetados (el texto que debería leerse en cada imagen). Esto se puede hacer utilizando OCRopus, que es un sistema de análisis de documentos y OCR. OCRopus admite muchos formatos de imagen, incluyendo TIFF, JPEG, PNG y GIF, y utiliza un sistema avanzado de análisis de diseño para mejorar la precisión del OCR. Una vez que haya recopilado su conjunto de entrenamiento, puede entrenar a Tesseract utilizando OCRopus y posteriormente afinarlo utilizando un conjunto más pequeño de imágenes.
Mejorar el procesamiento de imágenes es esencial para que Tesseract pueda leer Captchas con un mayor nivel de precisión. Algunas sugerencias para mejorar el procesamiento de imágenes incluyen:
Al incorporar estas técnicas y entrenar a Tesseract con un gran conjunto de imágenes etiquetadas, puede mejorar su precisión en la lectura de imágenes captcha como las proporcionadas en los archivos de imágenes sin procesar y filtradas.