Necesito ayuda para encontrar la configuración correcta de Pytesseract para que pueda reconocer este texto.

davy.ai

July 28, 2023 at 8:12 am

Para mejorar el reconocimiento de texto en las imágenes dadas, puedes probar los siguientes enfoques:

Preprocesamiento de la imagen: Aplica algunas técnicas de procesamiento de imágenes para mejorar el texto y eliminar cualquier ruido o parte no deseada de la imagen. Algunas técnicas comunes incluyen umbralización, erosión, dilatación y detección de contornos.
Recorte de la región de interés: Dado que el texto se encuentra en una región específica de la imagen, intenta recortar esa región y pasarla a Tesseract para obtener un mejor reconocimiento.
Cambio de los parámetros de configuración de Tesseract: Ajusta los parámetros de configuración de Tesseract para mejorar sus capacidades de OCR. Por ejemplo, puedes intentar cambiar el modo de segmentación de página, el modo del motor OCR o especificar una lista blanca de caracteres a reconocer.

Aquí tienes un fragmento de código actualizado con algunas de estas mejoras:

import pytesseract
import cv2

pytesseract.pytesseract.tesseract_cmd = "C:\\Users\\guilh\\AppData\\Local\\Programs\\Tesseract-OCR\\tesseract.exe"

# lee la imagen y recorta la región de interés
imagen = cv2.imread('trades/1.png')
roi = imagen[32:46, 96:180]

# aplica algunas técnicas de procesamiento de imágenes para mejorar el texto
gris = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)
gris = cv2.threshold(gris, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
gris = cv2.erode(gris, None, iterations=1)
gris = cv2.dilate(gris, None, iterations=1)

# reconoce el texto usando Tesseract y especifica la fuente personalizada
texto = pytesseract.image_to_string(gris, lang='mc', config='--psm 13')
print(texto)

Este código recorta la región que contiene el texto, aplica algunas técnicas de procesamiento de imágenes para mejorarlo y luego lo pasa a Tesseract para el reconocimiento con la fuente personalizada especificada. Es posible que necesites ajustar los parámetros caso por caso para obtener los mejores resultados.

Answer

davy.ai

July 28, 2023 at 8:12 am
Para mejorar el reconocimiento de texto en las imágenes dadas, puedes probar los siguientes enfoques:
1. Preprocesamiento de la imagen: Aplica algunas técnicas de procesamiento de imágenes para mejorar el texto y eliminar cualquier ruido o parte no deseada de la imagen. Algunas técnicas comunes incluyen umbralización, erosión, dilatación y detección de contornos.
2. Recorte de la región de interés: Dado que el texto se encuentra en una región específica de la imagen, intenta recortar esa región y pasarla a Tesseract para obtener un mejor reconocimiento.
3. Cambio de los parámetros de configuración de Tesseract: Ajusta los parámetros de configuración de Tesseract para mejorar sus capacidades de OCR. Por ejemplo, puedes intentar cambiar el modo de segmentación de página, el modo del motor OCR o especificar una lista blanca de caracteres a reconocer.
Aquí tienes un fragmento de código actualizado con algunas de estas mejoras:
```
import pytesseract
import cv2

pytesseract.pytesseract.tesseract_cmd = "C:\\Users\\guilh\\AppData\\Local\\Programs\\Tesseract-OCR\\tesseract.exe"

# lee la imagen y recorta la región de interés
imagen = cv2.imread('trades/1.png')
roi = imagen[32:46, 96:180]

# aplica algunas técnicas de procesamiento de imágenes para mejorar el texto
gris = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)
gris = cv2.threshold(gris, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
gris = cv2.erode(gris, None, iterations=1)
gris = cv2.dilate(gris, None, iterations=1)

# reconoce el texto usando Tesseract y especifica la fuente personalizada
texto = pytesseract.image_to_string(gris, lang='mc', config='--psm 13')
print(texto)
```
Este código recorta la región que contiene el texto, aplica algunas técnicas de procesamiento de imágenes para mejorarlo y luego lo pasa a Tesseract para el reconocimiento con la fuente personalizada especificada. Es posible que necesites ajustar los parámetros caso por caso para obtener los mejores resultados.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Necesito ayuda para encontrar la configuración correcta de Pytesseract para que pueda reconocer este texto.

Answer

davy.ai