es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Extracción de números usando Tesseract OCR

Quiero extraer un número de una imagen. Estoy utilizando Tesseract OCR con Python para extraer el número. Pero el Tesseract OCR no funciona correctamente. La imagen tiene el siguiente formato:
Imagen

El texto está en Fuente Arial y el tamaño de la fuente es 80. El código que estoy utilizando es el siguiente:

import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = “C:\Program Files\Tesseract-OCR\tesseract.exe”

def process_image(iamge_name, lang_code):
return pytesseract.image_to_string(Image.open(iamge_name), lang=lang_code)

def print_data(data):
print(data)

def main():
data_eng = process_image(“test.jpg”, “eng”)
print_data(data_eng)

if name == ‘main‘:
main()

Usando este código, Tesseract no puede detectar el número. Hay alrededor de 200,000 imágenes de las cuales necesito extraer el número. Sería realmente útil si alguien puede darme una solución alternativa para lo mismo. Cualquier ayuda es apreciada.

Gracias de antemano.

Tags:  , , ,

Answer

  1. Avatar for davy.ai

    Extrayendo el número de una imagen utilizando Tesseract OCR con Python

    La imagen proporcionada que se necesita procesar está en fuente Arial con un tamaño de 80. El código que utiliza Python y Tesseract OCR no funciona correctamente para esta imagen.

    Posibles soluciones alternativas

    1. Preprocesamiento: El preprocesamiento de sus imágenes puede ayudar con el reconocimiento OCR. El uso de técnicas de preprocesamiento de imágenes como binarización, escala de grises, ajuste de contraste o eliminación de ruido puede mejorar el reconocimiento OCR en su imagen. Asegúrese de que las técnicas de preprocesamiento que utilice no alteren el contenido de la imagen que desea extraer.
    2. Entrenamiento de fuentes: El entrenamiento del OCR Tesseract puede ayudar en el reconocimiento correcto de fuentes. El uso de motores de reconocimiento óptico de caracteres, como Tesseract, requiere el entrenamiento del motor antes de que el reconocimiento OCR se pueda utilizar de manera efectiva en las imágenes. Puede utilizar herramientas de entrenamiento de Tesseract para mejorar el reconocimiento de su fuente específica que no es reconocida correctamente por el OCR Tesseract.
    3. Soluciones OCR alternativas: Puede utilizar otras soluciones OCR, como OCR de Google Cloud Vision, OCR de Amazon Rekognition o OCR de ABBYY, como alternativa al OCR Tesseract para ver si pueden reconocer el contenido requerido de su imagen.

    Conclusión

    En conclusión, podría probar una de las soluciones alternativas mencionadas o una combinación de ellas para mejorar el reconocimiento OCR en su imagen. El resultado dependerá de la imagen específica y la complejidad del número que desea extraer.

Comments are closed.