Reconocimiento Optico de caracteres (OCR)

PorGustavo

Jul 30, 2014

El reconocimiento óptico de caracteres (OCR), permite convertir diferentes tipos de documentos y pasarlos a texto plano (ejemplo: documentos en papel escaneados guardados como Tif, jpg, png, o ficheros en PDF.

La función es separar el texto de la imagen, o lo que es lo mismo, poder diferenciar un texto de una imagen cualquiera, esto permite tener acceso y editar el contenido del documento original (albaranes, formularios, facturas, etc.). Generalmente en el sector de la empresa se le llama “gestión documental” y se usa para agilizar los procesos de localización y recuperación de archivos, reducción de costes de almacenamiento de los documentos e incremento de la productividad.

Hoy en día podemos encontrar software potente para las empresas, pero de momento no es libre. Para hacerse una idea de la “gestión documental” en empresa usando OCR:

En otros sectores la tecnología OCR tiene cabida por ejemplo en los radares de trafico. Una cámara captura la matricula y el motor OCR se encarga de pasar los números de la imagen a texto plano.

La tecnología OCR actualmente esta dando mas avances dentro las google glass. o los teléfonos moviles:

Hay muchos motores OCR de código abierto pero tienen sus limitaciones (la imagen tiene que tener una gran calidad, la mayoría solo admite ficheros de imagen en formato Tif …).

Tesseract-ocr esta entre estos. Desarrollado originalmente por Hewlett Packard, fue liberado como código abierto en el año 2005 y esta patrocinado actualmente por Google, que lo distribuye bajo licencia Apache. Es multiplataforma y soporta múltiples idiomas (funciona por terminal y solo puede procesar imágenes TIFF.).

Otro es Tessract-GUI, que no es un front-end para tesseract-ocr. Es sólo una manera gráfica para utilizarlo con la manipulación de imágenes sencillas a través de ImageMagick (ofrece mas formatos de entrada como png, jpeg, tif, pdf).

Tessract-GUI tiene dependencias de las siguientes aplicaciones que deben ser instaladas:
tesseract-ocr y ImageMagick

Descargamos Tesseract-GUI desde su web

$   cd /directorio donde se descargue/tesseract-gui-X.X.tar.gz $   tar xzvf tesseract-gui-X.X.tar.gz $   cd tesseract-gui-X.X $   sudo make install

Y lo lanzamos con:

$   tesseract-gui.py

test
Otra opción mas fácil es hacer pasar la imagen a texto online, hay bastantes webs para subir las imágenes y pasarlas a texto

Por Gustavo

Entrada relacionada

Cursos Sin categoría

Reconocimiento Optico de caracteres (OCR)

PorGustavo

Por Gustavo

Entrada relacionada

LINUX Dominar la Administración del Sistema 3°Edición [PDF]

BackBox Linux 4.1, nueva versión de esta distro de seguridad

¿Google Drive para Linux? Quién sabe…

Deja una respuesta Cancelar la respuesta

You missed

GitHub CLI incorpora gh skill para operar skills de agentes IA

CloudWatch habilita reglas multi-región para telemetría en AWS

GitHub añade Rule Insights Dashboard para gobernar rulesets

Sapphire Sleet en macOS: cadena de intrusión sin exploits