LinuxParty

NUESTRO SITIO necesita la publicidad para costear hosting y el dominio. Por favor considera deshabilitar tu AdBlock en nuestro sitio. También puedes hacernos una donación entrando en linuxparty.es, en la columna de la derecha.
Inicio desactivadoInicio desactivadoInicio desactivadoInicio desactivadoInicio desactivado
 
Colaborador Anónimo. escribió "Esta guía describe como instalar Tesseract OCR en Ubuntu 7.04. OCR significa: "Optical Character Recognition". El sistema resultabe podría permitir la conversiones de las imágenes que forman el texto en ficheros de Texto. Tesseract esta licenciado bajo el Apache License v2.0

El programa tesseract-ocr fue comprado por Google a HP hace varios años y la verdad es que reconoce incluso el texto en varias columnas, cosa que ni la versión 7 del famoso software de reconocimiento óptico de caracteres (OCR) de Adobe es capaz de hacer.

El programa lo podéis descargar desde http://code.google.com/p/tesseract-ocr/ , aunque la imagen tiene que estar en formato TIFF para que sea reconocida.

El artículo lo puede leer en:
http://www.howtoforge.com/ocr_with_tesseract_on_ubuntu704

Pin It

Escribir un comentario


Código de seguridad
Refescar



Redes:



 

Suscribete / Newsletter

Suscribete a nuestras Newsletter y periódicamente recibirás un resumen de las noticias publicadas.

Donar a LinuxParty

Probablemente te niegues, pero.. ¿Podrías ayudarnos con una donación?


Tutorial de Linux

Filtro por Categorías