Lectura de Imágenes – Reconocimiento óptico de caracteres (OCR)

Posted by admin on November 12, 2012

En 2004, Google desató un ambicioso plan bajo el nombre simple de Google Print, que más tarde fue cambiado y ahora se conoce como Google Book Search (o simplemente de libros de Google). El objetivo: hacer que los libros de todo el mundo disponibles en Internet. Si pensabas que esto no era una tarea científica, sino simplemente uno que requiere una gran cantidad de personas para escanear un montón de libros y subirlos, piénselo de nuevo. Deténgase un momento y pensar en cómo no es posible buscar un archivo de imagen (la salida típica de un documento escaneado) para una determinada palabra clave que usted podría estar buscando. Sin embargo, cuando se escribe una palabra clave en Google Books, que se busca y se presentan en el libro de subida donde se produce. ¿Cómo lo hacen?

La respuesta a esa pregunta es el reconocimiento óptico de caracteres, comúnmente se denomina como OCR. OCR es el proceso mediante el cual se busca una imagen para el texto escrito a máquina, manuscrito o impreso, y por lo tanto convertido en un formato de texto legible por máquina / ejecutable. Los documentos de entrada son por lo general los archivos escaneados en un formato de imagen genérica o en un formato PDF. OCR, al igual que en el formulario que está disponible hoy en día, tiene su nacimiento en algún lugar de la década de 1950, cuando un criptoanalista Fuerzas Armadas de EE.UU. Agencia de Seguridad inventado una máquina capaz de procesar los documentos impresos en formatos legibles por máquina y se pueden editar para el tratamiento informático. Desde entonces, una serie de innovaciones se han hecho en el campo con desarrollos simultáneos en el campo de la tecnología de la información en general. Incluso hoy en día, el OCR es un campo de investigación desafiante con amplias aplicaciones comerciales, como la búsqueda de libros y la indexación, el reconocimiento de la dirección postal, la conversión de documentos del gobierno en el e-archivo, y la lista continúa.

La principal vía tomada para OCR procesamiento es el análisis estructural y de coincidencia de patrón, en el que las diferentes formas que ocurren en la imagen se correlacionan estadísticamente a las diferentes letras de la lengua y por lo tanto el más cercano candidato es seleccionado para la salida en la fuente legible por máquina. Las versiones anteriores de los reconocedores utilizados para ser específicos para una fuente en particular, sino OCRs hoy puede reconocer caracteres en la mayoría de las fuentes disponibles para el idioma.

Algunos de los populares programas de OCR en la actualidad incluyen ocrad, ABBYY Fine Reader, Brainware, y Tesseract, de los cuales ABBYY y Tesseract oferta de soporte multi-idioma. La mayoría de estos programas cuentan con licencia y tiene que ser comprado para poder usarlos. Ellos aceptan varios tipos de formato de imagen como JPEG, TIFF, GIF, etc, así como los formatos PDF y obtener el resultado en un formato de documento de texto estándar.

Incluso entonces, la mayoría de los reconocedores de hoy son específicos a una lengua (o lenguas emparentadas unas pocas) para los que están hechos a medida, y este lenguaje es que no más a menudo, es inevitable Inglés. Soluciones en línea ofrecen lo último en tecnología multi reconocimiento del lenguaje de la OCR, en combinación con la disposición de que se ponen para no tener que descargar el software con licencia en su PC. Por otra parte, es absolutamente libre, y el archivo de salida está listo para su descarga de forma inmediata, sin tener que enviar su correo electrónico y esperar a que lleguen a su bandeja de entrada.

Categories: Software

Comments are closed.