Recomendado, 2021

La Elección Del Editor

OCR Convertir hojas escaneadas y archivos PDF a textos editables

OCR es el acrónimo que significa " Reconocimiento óptico de caracteres " (reconocimiento óptico de caracteres) y es una tecnología de software, "inteligente" que sirve para convertir imágenes y archivos PDF que contienen textos escritos en documentos que pueden modificarse con programas normales de procesamiento de textos, como Microsoft Word.

Sin entrar en detalles técnicos, un software OCR le permite tomar un papel escrito y convertirlo en un documento, cuyas palabras se pueden cambiar.

En general, nos referimos al uso del escáner y al reconocimiento de textos escritos en una hoja para que se puedan cambiar las palabras.

Para encontrar campos de aplicación típicos de la vida cotidiana, podemos pensar en cuándo desea utilizar el texto escrito en un libro o un periódico para reportarlo en su propio documento de Word o en un papel, editarlo y hacerlo o incluso reescribir un fax recibido. .

En este artículo vemos algunos programas y sitios de Internet, gratuitos, útiles para editar faxes, imágenes de escáner y pdf en un archivo de texto simple.

Últimamente, la tecnología OCR ha dado grandes pasos y los resultados son sorprendentes.

1) Escribir texto en fotos con Google Keep es la forma más fácil, incluso si no funciona con archivos PDF.

2) Con Microsoft Onenote para Windows 8, puede utilizar la función OCR de las hojas escaneadas para editar documentos en papel.

El programa es fácil de usar y gratuito y se discute en otro artículo.

3) Incluso con Google Docs, puede extraer texto de un pdf o una imagen que sea otra solución muy práctica y conveniente.

4) Cognitive OpenOCR (Cuneiform) es un programa de código abierto que permite realizar el reconocimiento óptico de caracteres (OCR) y luego transformar archivos PDF e imágenes en documentos de texto que se pueden editar con Word u otros programas.

Cuneiform es compatible con 23 idiomas, incluido el italiano, y tiene algoritmos especiales para reconocer texto de una impresora, fax y fotocopia.

Reconoce automáticamente bloques de texto, tablas e imágenes sin dificultad de uso y mantiene el diseño de la página en perfecto orden.

5) JOCR es un programa especializado en el reconocimiento de caracteres presentes en imágenes tomadas desde el escritorio de la computadora.

Este programa funciona con Office 2003 y requiere que el componente Microsoft Office Document Imaging funcione correctamente.

Lo bueno es que JOCR es un programa portátil que no necesita instalación y la interfaz es bastante simple, muy similar a los programas que capturan todo lo que aparece en el escritorio (por ejemplo, el botón "sello")

Puede elegir capturar todo el escritorio, una región de la misma ventana o una ventana específica.

El programa JOCR le permitirá imprimir, copiar o, la función principal, "reconocer" lo que ve y lo que se ha capturado para que pueda editarlo.

De hecho, la imagen se analiza y todos los caracteres y palabras deben reconocerse y luego mostrarse en el bloc de notas de Windows como un archivo txt.

JOCR es compatible con scripts escritos en muchos idiomas, incluyendo inglés, francés, alemán, español y también italiano.

6) GOCR es un programa Opensource para Windows y para Linux y es el principal proyecto de desarrollo experimental de este tipo de software; para los expertos de Linux Gnu.

7) OnlineOCR.net es un sitio web en el que solo necesita cargar la imagen escaneada o el pdf para obtener el archivo editable y editable con Word.

8) No es un programa, pero hay un servicio de OCR en línea disponible en el sitio web de OCRTerminal .

Desde este sitio puede convertir una imagen en un archivo de texto o un archivo pdf en una palabra, siempre editable.

Esta última función, la conversión de archivos de .pdf a .doc también se puede hacer con otro software específico para editar archivos pdf.

Cuando hablamos de una imagen convertida en un archivo de texto, en este caso, nos referimos a una página escaneada y guardada por el programa de un escáner normal, en un archivo jpeg, gif, bmp o tiff.

Para utilizar el sitio, debe registrarse y reconocer la conversión de archivos escritos en cualquier idioma, incluido el italiano .

9) OCR TO Word es un programa simple y poderoso capaz de extraer texto de un PDF o de un documento adquirido con el escáner.

El texto extraído se puede editar en Word.

10) OCR Online es un sitio gratuito que le permite convertir 100 imágenes todos los días, incluso en italiano, directamente en línea sin necesidad de descargar programas.

11) gImageReader es un programa de código abierto basado en el proyecto Tesseract que fue desarrollado por HP Labs hace varios años, mientras que hoy en día pertenece a Google.

Esta potente aplicación le permite extraer texto de imágenes, archivos PDF, XPS, BMP, ICO y muchos otros archivos de imagen.

Puede especificar diferentes porciones de texto para extraer y guardarlas directamente en un archivo de texto editable.

12) Free OCR es un programa que puede convertir imágenes y archivos pdf a documentos con facilidad y con una interfaz muy simple de usar.

No sé si es la mejor, pero la última versión es de enero de 2015, por lo que el proyecto está vivo y actualizado constantemente para ser perfeccionado.

El motor Free OCR se llama Tesseract y funciona bien y también reconoce el idioma italiano.

El rendimiento de estos programas depende en gran medida de la calidad de la imagen que desee reconocer y de la sensibilidad del escáner utilizado.
Pasamos de los textos reproducidos de la misma manera a los casos en que no se reconoce ni una palabra.

Top