5 Servicios Gratuitos De Ocr En Línea Probados Y Revisados
¿Tienes un documento PDF o una imagen que te gustaría convertir en texto? Recientemente, alguien me envió un documento por correo que debía editar y devolver con correcciones. La persona no pudo localizar una copia digital, así que me encargué de pasar todo ese texto a formato digital.
No había forma de que me pasara horas tecleando todo, así que acabé haciendo una buena foto del documento de alta calidad y luego pasé por un montón de servicios de OCR en línea para ver cuál me daba los mejores resultados.
En este artículo, repasaré un par de mis sitios favoritos para el OCR que son gratuitos. Hay que tener en cuenta que la mayoría de estos sitios ofrecen un servicio básico gratuito y luego tienen opciones de pago si quieres funciones adicionales como imágenes más grandes, documentos PDF de varias páginas, diferentes idiomas de entrada, etc.
También es bueno saber de antemano que la mayoría de estos servicios no podrán igualar el formato de su documento original. Sirven principalmente para extraer el texto y ya está. Si necesitas que todo tenga un diseño o formato específico, tendrás que hacerlo manualmente una vez que obtengas todo el texto del OCR.
Además, los mejores resultados para obtener el texto provendrán de documentos con una resolución de 200 a 400 DPI. Si tienes una imagen con pocos DPI, los resultados no serán tan buenos.
Por último, hubo muchos sitios que probé que simplemente no funcionaron. Si buscas en Google un OCR online gratuito, verás un montón de sitios, pero varios de los que aparecen entre los 10 primeros resultados ni siquiera completaron la conversión. Algunos se quedaban sin funcionar, otros daban errores y otros simplemente se quedaban atascados en la página de "conversión", así que ni siquiera me molesté en mencionar esos sitios.
Para cada sitio, probé dos documentos para ver el resultado. Para mis pruebas, simplemente usé mi iPhone 5S para tomar una foto de ambos documentos y luego los subí directamente a los sitios web para la conversión.
En caso de que quieras ver cómo eran las imágenes que utilicé para mi prueba, las he adjuntado aquí: Prueba1 y Prueba2 . Ten en cuenta que no son las versiones de resolución completa de las imágenes tomadas desde el teléfono. Utilicé la imagen de resolución completa cuando la subí a los sitios.
OnlineOCR
OnlineOCR.net es un sitio limpio y sencillo que dio muy buenos resultados en mi prueba. Lo que más me gusta de él es que no tiene toneladas de anuncios por todas partes, lo que suele ocurrir con este tipo de sitios de servicios de nicho.
Para empezar, selecciona tu archivo y espera a que termine de cargarse. El tamaño máximo de carga para este sitio es de 100 MB. Si te registras para obtener una cuenta gratuita, obtienes algunas características adicionales como el mayor tamaño de carga, PDFs de varias páginas, diferentes idiomas de entrada, más conversiones por hora, etc.
A continuación, elige el idioma de entrada y luego el formato de salida. Puede elegir entre Word, Excel o texto sin formato. Haga clic en el botón Convertir y verá el texto mostrado en la parte inferior en un cuadro junto con un enlace de descarga.
Si todo lo que quieres es el texto, sólo tienes que copiarlo y pegarlo desde el cuadro. Sin embargo, te sugiero que descargues el documento de Word, porque hace un trabajo sorprendentemente bueno al mantener el diseño del documento original.
Por ejemplo, cuando abrí el documento de Word para
mi segunda prueba, me sorprendió encontrar que el documento incluía una tabla con tres columnas, como en la imagen.
De todos los sitios, éste fue el mejor con diferencia. Merece la pena registrarse en él si necesitas hacer muchas conversiones.
Para completar, también voy a enlazar con los archivos de salida creados por cada servicio para que puedas ver los resultados por ti mismo. Aquí están los resultados de OnlineOCR: Test1 Doc y Test2 Doc.
Tenga en cuenta que al abrir estos documentos de Word en su ordenador, aparecerá un mensaje en Word indicando que procede de Internet y que la edición se ha desactivado. Esto es perfectamente correcto porque Word no confía en los documentos de Internet y realmente no es necesario habilitar la edición si sólo quieres ver el documento.
i2OCR
Otro sitio que dio muy buenos resultados fue i2OCR El proceso es muy similar: elija su idioma, el archivo y luego presione Extraer texto .
Aquí tendrás que esperar uno o dos minutos porque este sitio tarda un poco más. Además, en el Paso 2, asegúrate de que tu imagen se muestra con el lado derecho en la vista previa, de lo contrario obtendrás un montón de galimatías como salida. Por alguna razón, las imágenes de mi iPhone se mostraban en modo vertical en mi ordenador, pero en modo horizontal cuando las subí a este sitio.
Tuve que abrir manualmente la imagen en una aplicación de edición de fotos, girarla 90 grados, volver a girarla en modo vertical y guardarla de nuevo. Una vez completado, desplázate hacia abajo y te mostrará una vista previa del texto junto con un botón de descarga.
A este sitio le fue bastante bien con el resultado de la primera prueba, pero no le fue tan bien con la segunda prueba que tenía el diseño de columnas. Aquí están los resultados de i2OCR: Test1 Doc y Test2 Doc.
FreeOCR
Free-OCR.com toma tus imágenes y las convierte en texto plano. No tiene una opción para exportar a formato Word. Elija su archivo, seleccione un idioma y luego haga clic en Iniciar .
El sitio es rápido y obtendrás el resultado con bastante rapidez. Sólo tienes que hacer clic en el enlace para descargar el archivo de texto en tu ordenador.
Al igual que NewOCR, mencionado más abajo, este sitio pone en mayúsculas todas las T del documento. No tengo ni idea de por qué lo hace, pero por alguna extraña razón tanto este sitio como NewOCR lo hacen. No es un gran problema para cambiarlo, pero es un proceso tedioso que realmente no debería tener que hacer.
Aquí están los resultados de FreeOCR: Test1 Doc y Test2 Doc.
ABBYY FineReader Online
Para utilizar FineReader Online , tienes que registrarte para obtener una cuenta, con la que podrás probar gratis durante 15 días el OCR de hasta 10 páginas. Si sólo necesita hacer un OCR de un par de páginas, puede utilizar este servicio. Asegúrate de hacer clic en el enlace de verificación que aparece en el correo electrónico de confirmación después de registrarte.
Haga clic en Reconocer en la parte superior y luego haga clic en Cargar para seleccionar su archivo. Elige tu idioma, el formato de salida y luego haz clic en Reconocer en la parte inferior. Este sitio tiene una interfaz limpia y sin anuncios también.
En mis pruebas, este sitio fue capaz de agarrar el texto del primer documento de prueba, pero era absolutamente enorme cuando abrí el documento de Word, así que terminé haciéndolo de nuevo y eligiendo Texto sin formato como salida
formato.
En la segunda prueba con las columnas, el documento de Word estaba vacío y ni siquiera pude encontrar el texto. No estoy seguro de lo que ha ocurrido, pero parece que no es capaz de manejar nada más que párrafos simples. Aquí están los resultados de FineReader: Test1 Doc y Test2 Doc.
NewOCR
El siguiente sitio, NewOCR.com , estaba bien, pero no tan bien como el primero. En primer lugar, tiene anuncios, pero afortunadamente no muchos. Primero seleccionas tu archivo y luego haces clic en el botón Preview .
Luego puedes girar la imagen y ajustar el área donde quieres escanear el texto. Es muy parecido a cómo funciona el proceso de escaneo en un ordenador con un escáner conectado.
Si el documento tiene varias columnas, puedes marcar el botón Análisis de diseño de página y tratará de dividir el texto en columnas. Haga clic en el botón OCR, espere unos segundos a que se complete y desplácese hasta el final cuando se actualice la página.
En la primera prueba, obtuvo todo el texto correctamente, pero por alguna razón puso en mayúsculas todas las T del documento. Ni idea de por qué lo hizo, pero lo hizo. En la segunda prueba, con el análisis de la página activado, obtuvo la mayor parte del texto, pero el diseño estaba completamente fuera de lugar.
Estos son los resultados de NewOCR: Test1 Doc y Test2 Doc.
Conclusión
Como puedes ver, lamentablemente la gratuidad no da muy buenos resultados la mayoría de las veces. El primer sitio mencionado es el mejor con diferencia, porque no sólo hizo un gran trabajo al reconocer todo el texto, sino que también consiguió conservar el formato del documento original.
Sin embargo, si sólo necesitas texto, la mayoría de los sitios web mencionados anteriormente deberían poder hacerlo por ti. Si tienes alguna pregunta, no dudes en comentar. Que lo disfrutes.
Contenidos relacionados
No se ha encontrado ninguno
Subir
Deja una respuesta