Google Drive amplía sus capacidades de OCR Para leer el texto en documentos escaneados en más de 200 idiomas

Reconocimiento óptico de caracteres, también conocido como OCR, es realmente una tecnología increíble. Si usted no está familiarizado, se necesitan imágenes y lee el texto en ellos. Para los archivos PDF, puede hacer que las palabras que encuentra investigable, seleccionable, y todo lo que es posible que desee hacer con ellos. Las mejores implementaciones de OCR funcionan lo suficientemente bien que casi hacen CAPTCHA sin sentido. Y mientras Google Drive ha ofrecido esta función en Inglés para los más de un año, ahora rodando hacia fuera a más de 200 idiomas diferentes.

image02

Si lo hace, es muy fácil. En Drive, sólo tiene que ir a una imagen o PDF y abrirlo con Google Docs, como se ve arriba. Esto también funciona en la aplicación para Android, donde se puede utilizar la cámara para escanear documentos, también. Lo que se obtiene es una versión modificada del documento donde se ve la imagen y el texto se transcribe a continuación la misma. Google hace lo posible para conservar el formato como negrita y cursiva, pero aquí es donde es muy probable que para ver los errores. Las nuevas capacidades de lenguaje cambian nada en el usuario final, ya que detecta automáticamente el idioma, incluso trabajando para sistemas de caracteres no latinos.

Si ha utilizado el software de OCR antes o justo tener experiencia con documentos OCR'd, la forma Drive es un poco diferente. No produce un PDF donde el texto es seleccionable en la imagen, pero en su lugar se lee el texto y lo mueve a una nueva página. Un aspecto positivo es que se puede editar el texto para corregir errores, pero puede no ser la mejor opción para todos.

De cualquier manera, este es un buen ejemplo de Google preocuparse por los mercados no estadounidenses del mundo (además de las muchas personas que utilizan idiomas distintos del inglés dentro de los EE.UU.).

  • Fuente:
  • Investigación Google

» » » Google Drive amplía sus capacidades de OCR Para leer el texto en documentos escaneados en más de 200 idiomas