Google Blog Investigación Publicar muestra cómo WordLens traducción en vivo al instante Sustituye texto en vídeo en directo
Bienvenido al futuro. No, en serio, es el futuro, aquí y ahora mismo. Y no sólo porque tenemos procesadores móviles que pueden calcular Pi a la cifra de diez billonésima, o porque nuestros videojuegos están empezando a parecerse más a las películas que juegos. No, lo que me hace sentir que estoy viviendo en el futuro (TM) más que cualquier otra cosa es cómo todo ese pastel-en-el-cielo Ley tecnología de Moore se aplica a la solución de problemas muy humanos, como averiguar dónde está la salida en el aeropuerto de Yakarta.
Caso en cuestión: la de Google Traducir aplicación es la aplicación de la Lente Palabra visual herramienta, que le permite apuntar la cámara del teléfono a un signo o un pedazo de papel y ver el texto en su lengua materna traducir, 20 nuevos idiomas. Y también La Bamba. Cuando haya terminado de tratar de obtener Ritchie Valens de la cabeza, vuelve aquí para maravillarse de cómo funciona realmente esas cosas.
Google nos deja ver al hombre detrás de la cortina en esta entrada del blog. Es una explicación detallada de la informática detrás de traducción casi instantánea. Básicamente Google tiene que utilizar el reconocimiento óptico de caracteres en la rotación de los fotogramas de vídeo con un asombroso grado de exactitud, a continuación, utilizar un diccionario de lengua cruzada masiva de traducir las palabras en la pantalla, luego colocarlos de nuevo en el video en una posición, el tamaño y el estilo que coincide con el texto original ... todo al utilizar datos transmitidos poco como sea posible.
Es más difícil de lo que parece, porque el aspecto de traducción en directo de la herramienta tiene que ser capaz de reconocer texto pequeño, borrosa casi al instante - computadoras de Google son, básicamente haciendo Captcha instantánea desconcierta varias veces por segundo. Para "entrenar" al sistema, los ingenieros de hecho, tuvimos que crear algoritmos para añadir la suciedad y las manchas digitales a las cartas con el fin de conseguir que funcione con la más amplia variedad de entrada posible. Eso es aún más difícil de lo que parece, ya que Google también tuvo que asegurarse de no forzar el sistema con los falsos positivos o intentar traducir lo que el usuario puede que no tienen la intención, al igual que el texto relativo vertical. También descarga a al menos algunos de los trabajos de hardware local del teléfono con el fin de optimizar la conexión.
Este es el tipo de Star Trek magia que hace que te preguntes lo que vendrá después. Salida de Google Blog de Investigación de correos para un desglose más completo.
- Fuente:
- Blog Google Investigación