Las nuevas cámaras de Street View de Google ayudarán a los algoritmos a indexar el mundo real
Steve Silverman ayudó a construir las cámaras de dos robots de la NASA que fueron a Marte. En el paisaje menos exótico de un aparcamiento de Google, mira con cariño su última creación, atornillada al techo de un utilitario Hyundai. El engorroso montaje casi duplica la altura del coche: cuatro patas blancas que sostienen un tallo negro vertical con ocho cámaras. «Pensamos en taparlo, pero somos un poco frikis», dice Silverman. «
Silverman y su equipo construyen el hardware que captura las imágenes para Google Street View, el proyecto que desde 2007 ha puesto en línea panorámicas de más de 16 millones de kilómetros de carreteras, edificios y algún que otro acto de orinar en público para que todo el mundo lo vea. El nuevo diseño de la cámara, la primera gran actualización en ocho años, empezó a patrullar regularmente las calles el mes pasado. Los datos que están empezando a llegar reforzarán el control digital de Google sobre el mundo.
Como se podría esperar si se recuerda la cámara de su teléfono móvil de 2009, las imágenes de Street View están a punto de ser mucho más claras. Te esperan para deslizarte por el mundo desde tu sofá con mayor resolución y colores más vivos. Pero el nuevo hardware de Google no se ha diseñado pensando sólo en los ojos humanos. El equipo para el coche incluye dos cámaras que capturan imágenes fijas en alta definición mirando a ambos lados del vehículo. Están ahí para alimentar los algoritmos de reconocimiento de imágenes de Google con imágenes más claras y cercanas de los edificios y las señales de la calle.
Estos algoritmos pueden analizar millones de señales y escaparates sin cansarse. Al recoger una gran cantidad de información visible en las calles del mundo -señales, nombres de negocios, incluso los horarios de apertura publicados en el escaparate de la tienda de delicatessen de la esquina-, Google espera mejorar su ya formidable base de datos cartográfica digital. La empresa, creada a partir de algoritmos que indexan la web, está utilizando la misma estrategia en el mundo real.
Vigilancia global
La idea de Street View es casi tan antigua como la propia Google. En 2001, tres años después de la fundación de la empresa, el consejero delegado Larry Page llevó al laboratorio de gráficos de Stanford una cinta de vídeo que había grabado conduciendo por la zona de la bahía. Pidió a los investigadores que encontraran una forma de resumirlo en imágenes, y empezaron un proyecto bautizado como «crawling the physical web». Su tecnología fue absorbida por Google en 2006, cuando los coches de la empresa salieron por primera vez a las carreteras antes del lanzamiento público de Street View al año siguiente.
Una década después, los coches de Street View han tomado más de 80.000 millones de fotos en miles de ciudades y 85 países. Los datos cartográficos convencionales de la empresa son aún más extensos. Pero Google todavía tiene hambre de un mejor índice del mundo. Jen Fitzpatrick, la vicepresidenta que dirige la división de mapas de la compañía, nos culpa de ello. «La gente acude a nosotros cada día con preguntas más difíciles y profundas», afirma.
La primera vez que buscaste en Google Maps o Street View probablemente escribiste una dirección, quizá la tuya. Fitzpatrick afirma que ahora la empresa recibe consultas más difíciles que requieren un modelo digital más fresco y detallado del mundo, como «¿Qué restaurante tailandés está abierto ahora y hace entregas en mi dirección?»
Quiere que su servicio maneje consultas que supongan un conocimiento de cómo es el mundo: «¿Cómo se llama la tienda rosa que hay junto a la iglesia de la esquina?». El impulso de Google para que hablemos con su asistente virtual al estilo de Siri nos anima a ser más conversacionales en nuestras demandas. «Son preguntas que solo podemos responder si tenemos una información más rica y profunda», dice Fitzpatrick.
La enorme inversión de Google en aprendizaje automático e IA proporciona una forma natural de obtener esa información. Gracias a recientes investigaciones dentro de la división de mapas, cuando un coche de Street View capta fotos de un tramo de carretera, los algoritmos pueden ahora crear automáticamente nuevas direcciones en la base de datos de mapas de la empresa localizando y transcribiendo los nombres y números de las calles. Street View ha sido el primer grupo de productos de Google en utilizar los potentes chips de inteligencia artificial de la empresa, denominados TPU.
El sistema del equipo ha aprendido a descifrar las abreviaturas, como «AV.» de avenida, tomando pistas de otras señales del país en las que se escriben completas, y otras pistas en los datos de los mapas de Google. El software también ha sido entrenado para reconocer los nombres de los negocios, y es lo suficientemente inteligente como para ignorar los peligros visuales de los viajes, como el logotipo gigante de Bridgestone, que podría eclipsar el nombre de una tienda de neumáticos.
Las imágenes de mayor calidad procedentes del nuevo hardware que ahora se encuentra en los vehículos de Google Street View permitirán que estos sistemas extraigan información como ésta con mayor fiabilidad. «Desde el punto de vista del aprendizaje automático, todo mejora», afirma Andrew Lookingbill, un ingeniero que trabaja en esta tecnología. También ayudará a los esfuerzos de su equipo por construir nuevos programas informáticos aún mejores para entender el mundo. Están pensando en tratar de reconocer automáticamente los distintos tipos de negocios a partir de su aspecto y en leer información más detallada, como los carteles de los horarios de apertura.
Nuevo territorio
La descodificación de las imágenes de Street View con algoritmos puede ser especialmente útil en lugares donde las carreteras, las ciudades y los negocios cambian con mayor rapidez: las economías menos desarrolladas donde Google y sus competidores esperan encontrar sus próximos miles de millones de usuarios. El gobierno de la India informó este año de que recientemente ha construido una media de 14 millas de nuevas carreteras cada día. Street View se puso en marcha este verano en la megaciudad nigeriana de Lagos, con 21 millones de habitantes. Fitzpatrick afirma que los algoritmos de búsqueda de imágenes de Google podrían ayudar a traducir las nuevas imágenes en un aumento significativo de la calidad de los mapas. Google vende anuncios dentro de los mapas, por lo que la nueva cobertura y precisión pueden traducirse en más ingresos si atraen a nuevos usuarios y uso del servicio.
Google quiere que le ayudes a alimentar sus algoritmos ávidos de imágenes. El reciente interés de la industria tecnológica por la realidad virtual ha hecho que las cámaras de 360 grados sean relativamente baratas. Este verano, Google comenzó a certificar algunas cámaras como «preparadas para Street View», lo que significa que puedes subir tus propias panorámicas a través de la aplicación móvil de Street View para que aparezcan en el servicio de la compañía. Esas imágenes serán procesadas por los algoritmos de reconocimiento de imágenes de Google para obtener datos cartográficos frescos al igual que sus propias imágenes.
Google cuenta con el crowdsourcing para que los datos de Street View sean más frescos que ahora. «La expectativa es que Google tenga el mundo indexado», dice Charles Armstrong, director de producto de Street View. «Pero nunca está a la altura de las expectativas». La aplicación móvil de Street View de Google recompensa con trofeos virtuales a las personas que aportan fotos, e incluso sugiere lugares locales a los que llevar la cámara. Y lo que es más importante, Armstrong predice que las empresas, las oficinas de turismo e incluso los gobiernos pronto conducirán sus propios coches con cámara para asegurarse de que el mundo tenga una visión actualizada de sus calles y ciudades.
Todas las actualizaciones de Street View podrían ayudar a Google a mantener su posición privilegiada en los mapas digitales. La empresa es la más destacada entre el puñado de proyectos cartográficos líderes a nivel mundial. Los otros pesos pesados son HERE, propiedad de una coalición de empresas automovilísticas alemanas; TomTom, conocida por sus unidades y relojes GPS autónomos; y el proyecto colaborativo Open Street Map. «Cada uno se mide con los demás», dice Alyssa Wright, presidenta de la sección estadounidense de Open Street Map. (En un mundo en el que la mayoría de nosotros lleva smartphones equipados con GPS, los datos cartográficos son importantes para mucho más que para obtener direcciones. «La cartografía es fundamental para construir nuestro futuro digital, desde los vehículos autónomos hasta las aplicaciones de citas», afirma Wright.
Las nuevas cámaras de Street View y el impulso de Google a las imágenes de origen colectivo podrían llevar a la empresa a nuevas controversias sobre la privacidad. La preocupación por el hecho de que Google convierta las escenas públicas efímeras en elementos permanentes de Internet ha surgido, y a veces se ha disparado, desde que comenzó Street View. Alemania y Austria son en gran medida invisibles en Google Street View, y lo han sido durante años, después de que la empresa se metiera en problemas por registrar datos Wi-Fi con los vehículos de Street View. La flota de Google ha vuelto recientemente a ambos países. En 2012, el tribunal supremo de Suiza ordenó a Google que redujera sus cámaras para evitar que se asomaran por encima de las paredes y para difuminar ciertos lugares, como los refugios para mujeres.
Fitzpatrick rechaza la sugerencia de que unas imágenes de mayor calidad podrían dar lugar a más problemas de privacidad. «No hemos visto ni oído hablar de lugares en los que haya sensibilidades adicionales», afirma. Google seguirá difuminando automáticamente los rostros y las matrículas en sus propias imágenes de Street View. Pero no lo hará por defecto en las imágenes de crowdsourcing, sino que dejará que los usuarios elijan si quieren utilizar la tecnología de desenfoque de Google cuando suban nuevas fotos 360.
¿Cuánto más podría extraer Google de Street View utilizando algoritmos de procesamiento de imágenes? Mucho.
A principios de este año, investigadores de Stanford, entre los que se encuentra el profesor Fei-Fei Li, ahora científico jefe de la división de la nube de Google, demostraron que podían predecir los ingresos, la raza y los patrones de votación de las ciudades estadounidenses con un software que registra la marca, el modelo y el año de los coches en las fotos de Street View. Cuando se le preguntó si se había planeado algo así en Google, un portavoz se limitó a decir que la empresa siempre está buscando formas de utilizar los datos de Street View para mejorar las plataformas de la compañía, incluso más allá de los mapas.
El procesamiento de las imágenes de Street View de Google y sus usuarios también podría ayudar a los coches de autoconducción de la también filial de Alphabet, Waymo, a entender el mundo. «El equipo colabora en cosas de vez en cuando», es todo lo que Fitzpatrick dirá al respecto. Pero su equipo tiene mucho que ganar a cambio de Waymo.
De vuelta en ese aparcamiento de Google, el mago de la cámara Silverman confiesa que patrullar las carreteras en un coche de Street View luciendo uno de los dispositivos de su equipo no es muy divertido. «Después de un día estás dispuesto a no ser conductor de autobús y volver a la ingeniería», dice. Al igual que los vehículos autoconducidos cambiarían la economía de los servicios de transporte a la carta, no tener que pagar a la gente para que se aburra al volante sería una ventaja para Street View. El índice algorítmico del mundo físico de la empresa puede estar empezando.