El software de Google mejora: ahora sabe lo que ve

Reconocimiento de imágenes de Google

El reconomiento de imágenes es uno de los grandes retos del futuro: requiere muchísimo trabajo, tanto la creación de bancos de imágenes como la automatización que sabemos que tanto adora la compañía. Google ya había jugueteado antes con la posibilidad de dar a los ordenadores la capacidad de interpretar lo que vieran. Ahora, la compañía ha recibido el primer premio en un concurso de reconocimiento visual llamado ImageNet. 

El equipo de Google tenía que cumplir los tres objetivos. Debía ser capaz de clasificar los objetos, de tal forma que cada objeto que la cámara pudiese captar estuviese en una base de datos. El segundo objetivo requería que el software fuese capaz de ubicar cada objeto en su posición, y el tercero requería la asociación de los dos anteriores: reconocer automáticamente cada objeto en su posición. 

Esta es otra de las piezas que, correctamente ensambladas, podrían generar la Inteligencia Artificial más puntera que se haya conocido

Google superó la primera parte de la prueba generando un algoritmo que clasificaba los objetos en categorías. A base de categorizar, el ordenador era capaz de llegar a un punto lo suficientemente concreto como para hacer al objeto identificable. El segundo punto, relativamente el más fácil de los tres, se superó al ser capaz de diferenciar donde acababa el objeto y comenzaba el fondo. 

El verdadero reto de los chicos del equipo Google llegó con el tercer reto. Que un ordenador sepa la forma que tiene una manzana es una cosa, y otra muy distinta que al verla mediante la cámara, el ordenador sepa relacionar su archivo de memoria "manzana" con los datos que sus sensores le están proporcionando. 

Google reconomiento de imágenes

Como siempre, Google gano haciéndolo más simple: en lugar de generar una elaboradísima base de datos, limitó el número de parámetros de identificación. Cuando la cámara capturaba una imagen, el software ofrecía distintas posibilidades en el reconocimiento (¿esto es una manzana o una naranja?), y finalmente se quedaba con la que más eficazmente hubiese reconocido la imagen (en el sentido de que la hubiese reconocido más fácilmente).