14 de abril de 2007

Programa para identificar objetos en imágenes


Tenemos un problema cuando buscamos imágenes en internet, y es que probablemente la foto que buscamos no lleva por nombre lo que imaginamos y por lo tanto tenemos menos provabilidades de encontrarla.
Thomas Serre y sus compis del MIT (Massachusetts Institute of Technology) han construido un software que promete poder identificar distintos objetos dentro de una imagen.
Esto podría ser un mero vaporware que puede que tardemos en ver operando, si algún día lo hace, pero en caso que la notícia sea real puede cambiar bastante las cosas en el mundo de internet, a mejor o a peor según se mire.

A mejor:
-Se podrá usar un escaneo de software para detectar fotografías con contenido ilegales, el más claro ejemplo que se me viene a la cabeza son las páginas web con contenidos pederastas. No se tendrá que navegar manualmente sino que el programa podrá detectar qué imágenes supuestamente contienen dicho contenido para poder rastrearlas posteriormente de forma manual.
-La pestaña de búsqueda de Imágenes de Google podría mostrarnos las imágenes por su contenido real. Cuántas fotos hay que se identifican por un número? No obstante, esto sería demasiado lento de hacer en real-time. El sistema debería estar siempre rastreando y proporcionando pseudo-nombres que serían usados en las búsquedas de los usuarios.
-Hoy en día la indexación de vídeos depende exclusivamente de su título. Con una selección de frames de cada película en una enorme base de datos podríamos saber si lo que nos estamos bajando es lo que esperamos o no.

A peor:
-Probablemente nadie se enterá jamás, con la tecnología actual, que la imagen colgada en esta entrada ha sido usurpada vilmente de otra web. Con este software se detectarían lo que algunos podrían llamarían 'delito' por publicar una imagen con derechos. Como honra al dibujante, diré que la imagen es de Satoshi Kambayashi.
-Tenemos la capacidad tecnológica de tener un software como éste que no provoque larguísimas esperas en nuestras búsquedas? Preferimos unos resultados en 0,04 sg por nombre que unos de 4 minutos por identificación de formas?


Algo parecido pero con diferente aplicación es el Geometrically Coherent Image Interpretation. Vendría a ser un transformador automático de imagen a modelo tridimensional. Más vale un video que cien palabras:


ShareThis