El portal educativo del Estado argentino

educ.ar en YouTube

Minority report en TED 2009: lo último en interfaces fluidas multi touch y con reconocimiento gestual

Patti Maes presentó el último desarrollo del Media Lab del MIT sobre interfaces fluídas o líquidas denominadas "Sexto Sentido". La realidad se acerca al film Minority report que Steven Spielberg realizó en 2002. La investigadora mostró en el ciclo de conferencias TED 2009 el diseño tecnológico que incorpora una cámara de video, un proyector y una cámara digital dentro de un dispositivo móvil. Las interfaces de SixthSense además de ser multi touch son también de reconocimiento gestual. El prototipo actual del sistema tiene un costo aproximado de 350 dólares.

Dale Herigstad, director creativo de la empresa de diseño Schematic Creative Inspirations, trabajó con el cineasta Steven Spielberg en el diseño conceptual de las pantallas de navegación y hologramas para la película Minority Report. Herigstad es un especialista en las nuevas formas de interfaces de usuario para la web, la televisión y otros medios de comunicación.

Herigstad dice que hoy en día el público está en todas partes y quiere ver productos audiovisuales a través del variado abanico de medios: televisión, web, vía Facebook o YouTube, en su iPhone o en la netbook. La mirada y la atención de la gente se dirigen allí donde hay una pantalla, cualquiera que sea. Lo que Herigstad y otros desarrolladores están considerando en primer plano es el factor distancia. La distancia entre el usuario y la pantalla en distintos contextos se ha tornado en el punto de inflexión de los nuevos prototipos.

Las distancias y el enriquecimiento de experiencias

La distancia más personal de manipulación de pantallas, en cuanto a cercanía e intimidad, se da con el uso de los dispositivos móviles (iPhone, iPod, GPS, celulares) y netbooks, laptops, etc. La persona se encuentra muy cerca y puede tocar la pantalla. Si utilizáramos una escala comparativa con la experiencia de pantalla tradicional como la de televisión, los dispositivos móviles y computadoras estarían en el orden de 1 o 2 de navegación mientras que la TV estaría posicionada en un 10 de navegación –incluyendo a otras personas en el contexto, amigos y familia-. Las pantallas de los medios de comunicación públicos tienen una distancia de navegación variable ya que están en cualquier lugar y las personas pueden acercarse o verlas desde lejos (escala de navegación entre 2 y 200).

minorityreport.jpg

Para Herigstad hay una gran línea divisoria entre la distancia-gesto de la televisión y los medios públicos y la distancia-contacto de los medios personales (dispositivos móviles, netbooks, laptops y computadoras). En la bisagra “distance gesture vs. distance touch” el contacto directo del toque de la pantalla “casi” anula la distancia y enriquece la experiencia de navegación. Al acortar las distancias se ponen en juego otros conceptos como la perspectiva, la posición, el tipo de interacción y la usabilidad. Se trata menos de los gadgets y más de la experiencia, de la utilización que se hace de estos productos: cómo se los usa, cuándo, dónde, de qué maneras, con qué fin. Por eso “el” slogan para este momento del diseño y la arquitectura de interfaces es: “Tu interfaz es tu marca”.

Ver no es lo mismo que tocar, mejor es navegar con los dedos en el aire

Teniendo al slogan ´la interfaz es la marca´ como brújula y pensando en la máxima comodidad, facilidad y fluidez de navegación, es decir, en la optimización de la usabilidad, Herigstad pensó en interfaces inspiradas en la lengua de señas. El diseño que propone el especialista descansa sobre la pureza minimalista de prescindir de los dispositivos o controles remotos. El ejemplo más sencillo sería controlar el volumen de la televisión usando un gesto de la mano, más precisamente un dedo “navegando” en el aire.

Herigstad va más allá del entretenimiento y proyecta otros usos y aplicaciones de esta interfaz, por ejemplo, en la medicina quirúrgica entrenando a una máquina para responder al lenguaje de señas de las manos. Y adentrándose en un terreno más lejano, pasa de las señas manuales a las ondas cerebrales como “dispositivos” de navegación de interfaces especialmente receptivas a interacciones con este tipo de telecomando sin mediaciones.

En Minority Report, película de ciencia ficción dirigida por Steven Spielberg (2002) basada en el cuento de Philip K. Dick del mismo nombre, el argumento se desarrolla en el año 2054 cuando el crimen ha sido erradicado del mundo. ¿Cómo? En este futuro es posible predecir las posibilidades de ocurrencias de acontecimientos criminales y los culpables son condenados antes de que cometan sus delitos. Tres personas con capacidades precognitivas, o Precogs, ayudan a la policía Precrimen, perteneciente al Departamento de Justicia, a descubrir los crímenes antes de que se produzcan. Todas las pruebas para condenar a alguien -desde imágenes alusivas al tiempo, lugar y otros detalles- son percibidas por los Precogs con antelación y enviadas a un sistema de datos que permite evitar los futuros delitos. Las visiones sobre los asesinatos nunca han fallado. El jefe John Anderton (Tom Cruise) es un policía perteneciente a la Unidad de Precrimen que maneja todos los datos e imágenes percibidos por los precogs a través de un sistema de interfaces fluidas multi touch y de reconocimiento gestual.


Los desarrolladores como Herigstad están estudiando algoritmos para diseñar arreglos avanzados de metadatos, esto implica que buscan la manera de reunir las experiencias de visualización automáticamente. En otras palabras, en la actualidad cuando vemos un programa en la televisión, hay un cuidadoso proceso de producción que sucede detrás de la escena sobre la cual está focalizada la mirada-atención. Este “backstage” involucra el funcionamiento de las promociones, las marcas, los créditos, la publicidad, etc. Para Herigstad, en el futuro los sistemas de interfaces con arreglos avanzados de metadatos podrán entender las jerarquías de cada una de estas piezas y las elaborarán de acuerdo a las preferencias de los usuarios mediante un ensamblaje dinámico. La customización o personalización automática que llevarán a cabo las interfaces ofrecerán al usuario una visualización de metadatos a medida. El ejemplo visual de este concepto está mostrado magistralmente en el film Minority report cuando el personaje que interpreta Tom Cruise ingresa al shopping y las diferentes pantallas se dirigen a él por su nombre, ofreciéndole productos o brindándole información de acuerdo a sus intereses.

Un prototipo de interfaz líquida multi touch y de reconocimiento gestual hoy mismo

Hasta aquí nos referimos a películas de ciencia ficción y a desarrollos experimentales de interfaces que prescinden de dispositivos remotos y emplean la lengua de señas manual. La presentación de Patti Maes, investigadora del MIT, en el ciclo de conferencias TED 2009 maravilló al auditorio allí presente y a todos los interesados en la evolución de las interfaces en el mundo con el prototipo SixthSense.

En el siguiente video, que permite visualizar los subtítulos en español, Patti Maes presenta el último desarrollo del Media Lab sobre interfaces fluídas o líquidas denominadas SixthSense (Sexto Sentido). Una vez más, la realidad al menos equipara a la ficción de la mano de los investigadores del MIT. Maes muestra el diseño tecnológico que incorpora una cámara de video, un proyector y una cámara digital dentro de un dispositivo móvil, que puede ser un celular. Las interfaces de SixthSense además de ser multi touch son también de reconocimiento gestual. El prototipo actual del sistema tiene un costo aproximado de 350 dólares.

Esteban Javier Rico de la red Infodesign, de la Facultad de Arquitectura, Diseño y Urbanismo de la UBA, hizo la siguiente reseña de la presentación.

Perfil de SixthSense

El prototipo está compuesto por un proyector de bolsillo, un espejo y una cámara. Los componentes de hardware se acoplan en un colgante de dispositivos portátiles como teléfonos móviles. Tanto el proyector y la cámara están conectados a dispositivos de informática móvil en el bolsillo del usuario. El proyector permite la visualización de la información visual sobre superficies diversas, paredes y objetos físicos a nuestro alrededor para ser utilizado como interfaces, mientras que la cámara reconoce las acciones y gestos del usuario utilizando técnicas basadas en la visión. El programa procesa los datos de la secuencia de video capturada por la cámara y las acciones a través de seguimiento visual de la punta de los dedos del usuario usando simples técnicas de visión por computadora. Los movimientos y las disposiciones de estos gestos se interpretan como la interacción que actúa como instrucciones para estas interfaces fluídas gestuales.


SixthSense.jpg

SixthSense es una verdadera interfaz gestual portátil que aumenta el contacto con el mundo físico real que nos rodea con la información digital y nos permite usar gestos naturales para interactuar con dicha información. Cuando nos encontramos con algo o alguien en algún lugar, usamos nuestros cinco sentidos para percibir información sobre el mismo; esa información nos ayuda a tomar decisiones y a elegir el derecho a tomar acciones. Pero a veces sin duda la información más útil que puede ayudarnos a tomar la decisión correcta no es, naturalmente, perceptible con los cinco sentidos, es decir, los datos, información y conocimientos que están en soportes digitales (web) y que puede ser requerida en un minuto determinado para tomar una decisión fuera de nuestra oficina o casa.

A pesar de que la miniaturización de los dispositivos informáticos hoy nos permite llevar las computadoras en nuestros bolsillos, no existe ninguna relación entre nuestros dispositivos digitales y nuestras interacciones con el mundo físico. La información se limita tradicionalmente al papel o digitalmente en una pantalla. SixthSense genera una nueva interfaz que conecta lo intangible de la información digital con el mundo tangible y así nos permite interactuar con esta información a través de gestos naturales.

SixthSense permite al usuario dibujar iconos o símbolos en el aire utilizando el movimiento del dedo índice y el sistema reconoce las interacciones como símbolos e instrucciones. Por ejemplo, dibujar una lupa-símbolo lleva al usuario a la aplicación de mapa o plano una ‘@’ símbolo le abre al usuario su correo electrónico. El sistema también aumenta la interacción con los objetos físicos al permitirle al usuario interactuar con la proyección de más información acerca de estos objetos proyectando sobre ellos. Por ejemplo, un periódico puede mostrar video en vivo de noticias o la información dinámica se puede proporcionar en un trozo de papel ordinario.

Luego de ver la impresionante presentación de Patti Maes en TED 2009, Minority report se va acercando a nuestro presente bastante tiempo antes de lo esperado.



Privacidad y condiciones de uso

© educ.ar. Todos los derechos reservados
Educ.ar S.E. - Saavedra 789 - Ciudad de Buenos Aires - C1229ACE
Tel / Fax: 54-11-5129-6500 (rot.) - Argentina

Portal educ.ar Canal Encuentro Canal Pakapaka Presidencia de la Nación Ministerio de educación