MENOS ES MÁS

MAYORDOMOS DIGITALES

En diciembre de 1980, Nobutaka Shikanai nos invitó a Jerome Wiesner y a mí a cenar en su bonita casa de campo en la región japonesa de Hakone, no lejos del monte Fuji. Estábamos tan convencidos de que el imperio de medios de comunicación y televisión del señor Shikanai se beneficiaría de formar parte del Media Lab del MIT desde sus inicios, que creíamos que Nobutaka Shikanai querría ser uno de nuestros mecenas. Pensábamos que su interés personal por el arte contemporáneo armonizaba con nuestro sueño de unir tecnología y expresión, la invención con el uso creativo de nuestros medios.

Antes de cenar, paseamos por el jardín observando la famosa colección del señor Shikanai, el Hakone Open Air Museum. Durante la cena con los señores Shikanai nos acompañó su secretario privado que hablaba un inglés perfecto, al contrario que los Shikanai, lo cual era significativo. Wiesner inició la conversación expresando un gran interés por la obra de Alexander Calder y habló de la relación que habían establecido el MIT y él mismo con Calder. El secretario escuchó el relato y después lo tradujo de principio a fin. Al término de la explicación, el señor Shikanai hizo una pausa para reflexionar, luego nos miró y emitió un enorme «Ohhhh».

El secretario tradujo entonces: «El señor Shikanai dice que está muy impresionado por el trabajo de Calder, y las adquisiciones más recientes del señor Shikanai tuvieron lugar en las circunstancias de…». Un momento. ¿De dónde salía todo esto?

Así transcurrió casi toda la cena. Wiesner decía algo que era traducido en su totalidad y la respuesta era más o menos un «Ohhhh» que se nos traducía con una larga explicación. Aquella noche me dije que si de verdad quería construir un ordenador personal, tenía que ser tan bueno como el secretario del señor Shikanai. Tenía que ser capaz de expandir y contraer las señales en función de su conocimiento sobre mí y mi entorno, lo cual me permitiría ser redundante en la mayoría de ocasiones.

La mejor metáfora que puedo imaginar para comparar una interfaz hombre-ordenador es la del mayordomo inglés. El «agente» responde al teléfono, reconoce a los que llaman, nos pasa las llamadas que juzga oportunas e incluso dice mentiras inofensivas si es necesario. El mismo agente es sensato, sabe encontrar los momentos oportunos y es respetuoso con la idiosincrasia de cada uno. Las personas que conocen al mayordomo es evidente que gozan de una ventaja considerable sobre los extraños. Eso está muy bien.

Tales agentes humanos están a disposición de muy poca gente. Los secretarios de oficina también juegan un papel similar. Una persona que nos conoce bien y comparte con nosotros mucha información puede actuar en nuestro lugar con mucha eficacia. Si el secretario se pone enfermo, no ayudará en nada que la agencia de trabajo temporal envíe a un Albert Einstein. No tiene que ver con el cociente de inteligencia, sino con el conocimiento que este agente tiene de nosotros y de cómo debe utilizarlo en interés nuestro.

La posibilidad de construir esta clase de funcionalidad en un ordenador era un sueño tan inalcanzable hasta hace poco que la idea ni siquiera se podía tomar en serio. Pero esto está cambiando muy deprisa. En la actualidad, unas cuantas personas sí creen que se pueden construir «agentes de interfaz». Por esta razón, este interés por los agentes inteligentes se ha convertido en el tema de moda de la investigación sobre la interfaz hombre-ordenador. Ahora resulta evidente que queremos delegar más funciones y preferimos manipular menos ordenadores.

La idea es construir sustitutos de ordenador que posean sólidos conocimientos sobre algo (un proceso, un tema de interés, una manera de actuar) y a la vez sobre nuestra relación con ese algo (nuestros gustos, inclinaciones, conocimientos). Es decir, el ordenador debería tener una experiencia doble, como un cocinero, jardinero o chófer que usan sus habilidades para dar con nuestros gustos y necesidades en comida, jardinería y manera de conducir. Delegar esas tareas no quiere decir que no nos guste preparar la comida, cuidar las plantas o conducir el coche, sino que tenemos la opción de hacer esas cosas cuando queramos, porque lo deseamos y no porque estemos obligados a hacerlo.

Lo mismo puede aplicarse a los ordenadores. La verdad es que no tengo interés en recorrer un sistema, atravesar protocolos y descubrir vuestra dirección de Internet. Sólo quiero haceros llegar un mensaje. Tampoco me interesa tener que leer miles de boletines para estar informado. Quiero que estas cosas las haga mi agente de interfaz.

Los mayordomos digitales serán numerosos y vivirán tanto en la red como a nuestro lado, en el centro y en la periferia de nuestra propia organización, ya sea ésta grande o pequeña.

Con frecuencia hablo de lo inteligente que es mi agenda y del cariño que le tengo: cómo entrega en un inglés perfecto sólo la información oportuna y relevante y con cuánta inteligencia. Su manera de funcionar consiste en que sólo un ser humano sabe el número de la agenda, y todos los mensajes pasan por esa persona, que sabe dónde estoy, qué cosas son importantes, a qué personas conozco y quiénes son sus agentes. La inteligencia está en la cabeza del sistema y no en la periferia, es decir, no en la agenda.

Pero también deberíamos disponer de inteligencia en el extremo receptor. Hace poco me visitó el director de una gran empresa cuyo asistente llevaba la agenda y le recordaba lo que tenía que decir en los momentos oportunos. A la larga, incorporarán a la agenda las cualidades del asistente: tacto, sensatez y discreción.

FILTROS PERSONALES

Imaginemos que nos llega a casa un periódico electrónico en forma de bits. Supongamos que se envía a un visor mágico, en un papel muy delgado, flexible, sumergible, inalámbrico, ligero y brillante. La solución de interfaz exige años de experiencia de la especie humana sobre encabezamiento y maquetación, marcas tipográficas, imágenes y una multitud de técnicas que contribuyen a facilitar la lectura. Si el interfaz lo hiciera bien podría ser un medio de información magnífico, pero si tuviera fallos sería espantoso.

Hay otro modo de ver un periódico: como un interfaz de noticias. En lugar de leer lo que otras personas piensan que es noticia y creen que bien vale el espacio que ocupa, ser digital cambiará el modelo económico de selección de noticias; hará que nuestros intereses particulares desempeñen un papel más importante e incluso que podamos tener acceso al tipo de noticias que no se llegan a imprimir porque no se consideran de interés general.

Imaginemos un futuro en que nuestro agente de interfaz puede grabar todos los noticiarios por cable, leer todos los periódicos y sintonizar todas las cadenas de radio y televisión del planeta para luego elaborar un sumario personalizado. Esta clase de periódico saldría en ediciones de un ejemplar único.

Un periódico se lee de manera muy diferente el lunes por la mañana que el domingo por la tarde. A las siete de la mañana de un día de trabajo se hojea un periódico para filtrar la información y personalizar una serie de bits idénticos que se han enviado a cientos de miles de personas. Mucha gente tiende a tirar secciones enteras del periódico sin echarles un vistazo, hojean algo del resto y leen pocas cosas con atención.

¿Qué ocurriría si un periódico pusiera a nuestra disposición todos sus recursos para editar un solo ejemplar? Habría noticias destacadas con relatos «menos importantes» relacionados con la gente que conocemos, con las personas que veremos al día siguiente y los lugares a los que estamos a punto de ir o de los que hemos vuelto hace poco. Nos informaría de las empresas que conocemos. De hecho, estaríamos dispuestos a pagar más por diez páginas del Globe de Boston en esas condiciones que por cien páginas de las habituales si tuviéramos la seguridad de que se nos daría el subconjunto apropiado de información. Consumiríamos cada bit, por así decirlo. Podríamos llamarlo el Diario Yo.

El domingo por la tarde, sin embargo, preferiríamos disfrutar de las noticias con mucha más serenidad, aprender cosas que nunca pensamos que nos interesarían, aceptar el reto de rellenar un crucigrama, reírnos un poco con Art Buchwald y buscar rebajas en los anuncios. Así es el Diario Yo. Lo último que desearíamos un lluvioso domingo por la tarde es tener un agente de interfaz hipertenso que intentase separar el material aparentemente irrelevante.

No obstante, éstas no son dos formas distintas de ser, como el blanco y el negro. De hecho, nos movemos entre ellas, y desearemos disponer de distintos grados de personalización según el tiempo libre, la hora del día y nuestro estado de ánimo en cada momento. Imaginemos una pantalla de ordenador que ofrece información y que cuenta con un mando que, como un control de volumen, permita regular hacia arriba y hacia abajo la personalización. Podría haber muchos controles similares, incluso un pasador que se moviese de izquierda a derecha, tanto en sentido literal como en el político, para poder modificar las noticias sobre asuntos públicos.

Estos controles cambiarían la longitud y el tono editorial de las noticias que recibiríamos. En un futuro lejano, los agentes de interfaz leerán, escucharán y verán cada información o noticia en su totalidad. En un futuro próximo, el proceso de filtrado se iniciará con el uso de cabeceras, aquellos bits que tratan de bits.

CUÑADAS DIGITALES

El hecho de que se sepa que la publicación TV Guide ha tenido más beneficios que las cuatro grandes cadenas norteamericanas de televisión juntas sugiere que el valor de la información acerca de la información puede ser mayor que el de la propia información. Cuando pensamos en la circulación de información nueva, tendemos a restringir nuestras ideas con conceptos como «avances informativos» y «zapping de canales». Estos conceptos no son adaptables. Con mil canales, si vamos de cadena en cadena y permanecemos sólo tres segundos en cada una, tardaremos casi una hora en hacer el chequeo de todas ellas. Un programa habrá terminado mucho antes de que decidamos si es el más interesante.

Cuando yo quiero ir al cine, en lugar de leer la cartelera, pregunto a mi cuñada. Todos tenemos un equivalente que es experto en películas y que a la vez nos conoce bien. Lo que necesitamos construir es una cuñada digital.

De hecho, el concepto de «agente» personificado en seres humanos que ayudan a otras personas es muchas veces una combinación de la experiencia y el conocimiento de uno mismo. Un buen agente de viajes combina sus saberes sobre hoteles y restaurantes con sus conocimientos sobre nosotros, que obtiene de las opiniones que le hemos facilitado sobre otros hoteles y restaurantes. Un agente inmobiliario se hace una idea de nosotros a partir de una sucesión de casas que han encajado con nuestros gustos en mayor o menor grado. Imaginemos pues un agente contestador telefónico, uno de noticias u otro que filtre el correo electrónico. Todos ellos tienen en común la habilidad de poder hacerse un modelo de nosotros.

No sólo es cuestión de completar un cuestionario o tener un perfil fijo. Los agentes de interfaz deben aprender y evolucionar con el tiempo, como los amigos y asistentes humanos. Es más fácil decirlo que hacerlo. Hasta hace muy poco tiempo no hemos empezado a manejar modelos de ordenador que aprenden de las personas.

Cuando hablo de agentes de interfaz, siempre se me pregunta si me refiero a inteligencia artificial. La respuesta es rotunda: «Sí». Pero la pregunta lleva implícitas algunas dudas que surgen de las falsas esperanzas y promesas que la inteligencia artificial hizo concebir en el pasado. Además, mucha gente todavía no se siente cómoda con la idea de que las máquinas sean inteligentes.

Alan Turing, en un escrito de 1950 titulado «Maquinaria informática e inteligencia», fue el primero que hizo una propuesta seria sobre la inteligencia de las máquinas. Más tarde, algunos pioneros como Marvin Minsky compartieron el profundo interés de Turing por la inteligencia artificial. Se planteaban preguntas sobre el reconocimiento del contexto, la comprensión de las emociones, el sentido del humor y el uso de metáforas. Por ejemplo: ¿Cuáles son las letras que siguen a una serie que empieza por U, D, T, C, C?

Creo que tal vez la inteligencia artificial sufrió una recaída alrededor de 1975, cuando los recursos informáticos empezaron a alcanzar el tipo de capacidad que se necesita para resolver problemas intuitivos y exhibir un comportamiento inteligente. Lo que ocurrió es que los científicos optaron de pronto por investigar aplicaciones muy factibles y comercializables, como robots y sistemas expertos (por ejemplo, en los sectores del transporte de mercancías y reservas aéreas), y descuidaron las cuestiones más profundas y básicas de la inteligencia y el aprendizaje.

Minsky señala que mientras los ordenadores de hoy ofrecen una amplia gama de reservas aéreas (un tema casi más allá de la lógica), no pueden ofrecer el mínimo sentido común que tiene un niño de tres o cuatro años. Ni siquiera saben cuál es la diferencia entre un perro y un gato. Temas como el del sentido común están dejando ahora las bambalinas para pasar al centro del escenario de la investigación científica, y esto es importante porque un agente de interfaz sin sentido común puede ser como un dolor de espalda.

Por cierto, la respuesta a la cuestión planteada anteriormente es: S, S. La serie está formada por la primera letra de cada número: Uno, Dos, Tres, Cuatro, etc.

DESCENTRALIZACIÓN

Algunos se imaginan un futuro agente de interfaz como una máquina del estilo Orwell centralizada y omnisciente. No obstante, un resultado más verosímil es una colección de programas de ordenador y aplicaciones personales, cada uno de los cuales es bastante bueno para una cosa y muy bueno para comunicarse con los demás. Esta imagen la forja Minsky en La sociedad de la mente (1987), donde propone que la inteligencia no se encuentra en ningún procesador central sino en el comportamiento colectivo de un grupo de máquinas, más específicas y mu y interconectadas.

Esta visión va en contra de una serie de prejuicios que Michael Resnick, en su libro de 1994 Tortugas, termitas y atascos de circulación, llama el «conjunto de la mente centralizada». Estamos condicionados a atribuir fenómenos complejos a algún tipo de agente de control. Por ejemplo, en general se supone que el pájaro que va al frente en una bandada con forma de V es el jefe y que los otros se limitan a seguirlo. Pues no es así. La formación ordenada es el resultado de un conjunto responsable de procesadores que se comportan de forma individual y siguen sencillas reglas de armonía sin la necesidad de un director. Resnick acertó al crear situaciones en las que las personas se sorprenden al saber que ellas mismas forman parte de procesos similares.

Hace poco contemplé una demostración suya en el Kresge Auditorium del MIT. Se pidió a un público de aproximadamente 1200 personas que empezaran a batir palmas e intentaran hacerlo al unísono. Sin la más mínima dirección por parte de Resnick, y en menos de dos segundos, la sala batía palmas a un solo ritmo. Inténtelo: incluso con grupos mucho más pequeños el resultado puede ser sorprendente. La incredulidad que mostraron los propios participantes indica lo poco que comprendemos, y a veces ni siquiera reconocemos, cómo puede aparecer la coherencia a partir de la actividad de agentes independientes.

Esto no quiere decir que nuestro agente de calendario vaya a concertar citas sin consultar con nuestro agente de viajes. Pero no todas las comunicaciones y decisiones tienen que pasar por una autoridad central para obtener permiso, lo que sería una pésima manera de controlar el sistema de reservas aéreas. Este método sí parece cada vez más viable para controlar organizaciones y Gobiernos puesto que una estructura descentralizada y altamente intercomunicada sería mucho más resistente y tendría mayores posibilidades de sobrevivir. Es mucho más duradera y tiene más probabilidades de evolucionar en el tiempo.

Durante muchos años, la descentralización era plausible como concepto pero imposible como realización. El efecto que produjo ver máquinas de fax en la plaza de Tiananmen es un ejemplo irónico, porque se invocaba la utilización de instrumentos descentralizados y populares precisamente cuando el Gobierno intentaba reafirmar su poder y su control centralizado. Internet es otro ejemplo; aporta un canal mundial de comunicación que escapa a cualquier censura y su éxito es fulminante sobre todo en lugares como Singapur, donde la red es omnipresente y la libertad de prensa marginal.

Los interfaces basados en agentes se descentralizarán del mismo modo que la información y las organizaciones. Así como un jefe del Ejército envía a un explorador o un comisario manda a una pareja de detectives, nosotros enviaremos agentes a recoger información en nuestro nombre. Estos agentes enviarán a otros agentes… Y el proceso se multiplica. Pero recordemos que empezó delegando nuestros deseos en la interfaz en vez de ejecutarlos nosotros mismos.

Este modelo de futuro es muy distinto de una aproximación al diseño de interfaz basado en factores humanos. Es cierto que el aspecto y el tacto de la interfaz son importantes, pero desempeñan un papel secundario en comparación con la inteligencia. De hecho, una de las interfaces más ampliamente extendidas constará de un agujerito (o dos) de plástico o metal, a través del cual nuestra voz llegará a un pequeño micrófono.

También es importante comprender el acercamiento al agente de interfaz como algo muy diferente del furor actual por Internet y su exploración con el programa Mosaic. Los hackers de Internet pueden pasearse por ese medio, explorar enormes conjuntos de conocimientos y complacerse con toda clase de nuevas formas de relación social. Este fenómeno tan extendido no va a declinar o desaparecer, pero es sólo un tipo de comportamiento, que se parece más a la manipulación directa que a la delegación.

Nuestras interfaces cambiarán. La vuestra será distinta de la mía, pues cada una se basará en nuestras respectivas predilecciones en materia de información, hábitos de entretenimiento y comportamiento social, pero todo ello surgirá de la enorme paleta de la vida digital.