5

EL PERFILADOR:
GOOGLE SABE DÓNDE ESTAMOS

La arquitectura de Google permite que cada consulta realizada en su buscador quede almacenada. Cada concepto y cada frase introducida en el cuadro de búsqueda permanecen a disposición del sistema de Google. Oficialmente, el tiempo de almacenamiento es de 18 meses, tal como se ha indicado en el capítulo anterior, a resultas de una medida que entró en vigor el 14 de marzo de 2007. La información depositada en los servidores con anterioridad a esta fecha se guardará el tiempo que Google considere adecuado. En cualquier caso, ¿por qué tienen que estar los datos guardados durante 18 meses? Teniendo en cuenta cómo pasa el tiempo para las nuevas tecnologías, este plazo supone casi una eternidad. Los móviles tienen una vida útil media de entre 18 y 24 meses, y los ordenadores y reproductores MP3 no duran mucho más. La excusa de querer mejorar el servicio no es del todo convincente, porque los servicios también se pueden mejorar con datos anonimizados.

Además, Google almacena la información durante mucho más de 18 meses, ya sea en el Historial web de Google o en los Grupos de Google. Una pregunta planteada en un foro permanecerá guardada eternamente, tal como se indica en el Centro de Asistencia de Grupos de Google, donde se puede leer lo siguiente; «De acuerdo con nuestra política, suprimiremos una entrada si su autor original lo solicita. No eliminaremos las citas de dicha entrada ni las secuencias que hacen referencia a ella a menos que los autores de éstas nos lo soliciten. Los debates constituyen el elemento central de Grupos de Google…». Es decir, que resulta bastante difícil y tedioso borrar las entradas que uno ha escrito. En cualquier caso, el usuario puede probar suerte con la «Herramienta de eliminación» disponible en el citado Centro de Asistencia.

Gobiernos peligrosos

«No me preocupa tanto que sea Google como el gobierno quien tenga interés en acceder a estos datos», afirma la «primera dama» Esther Dyson. El problema para Dyson es que se subvierta la esfera privada, sobre todo en la política. Hoy en día, cuando un gobierno decide acceder a determinada información, siempre habrá una empresa que, tarde o temprano, se la tendrá que ofrecer. Google está acostumbrada a enfrentarse con gobiernos para poder implantar su motor de búsqueda y publicidad en cualquier lugar. En China, por ejemplo, Google ha tenido que someterse a la censura oficial para que su página www.google.cn pueda funcionar. Así lo describió la agencia de noticias AFP el 19 de marzo de 2007; «Para conseguir la aprobación de su página web china con dominio “.cn”, Google se ha comprometido a suprimir de su base de datos para este servicio las direcciones que el gobierno comunista ha considerado indecentes. Entre los temas prohibidos figuran las discusiones sobre Taiwán y Tíbet y la sangrienta represión del movimiento democrático chino en 1989 por parte de las fuerzas armadas».

Colaboraciones como éstas son las que generan incomprensión y constituyen para los críticos la prueba de que Google ha dejado de ser fiel a su lema «Don’t be evil» establecido hace diez años. La empresa permite que un gobierno censure contenidos sólo por consolidarse en el país. Gracias a Google, ningún internauta de Pekín puede buscar los términos «independencia» o «Taiwán», y nadie en Shangai puede consultar vía Google cómo se desarrolló la masacre de la plaza de Tiananmén. Reporteros Sin Fronteras, organización que vela por la libertad de prensa en todo el mundo y sigue sin entender por qué Google hace estas concesiones y deja censurar sus contenidos por puro beneficio económico.

También en Singapur hay indicios de que Google coopera con las autoridades. Según un rumor insistente, pero sin confirmar, el gobierno singapureño paga por acceder a determinada información, algo que la empresa de Mountain View desmiente, por supuesto. Otro ejemplo de la buena cooperación existente con las autoridades es el caso de un bloguero anónimo cuya dirección IP fue revelada por Google, responsable del servicio Blogger.com, a un tribunal israelí en noviembre de 2007. Por lo visto, el bitacorero había difamado a tres políticos locales al acusarlos en su blog de mantener contactos con el hampa. Aunque al principio Google intentó resistirse al requerimiento apelando a la libertad de expresión, las autoridades israelíes replicaron diciendo que había una «sospecha fundada de delito». Numerosos medios norteamericanos criticaron con vehemencia a Google por su actuación en el caso, pero la empresa se remitió en todo momento a la «orden del tribunal». Una vez más se demuestra que un estado o una autoridad sólo tiene que amenazar con una orden judicial para acceder a los datos de Google.

La censura también llega a Europa. En Alemania, el Centro Federal de Control de Medios Peligrosos para la Juventud (BPjM) marca regularmente determinadas webs. Según Google, se trata de «miles de páginas» que se reciben y se añaden a una lista negra como consecuencia de la autocensura practicada por la asociación de Autocontrol Voluntario de los Proveedores de Servicios Multimedia (FSM). Sin embargo, también Yahoo!, MSN y otros buscadores eliminan asimismo estas páginas de sus índices de búsqueda (webs de pornografía infantil, ultraderecha y enaltecimiento de la violencia).

En la mayoría de los países, Google tiene unos empleados cuya tarea principal es la de practicar el lobbying, es decir, comunicarse con gobiernos y partidos. Se denominan policy counselsy consejeros políticos. Cuando Google tiene a la vista un nuevo proyecto, como el Street View en Europa (vistas fotográficas de las calles en Google Maps), primero se pone en contacto con gobiernos y autoridades para saber cuáles son las posibles condiciones y someter a examen el diseño de la operación. Pero estos consejeros también ejercen de interlocutores para partidos y gobiernos cuando éstos tienen algún «deseo» especial que formular a Google. Ya hemos hablado de cómo son estas peticiones en China u otros países totalitarios, y no sería de extrañar que los ejecutivos europeos también tuvieran algún que otro deseo que plantear a Google.

La posibilidad de acceder a los datos que Google recopila también puede ser de utilidad para el estamento policial, como lo demuestra el caso de Melanie McGuire. En la primavera de 2007, esta mujer de treinta y cuatro años y residente en Nueva Jersey fue acusada del asesinato de su marido. Durante la causa se supo que había introducido en el buscador la frase «how to commit murder» exactamente diez días antes de que su marido recibiera un disparo. McGuire también había tecleado, tanto en Google como en MSM, las frases «undectectable poisons», «fatal insulin dosis», «poisoning deaths», «where to purchase guns illegaly» y otras por el estilo. La policía encontró esta información analizando el disco duro de la sospechosa, pero también la podría haber solicitado directamente a Google, ya que en Estados Unidos las direcciones IP son fijas y permiten llegar al titular como si fuera un número de teléfono.

Precisamente aquí reside el problema: Google sabe más que la policía. En cualquier lugar donde Google sea el buscador más popular (en la mayoría de los países europeos lo es), la información que recopila podría ser de gran utilidad para las pesquisas policiales. Durante las investigaciones realizadas para este libro también intenté descubrir cuántas peticiones ha recibido Google de los distintos cuerpos de policía de todo el mundo. Desgraciadamente, no obtuve ninguna respuesta, pero tampoco es muy difícil imaginar cómo reaccionan las empresas ante la presión política. Si, de la noche a la mañana, un gobierno dictase unas leyes que obligasen a las empresas a publicar sus datos, no cabe duda que el tesoro de Google estaría muy codiciado por cualquier autoridad.

La cantidad de información que se recopila y las bases de datos que se interceptan como consecuencia de la guerra contra el terror es cada vez mayor, como demostró el caso SWIFT. En la Society for Worldwide Interbank Financial Intercomunications (SWIFT), con sede en Bélgica, se realizan diariamente unos once millones de transferencias financieras por un volumen de aproximadamente 4,8 billones de euros. El motivo de la polémica fue que los servicios de seguridad estadounidenses controlaban regularmente las transferencias que se realizaban a su país. En la red de la sociedad figuran 7800 institutos de crédito de 200 países. Este espionaje se justificó argumentando que la intención era evitar actividades terroristas relacionadas con las transferencias.

De la misma manera que se puede espiar a SWIFT, o que las líneas aéreas con vuelos a Estados Unidos tienen que poner a disposición de las autoridades estadounidenses los datos de los pasajeros antes del despegue, también un gobierno podría exigir a Google que le dejase echar un vistazo a sus bases de datos. Y como Google es uno de los motores de búsqueda más populares del mundo, las autoridades estadounidenses tendrían acceso a los datos de todos los usuarios de Google del planeta. La información grabada en Yahoo! o MSN no es menos atractiva, pero la popularidad y el ingenioso sistema de Google son la mejor garantía para encontrar en sus servidores el material más interesante y comprometedor.

De momento, no hemos llegado tan lejos. Esther Dyson también sabe cómo impedir el intervencionismo: «El pueblo tiene que controlar al gobierno». ¿Cómo?: «Destituyéndolo mediante las urnas». O reeligiéndolo.

Google contra Los defensores de La privacidad

En cambio, los organismos de protección de datos y los defensores de la privacidad no son precisamente condescendientes con la empresa del «Don’t be evil». Según ellos, Google es mala. Por un lado, desde Washington, el Center for Digital Democracy (CDD) y el Center for Democracy and Technology (CDT) luchan contra Google, y su acritud no se limita al mencionado acuerdo con DoubleClick. Por otro lado, en Europa actúa la organización británica en favor de los derechos civiles Privacy International (PI), cuya relación con Google es todo menos amistosa. En el verano de 2007, PI le otorgó el peor calificativo que puede recibir una empresa: «hostile to privacy» (enemiga de la privacidad).

«Ninguna de las firmas investigadas ejerce una amenaza sobre los datos personales comparable a la que practica Google», dijo el jefe de PI Simón Davies. Durante seis meses, 23 empresas del sector de las tecnologías de la información fueron sometidas a examen. No sólo se tuvieron en cuenta distintos análisis y valoraciones técnicas, sino que también se consideraron los datos que las propias empresas habían facilitado. Google causó mala impresión porque los datos de los usuarios recopilados con su herramienta de búsqueda se podían combinar con los de otros servicios (Gmail, Google Maps, etc.). «Los usuarios no pueden consultar los datos que Google reúne sobre su identidad ni solicitar que los supriman», crítica Davies. «Un análisis más pormenorizado ha revelado que Google hace con nuestros datos mucho más de lo que jamás habríamos imaginado», concluye. Los dos años de almacenamiento de las consultas también son demasiado tiempo para Davies. Según el informe de PI, Google infringiría las leyes de protección de datos en muchas partes del mundo. Por su parte, los abogados de la empresa reaccionaron diciendo que la recopilación de datos servía para comprender mejor a los usuarios y mejorar los servicios ofrecidos. Para los defensores de la privacidad, estas palabras sólo son débil consuelo.

Mucha gente que utiliza el buscador se preguntará: «¿Qué sabrá ahora Google sobre mí?». Actualmente es más de lo que se puede imaginar, pero siempre depende de lo que el usuario haga con Google y de los servicios que utilice.

Si nos limitamos a la búsqueda clásica, lo «único» que se conoce es la dirección IP, el concepto de búsqueda, la hora y todo lo que registre la cookie. Sólo con esto ya se puede crear un bonito perfil de áreas de interés del usuario. «Sin embargo, siempre tienes que pensar lo que introduces en un buscador», me dijo Danny Sullivan, el experto en motores de búsqueda que ha seguido la evolución de Google desde el principio y nunca ha dejado de apoyar a Page y Brin con sus consejos. «Porque un proceso de búsqueda no es, de largo, tan anónimo como la gente cree». Si hasta Sullivan, quien desde su plataforma[8] demuestra ser lo más alejado a un crítico voraz de los buscadores, habla en estos términos, es que hay gato encerrado.

Google dispone de un servicio que, a primera vista, parece divertido y, a la vez, un tanto desconcertante, con el que aplica en la búsqueda las tendencias de individualización y personalización. Al igual que hace Amazon («Los clientes que han comprado este libro también se han decidido por…»), el departamento de personalización (engeneering lead personalization) de Mountain View ha desarrollado un sistema de recomendaciones. Los que no deseen realizar ninguna búsqueda, pero quieran navegar en la Red, pueden pulsar el botón de «recomendación» y obtener sugerencias actualizadas diariamente. Estas recomendaciones se generan en función de cada perfil de búsqueda, es decir, a partir de consultas anteriores.

Se trata de un servicio prácticamente inofensivo si lo comparamos con las posibilidades de vigilancia que se abren al utilizar los otros servicios de Google, donde los usuarios son como un libro abierto, unos con más páginas, otros con menos. Y es que este gran consorcio de Internet se brinda solícitamente a organizarnos períodos de nuestra vida y facilitarnos toda suerte de consejos, servicios y software gratuito.

Google «no es mala» y, por ello, no sólo proporciona un paquete de programas totalmente gratis con procesador de textos, tratamiento de imágenes y programa de presentaciones, sino que también ofrece protección antivirus. Además, al ser un software online, abre la posibilidad del espionaje en línea. Como cada programa está provisto de un número de serie o de identificación, se pueden extraer y, de nuevo, recopilar una gran cantidad de datos a partir de su utilización.

El escáner de Gmail

Para abrir una cuenta en Gmail hay que registrarse, y esto significa proporcionar a Google una serie de datos personales como el nombre, residencia, edad, etc. A su vez, estos datos se pueden combinar con la información que proporciona la dirección IP, es decir, con las búsquedas realizadas, como mínimo, en los últimos 18 meses. Lo que la mayoría desconoce, aunque se explique detalladamente en las condiciones de uso de Gmail, es que el correo se analiza y, además, se completa con una publicidad adecuada al contenido de los mensajes. En Estados Unidos, el escaneado del correo electrónico ya es una práctica extendida, y en Europa también funciona. Haga lo que haga el escáner, se puede considerar como control total.

El mismo programa que se encarga de filtrar el correo masivo no solicitado (spam) se ocupa también de explorar los mensajes y completarlos con un anuncio adecuado al texto, tanto los redactados como los recibidos. Sólo hay pausas publicitarias o e-mail sin anuncios cuando el barrido del texto determina que el mensaje contiene información sobre una catástrofe o un acontecimiento trágico, como un accidente o una muerte. Quién sabe si algún día Google adjuntará un pésame en un correo electrónico que informe de la defunción de un amigo o un familiar; o un «que se mejore pronto» cuando alguien utilice el correo para anular una cita por motivos de salud; o incluso un «¡arriba ese ánimo!» si en el mensaje alguien se está desahogando a consecuencia un mal de amores.

En el aviso de privacidad del servicio, Google asegura que no facilita ninguna información personal de los e-mails a las empresas anunciantes. La propia mención de este punto resulta ya sospechosa.

En el año 2004, el acreditado periodista y divulgador de las nuevas tecnologías Walt Mossberg, que aparte de firmar una columna en The Wall Street Journal conduce «All Things Digital»,[9] uno de los blogs tecnológicos más famosos de Estados Unidos, también se mostró escéptico con Gmail y animó a Google a montar un servicio de correo electrónico alternativo que no escanease nada, no adornase la pantalla con publicidad y, como contrapartida, cobrase una cuota de suscripción aceptable. Google dio la callada por respuesta, como es lógico, ya que la propuesta chocaba frontalmente con su filosofía del «todo gratis».

A este respecto cabría mencionar otra peculiaridad de Gmail. Cuando el usuario entra en su cuenta para consultar el correo y después abre otra ventana de su navegador para entrar en otro sitio Google, lo hará con la identidad de su correo electrónico.

Todos los que dicen que nadie está obligado a crear una cuenta de Gmail y que se pueden utilizar otros servicios de correo electrónico gratuitos, reciben siempre la misma respuesta; Gmail es tan popular porque Google pone a disposición de todos sus usuarios una capacidad de almacenamiento remarcable, mucha más que sus competidores.

El espacio de memoria online también es un estímulo para muchos internautas que utilizan otro servicio: el disco duro en línea GDrive, una memoria en la Red donde el usuario puede almacenar sus datos. Desde el punto de vista de la recopilación de información y el uso que de ella hace Google, resulta del todo cuestionable confiar en este servicio. Si se trata de música, vídeos o fotos, no hay nada que objetar, pero si el servicio de almacenamiento online se utiliza para guardar documentos más delicados, hay que andar con cuidado, porque los tentáculos del pulpo de los datos siempre están al acecho. Debido a los virus, todos los datos se escanean por motivos de seguridad. Por tanto, no resulta aventurado pensar que, como ocurre con Gmail, también se analicen los textos.

Todos los movimientos quedan registrados

Al utilizar Google Maps para buscar poblaciones y visualizar rutas, estamos facilitando a Google la tarea de elaborar un perfil de nuestros movimientos, ya que, en teoría, las direcciones introducidas también se pueden grabar y utilizar (algo que a la policía le puede resultar de mucha utilidad).

Con el Historial web de Google[10] el usuario puede grabar en línea su historial de navegación y recuperarlo posteriormente. Google protocoliza todas las páginas web, imágenes, vídeos o incluso noticias que el internauta ha consultado. Para utilizar esta función es necesario tener una cuenta Google, con lo que volvemos otra vez a lo mismo. En cuanto estamos registrados, nuestros hábitos de navegación se pueden guardar con nombre y apellidos y permitimos la creación de perfiles.

Si utilizamos Google Earth para colgar nuestras fotografías a través, por ejemplo, del popular portal de imágenes Flickr, estamos sirviendo a domicilio una serie de impresiones visuales que permiten a Google descubrir dónde hemos ido de vacaciones o dónde hemos estado de viaje de negocios.

Si activamos las Alertas de noticias, revelaremos nuestros intereses informativos.

Si nos instalamos la Búsqueda de Desktop nos convertimos en un libro abierto para Google, porque este programa protocoliza prácticamente cada tecla que pulsamos y revela todo lo que hemos guardado y ejecutado en el ordenador (incluso cuando nos conectamos ocasionalmente). La Búsqueda de Desktop es particularmente controvertida, ya que con unos cuantos clics (teclear un término y pulsar el botón de búsqueda) aparecen en décimas de segundo todos los ficheros y correos electrónicos donde aparece el concepto buscado. A veces, esta función también encuentra archivos que se han eliminado hace tiempo, pero que todavía están en algún lugar de la caché y, de repente, como por arte de magia, vuelven a aparecer.

El problema de la caché

La caché no sólo es peligrosa en el ordenador, sino también en la Red. La WWW no perdona los pecados de juventud. Pobre de aquel que en algún momento de su vida haya dicho alguna tontería en un foro, haya planteado una pregunta absurda en un grupo de noticias o esté circulando una imagen suya en situación frívola o embarazosa, porque, gracias a Google, en la Red se encuentra (casi) todo. La función «Caché» de Google hace que hasta las páginas web permanezcan almacenadas durante muchísimo tiempo: «La Caché de Google es la instantánea de la página que tomamos cuando exploramos la Web en forma automática. Es posible que la página haya cambiado desde entonces. Haga clic aquí para ver la página actual sin resaltar», se puede leer en el buscador al hacer clic en el enlace «En caché».

Las memorias caché no se vacían prácticamente nunca. Google permite encontrar esa información que muchos habrían preferido enterrar en lo más profundo de la Red. Resulta prácticamente imposible borrar una reproducción de una página, deshacerse de un pecado de juventud o superar una difamación extendida en la Web, y si se consigue, siempre es a costa de un tremendo esfuerzo.

En cualquier caso, el poder del motor de búsqueda de Google ha permitido el surgimiento de empresas como Reputationdefender[11] en Estados Unidos o Datenwachschutz[12] en Alemania, que se encargan de mantener la buena reputación en la Red. «En la web hay fotografías desagradables, información privada, vídeos filmados a escondidas, datos bancarios, libelos, etc., distribuidos por decenas de miles de páginas. Nosotros le ayudamos a borrar esa información y guardar las pruebas», explica Datenwachschutz para promocionar sus servicios, «Gracias a Google, tenemos mucho trabajo», explica su director, Carsten Hoppe. «Borrar de Google y de Caché de Google» es uno de los servicios que la empresa cita literalmente. De hecho, en los últimos años se ha puesto de moda no sólo buscarse a uno mismo en Google, sino introducir en el buscador el nombre de trabajadores de una empresa o aspirantes a puestos de trabajo. Estas consultas permiten saber muchas más cosas sobre un empleado: qué aficiones tiene, en qué foros añade comentarios o, incluso, a qué grupos de ayuda pertenece. Así, por ejemplo, se podría descubrir que alguien ha visitado un portal para alcohólicos, fumadores o depresivos y ha añadido una pregunta en el foro; es decir, una información que podría resultar muy valiosa cuando un jefe tiene que decidirse entre varios candidatos para un puesto de trabajo.

iGoogle entra hasta el dormitorio

En mayo de 2007 entró en funcionamiento iGoogle, un servicio con el que los internautas pueden configurar una página de inicio personalizada para utilizarla como portal de navegación en la Red. En la página de iGoogle se pueden incluir, por ejemplo, webs de noticias preferidas, servicios de previsión meteorológica, listas de tareas o vídeos de YouTube. Si utilizamos esta página personalizada también estamos proporcionado a Google información sobre nuestros campos de interés. Lo mismo ocurre con la Búsqueda de libros de Google.

Y si a todo ello añadimos Google Calendar, el retrato del usuario quedará finalmente acabado, sobre todo teniendo en cuenta que el calendario también se puede obtener como aplicación para móviles.

Si utilizamos Google Talk, un servicio de mensajes instantáneos similar al que ofrecen MSN o ICQ, también proporcionamos a Google datos de comunicación escrita, por no hablar de lo que pasará en un futuro cuando la empresa entre en el negocio de la telefonía móvil con la plataforma Android.

No sería desacertado pensar que a mi gobierno se le ocurriera utilizar las consultas de búsqueda para obtener una determinada «tipología criminal». Esto fue lo que sucedió cuando, en el marco de una investigación policial sobre pornografía infantil en la Red, las autoridades estadounidenses obligaron a los operadores de motores de búsqueda a hacer públicas una serie de búsquedas concretas. Yahoo!, AOL y MSN accedieron al requerimiento. Google se negó, pero, y he aquí el problema, tuvo que ser un juez federal quien le obligó a acatar la orden.

Los responsables de los buscadores no niegan que las cookies de los distintos servicios se puedan vincular entre sí, lo que a su vez significa que cada uno de estos servicios recopila unos datos que son una piedra más o menos grande del mosaico y que, reunidas, forman el retrato final del internauta. Oficialmente, los responsables de esta pasión coleccionista se justifican arguyendo que así pueden desarrollar ofertas más a medida y mejorar continuamente los servicios.

Sea como fuere, volvemos de nuevo a lo mismo: la información es dinero. Para las empresas anunciantes que venden productos o servicios, el hecho de saber dónde hay un posible consumidor supone una clara ventaja respecto a la competencia.

Ya no es ninguna garantía que los responsables de los buscadores indiquen en sus condiciones de protección de datos que no facilitarán a otras empresas o personas ninguna información sin la aprobación del usuario. ¿Qué ocurre cuando se produce una venta? ¿Los usuarios de YouTube fueron consultados cuando Google compró la plataforma de vídeo?

También YouTube despierta cada vez más curiosidad. En la Advertising Research Foundation Rethink’s Conference, la directora de marketing de YouTube, Suzie Reider, anunció que, en un futuro, el portal recopilaría más datos de los usuarios. Según Reider, el objetivo es saber quién ve vídeos y qué vídeos ve para poder dirigir mejor la publicidad. Una vez más, el círculo se vuelve a cerrar: publicidad más dirigida significa publicidad más eficiente, lo que a su vez implica mayores ingresos.

Los defectos de la Web 2.0

La Internet participativa Web 2.0, cuya evolución ha estado marcada de forma determinante por servicios como YouTube, Facebook, Wikipedia, Twitter o Dopplr (prácticamente cada semana arrancan nuevas webs 2.0), también suscita el interés de Google. Casi todos los proyectos de la Web 2.0 comenzaron como pequeñas iniciativas no comerciales. Si la idea que proponen es buena, atraen usuarios, crecen y van ganando interés, no sólo para los internautas, sino también para otros competidores o empresas de TI. Finalmente, viene una gran firma como Google, eBay o Amazon y las adquiere.

Esto significa, una vez más, que todo aquel que introduzca hoy sus datos en una red social, tarde o temprano verá que los ha puesto a disposición de uno de los grandes. Facebook encarna el mejor ejemplo de este proceso. Microsoft y Google se enfrascaron en una dura pelea (o al menos así se reflejó en los medios) para obtener participaciones de esta plataforma. La adjudicación definitiva se produjo en octubre de 2007 y la beneficiaría no fue precisamente Google, sino Microsoft. El gigante del software pagó nada menos que 240 millones de dólares por una participación del 1,5%. Con la compra de las acciones no sólo conseguía una pequeña victoria sobre Google, sino también los derechos sobre la información de los usuarios de Facebook. Con toda seguridad, a algunos de ellos no les habría gustado que Microsoft pudiese disponer de sus datos, pero ahora ya es demasiado tarde.

La personalización y la explotación de los datos de los usuarios es un proceso que no ha hecho más que empezar. «Nuestros algoritmos son cada vez mejores y también estamos mejorando en cuanto a la personalización», afirmó, no sin causar impresión, el presidente ejecutivo de Google, Eric Schmidt, en una entrevista concedida al Financial Times en mayo de 2007. La idea que Schmidt tiene de la personalización es: si alguien busca un empleo, teclea en Google «¿qué trabajo puedo hacer?» y Google da la respuesta. También sobre cuestiones tan banales como «¿qué puedo hacer esta noche?» o «¿qué me puedo poner hoy?» pretende Google ayudar con sus consejos (por supuesto, en la última pregunta el usuario necesitaría una webcam). Schmidt explicó que «actualmente ni siquiera podemos dar respuesta a las preguntas más sencillas, porque sabemos demasiado poco», y anunció que los futuros planes de expansión se plantearían alrededor de este tema.

Para que esta personalización funcione, es necesario conocer al usuario, y esto se consigue con los distintos servicios que ofrecen la información en bandeja a Google. De hecho, la personalización no es más que un sistema de programas y ordenadores que sabe quiénes somos y qué hacemos.

Algunas ideas de Google resultan un tanto sospechosas. Justo al lado de la entrada principal del cuartel general de Mountain View, en el edificio 43, hay una enorme pizarra llamada «Masterplan» donde, si nos tomamos algo de tiempo, podremos llegar a leer ideas un tanto abstrusas. Sobre este gran panel, los empleados dan rienda suelta a sus pensamientos y escriben con rotulador propuestas sobre cosas a las que Google debería dedicarse. En su mayoría son simples disparates, ideas con las que mofarse de los críticos de la empresa. Quizás por ello se han escrito tantas cosas despectivas sobre el Masterplan. ¿A qué debería dedicarse Google? En la pizarra se pueden leer cosas como «viajes en el tiempo», «teletransporte» o «control de antecedentes» (esto último ya es probablemente una realidad).

Se podría decir que Google adoptó una idea de esta pizarra cuando, en la primavera de 2007, registró una patente con la que pretende ampliar los perfiles de los usuarios con un componente psicológico. Google quiere desarrollar un método con el que poder crear perfiles de conducta de los jugadores en línea. El programa analiza el comportamiento de las personas que juegan por Internet o en una consola conectada a la Red (en juegos como World of Warcraft o Second Life) y extrae conclusiones sobre la personalidad y las preferencias del jugador. A partir de los diálogos con los jugadores se puede saber si alguien es tranquilo, impulsivo, agresivo, colaborador o arriesgado. Con esta información pretenden, una vez más, atraer a empresas interesadas en anunciarse en los juegos. Los posibles anunciantes podrían ser tanto una pizzería de la zona como un fabricante de bebidas energéticas. En cualquier caso, la patente encaja perfectamente con la estrategia que Google quiere aplicar en los juegos. Su objetivo no es desarrollarlos, sino (y no podría ser de otra manera) llenarlos de anuncios. A principios de 2007, Google adquirió la firma AdScape, especializada en la publicidad en juegos.

La extracción de datos con data mining

La obtención de datos, actividad que Google desarrolla a gran escala, sólo es una cara de la moneda. De hecho, para transformar los perfiles de los usuarios en dinero contante y sonante (es decir, para venderlos a la publicidad), primero hay que analizar toda esta información. Teniendo en cuenta los 3600 millones de búsquedas que se realizan cada hora, no parece una empresa fácil.

Los datos son inútiles mientras están almacenados en los servidores y sólo adquieren valor cuando se procesan con un programa de análisis. El data mining se ha convertido en una práctica habitual en las grandes firmas desde hace años. Operadores de telefonía móvil o supermercados analizan la información de sus clientes con un software de extracción de datos que reconoce modelos, reglas y peculiaridades porcentuales a partir de métodos estadísticos y matemáticos. Los proveedores de programas de data mining, como el SAS Institute, anuncian sus productos a las empresas como una posibilidad de orientar las estrategias comerciales.

Estos métodos también los aplican institutos de investigación, administraciones y tiendas online. El data mining funciona con la misma rapidez que un motor de búsqueda, pero el proceso está automatizado: se introducen unos criterios de búsqueda y el programa extrae la información. ¿Cuántos clientes han visitado páginas de contenido erótico entre las cuatro y las cinco de la mañana en Alemania? ¿Qué internautas que compran en Amazon tienen una cuenta en iTunes y se interesan por los últimos téjanos de Levis? El software muestra las respuestas perfectamente ordenadas en unas tablas y gráficos de fácil comprensión.

¿Cómo funciona la extracción de datos en Google? Cualquiera que examine de cerca el programa gratuito Google Analytics se puede hacer una idea al respecto. La versión de prueba[13] es impresionante, porque muestra todo lo que pasa con los datos, cómo se interpretan, qué estadísticas se pueden extraer a partir del comportamiento de los usuarios y lo bien que se puede presentar gráficamente toda la información. Google lo recomienda a todos los que utilizan el módulo de publicidad AdWords para sacar más provecho de sus campañas.

Por lo demás, el data mining es esencial cuando hay que analizar cantidades de datos enormes, pero también cuando entra en juego otro concepto: el Knowledge Discovery, o descubrimiento de conocimiento. Y es que en una base de datos tan descomunal como la que administra Google, el conocimiento sólo se puede descubrir o extraer utilizando los sistemas correspondientes.

¿A quién ofrece Google estos datos? Oficialmente, se supone que a nadie, ni siquiera ahora, aunque si se ofreciesen las sumas adecuadas, Google podría abrir una nueva fuente de ingresos en cualquier momento. Efectivamente, si una empresa tuviera acceso a este conjunto de datos se beneficiaría de una enorme ventaja con respecto a la competencia y conocería las tendencias de consumo mucho mejor que cualquier instituto de opinión o de estudios de mercado, porque la muestra de individuos sería prácticamente toda la comunidad de Internet, que cuenta con cientos de millones de usuarios. En un escenario así, Google tendría un papel decisivo, porque podría influir en el mercado más que cualquier otra empresa y poseería un instrumento de presión determinante frente al resto de corporaciones. ¿Jugará Google estas cartas algún día?

Del algoritmo al futuro

Google apuesta por el data mining prácticamente desde su nacimiento, y más todavía siendo uno de sus fundadores, Sergey Brin, un experto en la materia. De hecho, el motor de búsqueda de Google se basa en una función de data mining, un algoritmo que es el secreto de su éxito.

Naturalmente, hay otros sistemas que se aprovechan del conocimiento y el descubrimiento de tendencias y modelos, como por ejemplo, el juego de bolsa virtual Performclub.[14] En esta página se puede participar con dinero real en una competición inspirada en la bolsa. El jugador cambia su dinero auténtico (diez euros al mes) por dinero virtual y tiene la posibilidad de dominar diez parqués internacionales, desde Nueva York hasta Hong Kong. Como en la vida real, puede apostar por la caída o subida de cotizaciones. Si el jugador especula bien, obtendrá beneficios; de lo contrario, puede volver a cambiar diez euros por fichas y seguir jugando.

¿Qué tiene que ver este ejemplo con Google? Performclub funciona en pequeño igual que Google en el gran mercado de la economía mundial. El juego está conectado en línea con las bolsas reales, utiliza las cotizaciones reales y los jugadores actúan con dinero virtual, que después pueden volver a cambiar por dinero auténtico. En definitiva, una bolsa real en línea. El juego se basa en lo que se conoce como sistema de microtransacciones. «Este sistema transforma los beneficios bursátiles virtuales en dinero real y asegura el reparto a todos los ganadores». Es decir, los operadores pueden repartir dinero porque analizan el conocimiento de los jugadores (ganadores) y utilizan este know-how en su propio beneficio para especular (con éxito) en la bolsa.

Google también actúa de una forma muy parecida: extrae las claves de las tendencias futuras analizando los datos mediante el data mining y el cálculo de probabilidad. Un ejemplo sería la especulación con propiedades inmobiliarias, porque Google es perfectamente capaz de pronosticar el valor de bienes inmuebles en determinadas situaciones.

«El data mining es inaceptable si se aplica con el alcance de que Google es capaz por las muchas fuentes de las que dispone», afirma el profesor Hermann Maurer, de la Universidad Tecnológica de Graz. Por encargo del gobierno austríaco, Maurer elaboró un profundo examen pericial de 184 páginas titulado «Repon on dangers and opportunities posed by large Search engine, particularly Google». «No sólo es necesario emprender alguna acción contra Google, sino también contra este nuevo fenómeno. No se puede dejar que el data mining a gran escala y los grandes motores de búsqueda campeen a sus anchas en el juego de la libre economía. Pertenecen a esa categoría de actividades donde el estado tiene que actuar, tal y como ya lo hace en otros ámbitos como las escuelas, la autorización de medicamentos o la construcción de grandes infraestructuras». Gracias al data mining, las empresas con una posición dominante en el mercado disponen de otra herramienta más de poder. Según Maurer, hay que intervenir para que estos monopolios no se vuelvan peligrosos.

Las tendencias de Google Trends

El buen funcionamiento de esta previsión de tendencias se puede comprobar fácilmente visitando la dirección www.google.com/trends. En esta página se puede introducir un término e, inmediatamente, saber con qué frecuencia ha sido buscado. ¿Qué tiene que ver esto con el espionaje de Google? Si un usuario habitual de la Red ya puede acceder a estos sistemas, es muy probable que Google esté en disposición de aplicar esta tecnología con mucha mayor puntería, rapidez y calidad.

En Google Trends también se pueden examinar comparativamente dos conceptos a la vez, o dos empresas. Por ejemplo, Microsoft y Apple, Yahoo! y Google o Internet Explorer y Firefox. Sólo tenemos que introducir en el cuadro de búsqueda los dos nombres separados por una coma. Apretando un botón, aparece un gráfico que muestra superpuestos los resultados para las dos empresas consultadas. Las curvas de evolución están salpicadas de letras que remiten, como una nota a pie de página, a un anuncio importante relacionado con cada empresa en un momento determinado. En el caso de la comparación entre Apple y Microsoft, el gráfico indica que la presentación del iPhone de Apple repercute en la tendencia de búsquedas y hace subir la curva, mientras que los acontecimientos relacionados con Microsoft dejan relativamente fríos a los usuarios de Internet. Si, por ejemplo, tecleamos «Nokia» en el buscador de tendencias, veremos que con la presentación del nuevo modelo (la serie N, el 26 de agosto de 2007) apenas crece el interés, mientras que el anuncio de devolver 46 millones de baterías hace subir de golpe la línea de tendencia.

El «News Reference Volume» de Google Trends, donde se puede consultar qué empresa o qué producto aparece en los medios, también proporciona una lectura apasionante. Con el servicio «Hot Trends», el índice de actividades de búsqueda se puede incluso trasladar a un único día. Es muy probable que Google pueda indicar con mayor detalle todavía la demanda de determinados productos o empresas; a la hora, al minuto o, ¿quién sabe?, en tiempo real. Google domina el trend tracking porque se ha posicionado en la cumbre de la tan omnipresente sociedad de la información y puede ordenar los datos desestructurados que esta sociedad genera. Google se ha convertido en un broker de la información que puede ofrecer servicios a empresas de cualquier sector y cobrar cantidades sustanciosas en todos los mercados.