EL FUTURO:
EL MUNDO NO ES (TODAVÍA) GOOGLE
Un 95% de cuota de mercado en España, un 90% en Francia, un 89% en Alemania y un 88% en Suiza: Google es un buscador completamente europeo. Pensado por estadounidenses, hecho para europeos. Ni siquiera en Estados Unidos es Google tan popular como en Europa: la cuota de mercado de Google en Estados Unidos se sitúa cerca del 60% (según una estadística de la empresa de investigación de mercados comScore). En la Unión Europea, la cuota de mercado se dispara al 83%. Los buscadores Yahoo!, MSN o Ask Jeeves apenas logran un exiguo 6% —todos juntos—. Pero también fuera de la UE Google es líder del mercado: en Turquía, Israel, Arabia Saudí y Sudáfrica, por citar sólo algunos ejemplos.
No obstante, existen también países en los que Google no es tan demandado. En Egipto, Google ocupa sólo la segunda posición, con un 33%: Yahoo! lidera el ranking en el país con un 51%. En Rusia, Google se sitúa únicamente en tercera posición: por detrás de los buscadores rusos Yandex (53%) y Rambler (19%), Google alcanza a duras penas el 13% de cuota de mercado. En la República Checa (pese a estar situada en una UE tan favorable a Google), el mundo de colores de Google también parece bastante gris: con un 9% de cuota de mercado, Google se sitúa, igualmente, en el tercer puesto tras los buscadores checos Seznam (47%) y Centrum (15%). Sólo en cuarto lugar aparece Google en la estadística de Bielorrusia: tanto Yandex como Rambler y Tut superan al buscador estadounidense.
Existen muchas alternativas y también países en los que los colores de Google aún no brillan en todas las pantallas. Puede que el resto de los buscadores no sean tan populares como Google, pero no tienen por qué ser peores.
Al contrario. No funcionan con un mecanismo de activación de publicidad tan astuto como Google AdWords, sino que se centran sobre todo en una cosa: buscar y encontrar. Y es que en el núcleo de actividad de Google, y pese a todos los esfuerzos de sus investigadores, existe un cierto estancamiento. El «Motor de búsqueda programable» (PSE por sus siglas en inglés) aún no está maduro y esto ofrece a los competidores la posibilidad de demostrar que con ellos se puede googlear mejor.
Cada cierto tiempo se presentan buscadores que, supuestamente, funcionan mejor que Google. Todos pretenden haber encontrado la piedra filosofal y tener la fórmula para hacerlo mejor. Páginas como Searchengineland,[35] Searchengínewatch[36] o Searchengineguide[37] presentan nuevos buscadores prácticamente cada semana. Si funcionan o no mejor que Google, Yahoo! o Live! es otra cuestión, basta señalar que existen alternativas; por lo menos en lo que se refiere a la búsqueda misma. Por si un día Google no funciona o se desea impedir que la multinacional recopile aún más datos sobre uno o evitar los grandes buscadores como Yahoo!, Windows Live o Ask.com, aquí se exponen diez alternativas a Google:
Exalead[38] es una de ellas. Si bien es cierto que el buscador no sondea tantas páginas como Google (el índice de Google consta de 10 000 millones de páginas), cuenta con funciones adicionales que compensan este hecho. La más llamativa: los resultados se muestran no sólo como texto, sino también como captura de pantalla. Además, existe una opción de búsqueda que consiste en la búsqueda en Wikipedia, y la función de «Búsqueda avanzada» es muy completa. Otro punto a su favor es que el número de páginas de comparativas de precios que se muestra al buscar un producto es significativamente menor.
Ixquick[39] también es utilizado por algunos usuarios de Internet en lugar de Google; www.ixquick.com consiste en lo que se denomina un metabuscador: utiliza distintos motores de búsqueda para facilitar resultados aún mejores, pues se presentan interrelacionados. Con Ixquick se obtienen resultados de muchos portales de búsqueda, como Exaltad, CNN Search, Gigablast, Wikipedia, MSN o Yahoo!, ordenados según un sistema especial de valoración. Otra ventaja de este metabuscador es que opera de forma anónima. Las solicitudes de búsqueda se remiten cifradas al resto de buscadores. Lo único censurable en Ixquick es que los enlaces patrocinados, es decir, la publicidad, se muestra marcada en azul claro, lo que realmente casi no permite distinguirla.
Más difícil resulta habituarse a Quintura.[40] Este buscador se dirige sobre todo a la generación Web 2.0. Cuando se introduce un término en el cuadro de búsqueda, no se muestra una lista de resultados tradicional, sino que los resultados aparecen en dos campos: en una lista de resultados (derecha) y en forma de nube conceptual (izquierda). La «nube de tags», como se denomina esta nube conceptual, muestra conceptos relacionados con la palabra introducida. Si, pongamos por caso, introducimos las palabras «Albert Einstein» en el cuadro de búsqueda, se muestra una nube compuesta por los conceptos «Imagen», «Nacido», «Biografía» y «Honores recibidos». De este modo se accede más rápidamente a la información buscada.
Snap[41] también es muy práctico, aunque también aquí resulta difícil distinguir la publicidad de los resultados convencionales. Lamentablemente, tanto en la parte superior como en la inferior se muestran enlaces patrocinados. Lo práctico de Snap es que se obtiene una lista de resultados en forma de texto: al pasar por encima con el ratón se abre una ventana con la página web correspondiente.
El buscador Kartoo[42] emplea un sistema totalmente distinto. Tampoco muestra listas de resultados, sino nubes de resultados que representan la página web en formato reducido. Si ciertas páginas tienen un contenido similar, éstas se muestran más cerca. Asimismo, en la nube o cerca de ella aparecen conceptos relacionados. Al hacer clic en un enlace, se muestran las relaciones entre los resultados por medio de líneas. Además de la nube conceptual, se muestra una lista de temas. Al hacer clic en uno de ellos, empiezan a girar esferas en los enlaces de la nube que tratan ese tema concreto. Si, por ejemplo, se busca el Nokia Communicator E90, a la izquierda se muestra el concepto «precio». Si se hace clic sobre él, se destacan las páginas en las que se aborda el precio del E90.
Una página alemana de pies a cabeza es Mister Wong.[43] En esta página, los usuarios pueden buscar en un catálogo de páginas web que —no olvidemos que estamos en la era de la Web 2.0— está adaptada a los usuarios de Internet. Sin embargo, sólo se encuentra una página si un usuario de Internet la ha señalado como favorita. Éste asigna palabras clave a la página y la recomienda, de esta manera, a otros usuarios. De este modo, el buscador de la Web 2.0 evita el spam y las páginas de comparativas de precios, dado que este tipo de páginas no son recomendadas por los usuarios.
Con Clusty[44] existe también un buscador perfectamente capaz de competir con Google, pues —como su nombre indica— forma clusters o agrupaciones de búsqueda. Además de la lista de resultados, situada a la derecha, en Clusty aparecen clusters de búsqueda a la izquierda en los que se desglosa nuevamente el concepto buscado. Si por ejemplo, se introducen las palabras «Apple iPhone», se muestran a la derecha los resultados convencionales y, a la izquierda, diez clusters, desde «Móviles» hasta «Valoraciones», «Ventas», «Tienda» o «Rumores». El inconveniente de Clusty es que el buscador sólo está disponible en inglés.
También el servicio de búsqueda Web.de[45] domina la formación de clusters y añade una función más. A la izquierda de la lista de resultados se ofrece la posibilidad de afinar la búsqueda. Se muestran varios términos genéricos, bajo los cuales se recoge información más detallada. Aunque Web.de recurre al motor de búsqueda de Yahoo!, valora los resultados de forma distinta, de modo que se diferencian de los de éste buscador. Hay un detalle interesante: en Web.de existe también el área «Uve Suche» (Búsqueda en directo), donde se listan todas las solicitudes de búsqueda que otros usuarios están introduciendo en esos momentos. Las solicitudes de búsqueda se actualizan cada diez segundos.
El buscador Seekport[46] está considerado como pionero en tecnología en el mercado alemán de motores de búsqueda. «Nos tomamos en serio la protección de la infancia. Por este motivo, por medio de procedimientos automáticos, filtramos de nuestra búsqueda en Internet normal, accesible también a los niños, los contenidos dirigidos exclusivamente al público adulto», se lee nada más acceder a la página principal. Si se desea, Seekport.de limita la búsqueda a las páginas de noticias, los diccionarios en línea (de referencia) y los blogs, aunque únicamente del área europea. Asimismo, Seekport ofrece un buen servicio para propietarios de blogs y páginas web. Por medio de la función «Seekbot» puede comprobarse si la página web figura en los resultados de los motores de búsqueda.
Este otro buscador[47] tiene un nombre divertido, pero es muy eficaz, pues resume los resultados de Google, Yahoo! y MSM: jux2[48] combina los resultados y, además, muestra cuál de los motores de búsqueda llega a un mayor número de resultados y qué resultados obtiene cada uno. Es recomendable echar un vistazo al apartado «differ», en el que se desglosa mediante estadísticas cuál es el grado de coincidencia de los resultados en las primera página de la lista (diez primeros resultados).
A principios de 2008 entró en el negocio de los buscadores el inventor de Wikipedia, Jimmy Wales, quien quiere competir con Google y compañía por medio de Wikia.[49] Wales cree poder hacer frente a la competencia con «la sabiduría de muchos», es decir, con los 1300 millones de personas que componen la comunidad de internautas. Wikia funciona por medio de un sistema similar al de la enciclopedia en línea Wikipedia, en la que el texto de las entradas lo escriben los propios usuarios de Internet. En Wikia, los usuarios valoran los resultados de la búsqueda, lo que genera un sistema de valoración y una lista de resultados supuestamente objetivos. No obstante, en enero de 2008, los resultados eran todavía de poca calidad, lo que se advertía, incluso, en la propia página web. Cabe preguntarse si realmente se puede animar a la comunidad de internautas a colaborar en un buscador open source de este tipo.
El 90% de lo que hay en la Red no lo encuentra siquiera Google, ya que éste, como todos los buscadores existentes, se queda en la superficie. Google sondea sólo la denominada «Visible Web», es decir, la «Red visible». Aquellas áreas que contienen información fundada, en las que está almacenado el saber, no se sondean.
Sobre la verdadera dimensión de la llamada «Deep Web», la Red profunda, sólo existen estimaciones. Ni siquiera el investigador de Google y gran perfeccionista Peter Norvig se atreve a responder esta pregunta: «Nadie lo sabe con exactitud». Se cree que la Red profunda es hasta 50 veces mayor que la Red superficial; algunas estimaciones parten incluso de la idea de que es hasta 500 veces mayor que la Red visible en la que busca Google. La Red profunda está compuesta principalmente por grandes bases de datos, como los bancos de datos y las páginas web científicos y médicos, a los que sólo se puede acceder registrándose. Google no busca en bases de datos de trabajos científicos. Tampoco puede acceder por medio de sus motores de búsqueda a áreas en las que, por poner un caso, sólo tienen acceso los lectores abonados de un diario. En todas aquellas páginas a las que sólo se puede acceder por medio de una contraseña. Google no puede entrar. Esto significa que Google se queda sólo en la superficie.
Pero no se trata únicamente de Google: todos los buscadores sondean sólo esta Red visible. Hace años que se debate en Europa sobre la creación de un buscador que pueda hacer frente a Google. Hasta el momento, todos los proyectos se han quedado en papel mojado. En el año 2004 se lanzó Quaero, un proyecto conjunto de alemanes y franceses que, sin embargo, nunca llegó a ponerse en práctica. Investigadores alemanes intentan ahora poner en marcha un buscador semántico llamado Theseus: 400 millones de euros han sido asignados a este proyecto. El Instituto Fraunhofer, dedicado al procesamiento de datos gráficos (IGD), fija para su buscador semántico ConWeaver el objetivo de «ser tan simple como Google, pero mucho más eficiente». ConWeaver aún no es un buscador en el sentido convencional, pues de momento se ofrece sobre todo a grandes empresas. «Basta un solo término de búsqueda para que el sistema sondee un sinnúmero de bases de datos, directorios y redes buscando no sólo el término de búsqueda, sino sus traducciones y vínculos temáticos. Al hacer clic se muestra toda la información relevante, como, por ejemplo, personas de contacto, descripciones y documentos, de forma bien estructurada y en una sola página», promete ConWeaver.
«Los métodos semánticos cambiarán profundamente la Red tal y como la conocemos hoy en día», señaló el director de eco Harald Summa el 18 de agosto de 2007 en Heise.de. El tiempo dirá si su predicción es acertada, pues para una búsqueda semántica se requiere información detallada sobre los usuarios. Se da por seguro que, en el futuro, todos los buscadores incluirán este componente semántico. Pero más importante que cualquier buscador semántico sería un buscador capaz de buscar en la Red profunda, es decir, esa parte de Internet 500 veces mayor que Google no alcanza. Eso sí que sería un reto y un método con el que competir seriamente con Google.
Existen muchas propuestas sobre nuevas tecnologías de búsqueda. Por ejemplo, el profesor de la Universidad Técnica de Graz, Hermann Maurer, recomienda el desarrollo de buscadores especializados. Éstos podrían emplearse para distintas áreas temáticas, por ejemplo, medicina, ingeniería industrial o carpintería. La explotación de estos buscadores debería asignarse, en opinión de Maurer, a entidades sin ánimo de lucro o universidades. No obstante, este planteamiento no tiene mucho sentido, pues habría que pensar primero en qué buscador se puede encontrar lo que se quiere. Esto no simplifica, precisamente, la vida en la Red. Además, plantea otro problema: si los buscadores son gestionados por una universidad (pública o controlada por el Estado), no se está muy lejos del control estatal. Dejando a un lado la cuestión de que se impondría la censura de las autoridades de la universidad o entidad educativa de que se trate, debe tenerse en cuenta que en la actualidad ya existen en Europa medidas muy estrictas de supervisión y control. Por todas partes surgen bases de datos y leyes con las que se pretende controlar y registrar el tráfico de telecomunicaciones y de Internet. Un buscador bajo control del Estado incrementaría el riesgo de que se derive hacia un Estado policial. La única opción razonable son empresas privadas que cumplan la legislación.
El futuro está en los buscadores no sólo semánticos, sino basados en el contexto. Éstos operan por medio de reglas matemáticas: no sólo comparan elementos textuales, sino que, con la ayuda de distintos métodos, establecen relaciones directas entre la imagen, el vídeo, el texto y el término buscado.
Existe un motivo por el que los científicos intentan descubrir nuevos métodos de búsqueda; tan sólo un 20% de los contenidos digitales está estructurado, puede consultarse de forma sistemática y, por tanto, ser localizado por un buscador. Una búsqueda puramente textual no basta para hacer accesible el 80% de los datos.
Pongamos por caso el vídeo: es cierto que Google y Yahoo! cuentan con un sistema de búsqueda de vídeos, pero éste está basado igualmente en la búsqueda de elementos textuales, porque los vídeos tienen asignadas palabras clave. ¿Pero cómo encontrar un vídeo que no tiene asignado ningún término?
Mike Lynch, director de la empresa angloestadounidense Autonomy, ha inventado un algoritmo capaz de encontrar un contenido por medio del contexto, se trate de vídeos, imágenes o textos. El «Autonomy Engine» de Lynch emplea análisis de imagen y vídeo, reconocimiento de voz y cara y sistemas de escaneado de texto y contenidos. Si se introduce, por ejemplo, «Bush en Irak» en el cuadro de búsqueda, aparece una lista con toda la información (vídeos, fotos, blogs noticias) relacionada con el término buscado. Pronto sólo existirán «buscadores que encuentran»; el método de Google estará entonces superado.
Un anticipo de cómo funciona este tipo de buscadores puede encontrarse en www.blinkx.com. Además de la búsqueda de vídeos, que ofrece ya resultados muy respetables (sobre todo en inglés), en el apartado «Looking for Pico?» se puede descargar uno en su ordenador el buscador más pequeño del mundo. Mientras se teclea el texto de un documento, Pico busca en segundo plano si existe nueva información sobre el tema en Internet, sean vídeos, noticias, música, blogs o una entrada de Wikipedia.
Cuando se critica a Google en un foro suele encontrarse esta frase: «Nadie te obliga a usar Google». Esta afirmación es cierta. Sin embargo, Google, como ya hemos señalado varias veces, es un buscador muy práctico, fácil de utilizar y sin fruslerías; si no fuera por ese ansia de recabar datos. Pero ésta se puede contrarrestar.
Como ya hemos mencionado, todo usuario de Internet deja huellas cuando navega por una página de Internet o utiliza un servicio en la Red. El gestor de la página web identifica la dirección IP, es decir, el distintivo con el que nos movemos por la autopista de la información, y otros muchos datos (hora, versión del navegador, ubicación geográfica del ordenador, etc.). Y si en esos momentos hay un «espía» circulando por la Red, también podrá registrar esta información confidencial. Los datos se almacenan en un archivo y pueden ser valorados y clasificados.
Aun así, sólo uno de cada dos usuarios de Internet conoce la existencia de este tipo de servicios que permiten buscar de forma anónima. Esto es lo que indica una encuesta encargada a Marketagent para el presente libro. Servicios como Anonymizer,[50] The Onion Router[51] o JAP[52] sólo son conocidos por tres de cada cien usuarios de Internet.
¿Qué son estos servicios? Se trata de servicios disponibles en la Red que pueden activarse al navegar y sustituyen a la dirección IP del usuario. Si activamos este servicio, la página web por la que navegamos ya no puede determinar de dónde viene la solicitud de búsqueda, pues sólo se transmite la dirección IP del servicio.
Por ejemplo: si se desea evitar que Google (o cualquier otra página web) descubra la propia dirección IP, se accede al servicio de búsqueda anónima y se introduce allí la dirección de Internet correspondiente.
En la actualidad, existen muchos servicios de búsqueda anónima. La empresa con sede en Darmstadt Anonymouse[53] es una página gratuita. El inconveniente de este servicio, disponible desde 1997, es que el usuario tiene que enfrentarse constantemente a ventanas emergentes con publicidad que hay que ir cerrando. Lo mismo es aplicable al servicio www.hujiko.com, aunque la publicidad se mantiene dentro de unos límites y las ventanas emergentes son menos insistentes. Otra opción es www.behidden.com, que no incluye ningún tipo de ventanas emergentes con publicidad.
Además de las soluciones en línea, también existen programas para navegar de forma anónima en Internet La Universidad Técnica de Dresden ha desarrollado una herramienta de este tipo, llamada JAP, que puede descargarse al propio ordenador. Este programa activa varias capas entre el usuario y el proveedor que cifran los datos varias veces y los mezclan antes de remitirlos. La ventaja de JAP es que permite navegar de forma totalmente anónima: el proveedor detecta que se está navegando de forma cifrada; sin embargo, no puede acceder ni detectar quién eres ni qué páginas ves.
Otra solución basada en software es la que ofrece el conocido servicio Anonimyzer, que, en su momento, fue un servicio gratuito en línea. No obstante, los programas son de pago. El que permite la navegación anónima cuesta aproximadamente 25 euros al año.
También de pago es el «escudo de seguridad» que se ofrece en www.cotse.net; cuesta, al cambio, 4,50 euros al mes. En este caso, sin embargo, se trata de un paquete de seguridad que incluye también un filtro antispam, un escáner de palabras, un sistema de contraseña segura, etc.
Otro programa, esta vez gratuito, es el navegador de búsqueda anónima que puede encontrarse bajo www.browzar.com. El programa ocupa sólo 220 kb y evita también que entren cookies en el ordenador.
En la página www.meineipadresse.de puede encontrarse un completo resumen de todos estos servicios.
«El uso de servicios de búsqueda anónima no sólo es legal conforme a la legislación vigente, sino que incluso recibe el apoyo financiero y publicitario de algunos organismos estatales de protección de datos», señala Martin Kasztantowicz, gestor de la página www.meineipadresse.de y propietario de la empresa con sede en Berlín GEOTEK. «Esto es positivo, pues precisamente en tiempos de riesgo terrorista los argumentos simplistas del tipo “Yo no tengo nada que ocultar” se vuelven demasiado atractivos para legisladores y organismos de control». Obviamente, los servicios de búsqueda anónima no impiden la investigación con fines penales. El uso de una página de este tipo para camuflar la búsqueda de contenidos prohibidos puede ser descubierto fácilmente por las autoridades, pues éstas pueden obligar a los gestores de los servicios a facilitarles información acerca del usuario real. «No crean que, por ejemplo, en Estados Unidos, la Homeland Security (organismo de seguridad interior) renuncia a acceder a un servicio de búsqueda anónima gestionado desde el propio país», dice Kasztantowicz. Y el uso de este servicio en un lugar de trabajo también puede ser detectado: «El empleador puede interpretar el uso no autorizado de herramientas de búsqueda anónima como un incumplimiento de sus normas de uso de las TI. En el peor de los casos, uno se arriesga a que le despidan».