14 mar 2007

Entrevista con Matt Cutts sobre el futuro de las búsquedas en Google

Matt Cutts es uno de los que más saben acerca de la tecnología de búsquedas de Google, y uno de los pocos trabajadores de la compañía que habla públicamente sobre el buscador. En este post de 'readwriteweb.com' se muestra una interesante entrevista con él, en el que nos cuenta cómo ve el futuro de Google con respecto a las herramientas de búsqueda de información, y en el que repasa algunas de las tendencias del mundo de los buscadores.

Cutts destaca que la próxima funcionalidad importante que vamos a ver es la personalización de estos servicios, y subraya que mejorará la calidad de las búsquedas del usuario medio y que es gratis. Google lo lleva ofreciendo desde marzo de 2004, y el objetivo es que poco a poco vaya devolviendo al usuario información que se ajuste a sus gustos, historial de búsquedas, etc., y de menor importancia a aquello por lo que históricamente no muestra interés. Para poder acceder a estas búsquedas personalizadas de Google, simplemente debes estar registrado con una cuenta de usuario (por ejemplo, la de Gmail).

Con ello, Google irá recopilando diversos factores de tu actividad dentro del buscador (no solamente las consultas realizadas, sino también otros parámetros como a qué información accedes más) para con ellos ir creando un perfil personalizado que permita devolverte información más interesante y, lo que realmente reporta ingresos a Google, publicidad mucho más segmentada (y no solamente en el buscador web, sino en otros servicios como YouTube). Como hemos comentado algunas ocasiones, el poder acceder a este tipo herramientas, supuestamente más potentes, tiene el inconveniente de que tenemos que confiar en que, en este caso Google, haga un uso apropiado de los datos personales a los que tiene acceso.

Cutts también recuerda que otro tipo de personalización de las búsquedas es la que está basada en la localización del usuario. De hecho, si buscamos 'durango' en 'google.com.mx' los resultados son diferentes que si lo hacemos en 'google.es', puesto que en el primero se destaca el Estado mexicano de Durango, y en el segundo el pueblo de Bizkaia.

Sobre los nuevos buscadores basados en Inteligencia Artificial, Cutts nos recuerda que el enfoque de Google en este aspecto es muy pragmático. Mientras algunos buscadores como Hakia (hace unos meses os hablábamos sobr este proyecto) ponen todos sus huevos en esta cesta de las búsquedas semánticas, Google lo lleva incorporando en su buscador web desde hace tiempo para ayudar a los usuarios con determinadas consultas. Por ejemplo, si buscamos 'videos barcelona', no solamente se devuelven resultados de web con la palabra "videos" (en plural), sino también con "video" (en singular). Con búsquedas como 'ngo' obtenemos resultados de páginas que contienen la cadena 'Non-governmental organization', y ocurre lo mismo con algunos sinónimos que Google va identificando a lo largo del rastreo de los documentos de la WWW.

Y es que Google dispone de un gran número de científicos especializados en el Procesamiento del Lenguaje Natural, y uno de los frutos de su trabajo se puede ver online en algunos idiomas de su traducción automática.

Cutts, al igual que hizo Peter Norvig hace unas semanas vuelve a recordar que Google, al igual que va a hacer el anunciado buscador de Wikia, también tiene en cuenta la opinión de los usuarios cuando éstos califican los resultados, e insiste en que en la parte inferior de las páginas del buscador hay un enlace (ver captura) para enviar nuestra opinión desfavorable cuando no estamos satisfechos con la información que nos devuelve Google.

Sobre 'searchmash', el buscador experimental que lanzó Google en octubre, se destaca su función para realizar diferentes pruebas de interfaces de búsqueda que en un futuro puedan pasar al buscador principal. Por ejemplo, se menciona una en la que, cuando tecleas estando en cualquier página de resultados de 'searchmash', lo que escribes aparece automáticamente en el formulario de búsqueda (esto no es posible hacerlo ahora en 'google.com', y Cutts señala que no es compatible con todos los navegadores).

Acerca del tema de las APIs, y concretamente del formato GData propuesto hace casi un año, Cutts destaca su utilidad para que los generadores de contenidos suban rápida y cómodamente información directamente a los servidores de Google. En lugar de crear un documento web con los datos y esperar a que el robot rastree e indexe sus contenidos, con estas interfaces (como ocurre en 'Google Base') podremos tenerlos en cuestión de segundos. Y es que Google aspira a pasar de ser un buscador web a ser un espacio donde podamos compartir la información directamente.

En referencia a los portales verticales, Cutts quiere dejar claro que herramientas como el buscador de patentes de Google, 'Google Books' o el buscador de código de programación no son realmente buscadores verticales, puesto que no muestran información sobre un tema concreto (como sí que hace 'Google Finance'), sino que extraen información de soportes concretos: patentes, libros, código fuente, ...

La tarea de crear los portales verticales, los que realizan búsquedas sobre una temática en particular, se la deja Google a los usuarios, que son los que realmente conocen a fondo campos como los deportes, el cine, el turismo, etc., y los que van además a dar más publicidad a las herramientas que creen. Éstas contarán con diversas tecnologías como la de 'Google Co-op, con lo que la compañía se asegura que sus contenidos (y su publicidad) siguen siendo las que se muestran.

Sobre el tema del spam, Cutts presume de que dentro de Google tienen indicadores que señalan que el spam dentro de las páginas de resultados del buscador web ha descendido durante los últimos dos años, y subraya que el reto es no solamente mantener este nivel en las búsquedas realizadas en inglés, sino también en otros idiomas "como el francés, el italiano, el alemán, el chino o el japonés". No se menciona expresamente el español, aunque él mismo ha asegurado en varias ocasiones ([1], [2], [3]) que su equipo lo está teniendo en cuenta.

Por último, y respecto al tema de los buscadores de contenidos audiovisuales (estamos a la espera de que se cree uno realmente bueno), se subraya que en este campo hay dos retos por superar. El primero es el de la extracción de la información contenida en los vídeos, tarea que comienza a dar sus primeros frutos, y el segundo es la de la asignación de relevancia a cada uno de los vídeos. Como comenta Cutts, el éxito de Google con la búsqueda de documentos web se basó en que entre ellos existen hiperenlaces que otorgan una cierta importancia cada vez que se crean, peculiaridad que no existe entre los vídeos, por lo que se debe investigar para analizar otros parámetros (mayor análisis de los contenidos, número de visualizaciones, votos, comentarios, enlaces desde otro tipo de documentos, ...).

Fuente: http://google.dirson.com/post/3237-entrevista-cutts-futuro-busquedas/

Suscríbete a nuestro Boletín

0 Comments:

Publicar un comentario

Gracias por dejar un comentario en Segu-Info.

Gracias por comentar!