26 jul 2008

Google tienen 'procesadas' 1.000.000.000.000 de URLs

Hace unos años, en la página de inicio de Google, en la parte inferior solía aparecer una cifra que mostraba el número de páginas indexadas que tenía el buscador web (ver captura). Era un número importante que daba una idea del volumen de información que procesaba Google, y de lo grande que era la WWW. Por ejemplo, en 1998 tenía indexadas 'solamente' 26 millones de URLs, y en el año 2000 unos 1.000 millones.

En este blog os contábamos las actualizaciones de esta cifra (en agosto de 2003, de 3.100 millones a 3.300; en febrero de 2004, de 3.300 a 4.300; en noviembre de 2004, de 4.300 a 8.100). Y es que el número se convirtió en una muestra del poder de los buscadores y, de hecho, en agosto de 2005 uno de los responsables de Yahoo! publicó un post titulado "¡Por supuesto que el tamaño importa!" que echaba leña al fuego del debate sobre el tamaño de los índices de los dos buscadores, y de las sospechas de que Yahoo! estaba mintiendo sobre el número de URLs que procesaba.

Ahora, Google vuelve a la carga con este tema, y en este post oficial nos desvela que acaba de sobrepasar el hito de 1.000.000.000.000 de URLs 'procesadas' (1 billón en español, 1 trillón en EEUU y Puerto Rico), más de 100 veces más que la última cifra (8.100 millones) mostrada por el buscador web hace 3 años, cuando dejó de hacer pública esta información. Sin embargo, los términos son diferentes, puesto que en aquella ocasión era de URLs "indexadas" (con información única), y ahora son URLs "procesadas", de las cuales muchas de ellas tienen la misma información duplicada entre ellas.

A pesar de esta enorme cifra de URLs procesadas (cada URL no es solamente una página web, sino también documentos PDF, documentos DOC, etc.), y a pesar de que Google procesa varios millones de Gigabytes de datos diariamente, todavía queda en el mundo mucha información en diversos soportes (películas, papel, vídeos, o páginas web) que rastrear. En el año 2005, el Director General de Google reconocía que tardarían 300 años en indexar toda la información mundial, y que solamente tenían indexado el 0.005% de los varios miles de millones de Gigabytes de información almacenada.

Fuente: http://google.dirson.com/post/4068-google-procesadas-billon-trillon-urls/

Suscríbete a nuestro Boletín

0 Comments:

Publicar un comentario

Gracias por dejar un comentario en Segu-Info.

Gracias por comentar!