18 agosto 2005

¡Por supuesto que el tamaño importa!

Es el encabezado con el que Yahoo! responde a la polémica iniciada entre ambos buscadores acerca del tamaño de los indice de páginas indexadas por ambos.
Jeremy Zawodny, ingeniero responsable del motor de búsqueda de Yahoo!, hace las veces de portavoz del mismo, respondiendo en su bitácora a la bitácora.
Google.dirson.com hace un extracto de los argumentos de la respuesta de Zawodny
:: "Si el tamaño no importa, ¿por qué se gasta Google unos cuantos bytes en su página principal para decir que tiene indexadas 8,168,684,336 páginas web?".
:: "Qué casualidad que el tamaño sea ahora poco importante, justo cuando Yahoo! publica que tiene un índice mucho más grande que el de Google".
:: "Si Google solamente indexase 100 mil documentos, ¿sería igual de bueno que lo que es ahora? Por supuesto que no. Sin indexar una cantidad razonable de documentos web, se estaría perdiendo material muy importante."
:: "La relevancia de los resultados es lo que importa y es un test muy fácil que podéis hacer vosotros mismos. Haced unas búsquedas en Google y en Yahoo! y comprobad cuál ofrece mejores resultados."
:: "También podéis echar un vistazo a "RustySearch". En los resultados se ve que Yahoo! es bastante competitivo, y está por delante de Google."
:: "El estudio del NCSA se basa en supuestos bastante pobres y me eché a reir cuando lo leí. Se parece más a un ingenioso hack informático que a un estudio científico. Como sospechaba, el hecho de que apareciese en Slashdot sirvió a muchos como prueba de que Yahoo! estaba equivocado y para coronar a Google como rey de los buscadores y de todas las cosas non-evil".
:: "Elegir palabras al azar [como hace el estudio] no refleja el mundo real. Pero aún suponiendo que sí, si tomamos algunos de los ejemplos en los que Google "vence" a Yahoo! en número de resultados, vemos que los "resultados extra" de Google consisten principalmente en páginas que son extensas listas de palabras. Por ejemplo, si buscamos "alkaloid´s observance" en Google, vemos que el primer resultado es una página web cuyo caché es una serie de palabras sin sentido."
Una desagradable polémica, y en la que es fácil tomar partido, simplemente realizando un par de pruebas de búsqueda y analizando los resultados obtenidos en ambos buscadores.
Probadlo vosotros mismos, la diferencia es evidente...