Como funciona un buscador Web

Todos queremos estar bien posicionados en los buscadores.

Para lograrlo primero debemos saber qué es un buscador y como funciona.

Un buscador Web es un sistema informático que devuelve a sus usuarios listas con referencias a páginas que contienen información sobre los términos que estos introducen.

Existen diferentes tipos de buscadores, pero los que más nos interesan desde un punto de vista del posicionamiento en Internet son los grandes buscadores: Google,

Yahoo, Live, Ask, etc.

Es importante que nuestro esfuerzo este enfocado en los principales buscadores de la red. Los buscadores más usados para las búsquedas son los siguientes:

1. Google con el 53% del total

2. Yahoo con el 21%

3. Live con el 14%

4. AOL con el 5%

5. Ask con el 2%

6. El resto de los motores de búsqueda con el 5%

Ahora sabemos cuales son los motores de búsqueda en los que conviene centrarse para lograr un buen posicionamiento con nuestro sitio Web. Pero falta entender como funcionan.

Los grandes buscadores tienen un funcionamiento común. En ellos, todo gira alrededor del índice. El índice es la estructura de datos que el buscador consulta para satisfacer las búsquedas de los usuarios. El índice de un motor de búsqueda es análogo al índice de un libro: son referencias que indican dónde se cubren determinados términos o dónde aparecen ciertas palabras. El proceso de construcción del índice se llama indexación.

Los procesos fundamentales que realiza un buscador son dos: resolver las búsquedas propiamente dichas (búsqueda) y la construcción/actualización del índice (indexación). Para que una página de Internet pueda ser ofrecida como resultado en un buscador, debe haber sido indexada previamente. Por tanto, para la construcción/actualización del índice, los buscadores deben recorrer (rastrear) la Web en busca de nuevas páginas.
Para que un buscador pueda devolver los resultados más recientes y relevantes ante las búsquedas de los usuarios es preciso que mantenga el índice lo más actualizado posible.
Y para mantener el índice actualizado debe estar continuamente recorriendo la Red en busca de nuevas páginas y páginas que hayan sido modificadas.

¿Cómo se lleva a cabo el proceso de indexación?

La Web está construida alrededor del concepto de hipervínculo: los enlaces . Tenemos páginas con referencias a otras páginas, y éstas que apuntan a otras a su vez. Los buscadores, para recorrer la Web, llevan a cabo procesos de rastreo para los cuales utilizan unos sistemas llamados arañas, robots o rastreadores. Las arañas avanzan, enlace a enlace, por los contenidos de la Red. Para que pueda realizarse un rastreo lo más eficaz posible, el recorrido de la Red no es lineal, sino que las páginas que más cambian y las más relevantes se rastrean con mayor frecuencia. Como resultado del proceso de rastreo el buscador obtiene una serie de páginas nuevas y/o modificadas que deben ser estudiadas e incorporadas al índice. Este proceso recibe el nombre de indexación. Como parte del proceso, el buscador deberá analizar no sólo las palabras y temáticas de las páginas, sino una serie de criterios que permiten medir su calidad e importancia. El índice es una estructura de datos especialmente concebida para que las búsquedas se puedan resolver de modo inmediato.

Cómo se resuelve una búsqueda en un buscador

El buscador recibe del usuario las palabras introducidas en la caja de búsquedas: las que describen su necesidad de información. A partir de ahí, realiza una serie de consultas en el índice para identificar las páginas en que están presentes dichas palabras. Recordemos que el índice ha sido especialmente construido para que la localización de páginas a partir de palabras sea extraordinariamente veloz. Al tiempo que descubre las páginas en cuestión, lee los criterios de relevancia que se insertaron en la fase de indexación y ordena las páginas de acuerdo a dicha relevancia. Por último, compone la página de respuesta al usuario en la que los resultados están ordenados de mayor a menor relevancia.
Ahora que sabemos cuales son los buscadores más usados y que consideran importante a los enlaces de texto en la indexación, ya podemos comenzar a optimizar nuestro trabajo para lograr un buen posicionamiento en los buscadores .