¿Cómo busca Google la información?

Blog colaborativo de: Valentina Pardo, Raúl González y Ricardo Toledo

Atrás quedaron las largas horas que debíamos destinar a consultar en distintos libros almacenados en una biblioteca con el fin de encontrar respuestas a distintas interrogantes o desarrollar trabajos escolares o universitarios. Hoy, dado el fácil acceso que tenemos a dispositivos que nos permiten navegar en internet, los esfuerzos que debíamos realizar para obtener lo esperado se ha reducido enormemente puesto que podemos realizar una consulta en lenguaje natural en la página web de un buscador y obtener links con nuestra solicitud en segundos. Sin embargo, el proceso de búsqueda no parte cuando escribimos la consulta en el cuadro de búsqueda, sino que Google realiza un trabajo previo en distintas páginas webs para que entregar mejores respuestas a nuestras consultas.

Después de que nosotros como usuarios escribimos qué deseamos buscar, Google envía la consulta a sus servidores y, por medio de su algoritmo o programa informático, compara nuestra consulta con su índice para encontrar si existen páginas webs que coincidan con nuestra búsqueda y nos resuelvan lo consultado. Sin embargo, seleccionará solo 10 direcciones  para mostrarnos, esperando que respondan de mejor manera (PageRank).

Puede sonar bastante fácil, pero hay fases que como usuario no podemos ver y queremos detallar a continuación para que conozcas cómo se forma el índice en que Google consulta y qué ocurre cuando haces clic el botón “buscar”.

¿Cómo se forma el índice de Google?

El objetivo de hacer un índice es que Google pueda conocer de qué trata cada sitio web y recolectar información relevante de él, por ejemplo, las Keywords de los sitios, para que ante posteriores consultas de usuarios éste sepa desde qué páginas puede obtener aquella información.

“Google utiliza un software denominado "rastreador web" para descubrir páginas web de dominio público. El rastreador más conocido es "Googlebot". Los rastreadores consultan las páginas web y siguen los enlaces que aparecen en ellas, al igual que haría cualquier usuario al navegar por el contenido de la Web. Pasan de un enlace a otro y recopilan datos sobre esas páginas web que proporcionan a los servidores de Google.” Declaran en la misma web de Google.

Que una página se encuentre en el índice quiere decir que ha sido rastreada e indexada, y esto puede ocurrir de dos maneras:
  1. Si una página te ha citado: Los robots, llamados arañas o rastreadores, que manda Google a rastrear distintas páginas revisan su contenido y los enlaces que la página tiene, por lo tanto, si un tercero te ha citado también serás indexado.
  2. Desarrollar una página y "decírselo" a Google: A Google Search Console yo le aviso que tengo una página web para que envíe sus robots a que me lea y escaneen mi contenido, así pueden extraer la información necesaria para determinar cuando la web debe aparecer según cierto término de búsqueda y cuando no.

Frecuentemente los robots (arañas) de Google están visitando las páginas web para actualizar los contenidos de las páginas y los nuevos links utilizados en las mismas.

Comentarios