PageRank



Blog colaborativo de: Valentina Pardo, Raúl González y Ricardo Toledo





Ya hemos adelantado antes el proceso de búsqueda, una vez que el usuario realiza la consulta en la barra del buscador esta viaja algunos kilómetros a los servidores para ser comparada con los sitios webs que estén indexados. De los resultados que aparezcan como compatibles con la KeyWord, Google aplica un algoritmo (PageRank) que le permite rankear aquellas páginas compatibles con el criterio de búsqueda y les otorgará un orden para que sean mostrados.


¿Qué criterios utiliza Google para conformar el PageRank?

Según las mismas declaraciones de la empresa y el paper de Larry Page, Google utiliza más de 200 factores para determinar el orden en que se mostrarán las páginas. Entre los que destacan:
  • Actualidad del contenido de un sitio web
  • Número de sitios web que dirigen a un sitio y origen de los enlaces
  • Palabras de la página web
  • Sinónimos de palabras clave buscadas
  • Corrección ortográfica 
  • Calidad del contenido del sitio
  • URL y título de la página web
  • Tipo de resultado mejor (página web, imagen, vídeo, noticia, resultado personal, etc.)
  • Personalización
  • Recomendaciones de usuarios a los que estás conectado

Obviamente Google no revelará su fórmula secreta, sin embargo, con el paso del tiempo se ha podido indagar un poco más respecto a los factores valorados para posicionar el link, y existen asesores de páginas web que ofrecen mejorar el posicionamiento de la misma en la plataforma del buscador enfocándose en factores tienen que ver con la relevancia del sitio, su popularidad, el uso que le dan los usuarios, algunos factores negativos que pueda tener la página y más. De aquí se desprenden los términos Search Engine Optimization (SEO) y Search Engine Marketing (SEM). Donde el primero se refiere a aquellas estrategias o prácticas que lleva a cabo un arquitecto de web, desarrollador web o webmaster para que nuestra página sea encontrada de manera más rápida y priorizada por buscadores.


Cómo funciona PageRank

Resultado de imagen de pagerank

Según Google, cada enlace es un “voto de confianza” hacia una página, por lo que cuantos más “votos” tenga el sitio web mayor Pagerank (PR) tendrá, lo que conlleva un mejor posicionamiento.



Hay dos tipos de PR, el público y el real. Hasta 2016 podríamos consultar el PR público. Sin embargo, hoy Google ya no muestra el PR al público.


Aquellas páginas con mayor PR tienen mejor posicionamiento. Las de PR0 es que están penalizadas por spam o por utilizar keywords para engañar al algoritmo y así dar información que no tiene nada que ver con lo buscado. PR1 son aquellas que ofrecen lo buscado pero no destacan. PR2 son las que empiezan a destacar. PR3 tienen buena calidad. PR4 destaca entre las páginas que hablan de lo mismo. PR5 ya tienen un puesto notable en el posicionamiento. PR6, PR7 y PR8 son las mejores en lo suyo. PR9 y PR10 son las grandes entre las grandes tales como Google, Facebook o Youtube.


Factores que influyen
  • Relevancia:
"El perfecto motor de búsqueda entendería exactamente qué es lo que quieres decir y darte exactamente lo que buscas". Larry Page, director ejecutivo de Google.


Google, persiguiendo ser el motor de búsqueda perfecto, a lo largo de los años ha mejorado su algoritmo para que podamos encontrar lo que buscamos de la forma más óptima. Por eso pone especial atención a lo relevante de la información que tiene una página web respecto al término de la búsqueda realizada, es decir, que nos aporte la información solicitada. Aquella relevancia del sitio se logra analizando la posición, formato y sinónimos de las keywords que despliega la búsqueda a lo largo del sitio.
  • Popularidad
Viene dada por la cantidad de enlaces que recibe la página y, a su vez, de la importancia que tiene la página que enlaza la web en cuestión dado que se trata de medir la aceptación que tiene la página en la comunidad web. Al mismo tiempo, se analiza la forma en que se refieren a la página web, indagando en el texto del enlace.

  • Factores de usuario
Hacen referencia a la experiencia que tiene el usuario en el sitio web con el fin de priorizar aquellos sitios que aumenten la satisfacción de ellos. Es por esta razón que evalúan cosas como, la velocidad con que se puede navegar en el sitio, la usabilidad que tiene en dispositivos móviles, cantidad de clics recibidos, etc. Sin embargo, dado que este se puede manipular fácilmente, el algoritmo lo combina con el tiempo de permanencia de los usuarios en el sitio. Comúnmente, cuando el usuario no está conforme con el primer resultado que arrojó el buscador, vuelve a él para navegar en el siguiente link hasta encontrar lo esperado, es por esto, que también se toma en consideración la cantidad de veces que el usuario vuelve al buscador, aquella acción se denomina pogo-sticking.
  • Spam
Hay enlaces que no hacen más que entorpecer la búsqueda del usuario atentando con la excelencia en servicio que busca entregar Google, a aquellos enlaces el buscador los cataloga de Spam y, además de posicionarlos últimos en los resultados de búsqueda, los penaliza. ¿Cómo determina el algoritmo de Google si un enlace es o no Spam? Considerando factores como:

          - Redireccionamientos engañosos y encubrimiento:

El sitio parece encubrir contenido (es decir, muestra contenido a usuarios humanos diferente al que se muestra en motores de búsqueda) o redirigir a los usuarios a una página diferente a la rastreada por Google.

- Sitio comprometido

Es posible que un tercero haya pirateado algunas páginas de este sitio para mostrar enlaces o contenido fraudulento. Los propietarios de sitios web deben tomar medidas de forma inmediata para limpiar sus sitios y solucionar posibles vulnerabilidades de seguridad.

- Texto oculto o con demasiadas palabras clave

Es posible que algunas de las páginas contengan texto oculto o hagan un uso excesivo de palabras clave.

- Dominios aparcados

Los dominios aparcados son sitios con poco contenido único, por lo que Google no suele incluirlos en los resultados de búsqueda.

- Spam en estado puro

Parece que el sitio utiliza técnicas de spam agresivas, como contenido ininteligible generado automáticamente, encubrimiento, contenido extraído de otros sitios web o infracciones graves o reiteradas de las directrices para webmasters de Google.

- Proveedores de DNS dinámicos y hosts gratuitos de contenido malicioso

El sitio está alojado por un proveedor de DNS dinámico o por un servicio de alojamiento gratuito que incluye una cantidad significativa de contenido fraudulento.

- Contenido poco relevante con poco o ningún valor añadido

Parece que el sitio tiene páginas poco relevantes o de baja calidad que no ofrecen a los usuarios un gran valor añadido (como páginas asociadas de poca importancia, doorways, sitios que siguen una misma plantilla, contenido generado automáticamente o contenido copiado).

- Enlaces no naturales de un sitio

Google ha detectado un patrón de enlaces de salida manipuladores, engañosos, artificiales o no naturales en este sitio. Este patrón puede ser el resultado de la venta de enlaces que manipulan PageRank o que participan en esquemas de enlaces.

- Enlaces no naturales a un sitio

Google ha detectado un patrón de enlaces manipuladores, engañosos, artificiales o no naturales que dirigen al sitio. Este patrón puede ser el resultado de la compra de enlaces que manipulan PageRank o que participan en esquemas de enlaces.

- Spam generado por el usuario

Parece que el sitio incluye contenido fraudulento generado por los usuarios. El contenido problemático puede aparecer en páginas de foros, en páginas de libros de visitas o en perfiles de usuarios.
Si te interesa saber la fórmula más parecida a la que usa Pagerank te dejamos un link:


Además el siguiente link explica cómo funciona PageRank y hace un experimento comparativo con otros mecanismos de búsqueda:


____________________

Comentarios