Ideas básicas:

– Para ordenar las páginas al hacer búsquedas, google tiene un algoritmo secreto. Con este algoritmo cada página obtiene una “puntuación”, que sirve para ordenarla en cada búsqueda. El algoritmo es secreto y varía, pero dentro de unos parámetros. Este algoritmo depende fundamentalmente de tres variables:

1) el Page Rank de google
2) el contenido de la página o indexación
3) la información externa o parámetros externos

1) Page Rank: Cada página tiene una puntuación fija de page rank (que va de 1 a 10). El cálculo del page rank está publicado y vale:

Page_Rank = sumatorio(Page_Rank_I/Enlaces_SalientesI)

Donde: Sumatorio quiere decir que hay un sumando para cada uno de los enlaces que recibe tu página desde otras páginas.

PageRank_I es el Page Rank de una de las páginas que te enlazan (vale de 0 a 10).

Enlaces_Salientes_I es el número de enlaces o links que tiene la página que te pone un enlace hacia otras. Si esa tiene sólo 20 links y tiene uno hacia la tuya, ese enlace “da más puntos” que si tiene 50.000 enlaces, como es el caso de los directorios de internet.

– El robot de Google (Googlebot) va repasando todas las páginas de internet periódicamente. Repasa cada página una vez cada 2 o 3 meses. Cada vez que repasa una página va cambiando el page rank de las demás, porque encuentra los vínculos que han aparecido desde la última revisión.
La última imagen de una página que tiene google se puede ver al buscar la página y hacer clic sobre “en cache”.

Los blogs se repasan con más frecuencia (cada mes). Además, si tienes un blog en blogger, cuando publicas una entrada, blogger la registra y ya la puede encontrar en las búsquedas. No obstante, normalmente tarda un tiempo en mostrarla en las búsquedas (puede oscilar entre 1 y 12 horas).
Esto causa que, para poder subir en google hayan de pasar unos meses: al menos 7 u 8.

2) Indexación en función de las palabras que contiene una página: puntuación variable en función de la expresión que se haya buscado y el contenido de la página; a esta segunda puntuación podemos llamarla indexación.

Google no funciona como el buscador de windows, que muestra los archivos que contienen una palabra sin orden (los muestra en una lista a medida que los encuentra). En lugar de esto, google que los ordena en función de cuántas veces aparece la palabra y dónde aparece (vale más si aparece en un hipervínculo o en negrita, por ejemplo).

El valor de la indexación tampoco es muy complicado de calcular: muchos servidores tienen el famoso servicio de Index Server de Windows. Este servicio revisa todos los archivos del disco duro, o de unas carpetas determinadas y permite realizar búsquedas. Pero no son búsquedas como las del buscador de Windows, sino que los resultados aparecen ordenados. El funcionamiento y el código de este servicio de Index Server son públicos y muy similares al servicio de indexación de Google (googlebot).

Las únicas diferencias importantes entre el Microsoft Index Server y el Google Index Server son:
– A diferencia del de Windows, el servicio de indexación de Google tiene en cuenta la url (la dirección de la página: http://www.direccion.com). Si aparece “codigo da vinci” en la url tienes “más puntos” que si no aparece.
(En todo este artícul* supondré que el objetivo es aparecer en las primeras posiciones al buscar “codigo da vinci”, como me propuse yo).

– También tiene en cuenta googlebot los hipervínculos: las palabras que aparecen en links tienen más valor que las que aparecen en texto normal.

– En el Index Server de Windows, cuantas más veces se pone una palabra, más arriba sale en la búsqueda. Si google funcionase así, cualquiera podría aparecer el pirmero en google: bastaría con poner la expresión deseada un millón de veces en la página. Como google no es tonto penaliza o banea las páginas que intentan engañarle de este modo.

-Título del blog o de la página (no se contempla en el código del Index Server de Microsoft): la regla número 1 de google es que, para quedar bien posicionado al buscar una palabra o expresión, tiene que aparecer esta expresión en el título. Si aparece al principio del título es mejor. Y si el título sólo contiene esa expresión es mejor todavía. Porque tienen más valor las palabras del principio del título y, además, tienen más peso cuantas menos palabras haya en el título (si es un título de 10 palabras, se reparten “los puntos” entre todas, y tocan a menos “puntos” que si sólo hay 4 palabras en el título). El valor, de cara al servicio de Indexado de Googlebot, de una palabra en el título es de 10 a 20 veces mayor que el valor que tendría fuera del título (en el cuerpo de la página: entre las etiquetas htm y ).

– Penalización de url o baneo de Google: la penalización consiste en que una página no aparece en google (ni siquiera entre las 200 primeras) al realizar la búsqueda en la que esa página quería aparecer bien.
Pondré un ejemplo aclaratorio que me ha sucedido, pero cambiando las palabras clave de la búsqueda, para evitar problemas con google. El ejemplo no tiene que ver con “codigo da vinci”. Es otra historia: recuerdo que soy webmaster de más de 30 páginas web de temas variados (informática, cine, literatura, ocio, religión, etc.).

Vayamos con el ejemplo: tengo un blog que quiero que salga el primero en dos búsquedas distintas “coche” y “carreras”. Por supuesto que también quiero que salga el primero en “coche de carreras”. Para conseguirlo, en mi página hablo mucho de coches y de carreras. Además, para que salga muy bien situada al buscar “coche” pongo esa palabra muchas veces. En mi caso puse la palabra “coche” -más bien la palabra a la que ésta sustituye- en la columna lateral del blog muchas veces y dentro de hipervínculos. Así, el nombre de las secciones del blog (que aparecen permanentemente en la columna izquierda) era:

coche: motor
coche: carreras
coche: gasolina
coche: mantenimiento
etc.

Con esto conseguí un baneo en google al buscar “coche”. Es decir, cuando buscas “coche” en google no aparezco. Cuando buscas “carreras” aparezco el número 1 (aunque es muy complicado para un blog aparecer el primero en búsquedas en http://www.[URL=”http://www.google.com/”%5Dgoogle%5B/url%5D.com). Y cuando buscas “coche carreras” tampoco aparezco, porque estoy baneado para “coche”. Si aparece esta palabra maldita mi blog desaparece (recuerdo que “coche” y “carreras” son dos palabras de ejemplo, que sustituyen a otras dos palabras relacionadas entre sí: para una de ellas uno de mis blogs sale el 1º en http://www.[URL=”http://www.google.com/”%5Dgoogle%5B/url%5D.com, y para la otra ni aparece por el baneo).

Autor: Antonio Gonzalez antoniogonzalez2006@gmail.com