Oct 092012
 

En nuestro anterior artículo sobre Cómo obtener la indexación y el ranking de un sitio web en Google hemos visto la manera de obtener manualmente la indexación de un sitio web, tal como aparece en la página de resultados de Google. Pero también podemos estar interesados en automatizar la recogida de esta información mediante un script. En este artículo veremos cómo hacerlo con un script escrito en PHP.

Indexation Status disponible en GWT

Desde Julio de 2012, Google ha añadido a Google Webmaster Tools (GWT) la  funcionalidad “Indexation Status”, que permite ver en un gráfico la indexación del sitio:

gráfico de indexación de un sitio web en Google Webmaster Tools

Además, si seleccionamos la opción “Avanzada”, podemos seleccionar para su visualización otras estadísticas de interés:

  • Total de páginas indexadas
  • Páginas rastreadas en alguna ocasión
  • Páginas no seleccionadas para formar parte del índice (p.ej., páginas que se consideran duplicadas)
  • Páginas bloqueadas por la configuración del fichero robots.txt
  • Páginas eliminadas del índice (por ejemplo, porque dan un error 404 (not-found) o 410 (Gone)

gráfica de indexación avanzada de Google Webmaster Tools

 

El frontend de GWT nos da acceso interactivo a estos gráficos, y también nos permite descargar los datos en forma de un fichero CSV.

Pero también nos puede interesar automatizar la descarga de estos datos mediante un script, de manera que podamos, por ejemplo, configurar una alerta si alguna de estas métricas sufre una variación brusca que pueda indicar algún problema técnico en nuestro sitio web. Esto también es posible, utilizando el API de GWT.

Script PHP para la descarga de los datos de indexación

En github hay disponible un módulo GWT_IndexStatus escrito en PHP que implementa esta funcionalidad.

Para utilizarlo, descargamos y descomprimimos el fichero GWT_IndexStatus-php-1.0.0.zip, y editamos el fichero “GWT_IndexStatus.php” que contiene, para indicar en las líneas 55 y 56 el usuario y contraseña de acceso a nuestra cuenta de GWT:

A continuación podemos ejecutar directamente cualquiera de los cuatro ejemplos que vienen incluidos en el paquete. Por ejemplo:

example1.php.- Descarga y presenta en pantalla los datos de un determinado dominio (Hay que editar el script para escribir en la línea 13 el dominio deseado)

example2.php.- Descarga y presenta en pantalla los datos de todos los dominios accesibles desde la cuenta de GWT que se utiliza

example3.php.- Descarga y guarda como ficheros en formato CSV los datos de todos los dominios accesibles desde la cuenta de GWT que se utiliza

example4.php.- Presenta en pantalla un listado de los dominios accesibles desde la cuenta de GWT que se le indica en el propio script (hay que editar el script).

Nota: para que funcione el script example4.php, hay que editar el fichero “GWT_IndexStatus.php” para añadir el método getSites:

 Publicado por en 6:59 pm

 Deja un comentario

(requerido)

(requerido)