Abr 242012
 
Artículo Perl

(Read this post in english)

Una forma sencilla pero flexible de leer en perl el contenido de una url es hacer uso del módulo LWP::UserAgent.

El siguiente ejemplo muestra cómo leer el contenido de la url http://www.ejemplo.com:

Como vemos, de esta manera tenemos acceso por separado a los headers y al contenido de la respuesta. Además, podemos comprobar el código de respuesta en caso de error.

Especificar un usuario y clave para acceder a páginas protegidas

LWP::UserAgent nos permite también especificar un usuario y clave en caso de que la url a la que se quiere acceder esté protegida:

Identificarse con un determinado «user agent»

Los navegadores envían al servidor, con cada solicitud que realizan, un string denominado «user agent», en el que habitualmente indican el tipo de navegador, versión, y otras características que pueden ser utilizadas por el servidor para adaptar la respuesta que envía.

Utilizando el método «agent()», Podemos «disfrazar» la solicitud que realiza el script, para hacer ver que procede de distintos tipos de navegador. Por ejemplo:

 

Otras posibilidades

También podemos tener necesidad de especificar un timeout, enviar cookies o adaptar de algún otro modo nuestra solicitud HTTP. Los módulos LWP::UserAgent y HTTP::Request ofrecen métodos que implementan esta funcionalidad.

Indice de artículos sobre programación en lenguaje Perl

 Publicado por en 6:14 pm

  Una respuesta a “Cómo leer el contenido de una URL en Perl”

 Deja un comentario

(requerido)

(requerido)