Jun 052014
 

En este artículo presentamos algunos de los datos estadísticos más relevantes de la base de datos de OpenStreetMap de Alemania.

El contenido de esta base de datos se puede explorar en nuestro sitio web OpenAlfa Deutschland Straße

Cómo obtener la base de datos OSM de Alemania

En realidad la base de datos de OpenStreetMap cubre el mundo entero. Se puede obtener en forma de un único fichero “planet.osm”, que ocupa 16 GB en formato comprimido, y más de 250 GB sin comprimir.

Para obtener los datos de un sólo país, es preferible descargarse un extracto que está disponible en algunos sitios colaboradores de OpenStreeetMap. La lista de sitios que contienen extractos por país se puede obtener aquí.

En nuestro caso, utilizamos el extracto diario disponible en geofabrik.de. Para descargarlo, utilizamos el comando:

El fichero descargado está comprimido en formato bzip2, y ocupa 3.2 GBytes. En su interior, contiene un documento XML con tres tipos de elementos: nodos, vías (ways) y relaciones, que se comentan a continuación

Nota: Es interesante notar que también es posible descargar ficheros incrementales desde geofabrik.de. En otro artículo explicaremos la manera de mantener una copia actualizada de la base de datos, haciendo uso de estos ficheros incrementales.

Los ficheros  incrementales diarios disponibles en geofabrik nos permiten también estimar la actividad de mantenimiento del contenido de la base de datos. Representando gráficamente el tamaño de estos ficheros entre los meses de febrero y mayo de 2014, podemos comprobar que en el caso de Alemania el esfuerzo de mantenimiento es considerable, y muy constante:

[visualizer id=”5541″]

Nodos

La base de datos OSM de Alemania analizada contiene 95.397.469 nodos.

Cada nodo está identificado por un identificador numérico único, y consta básicamente de un par de coordenadas (latitud,longitud) que determinan un punto del mapa.

Opcionalmente, el nodo puede tener asociadas etiquetas (tags) que ofrecen información adicional sobre el mismo.

Ejemplo:

En el ejemplo podemos ver los dos primeros nodos que aparecen en el fichero descargado. El primero sólo contiene el identificador y las coordenadas del nodo, junto con información administrativa, en forma de atributos del elemento XML.

El segundo nodo tiene también una serie de tags asociados, que lo identifican como una parada de autobús con el nombre “Bleichplatz”.

 

Etiquetas de nodo (node tags)

Del total de nodos existente en el fichero descargado, 6.625.830 tienen una o más etiquetas asociadas.

Las etiquetas asociadas a un nodo son simplemente un par (k,v) en donde k (“key”) es el nombre de la etiqueta, y v (“value”) su valor.

Existen una serie de nombres de etiqueta normalizados (como “name” o “highway”, que se pueden ver en el ejemplo de arriba). Pero OSM no fuerza el uso de estos nombres, por lo que en la base de datos se pueden encontrar nombres no normalizados,  nombres que contienen errores ortográficos, y otros casos.

Resulta interesante analizar estadísticamente el total de apariciones de cada nombre de etiqueta. Las más frecuentes son:

Otros nombres de etiqueta interesantes, aunque el total de los mismos no sea tan elevado, son:

 

Nodos de tipo ‘natural’

El total de cada uno de los valores asignados a la etiqueta ‘natural’ de los nodos de la base de datos OSM de Alemania es:

Vias (Ways)

La base de datos OSM de Alemania analizada contiene 11.620.714 vías.

Una vía es una secuencia ordenada de nodos, identificada de manera única mediante un identificador numérico.

Las vías se utilizan para indicar en el mapa límites administrativos, carreteras, ríos, etc.

Opcionalmente, una vía puede tener asociadas una serie de etiquetas que proporcionan información adicional sobre la misma.

Ejemplo:

En el ejemplo, podemos ver la definición de una vía que consta de once nodos. La información administrativa se añade en forma de atributos version, changeset, etc del elemento <way>

Adicionamente, la vía tiene asociados varios tags que la identifican como una calle (k=”highway”, v=”tertiary”) denominada “Österwieher Straße”, con un límite de 50 Km/h para la circulación de vehículos.

Etiquetas de vía (way tags)

Los nombres de etiquetas de vía más frecuentes en la base de datos OSM de Alemania son:

Como vemos, “source” es el nombre de etiqueta más frecuente. Se trata de una información de tipo administrativo cuyo valor indica la fuente desde la cual se han obtenido los datos presentes en OSM para la vía.

La siguiente etiqueta más frecuente es “highway”. Esta etiqueta se utiliza para identificar tanto carreteras como calles, caminos, senderos, y en general cualquier trayecto transitable. Un buen número de vías tienen también un nombre asociado mediante la etiqueta “name”

Además de los nombres de vía arriba indicados, otros nombres interesantes son:

 

 

Ways de tipo ‘highway’

Ways de tipo ‘natural’

Ways de tipo ‘waterway’

 

Relaciones

La base de datos OSM de Alemania analizada contiene 385.081 relaciones.

Una relación es un conjunto de elementos que constituyen una entidad. Al igual que los nodos y vías, cada relación está identificada de manera única por un identificador numérico. Asimismo, la relación puede tener asociadas una serie de etiquetas que proporcionan información adicional sobre la misma.

Los miembros de la relación pueden ser vías, nodos, o incluso otras relaciones.

Ejemplo:

 

Etiquetas de relación

Entre las etiquetas que se asocian habitualmente a una relación, está la etiqueta “type”. En la base de datos analizada, los valores que aparecen con mayor frecuencia asignados a la etiqueta type son:

 

Entre estos, merecen especial atención las relaciones de tipo “boundary”. Estas se utilizan para agrupar todas las vías que delimitan una región (administrativa o de otro tipo), en forma de uno o más polígonos cerrados, que opcionalmente pueden contener “agujeros” en su interior.

Cuando a una relación se le asocia la etiqueta “type=boundary”, también se le asocia una etiqueta con nombre “boundary”, cuyo valor detalla el tipo de límite de que se trata. Contabilizando los distintos valores asignados a la etiqueta “boundary”, obtenemos el siguiente resultado:

Como vemos, el mayor volumen de relaciones de tipo boundary corresponde a límites administrativos, que delimitan las regiones de Alemania en sus distintos niveles: Bundesländer, Regierungsbezirke, Landkreise, etc…

El siguiente tipo de boundary en volumen corresponde a los límites de los códigos postales.

A continuación hay un número menor de áreas geográficas de interés: áreas protegidas, parques nacionales, etc.

 Publicado por en 1:43 pm

 Deja un comentario

(requerido)

(requerido)