Innovación en datos espaciales: Desarrollan una herramienta de código abierto para procesar más de 40 millones de parcelas del Catastro

Un nuevo script en Python descarga y consolida de forma automática la información territorial de los servicios INSPIRE ATOM en formato GeoParquet para facilitar su análisis histórico.

El Dato
Un nuevo script desarrollado en Python procesa más de 40 millones de parcelas catastrales en España a través de servicios INSPIRE ATOM.

El sector de la edificación, el urbanismo y la planificación territorial se enfrenta constantemente al reto de gestionar volúmenes masivos de información geoespacial. En este contexto de transformación digital, se ha presentado un script automatizado que permite descargar, procesar y asignar valor a más de 40 millones de parcelas catastrales de todo el territorio nacional, abriendo de este modo nuevas oportunidades para el análisis evolutivo del suelo en España.

El origen de la iniciativa y la necesidad de un registro histórico propio

La gestión eficiente del suelo y el análisis predictivo de las zonas urbanas dependen directamente de la calidad y disponibilidad de los datos analizados. Aunque la Dirección General del Catastro publica de manera periódica actualizaciones cada seis meses, la falta de un sistema accesible que almacene de manera continua las variaciones del territorio limita a los profesionales del sector. Ante esta situación, el analista de datos geoespaciales y especialista en SIG e infraestructuras, Miguel Freijedo Butler, ha diseñado una herramienta interna que busca subsanar esta carencia estructural mediante la recopilación masiva de información territorial.

Disponer de un histórico completo abre la puerta a muchos análisis espaciales que no son posibles trabajando únicamente con la fotografía más reciente proporcionada semestralmente por el Catastro.

La idea principal detrás de este proyecto surge de la necesidad interna de construir una base de datos histórica propia del Catastro, la cual permita conservar, monitorizar y analizar en profundidad la evolución detallada de las parcelas inmobiliarias y rústicas a lo largo del tiempo. Esta perspectiva histórica resulta fundamental para estudios de mercado residencial, planificación de infraestructuras públicas y auditorías ambientales.

Procesamiento masivo con Python y consolidación en formato GeoParquet

El núcleo técnico del desarrollo se basa en la automatización completa del flujo de datos de la infraestructura pública. El script está programado para conectarse directamente a los servicios INSPIRE ATOM del Catastro. Desde esta fuente oficial, el algoritmo impulsado por Miguel Freijedo Butler efectúa la descarga automatizada de los ficheros GML originales correspondientes a todo el territorio nacional, un volumen documental crítico que representa más de 40 millones de parcelas catastrales procesadas de forma masiva mediante Python y SQL.

La herramienta unifica los datos originales GML y los consolida en formato GeoParquet, agilizando de manera notable la explotación posterior en QGIS y GeoPandas.

Una vez completada la fase de descarga masiva, el sistema procesa los archivos geográficos nativos para unificarlos y guardarlos en formato GeoParquet. Este formato de almacenamiento en columnas optimiza drásticamente los tiempos de lectura y reduce el espacio en disco, facilitando una integración directa e inmediata con entornos analíticos avanzados como QGIS, GeoPandas, DuckDB o cualquier otra plataforma preparada para la explotación avanzada de big data geoespacial, analítica espacial y técnicas de Machine Learning (ML).

Impacto en el análisis territorial y disponibilidad del código fuente

El autor de la solución ha confirmado que los resultados de la primera carga completa ya han sido validados con éxito, logrando compilar la totalidad de los datos nacionales en una infraestructura unificada. Este avance técnico supone un recurso de gran valor para ingenierías, constructoras y administraciones públicas, ya que dota a los analistas de la capacidad de evaluar transformaciones urbanísticas históricas sin depender en exclusividad del último corte publicado.

El proyecto sirve como base para potenciar el procesamiento masivo de información territorial, con futuras mejoras orientadas a optimizar el rendimiento de la base de datos.

El proyecto ha servido como un ejercicio práctico de alta competencia para reforzar los conocimientos en el procesamiento masivo de información territorial a gran escala. A pesar del éxito de esta primera fase, el analista ha señalado que el software continuará en evolución, teniendo actualmente como tarea pendiente la implementación de mejoras enfocadas en la optimización técnica y el rendimiento analítico de la base de datos relacional. Para garantizar la transparencia y fomentar la innovación colaborativa en el ecosistema constructivo, el código fuente completo ha sido liberado de forma pública en el repositorio de GitHub bajo el nombre de ATOMCPDownloader.

Suscríbete a nuestra Newsletter | Construnews

Últimos artículos

Construnext asume la rehabilitación integral del nuevo campus de ENTI-UB en el 22@ de Barcelona

La constructora Construnext ha anunciado el inicio de las obras de rehabilitación integral y...

Portugal corona a las futuras promesas de la edificación ibérica en los Premios Pladur 2026

La capital portuguesa se ha convertido en el epicentro de la arquitectura emergente de...

La Comisión Europea despeja las dudas sobre el Pasaporte Digital de Productos (DPP)

La Comisión Europea ha dado un paso decisivo hacia la implementación de la economía...

El CSCAE y Fischer alían arquitectura e industria en Barcelona para acelerar la transformación de la construcción

El Consejo Superior de los Colegios de Arquitectos de España (CSCAE) celebrará su próximo...

¿Ciudades humanas o marcas urbanas? El dilema de la habitabilidad frente al riesgo de gentrificación

La evolución del urbanismo contemporáneo debate de forma constante la transición desde los modelos...

RIARTE publica las comunicaciones científicas completas en el «Libro de resúmenes CONTART 2026»

La XI Convención Internacional de la Arquitectura Técnica (CONTART 2026), celebrada en el Auditorio...

Artículos relacionados

Clima extremo y vías vulnerables: por qué la inspección visual ya no basta para proteger el ferrocarril

Los modelos tradicionales de mantenimiento ferroviario, apoyados de forma mayoritaria en las inspecciones visuales...

El capital riesgo reactiva el sector ConTech: la inversión inicia su recuperación global en el arranque de 2026

El ecosistema ConTech arranca el año con un cambio de tendencia largamente esperado. Tras...

The District abre la convocatoria del Proptech Startup Forum 2026 para conectar startups con inversores inmobiliarios

The District ha abierto la convocatoria para participar en el Proptech Startup Forum 2026,...

La inteligencia artificial sacude el empleo cualificado: los jóvenes, en el punto de mira

Un reciente informe de investigación de Anthropic citado por Fortune alerta de un impacto...

WikiBarrio: El «Big Data» de proximidad que revoluciona el sector inmobiliario y la construcción

Esta herramienta interactiva democratiza el acceso a indicadores socioeconómicos por sección censal, permitiendo a...

EXCEL4HOUSING 4.0 abre su convocatoria para startups y pymes innovadoras de la construcción y la vivienda

EXCEL4HOUSING 4.0 ha abierto una nueva convocatoria dirigida a startups y pymes con soluciones...

De lo lineal a lo exponencial: el verdadero reto del ConTech en la era de la inteligencia artificial

El sector de la construcción afronta una transición crítica en la adopción de inteligencia...

La avería invisible de la construcción: el caos digital de los repuestos

En el ecosistema de la construcción y la minería, la disponibilidad de maquinaria operativa...

Las tecnologías de propósito general y la construcción

Un artículo del Barcelona ConTech HubLa historia de la construcción no avanza de forma continua,...