Baustellendaten für Forschung & Verkehrsplanung
Strukturierte, tagesaktuelle und historische Autobahn-Baustellendaten für Analysen, Studien und Verkehrsplanung. Offizielle Autobahn-GmbH-Daten veredelt – mit DWD-Wetter, Koordinaten und 365+-Tage-Archiv. Kostenloser Zugang für Forschende und Planungsbehörden.
Zwei amtliche Quellen – ein strukturierter Datensatz
Rohdaten der Autobahn GmbH und des Deutschen Wetterdienstes werden täglich bereinigt, normiert und zu einem analysefertigen Datensatz zusammengeführt.
Täglich 03:00 Uhr
Normierung · DWD-Join
QGIS · Power BI
Alle 29 Variablen im Datensatz
Datensatz direkt in Python, R oder STATA laden
Vom API-Abruf bis zur Regressionsanalyse – einsatzbereit in den gängigen Analyseumgebungen.
import pandas as pd import requests TOKEN = "IHR_TOKEN_HIER" BASE = "https://www.autobahn-baustellen.de/wp-json/autobahn/v1" HDR = {"Authorization": f"Bearer {TOKEN}"} # ── Tagesstand laden ────────────────────────────────── df = pd.read_excel( f"{BASE}/download/baustellen", storage_options={"headers": HDR} ) # ── Deskriptive Statistik ───────────────────────────── print(df[["Länge (km)", "Max Breite (m)", "Temp Min", "Niederschlag (mm)"]].describe()) # ── Vollsperrungsquote nach Bundesland ──────────────── sperrquote = ( df.groupby("Bundesland")["Gesperrt"] .apply(lambda x: (x == "Ja").mean() * 100) .rename("Sperrquote_%") .sort_values(ascending=False) ) # ── Wetterkorrelation: Niederschlag × Baustellen-Dichte ─ korr = df.groupby("Bundesland").agg({ "Niederschlag (mm)": "mean", "Gesperrt": lambda x: (x == "Ja").sum() }) print(korr.corr())
library(readxl) library(dplyr) library(httr) library(ggplot2) TOKEN <- "IHR_TOKEN_HIER" URL <- "https://www.autobahn-baustellen.de/wp-json/autobahn/v1/download/baustellen" # ── Datensatz herunterladen ─────────────────────────── tmp <- tempfile(fileext = ".xlsx") GET(URL, add_headers(Authorization = paste("Bearer", TOKEN)), write_disk(tmp)) df <- read_excel(tmp) # ── Baustellen-Dichte nach Autobahn ────────────────── df %>% group_by(Autobahn) %>% summarise( n_baustellen = n(), km_gesamt = sum(`Länge (km)`, na.rm = TRUE), anteil_gesperrt = mean(Gesperrt == "Ja", na.rm = TRUE) ) %>% arrange(desc(n_baustellen)) %>% head(10) # ── Visualisierung: Sperrquote nach Bundesland ──────── df %>% group_by(Bundesland) %>% summarise(sperrquote = mean(Gesperrt == "Ja")) %>% ggplot(aes(x = reorder(Bundesland, sperrquote), y = sperrquote)) + geom_col(fill = "#FA6605") + coord_flip() + labs(title = "Vollsperrungsquote nach Bundesland", x = "", y = "Anteil Vollsperrung")
import pandas as pd from datetime import date, timedelta TOKEN = "IHR_TOKEN_HIER" BASE = "https://www.autobahn-baustellen.de/wp-json/autobahn/v1" HDR = {"Authorization": f"Bearer {TOKEN}"} # ── Paneldaten: 30 Tage als Längsschnitt aufbauen ───── frames = [] start = date(2026, 4, 1) for i in range(30): d = start + timedelta(days=i) url = f"{BASE}/download/baustellen?date={d}" try: df_day = pd.read_excel(url, storage_options={"headers": HDR}) df_day["datum"] = str(d) frames.append(df_day) except: pass panel = pd.concat(frames, ignore_index=True) # ── Aggregation: Tägliche Vollsperrungen Deutschland ── trend = ( panel.groupby("datum")["Gesperrt"] .apply(lambda x: (x == "Ja").sum()) .reset_index(name="vollsperrungen") ) print(trend) # → Zeitreihe für Zeitreihenanalyse / ARIMA
import pandas as pd import geopandas as gpd from shapely.geometry import Point TOKEN = "IHR_TOKEN_HIER" BASE = "https://www.autobahn-baustellen.de/wp-json/autobahn/v1" HDR = {"Authorization": f"Bearer {TOKEN}"} # ── Datensatz laden und in GeoDataFrame konvertieren ── df = pd.read_excel( f"{BASE}/download/baustellen", storage_options={"headers": HDR} ) gdf = gpd.GeoDataFrame( df, geometry=gpd.points_from_xy(df["Lng"], df["Lat"]), crs="EPSG:4326" ) # ── Spatial Join mit Bundesland-Shapefile ───────────── bundeslaender = gpd.read_file("bundeslaender.geojson") joined = gpd.sjoin(gdf, bundeslaender, how="left") # ── Hotspot-Analyse: Baustellen-Dichte nach Korridor ── vollsperrungen = gdf[gdf["Gesperrt"] == "Ja"] vollsperrungen.to_file("vollsperrungen.gpkg", driver="GPKG") # → Direkt in QGIS oder ArcGIS Pro laden
Was Forscher und Planer an diesem Datensatz schätzen
Kein Scraping, keine manuelle Aufbereitung, keine Rohdaten-Bereinigung. Ein analysefertiger Datensatz aus amtlichen Quellen – täglich aktuell und historisch verfügbar.
Amtliche Primärquelle
Daten stammen direkt von der Autobahn GmbH (Bundesbehörde) und dem Deutschen Wetterdienst – zitierfähig als Primärquelle in wissenschaftlichen Publikationen und Behördenberichten.
ZitierfähigAnalysefertig normiert
Sub-Phasen dedupliziert, Bundesland aus GPS berechnet, Durchfahrtsmaße aus Freitext extrahiert – kein Preprocessing nötig. Datensatz ist direkt in pandas, R oder STATA ladbar.
Kein PreprocessingLängsschnitt-tauglich
365+ Archiv-Tage als konsistentes Panel – gleiche Variablenstruktur, gleiche Normierung jeden Tag. Ideal für Zeitreihenanalysen, Differenz-in-Differenzen und Trend-Modellierung.
PaneldatenWetter als Kovariate
DWD-Wetterdaten (Temperatur, Niederschlag, Warnungen) sind bereits pro Baustelle gejoint – kein separater Wetter-API-Call. Kovariate für Wetter-Baustellen-Interaktionsmodelle direkt verfügbar.
GIS-fähige Geodaten
GPS-Koordinaten aller Baustellen – direkt als GeoPandas-GeoDataFrame, QGIS-Layer oder ArcGIS-Feature-Class verwendbar. Spatial Joins mit eigenen Shapefiles sofort möglich.
QGIS · ArcGISReproduzierbar & versioniert
Jeder Tagesstand ist über den API-Archiv-Parameter exakt reproduzierbar – kein Datenverlust, kein Überschreiben. Ideal für reproduzierbare Forschungsdesigns und Peer-Review-Prozesse.
ReproduzierbarWelche Fragen lassen sich damit beantworten?
Von der empirischen Verkehrsforschung bis zur kommunalen Verkehrsplanung – konkrete Fragestellungen, die dieser Datensatz unterstützt.
Baustelleneinfluss auf Unfallhäufigkeit
Korreliert die Anzahl aktiver Vollsperrungen auf einem Korridor mit der regionalen Unfallstatistik? Paneldatenmodell über 12 Monate – Wetter als Kovariate bereits integriert.
VerkehrssicherheitSaisonalität der Bautätigkeit
Zeigt die Baustellen-Aktivität auf deutschen Autobahnen signifikante Jahresmuster? Welche Bundesländer starten früher in die Bausaison – und wie beeinflusst das die Staubelastung?
ZeitreihenanalyseRäumliche Konzentration der Bauintensität
Gibt es Hot-Spots im Autobahnnetz mit überproportional hoher Baustellen-Dichte? GIS-basierte Cluster-Analyse mit GPS-Koordinaten und Streckenlängen als Gewichtung.
Spatial AnalysisETA-Abweichung durch Baustellen-Puffer
Wie viel Zeitverlust verursachen Baustellen mit Tempolimit und Spurreduzierung auf Hauptkorridoren? Simulation mit Länge × Tempolimit-Delta über alle Tagesstände eines Quartals.
VerkehrsmodellierungInfrastruktur-Erneuerungszyklus
Lassen sich aus Beginn/Ende-Datum und Streckenlänge Aussagen über den Erneuerungszyklus des deutschen Autobahnnetzes ableiten? Vergleich zwischen alten und neuen Bundesländern.
InfrastrukturpolitikWetter-Baustellen-Interaktion
Erhöht Niederschlag oder Frost die Wahrscheinlichkeit von Vollsperrungen – oder umgekehrt: Werden Baustellen bei Schlechtwetter häufiger gemeldet? Logistische Regression auf Tagesbasis.
KausalanalyseZielgruppen in Forschung & Planung
Der Datensatz richtet sich an alle, die strukturierte, amtliche Verkehrsinfrastruktur-Daten für wissenschaftliche oder planerische Zwecke benötigen.
Universitäten & Hochschulen
Lehrstühle für Verkehrswesen, Geographie, Wirtschafts- und Ingenieurwissenschaften – für Abschlussarbeiten, Dissertationen und Drittmittelprojekte.
Planungsbehörden
Landesbehörden für Straßenbau, kommunale Verkehrsplanungsämter und Ministerien – für Berichte, Gutachten und Infrastruktur-Priorisierung.
Forschungsinstitute
BASt, DLR, Fraunhofer, BAST-Partnerinstitute und private Verkehrsforschungsinstitute – für empirische Studien und Modellanpassungen.
Beratungsunternehmen
Verkehrs- und Infrastrukturberater, die Gutachten für Auftraggeber aus Industrie und öffentlicher Hand erstellen – amtliche Datenbasis statt Schätzwerte.
GIS & Geodaten-Spezialisten
Geoinformatiker, die Baustellen-Layer in Verkehrsnetze, NUTS-Regionen oder Siedlungsstruktur-Daten einbetten – GPS-Koordinaten für direkten Spatial Join.
KI & ML-Forschende
Teams, die Routing-Algorithmen, ETA-Prognosemodelle oder Risiko-Klassifikatoren trainieren – Paneldaten als tabellarischer Trainingsdatensatz.
Antworten für Forschende & Verkehrsplaner
Ist der Datensatz als wissenschaftliche Primärquelle zitierfähig?
Ja. Die Daten stammen aus der offiziellen REST-API der Autobahn GmbH des Bundes und dem Deutschen Wetterdienst – beides staatliche Institutionen mit anerkannter Datenkompetenz. Als aufbereitete Sekundärquelle ist autobahn-baustellen.de zitierfähig; als Primärquelle können Sie zusätzlich direkt auf die Autobahn GmbH verweisen. Eine empfohlene Zitierformel finden Sie im Abschnitt oben.
Wie baue ich einen konsistenten Paneldatensatz für Längsschnittanalysen auf?
Rufen Sie für jeden gewünschten Tag den Endpoint /download/baustellen?date=YYYY-MM-DD auf und fügen Sie eine Datumsspalte hinzu – dann per pd.concat() (Python) oder rbind() (R) zu einem Panel zusammenführen. Das Python-Beispiel im Code-Abschnitt oben zeigt diesen Workflow für 30 Tage. Die Variablenstruktur ist über alle Tage identisch – kein Schema-Drift, kein Reprocessing nötig.
Darf ich den Datensatz in einer Publikation oder einem Bericht verwenden?
Ja. Die Daten stammen aus öffentlich zugänglichen amtlichen Quellen. Sie dürfen den Datensatz für wissenschaftliche Publikationen, Gutachten, Berichte und Lehrveranstaltungen verwenden – mit entsprechender Quellenangabe. Für kommerzielle Weitervermarktung der Rohdaten kontaktieren Sie uns bitte vorab. Die Nutzung für nicht-kommerzielle Forschungszwecke ist ausdrücklich erwünscht.
Wie sind die Wetterdaten den Baustellen zugeordnet?
Für jede Baustelle wird anhand der GPS-Koordinaten die geografisch nächste DWD-Messstation ermittelt (typisch < 10 km Distanz). Von dieser Station werden Tageswettervorhersage (Typ, Min/Max-Temperatur, Niederschlag) und aktive Wetterwarnungen übernommen und als Spalten an den Baustellen-Datensatz angehängt. Für hochpräzise meteorologische Analysen empfehlen wir, den originalen DWD-Stationsbezug zu prüfen.
Sind die Daten für GIS-Analysen in QGIS oder ArcGIS geeignet?
Ja. Jede Baustelle enthält Lat/Lng als numerische Spalten im XLSX. Diese lassen sich in GeoPandas mit gpd.points_from_xy() direkt in einen GeoDataFrame konvertieren und als GeoPackage oder Shapefile exportieren – direkt ladbar in QGIS oder ArcGIS Pro. Das GIS-Beispiel im Code-Abschnitt zeigt den kompletten Workflow inklusive Spatial Join mit einem Bundesland-Shapefile.
Wie lange ist das Archiv verfügbar – und bleibt es konsistent?
Das Archiv wächst täglich und umfasst alle Tage seit dem Start der Datenerfassung. Die Variablenstruktur (Spaltenbezeichnungen, Datentypen, Normierung) bleibt über alle Tage konsistent – Schema-Änderungen werden mindestens 30 Tage im Voraus angekündigt und mit Migrationspfad dokumentiert. Für Längsschnittstudien ist damit Reproduzierbarkeit gewährleistet. Die verfügbaren Archiv-Tage listet der Endpoint /archive-dates als JSON.
Datensatz-Zugang anfordern – kostenlos & sofort
Registrieren Sie sich in 2 Minuten und laden Sie noch heute den ersten Tagesstand herunter – inklusive DWD-Wetter, Koordinaten und 29 Variablen. Kein Antrag, keine Wartezeit.
Keine Kosten · Keine Kreditkarte · Keine Verpflichtung · Sofortiger Download · Zitierfähige amtliche Quelle

