zur hauptseite

Vorhersage von Immobilienpreisen mittels maschinellen Lernens:
Eine explorative Datenanalyse und Modellierung von Grundstücksdaten aus Milwaukee (2024)

  • Studienarbeit (pdf)

  • Diese Arbeit untersucht die Anwendung von Machine-Learning-Methoden zur Analyse und Prognose von Immobilienpreisen in einem heterogenen Datensatz. Die zugrunde liegenden Daten umfassen Verkaufsinformationen von 2002 bis 2022 und zeichnen sich durch unterschiedliche Formate, fehlende Werte und starke Ausreisser aus. Nach einer umfassenden Datenaufbereitung und explorativen Datenanalyse wurden verschiedene Machine-Learning-Modelle, darunter lineare Regression, Entscheidungsbäume, Random Forests und Gradient Boosting, getestet und verglichen. Die Ergebnisse zeigen, dass insbesondere Gradient Boosting in Kombination mit optimierten Hyperparametern eine hohe Vorhersagegenauigkeit bietet, wobei das finale Modell einen Test-Score von R2 = 0.80 bieten kann. Die Analyse identifiziert Schlüsselvariablen wie Grundstücksgrösse, Gebäudealter und geografische Lage als wesentliche Einflussfaktoren auf die Verkaufspreise. Neben den technischen Ergebnissen untersucht die Arbeit die Herausforderungen der Datenvorbereitung. Abschliessend werden Vorschläge für zukünftige Arbeiten, wie die Integration zusätzlicher sozioökonomischer Daten und der Einsatz neuronaler Netze, zur weiteren Verbesserung der Modellleistung gegeben.