Analyzing the impact of grey data quality in the training phase of deep learning models for dwelling extraction in refugee camps

Research output: Contribution to journalArticlepeer-review

Abstract

Weltweit finden Menschen Zuflucht in Flüchtlingslagern. Die politische Situation, aber auch die dynamische Entwicklung der Flüchtlingslager erschwert es, humanitäre Hilfe zu leisten. Heutzutage werden Nichtregierungsorganisationen (NGOs) durch eine Kombination aus Fernerkundung und künstlicher Intelligenz unterstützt, die es möglich macht, Zelte zu detektieren und zu klassifizieren. Ein Problem sind jedoch mangelnde Trainingsdaten. Eine Lösung sind sogenannte ‚graue Daten‘, die jedoch semantische und geometrische Unsicherheiten besitzen. Die Auswirkung dieser grauen Daten auf die Modellleistung wurde analysiert und die Implementierung einer sogenannten zyklischen Lernrate (ZL) getestet, um Daten mit einer hohen Unsicherheit zu erkennen und zu löschen. Hierfür wurde ein U-net-Modell verwendet. Abhängig von der Menge an fehlerhaften Trainingsdaten, aber auch vom Fehlertyp konnten graue Daten die Modellgenauigkeit sogar verbessern, zum Beispiel durch leicht vergrößerte Objektgrenzen wurde der F1-Score von tropfenförmigen Zelten um 16 % verbessert. Allerdings verschlechterten besonders Klassifizierungsfehler die Modellperformanz. Bei Tukuls (Hütten) wurde beispielsweise der F1-Score um 2 % verbessert und bei kleinen Gebäuden (small structures) verbesserte sich die Producer Accuracy um 30 %. Das Voranstellen einer ZL führte zur Verbesserung der Modellperformanz bei manchen Klassen von bis zu 20 %, solange nicht ein großer Teil der Trainingsdaten fehlerhaft waren. Diese Methode ist jedoch zeitaufwendig und muss für bessere Ergebnisse sowie den operationellen Einsatz optimiert werden.
Translated title of the contributionAuswirkungen von „grauen Daten“ in der Trainingsphase von Deep-Learning-Modellen zur Detektion von Gebäuden in Flüchtlingslagern
Original languageEnglish
Pages (from-to)77-88
Number of pages10
Journalgis.Science: Die Zeitschrift für Geoinformatik
Volume2023
Issue number3
Publication statusPublished - 1 Oct 2023

Fields of Science and Technology Classification 2012

  • 107 Other Natural Sciences

Cite this