Die Kernidee des Forschungskooperationsprojektes „Verbesserung von KI Modellen basierend auf räumlichen Daten in der Agrarwirtschaft“ war die Unterstützung des KMU Heliopas, welches bereits einige initiale KI Ansaetze realisierte. Allerdings ist die Kernexpertise von Heliopas die Bodenfeuchte mit Anwendungen in der Agrarwirtschaft (z.B. WaterFox App ) und brauchte daher SDIL-Experten im Bereich maschinellen Lernens (ML) gepaart mit Know-How von Rechen-Infrastrukturen um bspw. von Hyperparameteroptimierung Tools für ML Modelle zu profitieren. Um vor allem auch innovative Ansätze des tiefen Lernens (DL, engl. Deep Learning) im Projekt zu nutzen, war die Integration weiterer Datenquellen notwendig und somit auch Bestandteil des Forschungskooperationsprojekts. Die Kooperation ist sehr gut gelungen und die erzielten Projektergebnisse halfen dem KMU Heliopas enorm (siehe Testimonials). Die Verwertung der Projektergebnisse ist bereits vom KMU sowie vom FZJ gestartet.
Projektziele
Die Forschungskooperation beinhaltet neben der explorativen Analyse der Daten und Erprobung innovativer DL-Modelle sowie Hyperparameteroptimierung, vor allem auch der Aufbau einer effizienten und qualitativen „Preprocessing Pipeline“ um weitere sinnvolle Datenquellen über die Zeit zu integrieren. Dazu sollten neue Datenquellen identifiziert werden und innovative neue ML und DL Modelle erprobt werden um Vorhersagen im Bereich der Bodenfeuchte für das KMU Heliopas zu verbessern.
Projektergebnisse
Der erste wissenschaftliche Beitrag ist der gelungene Aufbau der „Preprocessing Pipeline“ die Daten als Messdaten von verschiedenen Messstationen und Satelliten nutzt. Es handelt sich dabei um Zeitreihen mit unterschiedlich großen Messabständen. In den ersten Schritten der Pipeline wurden die Daten von unnützlichen Stationen (engl. remove stations) bereinigt und die Qualität der Daten aufbereitet (engl. clean labels). Danach wurden Lücken in den Zeitreihen mit diversen Techniken des „Resamplings“ gefüllt und anhand eines „Achnor-Features“ gefiltert. Im Transformationsschritt wurden frequenzbasierte Daten in eine Frequenzform transformiert (engl. data transformation). Zuletzt wurden die Daten in Zeitfenster aufgespalten (engl. split time Windows). Es wurden unterschiedliche große Zeitfenster analysiert und gewählt, um diese im Hyperparameter Tuning final verwenden zu können. Bild 1 zeigt dazu die diversen „Trials“ der Hyperparameteroptimierung von verschiedenen ML-Modellen das zu einer Verbesserung der Heliopas Modelle führte. Diese Optimierung sowie die Nutzung innovativer DL-Modelle sind die weiteren wissenschaftlichen Beiträge in Ergänzung zur „Preprocessing Pipeline“.
Die Projektergebnisse halfen dem KMU Heliopas. Dazu ein Testimonial von Benno Avino (Heliopas CTO & Co-Founder): “Durch das SDI-C Projekt konnten wir uns auf die Verarbeitung der Satellitenbilder konzentrieren und die Modellierung und das Training in fähige Hände zu geben … Außerdem konnten durch das Hyperparametertuning beträchtliche Verbesserungen für unser Modell erzielt werden“.
Ein letzter Teil der Projektergebnisse war jedoch auch sehr wichtig: Die Integration von neuen hoch-qualitativen Datenquellen benötigt durchaus Fachkenntnisse im Bereich der Bodenfeuchte. Das Projekt machte deutlich das mehr Fachkenntnisse im Bereich der Bodenfeuchte wünschenswert wären.
Nächste Schritte
Das Forschungszentrum verwertet die Projektergebnisse dieses Kooperationsprojektes bereits in dem EU-Projekt „Research on AI- and Simulation-Based Engineering at Exascale“ (CoE RAISE) im Rahmen der Hyperparameteroptimierung. Darüber hinaus ist die Verwertung der „Preprocessing Pipeline“ ebenfalls in der Praxis umgesetzt und wird bspw. in dem FZJ CASA HealthCare Lab im Rahmen der Forschung des Akute Respiratory Distress Syndrome (ARDS) genutzt. Die Firma Heliopas wertet die Ergebnisse des Projekts aus, um sie in ihre Produkte zu integrieren.
Ein wesentlicher nächster Schritt ist die Involvierung von mehr Domainexperten in der Bodenfeuchte (bspw. etablierter Wissenschaftler) und mehr Datenquellen, daher wurde ein Folgeprojekt beantragt und genehmigt. Mehr dazu in dem Bericht „Effiziente Nutzung von Multi-GPU Clustern zur Hyperparameter Optimierung von Deep Learning Modellen unter Nutzung innovativer Messdaten für die Bodenfeuchte“.
Projektpartner
Prof. Dr. – Ing. Morris Riedel, Forschungszentrum Juelich
Ingmar Wolff und Bennot Ommerborn Avino, Heliopas GmbH