Analyse des bestehenden Navigations-Stacks (Local-Controller/Path-following-Controller, Base Controller)
Entwicklung und Training eines Reinforcement-Learning-Ansatzes, der die klassische Trennung von Path-following-Controller und Base-Controller in einer gemeinsamen Policy abbilden
Untersuchung modellfreier und/oder modellbasierter RL-Verfahren hinsichtlich Stabilität, Datenbedarf und Übertragbarkeit
Integration in eine bestehende ROS2-Umgebung
Validierung in Simulation in einer bestehenden ROS2-Umgebung und auf unseren eigens entwickelten Robotern
Vergleich mit bestehenden Controllern bzgl. Pfadfehler, Stabilität und Inbetriebnahmezeit
Dokumentation, Auswertung und wissenschaftliche Aufbereitung der Ergebnisse