Fallstudie: Visuelle Klassifikation

– eine interaktive Datenexploration in 3D Unity

Forschungsschwerpunkt
Astrophysik, Datenwissenschaften

Kooperationspartner
Lehrstuhl für Astronomie, JMU Würzburg, Doktorandin Katharina Leiter, Prof. Matthias Kadler, Prof. Jörn Wilms

Verantwortlichkeiten
Konzept, Exploration, Gestaltung und Entwicklung

Tools
Unity 3D, C#, R

Zeitraum
3 Monate, 2023

Daten:
 Analyseergebnisse von Satellitendaten zu kosmischen Röntgenquellen

 

Megamaser, oder Nicht-Megamaser?

Wie lassen sich in großen Galaxiendatensätzen neue Muster entdecken? In dem Forschungsprojekt vom Lehrstuhl für Astronomie in Würzburg ging es um die Frage, ob sich bestimmte Galaxien anhand ihrer Röntgeneigenschaften zuverlässig unterscheiden lassen. Im Fokus standen zwei Gruppen: Galaxien mit sogenannten Megamasern, die eine wichtige unabhängige Möglichkeit bieten, die Expansion des Universums zu messen, und Vergleichsgalaxien ohne diese Signale.

Ziel der Analyse war es, charakteristische Kombinationen von Parametern zu finden, mit denen sich neue Galaxien einer der beiden Gruppen zuordnen lassen. Neben Verfahren des maschinellen Lernens unterstützte ich das Projekt durch eine visuelle Untersuchung der mehrdimensionalen Daten. So halfen datenbasierte Visualisierungen dabei, Muster, Zusammenhänge und auffällige Merkmalskombinationen sichtbar zu machen und die algorithmische Analyse zu ergänzen.

 

Machine Learning und Visuelle Exploration

Üblicherweise erfolgt diese Einordnung mithilfe von Entscheidungsbäumen oder Machine-Learning-Verfahren. Dabei wird geprüft, welche Kombinationen von Messwerten besonders gut zwischen verschiedenen Gruppen unterscheiden können. Je mehr Parameter in einem Datensatz enthalten sind, desto schwieriger wird es jedoch, diese Zusammenhänge nachzuvollziehen und die Qualität der Klassifikation zu bewerten. Genau hier setzte meine Arbeit an: Ich untersuchte, wie Datenvisualisierung dabei helfen kann, komplexe algorithmische Entscheidungen sichtbar und interpretierbar zu machen.

Data Mapping & Navigation

Das räumliche Mapping basiert auf einer Kombination aus Epizykeln und dem Prinzip des Random Walks. Jede Galaxie beschreibt einen eigenen Weg durch den 3D-Raum, der durch ihre Parameterwerte bestimmt wird: Jeder Schritt entspricht einem Parameter, die Schrittrichtung ergibt sich aus dem Messwert, die Schrittlänge aus seiner Gewichtung. So entstehen räumliche Muster, in denen sich ähnliche Quellen gruppieren und unterschiedliche klar voneinander absetzen. Forschende konnten verschiedene Parameterkombinationen und Gewichtungen testen und visuell untersuchen, welche Konstellationen Megamaser-Galaxien am besten von Nicht-Maser-Galaxien unterscheiden.

Ein wichtiger Bestandteil des Projekts war die Interaktivität. Die Anwendung ermöglichte es, individuelle Parametersets auszuwählen, Ausreißer im Datensatz zu identifizieren und einzelne Quellen gezielt genauer zu untersuchen. Über Navigation in einer frei erkundbaren 3D-Umgebung konnten die Forschenden direkt mit den Daten arbeiten und neue Perspektiven auf die Klassifikation gewinnen.

Wirkung

Die visuelle Analyse half dabei, interessante Parameterkombination für die Klassifiaktion zu finden und die Ergebnisse eines Random-Forest-Algorithmus besser zu verstehen.  Ausreißer konnten im Datensatz schneller erkannt und die Analysepipeline gezielt verbessert werden. So ergänzte die Visualisierung das maschinelle Lernen nicht nur als anschauliche Darstellung, sondern als Werkzeug für die wissenschaftliche Erkenntnisgewinnung.