Fallstudie: Transcape VR
– ein Tool für immersive visuelle Exploration transkriptomischer Daten
Forschungsschwerpunkt
Biologie
Kooperationspartner*innen
Anda Iosip, Chair for Computational and Theoretical Biology, Universität Würzburg
Verantwortlichkeiten
Konzept, Gestaltung und Entwicklung
Tools
Unity (Version 2019.3), C#-Skripte, SteamVR-2.0-Paket, Valve-Index-VR-Brille.
Zeitraum
3 Monate, 2021
Daten:
Wir verwenden öffentlich zugängliche Daten zu sieben verschiedenen Organen und Geweben der Venusfliegenfalle (Dionaea muscipula), einer tödlichen fleischfressenden Pflanze (siehe Iosip et al. 2020)
Wie lässt sich sichtbar machen, welche Gene in einer Pflanze an unterschiedlichen Stellen aktiv sind?
Forschende am CCTB der Uni Würzburg sind auf der Suche nach Genen, die mit dem Beutefang der fleischfressenden Pflanze, der Venusfalle, zusammenhängen. Dafür setzten sie die mRNA-Sequenzierung ein, um zu untersuchen, welche Gene in einer Zelle oder einem Gewebe aktiv sind. Dabei wird die Aktivität von tausenden Genen über viele verschiedene Gewebe und Bedingungen hinweg erfasst. In dieser großen Datenmenge die biologische Geschichte zu erkennen, ist eine Herausforderung.
Übliche Analysemethoden mit zweidimensionalen, nicht interaktiven Visualisierungen sind dabei oft einschränkend und schwer zugänglich. Um hier das Potenzial der erweiterten Realität zu testen, haben wir TranScape VR entwickelt – ein neues Werkzeug, das solche Datenlandschaften in einem immersiven, explorativen, ganzheitlichen und zugleich unterhaltsamen Virtual-Reality-Raum sichtbar macht.
In die Daten eintauchen
Wir stellten die Daten als interaktives Netzwerk dar. Dabei werden Gene den jeweiligen Gewebe-Knoten zugeordnet und bilden Gruppen. Biologische Eigenschaften, zum Beispiel wie stark ein Gen aktiv ist oder wie typisch es für ein bestimmtes Gewebe ist, werden auf visuelle Merkmale wie Farbe, Größe, Abstand und Position im 3D-Raum übertragen.
Statt nur statische Diagramme zu betrachten, können Forschende die Daten räumlich erkunden, drehen und filtern, um so Muster aus verschiedenen Blickwinkeln zu betrachten und ihre Hypothesen direkt im visuellen Modell zu testen. Das Tool verbindet mehrere Analyseperspektiven in einer gemeinsamen Umgebung und macht große, vernetzte Datensätze intuitiver erfassbar.
Ein Punkt, ein Gen…
Jedes Gen wird als Punkt im dreidimensionalen Raum dargestellt. Seine Position hängt davon ab, in welchen Geweben der Pflanze es aktiv ist und wie stark es mit diesen Geweben verbunden ist. Gene, die vor allem in einem bestimmten Gewebe aktiv sind, erscheinen näher an diesem Bereich. Gene, die in mehreren Geweben eine Rolle spielen, liegen zwischen ihnen.
So entsteht eine räumliche Karte der Daten: Ähnliche Gene gruppieren sich, während andere weiter entfernt liegen. Auf einen Blick wird sichtbar, welche Gene eng mit bestimmten Pflanzenteilen zusammenhängen und welche eher mehrere Bereiche miteinander verbinden.
Visuelle Exploration
Nutzer*innen können das Gen-Netzwerk visuell erkunden und analysieren, indem sie die Darstellung neu skalieren, mit ihr interagieren, Beschreibungen einzelner Gene abrufen sowie Gene anhand von Eigenschaften und Namen filtern oder hervorheben. Durch diese visuelle Exploration lassen sich Muster erkennen, die auch durch klassische Analysemethoden bestätigt werden. Dazu gehören unter anderem Korrelationsanalysen, Hauptkomponentenanalyse und Gewebespezifitätsanalyse.
Die Gen-Wolken lassen sich skalieren, drehen und verschieben, um unterschiedliche Perspektiven und Übersichten zu erhalten. Gewebe-Knoten können in Echtzeit neu angeordnet werden, um verschiedene räumliche Konstellationen zu untersuchen. Verbindungslinien zwischen Genen und Geweben können aktiviert werden, um zugehörige Gene sichtbar zu machen. Zusätzlich lassen sich Details zu einzelnen Genen aufrufen, zum Beispiel quantitative Werte und Beschreibungen. Auch Parameter wie Aktivitätsniveau oder Spezifität können gefiltert werden, um festzulegen, welche Gene angezeigt werden. Darüber hinaus ist eine Suche nach einzelnen Genen oder Gruppen von Genen über Stichworte möglich.
Gewebe-Netzwerk
Forschende können das Gewebe-Netzwerk erkunden, in dem die Verbindungen zwischen zwei Geweben durch die Anzahl der gemeinsam genutzten Gene bestimmt werden. Je mehr Gene zwei Gewebe teilen, desto dicker ist die Verbindungslinie. Im Poster wird darauf hingewiesen, dass sich zum Beispiel besonders starke Verbindungen zwischen Wurzel und Blüte sowie zwischen Blattstiel und Blattrand zeigen. Diese Beobachtung wird auch durch klassische Methoden wie Hauptkomponentenanalyse und Pearson-Korrelationsanalyse bestätigt.
Gen-Netzwerk
Im Gen-Netzwerk-Modus zeigen die Verbindungen zwischen Genen und Geweben deutlich, welche Gene zu welchen Geweben gehören. Gene sind über farbige Linien mit jedem Gewebe verbunden, in dem sie vorkommen. Die Anzahl der Linien, die an ein Gen angeschlossen sind, zeigt also, in wie vielen Geweben dieses Gen vorkommt. Es ist möglich, entweder alle Verbindungen gleichzeitig oder nur die Verbindungen zu ausgewählten Geweben einzuschalten. Dadurch lassen sich gemeinsam genutzte Gene zwischen Geweben sowie die Verteilung der Gewebespezifität genauer untersuchen.
Gen-Datenwolke
Gewebe werden als gelbe Kugeln dargestellt. Ihre Größe richtet sich nach der Anzahl der Gene, die mit ihnen verbunden sind: Je größer die Kugel, desto mehr Gene gehören zu diesem Gewebe. Gene erscheinen als blaue Punktwolke. Ihre Position wird durch ihre Spezifität bestimmt. Das heißt: Gene, die näher an einem Gewebe-Knoten liegen, sind stärker für dieses Gewebe typisch. Detaillierte Informationen zu jedem Gen, etwa zur Spezifität, zur Aktivität und zur Annotation, können durch Anklicken eingeblendet werden.