Tanja Munz-Körner

Science meets Art

Hidden States in Recurrent Neural Networks

Projektübersicht

Dieses Projekt befasst sich mit einem visuellen Analyseansatz, der für Experten im Bereich maschinelles Lernen entwickelt wurde, die die verborgenen Zustände (hidden states) von Schichten innerhalb rekurrenter neuronaler Netze (RNNs) analysieren möchten. Diese Technik ermöglicht es den Nutzern, interaktiv zu erkunden, wie verborgene Zustände Informationen speichern und verarbeiten, während die Eingabesequenz durch das Netzwerk propagiert wird. Durch die Anwendung dieser Methode können Nutzer Einblicke in den Vorhersagemechanismus gewinnen, indem sie identifizieren, welche Aspekte der Eingabedaten einen signifikanten Einfluss auf die Vorhersagen haben und verstehen, wie das Modell spezifische Ausgaben mit verschiedenen Konfigurationen der verborgenen Zustände verknüpft. Diese Arbeit baut auf der Forschung von Garcia et al. (Inner-process visualization of hidden states in recurrent neural networks) auf.

Mein Beitrag

Ich habe Materialien aus dem vorherigen Projekt genutzt, einschließlich des Quellcodes von Jupyter-Notebooks, die zur Erstellung von Visualisierungen verwendet wurden, um ein interaktives Visualisierungssystem mit Python 3, JavaScript und D3.js zu entwickeln. Ich habe neue Visualisierungen hinzugefügt, eine Reihe von Optionen zur Anpassung bereitgestellt und eine konsistentere Verwendung von Farben über verschiedene Visualisierungen hinweg sichergestellt. Darüber hinaus habe ich das ursprüngliche Paper aktualisiert und erweitert, um alle neuen Funktionen ausführlich zu beschreiben und neue Beispiele einzufügen. Dies beinhaltete die Erstellung aller Illustrationen für das Paper sowie eines Videos mit dem interaktiven System.

Veröffentlichungen

Die Ergebnisse dieses Projekts sind im Paper Visual Analytics Tool for the Interpretation of Hidden States in Recurrent Neural Networks veröffentlicht. Zusätzlicher Inhalt wird im Poster Visual-Explainable AI: The Use Case of Language Models. präsentiert.