Hidden States in Recurrent Neural Networks
- Python 3
- scikit-learn
- TensorFlow
- flask
- JavaScript
- d3.js
- HTML
- CSS
- LaTeX
Projektübersicht
Dieses Projekt befasst sich mit einem visuellen Analyseansatz, der für Experten im Bereich maschinelles Lernen entwickelt wurde, welche die verborgenen Zustände (hidden states) von Schichten innerhalb rekurrenter neuronaler Netze (RNNs) analysieren möchten. Diese Technik ermöglicht es den Nutzern, interaktiv zu erkunden, wie verborgene Zustände Informationen speichern und verarbeiten, während die Eingabesequenz durch das Netzwerk propagiert wird. Durch die Anwendung dieser Methode können Nutzer Einblicke in den Vorhersagemechanismus gewinnen, indem sie herausfinden, welche Aspekte der Eingabedaten einen signifikanten Einfluss auf die Vorhersagen haben und verstehen, wie das Modell spezifische Ausgaben mit verschiedenen Konfigurationen der verborgenen Zustände verknüpft. Diese Arbeit baut auf der Forschung von Garcia et al. (Inner-process visualization of hidden states in recurrent neural networks) auf.
Mein Beitrag
Ich habe Materialien aus dem vorherigen Projekt genutzt, einschließlich des Quellcodes von Jupyter-Notebooks, die zur Erstellung von Visualisierungen verwendet wurden, um ein interaktives Visualisierungssystem mit Python 3, JavaScript und D3.js zu entwickeln. Ich habe neue Visualisierungen hinzugefügt, eine Reihe von Optionen zur Anpassung bereitgestellt und eine konsistentere Verwendung von Farben über verschiedene Visualisierungen hinweg sichergestellt. Darüber hinaus habe ich das ursprüngliche Paper aktualisiert und erweitert, um alle neuen Funktionen ausführlich zu beschreiben und neue Beispiele einzufügen. Dies beinhaltete die Erstellung aller Illustrationen für das Paper sowie eines Videos mit dem interaktiven System.
Veröffentlichungen
Die Ergebnisse dieses Projekts sind im Paper Visual Analytics Tool for the Interpretation of Hidden States in Recurrent Neural Networks veröffentlicht. Zusätzlicher Inhalt wird im Poster Visual-Explainable AI: The Use Case of Language Models präsentiert.