About GRIP

Generative Research Interface Protocol

Das Problem

Forschende in den Digital Humanities stehen vor einem wiederkehrenden Problem: Für ihre Daten gibt es selten passende Standardinterfaces. Briefkorrespondenzen brauchen andere Darstellungen als Umfragedaten, Zitationsnetzwerke andere als Sammlungsinventare. Die Entwicklung maßgeschneiderter Interfaces ist zeitaufwändig und erfordert Expertise in UX-Design und Softwareentwicklung.

Gleichzeitig können Large Language Models (LLMs) wie Claude oder ChatGPT zunehmend Code generieren. Doch ohne domänenspezifisches Wissen produzieren sie generische Lösungen, die wissenschaftliche Anforderungen nicht erfüllen.

Forschungsfrage: Wie kann das Expertenwissen über geeignete Interface-Archetypen für verschiedene Datenstrukturen und Forschungsintentionen so kodifiziert werden, dass LLMs fundierte Interface-Empfehlungen generieren können?

Die Lösung: GRIP

GRIP ist ein methodisches Framework, das Sprachmodellen beibringt, passende Interface-Empfehlungen für Forschungsdaten zu generieren. Es kodifiziert das Wissen darüber, welche Interface-Archetypen für welche Datenstrukturen und Forschungsintentionen geeignet sind.

Kernidee: Das eigentliche Produkt ist der System-Prompt und das mentale Modell. Die Website beweist, dass das Modell funktioniert.

Beispiel

Eine Historikerin hat eine Sammlung von 500 Briefen zwischen Hannah Arendt und Karl Jaspers. Sie beschreibt ihre Daten einem LLM, das mit GRIP kontextualisiert ist:

Die 3-Ebenen-Taxonomie

GRIP organisiert Interface-Wissen in drei hierarchischen Ebenen:

Archetypen 4 Reader, Scope, Navigator, Workbench
Spezialisierungen 12 Edition, Survey, Citation, Registry...
Modi 48 Synopse, Apparat, Genetik, Faksimile...

Warum diese Struktur?

Die Zahlen 4-12-48 sind nicht willkürlich:

Die Entscheidungsmatrix

Die Zuordnung von Daten zu Archetypen erfolgt über zwei Dimensionen:

Topologie (Datenstruktur)

Intention (Forschungsziel)

Die Kombination ergibt 16 Felder: 4 primäre (eindeutige Zuordnung), 8 sekundäre (ableitbar), 4 ambige (erfordern Rückfragen zur Klärung).

Kognitive Grundlagen

Jeder Archetyp basiert auf Erkenntnissen aus der Mensch-Computer-Interaktion (Human-Computer Interaction, HCI). Die Design-Entscheidungen sind wissenschaftlich fundiert:

Reader

Tiefes Lesen erfordert ununterbrochenen Textfluss. Optimale Zeilenlänge: 60-75 Zeichen. Zu lange Zeilen erschweren den Zeilenrücksprung, zu kurze unterbrechen den Lesefluss.

Dyson, M. C. (2004). How physical text layout affects reading from screen.

Scope

Präattentive Verarbeitung: Das visuelle System erkennt Muster (Farbe, Form, Position) in unter 250ms, bevor bewusste Aufmerksamkeit einsetzt. Small Multiples nutzen diesen Effekt besser als interaktive Einzelcharts.

Healey, C. G., & Enns, J. T. (2012). Attention and visual memory in visualization and computer graphics.

Workbench

Mode Awareness: Bei Datenbearbeitung müssen Nutzende jederzeit wissen, ob sie sich im Lese- oder Bearbeitungsmodus befinden. Fehlende visuelle Trennung führt zu versehentlichen Änderungen.

Sellen, A. J., & Harper, R. H. (2003). The Myth of the Paperless Office.

Methodik

GRIP wurde durch einen iterativen Knowledge-Engineering-Prozess entwickelt:

1. Domänenanalyse

Analyse bestehender Forschungsinterfaces in den Digital Humanities: Welche Patterns wiederholen sich? Welche Datenstrukturen erfordern welche Darstellungsformen?

2. Taxonomie-Entwicklung

Induktive Ableitung der Archetypen aus beobachteten Interfaces. Validierung durch Mapping auf etablierte Metadatenstandards (TEI P5, DDI, MODS, LIDO, SKOS).

3. Prompt Engineering

Iterative Verfeinerung des System-Prompts durch Tests mit verschiedenen LLMs (Claude, GPT-4). Messung: Generiert das LLM sinnvolle Empfehlungen für gegebene Datenbeschreibungen?

4. Prototyping

Implementierung der 20 Demo-Interfaces als Proof-of-Concept. Die Website wendet GRIP auf sich selbst an (selbstreferenzieller Prototyp).

Zielgruppen

Forschende in den Digital Humanities

Nutzen GRIP, um passende Interface-Empfehlungen für ihre Daten zu erhalten. Beschreiben ihre Datenstruktur und Forschungsziele, erhalten konkrete UI-Spezifikationen.

LLM-Entwickler und Prompt Engineers

Nutzen die GRIP-Wissensbasis als System-Prompt-Komponente. Die Markdown-Dokumente sind für Context Windows optimiert.

UX-Designer für Forschungssoftware

Referenzieren die kognitiven Prinzipien und Design Rationales. Jede Archetyp-Entscheidung ist wissenschaftlich begründet.

Limitationen

GRIP ist ein Experiment, kein fertiges Produkt. Bekannte Einschränkungen:

Für LLM-Entwickler

Die Wissensbasis in knowledge/ ist für System-Prompts optimiert:

Technologie

Wissenschaftliche Standards

GRIP orientiert sich an etablierten Metadatenstandards der Digital Humanities:

Literaturverweise

Autor

Dr. Christopher Pollin

Digital Humanities Craft

chpollin.github.io

GRIP entstand als Context Engineering Experiment für Frontier-LLMs.

Zur Entscheidungsmatrix GitHub Repository