Playground-Hilfe
Walkthrough für den Playground, das Forschungswerkzeug der MHDBDB. Gedacht für mediävistische und digital-humanistische Fragestellungen, die mit einer einfachen Einzelwort-Suche nicht beantwortbar sind: Kookkurrenzen, mehrere Lemmata gleichzeitig, Zugriff auf die sechs Authority Files.
1. Worum es geht
Der Playground erweitert die Korpussuche um drei Säulen: Erstens die Mehr-Lemma- und Kookkurrenz-Suche – mehrere Lemmata gleichzeitig suchen und prüfen, wie nahe sie im Text zusammenstehen. Zweitens die sechs durchsuchbaren Authority Files – Autor*innen, Werke, das Wörterbuch, die Begriffstaxonomie, Gattungen und Eigennamen. Drittens neun TEI-Analysewerkzeuge über dem vorgeladenen Korpus, von der Wortfrequenz bis zum Kookkurrenz-Ranking.
Die Oberfläche ist forschungsorientiert: etwas dichter, mit mehr Bedienelementen als die Korpussuche. Wenn Sie nur nach einem einzigen Wort suchen wollen, ist die Korpussuche der schnellere Weg.
2. Der Drei-Spalten-Aufbau
Der Playground arbeitet in drei Schritten, die auch räumlich abgebildet sind:
- Korpus-Browser (links) – alle 667 Texte sind standardmäßig aktiv. Hier schränken Sie die Analyse auf bestimmte Werke, Autor*innen oder Gattungen ein.
- Abfragen (Mitte) – sechs Authority-File-Einstiegspunkte plus neun TEI-Analysewerkzeuge: Multi-Lemma-Suche, Lemmasuche nach Versposition, Wortfrequenz-Analyse, Text-Statistiken, Lemma-Verteilung, Begriffs-Verteilung, Textvergleich, Kookkurrenz-Ranking und Erweiterte Figurenbezeichnungen (Beta).
- Ergebnisse (rechts) – die Trefferliste zur aktuellen Abfrage, mit farbkodiertem Highlighting und Klick-Navigation in die Leseansicht.
Beim ersten Besuch lädt der Playground den Korpus-Index (rund 40 MB) und den Authority-Index (rund 3 MB) einmalig in den Browser-Cache. Das dauert je nach Verbindung einige Sekunden bis eine Minute. Bei späteren Besuchen liest der Playground direkt aus dem lokalen Cache, solange Sie ihn nicht über Website-Daten löschen im Footer entfernen.
3. Multi-Lemma-Suche
Die Multi-Lemma-Suche ist das Kernstück des Playgrounds. Sie öffnet einen Dialog, in den Sie mehrere Lemmata eingeben – als Wort oder als Lemma-ID.
Lemmata eingeben
Getrennt durch Komma oder Plus-Zeichen, zum Beispiel:
brôt, wîn oder
879 + 7532.
Auch ein einzelnes Lemma ist erlaubt. Jedes eingegebene Lemma erscheint als
entfernbarer Chip – so sehen Sie sofort, was die Suche berücksichtigt.
Die dreistufige Variantenauflösung aus der Korpussuche gilt auch hier: exakter Treffer im Wörterbuch, dann Prüfung gegen 234.244 orthographische Varianten, dann Teiltreffer als Fallback. Sonderzeichen (â, ê, î, ô, û, ä, ö, ü) werden automatisch normalisiert.
Suchmodus wählen
Nähe-Analyse Empfohlen
Findet Belegstellen, an denen die gesuchten Lemmata innerhalb eines einstellbaren Wortabstands zusammen vorkommen – eine Kookkurrenz (zwei oder mehr Lemmata, die im Text in geringem Abstand zusammenstehen). Der Standardwert von 10 Wörtern hat sich bewährt; einstellbar von 1 bis 50. Ideal für Fragen wie: „In welchen Passagen stehen minne und herze eng zusammen?"
Dokument-Suche
Listet alle Texte auf, die sämtliche angegebenen Lemmata irgendwo enthalten – unabhängig vom Abstand. Ideal für Fragen wie: „Welche Texte behandeln sowohl triuwe als auch zwîvel?" Das Ergebnis ist dokumentbasiert, nicht stellenbasiert.
Ergebnisse und Farbcodierung
Jedes Lemma bekommt eine eigene Farbe. In der Trefferliste sehen Sie die Belegstelle mit Kontext und farblich hervorgehobenen Lemmata. Ein Klick auf einen Treffer öffnet die Leseansicht der Hauptseite mit allen Lemmata in denselben Farben und springt direkt zur Fundstelle.
4. Lemmasuche nach Versposition
Findet ein einzelnes Lemma, das genau am Versanfang oder Versende steht. Eine direkte Antwort auf mediävistische Fragen wie: „Wie oft reimt Wolfram auf minne?" oder „Welche Wörter dominieren das Versende im Parzival?"
Wie es funktioniert
- Lemma eingeben (Wort wie
minneoder Lemma-ID). - Position wählen: Versanfang oder Versende (Default: Versende, weil der Reim-Use-Case häufiger ist).
- Auf Suchen klicken.
- Die Trefferliste zeigt jeden Text mit den Treffern an der gewählten Position, daneben den Anteil an allen Vorkommen im Text (z.B. „54%" heißt: jedes zweite Vorkommen des Lemmas im Text steht am Versende).
Was die Position bedeutet
Die Funktion arbeitet auf der <l>-Auszeichnung
des TEI-Korpus, also auf jeder vom Editions-Layout vorgegebenen Verszeile.
„Versanfang" ist das erste annotierte Wort einer <l>,
„Versende" das letzte. Wortpositionen außerhalb von <l>
(etwa in Kapitelüberschriften, Marginalia oder Notizen) gelten weder als Anfang noch als Ende.
Anwendungsbereich: Die Funktion wirkt nur in Versdichtung
(603 von 667 Texten, rund 90 % des Korpus). Prosa-Texte ohne
<l>-Auszeichnung
werden automatisch übersprungen und tauchen in den Ergebnissen nicht auf.
Beispiel: Reimpaare in AGS
Eine Stichprobe der ersten zehn Versenden in der Spruchsammlung
AGS zeigt klare
AABB-Reimpaare:
gân / begân,
bant / bekant,
mûzære / gewære,
rote / nota,
jâr / hâr.
Wer Reimwort-Vorkommen sucht, kommt auf diesem Weg direkt zu den Belegstellen.
Die Position-Spalte in den Ergebnissen ist auch ein Indikator für reimgetriebene Wortwahl: ein Lemma mit hohem Versende-Anteil (60 %+) steht überwiegend am Reim, eines mit niedrigem Anteil (unter 10 %) ist eher semantisch motiviert positioniert.
5. Weitere TEI-Analyse-Werkzeuge
Neben der Multi-Lemma-Suche und der Lemmasuche nach Versposition bietet der Bereich TEI-Textanalyse sieben weitere Werkzeuge über dem vorgeladenen Korpus. Alle rechnen vollständig im Browser auf den vorgebauten Indexen; wo es sinnvoll ist, führt ein Klick auf ein Ergebnis direkt in die Leseansicht.
Wortfrequenz-Analyse
Listet die häufigsten Lemmata über das gesamte Korpus oder einen einzelnen Text (Top-N). Ein POS-basierter Stoppwort-Filter entfernt häufige Funktionswörter (Artikel, Pronomen, Präpositionen, Konjunktionen) und hebt inhaltstragende Lemmata hervor. Die Tabelle zeigt je Lemma die absolute und die relative Frequenz (pro 1.000 Tokens); sortiert wird wahlweise nach der absoluten oder der relativen Frequenz.
Text-Statistiken
Pro Text: Token-Zahl, Lemma-Diversität (verschiedene Lemmata zur Gesamtzahl), Hapax-Rate und durchschnittliche Lemma-Frequenz, als sortierbare Korpus-Tabelle. Hohe Lemma-Diversität bei knappem Text ist ein Indikator für lexikalischen Reichtum. Über Checkboxen lässt sich ein Subset bilden („Nur Auswahl anzeigen"); die Auswahl übersteht das Sortieren.
Lemma-Verteilung
Zeigt ein einzelnes Lemma als Balkendiagramm über alle Texte: die Top-N als Balken, der Rest als aufklappbare Tabelle. Wahlweise absolut oder relativ (pro 1000 Tokens). Ein Klick auf einen Balken oder eine Sigle öffnet die Leseansicht mit Highlighting.
Begriffs-Verteilung
Wie die Lemma-Verteilung, aber begriffsbasiert: Sie geben einen Begriff ein
(deutsch, englisch oder als concept_-ID)
und sehen das Balkendiagramm über alle Texte. Aggregiert werden alle Lemmata,
deren Bedeutungen dem Begriff zugeordnet sind (Datenpfad Begriff → Bedeutungen
→ Lemmata → Texte). Ein Autocomplete schlägt passende Begriffe vor, alternative
Kandidaten werden angezeigt (etwa bei „love" → Intimität und Liebe/Zuneigung);
eine aufklappbare Liste der zugeordneten Lemmata erlaubt die Validierung der
Auswahl.
Textvergleich
Vergleicht zwei über Dropdown gewählte Texte und berechnet drei Lemma-Mengen: nur in A, in beiden, nur in B – je mit Frequenz in A, Frequenz in B und der absoluten Differenz. Sortier- und filterbar, mit A↔B-Swap für die gespiegelte Perspektive. Nützlich für Fragen wie „Welche Lemmata teilt der Parzival mit dem Jüngeren Titurel?" oder zur Suche nach geteilten seltenen Lemmata als Lehnvers-Indiz. Ein Klick auf eine Frequenz-Zahl öffnet den jeweiligen Text in der Leseansicht.
Kookkurrenz-Ranking
Beantwortet die Frage „Welche Lemmata stehen am häufigsten bei X?". Sie geben ein einzelnes Lemma ein und erhalten eine rangierte Tabelle der häufigsten Nachbar-Lemmata innerhalb eines Kontextfensters (±3 bis ±25 Wörter, Standard ±10). Der POS-Filter steht standardmäßig auf Inhaltswörtern (Nomen, Verben, Adjektive, Adverbien), damit Funktionswörter die Liste nicht dominieren; alternativ nur Nomen, nur Verben, nur Adjektive oder alle. Ein Klick auf ein Partner-Lemma öffnet dessen Lemma-Seite; über den separaten Link „→ Belege" je Zeile landen beide Lemmata im Nähe-Modus der Multi-Lemma-Suche.
Kookkurrenz-Ranking vs. Nähe-Analyse: Beide drehen sich um Wortumgebungen, beantworten aber verschiedene Fragen. Das Kookkurrenz-Ranking geht von einem einzigen Lemma aus und rankt ungerichtet, welche anderen Lemmata in seiner Umgebung am häufigsten auftauchen – es entdeckt die Partner für Sie. Die Nähe-Analyse der Multi-Lemma-Suche (Abschnitt 3) setzt dagegen voraus, dass Sie die Lemmata bereits kennen, und prüft nur, an welchen Stellen sie nah zusammenstehen.
Erweiterte Figurenbezeichnungen Beta
Kuratierte Bezeichnungspraktiken jenseits des Eigennamens für vier Werke (Eneasroman, Iwein, Rolandslied, Trojanerkrieg) aus Linda Beutel-Thurows Dissertationsprojekt Naming-analysis. Pro Figur sind die Terme in drei Kategorien gegliedert: Eigennamen, Antonomasien („der rîter" für Iwein) und Epitheta („der küene"), je mit Häufigkeit und aufklappbaren Belegstellen samt Versangabe und Sprecher (Erzähler, Figurenrede oder Selbstnennung). Für Rolandslied und Trojanerkrieg verlinken die Versangaben direkt in die Leseansicht. Die Daten sind mit sichtbarer Attribution und DOI eingebunden.
6. Typische Forschungsfragen
Damit die abstrakten Modi greifbarer werden: vier Fragen, die häufig an die MHDBDB gestellt werden, und wie Sie sie im Playground bearbeiten.
Kookkurrenz-Analyse
„In welchen Passagen stehen minne und herze eng zusammen?"
Multi-Lemma-Suche · Nähe-Analyse · Abstand 10 Wörter ·
minne, herze.
Die Trefferliste zeigt jede Belegstelle mit Kontext, Farbcodierung pro Lemma.
Thematische Kopräsenz auf Dokumentebene
„Welche Texte behandeln sowohl triuwe als auch zwîvel?"
Multi-Lemma-Suche · Dokument-Suche ·
triuwe, zwîvel.
Das Ergebnis listet die Werke auf, in denen beide Lemmata vorkommen – egal wo.
Begriffsnetzwerk erkunden
„Welche Lemmata fallen unter den Begriff Tugend?"
Authority-Ansicht Begriffe · nach Tugend suchen · im Detaileintrag stehen alle Lemmata, die der Begriffstaxonomie nach darunter fallen. Von dort können Sie direkt in die Korpussuche springen.
Gattungsbasierte Korpusselektion
„Welche Werke sind der Gattung Sangspruch zugeordnet?"
Authority-Ansicht Gattungen · nach Sangspruch suchen · die Werkliste im Detaileintrag zeigt alle zugeordneten Texte. Diese Auswahl können Sie als Ausgangspunkt für eine gefilterte Multi-Lemma-Suche übernehmen.
8. Vom Playground in die Leseansicht
Der typische Forschungsworkflow verbindet Playground und Korpussuche:
- Im Playground eine Multi-Lemma-Suche starten.
- Eine interessante Kookkurrenz in der Trefferliste auswählen.
- Klick auf das Ergebnis – die Korpussuche öffnet sich in einem neuen Tab.
- Der Text ist geladen, alle Lemmata sind farblich hervorgehoben, die Ansicht scrollt automatisch zur Fundstelle.
- Im Reading View weiterlesen, zwischen Belegen springen, Metadaten aufklappen.
So bleiben Analyse und Lektüre getrennt: der Playground liefert die Korpusstatistik, die Korpussuche den Volltext im Kontext.
9. Was Sie als Nächstes tun können
Stand: Juni 2026 · Änderungen auf GitHub