Playground-Hilfe

1. Worum es geht

Der Playground erweitert die Korpussuche um drei Säulen: Erstens die Mehr-Lemma- und Kookkurrenz-Suche – mehrere Lemmata gleichzeitig suchen und prüfen, wie nahe sie im Text zusammenstehen. Zweitens die sechs durchsuchbaren Authority Files – Autor*innen, Werke, das Wörterbuch, die Begriffstaxonomie, Gattungen und Eigennamen. Drittens neun TEI-Analysewerkzeuge über dem vorgeladenen Korpus, von der Wortfrequenz bis zum Kookkurrenz-Ranking.

Die Oberfläche ist forschungsorientiert: etwas dichter, mit mehr Bedienelementen als die Korpussuche. Wenn Sie nur nach einem einzigen Wort suchen wollen, ist die Korpussuche der schnellere Weg.

2. Der Drei-Spalten-Aufbau

Der Playground arbeitet in drei Schritten, die auch räumlich abgebildet sind:

Korpus-Browser (links) – alle 667 Texte sind standardmäßig aktiv. Hier schränken Sie die Analyse auf bestimmte Werke, Autor*innen oder Gattungen ein.
Abfragen (Mitte) – sechs Authority-File-Einstiegspunkte plus neun TEI-Analysewerkzeuge: Multi-Lemma-Suche, Lemmasuche nach Versposition, Wortfrequenz-Analyse, Text-Statistiken, Lemma-Verteilung, Begriffs-Verteilung, Textvergleich, Kookkurrenz-Ranking und Erweiterte Figurenbezeichnungen (Beta).
Ergebnisse (rechts) – die Trefferliste zur aktuellen Abfrage, mit farbkodiertem Highlighting und Klick-Navigation in die Leseansicht.

Beim ersten Besuch lädt der Playground den Korpus-Index (rund 40 MB) und den Authority-Index (rund 3 MB) einmalig in den Browser-Cache. Das dauert je nach Verbindung einige Sekunden bis eine Minute. Bei späteren Besuchen liest der Playground direkt aus dem lokalen Cache, solange Sie ihn nicht über Website-Daten löschen im Footer entfernen.

3. Multi-Lemma-Suche

Die Multi-Lemma-Suche ist das Kernstück des Playgrounds. Sie öffnet einen Dialog, in den Sie mehrere Lemmata eingeben – als Wort oder als Lemma-ID.

Lemmata eingeben

Getrennt durch Komma oder Plus-Zeichen, zum Beispiel: brôt, wîn oder 879 + 7532. Auch ein einzelnes Lemma ist erlaubt. Jedes eingegebene Lemma erscheint als entfernbarer Chip – so sehen Sie sofort, was die Suche berücksichtigt.

Die dreistufige Variantenauflösung aus der Korpussuche gilt auch hier: exakter Treffer im Wörterbuch, dann Prüfung gegen 234.244 orthographische Varianten, dann Teiltreffer als Fallback. Sonderzeichen (â, ê, î, ô, û, ä, ö, ü) werden automatisch normalisiert.

Suchmodus wählen

Nähe-Analyse Empfohlen

Findet Belegstellen, an denen die gesuchten Lemmata innerhalb eines einstellbaren Wortabstands zusammen vorkommen – eine Kookkurrenz (zwei oder mehr Lemmata, die im Text in geringem Abstand zusammenstehen). Der Standardwert von 10 Wörtern hat sich bewährt; einstellbar von 1 bis 50. Ideal für Fragen wie: „In welchen Passagen stehen minne und herze eng zusammen?"

Dokument-Suche

Listet alle Texte auf, die sämtliche angegebenen Lemmata irgendwo enthalten – unabhängig vom Abstand. Ideal für Fragen wie: „Welche Texte behandeln sowohl triuwe als auch zwîvel?" Das Ergebnis ist dokumentbasiert, nicht stellenbasiert.

Ergebnisse und Farbcodierung

Jedes Lemma bekommt eine eigene Farbe. In der Trefferliste sehen Sie die Belegstelle mit Kontext und farblich hervorgehobenen Lemmata. Ein Klick auf einen Treffer öffnet die Leseansicht der Hauptseite mit allen Lemmata in denselben Farben und springt direkt zur Fundstelle.

4. Lemmasuche nach Versposition

Findet ein einzelnes Lemma, das genau am Versanfang oder Versende steht. Eine direkte Antwort auf mediävistische Fragen wie: „Wie oft reimt Wolfram auf minne?" oder „Welche Wörter dominieren das Versende im Parzival?"

Wie es funktioniert

Lemma eingeben (Wort wie minne oder Lemma-ID).
Position wählen: Versanfang oder Versende (Default: Versende, weil der Reim-Use-Case häufiger ist).
Auf Suchen klicken.
Die Trefferliste zeigt jeden Text mit den Treffern an der gewählten Position, daneben den Anteil an allen Vorkommen im Text (z.B. „54%" heißt: jedes zweite Vorkommen des Lemmas im Text steht am Versende).

Was die Position bedeutet

Die Funktion arbeitet auf der <l>-Auszeichnung des TEI-Korpus, also auf jeder vom Editions-Layout vorgegebenen Verszeile. „Versanfang" ist das erste annotierte Wort einer <l>, „Versende" das letzte. Wortpositionen außerhalb von <l> (etwa in Kapitelüberschriften, Marginalia oder Notizen) gelten weder als Anfang noch als Ende.

Anwendungsbereich: Die Funktion wirkt nur in Versdichtung (603 von 667 Texten, rund 90 % des Korpus). Prosa-Texte ohne <l>-Auszeichnung werden automatisch übersprungen und tauchen in den Ergebnissen nicht auf.

Beispiel: Reimpaare in AGS

Eine Stichprobe der ersten zehn Versenden in der Spruchsammlung AGS zeigt klare AABB-Reimpaare: gân / begân, bant / bekant, mûzære / gewære, rote / nota, jâr / hâr. Wer Reimwort-Vorkommen sucht, kommt auf diesem Weg direkt zu den Belegstellen.

Die Position-Spalte in den Ergebnissen ist auch ein Indikator für reimgetriebene Wortwahl: ein Lemma mit hohem Versende-Anteil (60 %+) steht überwiegend am Reim, eines mit niedrigem Anteil (unter 10 %) ist eher semantisch motiviert positioniert.

5. Weitere TEI-Analyse-Werkzeuge

Neben der Multi-Lemma-Suche und der Lemmasuche nach Versposition bietet der Bereich TEI-Textanalyse sieben weitere Werkzeuge über dem vorgeladenen Korpus. Alle rechnen vollständig im Browser auf den vorgebauten Indexen; wo es sinnvoll ist, führt ein Klick auf ein Ergebnis direkt in die Leseansicht.

Wortfrequenz-Analyse

Listet die häufigsten Lemmata über das gesamte Korpus oder einen einzelnen Text (Top-N). Ein POS-basierter Stoppwort-Filter entfernt häufige Funktionswörter (Artikel, Pronomen, Präpositionen, Konjunktionen) und hebt inhaltstragende Lemmata hervor. Die Tabelle zeigt je Lemma die absolute und die relative Frequenz (pro 1.000 Tokens); sortiert wird wahlweise nach der absoluten oder der relativen Frequenz.

Text-Statistiken

Pro Text: Token-Zahl, Lemma-Diversität (verschiedene Lemmata zur Gesamtzahl), Hapax-Rate und durchschnittliche Lemma-Frequenz, als sortierbare Korpus-Tabelle. Hohe Lemma-Diversität bei knappem Text ist ein Indikator für lexikalischen Reichtum. Über Checkboxen lässt sich ein Subset bilden („Nur Auswahl anzeigen"); die Auswahl übersteht das Sortieren.

Lemma-Verteilung

Zeigt ein einzelnes Lemma als Balkendiagramm über alle Texte: die Top-N als Balken, der Rest als aufklappbare Tabelle. Wahlweise absolut oder relativ (pro 1000 Tokens). Ein Klick auf einen Balken oder eine Sigle öffnet die Leseansicht mit Highlighting.

Begriffs-Verteilung

Wie die Lemma-Verteilung, aber begriffsbasiert: Sie geben einen Begriff ein (deutsch, englisch oder als concept_-ID) und sehen das Balkendiagramm über alle Texte. Aggregiert werden alle Lemmata, deren Bedeutungen dem Begriff zugeordnet sind (Datenpfad Begriff → Bedeutungen → Lemmata → Texte). Ein Autocomplete schlägt passende Begriffe vor, alternative Kandidaten werden angezeigt (etwa bei „love" → Intimität und Liebe/Zuneigung); eine aufklappbare Liste der zugeordneten Lemmata erlaubt die Validierung der Auswahl.

Textvergleich

Vergleicht zwei über Dropdown gewählte Texte und berechnet drei Lemma-Mengen: nur in A, in beiden, nur in B – je mit Frequenz in A, Frequenz in B und der absoluten Differenz. Sortier- und filterbar, mit A↔B-Swap für die gespiegelte Perspektive. Nützlich für Fragen wie „Welche Lemmata teilt der Parzival mit dem Jüngeren Titurel?" oder zur Suche nach geteilten seltenen Lemmata als Lehnvers-Indiz. Ein Klick auf eine Frequenz-Zahl öffnet den jeweiligen Text in der Leseansicht.

Kookkurrenz-Ranking

Beantwortet die Frage „Welche Lemmata stehen am häufigsten bei X?". Sie geben ein einzelnes Lemma ein und erhalten eine rangierte Tabelle der häufigsten Nachbar-Lemmata innerhalb eines Kontextfensters (±3 bis ±25 Wörter, Standard ±10). Der POS-Filter steht standardmäßig auf Inhaltswörtern (Nomen, Verben, Adjektive, Adverbien), damit Funktionswörter die Liste nicht dominieren; alternativ nur Nomen, nur Verben, nur Adjektive oder alle. Ein Klick auf ein Partner-Lemma öffnet dessen Lemma-Seite; über den separaten Link „→ Belege" je Zeile landen beide Lemmata im Nähe-Modus der Multi-Lemma-Suche.

Kookkurrenz-Ranking vs. Nähe-Analyse: Beide drehen sich um Wortumgebungen, beantworten aber verschiedene Fragen. Das Kookkurrenz-Ranking geht von einem einzigen Lemma aus und rankt ungerichtet, welche anderen Lemmata in seiner Umgebung am häufigsten auftauchen – es entdeckt die Partner für Sie. Die Nähe-Analyse der Multi-Lemma-Suche (Abschnitt 3) setzt dagegen voraus, dass Sie die Lemmata bereits kennen, und prüft nur, an welchen Stellen sie nah zusammenstehen.

Erweiterte Figurenbezeichnungen Beta

Kuratierte Bezeichnungspraktiken jenseits des Eigennamens für vier Werke (Eneasroman, Iwein, Rolandslied, Trojanerkrieg) aus Linda Beutel-Thurows Dissertationsprojekt Naming-analysis. Pro Figur sind die Terme in drei Kategorien gegliedert: Eigennamen, Antonomasien („der rîter" für Iwein) und Epitheta („der küene"), je mit Häufigkeit und aufklappbaren Belegstellen samt Versangabe und Sprecher (Erzähler, Figurenrede oder Selbstnennung). Für Rolandslied und Trojanerkrieg verlinken die Versangaben direkt in die Leseansicht. Die Daten sind mit sichtbarer Attribution und DOI eingebunden.

6. Typische Forschungsfragen

Damit die abstrakten Modi greifbarer werden: vier Fragen, die häufig an die MHDBDB gestellt werden, und wie Sie sie im Playground bearbeiten.

Kookkurrenz-Analyse

„In welchen Passagen stehen minne und herze eng zusammen?"

Multi-Lemma-Suche · Nähe-Analyse · Abstand 10 Wörter · minne, herze. Die Trefferliste zeigt jede Belegstelle mit Kontext, Farbcodierung pro Lemma.

Thematische Kopräsenz auf Dokumentebene

„Welche Texte behandeln sowohl triuwe als auch zwîvel?"

Multi-Lemma-Suche · Dokument-Suche · triuwe, zwîvel. Das Ergebnis listet die Werke auf, in denen beide Lemmata vorkommen – egal wo.

Begriffsnetzwerk erkunden

„Welche Lemmata fallen unter den Begriff Tugend?"

Authority-Ansicht Begriffe · nach Tugend suchen · im Detaileintrag stehen alle Lemmata, die der Begriffstaxonomie nach darunter fallen. Von dort können Sie direkt in die Korpussuche springen.

Gattungsbasierte Korpusselektion

„Welche Werke sind der Gattung Sangspruch zugeordnet?"

Authority-Ansicht Gattungen · nach Sangspruch suchen · die Werkliste im Detaileintrag zeigt alle zugeordneten Texte. Diese Auswahl können Sie als Ausgangspunkt für eine gefilterte Multi-Lemma-Suche übernehmen.

7. Authority Files im Einsatz

Sechs Authority-Ansichten öffnen je einen Einstiegspunkt in die kontrollierten Vokabulare. Hier steht, wann welche Ansicht nützlich ist. Die technische Beschreibung der Dateien (Größe, Struktur, Provenienz) steht unter Daten → Acht Authority Files.

Autor*innen – Einstieg, wenn Sie bei einer Person beginnen: „Welche Werke sind Walther von der Vogelweide zugeschrieben?" Von dort öffnen Sie jedes Werk direkt im Reading View.
Werke – Einstieg, wenn Sie bei einem Text beginnen: Sigle, Autor*in, Editionen und Handschriftenzeugen im Überblick. Nützlich, um mehrere Editionen eines Werks zu vergleichen.
Lemmata – Einstieg, wenn Sie ein Wort nachschlagen wollen, bevor Sie suchen: Wortart, Bedeutungen und Belegzahl auf einen Blick.
Begriffe – Einstieg für semantische Recherche: von einem Konzept (z.B. Tugend) zu allen zugeordneten Lemmata absteigen.
Gattungen – Einstieg für gattungsbasierte Korpusselektion.
Namen – Einstieg für onomastische Fragen: Eigennamen mit semantischen Relationen.

Tipp: Die Authority-Ansichten arbeiten unabhängig von der Texteauswahl links. Sie können also den gesamten Namensraum durchsuchen, selbst wenn Sie die spätere TEI-Analyse auf wenige Texte einschränken wollen.

8. Vom Playground in die Leseansicht

Der typische Forschungsworkflow verbindet Playground und Korpussuche:

Im Playground eine Multi-Lemma-Suche starten.
Eine interessante Kookkurrenz in der Trefferliste auswählen.
Klick auf das Ergebnis – die Korpussuche öffnet sich in einem neuen Tab.
Der Text ist geladen, alle Lemmata sind farblich hervorgehoben, die Ansicht scrollt automatisch zur Fundstelle.
Im Reading View weiterlesen, zwischen Belegen springen, Metadaten aufklappen.

So bleiben Analyse und Lektüre getrennt: der Playground liefert die Korpusstatistik, die Korpussuche den Volltext im Kontext.