Lade Statistiken...

Initialisiere Datenbank...

MHDBDB Logo

TEI-kodiertes Korpus mittelhochdeutscher Literatur mit semantischen Annotationen

Über das Projekt

Projektziel

Die Mittelhochdeutsche Begriffsdatenbank (MHDBDB) ist eine Forschungsinfrastruktur der Universität Salzburg für die digitale Erschließung mittelhochdeutscher Literatur. Das Projekt kombiniert TEI-Kodierung mit semantischen Annotationen zur systematischen Analyse mittelalterlicher Texte.

TEI-Korpus

666 TEI-kodierte mittelhochdeutsche Texte mit Word-Level-Annotationen, verknüpft mit kontrollierten Vokabularen für Autoren, Werke, Lemmata, Konzepte, Gattungen und Namen.

Semantic Annotations

Jedes Wort ist mit lemmatischen und semantischen Informationen annotiert, die auf Authority Files basieren und komplexe linguistische und konzeptuelle Analysen ermöglichen.

Korpus-Übersicht

666
TEI-Texte
7
Authority Files
39,436
Lemmata
192,674
Orthographic Variants

Authority Files

  • persons.xml (0.12 MB) - Autoren und historische Personen
  • works.xml (1.41 MB) - Werk- und Handschriftenmetadaten
  • lexicon.xml (32.59 MB) - Wörterbuch mit grammatischen Annotationen
  • concepts.xml (0.21 MB) - Semantische Konzepttaxonomie
  • genres.xml (0.4 MB) - Literarische Gattungsklassifikation
  • names.xml (0.03 MB) - Eigennamen mit semantischen Relationen
  • variants.xml (12.46 MB) - Orthographische Varianten aus TEI-Korpus

MHDBDB Playground

Der Playground bietet eine interaktive Web-Oberfläche zur Exploration des TEI-Korpus mit 11 spezialisierten Suchfunktionen.

Authority Files Exploration

  • • Autoren durchsuchen
  • • Werke anzeigen
  • • Lemmata-Suche
  • • Konzepte erkunden
  • • Gattungen filtern
  • • Namen-Datenbank

TEI Text Analysis

  • • Einzelne Lemma-Suche
  • • Multi-Lemma-Suche (Absatz)
  • • Multi-Lemma-Suche (Dokument)
  • • Kookkurrenz-Analyse (Nähe)
  • • XPath-Queries

MHG Character Normalization

Alle Suchfunktionen unterstützen automatische Normalisierung mittelhochdeutscher Zeichen:

  • • Langvokale: â→a, ê→e, î→i, ô→o, û→u
  • • Umlaute: ä→ae, ö→oe, ü→ue
  • • Ligaturen: æ→ae, œ→oe

Dokumentation

Technische Dokumentation

TEI Guidelines

Alle TEI-Dateien folgen den TEI P5-Richtlinien mit MHDBDB-spezifischen Annotationen:

  • • TEI-Namespace: http://www.tei-c.org/ns/1.0
  • • Encoding: UTF-8
  • • Cross-References via xml:id
  • • Semantic Annotations via @ana
  • • Lemma Attributes via @lemma

Testing & Development

  • Testing Framework: Playwright
  • Dev Server: npm run serve
  • Test Suite: npm test
  • Test Report: npm run report

Kontakt & Lizenz

Universität Salzburg

Mittelhochdeutsche Begriffsdatenbank (MHDBDB)
Fachbereich Germanistik

E-Mail: mhdbdb@plus.ac.at
Web: mhdbdb.plus.ac.at

Lizenz

Dieses Projekt steht unter der CC BY-NC-SA 3.0 AT Lizenz.

Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Austria

Förderung

CLARIAH-AT

Gefördert durch CLARIAH-AT im Rahmen der österreichischen Forschungsinfrastruktur für Digital Humanities.