TEI-kodiertes Korpus mittelhochdeutscher Literatur mit semantischen Annotationen
Neu hier? Quick-Start in 3 Schritten →
Die Mittelhochdeutsche Begriffsdatenbank (MHDBDB) ist eine Forschungsinfrastruktur der Universität Salzburg für die digitale Erschließung mittelhochdeutscher Literatur. Das Projekt kombiniert TEI-Kodierung mit semantischen Annotationen zur systematischen Analyse mittelalterlicher Texte.
667 TEI-kodierte mittelhochdeutsche Texte mit Word-Level-Annotationen, verknüpft mit kontrollierten Vokabularen für Autor*innen, Werke, Lemmata, Begriffe, Gattungen und Namen. Validiert gegen ein eigenes RELAX-NG-Schema (667/667 Korpus- und 8/8 Authority-Dateien, CI-geprüft).
Jedes Wort ist mit lemmatischen und semantischen Informationen annotiert, die auf Authority Files basieren und komplexe linguistische und konzeptuelle Analysen ermöglichen.
Volltextsuche mit Multi-Lemma-Highlight, Lese-Ansicht mit Wikidata-Verknüpfung sowie persistente, zitierfähige Lemma-Seiten mit Worterbuchnetz-aligned IDs.
Der Playground bietet eine interaktive Web-Oberfläche zur Exploration des TEI-Korpus mit 10 spezialisierten Suchfunktionen.
Alle Suchfunktionen unterstützen automatische Normalisierung mittelhochdeutscher Zeichen:
Dieses Projekt wird mit Promptotyping entwickelt, einer iterativen Context-Engineering-Methode für die datengetriebene Entwicklung von Forschungsartefakten mit Frontier-LLMs.
Technische Dokumentation auf GitHub:
Anleitungen zur Nutzung von Korpussuche, Playground und Datenstandards:
Mittelhochdeutsche Begriffsdatenbank (MHDBDB)
Fachbereich Germanistik
E-Mail:
mhdbdb@plus.ac.at
Web:
mhdbdb.plus.ac.at
Dieses Projekt steht unter der CC BY-NC-SA 4.0 Lizenz.
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International
Gefördert durch CLARIAH-AT im Rahmen der österreichischen Forschungsinfrastruktur für Digital Humanities.
Mittelhochdeutsche Begriffsdatenbank (MHDBDB). Universität Salzburg. Koordination: Katharina Zeppezauer-Wachauer. Seit 1992. URL: https://dhcraft.org/mhdbdb-tei-only/ (abgerufen am …)
Lizenz: CC BY-NC-SA 4.0. Versionsstände über die GitHub Releases.