TEI-kodiertes Korpus mittelhochdeutscher Literatur mit semantischen Annotationen
Die Mittelhochdeutsche Begriffsdatenbank (MHDBDB) ist eine Forschungsinfrastruktur der Universität Salzburg für die digitale Erschließung mittelhochdeutscher Literatur. Das Projekt kombiniert TEI-Kodierung mit semantischen Annotationen zur systematischen Analyse mittelalterlicher Texte.
666 TEI-kodierte mittelhochdeutsche Texte mit Word-Level-Annotationen, verknüpft mit kontrollierten Vokabularen für Autoren, Werke, Lemmata, Konzepte, Gattungen und Namen.
Jedes Wort ist mit lemmatischen und semantischen Informationen annotiert, die auf Authority Files basieren und komplexe linguistische und konzeptuelle Analysen ermöglichen.
Der Playground bietet eine interaktive Web-Oberfläche zur Exploration des TEI-Korpus mit 11 spezialisierten Suchfunktionen.
Alle Suchfunktionen unterstützen automatische Normalisierung mittelhochdeutscher Zeichen:
Dieses Projekt wird mit Promptotyping entwickelt, einer iterativen Context-Engineering-Methode für die datengetriebene Entwicklung von Forschungsartefakten mit Frontier-LLMs.
Alle Promptotyping-Documents und technischen Dokumente auf GitHub:
Anleitung zur Nutzung von Korpus-Suche und Playground:
Webansicht in Vorbereitung
Mittelhochdeutsche Begriffsdatenbank (MHDBDB)
Fachbereich Germanistik
E-Mail:
mhdbdb@plus.ac.at
Web:
mhdbdb.plus.ac.at
Dieses Projekt steht unter der CC BY-NC-SA 3.0 AT Lizenz.
Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Austria
Gefördert durch CLARIAH-AT im Rahmen der österreichischen Forschungsinfrastruktur für Digital Humanities.