TEI-kodiertes Korpus mittelhochdeutscher Literatur mit semantischen Annotationen
Die Mittelhochdeutsche Begriffsdatenbank (MHDBDB) ist eine Forschungsinfrastruktur der Universität Salzburg für die digitale Erschließung mittelhochdeutscher Literatur. Das Projekt kombiniert TEI-Kodierung mit semantischen Annotationen zur systematischen Analyse mittelalterlicher Texte.
666 TEI-kodierte mittelhochdeutsche Texte mit Word-Level-Annotationen, verknüpft mit kontrollierten Vokabularen für Autor*innen, Werke, Lemmata, Begriffe, Gattungen und Namen.
Jedes Wort ist mit lemmatischen und semantischen Informationen annotiert, die auf Authority Files basieren und komplexe linguistische und konzeptuelle Analysen ermöglichen.
Der Playground bietet eine interaktive Web-Oberfläche zur Exploration des TEI-Korpus mit 11 spezialisierten Suchfunktionen.
Alle Suchfunktionen unterstützen automatische Normalisierung mittelhochdeutscher Zeichen:
Dieses Projekt wird mit Promptotyping entwickelt, einer iterativen Context-Engineering-Methode für die datengetriebene Entwicklung von Forschungsartefakten mit Frontier-LLMs.
Alle Promptotyping-Documents und technischen Dokumente auf GitHub:
Anleitung zur Nutzung von Korpus-Suche und Playground:
Webansicht in Vorbereitung
Mittelhochdeutsche Begriffsdatenbank (MHDBDB)
Fachbereich Germanistik
E-Mail:
mhdbdb@plus.ac.at
Web:
mhdbdb.plus.ac.at
Dieses Projekt steht unter der CC BY-NC-SA 4.0 Lizenz.
Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Austria
Gefördert durch CLARIAH-AT im Rahmen der österreichischen Forschungsinfrastruktur für Digital Humanities.