Förderung Geförderte Vorhaben Altlitauisch Digital: Corpus des Kristijonas Donelaitis (1714-1780) [Akronym: CorDon]

Altlitauisch Digital: Corpus des Kristijonas Donelaitis (1714-1780) [Akronym: CorDon]

Den Zeitraum der als Altlitauisch bezeichneten Sprachstufe markieren aus konventioneller Sicht der älteste bislang bekannte handschriftliche Text der sogenannten „Dzūkischen Gebete“ um 1520 als Anfangspunkt und die Grammatik von Christian Gottlieb Mielcke (1732–1807) von 1800 (Königsberg) als Endpunkt.

Das vollständige Textkorpus des Altlitauischen besteht dabei aus unterschiedlichen Texttypen, -sorten und -gattungen (religiöse und weltliche Texte, Prosa und Dichtung, über­setzte, original verfasste und kompilierte Texte, Hand­schriften und Drucke), mit einem Umfang von insgesamt ca. zehn Millionen Textwörtern. Autochthone Texte sind aller­dings in der Minderzahl. Der umfangreichste autoch­thone Text ist der vierzeilig verfasste Zyklus „Metai“ („Jahreszeiten“) und ein früherer Teil des Zyklus „Pričkaus pasaka apie lietuviška“ („Fritzchens Erzählung von der litauischen Hochzeit“) vom litauischen National­dichter Kristijonas Donelaitis. Von ihm stammen auch sechs Fabeln, wodurch das gesamte Donelaitis-Korpus aus ca. 160.000 Textwörtern besteht. Donelaitis gilt nicht nur als Begründer des litauischen Hexameters und der Gattung Fabel in der litauischen Literatur, seine Sprache hat auch eine entscheidende Wirkung auf die weitere Standardisierung des Litauischen im 19. und 20. Jahrhundert ausgeübt.

Für Prof. Gelumbeckaitė und Dr. Hoenen stellt nun die digitale Erschließung und texttechnologische Aufbereitung der Donelaitis-Texte als eines überschaubaren Teilkorpus des Altlitaui­schen einen wesentlichen Schritt zur Verwirklichung der zwei größten Desiderata der linguistischen Forschung zum Altlitauischen dar und soll dazu beitragen, das phi­lologische, deskriptiv linguistische, sprachhistorische und texttechnologische Fachwissen im Bereich der Baltistik umzusetzen. So ist die Vielfalt des Altlitauischen mit seinen drei Sprachvarianten (der westlichen sog. „preu­ßischen“, der mittleren sog. „žemaitischen“ und der öst­lichen sog. „litauischen“), die verschiedene phonographi­sche sowie diverse akzentographische Systeme aufwei­sen, nur eine Ursache dafür, warum bislang weder ein histori­sches Wörterbuch noch eine Grammatik des Altlitaui­schen entstanden ist; das Fehlen eines Korpus als em­pirische Forschungsgrundlage stellt einen weiteren Grund dar.

Das Ziel des Projekts ist daher, ein tiefenan­notiertes Korpus der gesamten litauischen Texte von Donelaitis zu erarbeiten, das mit einer wechselseitigen Alignie­rung versehen ist und entsprechende textologische, philologische und linguistische Abfrage- und Analysepro­zesse ermöglicht und eine benutzerfreundliche Such­oberfläche und Ausgabevisualisierung aufweist.

Das Korpus soll schließlich folgende metalinguistischen und linguistischen Informationen enthalten:

  • Sprach- und literaturhistorisch relevante Metain­formationen
  • Angaben zur Textstruktur: Wort-, Satz- und Versgrenzen, Zeilenumbrüche, Absätze usw.
  • Paläographische bzw. typographische und sons­tige textologische Merkmale
  • Lexikalische Angaben: Wiedergabe in standard­litauischer Schrift und der Wort­formen im Stan­dardlitauischen, Lemma­tisierung, Glossierungen
  • Grammatische Angabe: Wortarten, mophologi­sche bzw. morphosyntaktische Informationen.

Um die mannigfaltige und umfangreiche Materialmenge zu erfassen, wird die traditionelle philologische Forschung mit in­forma­ti­ons­technologischen Methoden verknüpft. Dabei wird der tra­ditio­nelle qualitativ-hermeneutische Ansatz um eine quanti­tative Analyse ergänzt. Damit übt das Projekt eine zentrale Relaisfunktion zwischen der hermeneu­tisch-sprachwissenschaftlichen Grundlagenforschung und den „Digital Humanities“ aus.