Das Korpus umfasst eine annotierte Sammlung der ältesten deutschen Sprachdenkmäler.
Mit der Initiative „Deutsch Diachron Digital“ wurde über viele Jahre das Ziel verfolgt, für die Erforschung der Sprachgeschichte des Deutschen tiefenannotierte Korpora auf der Höhe der technologischen Entwicklung zu erstellen. Sie sollten die empirische Grundlage der sprachhistorischen Forschung verbreitern und kostenfrei öffentlich verfügbar sein. Angesichts der Spezifika der zu annotierenden Sprachstufen und der Menge zu annotierender Daten wurde dann die Korpuserstellung nach Sprachstufen getrennt in eigenständigen Projekten verwirklicht, so dass heute ein Verbund aus mehreren Referenzkorpora existiert:
Referenzkorpus Altdeutsch (Berlin, Frankfurt, Jena) – Referenzkorpus Mittelhochdeutsch (Bonn, Bochum) – Referenzkorpus Frühneuhochdeutsch (Bochum, Halle, Potsdam) – Referenzkorpus Mittelniederdeutsch/Niederrheinisch (Hamburg, Münster) – Referenzkorpus Deutscher Inschriften (Bochum, Mainz).
Eine Fortführung der Verbundideen in einem Referenzkorpus des Neuhochdeutschen ist nun auch durch das Projekt GiesKaNe gegeben.
Die Korpora sind in ihrer Entstehungsgeschichte eng verbunden, verfolgen in der Korpuskonzeption, den Annotationsmodellen sowie den Abfrage- und Visualisierungsmöglichkeiten gemeinsame Ziele. Sie sind aber auch in ihren Nutzungsszenarien sowie ihren Entwicklungsperspektiven verbunden und stehen weiterhin in enger Kooperation.
Die Erarbeitung des ‚Referenzkorpus Altdeutsch (750‑1050)‘ wurde von 2008 bis 2015 durch die Deutsche Forschungsgemeinschaft gefördert. Die Projektarbeit erfolgte in Berlin, Frankfurt und Jena.
Seit der Veröffentlichung der ersten vollständigen Version ‚v1.0‘ steht das Referenzkorpus Altdeutsch kostenfrei, ohne Anmeldung und browserbasiert für weiterführende Forschungsprogramme zur Verfügung. Es enthält eine auf Vollständigkeit bedachte annotierte Sammlung der ältesten deutschen Sprachdenkmäler vom Beginn der kontinuierlichen schriftlichen Überlieferung um 750 bis etwa 1050 mit einem Umfang von ca. einer halben Million Textwörtern.
Nach dem Auslaufen des DFG-geförderten Projekts wird das Korpus an der Humboldt-Universität zu Berlin und bis 2020 an der Goethe-Universität Frankfurt am Main aus Bordmitteln weiterentwickelt und betrieben mit dem Ziel, die Forschungsressource entlang aktueller sprachhistorischer und korpuslinguistischer Entwicklungen zu erweitern und ihren nachhaltigen Einsatz sicherzustellen.
https://www.deutschdiachrondigital.de/projekt/
Gegenwärtig erarbeiten wir die strategischen Entwicklungspläne ‚Plan 2.0′ (u.a. Alignierung der althochdeutsch-lateinischen Paralleltexte) sowie ‚Plan 3.0‘ (u.a. syntaktische Annotation jenseits der Satzspannen) und greifen dabei auch auf die Koordination mit den Korpora und den korpuslinguistischen Partnern der DDD-Initiative zurück.
Zum Entwicklungskonzept gehören auch neue Anwendungsszenarien für die umfänglichen Daten des Referenzkorpus. Mit der Erstellung des ‚Lesekorpus Altdeutsch‘ am Standort Frankfurt am Main wurde zum Beispiel die philologisch orientierte Nutzung der Korpusdaten verbessert und beim Lehrstuhlprojekt der ‚Chronografischen Karten‘ in Berlin stehen Visualisierungs- und Unterrichtskonzepte für sprachhistorische Variationsdaten im Vordergrund.
Im Blog werden interessante Funde vorgestellt, und auch auf Twitter ist das Team vertreten: @altdeutsch.