Die British Library beherbergt eine der größten Sammlungen arabischer Handschriften:
Our Arabic manuscripts date from the early 8th to the 19th century AD. They originate from a wide range of Arab countries, from Yemen to North Africa, and from other regions with Muslim communities including Iran, Central Asia, India, China, Indonesia, Malaysia, and West Africa, showing fascinating variations in style and script.
Viele Werke sind schon digitalisiert worden und online verfügbar.
Nun stellt sich die Frage, wie man sie durchsuchbar machen kann. Dafür müsste eine Texterkennung für die Digitalisate durchgeführt werden – ein Prozess, der für „sauber getippte“ Texte schon recht gut funktioniert, für Fraktur- oder gar Handschriften aber noch schwierig ist.
Daher führt die British Library zurzeit ein Projekt namens Automatic Transcription of Historical Handwritten Arabic Texts:
Through this project we aim to support continued research in this area by contributing an open image and ground truth dataset of historical handwritten Arabic texts, ensuring historical Arabic collections continue to benefit from state-of-the-art developments in handwritten text recognition (HTR).
Informationen zum Projekt finden Sie auf dieser Seite der BL sowie in diesem Beitrag zum Digital scholarship blog der BL.