Naval Kishore Press – digital: Digitalisierung und Texterkennung bei Devanagari-Drucken

Der 1858 in der nordindischen Stadt Lakhnau gegründete Verlag Naval Kishore Press (NKP) entwickelte sich in den ca. hundert Jahren seines Bestehens zu einem der bedeutendsten Verlagsunternehmen Indiens. Zu Lebzeiten des Gründers Munshi Naval Kishore (1836-1895) veröffentlichte der Verlag geschätzte 5.000 Titel in den Sprachen Hindi, Sanskrit, Urdu, Arabisch, Persisch und Englisch. Inhaltlich deckte das Verlagsportfolio eine große Bandbreite ab – Schulbücher, Ratgeber, Texte der klassischen Sanskrit-Literatur, Literatur zum Islam, Koran-Ausgaben und Übersetzungen englischer Klassiker, wie z.B. die Dramen William Shakespeares, wurden publiziert. Die CATS Bibliothek / Abteilung Südasien der Universität Heidelberg besitzt mit ca. 2.000 Titeln der Naval Kishore Press einen repräsentativen Querschnitt der Veröffentlichungen dieses bedeutenden Verlagshauses.

Um diesen Schatz für Wissenschaftlerinnen und Wissenschaftler sichtbarer – und vor allem besser nutzbar – zu machen, wurde im Rahmen des FID Asien das Teilprojekt Naval Kishore Press – digital initiiert. Ausgewählte Hindi- und Sanskrit-Titel in Devanagari-Schrift aus der NKP Sammlung werden im Digitalisierungszentrum der UB Heidelberg digitalisiert. Aus diesen Bildfaksimiles werden unter Einsatz der Plattform Transkribus editierbare Volltextversionen erstellt. Die HTR Engine von Transkribus basiert auf künstlicher Intelligenz und wird folgendermaßen angewendet: Zunächst werden von ca. 200 Seiten des zu erkennenden Materials „Ground Truth“ (GT) Transkriptionen erstellt. Dabei handelt es sich um manuell transkribierte 1:1 Wiedergaben des Textes auf dem Bildfaksimile. Die GT und die Bildfaksimile werden verwendet um ein Datenmodell zu trainieren, dessen HTR Algorithmen auf künstlichen neuronalen Netzen basieren und mit dem nun weitere Devanagari-Text automatisch transkribiert werden können. Mit einer Character Error Rate (CER) von 2-5% beim Validierungssatz liefern die beiden trainierten Datenmodelle bereits hervorragende Ergebnisse.

Weiterlesen

Neues Themenportal zur “Bibliothek Otsuka”

Soeben wurde ein weiteres Themenportal auf unserer Webseite CrossAsia freigeschaltet. Auf diesem wird die so genannte “Bibliothek Otsuka“ vorgestellt. Der Marxist und Dichter Ōtsuka Kinnosuke (1892-1977) überließ die Sammlung der damaligen Deutschen Staatsbibliothek (heute wiedervereinigt mit der Staatsbibliothek zu Berlin-PK) in Ost-Berlin in Form von sechs Schenkungen zwischen den Jahren 1962 und 1986. Die letzte Schenkung erfolgte posthum durch seine Witwe. Das Portal informiert über Leben und Werk von Ōtsuka Kinnosuke, über den nicht ganz einfachen Weg, den die Schenkungen von Japan bis in die DDR genommen haben sowie über die Sammlungsinhalte.

Neues Themenportal in CrossAsia

Jüngst haben wir erneut ein Themenportal auf unseren CrossAsia-Seiten online gestellt. Es stellt das Berlin-Kraków Projekt vor, das durch die Bewilligung von Mitteln durch den Beauftragten der Bundesregierung für Kultur und Medien (BKM) und eine Kooperation mit der Biblioteka Jagiellońska in Kraków, Polen, ermöglicht worden ist und durch welches die Staatsbibliothek zu Berlin dem Ziel einer virtuellen Rekonstruktion der alten Ostasiensammlung der Preußischen Staatsbibliothek entscheidend nähergekommen ist. Das Portal informiert über die Geschichte der Sammlung, heute in Kraków lagernde Signaturengruppen bzw. Sammlungsteile und zeigt Wege zum Auffinden dieser in unseren Katalogen bzw. der Digitalen Bibliothek der Staatsbibliothek.

Neues Themenportal in CrossAsia

Jüngst haben wir erneut ein Themenportal auf unseren CrossAsia-Seiten online gestellt. Es handelt sich um das Themenportal Fung Asseng and Fung Ahok, in dem die Lebensläufte der möglicherweise ersten Chinesen, die je nach Deutschland gekommen sind, ihre Übersetzungen von Luthertexten, Nachfahren des ersteren sowie weiterführende Literatur zu beiden vorgestellt werden. Wir wünschen viel Spaß bei der Lektüre.

Weitere Themenportale folgen in Kürze.

Zwei neue Themenportale in CrossAsia

Kürzlich haben wir zwei neue Themenportale auf unseren CrossAsia Seiten online gestellt. Damit gibt es hier mittlerweile sechs solcher Portale. Das Format Themenportal beabsichtigt, Ihnen besondere Sammlungen innerhalb unserer Bestände näher zu bringen und über die jeweiligen Recherchewege zu diesen bzw. die Nutzungsmöglichkeiten derselben zu informieren. Die beiden jüngsten sind nun:

Chinese Medical Manuscripts. The Unschuld Collection at the Berlin State Library, in dem die im Jahr 2012 von der Staatsbibliothek Berlin erworbene und im Jahr 2016 um weitere Stücke ergänzte Sammlung medizinischer Handschriften, die Sammlung Unschuld, beschrieben wird. Die Sammlung umfasst 977 Handschriften zu medizinischen Themen, die über einen Zeitraum von vier Jahrzehnten durch den renommierten Medizinhistoriker Prof. Paul U. Unschuld zusammengetragen wurden. Als Experte für die Geschichte chinesischer Medizin und Pharmakologie sammelte Unschuld bereits früh die häufig übersehenen Manuskripte, die nicht in Antiquariaten oder Buchläden, sondern auf Straßenflohmärkten angeboten wurden. Seine Sammlung erlaubt einen einzigartigen Einblick in die Praxis chinesischer Heiler, Ärzte, Apotheker und Laien. Nahezu 400 Titel wurden digitalisiert und können in den Digitalen Sammlungen der Staatsbibliothek eingesehen werden.

sowie

Chagatai Manuscripts (The Hartmann Collection) , das die Sammlung tschagataischer Handschriften in der Staatsbibliothek vorstellt. Mit 191 Dokumenten ist sie eine der größten und wichtigsten in Europa. 131 von ihnen gehören zur Sammlung Hartmann, die zwischen 1902 und 1904 vom ersten modernen Islamwissenschaftler Deutschlands, Martin Hartmann (1851-1918), im damaligen Turkistan (dem heutigen Xinjiang) erworben und 1905 von der Staatsbibliothek angekauft wurde. Neben Texten zu literarischen, religiösen, geschichtlichen und hagiographischen Themen befinden sich darunter auch neun Risāles: Verhaltensregeln für einzelne soziale Gruppen, die einen detaillierten Einblick in die gesellschaftlichen Strukturen Zentralasiens im 19. Jahrhundert ermöglichen. Insgesamt 27 Handschriften aus der Sammlung Hartmann sind bis jetzt digitalisiert und können über die Datenbank Orient Digital erkundet werden.

Vier weitere Themenportale (Reisen im Südwesten Chinas, 1899-1917. Der Nachlass Fritz und Hedwig Weiss – in Memoriam Tamara Wyss, eine Online-Ausstellung mit Fotografien aus dem Nachlass der Eheleute Fritz und Hedwig Weiss, Odisha Bibliographie, eine Bibliographie mit einem gezielten, themenfokussierten Nachweis von Forschungsliteratur über die Geschichte, Kultur, Religion und Politik des indischen Bundesstaates Odisha/Orissa, Naval Kishore Press, eine Sammlung ausgewählter digitalisierter, editierbarer Volltextversionen in Devanāgarī und Transliteration von Hindi- und Sanskrit-Werken der NKP Sammlung sowie Japans Studierende in Deutschland, ein Online-Lexikon mit Informationen zu 2.700 japanischen Studierenden, die nach der Öffnung Japans im Zuge der Modernisierung  zu Studienzwecken nach Deutschland gekommen sind) finden Sie hier. Weitere Themenportale sind im Entstehen bzw. in Planung und folgen in Kürze.