CrossAsia Classroom: Nächster Digital Humanities Lunchtalk am 12. März

Wir möchten Sie herzlich zu einer neuen Veranstaltungsreihe innerhalb des CrossAsia Classrooms einladen: den Digital Humanities Lunchtalks. Ab nächster Woche wird es bis März 2024 einmal im Monat um 12 Uhr einen kurzen Impulsvortrag zu Themen der Digital Humanities geben, der ca. 30 Minuten dauern wird. Selbstverständlich wird es auch die Möglichkeit für Fragen und Diskussionen geben.

Die Veranstaltung findet online über WebEx statt, alle Termine der Digital Humanities Lunchtalks finden Sie auf der CrossAsia Classrooms Website.

Bitte geben Sie die Informationen auch gerne an interessierte Kolleg:innen weiter, wir freuen uns sehr auf eine rege Teilnahme.

 

Nächster Lunchtalk:

Digital Humanities Lunchtalk – Forschungsdaten
12.03.2024 | 12:00-12:30 Uhr | Duncan Paterson (SBB)
Duncan Paterson wird das Thema Forschungsdaten und deren Handhabung erläutern und insbesondere auf Publikationen und Beratung zum Datenmanagement eingehen.

CrossAsia ITR-Newspaper Explorer

The CrossAsia ITR-Newspaper Explorer is a new member of the ITR-Explorer family focusing on newspaper materials. Similar to ITR-Explorer, it provides CJK (Chinese, Japanese and Korean characters) mapping, phrase searching and result set manipulation (using ∩ (AND), U (OR) and – (AND NOT) operators) for users to build more complex search results sets (for more details, see our previous blog post https://blog.crossasia.org/neue-funktionen-im-crossasia-itr-explorer/). ITR’s Newspaper Explorer introduces a new heat map visualisation that makes full use of the fine-granular data nature of newspapers and provides a better way to observe time distribution at different scales, from decade, year, month to day level.

In this first release, the CrossAsia ITR-Newspaper Explorer offers a diverse collection of four newspaper sources in Traditional Chinese, Simplified Chinese, English and German. These four data sources cover a period from 1882 to 2012. As with other ITR family members such as CrossAsia Fulltext Search and ITR Explorer, CrossAsia ITR Newspaper Explorer is committed to continually integrating new data sources to ensure a constantly evolving and enriching user experience.

Currently included Newspaper Sources:

1882-1894 Neueste-Mittheilungen (13.855 articles) German
1832-1998 Historical Newspapers of China and South China Morning Post (10.450.568 articles) English
1902-1949 Ta-kung Pao -大公報 (2.912.830 articles) T. Chinese
1949-2009 People’s Daily -人民日报 (1.594.631 articles) S. Chinese

 

The Heat Map visualisation uses different colour depth (light to dark red) to show the result distribution in decade (the 1st row), year (the 2nd row) and month (the 3rd row). Each time block represents all articles published in that period (in terms of year, month and day). Selecting a time block will activate the alignment of all other time rows, moving the nearest time block to the beginning of each row (fig.1). The list of titles at the end of the page will adjust accordingly, showing all articles published in the selected time block including a link to call up the issue or article in the original platform (fig.2).

Please note that depending on your search term huge result sets are returned and loading might take some time.

Fig.1: Heatmap distribution for “Berlin OR 柏林” in all four newspaper ressources. In the “year row” 1933 has been selected, so the rows for month and day adjusted accordingly.


Fig.2: Disply of all articles within the selected time period that match the search criteria. The link in the last column needs an authentication as CrossAsia user and leeds to either the article or the issue with the respective article. If the material is open access, you can obtain it directly.

CrossAsia ITR-Zeitungsexplorer

Der CrossAsia ITR-Newspaper Explorer ist ein neues Mitglied der ITR-Explorer-Familie mit einem Schwerpunkt auf Zeitungsmaterialien. Ähnlich wie der ITR-Explorer bietet er ein CJK-Matching für chinesische, japanische und koreanische Schriftzeichen, Phrasensuche und die Möglichkeit zur Kombination von Ergebnismengen (unter Verwendung der Operatoren ∩ (AND), U (OR) und – (AND NOT)), damit Benutzer:innen ihre eigene, komplexere Suchergebnismengen erstellen können (weitere Einzelheiten finden Sie in einem früheren Blogbeitrag https://blog.crossasia.org/neue-funktionen-im-crossasia-itr-explorer/). Die neue Heatmap-Visualisierung des ITR Newspaper Explorers nutzt die Feingranularität von Zeitungsdaten, um die zeitliche Verteilung von Suchergebnissen auf verschiedenen Skalen zu ermöglichen, von Jahrzehnt, Jahr, Monat bis hin zur Tagesebene.

In dieser ersten Version bietet der CrossAsia ITR-Zeitungsexplorer eine vielfältige Sammlung aus vier Zeitungsquellen in Chinesisch (traditionelle und vereinfachte Schriftzeichen), Englisch und Deutsch an. Diese vier Datenquellen decken einen Zeitraum von 1882 bis 2012 ab. Wie bei den anderen ITR-Produkten wie der CrossAsia Volltextsuche und dem ITR Explorer ist auch der CrossAsia ITR-Zeitungsexplorer bestrebt, kontinuierlich neue zu integrieren, und so eine sich ständig weiterentwickelnde und bereichernde Nutzererfahrung zu gewährleisten.

Aktuelle Quellen im Zeitungsexplorer:

1882-1894 Neueste-Mittheilungen (13.855 Artikel) German
1832-1998 Historical Newspapers of China and South China Morning Post (10.450.568 Artikel) English
1902-1949 Ta-kung Pao -大公報 (2.912.830 Artikel) T. Chinese
1949-2012 People’s Daily -人民日报 (1.594.631 Artikel) S. Chinese

 

Die Heatmap-Visualisierung verwendet verschiedene Farbtiefen (Hell- bis Dunkelrot), um die Verteilung der Ergebnisse nach Jahrzehnt (1. Zeile), Jahr (2. Zeile) und Monat (3. Zeile) darzustellen. Jeder Zeitblock repräsentiert alle in diesem Zeitraum veröffentlichten Artikel (in Bezug auf Jahr, Monat und Datum). Durch Auswahl eines Zeitblocks wird die Ausrichtung aller anderen Zeitzeilen aktiviert, wobei der nächstgelegene Zeitblock den Anfang einer Zeile einnimmt (Abb.1). Auch die Titelliste am Ende der Seite passt sich an, um jeweils alle für die Suche relevanten Artikel aufzulisten, die in dem ausgewählten Zeitblock veröffentlicht wurden. Die jeweiligen Titel können über einen Link in der Plattform des Anbieters aufgerufen werden (Abb.2).

Bitte beachten Sie, dass – je nach Suchbegriff – sehr große Treffermengen geladen werden und dieser Vorgang u.U. etwas Zeit in Anspruch nimmt.

Abb.1: Heatmap-Verteilung für „Berlin OR 柏林“ in allen vier Zeitungsressourcen. In der „Jahreszeile“ wurde 1933 ausgewählt, so dass die Zeilen für Monat und Tag entsprechend angepasst wurden.


Abb.2: Anzeige aller Artikel innerhalb des gewählten Zeitraums, die den Suchkriterien entsprechen. Der Link in der letzten Spalte erfordert eine Authentifizierung als CrossAsia-Nutzer:in und führt entweder zum Artikel oder zur Ausgabe mit dem jeweiligen Artikel. Wenn es sich um Open Access-Materialien handelt, gelangen Sie direkt zu diesen.

Neues Themenportal in CrossAsia online: „Im Banne Chinas“ – Der Sinologe Wolfgang Franke als Forscher und Mittler

Soeben haben wir ein neues Themenportal online gestellt: „Im Banne Chinas“ – Der Sinologe Wolfgang Franke als Forscher und Mittler, verfasst von Antje Platzek (Berlin) und Stefan Messingschlager (Hamburg).

Wolfgang Franke (1912-2007) war von 1950 bis 1977 Ordinarius für Sinologie an der Universität Hamburg und hat in dieser Zeit dem dortigen Seminar für Sprache und Kultur Chinas zu weltweiter Ausstrahlung verholfen. Sein besonderer Verdienst ist es, sich als einer der ersten deutschen Sinologen bereits unmittelbar nach dem Zweiten Weltkrieg für eine verstärkte Beschäftigung mit dem zeitgenössischen China eingesetzt zu haben.

Auf Grundlage des in der Staatsbibliothek zu Berlin aufbewahrten wissenschaftlichen und jüngst eingetroffenen privaten Nachlasses von Wolfgang Franke wird im Themenportal ein vertiefter Einblick in sein Leben und Wirken vermittelt. Ein breites Spektrum von Aspekten wird in den Blick genommen, von seinem akademischen Werdegang, über seine Forschungstätigkeit und Reisen bis hin zu seiner Mittlerfunktion für den öffentlichen Diskurs. Es ermöglicht Einblicke in prägende Phasen und Bruchpunkte seiner Biografie und eröffnet damit zugleich die Sicht auf eng mit der Biografie verschränkte Problemstellungen, wie beispielsweise die Entwicklung der Sinologie in der Nachkriegszeit.

 

VDB-Online-Fortbildung für Fachreferent:innen und Bibliothekar:innen der Asienwissenschaften

Sehr geehrte Damen und Herren, liebe Kolleginnen und Kollegen,

morgen beginnt die VDB-Online-Fortbildung für Fachreferent:innen und Bibliothekar:innen der Asienwissenschaften!

Im Folgenden finden Sie wichtige Informationen zum Ablauf.

 

Veranstaltungstermine:

Tag 1: Donnerstag, 07. Dezember 2023, von 09:00 Uhr bis 15:30 Uhr

Tag 2: Freitag, 08. Dezember 2023, von 09:00 Uhr bis 14:15 Uhr

Durchführung online über WebEx.

 

Teilnahme:

Klicken Sie auf folgenden Link, um per WebEx teilzunehmen:

 

Veranstaltungsprogramm:

Programm Tag 1:

Donnerstag | 07.12.2023 | 08:50 – 15:30 Uhr

08:50 – 09:00 Ankommen im Raum  
09:00 – 10:00 FID Asien und CrossAsia:

Begrüßung und Organisatorisches (Dr. Nicole Terne, Dr. Benjamin Auberer)

Vorstellung FID Asien (Matthias Kaun)

Aktuelle Entwicklungen im Datenmanagement: Daten transformieren, sichern, nutzbar machen (Dr. Martina Siebert)

10:00 – 10:15 Kaffeepause
10:15 – 11:45 CrossAsia Services: 

Überblick über aktuelle CrossAsia/FID Asien Angebote (Dr. Nicole Terne)

Vorstellung aktueller Projekte:

Aktuelle Projekte im Zentralasien-Referat (Antje Ziemer)

Materialien der preußischen Turfan-Expedition als Quelle und Forschungsgegenstand (Dr. Aysima Mirsultan )

Xinjiang revisited: Rechtsdokumente aus der Sammlung Sugawara  (Dr. Aysima Mirsultan )

11:45 – 13:00 Mittagspause
13:00 – 14:00 Regionenvorstellung des FID Asien:

Unsere Regionen in Ost-, Südost- und Zentralasien stellen sich vor

14:00 – 14:15 Kaffeepause
14:15 – 15:15 Netzwerke – FIDs und NFDIs

Kurzvorstellung der Partner-FIDs und NFDIs (Dr. Nicole Terne, Dr. Benjamin Auberer)

Vortrag zu NFDI4Memory

15:15 – 15:30 Abschluss und Zusammenfassung Tag 1

Programm Tag 2:

Freitag | 08.12.2023 | 08:50 – 14:15 Uhr

08:50 – 09:00 Ankommen im Raum  
09:00 – 10:00 FID Asien – Digitale Angebote:

Forschungsdatenmanagement und Open Access Publikationen (Duncan Paterson)

Digital Humanities (Jing Hu)

10:00 – 10:15 Kaffeepause
10:15 – 11:15 Offene Austausch- und Vernetzungsrunde:

Die Teilnehmer:innen haben die Gelegenheit, sich vorzustellen und über ihre beruflichen Tätigkeiten und Aufgaben zu sprechen.

Dies soll dazu dienen, einen Einblick in die verschiedenen Arbeitsbereiche der Anwesenden zu erhalten und Vernetzungspotentiale zu entdecken.

11:15 – 11:45 Regionale Breakout Sessions:

Möglichkeit der Vernetzung sowohl innerhalb der Region als auch überregional

11:45 – 13:00 Mittagspause
13:00 – 14:00 Offene Diskussionsrunde, um Fragen zu klären:

Gemeinsames Lösen/Besprechen von vorab gesammelten Fragen und Problemen der Teilnehmer:innen aus dem Pad

14:00 – 14:15 Abschlussdiskussion und Fazit

 

Wir freuen uns auf Ihre Teilnahme und auf spannende Diskussionen. Bei Fragen oder für weitere Informationen stehen wir Ihnen gerne zur Verfügung.

 

Ihr CrossAsia-Team

VDB-Online-Fortbildung für Fachreferent:innen und Bibliothekar:innen der Asienwissenschaften

Sehr geehrte Damen und Herren, liebe Kolleginnen und Kollegen,

wir freuen uns, Sie zur bevorstehenden VDB-Online-Fortbildung für Fachreferent:innen und Bibliothekar:innen der Asienwissenschaften einladen zu dürfen.

Im Folgenden finden Sie wichtige Informationen zum Ablauf und zur Anmeldung.

 

Veranstaltungstermine:

Tag 1: Donnerstag, 07. Dezember 2023, von 08:50 Uhr bis 15:30 Uhr

Tag 2: Freitag, 08. Dezember 2023, von 08:50 Uhr bis 14:30 Uhr

Durchführung online über WebEx.

 

Anmeldung:

Die Anmeldung zur Fortbildung erfolgt über die E-Mail-Adresse: ostasienabteilung@sbb.spk-berlin.de. Bitte geben Sie bei der Anmeldung Ihre Kontaktdaten an. Eine Anmeldung ist bis zum 06.12.2023 möglich. Sehr gerne können Sie diese Einladung auch an interessierte Kolleg:innen weiterleiten.

 

Zertifikat des VDB:

Nach erfolgter Teilnahme an der Fortbildung erhalten Sie auf Wunsch ein Zertifikat des VDB (Verein Deutscher Bibliothekarinnen und Bibliothekare e.V.).

 

Lightning Talks:

Wir bieten die Möglichkeit an, 5 Kurzvorträge á 10 min von Teilnehmer:innen zu Themen aus ihren Bibliotheken vorzustellen. Wenn Sie Interesse haben, einen Vortrag zu übernehmen, melden Sie sich bitte ebenfalls unter der oben genannten E-Mail-Adresse.

 

Veranstaltungsprogramm:

Programm Tag 1:

Donnerstag | 07.12.2023 | 08:50 – 15:30 Uhr

08:50 – 09:00 Begrüßung und Organisatorisches
09:00 – 10:00 FID Asien:

– Kurzvorstellung (Nicole Terne) (5 min)

– Erwerbung von Printmedien und FID Lizenzen (Matthias Kaun) (20 min)

– Aktuelle Entwicklungen im Datenmanagement: Daten transformieren, sichern, nutzbar machen (Martina Siebert) (20 min)

– Zeit für Fragen (15 min)

10:00 – 10:15 Kaffeepause
10:15 – 11:45 CrossAsia Services – Unterstützung von externen Projekten – Vernetzung:

– Überblick über aktuelle CrossAsia/FID Asien Services

– Vorstellung laufender Projekte

– Organisatorisches

11:45 – 13:00 Mittagspause
13:00 – 14:00 Regionenvorstellung:

– Kurze und prägnante regionenspezifische Infos á 10 min

14:00 – 14:15 Kaffeepause
14:15 – 15:15 Vernetzung:

– Austausch über Kooperationsmöglichkeiten mit anderen FIDs, NFDIs etc.

15:15 – 15:30 Abschluss und Zusammenfassung Tag 1

 

Programm Tag 2:

Freitag | 08.12.2023 | 08:50 – 14:30 Uhr

08:50 – 09:00 Begrüßung und Wrap-up von Tag 1
09:00 – 10:00 FID Asien:

– Repository (Duncan Paterson) (20 min)

– Digital Humanities (N.N.) (20 min)

– Zeit für Fragen (15 min)

10:00 – 10:15 Kaffeepause
10:15 – 11:15 „Lightning Talks“:

– 5 Kurzvorträge á 10 min von Teilnehmer:innen zu Themen aus ihren Bibliotheken

11:15 – 12:00 Breakout Sessions:

– Diskussion in kleinen Gruppen zu den Themen der „Lightning Talks“

12:00 – 13:15 Mittagspause
13:15 – 14:15 Offene Diskussionsrunde und Lösung von Fragen/Problemen:

– Vorab gesammelte Fragen/Probleme der Teilnehmer:innen gemeinsam lösen/besprechen

14:15 – 14:30 Abschlussdiskussion und Fazit

 

Wir freuen uns auf Ihre Teilnahme und auf spannende Diskussionen. Bei Fragen oder für weitere Informationen stehen wir Ihnen gerne zur Verfügung.

 

Ihr CrossAsia-Team

Logo of the Europeana Tech Conference 2023

Vom lesenden Menschen zu lernenden Maschinen – über die Möglichkeiten von Gaia-x für das kulturelle Erbe

Dieser Beitrag ist eine Verschriftlichung des gleichnamigen Vortrags über die ersten Erfahrungen, Daten aus dem ITR von CrossAsia in Gaia-X zu publizieren und auf diesem Wege der Forschung und vor allem den Digital Huminaties zur Verfügung zu stellen. Der Vortrag wurde am 11. Oktober 2023 im Rahmen der Europeana Tech Conference 2023 in Den Haag gehalten.

Ausgangspunkt der Reise Richtung Gaia-X stellt die CrossAsia Webseite dar. CrossAsia ist das von der Staatsbibliothek zu Berlin verantwortete Portal, in dem alle Services des von der DFG geförderten Fachinformationsdienstes Asien und weiteren Angebote gebündelt werden. Der Fachinformationsdienst richtet sich an Wissenschaftlerinnen und Wissenschaftler aus den asienbezogenen Geisteswissenschaften und hat seinen Schwerpunkt auf Ost-, Zentral- und Südostasien. Die Staatsbibliothek sammelt nicht nur Materialien aus und über diese asiatischen Regionen, sondern hat sich bereits vor mehr als 20 Jahren für eine e-preferred-Strategie entschieden. Wann immer ein elektronisches Medium wie Zeitschrift oder Buch dauerhaft lizenziert werden kann, wird kein gedrucktes Exemplar erworben, sondern das elektronische Dokument lizenziert. Hierbei versucht die Staatsbibliothek neben den überregionalen oder nationalen Zugangsrechten auch die Rechte für die lokale Archivierung der Dokumente inkl. Text- und Datamining-Rechten nach Verhandlungen zu erlangen. Neben den Einträgen in den Nachweissystemen kommt der Verwaltung der lizenzierten Daten wie Bilddaten, Volltexten, Film- und Tondokumenten eine besondere Bedeutung zu. Ein erster Dienst, der aus der Verwaltung der digitalen Objekte entwickelt wurde, ist die CrossAsia-Volltextsuche. Diese basiert neben eigenen digitalisierten und mit Volltexten ausgestatteten Objekten auf lizenzierten Objekten von Verlagen und anderen Anbietern. Hierbei handelt es sich hauptsächlich um Text- und Bildmaterialien aus historischen Quellen, von Büchern über wissenschaftliche Artikel bis hin zu aktuellen Zeitungen. Bislang sind insbesondere Materialien in Englisch und Chinesisch repräsentiert; das Angebot wird auch in Hinblick auf die anderen Sprachen kontinuierlich ausgebaut.

All diese Inhalte werden im sogenannten Integrierten Textrepository (ITR) archiviert. Technische Grundlage hier ist eine Infrastruktur basierend auf der Fedora Repository Software. Gleichzeitig stellen wir die Durchsuchbarkeit der Inhalte über einen Solr-Index dar. Dieser enthält momentan fast 70 Millionen Dokumente und ist weltweit eine einmalige Sammlung für lizenzfreie und lizenzbehaftete digitale Ressourcen in den Asienwissenschaften.

Aus diesem Grunde haben viele Wissenschaftlerinnen und Wissenschaftler ein großes Interesse, in diesen Inhalten Muster zu entdecken, neue Zusammenhänge zu erkennen und neue Erkenntnisse mit eigenen Algorithmen und Programmen durch Text- und Datamining zu gewinnen. Der FID Asien besitzt zwar das Recht, seine Nutzerinnen und Nutzern solche Analysen direkt durchführen zu lassen. Hierbei stellt sich jedoch die Frage, wie Code und Inhalte zusammenkommen?

Eine naheliegende Idee wäre ein zusätzlicher Service, der es Wissenschaftlerinnen und Wissenschaftlern ermöglicht, ganze Sammlungen aus dem ITR herunterzuladen. Allerdings ist die Datenmenge im ITR sehr groß, so dass unter Umständen mehrere Terrabyte von Daten heruntergeladen werden müssten. Dies kann je nach Netzwerkgeschwindigkeit Wochen dauern. Zudem wird die weitere Verbreitung der Daten mit dem Download unkontrollierbar, was für alle lizenzierten Inhalte äußerst kritisch ist und zu Vertragsverletzungen führen kann. Dies wiederum schafft Probleme mit Verlagen, mit denen die Staatsbibliothek Verträge geschlossen hat. Schließlich basiert ein Lizenzvertrag auf gegenseitigem Vertrauen, weshalb eine strengere Zugriffskontrolle auf die Daten notwendig ist.

Eine andere Idee ist, dass Wissenschaftlerinnen und Wissenschaftler in die Staatsbibliothek kommen und sich dort mit ihrem eigenen Laptop über die IT-Infrastruktur der SBB direkt mit dem ITR verbinden und dann die entsprechenden Analysen durchführen. Dies ist aus Zeit- und Kostengründen nicht immer realisierbar, vor allem wenn eine ferne Anreise notwendig ist. Und auch in diesem Fall muss kontrolliert werden, ob Daten in zu großem Umfang aus dem ITR abgezogen werden und die Staatsbibliothek damit die Kontrolle über ihre in den Lizenzverträgen eingegangenen Verpflichtungen verliert.

Ein weiteres Problem stellen die erforderlichen Computer-Ressourcen dar, die z.B. für das Training im Rahmen des maschinellen Lernens benötigt werden und die ein einfacher Laptop nicht bieten kann. Daher kann auch die Verfügbarkeit der notwendigen Rechenleistung ein Problem sein.

Ausgehend von dieser Problematik begann unsere Suche nach einer Möglichkeit, unsere Daten und unser ITR für Text- und Datamining zu öffnen. Dabei stießen wir auf Gaia-X. Gaia-X ist eine europäische Initiative für eine unabhängige Cloud-Infrastruktur, wobei es sich eher um ein Framework als um eine weitere Cloud-Plattform wie Amazon Webservices oder Google handelt, die sich in verschiedene Domänen aufgliedert.

Die wichtigsten Eigenschaften des Gaia-X Frameworks sind im Folgenden aufgeführt:

  • Volle Souveränität über die eigenen Daten. Die Kontrolle über die Daten bleibt stets beim Eigentümer.
  • Dezentralität, d.h., es gibt keinen zentralen Punkt im Netzwerk, der für das Funktionieren notwendig ist.
  • Ein Regelwerk zur Schaffung von Vertrauen und spezielle Services (verfügbar als Open Source), die von allen Netzwerkteilnehmern genutzt werden können, um zu überprüfen, ob andere auch die Regeln einhalten. Gaia-X ist also ein föderales System mit implizitem Vertrauen.
  • Gaia-X ist interoperabel, da es keine vorgeschriebene technische Infrastruktur für die Teilnahme gibt.
  • Mit Gaia-X ist es möglich, fachspezifische Dataspaces zu erstellen und diese miteinander zu verknüpfen.

Abbildung 1 zeigt einen Überblick über die Gaia-X Domäne, die wir uns näher angeschaut haben. Links ist das Trust Framework mit den verbundenen föderierten Diensten dargestellt, die dazu genutzt werden können, um die Compliance von allen Teilnehmenden zu überprüfen. Rechts oben finden sich die Portale, die den Einstiegspunkt in die fachspezifischen Dataspaces in Gaia-X darstellen.

 

 

Alles, was in einem Portal veröffentlicht wird, wird im föderierten Katalog verzeichnet, der in der Abbildung neben den Portalen zu sehen ist. Dieser Katalog ist unabhängig von den Portalen und enthält Informationen über alle Assets in Gaia-X. Nutzerinnen und Nutzer besuchen ein Portal und sehen die Inhalte abhängig vom Portal in einer fachspezifischen Ansicht des föderierten Katalogs. Die Inhalte sind jedoch nicht an das Portal gebunden und können jederzeit und überall im Gaia-X-Netzwerk genutzt werden. Auch deswegen ist Gaia-X als dezentral zu bezeichnen.

Um herauszufinden, wie uns diese Eigenschaften unterstützen können, um Text- und Datamining im ITR zu ermöglichen, haben wir ein Proof-of-Concept gestartet. Das Ergebnis war ein eigenes CrossAsia Portal in Gaia-X. Inhalte eines solchen Portals sind sogenannte Service-Offerings in Gaia-X. Dies kann entweder ein Dataset oder ein Algorithmus sein. Für ein Dataset besteht die Möglichkeit des gesicherten Downloads, was bedeutet, dass die URL des Datensatzes niemals sichtbar wird. Gleichzeitig kann zum Beispiel die gesamte Anzahl an Downloads festgelegt werden.

Eine weitere Möglichkeit besteht darin, Compute-To-Data für ein Dataset zu aktivieren. Dies ermöglicht es Nutzerinnen und Nutzern, die Daten mit einem veröffentlichten Algorithmus zu verknüpfen und einen Compute Job zu starten. Die Nutzerinnen und Nutzer erhalten nur die Ergebnisse ihres Compute-Jobs, nicht die Daten selbst. Auf diese Weise können wir die Daten aus unserem ITR für Text- und Datamining anbieten, ohne dass jemand Daten herunterladen oder verschieben muss.

Dies funktioniert, weil hier das Ocean Protocol die technische Grundlage von Gaia-X darstellt. Abbildung 2 zeigt einen vereinfachten technischen Ablauf für Compute-To-Data. Die Schritte sind relativ einfach: zunächst suchen die Nutzerinnen und Nutzer die Daten und den Algorithmus aus dem föderierten Katalog (vorausgesetzt, es bestehen entsprechende Zugriffsrechte). Dann werden Daten und Algorithmus in einen isolierten Execution Pod geladen, der innerhalb einer Kubernetes-Umgebung startet. Einzig die Ergebnisse des Algorithmus und Logfiles zur Ausführung werden dann dem Nutzer oder der Nutzerin zur Verfügung gestellt. Am Ende wird der Execution Pod gelöscht.

 

 

Das Veröffentlichen von Datasets und Algorithmen und deren Verbindung hat wie in der Theorie beschrieben funktioniert. Daher kann der Proof-of-Concept als Erfolg angesehen werden: eine Bibliothek kann Datasets in Gaia-X veröffentlichen, Wissenschaftlerinnen und Wissenschaftler können einen Algorithmus veröffentlichen und beides über das Portal kombinieren. Die gewünschten Ergebnisse werden zur Verfügung gestellt, ohne das die Sicherheit der Daten gefährdet wird – keine Downloads sind notwendig und alle Daten bleiben bei der Institution, die sie veröffentlicht hat.

Mit der Ersteinrichtung des Portals muss jedoch festgestellt werden, dass noch einige Verbesserungen notwendig sind, bevor die Lösung in größerem Umfang gut genutzt werden kann. Wer das Portal ausprobieren möchte, wird feststellen, dass der Einstieg in das Gaia-X Netzwerk nicht einfach ist und einiger Erklärungen bedarf. Da es sich bei der Datenbank des föderierten Katalogs um einen Distributed Ledger handelt, wird ein Wallet zur Identifizierung und Rechtegewährung benötigt. Daher muss im Browser ein Wallet (z.B. MetaMask) installiert und konfiguriert werden. Nach dem Einstieg ins Netzwerk ist jedoch die Veröffentlichung von Datasets und Algorithmen recht einfach, wenn auch die Verwendung von Daten bzw. das Starten eines Compute-Jobs eine Reihe von Bestätigungen bestimmter Transaktionen auf dem Ledger erfordert.

Zusammenfassend lässt sich feststellen, dass Gaia-X eine interessante neue Möglichkeit für GLAM-Institutionen ist, ihre schützenswürdigen Daten anzubieten. Gaia-X ist derzeit noch stark von wirtschaftlichen und industriellen Interessen mit einer starken kommerziellen Ausrichtung getrieben. Dennoch haben wir uns entschieden, vor allem aufgrund der guten Ergebnisse, unsere Aktivitäten in Gaia-X fortzuführen und den Proof-of-Concept zu einer Pilotanwendung weiterzuentwickeln. Hier arbeiten wir an ersten Verbesserungen der User-Experience und werden in Kürze weitere Use-Cases mit wissenschaftlichem Fokus durchführen. Wir engagieren uns gleichzeitig in der Gaia-X und Ocean-Protocol-Community, um auch nicht-kommerzielle Anwendungsfälle in Gaia-X besser zu ermöglichen und Gaia-X zu einem wissenschaftlichen Ökosystem für fachspezifische Dataspaces weiterzuentwickeln.

Basierend auf unseren Erfahrungen aus dem Proof-of-Concept möchten wir Einrichtungen des Kulturerbes vorschlagen, darüber nachzudenken, wie Gaia-X und das Ocean Protocol sie dabei unterstützen können ein Fullstack-Dataprovider zu werden. Und eben nicht nur ein Dataprovider für Metadaten, um Kulturartefakte zu finden, nicht nur ein Dataprovider für Texte zum Lesen, Audios zum Hören, Bilder oder Videos zum Ansehen oder Forschungsdaten zum Analysieren. Sondern vielmehr ein Dataprovider, der solche Kulturdaten in hoher Qualität auch für Algorithmen und Netzwerke für maschinelles Lernen anbietet und dabei – sofern notwendig – die Hoheit über die Daten behält.

Derzeit werden Large Language Models stark von großen Unternehmen wie OpenAI, Google oder Facebook kontrolliert. Wenn jedoch jeder die Möglichkeit erhält, seine eigenen Modelle mit Daten von GLAM- Institutionen zu trainieren, kann das maschinelle Lernen demokratisiert werden. Da jeder Zugang zu den Daten hat, die er oder sie für seine Algorithmen benötigt – entweder zu freien Daten oder bei lizenzierten Daten dort, wo ein entsprechendes Zugriffs- und Lizenzrecht besteht. Neue Ansätze wie Federated Learning können dabei helfen und den Prozess sogar noch stark vereinfachen. Unser Ziel ist es, das Training künstlicher Intelligenz zu verbessern, indem wir unsere digitalen Lesesäle für die Algorithmen öffnen und nicht nur die neuen Möglichkeiten der künstlichen Intelligenz selbst zu nutzen.

Referenzen

Wenn Sie interessiert sind, die Lösung zu testen und Unterstützung benötigen, wenden Sie sich bitte an x-asia(at)sbb.spk-berlin.de

Detail of a portrait of Fujiwara no Teika by Utagawa Hiroshige in "Hyakunin isshu jokunshō". - Staatsbibliothek zu Berlin, Preußischer Kulturbesitz, shelf mark: 5 A 230984 ROA, 11v

„Hyakunin isshu“ and the Hiroshige studio: Utagawa Hiroshige and „Hyakunin isshu jokunshō“

Gastbeitrag von Dr. Freya Terryn

Fig. 1: Front cover of Hyakunin isshu jokunshō with a printed title slip (daisen 題簽) that reads “Hyakunin isshu jokunshō zen 百人一首女訓抄全” (Annotated Lessons for Women of One Hundred Poets, One Poem Each – Complete). – Staatsbibliothek zu Berlin, Preußischer Kulturbesitz, shelf mark: 5 A 230984 ROA

Fig. 1: Front cover of Hyakunin isshu jokunshō with a printed title slip (daisen 題簽) that reads “Hyakunin isshu jokunshō zen 百人一首女訓抄全” (Annotated Lessons for Women of One Hundred Poets, One Poem Each – Complete). – Staatsbibliothek zu Berlin, Preußischer Kulturbesitz, shelf mark: 5 A 230984 ROA

Nicknamed the ‘artist of mist, snow, and rain’, Utagawa Hiroshige 歌川広重 (1797–1858) is one of the leading creators of the landscape imagery in Japanese woodblock prints, or ukiyo-e 浮世絵. In the 1830s he made a name for himself in the genre of topographical views, starting with his meisho-e 名所絵: prints recording famous places of Edo (now Tokyo). His decisive breakthrough followed with his prints depicting the various stations along the Tōkaidō road, a travel route connecting Kyoto with Edo, and with his prints showing landscapes of the various provinces. Nor should we forget that he was also prolific in prints of birds and flowers, actors, beautiful women, historical figures, prints of humorous content, and he made an abundant number of designs for fan prints.

Like many ukiyo-e artists, Hiroshige also created illustrations for books. It is said that he worked on more than 120 illustrated books and illustrated at least 50 kyōka anthologies. Kyōka 狂歌 (literally ‘mad/crazy verse’) are parodic or humorous renditions of traditional waka 和歌, Japanese poetry in a 5‑7‑5‑7‑7 meter. Hiroshige displays a close affinity to this genre of poetry as his first printed work consisted of book illustrations for a collection of kyōka, entitled Kyōka Murasaki no maki 狂歌紫の巻 (The Murasaki Book of Witty Poems), published in 1818. Hiroshige’s connection to Japanese poetry continued throughout his career and also manifested itself in the pictorialization of the classical Japanese anthology One Hundred Poets, One Poem Each (Hyakunin isshu 百人一首; henceforth Hyakunin Isshu). Such an example is the illustrated woodblock-printed book Hyakunin isshu jokunshō 百人一首女訓抄 (Annotated Lessons for Women of One Hundred Poets, One Poem Each; Fig. 1).

This book is the subject of a research project that explores the connection between the Hyakunin Isshu and the Hiroshige studio. More specifically, this project looks at how the Japanese woodblock print artists Utagawa Hiroshige and his successor Utagawa Hiroshige III 三代歌川広重 (1842–1894) interpreted the Hyakunin Isshu in books illustrated with woodblock prints (ehon 絵本). With a grant awarded by the Stiftung Preußischer Kulturbesitz (Prussian Cultural Heritage Foundation), I consulted Hiroshige’s book Hyakunin isshu jokunshō in the collection of the Staatsbibliothek zu Berlin (Berlin State Library; henceforth SBB), in July 2022. The SBB is to my knowledge the only collection in Europe that houses a copy of this book. During my time at the SBB, I conducted a close analysis of the book’s bibliographic data, its physical properties and component parts, while placing the book in the history of the visual and textual representation of the anthology.

Hyakunin isshu jokunshō was originally published in 1848 and proved popular enough to be reprinted three times: in 1849, 1851, and 1858. The book was a product of the highly commercial world of Japanese printmaking, and as a book illustrated with woodblock prints it was conceived, designed, published, and distributed by representatives of many different trades and professions working in collaboration. Today we can identify three parties who were involved in the book’s production, namely the publisher, the visual artist, and the writer. Other parties, such as the papermakers, binders, block cutters, and printers, remain anonymous.

The publisher of Hyakunin isshu jokunshō is Honya Matasuke 本屋又助 (dates unknown). While next to nothing is known about this publisher, an analysis of the back matter of the book’s   copies from 1848, 1849, 1851, and 1858 does shed more light on his activities as a publisher and with what intention he published this book. As the back matter of Japanese books often reveals imprint information and contains the publisher’s catalog that records forthcoming titles and books currently on sale, it is possible to reconstruct the timeframe and content of the publisher’s activities. So far, I have been able to analyze back matter of digitized copies dating from 1849 and 1851 and the SBB copy (shelf mark: 5 A 230984 ROA), which is a reprint from 1858. Unfortunately, 1848 copies are rare and can only be found in collections in Japan — which remain, for now, undigitized.

From this analysis it is clear that Honya Matasuke was primarily active in the 1840s and 1850s as a publisher who issued books ranging from educational topics – for young children in general as well as aimed specifically at girls –, literary works, and illustrated books of sumo wrestlers and warriors to painting and drawing manuals. In addition, advertisements for the book included in copies from 1849 and 1851 confirm that this particular Hyakunin Isshu project was devised as an illustrated book for children and women to learn and easily understand waka poems by means of the annotated descriptions accompanying them.

Honya Matasuke was able to achieve this educational objective with the layout of the poems. As demonstrated by Fig. 2, which introduces on the right the poem composed by Emperor Jitō (Jitō tennō 持統天皇; 645–703; reign 686–697) and on the left the poem by Kakinomoto no Hitomaro 柿本人麿 (c. 653–655-c. 707–710), each page consists of a long vertical strip that contains the poem – which, with its shape, represents the tradition of composing poems on long narrow strips of colored paper –, followed by an annotated description explaining the meaning of the poem and an imaginary portrait of the poet below it. Especially the annotated descriptions were crucial for many readers to comprehend the meaning of the poem as the Hyakunin Isshu represents the history of Japanese poetry from the seventh century down to the time of Fujiwara no Teika 藤原定家 (1162–1241), who is accredited with selecting the poems. Thus, these poems contain poetic language that was at least four centuries old and that was often difficult to interpret. To provide readers with the correct interpretation of each poem, Honya Matasuke employed Yamada Tsunenori 山田常典 (1808–1863), a writer and waka poet who had received a rigorous training in waka poetry and other Japanese literary classics, making him the ideal candidate to write annotations for this Hyakunin Isshu project.

Fig. 2: Poems by Emperor Jitō and Kakinomoto no Hitomaro. – Staatsbibliothek zu Berlin, Preußischer Kulturbesitz, shelf mark: 5 A 230984 ROA, 10v–11r

Fig. 2: Poems by Emperor Jitō and Kakinomoto no Hitomaro. – Staatsbibliothek zu Berlin, Preußischer Kulturbesitz, shelf mark: 5 A 230984 ROA, 10v–11r

Next to Yamada Tsunenori, Honya Matasuke also employed not one but two visual artists. One artist was tasked with illustrating the imaginary portraits of the poets, for which the artist employed the formula of representing the poets as invariably seated figures on a raised platform with a decorated edge (Fig. 2). Similar to other illustrated books that used this formula since the 1660s, these portraits omit the signature of their maker. Therefore, it is impossible to know the identity of this artist.

The other artist Honya Matasuke employed was Utagawa Hiroshige. The presence of his signature confirms that he was tasked with illustrating eight folded sheets that were placed before the main bulk of the book that educates its readers on the one hundred poems and their interpretation (Fig. 3). From the content of these illustrations it becomes clear that Honya Matasuke intended to expand the content of the book by dedicating illustrations to The Tale of Genji (Genji monogatari 源氏物語, early 11th  entury), The Tales of Ise (Ise monogatari 伊勢物語, c. 980), and silkworm cultivation. Hiroshige’s illustrations also introduce other waka poets and poems, such as the 12 poets from the Collection of Japanese Poems of Ancient and Modern Times (Kokin wakashū 古今和歌集, 905), poems relating to The Eight Views of Ōmi (Ōmi hakkei 近江八景, 15th–16th century), and specifically introduce Murasaki Shikibu 紫式部 (c. 973/978–c. 1014/1031), the author of The Tale of Genji, and Fujiwara no Teika.

This deviation from the core of the Hyakunin Isshu was not irregular because with the inclusion of these additional pages, Honya Matasuke succeeded in presenting this book as an ōraimono 往来物. As a result, Hyakunin isshu jokunshō can be labeled as a book belonging to the genre of instruction manuals issued for teaching children how to read and write and to the genre of conduct books aimed at female readers in particular. Thus, perfectly matching with Honya Matasuke’s objective for the book.

ig. 3: These two pages contain illustrations by Hiroshige. At the top right he illustrated the poems and scents of the four final chapters of The Tale of Genji, namely Ukifune 浮舟, Kagerō 蜻蛉, Tenarai 手習, and Yume no ukihashi 夢の浮橋. At the top left, he illustrated three waka poems on the sun, the moon, and the stars. Below these illustrations we find a depiction of The Tales of Ise that shows courtier-poet Ariwara no Narihira 在原業平 (825–880) upon his sighting of Mt. Fuji (chapter nine of The Tales of Ise). – Staatsbibliothek zu Berlin, Preußischer Kulturbesitz, shelf mark: 5 A 230984 ROA, 12v–13r

Fig. 3: These two pages contain illustrations by Hiroshige. At the top right he illustrated the poems and scents of the four final chapters of The Tale of Genji, namely Ukifune 浮舟, Kagerō 蜻蛉, Tenarai 手習, and Yume no ukihashi 夢の浮橋. At the top left, he illustrated three waka poems on the sun, the moon, and the stars. Below these illustrations we find a depiction of The Tales of Ise that shows courtier-poet Ariwara no Narihira 在原業平 (825–880) upon his sighting of Mt. Fuji (chapter nine of The Tales of Ise). – Staatsbibliothek zu Berlin, Preußischer Kulturbesitz, shelf mark: 5 A 230984 ROA, 12v–13r

The consultation of Hiroshige’s book at the SBB has greatly enriched my research on the connection between the Hiroshige studio and the Hyakunin Isshu. My research stay allowed me to work on my transcribing skills and to learn more about Hiroshige and his illustrated books. I have presented preliminary findings of this research project on three occasions: an online presentation for the Berlin State Library on November 3, 2022; at the academic conference Book Historical Forum VI at the University of Leuven on November 25, 2022 (in Dutch); and at the seminar series ‘Culture in Perspective: South and East Asia’ at Ghent University on March 14, 2023. Currently I am still conducting research on this project and plan to consult an 1848 copy in a Japanese collection in the near future. Updates on this research will be revealed on my personal website and on Twitter.

 

Bio:
Dr. Freya Terryn is a postdoctoral researcher in Japanese Studies at the University of Leuven (KU Leuven, Belgium) and specializes in Japanese visual and print culture of the nineteenth century. With the support of a PhD Fellowship from the Research Foundation Flanders, she recently completed her PhD in Japanese Studies at the University of Leuven. She currently teaches courses on Japanese culture, art history, classical Japanese grammar, translation from Japanese to Dutch, and academic writing. When it comes to research, she is enthusiastic about the arts and material culture of eighteenth- and nineteenth-century Japan, with a particular focus on prints, illustrated books, and paintings. She also explores issues relating to artistic and commercial collaboration, the interaction between governing bodies and artists, pictorial quotation, exhibition culture, Japonisme, and the formation of Japanese art collections in Europe.

Der Beitrag erschien zuerst im SBB Blog.

 

Frau Dr. Freya Terryn, KU Leuven, war im Rahmen des Stipendienprogramms der Stiftung Preußischer Kulturbesitz im Jahr 2022 als Stipendiatin an der Staatsbibliothek zu Berlin. Forschungsprojekt: „The One Hundred Poets, One Poem Each across generations: A case study of picture-and-poetry books illustrated by Hiroshige and Hiroshige III“

Online-Werkstattgespräch zu dieser illustrierten Ausgabe am 3. 11. 2022

CrossAsia Classroom: Online-Seminare im Sommersemester 2023

Wir möchten Sie herzlich dazu einladen an unseren zahlreichen Online-Schulungen im Sommersemester zu den Angeboten von CrossAsia teilzunehmen. Die Schulungen beginnen ab dem 25.4. mit einem allgemeinen Überblicksveranstaltung. Es werden aber auch spezielle Veranstaltungen zu den einzelnen Regionen (China, Japan, Korea, Südostasien und Zentralasien) sowie einzelnen Materialtypen angeboten.

Das aktuelle Programm für das Sommersemester 2023 finden Sie wie immer im CrossAsia Classroom und unter der Rubrik „Wissenswerkstatt“ im Veranstaltungskalender der Staatsbibliothek zu Berlin hier.

Auf der CrossAsia Classroom-Seite finden Sie außerdem aktuelles Infomaterial zu den einzelnen Regionen und Links zu unseren CrossAsia Tutorials.

Fall Sie als Institution ein auf Sie und ihr Publikum zugeschnittenes Web-Seminare kostenfrei buchen möchten, können Sie sich gerne über xasia@sbb.spk-berlin.de mit uns in Verbindung setzen oder direkt unsere regionalen Referent:innen dahingehend kontaktieren. Gerne kommen wir auch zu Ihnen, um Schulungen Live vor Ort abzuhalten.

Neues Themenportal zu japanischen Querrollen aus den Sammlungen der Staatsbibliothek zu Berlin

Wir möchten Sie gerne einladen, unser neues ⇒Themenportal zu den japanischen Querrollen in den Sammlungen der Staatsbibliothek zu erkunden. Diese großformatigen Werke, die bisher in den Digitalisierten Sammlungen der Bibliothek nur in der Form von Einzelbildern elektronisch zugänglich waren, können ab sofort auf der CrossAsia-Seite über den integrierten Viewer in ihrer gesamten Länge betrachtet werden. Neben frühen buddhistischen Drucken finden Sie hier reich illuminierte Werke aus der Edo-Zeit, aber auch einfache Werkstattkopien von Erzählungen oder handkolorierte Drucke von Prozessionen. Wir wünschen viele Spaß beim Erkunden.

Ein kleiner technischer Hinweis: Die Reaktionszeit des Viewers bis zur Anzeige der kompletten Rolle ist z.Z. noch etwas lang. Es dauert ggf. einige Sekunden, bis die Rolle sich aufbaut.