CrossAsia – Fachinformationsdienst Asien

Bericht: Forschungsdatenworkshop

Forschungsdaten in den asienbezogenen Wissenschaften

Bericht zum Workshop am 6. Dezember 2018, 11-15 Uhr, in der Staatsbibliothek zu Berlin

 

Teilnehmerinnen und Teilnehmer des Workshops

Matthias Arnold (Heidelberg Research Architecture, Universität Heidelberg)
Prof. Carmen Brandt (DGA, Universität Bonn)
Daniela Claus-Kim (FU Berlin)
Dr. Carolin Dunkel (Staatsbibliothek zu Berlin)
Christian Dunkel (Staatsbibliothek zu Berlin)
Dr. Tania Becker von Falkenstein (DVCS, TU Berlin)
Prof. Robert Horres (Universität Tübingen)
Matthias Kaun (Staatsbibliothek zu Berlin)
Dr. Florian Kräutli (MPI Wissenschaftsgeschichte)
Hanno Lecher (Bereichsbibliothek Ostasien, UB Heidelberg)
Prof. Daniel Leese (The Maoist Legacy, Universität Freiburg)
Jens Ludwig (Stiftung Preußischer Kulturbesitz)
Maximilian Mehner, M.A. (DMG Südasien, Universität Marburg)
Nicole Merkel (UB Heidelberg)
Dr. Florian Pölking (VfK, Universität Bochum)
Prof. Cornelia Reiher (VSJF, FU Berlin, CrossAsia Fachbeirat)
Prof. Florian C. Reiter (DMG, HU Berlin)
David Schulze (Stiftung Wissenschaft und Politik)
Prof. Yvonne Schulz Zinda (VfK, Universität Hamburg)
Dr. Miriam Seeger (Staatsbibliothek zu Berlin)
Dr. Martina Siebert (Staatsbibliothek zu Berlin)
Franziska Trempler (Staatsbibliothek zu Berlin)
Dr. Cosima Wagner (GJF, Campusbibliothek, FU Berlin)
Prof. Urs Matthias Zachmann (GJF, FU Berlin)

Protokoll: Dr. Martina Siebert

 

Der FID Asien hat zum 6. Dezember 2018 nach Berlin eingeladen, um zum Thema Forschungsdaten in den Asienwissenschaften ins Gespräch zu kommen. Eingeladen waren sowohl Repräsentanten der relevanten Fachgesellschaften (DGA, DMG, DVCS, GJF, VfK, VSJF) als auch Vertreterinnen und Vertreter von Projekten und Institutionen, in denen größere Mengen an Daten in eigenen Infrastrukturen generiert und gehostet werden. Gemeinsam ist allen Teilnehmerinnen und Teilnehmern die Aufgabe, sich um die langfristige Sicherstellung der Zugänglichkeit und die Nachhaltigkeit von Forschungsdaten kümmern zu wollen bzw. zu müssen, auch um die Anforderungen der DFG diesbezüglich zu erfüllen. Eines der Ziele war es, zu diskutieren, ob der FID Asien sich in diesem Bereich für die asienbezogenen Wissenschaften stärker als bislang engagieren soll und ob bzw. wie er sich in die verschiedenen bereits bestehenden lokalen, regionalen und / oder nationalen Aktivitäten einbringen sollte. Es sollte gemeinsam ausgelotet werden ob, und wenn ja, wie man sich im Fach gemeinsam zum Thema Forschungsdaten koordinieren und positionieren möchte.

FID Asien und Forschungsdaten

Zur Einleitung haben Matthias Kaun (Leiter der Ostasienabteilung der Staatsbibliothek zu Berlin) und Miriam Seeger (Fachreferentin für China, Hongkong, Macao und Taiwan) umrissen, in welcher Form Forschungsdaten als Aufgabe im Rahmen des FID Antrags für die zweite Förderphase (2019-2021) definiert wurden und wie geplant ist, das Aktionsfeld „Forschungsdaten“ in den kommenden drei Jahren im FID Asien auszufüllen (siehe auch den Antragstext). Es sind vor allem zwei Stoßrichtungen vorgesehen: zum einen der Aufbau eines Beratungs- und Informationsangebots und kooperativen Netzwerks zwischen der Wissenschaft und Infrastrukturanbietern zu Forschungsdaten in den asienbezogenen Wissenschaften, zum anderen das Umsetzen und Testen von konkreten infrastrukturellen Anforderungen der Wissenschaft für die Generierung und Speicherung von Forschungsdaten im CrossAsia ITR (Integrierten Textrepositorium) oder einem „Zuliefersystem“ (wie für Bilddaten z.B. einem iiif-Editor) anhand von exemplarischen Partnerprojekten.

Diese parallele Vorgehensweise zielt darauf ab, Kompetenzen und Zuständigkeiten effizient und nachhaltig in einem Netzwerk zu verteilen – mit der Bereitschaft des FID Asien hier koordinierend tätig zu werden – aber auch selbst Expertise zu generieren. In einigen Fällen wird es in Zukunft sinnvoll sein, selbst „host“ zu sein. Dies sind vor allem solche Fälle, in denen auf der Basis von Materialien aus dem CrossAsia Portfolio oder dem des FID Asien Forschungsdaten entstehen, die – verlinkt mit den Vorlagen – in das CrossAsia ITR zurückgespeichert werden sollen.

Forschungsdaten: was und warum

Die Frage der „Definition“ von Forschungsdaten hat schon viele Stellungnahmen beschäftigt. In einem kurzen Überblick über die Entwicklung des Förderrahmens für Forschungsdaten und Infrastrukturen (Stichwort „Nationale Forschungsdateninfrastruktur“ NFDI; „Rat für Informationsinfrastrukturen“ RfII) hat Jens Ludwig (Stabstelle „Digitale Transformation“ der Stiftung Preußischer Kulturbesitz) u.a. drei Aspekte von Forschungsdaten hervorgehoben, die auch eine zeitliche Entwicklung und zunehmende Wichtigkeit von Forschungsdaten in und für die Wissenschaften nachzeichnen. Begonnen mit dem Anspruch der guten wissenschaftlichen Praxis und der damit geforderten „Nachvollziehbarkeit“ der Forschungsbasis haben sich die Erwartungen an Forschungsdaten sukzessive weiterentwickelt. Im nächsten Schritt war ein Forschungsdatum eine zitierfähige Datenpublikation, die nicht nur der Forschungsfrage, in deren Kontext sie entstanden ist, als Basis dienen kann, sondern darüber hinaus für verschiedenste „Nachnutzungen“ bereit stehen sollte. Heute sollen Forschungsdaten darüber hinaus idealerweise so präsentiert werden, dass sie mittels digitaler Werkzeuge, über Visualisierungen und statistische Methoden (Ngram, Co-occurrence etc.) weitere, u.U. nicht vorausgesehene Erkenntnisse durch eine „Nutzungsverbesserung“ der Daten generieren können.

„Bedarfs“-Communities und Fach-Communities

Die im Rahmen der NFDI beschlossene finanzielle Förderung blickt nicht so sehr auf diese verschiedenen Nutzungsstufen von Forschungsdaten. Hier liegt der Fokus erst einmal darauf, eine vernetzte „Struktur“ von Kompetenzen und keinen „Ort“ in Form eines Daten-Repositoriums o.ä. aufzubauen. Durch die Förderung soll sichergestellt werden, dass die verschiedenen wissenschaftlichen Bereiche und Methoden „Sprech- und Handlungsfähigkeit“ erlangen und aktive Fachcommunities ihre „Bedarfe selbst ermitteln und priorisieren.“ Grenzen sollen jedoch nicht „spezialistisch oder exklusiv“ sein, sondern wenn sie gezogen werden, anhand verschiedener Bedarfe bestimmt werden. Die Förderung dieser Konsortien und Infrastrukturen ist vor allem auf eine größere Effizienz des Wissenschaftssystems fokussiert. Somit werden im Rahmen der NFDI „Köpfe“ bzw. ca. 30 solcher Konsortien gefördert und nicht in erster Linie die dafür notwendige „Technik.“

Auch die asienbezogenen Wissenschaften sollten das Thema Forschungsdaten, so der Vorschlag, von eben solchen Infrastrukturen und kooperativen Netzwerken her angehen und weniger über Fragen der Formate u.ä. räsonieren. Zudem ist in der Regel „speichern“ kein ausreichendes Ziel, da die Daten ja gefunden werden müssen. Sie müssen zudem interoperabel genug sein, so dass sie in anderen Kontexten sinnvoll verwendet werden können. Forscher erwarten heute u.U. Werkzeuge, um die Daten zu explorieren und – mehr oder weniger – direkt am „Fundort“ zu analysieren. Doch wie weit soll / muss / möchte man hier gehen?

Die Frage der Breite der asienbezogenen Wissenschaften, in der alle geistes- und sozialwissenschaftlichen Disziplinen mit ihren speziellen und vielfältigen Formen von Forschungsdaten und -methoden vertreten sind, hat die Diskussionsrunde beschäftigt. Die NFDI-Konsortien sprechen von „aktiven Fachcommunities“ die ihre „Bedarfe“ selbst ermitteln sollen. Ist das auf die asienbezogenen Wissenschaften in ihrer gesamten Breite anwendbar und ein Konsens vorstellbar? Haben die verschiedenen geistes- und sozialwissenschaftlichen Arbeitsmethoden gemeinsame Bedarfe? Sehr deutlich wurde hier auch davor gewarnt mit diesen NFDI-Konsortien nicht eine vermeintliche „Kleinstaatlichkeit der Regionalstudien“ zu reproduzieren oder gar zu verfestigen. Sollen sich sozialwissenschaftlich arbeitende Projekte deshalb mit ihren Forschungsdaten eher an sozialwissenschaftliche Forschungsdateninfrastrukturen wenden? Spielt die „Nicht-Lateinschriftlichkeit“ hier eine Rolle und ist sie ein taugliches verbindendes Element? Sollte es ein Asien-NFDI-Konsortium geben, um sicher zu stellen, dass regionalspezifische Anforderungen nicht vergessen werden? Wer sind hier die besten Partner, um eine Forschungsdaten-Infrastruktur für die asienbezogenen (oder regionalspezifischen) Wissenschaften aufzubauen? Sind diese vielleicht nicht in Europa zu finden, sondern in Asien bzw. den entsprechenden Ländern selbst?

Kann es „eine“ Datenbank geben, in die alle Projekte ihre Daten speichern und damit keine Projektzeit für den Aufbau eigener Datenbanken verbrauchen (und dann Zeit dafür brauchen, diese Daten zu überführen etc.)? D.h. kann man einen allen gemeinsamen „Bedarf“ abstrahieren und diesen in eine datentechnische Struktur überführen? Interessant war in diesem Zusammenhang der Bericht aus dem MPIWG, wo anhand eines Beispielprojekts die Tauglichkeit des CIDOC Conceptual Reference Models (CIDOC-CRM) getestet wird, Forschungsdaten in Form eines „knowledge graph“ abzubilden.

Im Rahmen der Vorstellung der einzelnen Fachgesellschaften und Infrastrukturvertreter wurden eine Reihe weitere Bedarfe und Bedenken genannt: Verbreitung und Nachnutzung von Forschungsdaten können ethische Fragen aufwerfen, Persönlichkeitsrechte müssen berücksichtigt werden, und auch der Kopierschutz muss beachtet werden. Eine Infrastruktur muss in der Lage sein, all diese Anforderungen zu erfüllen.

Wer ist bzw. sollte für was zuständig sein? Welche Aktivitäten gibt es bereits?

Neben der Frage, ob eine Methode oder der regionale Bezug die sinnvollere Abgrenzung zu anderen NFDI-Konsortien bilden, stand auch die Frage im Raum, wie die Universitätsbibliotheken sich hier in Zukunft positionieren wollen. Für das wissenschaftliche Profil einer Universität ist es wichtig, in ihrem Kontext entstandene Daten auch selbst zu präsentieren (vgl. z.B. Repositorien für Doktorarbeiten). Für die Forscher selbst ist sicherlich der fachliche Zugang relevanter (und in der Regel auch vertrauter). Können die Fachgesellschaften hier Rollen übernehmen bzw. sich Aufgaben innerhalb eines Netzwerkes vorstellen? Wie ist die aktuelle Struktur in den jeweiligen Gesellschaften und gibt es bereits eine Position zu Forschungsdaten? Wie sehen Infrastruktureinrichtungen ihre aktuellen oder geplanten Aktivitäten in dieser Richtung?

Im Rahmen der Kurzberichte der Vertreter der Fachgesellschaften und Infrastruktur-Einrichtungen bzw. Projekte, die eine Infrastruktur aufbauen wollen oder aufgebaut haben, sind einige wichtige Dinge zur Sprache gekommen. Die beiden überregional wirkenden Asien-Fachgesellschaften, die Deutsche Morgenländische Gesellschaft (DMG) und die Deutschen Gesellschaft für Asienkunde e. V. (DGA), haben hier bislang noch keine strukturierte Aktivität unternommen oder Leitlinien zu diesem Thema erstellt. Die Ziele der DMG sind insbesondere die Förderung der Wissenschaften und die Publikation ihrer Ergebnisse, die sie mit ihrem Organ der ZDMG ausreichend repräsentiert sieht. Da ihre Mitglieder vor allem philologisch arbeiten, liegt ein Interessenfokus der DMG auf dem adäquaten Zugang zu Quellen. Die DMG greift regional zudem noch weiter aus als „asienbezogen“ und vertritt auch Forschung zu Afrika. Die sinologische Fachgesellschaft, die Deutsche Vereinigung für Chinastudien (DVCS), hat in ähnlicher Weise bislang auch noch keine strukturierte Aktivität unternommen. Die 230-250 Mitglieder des DVCS stammen vorwiegend aus dem Mittelbau. Zum aktuellen Zeitpunkt gibt es keine top-down Beratung innerhalb der DVCS im Hinblick auf Forschungsdaten. Die Fachgesellschaft der Koreanistik, die Vereinigung für Koreaforschung e.V. (VfK), hat ebenfalls noch keine Position zum Thema entwickelt, möchte sich aber in die weitere Diskussion einbringen und Ziele mitgestalten.

In beiden vertretenen japanologischen Fachgesellschaften, der Gesellschaft für Japanforschung (GJF) und der Vereinigung für Sozialwissenschaftliche Japanforschung (VSJF), gibt es Mitglieder, die bereits intensiv mit Big Data arbeiten und eine AG der GJF, die sich mit dem Thema Umgang mit Forschungsdaten beschäftigen wird, wurde auf dem Japanologentag (2018) ins Leben gerufen. Ziel der AG ist es, Aktivitäten besser zu vernetzen und ein Positionspapier zu Forschungsdaten zu erstellen.

Im Juli 2018 fand organisiert durch das vom BMBF geförderte Forschungsprojekt „FDM_OAS-Orient“ ein überregionaler Workshop zum Thema „Nicht-lateinische Schriften in multilingualen Umgebungen: Forschungsdaten und Digital Humanities in den Regionalstudien“ an der Campusbibliothek der FU Berlin statt, an dem u.a. Vertreterinnen und Vertreter beider Fachgesellschaften sowie des FID Asien und FID Nahost-, Nordafrika- und Islamstudien teilgenommen haben (siehe den Workshop-Bericht im DHd Blog).

Die anwesenden Infrastrukturvertreter konnten konkreter von bereits bestehenden Strukturen berichten und haben weitere Ziele oder auch spezifische Problematiken thematisiert. Die „Heidelberg Research Infrastructure“ sammelt seit mehreren Jahren bereits Erfahrungen darin, verschiedenste Quellenformate zu speichern und so aufzubereiten, dass damit wissenschaftliche Daten erzeugt werden können. Sie versucht dabei, Grundprinzipien wie Nachhaltigkeit und Anschlussfähigkeit an größere Netzwerke und die strikte Trennung von Metadaten und Daten zu wahren. Forschungsarbeiten aus dem Bereich der Sinologie sind hier erstes Testgebiet. Wenn man noch tiefer in Daten-Projekte hineinschaut, werden weitere Aspekte deutlich. Im Freiburger Projekt zur Chinesischen Kulturrevolution „The Maoist Legacy“ ist eine Datenbank mit Materialien der Kulturrevolution entstanden, die auch anderen Forschern zur Verfügung steht. Da es sich jedoch um z.T. sensible und auch Persönlichkeitsrechte behaftete Daten handelt, mussten mehrere Zugrifflevels eingerichtet werden. Bereits die Speicherung dieser Daten kann Rechtsfragen aufwerfen, die nicht jede Institution bereit oder auch fähig ist zu klären. Die Bibliothek des MPIWG berichtete aus vor allem zwei Bereichen, in denen sie aktuell in Bezug auf Forschungsdaten aktiv ist. Zum einen, das oben erwähnte „übersetzen“ von Datenbeziehungen mittels einer Ontologie, zum anderen die Überlegungen wie mit digitalen, analytischen Werkzeugen auf lizenzgeschützten Materialien gearbeitet werden kann, ohne die entsprechenden Lizenzen zu verletzen. Der zunehmenden Bedeutung von digitalen Datenanalysen auch in den Geisteswissenschaften trägt die Universität Tübingen Rechnung, indem sie einen Masterstudiengang anbietet, der Digital Humanities und Regionalstudien vereint. Auch wenn viel über digitale Daten und DH gesprochen wird, so ist doch weitere Lobby-Arbeit notwendig, damit Ergebnisse und Methoden, die von Forschern entwickelt werden – auch in Fächern wie der Japanologie oder Sinologie – als wissenschaftliche Leistung anerkannt und karrieretechnisch als relevant erachtet werden. Infrastrukturen können (und sollten) also auch ein Qualitätssigel sein und Daten darin somit nicht als „weggeschenkt“ gelten, sondern umgekehrt die Forscher oder das Projekt „prominenter“ machen.

Die FU Berlin brachte zwei weitere wichtige Aspekte bezüglich des digitalen Wandels ein: Erstens wird laut Deutschem Bibliotheksverband (dbv) ein Trend deutlich, dass wissenschaftliche Bibliotheken zu einer passgenauen Informations- und Medienversorgung zunehmend auch zeitgemäße Dienste und Werkzeuge zur Unterstützung des Life-Cycle in Forschung, Lehre und Studium entwickeln und anbieten (siehe: Wissenschaftliche Bibliotheken 2025, hrsg. vom DBV, Jan. 2018).

Zweitens ist es meistens nicht sinnvoll, als Institution den Weg des „digitalen Wandels“ alleine zu bestreiten, auch nicht wenn man die Größe einer Universität hat. Kooperation wird immer wichtiger. In einigen Institutionen fusionieren Datenzentren bzw. Anbieter für digitale Medien und Technologien in Forschung und Lehre mit den Bibliotheken (so in Planung an der FU Berlin) und die drei Berliner Universitäten – HU, FU und TU – wollen gemeinsam mit der Charité Universitätsmedizin einen Verbundantrag im Rahmen der Exzellenzinitiative einreichen (Stand Dez. 2018), in der der digitale Wandel eine zentrale Rolle spielen soll.

Festzuhalten ist, dass der Grad der Bereitschaft zu und die Ausgestaltung von neuen bibliothekarischen Dienstleistungen in den Bereichen Forschungsdatenmanagement und Digital Humanities allgemein sowie für die Regionalwissenschaften im Besonderen stark standortabhängig ist und ein großes Gefälle von Hochschule zu Hochschule aufweist.

Gibt es einen nächsten gemeinsamen Schritt und wie könnte der aussehen?

Voraussichtlich im ersten Quartal 2019 wird die Ausschreibung für NFDI-Konsortien verkündet. Kann man ein solches Angebot der NFDI z.B. nutzen, um gemeinsam auszuloten, wie ein kooperatives Vorgehen in diesen neuen Feldern gestaltet werden könnte? In diesem Zuge müsste auch definiert werden, wie Aktivitäten im Rahmen der zweiten Runde des FID und solche im Rahmen der NFDI verzahnt werden könnten.

Brauchen die asienbezogenen Wissenschaften etwas Vergleichbares wie den „Rat für Sozial- und Wirtschaftsdaten“ (RatSWD), einen „Asien-Rat“, der von politischem Interesse für die Sichtbarkeit der Regionalstudienfächer und ihrer Anforderungen an Forschungsinfrastrukturen ist? Könnte dieser Rat in nationalen Kontexten agieren und die asienbezogene Forschung dort sprechfähig machen? Von welchem nationalen Interesse wäre so ein „Asien-Rat“ bzw. was wären seine Aufgaben?

Bei allen ausformulierten Anforderungen zu Forschungsdaten und Infrastrukturen muss man bedenken, dass zukünftige Forschungsanträge und -ergebnisse daran gemessen werden.

Um das breitere Interesse und die Anforderungen der Forschenden, Lehrenden und Studierenden am Thema Forschungsdaten und Forschungsdateninfrastruktur zu ermitteln, soll eine Umfrage erstellt und über relevante Mailing-Listen, den CrossAsia Newsletter und u.U. auch die Fachgesellschaften verbreitet werden. Die Fachverbände werden gebeten, sich ebenfalls zur Frage zu positionieren (u.U. auch anhand des Fragebogens). Sie sollen zudem Position dazu beziehen, ob und wie sie sich in den weiteren Prozess einbringen wollen.

CrossAsia übernimmt für den Entwurf des Fragebogens die Federführung. Der Entwurf wird im ersten  Quartal 2019 an die Teilnehmerinnen und Teilnehmer der Runde mit Bitte um Kommentierung geschickt.

Zum Abschluss hier noch einige Kommentare, Vorschläge und mögliche Ziele, die im Rahmen der Diskussionen bezüglich Forschungsdaten, den Bedürfnissen der Wissenschaftlerinnen und Wissenschaftler genannt wurden:

  • Position zu Formaten und Standards sollten gemeinsam entwickelt werden.
  • Fragen und Klärungsansätze zu rechtlichen und ethischen Probleme mit Daten sollten zusammengetragen und allen Daten-Forschern klar vor Augen geführt werden.
  • Kooperationen sollten das Ziel haben, aus den verschiedenen konkreten Beispielen Daten-Abstraktionen zu entwickeln, die schließlich das regionalspezifische in den Hintergrund stellen.
  • Asien auch in diesen Kontexten beizubehalten ist als Teil der Lobbyarbeit für die eigene wissenschaftliche Disziplin wichtig.
  • Auch wenn Fachgesellschaften z.T. ihre Bedürfnisse bereits identifiziert haben, mangelt es ihnen an passender Infrastruktur, die sie oft nicht aus eigener Kraft aufbauen können.
  • Solche Aufgaben sollten in einer Governance-Struktur verwirklicht werden, die in der Lage ist, Partikularinteressen nicht zu unterdrücken.
  • Es sollten keine „Daten-Container“ gebaut werden; Ziel sollte vielmehr sein, in Richtung Open Data, Open Science zu gehen.

DFG-Fortsetzungsantrag für den FID Asien bewilligt

Die Staatsbibliothek zu Berlin, die Universitätsbibliothek Heidelberg und das Südasien-Institut der Universität Heidelberg betreiben gemeinsam seit 2016 den FID Asien, der im Rahmen des Förderprogramms „Fachinformationsdienste für die Wissenschaft“ finanziell durch die Deutsche Forschungsgemeinschaft (DFG) unterstützt wird. Nach dem erfolgreichen Abschluss der ersten Projektphase (2016-2018) wurde nun der Fortsetzungsantrag von der DFG bewilligt.

Ziel der zweiten Projektphase (2019-2021) ist es, die Informationsservices zu konsolidieren und diese gleichzeitig als eine Serviceinfrastruktur für die deutschen Wissenschaften im Asienkontext weiterzuentwickeln. Ein zweiter wichtiger Aspekt ist die Öffnung des FID Asien für verschiedene nationale und internationale Kooperationen. Mit sogenannten im Antrag vereinbarten Satellitenprojekten – Projekte, die separat, aber in Kooperation mit dem FID beantragt werden – soll die Öffnung des FID Asien als Infrastruktur-Servicedienstleister erprobt werden, bspw. für die Nutzung der Infrastruktur im Rahmen von Digitalisierungs- und Erschließungsarbeiten.

Was haben wir uns für die kommenden drei Jahre vorgenommen?

  • Fortsetzung des auf disziplinäre sowie inter- und transdisziplinäre und transregionale Fragestellungen in Bezug auf Asien abgestimmten Bestandsaufbaus. Die Staatsbibliothek zu Berlin ist verantwortlich für die Sammlung aus und über Ostasien, Zentralasien sowie Südostasien. Ein besonderes Augenmerk werden wir auf die Länder Südostasiens legen, um auch hier den Bedarf der Fachcommunities noch besser bedienen zu können. Bestehende Kooperationen mit der TIB Hannover – Technische Informationsbibliothek und der ZBW Kiel – Leibniz-Informationszentrum Wirtschaft wollen wir ausbauen. Mit der SUB Göttingen soll darüber hinaus eine engere Kooperation bezüglich des Bestandsaufbaus zu Literatur in uighurischer und mongolischer Sprache angestrebt werden. Die Universitätsbibliothek Heidelberg verantwortet den Bereich Südasien.
  • Weiterentwicklung der Services von CrossAsia-ePublishing um die Möglichkeit des interaktiven und vernetzten sowie multimedialen Publizierens im Sinne von „enhanced publications“, sodass sie noch flexibler, nachfrage- und serviceorientierter gestaltet sind und noch besser auf die Anforderungen der Wissenschaftlerinnen und Wissenschaftler reagiert werden kann.
  • Weiterentwicklung der CrossAsia-Suche, Ergänzung dieser um neue Suchräume und Ausbau durch Kooperationen mit anderen Einrichtungen.
  • Erprobung eines neuen, regional strukturierten Zugangs zu den Inhalten des FID Asien, um die Angebote zu Zentralasien, Südasien und Südostasien prominenter, sicht- und erlebbarer werden zu lassen.
  • Fortsetzung der Überführung weiterer Daten im Routineverfahren ins CrossAsia Integrierte Textrepositorium (CrossAsia ITR).
  • Erweiterung des CrossAsia ITR als Infrastruktur für Digitalisierungs- und Erschließungsprojekte sowohl von Text- als auch verschiedensten nicht-textuellen Daten wie z.B. Bildmaterialien. Ziel ist es, Satellitenprojekten die Möglichkeit zu geben, die Infrastruktur beispielsweise für die Erschließung ihrer Daten zu erproben.
  • Aufbau und Etablierung einer Angebots-, Informations- und Beratungsstruktur zu asienbezogenen Forschungsdaten.

Mehr zu den Aktivitäten des FID Asien sowie insbesondere auch die Antragstexte für den FID Asien finden Sie auf unseren Über CrossAsia-Seiten. Dort finden Sie übrigens auch noch zahlreiche weitere Informationen zu unseren zahlreichen Tätigkeitsbereichen, wie dem Datenmanagement, der Suche, oder der Lizenzierung.

Diese Vorhaben und Aktivitäten werden nach wie vor in enger Abstimmung mit unserem Wissenschaftlichen Beirat erfolgen. Wir berichten auch in den kommenden Monaten über die Entwicklungen und Ergebnisse der einzelnen Arbeitspakete und Module des FID Projekts hier im Blog. Die kontinuierliche Rückkopplung mit der Fachcommunity ist uns ein großes Anliegen. Bei jeglichen Fragen zu unseren Angeboten sowie Wünschen und Verbesserungsvorschlägen freuen wir uns über Ihre Nachricht unter: x-asia@sbb.spk-berlin.de

Gesamtkatalog der indonesischen Handschriften der Staatsbibliothek zu Berlin

Nach einer fast dreimonatigen Seefahrt von Jakarta nach Deutschland sind vor kurzem mehrere große und schwere Pakete in der Staatsbibliothek eingetroffen. Darin enthalten der erste Gesamtkatalog der indonesischen Handschriften der Staatsbibliothek – jedes Katalogexemplar im A4-Format, zwei Kilogramm schwer und 873 Seiten dick. Der Katalog ist des Ergebnis einer äußerst fruchtbaren Kooperation mit dem Indonesischen Nationalmuseum, die jetzt im Nachgang der im Oktober 2015 im Dietrich-Bonhoeffer-Saal der Staatsbibliothek stattgefundenen indonesischen Handschriftenausstellung „SchriftSprache – Aksara dan Bahasa“ zu einem solch „schwergewichtigen“ Ergebnis geführt hat. Korrekterweise müsste man zwar eigentlich von „Nusantara-Handschriften“ sprechen, denn Indonesien im heutigen Verständnis gab es zur Entstehungszeit der Handschriften noch nicht, aber da diese Bezeichnung auch international der Einfachheit halber üblich ist, wurde sie auch für diesen Katalog so übernommen.

Ein Katalogisierungsprojekt von Handschriften aus der ganzen Nusantara-Region würde jeden Experten vor eine unlösbare Aufgabe stellen: es gibt einfach zu viele Sprachen und auch Schriften. So konnte der Katalog auch nur von einem Expertenteam zusammengestellt werden. Die Finanzierung des Aufenthalts der jeweiligen Sprachexpert*innen in Berlin und auch des Druckes erfolgte ausschließlich durch das Indonesische Nationalmuseum. Folgende Wissenschaftler haben die Katalogeinträge erstellt: Abimarda Kurniawan, I Made Suparta, Kartika Setyawati, Lisa Misliani, Muhlis Hadrawi, Munawar Holil, Titik Pudjiastuti und Ulrich Kozok. Teilweise konnte auf bereits vorhandene Kataloge aus der Reihe des VOHD (Verzeichnis der Orientalischen Handschriften in Deutschland) oder andere Altkataloge zurückgegriffen werden; viele Handschriften wurden aber auch erstmals beschrieben. Von vielen Handschriften wurden Beispielbilder und Scans von Textauszügen beigegeben, vor allem von den Nichtpapierhandschriften wie z.B. den Batak-Pustaha auf Baumbast aus Sumatra und den Lontarpalmblatthandschriften aus Bali und Java.

Mittlerweile sind bereits mehr als 40% der Kataloginhalte in die Online-Datenbank www.orient-digital.de eingespielt worden; der Rest wird zeitnah ergänzt. Auch ein PDF des Katalogs ist in Vorbereitung und wird in Kürze als download bereitgestellt. Der Papier-Katalog kann über das Sekretariat der Orientabteilung bestellt werden.

Titik Pudjiastuti, Thoralf Hanstein (editors): Catalogue of Indonesian manuscripts – Collection Staatsbibliothek zu Berlin – Preußischer Kulturbesitz. Bali-Java-Kalimantan-Lombok-Madura-Sulawesi-Sumatra-Sumbawa. Jakarta, Museum Nasional Republik Indonesia. 2016

Der Beitrag wurde von Dr. Thoralf Hanstein, Fachreferent für Arabistik, verfasst und erschien zuerst am 10.09.2018 im Blog der Staatsbibliothek

Buchmesse in Phnom Penh

Vom 7.-9. Dezember 2018 fand in Phnom Penh bereits zum 7. Mal eine Buchmesse statt, die sich zu dem wichtigsten Ereignis für kambodschanische Verlage, Autoren und Leser entwickelt hat. Die Autorin hat dran teilgenommen, mit zahlreichen Verlegern und Autoren gesprochen und Neuerscheinungen in Khmer gekauft.

Die Messe stand unter dem Motto „Living Books, Growing Knowledge“ und fand auf dem Gelände der Nationalbibliothek, einem Gebäude im Kolonialstil, das 1924 errichtet wurde, statt. Unter den großen Bäumen bezogen die Aussteller insgesamt 115 Stände. Aussteller- und Besucherzahlen sind im Laufe der Jahre kontinuierlich angestiegen. Während 2017 über 50 000 Besucher gezählt wurden, waren es 2018 bereits 130 000. Damit wurde die erwartete Besucherzahl von 70 000 weit übertroffen. Organisiert wurde die Buchmesse vom Ministerium für Kultur und Schöne Künste in Zusammenarbeit mit dem Ministerium für Bildung, Jugend und Sport, der Nationalbibliothek und etlichen Partnerorganisationen. Zu dem Erfolg hat wesentlich eine große Zahl von Freiwilligen beigetragen.

Den Organisatoren zufolge besteht das Ziel der Buchmesse darin, die Bedeutung von Büchern in den Fokus der Öffentlichkeit zu rücken, die Freude am Lesen zu fördern sowie kambodschanische Autoren und Verlage zu unterstützen.

Während der drei Tage konnten sich die Besucher über neue Buchpublikationen informieren und diese auch gleich kaufen, mit Autoren diskutieren und an Lesungen teilnehmen. Speziell für Kinder gab es ein vielfältiges Programm mit Bühnenshows, Vorleserunden und anderen Aktivitäten.

Der größte Teil des Publikums waren Jugendliche und junge Erwachsene. Auffallend viele junge Mönche besuchten die Buchmesse und interessierten sich besonders für Sachliteratur wie z.B. über Rhetorik oder Geschichte.

Zu den Ausstellern gehörten große und kleine, bereits etablierte und neue Verlage. Der Direktorin der Nationalbibliothek, Frau Khlot Vibola, zufolge gibt es in Kambodscha ca. 800 Verlage. Autoren wie Frau Ouk Samnang, Herr Chhay Sophal oder Herr Hoeu Hin hatten eigene Stände und präsentierten ihre neuen und alten Bücher, die sie auf Wunsch gerne signierten. Junge Autoren nutzen die Gelegenheit zur Selbstvermarktung ihrer Bücher. Zahlreiche Organisationen und Institutionen wie z. B. der Kambodschanische Schriftstellerverband, The Asia Foundation, das Cambodia Development Resource Institute (CDRI), das Buddhistische Institut und verschiedene Bibliotheken stellten sich dem Publikum mit ihre Publikationen und Dienstleistungen vor.

Vor allem unter den jüngeren Kambodschanern besteht offenbar ein außerordentlich großes Interesse an Sachbüchern zu allen möglichen Themen und an Ratgeberliteratur (besonders Betriebswirtschaft, Lebensführung). Dabei handelt es sich zum großen Teil um Übersetzungen aus dem Englischen ins Khmer. Beliebt sind auch chinesische Romane, die ins Khmer übersetzt werden. Unter jungen Leuten sehr gefragt sind Liebesromane. Kanha Poa Svay („Fräulein Lila“) verfasst nach eigenen Angaben bis zu 10 Titel pro Jahr. Andere vertreiben ihre Romane fast ausschließlich über das Internet (z.B. Blue Romance Novel).

Verlage und Autoren beklagen sich seit Jahren darüber, dass Urheberrechtsverletzungen nicht geahndet werden. Oft kursieren bereits wenige Tage nach Veröffentlichung eines Werkes Raubkopien, was Autoren entmutigt und Verleger sehr zögerlich macht.

Premierminister Hun Sen hat anläßlich der Buchmesse 80 000 Freiexemplare von Werken der beiden bekannten kambodschanischen Autoren Krom Ngoy und Ou Chong sowie eine zweibändige Ausgabe der alten indischen Fabeln Hitaupades (Hitopadesha) gestiftet.

Die 2018 von der Staatsbibliothek zu Berlin in Kambodscha erworbenen Bücher stehen den Nutzerinnen und Nutzern in wenigen Wochen über die Kataloge der Staatsbibliothek zur Verfügung.

Neu bei CrossAsia-eJournals: südostasien – Zeitschrift für Politik • Kultur • Dialog

Die Zeitschrift südostasien – Zeitschrift für Politik Kultur Dialog erscheint seit 1998 viermal jährlich und berichtet über aktuelle Entwicklungen in Politik, Kultur, Ökologie, Ökonomie und Gesellschaft der Länder der Region Südostasien. Hervorgegangen ist sie aus den Zeitschriften philippinenforum und den südostasien informationen.

Aufgrund einer Kooperation mit der Stiftung Asienhaus, dem philippinenbüro und der Südostasien Informationsstelle konnten nun alle bisher erschienenen Bände der Zeitschrift südostasien – Zeitschrift für Politik Kultur Dialog über CrossAsia-eJournals online zugänglich gemacht werden. Die Vorgängerzeitschrift südostasien informationen ist in Vorbereitung und wird im Frühjahr 2019 als Online-Journal ebenfalls über CrossAsia-eJournals zugänglich sein.

Die in der Zeitschrift veröffentlichten Aufsätze mit direktem Zugang zum Volltext werden nach und nach im Südwestdeutschen Bibliotheksverbund (SWB) erfasst und sind somit auch in der CrossAsia-Suche nachgewiesen.

Das Projekt steht im Kontext des Arbeitsschwerpunkts “Elektronisches Publizieren im Open Access” innerhalb des DFG-geförderten “Fachinformationsdienst Asien”.

Newsletter Nr. 17

Liebe CrossAsia-Nutzerinnen, liebe CrossAsia-Nutzer,

seit unserem letzten Newsletter im Frühjahr ist viel passiert. Wir haben im Mai den Folgeantrag für die zweite Förderphase des FID bei der DFG gestellt. Das bedeutet zugleich, dass wir kurz vor dem Ende der aktuellen Projektlaufzeit stehen. Zeit für einen kurzen Rückblick und eine Vorausschau:

Der bereits im Frühjahr freigeschalteten Betaversion der CrossAsia Volltextsuche (Typ A), die als „geführte Suche“ charakterisiert werden kann, wurde kürzlich eine zweite, mehr „explorative“ Betaversion einer Volltextsuche zur Seite gestellt (Typ B). Zugänglich sind beide Suchen über unsere neue Einstiegsseite zur CrossAsia Volltextsuche. Die Suchen wurden zudem um weitere Inhalte ergänzt. So sind nun auch zahlreiche englischsprachige Texte aus Archivmaterialien enthalten, weitere vormoderne chinesische Texte – Lokalmonographien, das Siku quanshu und historische Materialien aus der Qing-Zeit – sowie ein kleines, aber wachsendes Paket an eBooks mit aktuellen chinesischsprachigen wissenschaftlichen Publikationen. Die Suche wird auch weiterhin kontinuierlich um neue Inhalte und Features ergänzt. Lesen Sie mehr zum aktuellen Stand der Volltextsuchen im Beitrag „Noch mehr Volltextsuche für alle!“. Wir würden uns über Ihre Eindrücke und Ihr Feedback zu den zwei Volltextsuchen freuen (gerne im Forum oder per E-Mail). Teilen Sie uns mit, welche Funktionalitäten aus Ihrer Sicht sinnvoll sind, welche fehlen und was wir noch besser machen können.

Im Laufe diesen Jahres haben wir begonnen, besondere Sammlungen und Sammlungssegmente innerhalb unserer Bestände in Form von „Themenportalen“ vorzustellen und über die jeweiligen Recherchewege zu diesen bzw. die Nutzungsmöglichkeiten derselben zu informieren. Inzwischen sind bereits neun solcher Themenportale online. In den jüngsten zwei Präsentationen stellen wir das „Berlin-Kraków Projekt“ vor, dessen Ziel eine virtuelle Rekonstruktion der alte Ostasiensammlung der Preußischen Staatsbibliothek ist, sowie die „Bibliothek Otsuka“, die Sammlung des marxistisch geprägten Wirtschaftswissenschaftlers und Dichters Ōtsuka Kinnosuke (1892-1977).

In den kommenden drei Jahren – vorbehaltlich einer Zusage seitens der DFG – wird der FID sich auf ausdrücklichen Wunsch aus der Fachcommunity hin über die aktuell laufenden Entwicklungen und Aktivitäten hinaus zwei neuen Kernthemen widmen:

Erstens ist der Aufbau einer Informations- und Beratungsstruktur für asienbezogene Forschungsdaten geplant. Hierbei sollen sowohl Anwendungsfragen seitens der Wissenschaft berücksichtigt werden, als auch Aktivitäten auf nationaler Ebene, wie beispielsweise von RADAR und DARIAH-DE sowie die Empfehlungen des Rats für Informationsinfrastrukturen (RfII) zu Fragen im Bereich Forschungsdaten, Forschungsdatenmanagement und Datenkuratierung. Zweitens ist der Ausbau des ITR als Infrastruktur für digitale Objekte in allen Formaten geplant. Hier ist das Ziel, Digitalisierungs- und Erschließungsprojekten auch anderer Institutionen eine Infrastruktur beispielsweise für die Metadatenerzeugung anzubieten. Mehr dazu erfahren Sie in den kommenden Monaten hier im Blog.

Anbei finden Sie auch wieder die wichtigsten Blogbeiträge der vergangenen Monate im aktuellen CrossAsia Newsletter zum Nachlesen:

Neu lizenzierte Datenbanken

Frauenzeitschriften Fujin kôron und Fujin gahô

JapanKnowledge mit neuen Inhalten

NKScholar und 스콜라 Scholar

Diaolong 雕龍 – Portal

China Comprehensive Gazetteers 中國綜合方誌庫

Area Studies: China and Southeast Asia sowie Area Studies: Japan

China: Culture and Society

Interessantes und neue Entwicklungen aus CrossAsia

Noch mehr Volltextsuche für alle!

Wo landen eigentlich die bibliografischen Daten der elektronischen Titel?

Neue Themenportale

Berlin-Kraków Projekt

“Bibliothek Otsuka”

CrossAsia-eBooks

‚Neue Hallesche Berichte‘ online zugänglich – Kooperation zwischen den Franckeschen Stiftungen und CrossAsia-eBooks

„HerStory. Historical Scholarship between South Asia and Europe” – Festschrift zu Ehren von Professor Dr. Gita Dharampal-Frick

 

Seien Sie mit uns zusammen gespannt, wie es weitergeht und drücken Sie uns die Daumen für den FID-Antrag.

Viel Spaß beim Lesen des Newsletters wünscht Ihnen Ihr

CrossAsia-Team

Noch mehr Volltextsuche für alle!

Seit April steht bereits die erste Version der CrossAsia Volltextsuche zur Verfügung. Wir hatten damals über das CrossAsia Integrierte TextRepositorium (ITR) berichtet, und die Suche als eine Spitze dieses sonst von außen nicht sichtbaren „Eisbergs“ kurz vorgestellt. Seither ist viel passiert. Das ITR und die in die Volltextsuche eingebetteten Ressourcen sind kontinuierlich gewachsen und wir konnten jetzt auch eine zweite Variante der Volltextsuche freischalten. Zu beidem finden Sie mehr Details weiter unten. Ein wichtiger Punkt bei der Volltextsuche für uns ist, sie so anzubieten, dass sie *allen* Nutzer*innen zur Verfügung steht, also auch solchen, die keinen Zugang zu den jeweiligen Datenbanken haben bzw. deren Zugang nicht über CrossAsia ermöglicht wird. Damit fügt sich die Volltextsuche harmonisch in das Profil der eher „bibliographischen“ CrossAsia Suche ein, die ebenfalls frei zur Verfügung steht.

Schnipsel und Links

Die Treffer in der CrossAsia Volltextsuche werden als sehr kurze und fragmentierte Textschnipsel ausgegeben. Nur so ist es möglich, die Suche für alle zu öffnen und dabei die für diese Ressoucen vereinbarten Lizenzbedingungen zu wahren. Auch Nutzer*innen ohne Zugang zu den jeweiligen Datenbanken wird damit die Möglichkeit gegeben, einen Eindruck zu gewinnen, welche Quellen u.U. relevant für die eigene Fragestellung sind. Über verschiedene Links in den Treffern gelangt man zur kompletten Quelle. Für authentifizierte CrossAsia-Nutzer*innen führt das ‚rot‘ gefärbte Icon direkt zum Objekt im originalen Kontext der Datenbank; für Nutzer*innen mit anderen Zugangsmöglichkeiten – z.B. über den IP-Range ihrer Institution oder ein individuelles Login – wird parallel ein ‚graues‘ Icon angeboten. „Direkt zur Quelle“ bedeutet für die verschiedenen Ressoucen dann doch verschiedenes. In jedem Fall stellen wir möglichst treffgenaue Links zur Verfügung. D.h. wenn der Datenbankanbieter uns das ermöglicht, wird die entsprechende Seite angesteuert, in anderen Fällen gelangt man zumindest zum Buch oder Artikel und muß dort dann die im Treffer angegebene Seite (bzw. Imagenummer) aufschlagen. In einigen Fällen jedoch stehen nur Links zur jeweiligen Datenbank zur Verfügung. Hier ist der Weg dann etwas weiter bis zur Fundstelle (so aktuell z.B. der Fall für die People’s Daily und die Lokalmonographien der Erudition-Datenbank).

Noch mehr Volltexte für die Suche

Der Korpus an Texten, die in der CrossAsia Volltextsuche durchsucht werden können wächst kontinuierlich. Aktuell dominieren chinesische Texte und englische Texte mit Chinabezug, aber weitere Ressourcen, die auch für die Japan-, Korea- und weitere asienbezogene Forschung relevant sind, befinden sich bereits in der Pipeline. Aktuell können die Inhalte der folgenden, über CrossAsia lizenzierten Datenbanken recherchiert werden:

  • Adam Matthew – China, America, Pacific
  • Adam Matthew – China Trade & Politics
  • Adam Matthew – Foreign Office Files China
  • 道藏輯要
  • 中國地方誌 一集 (雕龍)
  • 中國地方誌 續集 (雕龍)
  • Missionary, Sinology, and Literary Periodicals (1817-1949)
  • Local Gazetteers (Erudition)
  • 人民日报 : People’s daily (1946-2009)
  • 清代史料
  • 四庫全書
  • 續修四庫全書

Darüberhinaus sind in die Volltextsuche einzelne lizenzierte Bände aus den Airiti und CNKI ebook-Portalen integriert, sowie ein Testsample an gedruckten Beständen, für die wir selbst mittels OCR einen Index erstellt haben. Zusammen sind das aktuell: 120 Tausend Titel (Buch- und Artikeltitel) mit über 13 Millionen Seiten. Das ist schon eine ziemlich große Eisbergspitze.

Noch mehr Suche für die Volltexte

Einigen Nutzer*innen ist die CrossAsia Volltextsuche Typ A mittlerweile schon vertraut. Jetzt haben wir ihr eine Volltextsuche Typ B zur Seite gestellt. Charakterisieren lassen sich die beiden als „geführte Suche“ (Typ A) und „explorative Suche“ (Typ B).

Typ A nimmt als Anker für die Suche Einheiten wie z.B. ein Buch oder eine Tagesausgabe der People’s Daily und verwendet die Anzahl der Seiten/Artikel mit Treffern darin als Kriterium für die Reihenfolge der Anzeige. Ein Buch mit mehr Seiten auf denen der Suchterm erscheint, wird also höher gerankt. Die „Anker“ bzw. Bücher etc. werden im Suchergebnis in der linken Spalte in diesem Ranking angezeigt; wählt man ein Objekt dort aus, erscheinen die Seiten mit Treffern aus dem ausgewählten Objekt in der mittleren Spalte. Diese sind nach Seitenzahl geordnet. Mit Hilfe der Filter in der rechten Spalte kann man die Treffermenge dann weiter reduzieren bzw. fokusieren. Es wird in Typ A  *nur* in den Inhalten der Seiten gesucht und diese Inhalte zu ihren jeweiligen Büchern o.ä. gebündelt ausgegeben.

Hier die Funktionen der drei Seitenbereiche von Typ A im Überblick:

Typ B behandelt alle Objekte gleichberechtigt. D.h. Bücher, Artikel oder Archivalien und die einzelnen Volltextseiten werden auf ihre Relevanz in Bezug auf den Suchterm vom Index bewertet und in der Reihenfolge dieser Bewertung (dem „score“) als Treffer ausgeliefert. Metadaten, Bescheibungen, Autorennamen, Volltexte – alles wird durchsucht und in bunt gemischter Reihe ausgegeben. Über Filter auf der linken Seite kann der Typ der Trefferobjekte gewählt werden (also ob nur Seiten oder nur Bücher bzw. Artikel und ihre Metadaten ausgeben werden sollen) oder auch Filter wie Jahr, subject u.ä. eingestellt werden. Dies kann wiederum nachträglich geschehen, in Typ B aber auch bevor ein Suchterm eingegeben wurde. Zu beachten hier ist, daß aktuell für Seiten keine inhaltlichen Filter zur Verfügung stehen. IE jenseits von Edge setzen die Filterfunktion nicht korrekt um.

 

Einen kurzen Überblick gibt auch die neue Einstiegsseite für die CrossAsia Volltextsuche. Mehr Informationen zu den jeweiligen Besonderheiten der beiden Such-Typen können über das „i“ hinter den Suchschlitzen aufgerufen werden.

Und was kommt dann?

Beide Suchmodi lösen Schranken zwischen verschiedenen Quellenkorpora und Texttypen auf, die durch die individuellen Datenbankzugänge geschaffen wurden, und ermöglichen damit – so hoffen wir – neue, bessere Wege, sich einen Überblick über die Quellenlage zu verschaffen und das Umfeld eines Suchterminus in einem möglichst breiten Spektrum von Texten zu ergründen. Details aus verschiedenen Datenkorpora werden gemeinsam angezeigt und werden jenseits der von der Datenbank vorgegebenen Logik ansteuerbar. Das ist ein wichtiger, aber doch auch nur ein erster Schritt. Um sich in diesen großen Mengen an Text nicht zu verlieren, wollen wir gemeinsam mit unseren Nutzern überlegen, wie innovative Rechereche- und Zugangsmodi aussehen könnten. Um zudem diese große Menge an Text für neue Forschungsfragen in den digitalen Geisteswissenschaften zu erschließen, arbeiten wir an Schnittstellen, über die Projekte (große und individuelle) mit diesen Daten in Zukunft arbeiten können, aber auch an Wegen über ein pre-processing diese Texte nicht nur über die Metadaten ihrer bibliographischen Einheit zu charakterisieren, sondern auch „aus sich selbst heraus“, d.h. mit Hilfe von automatisierter Textanreicherung und statistischen Auswertungen von Kollokationen u.ä. weitere Formen von „Metadaten“ zu generieren.

Über Hinweise, Feedback, Vorschläge, Kritik sind wir dankbar! Am besten direkt an x-asia@sbb.spk-berlin.de

(For a short English description of the CrossAsia Fulltext Search and the two types of searches please go to the entry page of CrossAsia Fulltext Search and the „i“ next to the search slot in both versions of the search)

 

Newsletter Nr. 16

Liebe CrossAsia-Nutzerinnen, liebe CrossAsia-Nutzer,

 

CrossAsia ist mit einer Fachtagung in das Jahr gestartet. Für diejenigen, die nicht dabei sein konnten, haben wir einen Bericht vorbereitet.

2018 stehen wir vor der Aufgabe, einen neuen FID-Antrag zu stellen, um unsere Services für Sie auch weiterhin anbieten und vor allem ausbauen zu können. Wir werden Sie darüber auf dem Laufenden halten.

Außerdem haben wir einige neue Datenbanken, Themenportale und eBook-Publikationen für Sie bereitgestellt, die CrossAsia-Suche verbessert und auch das Integrierte Text-Repositorium macht Fortschritte. Falls Sie die Neuerungen noch nicht ausprobieren konnten, können Sie sich unter den folgenden Links einen ersten Überblick verschaffen:

 

Über die CrossAsia Fachtagung 2018

Zwei neue Themenportale in CrossAsia

Vier neue Datenbanken lizensiert

Neue Datenbank: North China Standard Online

Neue Datenbank: Asia and the West: Diplomacy and Cultural Exchange

Zwei neue Veröffentlichungen bei CrossAsia-eBooks

CrossAsia Suche schlägt eine „Brücke“ zwischen elektronischer Recherche und gedrucktem Buch

DBpia und KISS in CrossAsia Suche integriert

CrossAsia ITR – was schon ist und was noch kommt

CrossAsia Volltextsuche (Beta)

 

Wir hoffen, dass Sie uns auch weiterhin mit Interesse und Aufmerksamkeit begleiten und von unseren Angeboten regen Gebrauch machen!

 

Viel Spaß beim Lesen des Newsletters wünscht Ihnen Ihr

 

CrossAsia-Team

CrossAsia ITR Volltextsuche (Beta)

Heute ist eine erste Beta-Version der Volltextsuche im Rahmen der CrossAsia Suche online gegangen. Die Volltexte stammen aus dem CrossAsia Integrierten Textrepositorium (CrossAsia ITR), eine im Rahmen der ersten Projektphase des FID aufgebauten Infrastruktur zur Archivierung und Bereitstellung von digitalen Objekten wie Bildern, Texten und Metadaten. Aktuell kann in folgenden Kollektionen recherchiert werden:

  • 人民日报 : People’s daily (von der ersten Ausgabe 1946 bis Ende August 2009, insgesamt 23.074 Ausgaben mit 1.594.648  Artikeln)
  • Foreign Office Files China (7892 Dokumente mit insgesamt 983.201 OCR-generierten Volltextseiten)
  • 續修四庫全書 (5445 Buchtitel mit 2.311.561 Seiten)
  • Local Gazetteers (2000 Buchtitel mit 2.496.431 Seiten)
  • 道藏輯要 (299 Buchtitel mit 21.237 Seiten)
  • Airiti ebooks (75 lizenierte eBook-Titel mit 26.654 Seiten)
  • Fulltext search in print books (15 Titel aus unserem Bestand, für die wir testweise einen durchsuchbaren Volltext mit OCR erstellt haben, insgesamt 4619 Seiten)

Zur CrossAsia ITR Volltextsuche gelangen Sie über den 4. Reiter auf der CrossAsia Suche oder auch direkt. Auf der Einstiegseite zur Suche – sowie unter dem (i) in der ITR Suche – finden Sie Erläuterungen zu den Besonderheiten der Suche und Hinweise zur Verwendung.

Viel Spaß beim Ausprobieren und wir freuen uns über Feedback unter x-asia@sbb.spk-berlin.de.

 

CrossAsia ITR – was schon ist und was noch kommt

Der Aufbau einer Infrastruktur für Meta- und Volltextdaten bildet als Aktionsfeld 4 einen zentralen Teil der Aufgaben, die sich CrossAsia im Rahmen der ersten FID-Phase gestellt hat. Wie kurz auf unserer Seite „Über CrossAsia“ ausgeführt, dient das „Integrierte Text-Repositorium“ CrossAsia ITR zum einen der Aufgabe, Texte, Bilder und Metadaten der für CrossAsia lizenzierten Datenbanken sicher und nachhaltig zu archivieren, zum anderen bietet es die Möglichkeit, diese Inhalte nahtlos in aktuelle und zukünftige CrossAsia Services einzubinden und im Rahmen der digitalen Wissenschaften für Analysen, Explorationen, Anreicherungen und Visualisierungen anbieten zu können. Das ITR ist dabei nicht *nur* ein Lager (z.B. auch für Forschungsdaten), sondern eine komplexe Infrastruktur mit Workflows und technischen Routinen für das Einspielen, Verwalten, und die Bereitstellung der Objekte des ITR (siehe Abbildung 1).

Abbildung 1: CrossAsia ITR Systemarchitektur

 

Wo finde ich denn das CrossAsia ITR und was ist drin?

Wie bei Lagern, Magazinen, Repositorien zumeist die Regel, ist auch das CrossAsia ITR vor allem Infrastruktur, d.h. es *ermöglicht* Dinge ohne selbst unmittelbar sichtbar und greifbar zu werden. Mit einer Reihe von Metadaten ragt das ITR, wie die Spitze eines Eisbergs, jedoch bereits in die CrossAsia Suche hinein. Dies sind z.B. alle 5.445 Titel des Xuxiu Siku quanshu, die 299 Titel aus dem Daozang jiyao, 7.099 eBook Titel, die über Airiti als PDA angeboten werden, und 7.892 Objekttitel der Foreign Office Files China. Einen Überblick darüber, was aktuell in die CrossAsia Suche integriert ist, erhalten Sie bei Klick auf das „i“ neben dem Suchschlitz der CrossAsia Suche. Wie gewohnt bieten diese Treffer einen CrossAsia Link, mit dem das Objekt in der Datenbank aufgerufen werden kann.

Weitere Kontingente an Metadaten und digitalen Objekten, die entweder bereits ins ITR integriert sind bzw. sich auf dem Weg dorthin befinden, sind die Metadaten der Zhonghua Ancient Book und Pishu Datenbanken, die Metadaten und Texte der Renmin Ribao (1946-2009) und Zhongguo fangzhiku, sowie Metadaten, Texte und Images der Datenbanken Meiji Japan, Siku quanshu, Qingdai shiliao, China, America and the Pacific, sowie China, Trade and Culture (Stand April 2018). Die Idee und Aufgabe von Metadaten-Objekten im ITR ist auch, eine Art „Regalplatz“ zu bilden, an dem in Zukunft z.B. das PDF des gesamten Titels abgelegt werden kann und Volltexte und digitale Bilder der Einzelseiten des Titel angehängt werden können. Alle Objekte des ITR sind adressierbar und werden mit Zugriffsrechten versehen.

Die Volltexte dieser im ITR archivierten Objekte können über eine „CrossAsia ITR Suche“ von Nutzerinnen und Nutzern recherchiert werden, um relevante Texte im CrossAsia Angebot zu entdecken und diese dann in den entsprechenden Datenbanken authentifiziert aufrufen zu können. Das ist sozusagen die zweite Spitze des ITR-Eisbergs. Die Volltext-Ressourcen des ITR werden seit April 2018 in zunächst einer prototypischen Beta-Version für eine CrossAsia Volltext-Suche eingebunden; demnächst folgt eine zweite Beta-Version mit anderen Suchoptionen. Dazu in Kürze mehr für Sie zum Testen und mit Erläuterungen der Funktionalitätenhier im Blog.

Experimentelle und analytische Zugänge zu den Objekten des ITR

In Zukunft wird das ITR uns und unseren Nutzerinnen und Nutzern weitere, deutlich flexiblere und auch experimentelle, explorative und analytische Zugänge und Gesamtschauen von Beständen bieten. Um Nutzerinnen und Nutzern das direkte Arbeiten mit den Beständen mittels digitaler Tools zu ermöglichen wird das ITR mit Schnittstellen ausgestattet, die – unter Einhaltung der Lizenzbedingungen – ein möglichst nahtloses Arbeiten mit den Volltexten ermöglichen sollen (für einen Entwurf einer Struktur, die diese Zugriffe reguliert und ermöglicht, siehe Abbildung 2).

Abbildung 2 – Architektur Schnittstelle

Das ITR soll weiterhin als Arbeitsplattform ausgebaut werden, die es einzelnen Nutzerinnen und Nutzern sowie Forschergruppen erlaubt, z.B. eigene Transkriptionen und Erschließungen von gescannten Texten und Bildmaterialien zu erstellen und diese über kontrollierte Workflows in das ITR zurückzuspielen und dort zu sichern, um sie wiederum über die ITR Suche anbieten zu können.

Das CrossAsia ITR hat das Ziel, der CrossAsia Community eine neue Sicht auf und neue Formen der Recherchen in den über CrossAsia angebotenen Materialien zu ermöglichen. Damit wollen wir Rechercheangebote für die digitalen Wissenschaften von heute entwickeln und die Grundlage für Forschungsanliegen von morgen legen. Das CrossAsia Team freut sich darauf, die Möglichkeiten der Recherche in den Volltexten des ITR gemeinsam mit der Community auszutesten und die Entwicklungen weiter voranzutreiben. Wir freuen uns über Ihre Rückmeldungen, Verbesserungsvorschläge und Ideen.

Über die neue Kategorie im CrossAsia Blog zu „ITR und Entwicklungen“ halten wir Sie über die weiteren Entwicklungen auf dem Laufenden.