Forschungsdaten in den asienbezogenen Wissenschaften
Bericht zum Workshop am 6. Dezember 2018, 11-15 Uhr, in der Staatsbibliothek zu Berlin
Teilnehmerinnen und Teilnehmer des Workshops
Matthias Arnold (Heidelberg Research Architecture, Universität Heidelberg)
Prof. Carmen Brandt (DGA, Universität Bonn)
Daniela Claus-Kim (FU Berlin)
Dr. Carolin Dunkel (Staatsbibliothek zu Berlin)
Christian Dunkel (Staatsbibliothek zu Berlin)
Dr. Tania Becker von Falkenstein (DVCS, TU Berlin)
Prof. Robert Horres (Universität Tübingen)
Matthias Kaun (Staatsbibliothek zu Berlin)
Dr. Florian Kräutli (MPI Wissenschaftsgeschichte)
Hanno Lecher (Bereichsbibliothek Ostasien, UB Heidelberg)
Prof. Daniel Leese (The Maoist Legacy, Universität Freiburg)
Jens Ludwig (Stiftung Preußischer Kulturbesitz)
Maximilian Mehner, M.A. (DMG Südasien, Universität Marburg)
Nicole Merkel (UB Heidelberg)
Dr. Florian Pölking (VfK, Universität Bochum)
Prof. Cornelia Reiher (VSJF, FU Berlin, CrossAsia Fachbeirat)
Prof. Florian C. Reiter (DMG, HU Berlin)
David Schulze (Stiftung Wissenschaft und Politik)
Prof. Yvonne Schulz Zinda (VfK, Universität Hamburg)
Dr. Miriam Seeger (Staatsbibliothek zu Berlin)
Dr. Martina Siebert (Staatsbibliothek zu Berlin)
Franziska Trempler (Staatsbibliothek zu Berlin)
Dr. Cosima Wagner (GJF, Campusbibliothek, FU Berlin)
Prof. Urs Matthias Zachmann (GJF, FU Berlin)
Protokoll: Dr. Martina Siebert
Der FID Asien hat zum 6. Dezember 2018 nach Berlin eingeladen, um zum Thema Forschungsdaten in den Asienwissenschaften ins Gespräch zu kommen. Eingeladen waren sowohl Repräsentanten der relevanten Fachgesellschaften (DGA, DMG, DVCS, GJF, VfK, VSJF) als auch Vertreterinnen und Vertreter von Projekten und Institutionen, in denen größere Mengen an Daten in eigenen Infrastrukturen generiert und gehostet werden. Gemeinsam ist allen Teilnehmerinnen und Teilnehmern die Aufgabe, sich um die langfristige Sicherstellung der Zugänglichkeit und die Nachhaltigkeit von Forschungsdaten kümmern zu wollen bzw. zu müssen, auch um die Anforderungen der DFG diesbezüglich zu erfüllen. Eines der Ziele war es, zu diskutieren, ob der FID Asien sich in diesem Bereich für die asienbezogenen Wissenschaften stärker als bislang engagieren soll und ob bzw. wie er sich in die verschiedenen bereits bestehenden lokalen, regionalen und / oder nationalen Aktivitäten einbringen sollte. Es sollte gemeinsam ausgelotet werden ob, und wenn ja, wie man sich im Fach gemeinsam zum Thema Forschungsdaten koordinieren und positionieren möchte.
FID Asien und Forschungsdaten
Zur Einleitung haben Matthias Kaun (Leiter der Ostasienabteilung der Staatsbibliothek zu Berlin) und Miriam Seeger (Fachreferentin für China, Hongkong, Macao und Taiwan) umrissen, in welcher Form Forschungsdaten als Aufgabe im Rahmen des FID Antrags für die zweite Förderphase (2019-2021) definiert wurden und wie geplant ist, das Aktionsfeld „Forschungsdaten“ in den kommenden drei Jahren im FID Asien auszufüllen (siehe auch den Antragstext). Es sind vor allem zwei Stoßrichtungen vorgesehen: zum einen der Aufbau eines Beratungs- und Informationsangebots und kooperativen Netzwerks zwischen der Wissenschaft und Infrastrukturanbietern zu Forschungsdaten in den asienbezogenen Wissenschaften, zum anderen das Umsetzen und Testen von konkreten infrastrukturellen Anforderungen der Wissenschaft für die Generierung und Speicherung von Forschungsdaten im CrossAsia ITR (Integrierten Textrepositorium) oder einem „Zuliefersystem“ (wie für Bilddaten z.B. einem iiif-Editor) anhand von exemplarischen Partnerprojekten.
Diese parallele Vorgehensweise zielt darauf ab, Kompetenzen und Zuständigkeiten effizient und nachhaltig in einem Netzwerk zu verteilen – mit der Bereitschaft des FID Asien hier koordinierend tätig zu werden – aber auch selbst Expertise zu generieren. In einigen Fällen wird es in Zukunft sinnvoll sein, selbst „host“ zu sein. Dies sind vor allem solche Fälle, in denen auf der Basis von Materialien aus dem CrossAsia Portfolio oder dem des FID Asien Forschungsdaten entstehen, die – verlinkt mit den Vorlagen – in das CrossAsia ITR zurückgespeichert werden sollen.
Forschungsdaten: was und warum
Die Frage der „Definition“ von Forschungsdaten hat schon viele Stellungnahmen beschäftigt. In einem kurzen Überblick über die Entwicklung des Förderrahmens für Forschungsdaten und Infrastrukturen (Stichwort „Nationale Forschungsdateninfrastruktur“ NFDI; „Rat für Informationsinfrastrukturen“ RfII) hat Jens Ludwig (Stabstelle „Digitale Transformation“ der Stiftung Preußischer Kulturbesitz) u.a. drei Aspekte von Forschungsdaten hervorgehoben, die auch eine zeitliche Entwicklung und zunehmende Wichtigkeit von Forschungsdaten in und für die Wissenschaften nachzeichnen. Begonnen mit dem Anspruch der guten wissenschaftlichen Praxis und der damit geforderten „Nachvollziehbarkeit“ der Forschungsbasis haben sich die Erwartungen an Forschungsdaten sukzessive weiterentwickelt. Im nächsten Schritt war ein Forschungsdatum eine zitierfähige Datenpublikation, die nicht nur der Forschungsfrage, in deren Kontext sie entstanden ist, als Basis dienen kann, sondern darüber hinaus für verschiedenste „Nachnutzungen“ bereit stehen sollte. Heute sollen Forschungsdaten darüber hinaus idealerweise so präsentiert werden, dass sie mittels digitaler Werkzeuge, über Visualisierungen und statistische Methoden (Ngram, Co-occurrence etc.) weitere, u.U. nicht vorausgesehene Erkenntnisse durch eine „Nutzungsverbesserung“ der Daten generieren können.
„Bedarfs“-Communities und Fach-Communities
Die im Rahmen der NFDI beschlossene finanzielle Förderung blickt nicht so sehr auf diese verschiedenen Nutzungsstufen von Forschungsdaten. Hier liegt der Fokus erst einmal darauf, eine vernetzte „Struktur“ von Kompetenzen und keinen „Ort“ in Form eines Daten-Repositoriums o.ä. aufzubauen. Durch die Förderung soll sichergestellt werden, dass die verschiedenen wissenschaftlichen Bereiche und Methoden „Sprech- und Handlungsfähigkeit“ erlangen und aktive Fachcommunities ihre „Bedarfe selbst ermitteln und priorisieren.“ Grenzen sollen jedoch nicht „spezialistisch oder exklusiv“ sein, sondern wenn sie gezogen werden, anhand verschiedener Bedarfe bestimmt werden. Die Förderung dieser Konsortien und Infrastrukturen ist vor allem auf eine größere Effizienz des Wissenschaftssystems fokussiert. Somit werden im Rahmen der NFDI „Köpfe“ bzw. ca. 30 solcher Konsortien gefördert und nicht in erster Linie die dafür notwendige „Technik.“
Auch die asienbezogenen Wissenschaften sollten das Thema Forschungsdaten, so der Vorschlag, von eben solchen Infrastrukturen und kooperativen Netzwerken her angehen und weniger über Fragen der Formate u.ä. räsonieren. Zudem ist in der Regel „speichern“ kein ausreichendes Ziel, da die Daten ja gefunden werden müssen. Sie müssen zudem interoperabel genug sein, so dass sie in anderen Kontexten sinnvoll verwendet werden können. Forscher erwarten heute u.U. Werkzeuge, um die Daten zu explorieren und – mehr oder weniger – direkt am „Fundort“ zu analysieren. Doch wie weit soll / muss / möchte man hier gehen?
Die Frage der Breite der asienbezogenen Wissenschaften, in der alle geistes- und sozialwissenschaftlichen Disziplinen mit ihren speziellen und vielfältigen Formen von Forschungsdaten und -methoden vertreten sind, hat die Diskussionsrunde beschäftigt. Die NFDI-Konsortien sprechen von „aktiven Fachcommunities“ die ihre „Bedarfe“ selbst ermitteln sollen. Ist das auf die asienbezogenen Wissenschaften in ihrer gesamten Breite anwendbar und ein Konsens vorstellbar? Haben die verschiedenen geistes- und sozialwissenschaftlichen Arbeitsmethoden gemeinsame Bedarfe? Sehr deutlich wurde hier auch davor gewarnt mit diesen NFDI-Konsortien nicht eine vermeintliche „Kleinstaatlichkeit der Regionalstudien“ zu reproduzieren oder gar zu verfestigen. Sollen sich sozialwissenschaftlich arbeitende Projekte deshalb mit ihren Forschungsdaten eher an sozialwissenschaftliche Forschungsdateninfrastrukturen wenden? Spielt die „Nicht-Lateinschriftlichkeit“ hier eine Rolle und ist sie ein taugliches verbindendes Element? Sollte es ein Asien-NFDI-Konsortium geben, um sicher zu stellen, dass regionalspezifische Anforderungen nicht vergessen werden? Wer sind hier die besten Partner, um eine Forschungsdaten-Infrastruktur für die asienbezogenen (oder regionalspezifischen) Wissenschaften aufzubauen? Sind diese vielleicht nicht in Europa zu finden, sondern in Asien bzw. den entsprechenden Ländern selbst?
Kann es „eine“ Datenbank geben, in die alle Projekte ihre Daten speichern und damit keine Projektzeit für den Aufbau eigener Datenbanken verbrauchen (und dann Zeit dafür brauchen, diese Daten zu überführen etc.)? D.h. kann man einen allen gemeinsamen „Bedarf“ abstrahieren und diesen in eine datentechnische Struktur überführen? Interessant war in diesem Zusammenhang der Bericht aus dem MPIWG, wo anhand eines Beispielprojekts die Tauglichkeit des CIDOC Conceptual Reference Models (CIDOC-CRM) getestet wird, Forschungsdaten in Form eines „knowledge graph“ abzubilden.
Im Rahmen der Vorstellung der einzelnen Fachgesellschaften und Infrastrukturvertreter wurden eine Reihe weitere Bedarfe und Bedenken genannt: Verbreitung und Nachnutzung von Forschungsdaten können ethische Fragen aufwerfen, Persönlichkeitsrechte müssen berücksichtigt werden, und auch der Kopierschutz muss beachtet werden. Eine Infrastruktur muss in der Lage sein, all diese Anforderungen zu erfüllen.
Wer ist bzw. sollte für was zuständig sein? Welche Aktivitäten gibt es bereits?
Neben der Frage, ob eine Methode oder der regionale Bezug die sinnvollere Abgrenzung zu anderen NFDI-Konsortien bilden, stand auch die Frage im Raum, wie die Universitätsbibliotheken sich hier in Zukunft positionieren wollen. Für das wissenschaftliche Profil einer Universität ist es wichtig, in ihrem Kontext entstandene Daten auch selbst zu präsentieren (vgl. z.B. Repositorien für Doktorarbeiten). Für die Forscher selbst ist sicherlich der fachliche Zugang relevanter (und in der Regel auch vertrauter). Können die Fachgesellschaften hier Rollen übernehmen bzw. sich Aufgaben innerhalb eines Netzwerkes vorstellen? Wie ist die aktuelle Struktur in den jeweiligen Gesellschaften und gibt es bereits eine Position zu Forschungsdaten? Wie sehen Infrastruktureinrichtungen ihre aktuellen oder geplanten Aktivitäten in dieser Richtung?
Im Rahmen der Kurzberichte der Vertreter der Fachgesellschaften und Infrastruktur-Einrichtungen bzw. Projekte, die eine Infrastruktur aufbauen wollen oder aufgebaut haben, sind einige wichtige Dinge zur Sprache gekommen. Die beiden überregional wirkenden Asien-Fachgesellschaften, die Deutsche Morgenländische Gesellschaft (DMG) und die Deutschen Gesellschaft für Asienkunde e. V. (DGA), haben hier bislang noch keine strukturierte Aktivität unternommen oder Leitlinien zu diesem Thema erstellt. Die Ziele der DMG sind insbesondere die Förderung der Wissenschaften und die Publikation ihrer Ergebnisse, die sie mit ihrem Organ der ZDMG ausreichend repräsentiert sieht. Da ihre Mitglieder vor allem philologisch arbeiten, liegt ein Interessenfokus der DMG auf dem adäquaten Zugang zu Quellen. Die DMG greift regional zudem noch weiter aus als „asienbezogen“ und vertritt auch Forschung zu Afrika. Die sinologische Fachgesellschaft, die Deutsche Vereinigung für Chinastudien (DVCS), hat in ähnlicher Weise bislang auch noch keine strukturierte Aktivität unternommen. Die 230-250 Mitglieder des DVCS stammen vorwiegend aus dem Mittelbau. Zum aktuellen Zeitpunkt gibt es keine top-down Beratung innerhalb der DVCS im Hinblick auf Forschungsdaten. Die Fachgesellschaft der Koreanistik, die Vereinigung für Koreaforschung e.V. (VfK), hat ebenfalls noch keine Position zum Thema entwickelt, möchte sich aber in die weitere Diskussion einbringen und Ziele mitgestalten.
In beiden vertretenen japanologischen Fachgesellschaften, der Gesellschaft für Japanforschung (GJF) und der Vereinigung für Sozialwissenschaftliche Japanforschung (VSJF), gibt es Mitglieder, die bereits intensiv mit Big Data arbeiten und eine AG der GJF, die sich mit dem Thema Umgang mit Forschungsdaten beschäftigen wird, wurde auf dem Japanologentag (2018) ins Leben gerufen. Ziel der AG ist es, Aktivitäten besser zu vernetzen und ein Positionspapier zu Forschungsdaten zu erstellen.
Im Juli 2018 fand organisiert durch das vom BMBF geförderte Forschungsprojekt „FDM_OAS-Orient“ ein überregionaler Workshop zum Thema „Nicht-lateinische Schriften in multilingualen Umgebungen: Forschungsdaten und Digital Humanities in den Regionalstudien“ an der Campusbibliothek der FU Berlin statt, an dem u.a. Vertreterinnen und Vertreter beider Fachgesellschaften sowie des FID Asien und FID Nahost-, Nordafrika- und Islamstudien teilgenommen haben (siehe den Workshop-Bericht im DHd Blog).
Die anwesenden Infrastrukturvertreter konnten konkreter von bereits bestehenden Strukturen berichten und haben weitere Ziele oder auch spezifische Problematiken thematisiert. Die „Heidelberg Research Infrastructure“ sammelt seit mehreren Jahren bereits Erfahrungen darin, verschiedenste Quellenformate zu speichern und so aufzubereiten, dass damit wissenschaftliche Daten erzeugt werden können. Sie versucht dabei, Grundprinzipien wie Nachhaltigkeit und Anschlussfähigkeit an größere Netzwerke und die strikte Trennung von Metadaten und Daten zu wahren. Forschungsarbeiten aus dem Bereich der Sinologie sind hier erstes Testgebiet. Wenn man noch tiefer in Daten-Projekte hineinschaut, werden weitere Aspekte deutlich. Im Freiburger Projekt zur Chinesischen Kulturrevolution „The Maoist Legacy“ ist eine Datenbank mit Materialien der Kulturrevolution entstanden, die auch anderen Forschern zur Verfügung steht. Da es sich jedoch um z.T. sensible und auch Persönlichkeitsrechte behaftete Daten handelt, mussten mehrere Zugrifflevels eingerichtet werden. Bereits die Speicherung dieser Daten kann Rechtsfragen aufwerfen, die nicht jede Institution bereit oder auch fähig ist zu klären. Die Bibliothek des MPIWG berichtete aus vor allem zwei Bereichen, in denen sie aktuell in Bezug auf Forschungsdaten aktiv ist. Zum einen, das oben erwähnte „übersetzen“ von Datenbeziehungen mittels einer Ontologie, zum anderen die Überlegungen wie mit digitalen, analytischen Werkzeugen auf lizenzgeschützten Materialien gearbeitet werden kann, ohne die entsprechenden Lizenzen zu verletzen. Der zunehmenden Bedeutung von digitalen Datenanalysen auch in den Geisteswissenschaften trägt die Universität Tübingen Rechnung, indem sie einen Masterstudiengang anbietet, der Digital Humanities und Regionalstudien vereint. Auch wenn viel über digitale Daten und DH gesprochen wird, so ist doch weitere Lobby-Arbeit notwendig, damit Ergebnisse und Methoden, die von Forschern entwickelt werden – auch in Fächern wie der Japanologie oder Sinologie – als wissenschaftliche Leistung anerkannt und karrieretechnisch als relevant erachtet werden. Infrastrukturen können (und sollten) also auch ein Qualitätssigel sein und Daten darin somit nicht als „weggeschenkt“ gelten, sondern umgekehrt die Forscher oder das Projekt „prominenter“ machen.
Die FU Berlin brachte zwei weitere wichtige Aspekte bezüglich des digitalen Wandels ein: Erstens wird laut Deutschem Bibliotheksverband (dbv) ein Trend deutlich, dass wissenschaftliche Bibliotheken zu einer passgenauen Informations- und Medienversorgung zunehmend auch zeitgemäße Dienste und Werkzeuge zur Unterstützung des Life-Cycle in Forschung, Lehre und Studium entwickeln und anbieten (siehe: Wissenschaftliche Bibliotheken 2025, hrsg. vom DBV, Jan. 2018).
Zweitens ist es meistens nicht sinnvoll, als Institution den Weg des „digitalen Wandels“ alleine zu bestreiten, auch nicht wenn man die Größe einer Universität hat. Kooperation wird immer wichtiger. In einigen Institutionen fusionieren Datenzentren bzw. Anbieter für digitale Medien und Technologien in Forschung und Lehre mit den Bibliotheken (so in Planung an der FU Berlin) und die drei Berliner Universitäten – HU, FU und TU – wollen gemeinsam mit der Charité Universitätsmedizin einen Verbundantrag im Rahmen der Exzellenzinitiative einreichen (Stand Dez. 2018), in der der digitale Wandel eine zentrale Rolle spielen soll.
Festzuhalten ist, dass der Grad der Bereitschaft zu und die Ausgestaltung von neuen bibliothekarischen Dienstleistungen in den Bereichen Forschungsdatenmanagement und Digital Humanities allgemein sowie für die Regionalwissenschaften im Besonderen stark standortabhängig ist und ein großes Gefälle von Hochschule zu Hochschule aufweist.
Gibt es einen nächsten gemeinsamen Schritt und wie könnte der aussehen?
Voraussichtlich im ersten Quartal 2019 wird die Ausschreibung für NFDI-Konsortien verkündet. Kann man ein solches Angebot der NFDI z.B. nutzen, um gemeinsam auszuloten, wie ein kooperatives Vorgehen in diesen neuen Feldern gestaltet werden könnte? In diesem Zuge müsste auch definiert werden, wie Aktivitäten im Rahmen der zweiten Runde des FID und solche im Rahmen der NFDI verzahnt werden könnten.
Brauchen die asienbezogenen Wissenschaften etwas Vergleichbares wie den „Rat für Sozial- und Wirtschaftsdaten“ (RatSWD), einen „Asien-Rat“, der von politischem Interesse für die Sichtbarkeit der Regionalstudienfächer und ihrer Anforderungen an Forschungsinfrastrukturen ist? Könnte dieser Rat in nationalen Kontexten agieren und die asienbezogene Forschung dort sprechfähig machen? Von welchem nationalen Interesse wäre so ein „Asien-Rat“ bzw. was wären seine Aufgaben?
Bei allen ausformulierten Anforderungen zu Forschungsdaten und Infrastrukturen muss man bedenken, dass zukünftige Forschungsanträge und -ergebnisse daran gemessen werden.
Um das breitere Interesse und die Anforderungen der Forschenden, Lehrenden und Studierenden am Thema Forschungsdaten und Forschungsdateninfrastruktur zu ermitteln, soll eine Umfrage erstellt und über relevante Mailing-Listen, den CrossAsia Newsletter und u.U. auch die Fachgesellschaften verbreitet werden. Die Fachverbände werden gebeten, sich ebenfalls zur Frage zu positionieren (u.U. auch anhand des Fragebogens). Sie sollen zudem Position dazu beziehen, ob und wie sie sich in den weiteren Prozess einbringen wollen.
CrossAsia übernimmt für den Entwurf des Fragebogens die Federführung. Der Entwurf wird im ersten Quartal 2019 an die Teilnehmerinnen und Teilnehmer der Runde mit Bitte um Kommentierung geschickt.
Zum Abschluss hier noch einige Kommentare, Vorschläge und mögliche Ziele, die im Rahmen der Diskussionen bezüglich Forschungsdaten, den Bedürfnissen der Wissenschaftlerinnen und Wissenschaftler genannt wurden:
- Position zu Formaten und Standards sollten gemeinsam entwickelt werden.
- Fragen und Klärungsansätze zu rechtlichen und ethischen Probleme mit Daten sollten zusammengetragen und allen Daten-Forschern klar vor Augen geführt werden.
- Kooperationen sollten das Ziel haben, aus den verschiedenen konkreten Beispielen Daten-Abstraktionen zu entwickeln, die schließlich das regionalspezifische in den Hintergrund stellen.
- Asien auch in diesen Kontexten beizubehalten ist als Teil der Lobbyarbeit für die eigene wissenschaftliche Disziplin wichtig.
- Auch wenn Fachgesellschaften z.T. ihre Bedürfnisse bereits identifiziert haben, mangelt es ihnen an passender Infrastruktur, die sie oft nicht aus eigener Kraft aufbauen können.
- Solche Aufgaben sollten in einer Governance-Struktur verwirklicht werden, die in der Lage ist, Partikularinteressen nicht zu unterdrücken.
- Es sollten keine „Daten-Container“ gebaut werden; Ziel sollte vielmehr sein, in Richtung Open Data, Open Science zu gehen.