Ergebnisse der Umfrage zu Forschungsdaten in den asienbezogenen Wissenschaften

Im Frühjahr haben wir Sie als FID Asien gemeinsam mit den Fachgesellschaften (DGA, DMG, DVCS, GJF, VfK, VSJF) zu Forschungsdaten in den asienbezogenen Wissenschaften befragt. Ziel der Umfrage war, zu ermitteln, wie Sie im Forschungsprozess mit ihren asienbezogenen Daten umgehen, welche Erfahrungen und Meinungen Sie zur Recherche und Nachnutzung sowie Erstellung und Bereitstellung von Forschungsdaten haben und welche Unterstützungsangebote Sie bereits erhalten, bzw. welche Sie sich seitens des FID Asien wünschen.

Wir möchten Ihnen an dieser Stelle ganz herzlich für Ihre rege Beteiligung und die vielfältigen, äußerst hilfreichen Hinweise danken, die Sie uns gegeben haben. Die Beteiligung an der Umfrage und die Ergebnisse zeigen sehr deutlich, dass Forschungsdaten und der Umgang mit diesen auch in den asienbezogenen Wissenschaften bereits wichtige Themen sind, aber es auch noch einigen Erklärungs- und Diskussionsbedarf gibt. Mit diesem Beitrag möchten wir über eine Auswertung der Ergebnisse hinaus versuchen, die Diskussion weiter anzuregen und zugleich in einigen Bereichen vielleicht etwas mehr Klarheit schaffen.

Im Folgenden finden Sie eine Auswertung der Umfrage mit den wichtigsten Ergebnissen und Grafiken sowie mit Erläuterungen; eine vollständige Aufführung aller Tabellen und Grafiken finden Sie zum Download anbei.

 

 

 


Wer waren die Teilnehmenden an der Umfrage?

Für die Umfrage sind 128 vollständig ausgefüllte Antwortbögen bei uns eingegangen. Die Antwortbögen wurden überwiegend von Professor*innen und Wissenschaftlichen Angestellten (je 26% der Befragten) eingereicht. 16% der Teilnehmenden schreiben ihre Promotion und 9% studieren. Die Teilnehmenden sind überwiegend an Universitäten bzw. Hochschulen tätig (80%), ein deutlich kleinerer Anteil ist an außeruniversitären Einrichtungen (knapp 9%) und Bibliotheken (6%) tätig. 66% der Teilnehmenden haben in den letzten 10 Jahren vorwiegend in Deutschland gewirkt, gefolgt von Asien und Europa (ohne Deutschland) mit ca. 13% bzw. 11%.

Bezüglich ihres Forschungsinteresses nennen die Teilnehmenden mit Abstand am häufigsten die Region China, Taiwan, Hongkong und Macao sowie Japan, mit 45% bzw. 44% (siehe Abb. 1). Die Verteilung spiegelt etwa die Nutzergruppen in CrossAsia wider.

Die Teilnehmenden verorten ihr Forschungsgebiet mit 40% in den Geschichtswissenschaften, gefolgt von den Literaturwissenschaften / Philologien (25%), Politologie (23%), Religionswissenschaften (17%) sowie Philosophie und Soziologie (je 15%). Für eine Grafik siehe Abb. 2. Unter „Sonstiges“ wurden insbesondere Schnittmengen zwischen verschiedenen Fächern genannt oder Spezialisierungen, wie Medizingeschichte, Sozialpolitik oder Technikstudien.

Bezüglich der Vorerfahrungen mit digitalen Forschungsdaten und Forschungsdatenrepositorien haben wir um eine Selbsteinschätzung gebeten. Etwa Dreiviertel der Teilnehmenden haben demnach Erfahrungen, wie Abb. 3 zeigt: 13% schätzen ihre Erfahrungen als weitrechend ein, 32% sagen sie haben einige Erfahrungen und 30% haben erste Erfahrungen.

 


Warum sind Forschungsdaten wichtig?

Wir haben danach gefragt, ob die Teilnehmenden eine Initiative, digitale Forschungsdaten von gesicherter Qualität für die asienbezogene Forschung zu sammeln und aufzubereiten, für unterstützenswert halten. Insgesamt mehr als 90% der Befragten haben mit „Ja, auf jeden Fall“ (66%) oder „Eher ja“ (27%) geantwortet. Die genannten Gründe, warum eine solche Initiative wichtig ist, sind vielfältig; viele werden unten in den weiteren Fragen noch ausführlicher behandelt. Stichwörter sind Transparenz, Nachvollziehbarkeit von Forschung, Sicherung von Forschungsergebnissen, und Erhöhung und Verbesserung der Zugänglichkeit zu Wissen. Weitere wichtige Argumente für eine solche Initiative sind, erstens, dass (fachspezifische) Standards für Qualitätskriterien und Qualitätssicherung entwickelt werden können (bspw. Datenstandards und Standards für die Beschreibung der Daten, i.e. Metadatenstandards, sowie Standards für den Austausch von Daten bspw. über Schnittstellen etc.) und, zweitens, dass Synergieeffekte erlangt werden können, bspw. durch die Beratung von Projekten bereits in der Antragsstellung und das Bereitstellen von Best Practice Beispielen, damit Standards von Anfang an mit eingeplant und eingehalten werden können.

Die überwiegende Mehrzahl der Antwortenden (88%) meint, dass recherchierbare und nachnutzbare asienbezogene Forschungsdaten einen Mehrwert für die Forschung darstellen. Abb. 4 zeigt die Gründe, die am stärksten priorisiert werden. Diese Frage war auf bis zu drei Antwortmöglichkeiten beschränkt. Den Kommentaren zufolge war die gewünschte Priorisierung hier nicht immer einfach. Dies zeigt sich auch daran, dass die Verteilung der Antworten sich über alle Optionen erstreckt.

 


Wie werden Daten im Forschungsprozess erstellt und gesichert?

Wir fragten nach der Verwendung von digitalen Werkzeugen für die Forschung. Hier war keine Begrenzung der Antwortoptionen gesetzt. Insgesamt haben wir von den 128 Teilnehmenden 505 Antworten erhalten. Im Schnitt verwendet somit jede/r vier verschiedene Tools für seine/ihre Forschung.

Einige Tools wie Portale und Datenbanken (91%) sowie Office Software (82%) können als Standardtools angesehen werden. Speziellere Tools wie zur Analyse (30%), Annotation (23%), Visualisierung (20%) und zum Erstellen von Editionen (16%) werden jedoch noch vergleichsweise wenig verwendet (siehe Abb. 5).

Die nächsten Fragen befassen sich mit dem Sichern von Daten.

66% der Befragten sichern ihre gesammelten Daten im Laufe des Forschungsprozesses unaufgefordert, sodass am Ende des Forschungsprozesses digitale Forschungsdaten vorliegen, davon 43% wann immer es möglich ist und 56% wenn es ihnen sinnvoll erscheint. 14% der Befragten sichern nur, wenn sie explizit dazu aufgefordert werden und 4% sichern ihre Daten nicht. 11% der Teilnehmenden sagen, dass bei ihnen keine Daten anfallen.

Aber wo speichern die Forscherinnen und Forscher ihre digitale Datengrundlage?

Die überwiegende Anzahl derer, bei denen Daten im Verlauf des Forschungsprozesses anfallen, speichert diese auf dem eigenen Arbeitsrechner (65%) und/oder auf einem externen Medium wie Festplatte, CD/DVD, USB-Stick (55%). Nur etwas mehr als 5% der Antwortenden, das sind sieben Personen, speichern ihre Daten auch in einem Repositorium (siehe Abb. 6). Als Sonstiges wurde noch die Veröffentlichung ergänzt, das bedeutet die Veröffentlichung der Forschungsdaten bspw. in einem sogenannten Data Journal oder als Ergänzung zu einer wissenschaftlichen Publikation (Stichwort „enhanced publication“).

Die sieben Personen, die ihre digitalen Forschungsdaten auch in einem Repositorium speichern, haben 10 Antworten gegeben. Fünf der Antwortenden speichern ihre Daten in einem universitären bzw. institutionellen Repositorium, zwei jeweils bei GitHub und Zenodo und eine Person bei TextGrid.

 


Wie sieht es mit der Recherche und Nachnutzung von digitalen Forschungsdaten aus?

Wir haben nach der Nachnutzung digitaler Forschungsdaten gefragt, sowohl selbst generierter Daten als auch solcher anderer Wissenschaftler*innen. Mit Nachnutzung digitaler Forschungsdaten meinen wir, dass Forschungsdaten – die häufig auch über den ursprünglichen Erzeugungs- und Forschungskontext hinaus einen bleibenden Wert haben – Grundlage für andere Forschungsfragen und -vorhaben bilden können. Von den Befragten – Mehrfachantworten waren möglich – hat die überwiegende Anzahl der Antwortenden schon einmal Daten nachgenutzt. Bei diesem Datenmaterial hat es sich entweder um selbsterstelltes Datenmaterial gehandelt, oder um solches aus einer Projektgruppe mit eigener Beteiligung, bei anderen Forschenden angefragtes Material oder aus einem Datenarchiv. Knapp 20% der Befragten hat nach eigenen Angaben bislang keine Daten nachgenutzt (siehe Abb. 7).

Uns haben in der Folge insbesondere zwei Dinge interessiert:

Erstens, wenn schon einmal Daten nachgenutzt wurden, um welche Art von Daten hat es sich gehandelt?

Wie in den Geistes- und Sozialwissenschaften zu erwarten, hat die überwiegende Anzahl der Teilnehmenden bereits mit Textdaten (70%) gearbeitet, gefolgt von bibliographischen Daten (42%), Bilddaten (39%) und numerischen, statistischen Daten (35%). Andere Datenformate wie audiovisuelle Daten, Programmcodes etc. spielen aktuell eine deutlich untergeordnete Rolle (siehe Abb. 8).

Zweitens, wenn die nachgenutzten Daten aus einem Datenarchiv/Repositorium stammen, wo bzw. wie wurden sie gefunden?

Von 42 Personen haben wir insgesamt 67 Antworten erhalten. Ergebnis ist hier, dass von den Befragten überwiegend universitäre bzw. institutionelle Repositorien verwendet werden (14%) oder aber Datenarchive aus Asien (12,5%). Von den zentralen Angeboten wie Repositorien und Nachweissystemen wurden überwiegend – jedoch zugleich in sehr geringem Maße – GitHub (7%) und Zenodo (6%) genannt (siehe Abb. 9). Unter Sonstiges wurden beispielweise GRETIL (Göttingen Register of Electronic Texts in Indian Languages) ergänzt oder der UK Data Service, der Zugang zu soziologischen und wirtschaftlichen Daten bietet.

 

Wir haben diejenigen gebeten, die angegeben haben, dass sie Daten aus einem Repositorium in Asien verwendet haben, dies zu spezifizieren. Genannt wurden folgende Angebote bzw. Institutionen:

  • Academia Sinica Taiwan – Datenbanken
  • Center for Open Data in the Humanities (Japan, NII)
  • Docusky (National Taiwan University)
  • eGangotri Digital Preservation Trust (über archive.org)
  • Indira Gandhi Center for the Arts
  • JACAR (Japan Center for Asian Historical Records)
  • Kansai University Library – Datenbanken
  • Kindai University Library – Datenbanken
  • Kokubunken (National Institute of Japanese Literature Repository) – Repositorium
  • National Bureau of Statistics of China – statistische Datenbanken
  • National Diet Library – Datenbanken
  • Nichibunken (International Research Center for Japanese Studies) – Datenbanken
  • NINJAL (National Institute for Japanese Language and Linguistics) – Datenbanken
  • SAT Daizōkyō Text Database – Korpus buddhistischer Texte

Auffällig ist, dass zusätzlich zu den obengenannten auch einige lizenzpflichtige Datenbanken angegeben wurden, die über CrossAsia zugänglich sind. Dies war so mit der Frage nicht beabsichtigt; wir hatten auf Daten abgezielt, die in verschiedenen Forschungskontexten entstanden sind und veröffentlicht wurden. Ein Beispiel wäre, in einem Forschungsprojekt werden Archivmaterialien aus bspw. einer lizenzpflichtigen Datenbank verwendet, die nur als Images zur Verfügung stehen. Ein mögliches Forschungsdatum wäre in dem Beispiel die Transkription und Annotation der Texte. Aus Forschersicht ist aber sicherlich nicht falsch anzunehmen, dass es erst einmal unerheblich ist – sofern die Qualität gesichert und das Entstehen der Daten dokumentiert ist – woher die Daten kommen, die für die jeweilige Fragestellung relevant sind. Deutlich wurde uns bei den Antworten, dass hier gegebenenfalls noch Aufklärungs- bzw. Definitionsarbeit notwendig ist, was – zumindest in diesem Kontext – mit Forschungsdaten, Datenrepositorien etc. gemeint ist.

Nachdem wir erfahren haben, wo Daten gefunden werden und was für Daten das sind, haben uns die Kriterien interessiert, die Forscherinnen und Forscher an die Nachnutzung von Forschungsdaten aus einem Repositorium stellen.

Dazu haben wir mittels einer Matrixfrage gebeten, folgende drei Kriterien nach ihrer Wichtigkeit zu bewerten, wobei die Skala von 1 = „sehr wichtig“ bis 5 = „überhaupt nicht wichtig“ reicht. Alle Kriterien wurden von 70% der Befragten als „wichtig“ oder „sehr wichtig“ eingestuft (siehe Abb. 10):

  • Beschreibung und Kontextualisierung der Daten (als Beleg für deren Erstellung auf der Basis bester wissenschaftlicher Praxis)
  • Angaben zu Lizenzen und den Möglichkeiten der Nachnutzung
  • Zitierbarkeit der Daten (Permalink)

Als weitere wichtige Kriterien wurden darüber hinaus noch genannt:

  • gut angelegte Suchmaschinen
  • Verwendung offener, nicht-proprietärer Standards
  • Verwendung quelloffener, nicht-proprietärer Software
  • Zeichenkodierung (chinesisch, japanisch, koreanisch etc.)
  • rechtliche und ethische Aspekte (wie Einverständnis-Erklärung der untersuchten Personen, Schutz von Anonymität / Persönlichkeitsrechten bei qualitativen Daten)
  • Interoperabilität der Daten

Als letzte Frage in diesem Abschnitt haben wir nach Problemen bei der Recherche nach Forschungsdaten in Datenrepositorien gefragt. Auch hier waren wieder Mehrfachantworten möglich. Wir haben von 127 Personen 221 Antworten erhalten (siehe Abb. 11). Davon haben 37 Personen (29%) bisher keine Probleme identifizieren können. Die restlichen 185 Antworten verteilen sich auf alle von uns vorgeschlagenen Kriterien. Am häufigsten werden von den Befragten allerdings nicht-Unicode-kompatible Schriften (42%), nicht-lateinische Schriften (32%) und proprietäre Formate (25%) genannt.

Weitere genannte Aspekte unter Sonstiges thematisieren mangelnde Quellenangaben, unklare Nutzungsrechte und eine nicht gesicherte Zugänglichkeit.

 


Wie sieht es mit der Bereitschaft zum Teilen von Daten aus?

Wir haben nach digitalen Forschungsdaten gefragt, die aus Sicht der Forschenden von anderen nachgenutzt werden können. Bei den Antworten wird deutlich, dass die größte Gruppe (58 Personen oder 45%) unsicher ist, ob die Daten, die sie im Rahmen ihrer Forschung erstellt oder zusammengestellt haben, für andere Wissenschaftler*innen nützlich sein könnten. 30% antworten mit „ja“ und 19% mit „nein“. Dies wäre also ein weiterer wichtiger Aspekt, wo mehr Vermittlungs- und Aufklärungsarbeit geleistet werden kann, dass erstellte Daten auch in anderen Kontexten mit ganz anderen Fragestellungen, auch solchen, die mit dem ursprünglichen Forschungsobjekt nichts zu tun haben müssen, nützlich sein können. Zu denken wäre hier bspw. an Metastudien, die Studiendesigns anderer Wissenschaftler zum Forschungsgegenstand nehmen. Diese Unsicherheit rührt sicherlich auch daher, dass nicht immer klar ist, wie aus den Ergebnissen und Nebenprodukten der eigenen Forschung Daten mit einer gewissen Abstraktionsebene generiert werden können, sodass diese für andere Kontexte nützlich sind.

Wir haben die 39 Personen, die mit „ja“ geantwortet haben, gebeten zu spezifizieren, um was für Daten es sich handelt, die aus ihrer Sicht von anderen nachnutzbar sind. Unter den 104 Antworten wurden mit Abstand am häufigsten Textdaten (von 24% der Befragten) genannt, gefolgt von Bilddaten (15%), bibliographischen Daten und statistischen/numerischen Daten (jeweils 12%). Audiodaten, Programmcode, Videodaten und Geodaten wurden von nur 6 oder weniger Personen genannt (weniger als 5%), digitale 3D Modelle wurden gar nicht genannt. Unter Sonstiges wurden noch Grundrisse, Scans von Manuskripten und Archivdaten ergänzt, wobei diese sich in vielen Fällen – je nach Inhalt – einem der oben genannten Kategorien zuordnen lassen (Textdaten, Bilddaten, numerische Daten).

Mit 86% kann sich die überwiegende Anzahl der Befragten vorstellen, Teile ihrer Forschungsdaten für andere zur Verfügung zu stellen. Nur 10 Personen (8%) stimmen jedoch einer bedingungslosen Bereitstellung der eigenen Forschungsdaten für andere zu. Die meisten knüpfen dies an Bedingungen:

  • dass die jeweilige Person als Quelle angegeben und über die Nutzung informiert wird (61%).
  • dass die jeweilige Person ein OK geben muss, bevor der Zugriff auf die Daten erfolgen kann (11%).

Knapp 4% (5 Personen) sprechen sich gegen eine Bereitstellung der Daten aus und 9% (12 Personen) enthalten sich einer Stellungnahme.

Unter Sonstiges werden weitere individuelle Bedingungen genannt, die teils aus Kombinationen der obenstehenden Bedingungen bestehen, teils die Informant*innen mitberücksichtigt und teils die Veröffentlichung der Daten berührt.

Wir haben nach den Gründen gefragt, die für eine Veröffentlichung der eigenen Forschungsdaten sprechen (Abb. 12), als auch nach solchen gegen eine Veröffentlichung (Abb. 13). Auch hier waren wieder Mehrfachantworten möglich.

Bei den Gründen für eine Veröffentlichung werden die „inhaltlichen“ Aspekte relativ häufig genannt (40% oder mehr der Befragten), wohingegen die strukturellen Aspekte, wie Anforderungen seitens Fördergeber oder Fördermittel, relativ wenig zum Tragen kommen (10% oder weniger).

Die inhaltlichen Aspekte sind:

  • Möglichkeit der Nachnutzung der Daten durch andere Wissenschaftler*innen (71% der Befragten)
  • Qualitätssicherung und Nachvollziehbarkeit der Forschung (69%)
  • Langzeitarchivierung der Daten (66%)
  • Zitierfähigkeit der Daten (Permalink) (55%)
  • Schutz vor Plagiaten bzw. davor, dass das Forschungsthema durch andere Wissenschaftler*innen besetzt wird (40%)

Bei den Kontra-Argumenten überwiegen die organisatorisch-strukturellen Gründe: 62% der Befragten nennen den Zeitaufwand für die Aufbereitung (Kuratierung) der Daten vor der Übergabe, 45% nennen die Kosten bzw. das fehlende Budget, 37% fehlt das technische Know-how und 34% geben an, sie haben keine Kontrolle über die Verwendung ihrer Forschungsdaten.

28% der Befragten sagen jeweils, dass die Daten urheberrechtsbelastet sind und/oder Persönlichkeitsrechte betreffen. Unter Sonstiges wurde noch ergänzt, dass die Daten politisch sensibles Material enthalten können.

Als nächstes haben wir gefragt, nach welchen Kriterien die Wissenschaftler*innen Daten auswählen würden, die sie zugänglich machen.

Nur eine geringere Anzahl an Personen würde alle Forschungsdaten zugänglich machen (22 Personen oder 17%). Die Mehrzahl würde dies an bestimmte Bedingungen knüpfen: als Ergänzung zu einer Publikation (58%), von anderen angefragte/benötigte Daten (44%), aussagekräftige Daten/Materialien (42%) und Daten, die aus Projekten entstehen, die mit öffentlichen Mitteln gefördert werden (32%). Auffällig ist, dass gerade der Punkt „Kritische Forschungsdaten“, also solche, die ggf. nicht reproduzierbar sind und besonders einer Sicherung bedürfen, nur von 34 Personen oder 27% genannt wird. Originalschrift scheint auch weniger ein Kriterium zu sein; auch dies wird nur von 26% genannt (siehe Abb. 14).

 

Anschließend haben wir die Teilnehmer*innen gebeten, die drei wichtigsten Eigenschaften eines Forschungsdatenrepositoriums (Abb. 15) sowie die nötigen Rahmenbedingungen (Abb. 16) zu benennen. Dabei ging es uns um eine Priorisierung, dass alle aufgeführten Aspekte irgendwie wichtig sind, war vorausgesetzt.

Bezüglich der Frage nach den Eigenschaften eines Repositoriums wurde von den Befragten mit Abstand am häufigsten die Vertrauenswürdigkeit der betreibenden Organisation angeführt (57%), gefolgt von einer eindeutigen Zitierbarkeit der Daten (38%), differenzierten und kontrollierten Zugriffsrechten (30%) sowie besonderen Schutzmechanismen für sensible Einzelinformationen (28%).

Interessant ist, dass die zuverlässige Auffindbarkeit von Daten in Originalschrift und die Verzeichnung des Bestands in anderen Systemen bspw. über Schnittstellen vergleichsweise selten genannt wurden (20% und 12% der Befragten). Dies mag vielleicht daran liegen, dass sowohl das verwendete Vokabular als auch die Thematik unter Wissenschaftler*innen weniger verwendet wird, sondern eher bibliothekarischer Natur ist.

Bezüglich der Rahmenbedingungen wurden fast alle vorgeschlagenen Punkte gleich bewertet mit etwa 20-31% der Befragten, abgesehen dem Aspekt „Klare Nutzungs-/Lizenzvereinbarungen zwischen Datengebenden, Archiv und Nutzenden“ (54%) sowie „Übertragung eventueller Verpflichtungen (wie Veröffentlichung, Archivierung etc.)“ (5%).

In einer Matrixfrage haben wir die Forscherinnen und Forscher gebeten zu bewerten, wie wichtig ihnen folgende Kriterien sind, wenn sie eigene asienwissenschaftliche Forschungsdaten veröffentlichen (wollen/würden). Die Skala reicht erneut von 1 = „sehr wichtig“ bis 5 = „überhaupt nicht wichtig“ (siehe Abb. 17).

Die Kriterien mit den Prozentwerten der Befragten, die sehr wichtig oder wichtig angekreuzt haben, lauten akkumuliert:

  • Beschreibung der Daten in Originalschrift möglich (73%)
  • Beschreibung der Daten in Transliteration / Transkription möglich (63%)
  • Beschreibung der Daten auf Deutsch / Englisch möglich (73%)
  • Verwendung von fach- / region- / sprachspezifischen Terminologien (z.B. Maße, Einheiten) (54%)
  • Verwendung fachspezifisch und international gängiger Metadatenstandards (57%)

Alle fünf Kriterien werden demnach überwiegend als wichtig oder sehr wichtig eingestuft. Auffällig ist, dass die Beschreibung der Daten in Originalschrift sowie auf Deutsch / Englisch als besonders wichtig erachtet werden. 50% bzw. 47% der Befragten bewerten dies als sehr wichtig.

Auffällig ist auch, dass bei den zwei zuletzt genannten Kriterien besonders viele Teilnehmenden keine Antwort geben (13% und 17%). Dies kann entweder auf den Fragentyp zurückzuführen sein, oder aber die beiden Kriterien sind ggf. ebenfalls weniger verständlich.

 


Welche Unterstützung und Informationsangebote gibt es und welche werden benötigt?

Im letzten Themenblock haben uns Informationsangebote zu Forschungsdaten und der Umgang mit diesen sowie Bedarfe an solchen Angeboten interessiert. Wir haben gefragt, wie umfänglich die Teilnehmenden sich an ihren wissenschaftlichen Einrichtungen in Bezug auf Forschungsdaten beraten fühlen. 36% der Befragten fühlen sich vollumfänglich oder in einigen Themenbereichen gut beraten, 45% fühlen sich gar nicht oder nicht ausreichend beraten. Der größte Anteil antwortete im Mittelfeld, d.h. zu einigen Themenbereichen oder nicht ausreichend, akkumuliert beläuft sich dies auf 60%.

Wir haben diejenigen gefragt, die positiv geantwortet haben (46 Personen), in welchen Themenbereichen sie Unterstützung erhalten. Hier waren Mehrfachantworten möglich. Eher dominant sind technische/organisatorische Themen wie Datenmanagement, Open-Access-Lizenzen, Datenformate etc. Eher weniger häufig genannt werden Rechtsaspekte und praktische Belange, wie „Wie finde ich ein Repositorium?“ oder „Was muss ich bei der Dokumentation der Daten beachten?“

  • Datenmanagement allgemein (21% der Befragten)
  • Open-Access-Lizenzen (16%)
  • Technische Fragen zu Datentypen, Formaten, Metadatenstandards (13%)
  • Langzeitarchivierung (12%)
  • Urheberrecht (11%)
  • Dokumentation der beschreibenden Daten (Metadaten) (9%)
  • Ethik und Persönlichkeitsrechte (9%)
  • Repositorium finden (7%)

In der nächsten Frage wollten wir nun wissen, welche Beratungs- und Informationsbedarfe seitens des FID Asien gewünscht werden. Hier waren wieder Mehrfachantworten möglich.

Nur 16 Personen (12%) haben keinen Bedarf an Beratungsangeboten gemeldet. Die restlichen 406 Antworten verteilen sich folgendermaßen auf die vorgeschlagenen Themen:

  • Datenmanagement allgemein (55% der Befragten)
  • Technische Fragen zu Datentypen, Formaten, Metadatenstandards (48%)
  • Dokumentation der beschreibenden Daten (Metadaten) (46%)
  • Langzeitarchivierung (41%)
  • Open-Access-Lizenzen (38%)
  • Urheberrecht (37%)
  • Repositorium finden (27%)
  • Ethik und Persönlichkeitsrechte (21%)

Auch hier ist auffallend, dass Rechtsfragen weniger häufig genannt werden. Unter Sonstiges wurde u.a. noch die Interoperabilität von Forschungsdaten genannt.

Die nächste Frage befasst sich mit den Angeboten des FID Asien, die sich aktuell in Vorbereitung befinden (siehe Abb. 18). Hier wurde in einer Matrixfrage auf einer Skala von 1 = „sehr wichtig“ bis 5 = „überhaupt nicht wichtig“ nach der Wichtigkeit dieser Angebote gefragt.

Zwei Angebote des FID Asien wurden thematisiert. Erstens, im Zusammenhang mit den im CrossAsia ITR (Integriertes Textrepositorium) gespeicherten Volltexten aus lizenzierten Datenbanken soll es in Zukunft möglich sein, diese Volltexte über Schnittstellen anzusprechen und in digitale Werkzeuge zu laden. Daran gekoppelt sind natürlich einerseits ein Authentifizierungssystem, andererseits die Idee, die mittels digitaler Werkzeuge angereicherten Daten ins ITR zurückzuspielen und dort dauerhaft referenzierbar bereitzustellen. Dieses Angebot wurde von 52% der Befragten als wichtig oder sehr wichtig bezeichnet.

Zweitens stellten wir ein Angebot im Zusammenhang mit den Open Access Publikationsplattformen des FID Asien vor: die dauerhafte Speicherung und Verwaltung von Forschungsdaten mit Bezug zu Open Access-Publikationen, die auf den ePublishing Plattformen des FID Asien veröffentlicht sind, inkl. deren Verknüpfung zu den zugehörigen Publikationen. Dies wurde sogar von 65% der Befragten als wichtig oder sehr wichtig bezeichnet.

Auffallend ist, dass auch bei dieser Matrixfrage wieder der Anteil derjenigen, die keine Antwort gegeben haben, relativ hoch ist (24% bzw. 18%). Ein Grund dafür kann u.U. sein, dass die vorgestellten Angebote nicht ausreichend bekannt sind oder ungenügend erläutert wurden.

Daran anschließend haben wir gefragt, welche Angebote mit Bezug auf Forschungsdaten vom FID Asien gewünscht werden, die nicht bereits genannt wurden. Hier wurde insbesondere ein Verzeichnis von fachrelevanten Repositorien bzw. eine Übersicht, Bibliographie oder Metakatalog zu Forschungsdaten mit Asienbezug genannt, die in relevanten Repositorien verzeichnet bzw. veröffentlicht sind. Unterstrichen wurde dieser Wunsch mit dem Hinweis, dass Daten in Originalschrift häufig in den Repositorien nicht (zuverlässig) nachgewiesen werden.

Abschließend haben wir in diesem Themenkomplex noch gefragt, wenn Daten vor- und aufbereitet werden, sodass Dritte diese nutzen können, zu welchen Aspekten besonders Unterstützung benötigt wird (siehe Abb. 19). Hier haben wir eine Priorisierung angestrebt.

Angeführt wird die Liste von fachspezifischen Aspekten, wie Empfehlungen zum Umgang mit Forschungsdaten (44% der Befragten) und Standards für eine angemessene Dokumentation (34%). Dies wird gefolgt von eher technischen Themen, wie unterstützende Software-Tools für die Aufbereitung und Bereinigung von Daten (32%) oder Beratung bei technischen Fragen (25%). Rechtliche Aspekte finden sich eher im Mittelfeld oder unter den weniger häufig genannten Punkten. So wird Beratung zum bzw. eine Auseinandersetzung mit dem Urheberrecht von 28% der Teilnehmenden gewünscht und selbiges zum Datenschutz von 20%. Eine fachspezifische Auseinandersetzung zu ethischen Fragen im Zusammenhang mit personenbezogenen Fragen wird von 9% gewünscht.

18% sagen, dass sie eher keine Zeit für die Aufbereitung von Daten, die nicht unmittelbar etwas mit ihrer Forschung zu tun haben, aufbringen wollen.

 

Im Freitextfeld für abschließende Kommentare zur Umfrage haben wir u.a. Hinweise erhalten, dass das Thema als sehr wichtig erachtet wird und gewünscht wird, dass zukünftige Wissenschaftler-Generationen bereits während des Studiums für die Frage des Umgangs mit und der Bereitschaft zur Veröffentlichung von Forschungsdaten sensibilisiert werden sollten. So wurde auch darauf hingewiesen, dass es für manche in der Umfrage verwendeten Begriffe hilfreich gewesen wäre, wenn zu diesen eine Definition mitgeliefert worden wäre, um sowohl ein gemeinsames Verständnis zu haben, als auch diejenigen, die noch nicht so tief in der Materie sind, mit einzubinden.


Was soll nun mit diesen Erkenntnissen geschehen?

Das Thema Forschungsdaten in den asienbezogenen Wissenschaften wurde bereits auf der CrossAsia Fachtagung im Januar 2018 gemeinsam als wichtig identifiziert und der FID Asien hat diese Anforderung der Wissenschaft in den Nachfolgeantrag mit aufgenommen. Die Aufgabe, ein entsprechendes Beratungs- und Informationsangebot zu entwickeln, das Sie bei allen Fragen rund um das Thema Forschungsdaten unterstützen soll, haben wir also schon für die Förderrunde 2019-2021 auf der Agenda. Die Ergebnisse der Umfrage helfen uns – und vielleicht auch Ihnen – zu beurteilen, wo wir in den asienbezogenen Wissenschaften derzeit „in Summe“ stehen. Für den FID Asien ist dabei wichtig, nicht nur den bereits im Thema fortgeschritteneren Forschenden als Ansprechpartner zur Verfügung zu stehen, sondern auch grundlegende Kenntnisse zu Forschungsdaten, Nachweise zu bereits bestehenden Angeboten und Informationen zu aktuellen Entwicklungen für die gesamte Community zusammenzutragen und bereitzustellen. Diese Aufgabe können wir nun auf der Basis Ihrer vielen hilfreichen Antworten und Anregungen, die wir im Rahmen der Umfrage erfahren haben, etwas zielgenauer angehen. Wir laden Sie ein, uns auch im weiteren Prozess mit Ihren Anregungen und Ihrem Feedback zu begleiten.

Umfrage Forschungsdaten – Newsletter 18

  • de

Umfrage zu Forschungsdaten in den asienbezogenen Wissenschaften

Liebe Asienwissenschaftlerin, lieber Asienwissenschaftler,
liebe Nutzerin, lieber Nutzer von CrossAsia,

der aktuelle Newsletter steht ganz im Zeichen von Forschungsdaten. Diese erlangen aufgrund des digitalen Wandels in der Wissenschaft und des Einsatzes computergestützter Methoden zunehmend an Bedeutung. Dies betrifft nicht nur die Geistes-, Kultur- und Sozialwissenschaften im Allgemeinen, sondern auch die Asienwissenschaften, wo bisher im Gegensatz zu anderen Disziplinen vergleichsweise wenig passiert ist. Drei wichtige Aspekte bezüglich Forschungsdaten haben sich in der Diskussion um digitale Forschungsdaten herauskristallisiert:

  • Der Anspruch der guten wissenschaftlichen Praxis und der damit geforderten Nachvollziehbarkeit der Forschungsbasis im Kontext digitaler Forschungsdaten.
  • Forschungsdaten als zitierfähige Datenpublikationen, die nicht nur der Forschungsfrage, in deren Kontext sie entstanden sind, als Basis dienen können, sondern darüber hinaus für verschiedenste Nachnutzungen bereit stehen.
  • Die Präsentation der Forschungsdaten in der Form, dass sie mittels digitaler Werkzeuge genutzt werden können und bspw. über Visualisierungen und statistische Methoden weitere, u.U. nicht vorausgesehene Erkenntnisse durch eine Nutzungsverbesserung der Daten generieren können.

Die Diskussion um digitale Forschungsdaten betrifft darüber hinaus aber auch zahlreiche rechtliche, ethische und organisatorische Aspekte, wie bspw. die Einwilligung zur Nachnutzung der Daten durch andere Forscherinnen und Forscher, das Einholen des Einverständnisses zur Nachnutzung der Daten durch bspw. Studienteilnehmer*innen und den Schutz von Persönlichkeitsrechten sowie anderer sensitiver Daten.

Das Thema Forschungsdaten inklusive des Umgangs mit diesen ist längst auch auf der Agenda von Wissenschaftsgremien und Forschungsförderern angekommen. So ruft die DFG bspw. Wissenschaftlerinnen und Wissenschaftler dazu auf, bei der Antragsstellung bereits ein Konzept für den Umgang mit Forschungsdaten in dem Projekt zu entwickeln.

Der FID Asien, der von der DFG maßgeblich finanziell unterstützt wird, möchte die Fachcommunity der Wissenschaftlerinnen und Wissenschaftler, die zu Asien forschen, beim Forschungsdatenmanagement unterstützen und innerhalb der Fachcommunity eine Diskussion zum Thema anstoßen. Dies geschieht auch vor dem Hintergrund der sich aktuell etablierenden Nationalen Forschungsdateninfrastruktur (NFDI). Die Asienwissenschaften sind aufgefordert, auf Bedarfe und Besonderheiten bezüglich Forschungsdaten aufmerksam zu machen, damit diese in die allgemeine Diskussion eingebracht und bei der Erarbeitung der infrastrukturellen und technischen Rahmenbedingungen berücksichtigt werden können.

Um diesen Dialog anzustoßen möchte der FID Asien gemeinsam mit den Fachgesellschaften (DGA, DMG, DVCS, GJF, VfK, VSJF) von Ihrer Expertise lernen und von Ihnen erfahren, wie Sie im Forschungsprozess mit ihren Daten umgehen, welche Erfahrungen und Meinungen Sie zur Recherche und Nachnutzung sowie Erstellung und Bereitstellung von Forschungsdaten haben.

Wir würden uns sehr freuen, wenn Sie sich einen Augenblick Zeit für diese Umfrage nehmen. Die Beantwortung dauert ca. 20 Minuten. Die Ergebnisse der Umfrage werden wir bei ausreichender Beteiligung im CrossAsia Blog veröffentlichen.

Die Umfrage ist offen bis: 8. April 2019

Weitere interessante und neue Entwicklungen aus CrossAsia

Neu lizenzierte Datenbanken und Testzugänge

Vielen Dank für Ihre Unterstützung!

Ihr Team vom FID Asien

Bericht: Forschungsdatenworkshop

Forschungsdaten in den asienbezogenen Wissenschaften

Bericht zum Workshop am 6. Dezember 2018, 11-15 Uhr, in der Staatsbibliothek zu Berlin

 

Teilnehmerinnen und Teilnehmer des Workshops

Matthias Arnold (Heidelberg Research Architecture, Universität Heidelberg)
Prof. Carmen Brandt (DGA, Universität Bonn)
Daniela Claus-Kim (FU Berlin)
Dr. Carolin Dunkel (Staatsbibliothek zu Berlin)
Christian Dunkel (Staatsbibliothek zu Berlin)
Dr. Tania Becker von Falkenstein (DVCS, TU Berlin)
Prof. Robert Horres (Universität Tübingen)
Matthias Kaun (Staatsbibliothek zu Berlin)
Dr. Florian Kräutli (MPI Wissenschaftsgeschichte)
Hanno Lecher (Bereichsbibliothek Ostasien, UB Heidelberg)
Prof. Daniel Leese (The Maoist Legacy, Universität Freiburg)
Jens Ludwig (Stiftung Preußischer Kulturbesitz)
Maximilian Mehner, M.A. (DMG Südasien, Universität Marburg)
Nicole Merkel (UB Heidelberg)
Dr. Florian Pölking (VfK, Universität Bochum)
Prof. Cornelia Reiher (VSJF, FU Berlin, CrossAsia Fachbeirat)
Prof. Florian C. Reiter (DMG, HU Berlin)
David Schulze (Stiftung Wissenschaft und Politik)
Prof. Yvonne Schulz Zinda (VfK, Universität Hamburg)
Dr. Miriam Seeger (Staatsbibliothek zu Berlin)
Dr. Martina Siebert (Staatsbibliothek zu Berlin)
Franziska Trempler (Staatsbibliothek zu Berlin)
Dr. Cosima Wagner (GJF, Campusbibliothek, FU Berlin)
Prof. Urs Matthias Zachmann (GJF, FU Berlin)

Protokoll: Dr. Martina Siebert

 

Der FID Asien hat zum 6. Dezember 2018 nach Berlin eingeladen, um zum Thema Forschungsdaten in den Asienwissenschaften ins Gespräch zu kommen. Eingeladen waren sowohl Repräsentanten der relevanten Fachgesellschaften (DGA, DMG, DVCS, GJF, VfK, VSJF) als auch Vertreterinnen und Vertreter von Projekten und Institutionen, in denen größere Mengen an Daten in eigenen Infrastrukturen generiert und gehostet werden. Gemeinsam ist allen Teilnehmerinnen und Teilnehmern die Aufgabe, sich um die langfristige Sicherstellung der Zugänglichkeit und die Nachhaltigkeit von Forschungsdaten kümmern zu wollen bzw. zu müssen, auch um die Anforderungen der DFG diesbezüglich zu erfüllen. Eines der Ziele war es, zu diskutieren, ob der FID Asien sich in diesem Bereich für die asienbezogenen Wissenschaften stärker als bislang engagieren soll und ob bzw. wie er sich in die verschiedenen bereits bestehenden lokalen, regionalen und / oder nationalen Aktivitäten einbringen sollte. Es sollte gemeinsam ausgelotet werden ob, und wenn ja, wie man sich im Fach gemeinsam zum Thema Forschungsdaten koordinieren und positionieren möchte.

FID Asien und Forschungsdaten

Zur Einleitung haben Matthias Kaun (Leiter der Ostasienabteilung der Staatsbibliothek zu Berlin) und Miriam Seeger (Fachreferentin für China, Hongkong, Macao und Taiwan) umrissen, in welcher Form Forschungsdaten als Aufgabe im Rahmen des FID Antrags für die zweite Förderphase (2019-2021) definiert wurden und wie geplant ist, das Aktionsfeld „Forschungsdaten“ in den kommenden drei Jahren im FID Asien auszufüllen (siehe auch den Antragstext). Es sind vor allem zwei Stoßrichtungen vorgesehen: zum einen der Aufbau eines Beratungs- und Informationsangebots und kooperativen Netzwerks zwischen der Wissenschaft und Infrastrukturanbietern zu Forschungsdaten in den asienbezogenen Wissenschaften, zum anderen das Umsetzen und Testen von konkreten infrastrukturellen Anforderungen der Wissenschaft für die Generierung und Speicherung von Forschungsdaten im CrossAsia ITR (Integrierten Textrepositorium) oder einem „Zuliefersystem“ (wie für Bilddaten z.B. einem iiif-Editor) anhand von exemplarischen Partnerprojekten.

Diese parallele Vorgehensweise zielt darauf ab, Kompetenzen und Zuständigkeiten effizient und nachhaltig in einem Netzwerk zu verteilen – mit der Bereitschaft des FID Asien hier koordinierend tätig zu werden – aber auch selbst Expertise zu generieren. In einigen Fällen wird es in Zukunft sinnvoll sein, selbst „host“ zu sein. Dies sind vor allem solche Fälle, in denen auf der Basis von Materialien aus dem CrossAsia Portfolio oder dem des FID Asien Forschungsdaten entstehen, die – verlinkt mit den Vorlagen – in das CrossAsia ITR zurückgespeichert werden sollen.

Forschungsdaten: was und warum

Die Frage der „Definition“ von Forschungsdaten hat schon viele Stellungnahmen beschäftigt. In einem kurzen Überblick über die Entwicklung des Förderrahmens für Forschungsdaten und Infrastrukturen (Stichwort „Nationale Forschungsdateninfrastruktur“ NFDI; „Rat für Informationsinfrastrukturen“ RfII) hat Jens Ludwig (Stabstelle „Digitale Transformation“ der Stiftung Preußischer Kulturbesitz) u.a. drei Aspekte von Forschungsdaten hervorgehoben, die auch eine zeitliche Entwicklung und zunehmende Wichtigkeit von Forschungsdaten in und für die Wissenschaften nachzeichnen. Begonnen mit dem Anspruch der guten wissenschaftlichen Praxis und der damit geforderten „Nachvollziehbarkeit“ der Forschungsbasis haben sich die Erwartungen an Forschungsdaten sukzessive weiterentwickelt. Im nächsten Schritt war ein Forschungsdatum eine zitierfähige Datenpublikation, die nicht nur der Forschungsfrage, in deren Kontext sie entstanden ist, als Basis dienen kann, sondern darüber hinaus für verschiedenste „Nachnutzungen“ bereit stehen sollte. Heute sollen Forschungsdaten darüber hinaus idealerweise so präsentiert werden, dass sie mittels digitaler Werkzeuge, über Visualisierungen und statistische Methoden (Ngram, Co-occurrence etc.) weitere, u.U. nicht vorausgesehene Erkenntnisse durch eine „Nutzungsverbesserung“ der Daten generieren können.

„Bedarfs“-Communities und Fach-Communities

Die im Rahmen der NFDI beschlossene finanzielle Förderung blickt nicht so sehr auf diese verschiedenen Nutzungsstufen von Forschungsdaten. Hier liegt der Fokus erst einmal darauf, eine vernetzte „Struktur“ von Kompetenzen und keinen „Ort“ in Form eines Daten-Repositoriums o.ä. aufzubauen. Durch die Förderung soll sichergestellt werden, dass die verschiedenen wissenschaftlichen Bereiche und Methoden „Sprech- und Handlungsfähigkeit“ erlangen und aktive Fachcommunities ihre „Bedarfe selbst ermitteln und priorisieren.“ Grenzen sollen jedoch nicht „spezialistisch oder exklusiv“ sein, sondern wenn sie gezogen werden, anhand verschiedener Bedarfe bestimmt werden. Die Förderung dieser Konsortien und Infrastrukturen ist vor allem auf eine größere Effizienz des Wissenschaftssystems fokussiert. Somit werden im Rahmen der NFDI „Köpfe“ bzw. ca. 30 solcher Konsortien gefördert und nicht in erster Linie die dafür notwendige „Technik.“

Auch die asienbezogenen Wissenschaften sollten das Thema Forschungsdaten, so der Vorschlag, von eben solchen Infrastrukturen und kooperativen Netzwerken her angehen und weniger über Fragen der Formate u.ä. räsonieren. Zudem ist in der Regel „speichern“ kein ausreichendes Ziel, da die Daten ja gefunden werden müssen. Sie müssen zudem interoperabel genug sein, so dass sie in anderen Kontexten sinnvoll verwendet werden können. Forscher erwarten heute u.U. Werkzeuge, um die Daten zu explorieren und – mehr oder weniger – direkt am „Fundort“ zu analysieren. Doch wie weit soll / muss / möchte man hier gehen?

Die Frage der Breite der asienbezogenen Wissenschaften, in der alle geistes- und sozialwissenschaftlichen Disziplinen mit ihren speziellen und vielfältigen Formen von Forschungsdaten und -methoden vertreten sind, hat die Diskussionsrunde beschäftigt. Die NFDI-Konsortien sprechen von „aktiven Fachcommunities“ die ihre „Bedarfe“ selbst ermitteln sollen. Ist das auf die asienbezogenen Wissenschaften in ihrer gesamten Breite anwendbar und ein Konsens vorstellbar? Haben die verschiedenen geistes- und sozialwissenschaftlichen Arbeitsmethoden gemeinsame Bedarfe? Sehr deutlich wurde hier auch davor gewarnt mit diesen NFDI-Konsortien nicht eine vermeintliche „Kleinstaatlichkeit der Regionalstudien“ zu reproduzieren oder gar zu verfestigen. Sollen sich sozialwissenschaftlich arbeitende Projekte deshalb mit ihren Forschungsdaten eher an sozialwissenschaftliche Forschungsdateninfrastrukturen wenden? Spielt die „Nicht-Lateinschriftlichkeit“ hier eine Rolle und ist sie ein taugliches verbindendes Element? Sollte es ein Asien-NFDI-Konsortium geben, um sicher zu stellen, dass regionalspezifische Anforderungen nicht vergessen werden? Wer sind hier die besten Partner, um eine Forschungsdaten-Infrastruktur für die asienbezogenen (oder regionalspezifischen) Wissenschaften aufzubauen? Sind diese vielleicht nicht in Europa zu finden, sondern in Asien bzw. den entsprechenden Ländern selbst?

Kann es „eine“ Datenbank geben, in die alle Projekte ihre Daten speichern und damit keine Projektzeit für den Aufbau eigener Datenbanken verbrauchen (und dann Zeit dafür brauchen, diese Daten zu überführen etc.)? D.h. kann man einen allen gemeinsamen „Bedarf“ abstrahieren und diesen in eine datentechnische Struktur überführen? Interessant war in diesem Zusammenhang der Bericht aus dem MPIWG, wo anhand eines Beispielprojekts die Tauglichkeit des CIDOC Conceptual Reference Models (CIDOC-CRM) getestet wird, Forschungsdaten in Form eines „knowledge graph“ abzubilden.

Im Rahmen der Vorstellung der einzelnen Fachgesellschaften und Infrastrukturvertreter wurden eine Reihe weitere Bedarfe und Bedenken genannt: Verbreitung und Nachnutzung von Forschungsdaten können ethische Fragen aufwerfen, Persönlichkeitsrechte müssen berücksichtigt werden, und auch der Kopierschutz muss beachtet werden. Eine Infrastruktur muss in der Lage sein, all diese Anforderungen zu erfüllen.

Wer ist bzw. sollte für was zuständig sein? Welche Aktivitäten gibt es bereits?

Neben der Frage, ob eine Methode oder der regionale Bezug die sinnvollere Abgrenzung zu anderen NFDI-Konsortien bilden, stand auch die Frage im Raum, wie die Universitätsbibliotheken sich hier in Zukunft positionieren wollen. Für das wissenschaftliche Profil einer Universität ist es wichtig, in ihrem Kontext entstandene Daten auch selbst zu präsentieren (vgl. z.B. Repositorien für Doktorarbeiten). Für die Forscher selbst ist sicherlich der fachliche Zugang relevanter (und in der Regel auch vertrauter). Können die Fachgesellschaften hier Rollen übernehmen bzw. sich Aufgaben innerhalb eines Netzwerkes vorstellen? Wie ist die aktuelle Struktur in den jeweiligen Gesellschaften und gibt es bereits eine Position zu Forschungsdaten? Wie sehen Infrastruktureinrichtungen ihre aktuellen oder geplanten Aktivitäten in dieser Richtung?

Im Rahmen der Kurzberichte der Vertreter der Fachgesellschaften und Infrastruktur-Einrichtungen bzw. Projekte, die eine Infrastruktur aufbauen wollen oder aufgebaut haben, sind einige wichtige Dinge zur Sprache gekommen. Die beiden überregional wirkenden Asien-Fachgesellschaften, die Deutsche Morgenländische Gesellschaft (DMG) und die Deutschen Gesellschaft für Asienkunde e. V. (DGA), haben hier bislang noch keine strukturierte Aktivität unternommen oder Leitlinien zu diesem Thema erstellt. Die Ziele der DMG sind insbesondere die Förderung der Wissenschaften und die Publikation ihrer Ergebnisse, die sie mit ihrem Organ der ZDMG ausreichend repräsentiert sieht. Da ihre Mitglieder vor allem philologisch arbeiten, liegt ein Interessenfokus der DMG auf dem adäquaten Zugang zu Quellen. Die DMG greift regional zudem noch weiter aus als „asienbezogen“ und vertritt auch Forschung zu Afrika. Die sinologische Fachgesellschaft, die Deutsche Vereinigung für Chinastudien (DVCS), hat in ähnlicher Weise bislang auch noch keine strukturierte Aktivität unternommen. Die 230-250 Mitglieder des DVCS stammen vorwiegend aus dem Mittelbau. Zum aktuellen Zeitpunkt gibt es keine top-down Beratung innerhalb der DVCS im Hinblick auf Forschungsdaten. Die Fachgesellschaft der Koreanistik, die Vereinigung für Koreaforschung e.V. (VfK), hat ebenfalls noch keine Position zum Thema entwickelt, möchte sich aber in die weitere Diskussion einbringen und Ziele mitgestalten.

In beiden vertretenen japanologischen Fachgesellschaften, der Gesellschaft für Japanforschung (GJF) und der Vereinigung für Sozialwissenschaftliche Japanforschung (VSJF), gibt es Mitglieder, die bereits intensiv mit Big Data arbeiten und eine AG der GJF, die sich mit dem Thema Umgang mit Forschungsdaten beschäftigen wird, wurde auf dem Japanologentag (2018) ins Leben gerufen. Ziel der AG ist es, Aktivitäten besser zu vernetzen und ein Positionspapier zu Forschungsdaten zu erstellen.

Im Juli 2018 fand organisiert durch das vom BMBF geförderte Forschungsprojekt „FDM_OAS-Orient“ ein überregionaler Workshop zum Thema „Nicht-lateinische Schriften in multilingualen Umgebungen: Forschungsdaten und Digital Humanities in den Regionalstudien“ an der Campusbibliothek der FU Berlin statt, an dem u.a. Vertreterinnen und Vertreter beider Fachgesellschaften sowie des FID Asien und FID Nahost-, Nordafrika- und Islamstudien teilgenommen haben (siehe den Workshop-Bericht im DHd Blog).

Die anwesenden Infrastrukturvertreter konnten konkreter von bereits bestehenden Strukturen berichten und haben weitere Ziele oder auch spezifische Problematiken thematisiert. Die „Heidelberg Research Infrastructure“ sammelt seit mehreren Jahren bereits Erfahrungen darin, verschiedenste Quellenformate zu speichern und so aufzubereiten, dass damit wissenschaftliche Daten erzeugt werden können. Sie versucht dabei, Grundprinzipien wie Nachhaltigkeit und Anschlussfähigkeit an größere Netzwerke und die strikte Trennung von Metadaten und Daten zu wahren. Forschungsarbeiten aus dem Bereich der Sinologie sind hier erstes Testgebiet. Wenn man noch tiefer in Daten-Projekte hineinschaut, werden weitere Aspekte deutlich. Im Freiburger Projekt zur Chinesischen Kulturrevolution „The Maoist Legacy“ ist eine Datenbank mit Materialien der Kulturrevolution entstanden, die auch anderen Forschern zur Verfügung steht. Da es sich jedoch um z.T. sensible und auch Persönlichkeitsrechte behaftete Daten handelt, mussten mehrere Zugrifflevels eingerichtet werden. Bereits die Speicherung dieser Daten kann Rechtsfragen aufwerfen, die nicht jede Institution bereit oder auch fähig ist zu klären. Die Bibliothek des MPIWG berichtete aus vor allem zwei Bereichen, in denen sie aktuell in Bezug auf Forschungsdaten aktiv ist. Zum einen, das oben erwähnte „übersetzen“ von Datenbeziehungen mittels einer Ontologie, zum anderen die Überlegungen wie mit digitalen, analytischen Werkzeugen auf lizenzgeschützten Materialien gearbeitet werden kann, ohne die entsprechenden Lizenzen zu verletzen. Der zunehmenden Bedeutung von digitalen Datenanalysen auch in den Geisteswissenschaften trägt die Universität Tübingen Rechnung, indem sie einen Masterstudiengang anbietet, der Digital Humanities und Regionalstudien vereint. Auch wenn viel über digitale Daten und DH gesprochen wird, so ist doch weitere Lobby-Arbeit notwendig, damit Ergebnisse und Methoden, die von Forschern entwickelt werden – auch in Fächern wie der Japanologie oder Sinologie – als wissenschaftliche Leistung anerkannt und karrieretechnisch als relevant erachtet werden. Infrastrukturen können (und sollten) also auch ein Qualitätssigel sein und Daten darin somit nicht als „weggeschenkt“ gelten, sondern umgekehrt die Forscher oder das Projekt „prominenter“ machen.

Die FU Berlin brachte zwei weitere wichtige Aspekte bezüglich des digitalen Wandels ein: Erstens wird laut Deutschem Bibliotheksverband (dbv) ein Trend deutlich, dass wissenschaftliche Bibliotheken zu einer passgenauen Informations- und Medienversorgung zunehmend auch zeitgemäße Dienste und Werkzeuge zur Unterstützung des Life-Cycle in Forschung, Lehre und Studium entwickeln und anbieten (siehe: Wissenschaftliche Bibliotheken 2025, hrsg. vom DBV, Jan. 2018).

Zweitens ist es meistens nicht sinnvoll, als Institution den Weg des „digitalen Wandels“ alleine zu bestreiten, auch nicht wenn man die Größe einer Universität hat. Kooperation wird immer wichtiger. In einigen Institutionen fusionieren Datenzentren bzw. Anbieter für digitale Medien und Technologien in Forschung und Lehre mit den Bibliotheken (so in Planung an der FU Berlin) und die drei Berliner Universitäten – HU, FU und TU – wollen gemeinsam mit der Charité Universitätsmedizin einen Verbundantrag im Rahmen der Exzellenzinitiative einreichen (Stand Dez. 2018), in der der digitale Wandel eine zentrale Rolle spielen soll.

Festzuhalten ist, dass der Grad der Bereitschaft zu und die Ausgestaltung von neuen bibliothekarischen Dienstleistungen in den Bereichen Forschungsdatenmanagement und Digital Humanities allgemein sowie für die Regionalwissenschaften im Besonderen stark standortabhängig ist und ein großes Gefälle von Hochschule zu Hochschule aufweist.

Gibt es einen nächsten gemeinsamen Schritt und wie könnte der aussehen?

Voraussichtlich im ersten Quartal 2019 wird die Ausschreibung für NFDI-Konsortien verkündet. Kann man ein solches Angebot der NFDI z.B. nutzen, um gemeinsam auszuloten, wie ein kooperatives Vorgehen in diesen neuen Feldern gestaltet werden könnte? In diesem Zuge müsste auch definiert werden, wie Aktivitäten im Rahmen der zweiten Runde des FID und solche im Rahmen der NFDI verzahnt werden könnten.

Brauchen die asienbezogenen Wissenschaften etwas Vergleichbares wie den „Rat für Sozial- und Wirtschaftsdaten“ (RatSWD), einen „Asien-Rat“, der von politischem Interesse für die Sichtbarkeit der Regionalstudienfächer und ihrer Anforderungen an Forschungsinfrastrukturen ist? Könnte dieser Rat in nationalen Kontexten agieren und die asienbezogene Forschung dort sprechfähig machen? Von welchem nationalen Interesse wäre so ein „Asien-Rat“ bzw. was wären seine Aufgaben?

Bei allen ausformulierten Anforderungen zu Forschungsdaten und Infrastrukturen muss man bedenken, dass zukünftige Forschungsanträge und -ergebnisse daran gemessen werden.

Um das breitere Interesse und die Anforderungen der Forschenden, Lehrenden und Studierenden am Thema Forschungsdaten und Forschungsdateninfrastruktur zu ermitteln, soll eine Umfrage erstellt und über relevante Mailing-Listen, den CrossAsia Newsletter und u.U. auch die Fachgesellschaften verbreitet werden. Die Fachverbände werden gebeten, sich ebenfalls zur Frage zu positionieren (u.U. auch anhand des Fragebogens). Sie sollen zudem Position dazu beziehen, ob und wie sie sich in den weiteren Prozess einbringen wollen.

CrossAsia übernimmt für den Entwurf des Fragebogens die Federführung. Der Entwurf wird im ersten  Quartal 2019 an die Teilnehmerinnen und Teilnehmer der Runde mit Bitte um Kommentierung geschickt.

Zum Abschluss hier noch einige Kommentare, Vorschläge und mögliche Ziele, die im Rahmen der Diskussionen bezüglich Forschungsdaten, den Bedürfnissen der Wissenschaftlerinnen und Wissenschaftler genannt wurden:

  • Position zu Formaten und Standards sollten gemeinsam entwickelt werden.
  • Fragen und Klärungsansätze zu rechtlichen und ethischen Probleme mit Daten sollten zusammengetragen und allen Daten-Forschern klar vor Augen geführt werden.
  • Kooperationen sollten das Ziel haben, aus den verschiedenen konkreten Beispielen Daten-Abstraktionen zu entwickeln, die schließlich das regionalspezifische in den Hintergrund stellen.
  • Asien auch in diesen Kontexten beizubehalten ist als Teil der Lobbyarbeit für die eigene wissenschaftliche Disziplin wichtig.
  • Auch wenn Fachgesellschaften z.T. ihre Bedürfnisse bereits identifiziert haben, mangelt es ihnen an passender Infrastruktur, die sie oft nicht aus eigener Kraft aufbauen können.
  • Solche Aufgaben sollten in einer Governance-Struktur verwirklicht werden, die in der Lage ist, Partikularinteressen nicht zu unterdrücken.
  • Es sollten keine „Daten-Container“ gebaut werden; Ziel sollte vielmehr sein, in Richtung Open Data, Open Science zu gehen.