CrossAsia Newsletter

“Texte aufräumen” – die ersten CrossAsia N-Gramm-Pakete stehen zum Download bereit

Die meisten kennen sicherlich Ursus Wehrlis Buch „Kunst aufräumen“. Dort wird z.B. Keith Harings „Untitled“ (1986) in seine einzelnen Farbsegmente zerlegt und diese werden fein säuberlich nach Farben und Größe geordnet übereinander gestapelt (siehe z.B. hier). Ganz ähnlich geht das Erstellen von N-Grammen vor. Der eigentliche Text wird in seine Einzelteile zerlegt, identische Einzelteile werden zusammengetragen und dann wird gezählt: was gibt es wie oft. Damit wird sogar noch etwas ökonomischer als bei Herrn Wehrli „aufgeräumt“. Die eigentliche Struktur, das Gesamtbild, wird aufgelöst und der Text strikt statistisch und auf der Basis seiner Einzelteile betrachtet. Was im Fall von N-Grammen als „Einzelteil“ gilt, kann dabei variieren. In Texten in lateinischer Schrift können das die Buchstaben sein oder die durch Leerstellen identifizierbaren Wörter oder auch zwei oder drei (etc.) aufeinanderfolgende Buchstaben oder Wörter.

„Aufräumen“ Ostasiatisch

Für ostasiatische Texte sind die am sichersten korrekt zu identifizierenden Einzelteile die verschiedenen Schriftzeichen (chinesische Schriftzeichen oder auch japanische bzw. koreanische Silbenzeichen). An einem Beispiel lässt sich gut zeigen, wie konzeptionell einfach N-Gramme zunächst gedacht sind. Aus den ersten zwei Phrasen des Daode jing

道可道,非常道。名可名,非常名。無名天地之始, 有名萬物之母。

… wird (hier ohne die Satzzeichen, da die im Original i.d.R. ja auch nicht zur Verfügung stehen) im Fall von 1-Grammen (Monogramm bzw. Engl. unigram) folgendes:

名, 5
道, 3
可, 2
非, 2

常, 2
之, 2
無, 1
天, 1

地, 1
始, 1
有, 1
萬, 1

物, 1
母, 1

… im Fall von 2-Grammen (Bigramm bzw. Engl. bigram), bei denen die Einzelteile nicht aneinander angrenzen, sondern sich schuppenartig überlagern (also 道可, 可道, 道非 etc.), nach Anzahl gestaffelt dieses:

非常, 2
道可, 1
可道, 1
道非, 1
常道, 1
道名, 1

名可, 1
可名, 1
名非, 1
常名, 1
名無, 1
無名, 1

名天, 1
天地, 1
地之, 1
之始, 1
始有, 1
有名, 1

名萬, 1
萬物, 1
物之, 1
之母, 1

Die 3-Gramm (Trigramm bzw. Engl. trigram) Liste würde noch länger und keiner der 3-Gramme würde – auf diesen kleinen Abschnitt bezogen – mehr als einmal vorkommen. Zwei Dinge werden klar: N-Gramme machen für kurze Texte keinen Sinn und die Listen werden schnell sehr groß. Für den gesamten Korpus des Xuxiu Siku quanshu mit 5.446 Titeln sind das 27.387 Monogramme, bzw. 13.216.542 Bigramme; allein für das Beispiel Buwu quanshu 卜筮全書 aus dem Headerbild werden bereits 3.382 Monogramme, 64.438 Bigramme und 125.010 Trigramme gebildet.

Weiterlesen

Umfrage Forschungsdaten – Newsletter 18

Umfrage zu Forschungsdaten in den asienbezogenen Wissenschaften

Liebe Asienwissenschaftlerin, lieber Asienwissenschaftler,
liebe Nutzerin, lieber Nutzer von CrossAsia,

der aktuelle Newsletter steht ganz im Zeichen von Forschungsdaten. Diese erlangen aufgrund des digitalen Wandels in der Wissenschaft und des Einsatzes computergestützter Methoden zunehmend an Bedeutung. Dies betrifft nicht nur die Geistes-, Kultur- und Sozialwissenschaften im Allgemeinen, sondern auch die Asienwissenschaften, wo bisher im Gegensatz zu anderen Disziplinen vergleichsweise wenig passiert ist. Drei wichtige Aspekte bezüglich Forschungsdaten haben sich in der Diskussion um digitale Forschungsdaten herauskristallisiert:

  • Der Anspruch der guten wissenschaftlichen Praxis und der damit geforderten Nachvollziehbarkeit der Forschungsbasis im Kontext digitaler Forschungsdaten.
  • Forschungsdaten als zitierfähige Datenpublikationen, die nicht nur der Forschungsfrage, in deren Kontext sie entstanden sind, als Basis dienen können, sondern darüber hinaus für verschiedenste Nachnutzungen bereit stehen.
  • Die Präsentation der Forschungsdaten in der Form, dass sie mittels digitaler Werkzeuge genutzt werden können und bspw. über Visualisierungen und statistische Methoden weitere, u.U. nicht vorausgesehene Erkenntnisse durch eine Nutzungsverbesserung der Daten generieren können.

Die Diskussion um digitale Forschungsdaten betrifft darüber hinaus aber auch zahlreiche rechtliche, ethische und organisatorische Aspekte, wie bspw. die Einwilligung zur Nachnutzung der Daten durch andere Forscherinnen und Forscher, das Einholen des Einverständnisses zur Nachnutzung der Daten durch bspw. Studienteilnehmer*innen und den Schutz von Persönlichkeitsrechten sowie anderer sensitiver Daten.

Das Thema Forschungsdaten inklusive des Umgangs mit diesen ist längst auch auf der Agenda von Wissenschaftsgremien und Forschungsförderern angekommen. So ruft die DFG bspw. Wissenschaftlerinnen und Wissenschaftler dazu auf, bei der Antragsstellung bereits ein Konzept für den Umgang mit Forschungsdaten in dem Projekt zu entwickeln.

Der FID Asien, der von der DFG maßgeblich finanziell unterstützt wird, möchte die Fachcommunity der Wissenschaftlerinnen und Wissenschaftler, die zu Asien forschen, beim Forschungsdatenmanagement unterstützen und innerhalb der Fachcommunity eine Diskussion zum Thema anstoßen. Dies geschieht auch vor dem Hintergrund der sich aktuell etablierenden Nationalen Forschungsdateninfrastruktur (NFDI). Die Asienwissenschaften sind aufgefordert, auf Bedarfe und Besonderheiten bezüglich Forschungsdaten aufmerksam zu machen, damit diese in die allgemeine Diskussion eingebracht und bei der Erarbeitung der infrastrukturellen und technischen Rahmenbedingungen berücksichtigt werden können.

Um diesen Dialog anzustoßen möchte der FID Asien gemeinsam mit den Fachgesellschaften (DGA, DMG, DVCS, GJF, VfK, VSJF) von Ihrer Expertise lernen und von Ihnen erfahren, wie Sie im Forschungsprozess mit ihren Daten umgehen, welche Erfahrungen und Meinungen Sie zur Recherche und Nachnutzung sowie Erstellung und Bereitstellung von Forschungsdaten haben.

Wir würden uns sehr freuen, wenn Sie sich einen Augenblick Zeit für diese Umfrage nehmen. Die Beantwortung dauert ca. 20 Minuten. Die Ergebnisse der Umfrage werden wir bei ausreichender Beteiligung im CrossAsia Blog veröffentlichen.

Die Umfrage ist offen bis: 8. April 2019

Weitere interessante und neue Entwicklungen aus CrossAsia

Neu lizenzierte Datenbanken und Testzugänge

Vielen Dank für Ihre Unterstützung!

Ihr Team vom FID Asien

Bericht: Forschungsdatenworkshop

Forschungsdaten in den asienbezogenen Wissenschaften

Bericht zum Workshop am 6. Dezember 2018, 11-15 Uhr, in der Staatsbibliothek zu Berlin

 

Teilnehmerinnen und Teilnehmer des Workshops

Matthias Arnold (Heidelberg Research Architecture, Universität Heidelberg)
Prof. Carmen Brandt (DGA, Universität Bonn)
Daniela Claus-Kim (FU Berlin)
Dr. Carolin Dunkel (Staatsbibliothek zu Berlin)
Christian Dunkel (Staatsbibliothek zu Berlin)
Dr. Tania Becker von Falkenstein (DVCS, TU Berlin)
Prof. Robert Horres (Universität Tübingen)
Matthias Kaun (Staatsbibliothek zu Berlin)
Dr. Florian Kräutli (MPI Wissenschaftsgeschichte)
Hanno Lecher (Bereichsbibliothek Ostasien, UB Heidelberg)
Prof. Daniel Leese (The Maoist Legacy, Universität Freiburg)
Jens Ludwig (Stiftung Preußischer Kulturbesitz)
Maximilian Mehner, M.A. (DMG Südasien, Universität Marburg)
Nicole Merkel (UB Heidelberg)
Dr. Florian Pölking (VfK, Universität Bochum)
Prof. Cornelia Reiher (VSJF, FU Berlin, CrossAsia Fachbeirat)
Prof. Florian C. Reiter (DMG, HU Berlin)
David Schulze (Stiftung Wissenschaft und Politik)
Prof. Yvonne Schulz Zinda (VfK, Universität Hamburg)
Dr. Miriam Seeger (Staatsbibliothek zu Berlin)
Dr. Martina Siebert (Staatsbibliothek zu Berlin)
Franziska Trempler (Staatsbibliothek zu Berlin)
Dr. Cosima Wagner (GJF, Campusbibliothek, FU Berlin)
Prof. Urs Matthias Zachmann (GJF, FU Berlin)

Protokoll: Dr. Martina Siebert

 

Der FID Asien hat zum 6. Dezember 2018 nach Berlin eingeladen, um zum Thema Forschungsdaten in den Asienwissenschaften ins Gespräch zu kommen. Eingeladen waren sowohl Repräsentanten der relevanten Fachgesellschaften (DGA, DMG, DVCS, GJF, VfK, VSJF) als auch Vertreterinnen und Vertreter von Projekten und Institutionen, in denen größere Mengen an Daten in eigenen Infrastrukturen generiert und gehostet werden. Gemeinsam ist allen Teilnehmerinnen und Teilnehmern die Aufgabe, sich um die langfristige Sicherstellung der Zugänglichkeit und die Nachhaltigkeit von Forschungsdaten kümmern zu wollen bzw. zu müssen, auch um die Anforderungen der DFG diesbezüglich zu erfüllen. Eines der Ziele war es, zu diskutieren, ob der FID Asien sich in diesem Bereich für die asienbezogenen Wissenschaften stärker als bislang engagieren soll und ob bzw. wie er sich in die verschiedenen bereits bestehenden lokalen, regionalen und / oder nationalen Aktivitäten einbringen sollte. Es sollte gemeinsam ausgelotet werden ob, und wenn ja, wie man sich im Fach gemeinsam zum Thema Forschungsdaten koordinieren und positionieren möchte.

FID Asien und Forschungsdaten

Zur Einleitung haben Matthias Kaun (Leiter der Ostasienabteilung der Staatsbibliothek zu Berlin) und Miriam Seeger (Fachreferentin für China, Hongkong, Macao und Taiwan) umrissen, in welcher Form Forschungsdaten als Aufgabe im Rahmen des FID Antrags für die zweite Förderphase (2019-2021) definiert wurden und wie geplant ist, das Aktionsfeld „Forschungsdaten“ in den kommenden drei Jahren im FID Asien auszufüllen (siehe auch den Antragstext). Es sind vor allem zwei Stoßrichtungen vorgesehen: zum einen der Aufbau eines Beratungs- und Informationsangebots und kooperativen Netzwerks zwischen der Wissenschaft und Infrastrukturanbietern zu Forschungsdaten in den asienbezogenen Wissenschaften, zum anderen das Umsetzen und Testen von konkreten infrastrukturellen Anforderungen der Wissenschaft für die Generierung und Speicherung von Forschungsdaten im CrossAsia ITR (Integrierten Textrepositorium) oder einem „Zuliefersystem“ (wie für Bilddaten z.B. einem iiif-Editor) anhand von exemplarischen Partnerprojekten.

Diese parallele Vorgehensweise zielt darauf ab, Kompetenzen und Zuständigkeiten effizient und nachhaltig in einem Netzwerk zu verteilen – mit der Bereitschaft des FID Asien hier koordinierend tätig zu werden – aber auch selbst Expertise zu generieren. In einigen Fällen wird es in Zukunft sinnvoll sein, selbst „host“ zu sein. Dies sind vor allem solche Fälle, in denen auf der Basis von Materialien aus dem CrossAsia Portfolio oder dem des FID Asien Forschungsdaten entstehen, die – verlinkt mit den Vorlagen – in das CrossAsia ITR zurückgespeichert werden sollen.

Forschungsdaten: was und warum

Die Frage der „Definition“ von Forschungsdaten hat schon viele Stellungnahmen beschäftigt. In einem kurzen Überblick über die Entwicklung des Förderrahmens für Forschungsdaten und Infrastrukturen (Stichwort „Nationale Forschungsdateninfrastruktur“ NFDI; „Rat für Informationsinfrastrukturen“ RfII) hat Jens Ludwig (Stabstelle „Digitale Transformation“ der Stiftung Preußischer Kulturbesitz) u.a. drei Aspekte von Forschungsdaten hervorgehoben, die auch eine zeitliche Entwicklung und zunehmende Wichtigkeit von Forschungsdaten in und für die Wissenschaften nachzeichnen. Begonnen mit dem Anspruch der guten wissenschaftlichen Praxis und der damit geforderten „Nachvollziehbarkeit“ der Forschungsbasis haben sich die Erwartungen an Forschungsdaten sukzessive weiterentwickelt. Im nächsten Schritt war ein Forschungsdatum eine zitierfähige Datenpublikation, die nicht nur der Forschungsfrage, in deren Kontext sie entstanden ist, als Basis dienen kann, sondern darüber hinaus für verschiedenste „Nachnutzungen“ bereit stehen sollte. Heute sollen Forschungsdaten darüber hinaus idealerweise so präsentiert werden, dass sie mittels digitaler Werkzeuge, über Visualisierungen und statistische Methoden (Ngram, Co-occurrence etc.) weitere, u.U. nicht vorausgesehene Erkenntnisse durch eine „Nutzungsverbesserung“ der Daten generieren können.

„Bedarfs“-Communities und Fach-Communities

Die im Rahmen der NFDI beschlossene finanzielle Förderung blickt nicht so sehr auf diese verschiedenen Nutzungsstufen von Forschungsdaten. Hier liegt der Fokus erst einmal darauf, eine vernetzte „Struktur“ von Kompetenzen und keinen „Ort“ in Form eines Daten-Repositoriums o.ä. aufzubauen. Durch die Förderung soll sichergestellt werden, dass die verschiedenen wissenschaftlichen Bereiche und Methoden „Sprech- und Handlungsfähigkeit“ erlangen und aktive Fachcommunities ihre „Bedarfe selbst ermitteln und priorisieren.“ Grenzen sollen jedoch nicht „spezialistisch oder exklusiv“ sein, sondern wenn sie gezogen werden, anhand verschiedener Bedarfe bestimmt werden. Die Förderung dieser Konsortien und Infrastrukturen ist vor allem auf eine größere Effizienz des Wissenschaftssystems fokussiert. Somit werden im Rahmen der NFDI „Köpfe“ bzw. ca. 30 solcher Konsortien gefördert und nicht in erster Linie die dafür notwendige „Technik.“

Auch die asienbezogenen Wissenschaften sollten das Thema Forschungsdaten, so der Vorschlag, von eben solchen Infrastrukturen und kooperativen Netzwerken her angehen und weniger über Fragen der Formate u.ä. räsonieren. Zudem ist in der Regel „speichern“ kein ausreichendes Ziel, da die Daten ja gefunden werden müssen. Sie müssen zudem interoperabel genug sein, so dass sie in anderen Kontexten sinnvoll verwendet werden können. Forscher erwarten heute u.U. Werkzeuge, um die Daten zu explorieren und – mehr oder weniger – direkt am „Fundort“ zu analysieren. Doch wie weit soll / muss / möchte man hier gehen?

Die Frage der Breite der asienbezogenen Wissenschaften, in der alle geistes- und sozialwissenschaftlichen Disziplinen mit ihren speziellen und vielfältigen Formen von Forschungsdaten und -methoden vertreten sind, hat die Diskussionsrunde beschäftigt. Die NFDI-Konsortien sprechen von „aktiven Fachcommunities“ die ihre „Bedarfe“ selbst ermitteln sollen. Ist das auf die asienbezogenen Wissenschaften in ihrer gesamten Breite anwendbar und ein Konsens vorstellbar? Haben die verschiedenen geistes- und sozialwissenschaftlichen Arbeitsmethoden gemeinsame Bedarfe? Sehr deutlich wurde hier auch davor gewarnt mit diesen NFDI-Konsortien nicht eine vermeintliche „Kleinstaatlichkeit der Regionalstudien“ zu reproduzieren oder gar zu verfestigen. Sollen sich sozialwissenschaftlich arbeitende Projekte deshalb mit ihren Forschungsdaten eher an sozialwissenschaftliche Forschungsdateninfrastrukturen wenden? Spielt die „Nicht-Lateinschriftlichkeit“ hier eine Rolle und ist sie ein taugliches verbindendes Element? Sollte es ein Asien-NFDI-Konsortium geben, um sicher zu stellen, dass regionalspezifische Anforderungen nicht vergessen werden? Wer sind hier die besten Partner, um eine Forschungsdaten-Infrastruktur für die asienbezogenen (oder regionalspezifischen) Wissenschaften aufzubauen? Sind diese vielleicht nicht in Europa zu finden, sondern in Asien bzw. den entsprechenden Ländern selbst?

Kann es „eine“ Datenbank geben, in die alle Projekte ihre Daten speichern und damit keine Projektzeit für den Aufbau eigener Datenbanken verbrauchen (und dann Zeit dafür brauchen, diese Daten zu überführen etc.)? D.h. kann man einen allen gemeinsamen „Bedarf“ abstrahieren und diesen in eine datentechnische Struktur überführen? Interessant war in diesem Zusammenhang der Bericht aus dem MPIWG, wo anhand eines Beispielprojekts die Tauglichkeit des CIDOC Conceptual Reference Models (CIDOC-CRM) getestet wird, Forschungsdaten in Form eines „knowledge graph“ abzubilden.

Im Rahmen der Vorstellung der einzelnen Fachgesellschaften und Infrastrukturvertreter wurden eine Reihe weitere Bedarfe und Bedenken genannt: Verbreitung und Nachnutzung von Forschungsdaten können ethische Fragen aufwerfen, Persönlichkeitsrechte müssen berücksichtigt werden, und auch der Kopierschutz muss beachtet werden. Eine Infrastruktur muss in der Lage sein, all diese Anforderungen zu erfüllen.

Wer ist bzw. sollte für was zuständig sein? Welche Aktivitäten gibt es bereits?

Neben der Frage, ob eine Methode oder der regionale Bezug die sinnvollere Abgrenzung zu anderen NFDI-Konsortien bilden, stand auch die Frage im Raum, wie die Universitätsbibliotheken sich hier in Zukunft positionieren wollen. Für das wissenschaftliche Profil einer Universität ist es wichtig, in ihrem Kontext entstandene Daten auch selbst zu präsentieren (vgl. z.B. Repositorien für Doktorarbeiten). Für die Forscher selbst ist sicherlich der fachliche Zugang relevanter (und in der Regel auch vertrauter). Können die Fachgesellschaften hier Rollen übernehmen bzw. sich Aufgaben innerhalb eines Netzwerkes vorstellen? Wie ist die aktuelle Struktur in den jeweiligen Gesellschaften und gibt es bereits eine Position zu Forschungsdaten? Wie sehen Infrastruktureinrichtungen ihre aktuellen oder geplanten Aktivitäten in dieser Richtung?

Im Rahmen der Kurzberichte der Vertreter der Fachgesellschaften und Infrastruktur-Einrichtungen bzw. Projekte, die eine Infrastruktur aufbauen wollen oder aufgebaut haben, sind einige wichtige Dinge zur Sprache gekommen. Die beiden überregional wirkenden Asien-Fachgesellschaften, die Deutsche Morgenländische Gesellschaft (DMG) und die Deutschen Gesellschaft für Asienkunde e. V. (DGA), haben hier bislang noch keine strukturierte Aktivität unternommen oder Leitlinien zu diesem Thema erstellt. Die Ziele der DMG sind insbesondere die Förderung der Wissenschaften und die Publikation ihrer Ergebnisse, die sie mit ihrem Organ der ZDMG ausreichend repräsentiert sieht. Da ihre Mitglieder vor allem philologisch arbeiten, liegt ein Interessenfokus der DMG auf dem adäquaten Zugang zu Quellen. Die DMG greift regional zudem noch weiter aus als „asienbezogen“ und vertritt auch Forschung zu Afrika. Die sinologische Fachgesellschaft, die Deutsche Vereinigung für Chinastudien (DVCS), hat in ähnlicher Weise bislang auch noch keine strukturierte Aktivität unternommen. Die 230-250 Mitglieder des DVCS stammen vorwiegend aus dem Mittelbau. Zum aktuellen Zeitpunkt gibt es keine top-down Beratung innerhalb der DVCS im Hinblick auf Forschungsdaten. Die Fachgesellschaft der Koreanistik, die Vereinigung für Koreaforschung e.V. (VfK), hat ebenfalls noch keine Position zum Thema entwickelt, möchte sich aber in die weitere Diskussion einbringen und Ziele mitgestalten.

In beiden vertretenen japanologischen Fachgesellschaften, der Gesellschaft für Japanforschung (GJF) und der Vereinigung für Sozialwissenschaftliche Japanforschung (VSJF), gibt es Mitglieder, die bereits intensiv mit Big Data arbeiten und eine AG der GJF, die sich mit dem Thema Umgang mit Forschungsdaten beschäftigen wird, wurde auf dem Japanologentag (2018) ins Leben gerufen. Ziel der AG ist es, Aktivitäten besser zu vernetzen und ein Positionspapier zu Forschungsdaten zu erstellen.

Im Juli 2018 fand organisiert durch das vom BMBF geförderte Forschungsprojekt „FDM_OAS-Orient“ ein überregionaler Workshop zum Thema „Nicht-lateinische Schriften in multilingualen Umgebungen: Forschungsdaten und Digital Humanities in den Regionalstudien“ an der Campusbibliothek der FU Berlin statt, an dem u.a. Vertreterinnen und Vertreter beider Fachgesellschaften sowie des FID Asien und FID Nahost-, Nordafrika- und Islamstudien teilgenommen haben (siehe den Workshop-Bericht im DHd Blog).

Die anwesenden Infrastrukturvertreter konnten konkreter von bereits bestehenden Strukturen berichten und haben weitere Ziele oder auch spezifische Problematiken thematisiert. Die „Heidelberg Research Infrastructure“ sammelt seit mehreren Jahren bereits Erfahrungen darin, verschiedenste Quellenformate zu speichern und so aufzubereiten, dass damit wissenschaftliche Daten erzeugt werden können. Sie versucht dabei, Grundprinzipien wie Nachhaltigkeit und Anschlussfähigkeit an größere Netzwerke und die strikte Trennung von Metadaten und Daten zu wahren. Forschungsarbeiten aus dem Bereich der Sinologie sind hier erstes Testgebiet. Wenn man noch tiefer in Daten-Projekte hineinschaut, werden weitere Aspekte deutlich. Im Freiburger Projekt zur Chinesischen Kulturrevolution „The Maoist Legacy“ ist eine Datenbank mit Materialien der Kulturrevolution entstanden, die auch anderen Forschern zur Verfügung steht. Da es sich jedoch um z.T. sensible und auch Persönlichkeitsrechte behaftete Daten handelt, mussten mehrere Zugrifflevels eingerichtet werden. Bereits die Speicherung dieser Daten kann Rechtsfragen aufwerfen, die nicht jede Institution bereit oder auch fähig ist zu klären. Die Bibliothek des MPIWG berichtete aus vor allem zwei Bereichen, in denen sie aktuell in Bezug auf Forschungsdaten aktiv ist. Zum einen, das oben erwähnte „übersetzen“ von Datenbeziehungen mittels einer Ontologie, zum anderen die Überlegungen wie mit digitalen, analytischen Werkzeugen auf lizenzgeschützten Materialien gearbeitet werden kann, ohne die entsprechenden Lizenzen zu verletzen. Der zunehmenden Bedeutung von digitalen Datenanalysen auch in den Geisteswissenschaften trägt die Universität Tübingen Rechnung, indem sie einen Masterstudiengang anbietet, der Digital Humanities und Regionalstudien vereint. Auch wenn viel über digitale Daten und DH gesprochen wird, so ist doch weitere Lobby-Arbeit notwendig, damit Ergebnisse und Methoden, die von Forschern entwickelt werden – auch in Fächern wie der Japanologie oder Sinologie – als wissenschaftliche Leistung anerkannt und karrieretechnisch als relevant erachtet werden. Infrastrukturen können (und sollten) also auch ein Qualitätssigel sein und Daten darin somit nicht als „weggeschenkt“ gelten, sondern umgekehrt die Forscher oder das Projekt „prominenter“ machen.

Die FU Berlin brachte zwei weitere wichtige Aspekte bezüglich des digitalen Wandels ein: Erstens wird laut Deutschem Bibliotheksverband (dbv) ein Trend deutlich, dass wissenschaftliche Bibliotheken zu einer passgenauen Informations- und Medienversorgung zunehmend auch zeitgemäße Dienste und Werkzeuge zur Unterstützung des Life-Cycle in Forschung, Lehre und Studium entwickeln und anbieten (siehe: Wissenschaftliche Bibliotheken 2025, hrsg. vom DBV, Jan. 2018).

Zweitens ist es meistens nicht sinnvoll, als Institution den Weg des „digitalen Wandels“ alleine zu bestreiten, auch nicht wenn man die Größe einer Universität hat. Kooperation wird immer wichtiger. In einigen Institutionen fusionieren Datenzentren bzw. Anbieter für digitale Medien und Technologien in Forschung und Lehre mit den Bibliotheken (so in Planung an der FU Berlin) und die drei Berliner Universitäten – HU, FU und TU – wollen gemeinsam mit der Charité Universitätsmedizin einen Verbundantrag im Rahmen der Exzellenzinitiative einreichen (Stand Dez. 2018), in der der digitale Wandel eine zentrale Rolle spielen soll.

Festzuhalten ist, dass der Grad der Bereitschaft zu und die Ausgestaltung von neuen bibliothekarischen Dienstleistungen in den Bereichen Forschungsdatenmanagement und Digital Humanities allgemein sowie für die Regionalwissenschaften im Besonderen stark standortabhängig ist und ein großes Gefälle von Hochschule zu Hochschule aufweist.

Gibt es einen nächsten gemeinsamen Schritt und wie könnte der aussehen?

Voraussichtlich im ersten Quartal 2019 wird die Ausschreibung für NFDI-Konsortien verkündet. Kann man ein solches Angebot der NFDI z.B. nutzen, um gemeinsam auszuloten, wie ein kooperatives Vorgehen in diesen neuen Feldern gestaltet werden könnte? In diesem Zuge müsste auch definiert werden, wie Aktivitäten im Rahmen der zweiten Runde des FID und solche im Rahmen der NFDI verzahnt werden könnten.

Brauchen die asienbezogenen Wissenschaften etwas Vergleichbares wie den „Rat für Sozial- und Wirtschaftsdaten“ (RatSWD), einen „Asien-Rat“, der von politischem Interesse für die Sichtbarkeit der Regionalstudienfächer und ihrer Anforderungen an Forschungsinfrastrukturen ist? Könnte dieser Rat in nationalen Kontexten agieren und die asienbezogene Forschung dort sprechfähig machen? Von welchem nationalen Interesse wäre so ein „Asien-Rat“ bzw. was wären seine Aufgaben?

Bei allen ausformulierten Anforderungen zu Forschungsdaten und Infrastrukturen muss man bedenken, dass zukünftige Forschungsanträge und -ergebnisse daran gemessen werden.

Um das breitere Interesse und die Anforderungen der Forschenden, Lehrenden und Studierenden am Thema Forschungsdaten und Forschungsdateninfrastruktur zu ermitteln, soll eine Umfrage erstellt und über relevante Mailing-Listen, den CrossAsia Newsletter und u.U. auch die Fachgesellschaften verbreitet werden. Die Fachverbände werden gebeten, sich ebenfalls zur Frage zu positionieren (u.U. auch anhand des Fragebogens). Sie sollen zudem Position dazu beziehen, ob und wie sie sich in den weiteren Prozess einbringen wollen.

CrossAsia übernimmt für den Entwurf des Fragebogens die Federführung. Der Entwurf wird im ersten  Quartal 2019 an die Teilnehmerinnen und Teilnehmer der Runde mit Bitte um Kommentierung geschickt.

Zum Abschluss hier noch einige Kommentare, Vorschläge und mögliche Ziele, die im Rahmen der Diskussionen bezüglich Forschungsdaten, den Bedürfnissen der Wissenschaftlerinnen und Wissenschaftler genannt wurden:

  • Position zu Formaten und Standards sollten gemeinsam entwickelt werden.
  • Fragen und Klärungsansätze zu rechtlichen und ethischen Probleme mit Daten sollten zusammengetragen und allen Daten-Forschern klar vor Augen geführt werden.
  • Kooperationen sollten das Ziel haben, aus den verschiedenen konkreten Beispielen Daten-Abstraktionen zu entwickeln, die schließlich das regionalspezifische in den Hintergrund stellen.
  • Asien auch in diesen Kontexten beizubehalten ist als Teil der Lobbyarbeit für die eigene wissenschaftliche Disziplin wichtig.
  • Auch wenn Fachgesellschaften z.T. ihre Bedürfnisse bereits identifiziert haben, mangelt es ihnen an passender Infrastruktur, die sie oft nicht aus eigener Kraft aufbauen können.
  • Solche Aufgaben sollten in einer Governance-Struktur verwirklicht werden, die in der Lage ist, Partikularinteressen nicht zu unterdrücken.
  • Es sollten keine „Daten-Container“ gebaut werden; Ziel sollte vielmehr sein, in Richtung Open Data, Open Science zu gehen.

中華再造善本 und 民國圖書數據庫

Mittlerweile konnten die Datenbanken 中華再造善本 „China Rare Book Reprinted Collection“ und 民國圖書數據庫 „Early Twentieth Century Book in China, 1912-1949“, die Ende letzten Jahres im Test zur Verfügung standen, dauerhaft lizensiert werden.  Sie finden die Datenbanken über den Menüpunkt Ressourcen > Datenbanken und mit der Auswahl der Klassifikation „Books & Collections“ sowie der Sprache „Chinesisch“ bzw. mit der Eingabe des Titels der jeweiligen Datenbank in den Suchschlitz auf eben dieser Seite.

Die Informationen zur Datenbank aus dem Beitrag zum Testzugang finden Sie ebenfalls hier im Blog.

Neu: Jinbutsu Sôsho und Regionalseiten der Asahi Shimbun

Ab sofort stehen zwei neue Angebote zur Verfügung:

In der Datenbank JapanKnowledge finden Sie nun die Reihe Jinbutsu Sôsho 人物叢書 herausgegeben von der  Nihon Rekishi Gakkai (The Society of Japanese History) und verlegt bei Yoshikawa Kobunkan. Die Reihe umfasst 270 der ursprünglich 287 erschienenen Bände zu bedeutenden Persönlichkeiten der japanischen Geschichte. Die behandelten Personen umfassen nicht nur JapanerInnen und reichen von der Vormoderne bis in die frühe Shôwa-Zeit. Sie stammen aus allen Fachgebieten wie Politik, Religion, Literatur etc. Nähere Informationen zum Inhalt finden Sie hier. Die Reihe Jinbutsu Sôsho 人物叢書 ist in dem Abschnitt unter „JK Books“ enthalten und kann über die voreingestellte, einfache Suche gemeinsam mit den anderen Inhalten durchsucht werden. Es ist aber auch möglich über die ausführliche Suche (詳細(個別)検索) nur in der Buchreihe allein zu recherchieren.

Des Weiteren stehen über 聞蔵 II ビジュアル, also die Datenbank der Asahi Shimbun, neu die Regionalseiten der einzelnen Präfekturen bis zum Jahr 1999 soweit sie bereits digitalisiert wurden, zur Verfügung. Sie finden das Angebot in dem Segment mit den historischen Ausgaben in PDF-Form, also unter 朝日新聞縮刷1879-1999. Dort können Sie entweder die  Hauptausgabe (本紙) oder die Regionalseiten durchsuchen (全国の地域面). Für die Regionalseiten steht leider keine Volltextsuche zur Verfügung, sondern sie können lediglich über das Datum ausgewählt werden. Es besteht auch die Möglichkeit wie in einem elektronischen Bücherregal zu blättern. Bei Einstellung auf die Regionalseiten verändert sich die Eingabemaske dementsprechend. Genauere Angaben zu den Inhalten finden sich auf den Hilfeseiten in der Datenbank.

 

DFG-Fortsetzungsantrag für den FID Asien bewilligt

Die Staatsbibliothek zu Berlin, die Universitätsbibliothek Heidelberg und das Südasien-Institut der Universität Heidelberg betreiben gemeinsam seit 2016 den FID Asien, der im Rahmen des Förderprogramms „Fachinformationsdienste für die Wissenschaft“ finanziell durch die Deutsche Forschungsgemeinschaft (DFG) unterstützt wird. Nach dem erfolgreichen Abschluss der ersten Projektphase (2016-2018) wurde nun der Fortsetzungsantrag von der DFG bewilligt.

Ziel der zweiten Projektphase (2019-2021) ist es, die Informationsservices zu konsolidieren und diese gleichzeitig als eine Serviceinfrastruktur für die deutschen Wissenschaften im Asienkontext weiterzuentwickeln. Ein zweiter wichtiger Aspekt ist die Öffnung des FID Asien für verschiedene nationale und internationale Kooperationen. Mit sogenannten im Antrag vereinbarten Satellitenprojekten – Projekte, die separat, aber in Kooperation mit dem FID beantragt werden – soll die Öffnung des FID Asien als Infrastruktur-Servicedienstleister erprobt werden, bspw. für die Nutzung der Infrastruktur im Rahmen von Digitalisierungs- und Erschließungsarbeiten.

Was haben wir uns für die kommenden drei Jahre vorgenommen?

  • Fortsetzung des auf disziplinäre sowie inter- und transdisziplinäre und transregionale Fragestellungen in Bezug auf Asien abgestimmten Bestandsaufbaus. Die Staatsbibliothek zu Berlin ist verantwortlich für die Sammlung aus und über Ostasien, Zentralasien sowie Südostasien. Ein besonderes Augenmerk werden wir auf die Länder Südostasiens legen, um auch hier den Bedarf der Fachcommunities noch besser bedienen zu können. Bestehende Kooperationen mit der TIB Hannover – Technische Informationsbibliothek und der ZBW Kiel – Leibniz-Informationszentrum Wirtschaft wollen wir ausbauen. Mit der SUB Göttingen soll darüber hinaus eine engere Kooperation bezüglich des Bestandsaufbaus zu Literatur in uighurischer und mongolischer Sprache angestrebt werden. Die Universitätsbibliothek Heidelberg verantwortet den Bereich Südasien.
  • Weiterentwicklung der Services von CrossAsia-ePublishing um die Möglichkeit des interaktiven und vernetzten sowie multimedialen Publizierens im Sinne von „enhanced publications“, sodass sie noch flexibler, nachfrage- und serviceorientierter gestaltet sind und noch besser auf die Anforderungen der Wissenschaftlerinnen und Wissenschaftler reagiert werden kann.
  • Weiterentwicklung der CrossAsia-Suche, Ergänzung dieser um neue Suchräume und Ausbau durch Kooperationen mit anderen Einrichtungen.
  • Erprobung eines neuen, regional strukturierten Zugangs zu den Inhalten des FID Asien, um die Angebote zu Zentralasien, Südasien und Südostasien prominenter, sicht- und erlebbarer werden zu lassen.
  • Fortsetzung der Überführung weiterer Daten im Routineverfahren ins CrossAsia Integrierte Textrepositorium (CrossAsia ITR).
  • Erweiterung des CrossAsia ITR als Infrastruktur für Digitalisierungs- und Erschließungsprojekte sowohl von Text- als auch verschiedensten nicht-textuellen Daten wie z.B. Bildmaterialien. Ziel ist es, Satellitenprojekten die Möglichkeit zu geben, die Infrastruktur beispielsweise für die Erschließung ihrer Daten zu erproben.
  • Aufbau und Etablierung einer Angebots-, Informations- und Beratungsstruktur zu asienbezogenen Forschungsdaten.

Mehr zu den Aktivitäten des FID Asien sowie insbesondere auch die Antragstexte für den FID Asien finden Sie auf unseren Über CrossAsia-Seiten. Dort finden Sie übrigens auch noch zahlreiche weitere Informationen zu unseren zahlreichen Tätigkeitsbereichen, wie dem Datenmanagement, der Suche, oder der Lizenzierung.

Diese Vorhaben und Aktivitäten werden nach wie vor in enger Abstimmung mit unserem Wissenschaftlichen Beirat erfolgen. Wir berichten auch in den kommenden Monaten über die Entwicklungen und Ergebnisse der einzelnen Arbeitspakete und Module des FID Projekts hier im Blog. Die kontinuierliche Rückkopplung mit der Fachcommunity ist uns ein großes Anliegen. Bei jeglichen Fragen zu unseren Angeboten sowie Wünschen und Verbesserungsvorschlägen freuen wir uns über Ihre Nachricht unter: x-asia@sbb.spk-berlin.de

Gesamtkatalog der indonesischen Handschriften der Staatsbibliothek zu Berlin

Nach einer fast dreimonatigen Seefahrt von Jakarta nach Deutschland sind vor kurzem mehrere große und schwere Pakete in der Staatsbibliothek eingetroffen. Darin enthalten der erste Gesamtkatalog der indonesischen Handschriften der Staatsbibliothek – jedes Katalogexemplar im A4-Format, zwei Kilogramm schwer und 873 Seiten dick. Der Katalog ist des Ergebnis einer äußerst fruchtbaren Kooperation mit dem Indonesischen Nationalmuseum, die jetzt im Nachgang der im Oktober 2015 im Dietrich-Bonhoeffer-Saal der Staatsbibliothek stattgefundenen indonesischen Handschriftenausstellung „SchriftSprache – Aksara dan Bahasa“ zu einem solch „schwergewichtigen“ Ergebnis geführt hat. Korrekterweise müsste man zwar eigentlich von „Nusantara-Handschriften“ sprechen, denn Indonesien im heutigen Verständnis gab es zur Entstehungszeit der Handschriften noch nicht, aber da diese Bezeichnung auch international der Einfachheit halber üblich ist, wurde sie auch für diesen Katalog so übernommen.

Ein Katalogisierungsprojekt von Handschriften aus der ganzen Nusantara-Region würde jeden Experten vor eine unlösbare Aufgabe stellen: es gibt einfach zu viele Sprachen und auch Schriften. So konnte der Katalog auch nur von einem Expertenteam zusammengestellt werden. Die Finanzierung des Aufenthalts der jeweiligen Sprachexpert*innen in Berlin und auch des Druckes erfolgte ausschließlich durch das Indonesische Nationalmuseum. Folgende Wissenschaftler haben die Katalogeinträge erstellt: Abimarda Kurniawan, I Made Suparta, Kartika Setyawati, Lisa Misliani, Muhlis Hadrawi, Munawar Holil, Titik Pudjiastuti und Ulrich Kozok. Teilweise konnte auf bereits vorhandene Kataloge aus der Reihe des VOHD (Verzeichnis der Orientalischen Handschriften in Deutschland) oder andere Altkataloge zurückgegriffen werden; viele Handschriften wurden aber auch erstmals beschrieben. Von vielen Handschriften wurden Beispielbilder und Scans von Textauszügen beigegeben, vor allem von den Nichtpapierhandschriften wie z.B. den Batak-Pustaha auf Baumbast aus Sumatra und den Lontarpalmblatthandschriften aus Bali und Java.

Mittlerweile sind bereits mehr als 40% der Kataloginhalte in die Online-Datenbank www.orient-digital.de eingespielt worden; der Rest wird zeitnah ergänzt. Auch ein PDF des Katalogs ist in Vorbereitung und wird in Kürze als download bereitgestellt. Der Papier-Katalog kann über das Sekretariat der Orientabteilung bestellt werden.

Titik Pudjiastuti, Thoralf Hanstein (editors): Catalogue of Indonesian manuscripts – Collection Staatsbibliothek zu Berlin – Preußischer Kulturbesitz. Bali-Java-Kalimantan-Lombok-Madura-Sulawesi-Sumatra-Sumbawa. Jakarta, Museum Nasional Republik Indonesia. 2016

Der Beitrag wurde von Dr. Thoralf Hanstein, Fachreferent für Arabistik, verfasst und erschien zuerst am 10.09.2018 im Blog der Staatsbibliothek

Zwei neue Datenbanken von Gale

Ab sofort können wir Ihnen zwei neue Datenbanken aus der Serie China and the Modern World von Gale anbieten: Missionary, Sinology, and Literary Periodicals (1817-1949) sowie Records of the Maritime Customs Service of China (1854-1949). Erstere enthält folgende 17 in bzw. zu  China publizierte englischsprachige Zeitungen und Zeitschriften aus der Zeit zwischen 1817 und 1949:

Bulletin of Catholic University of Peking
The Canton Miscellany
The China Critic
The China Mission Year Book
The China Quarterly
The China Review, or Notes and Queries on the Far East
The China Year Book
The Chinese And Japanese Repository
Chinese Miscellany
The Chinese Recorder
Educational Review
The Indo – Chinese Gleaner
New China Review
Notes And Queries : On China And Japan
T’ien Hsia Monthly
West China Missionary News
Yenching Journal of Social Studies

Letztere versammelt erstklassige Primärquellen zu Chinas Beziehungen mit dem Westen von der späten Qing- bis zur Republikzeit aus der chinesischen Seezollverwaltung (Chinese Maritime Customs Service), wie z.B. offizielle Rundschreiben, private und geheime Korrespondenzen, Berichte und Depeschen. Die Datenbank enthält folgende fünf Sammlungen:

Inspector General’s Circulars

London Office Files

The Policing of Trade

Semi-Official Correspondence from selected Ports

The Sino-Japanese War and its Aftermath, 1931-1949

 

Die Zeitschriften bzw. Quellen sind im Volltext durchsuchbar, es werden Images angeboten. Sie finden die Datenbanken auch auf der CrossAsia Website über den Menüpunkt Ressourcen > Datenbanken und mit der Auswahl der Klassifikation „Newspapers & Magazines“ bzw. „Archival materials“ sowie der Sprache „English“.

 

Newsletter Nr. 17

Liebe CrossAsia-Nutzerinnen, liebe CrossAsia-Nutzer,

seit unserem letzten Newsletter im Frühjahr ist viel passiert. Wir haben im Mai den Folgeantrag für die zweite Förderphase des FID bei der DFG gestellt. Das bedeutet zugleich, dass wir kurz vor dem Ende der aktuellen Projektlaufzeit stehen. Zeit für einen kurzen Rückblick und eine Vorausschau:

Der bereits im Frühjahr freigeschalteten Betaversion der CrossAsia Volltextsuche (Typ A), die als „geführte Suche“ charakterisiert werden kann, wurde kürzlich eine zweite, mehr „explorative“ Betaversion einer Volltextsuche zur Seite gestellt (Typ B). Zugänglich sind beide Suchen über unsere neue Einstiegsseite zur CrossAsia Volltextsuche. Die Suchen wurden zudem um weitere Inhalte ergänzt. So sind nun auch zahlreiche englischsprachige Texte aus Archivmaterialien enthalten, weitere vormoderne chinesische Texte – Lokalmonographien, das Siku quanshu und historische Materialien aus der Qing-Zeit – sowie ein kleines, aber wachsendes Paket an eBooks mit aktuellen chinesischsprachigen wissenschaftlichen Publikationen. Die Suche wird auch weiterhin kontinuierlich um neue Inhalte und Features ergänzt. Lesen Sie mehr zum aktuellen Stand der Volltextsuchen im Beitrag „Noch mehr Volltextsuche für alle!“. Wir würden uns über Ihre Eindrücke und Ihr Feedback zu den zwei Volltextsuchen freuen (gerne im Forum oder per E-Mail). Teilen Sie uns mit, welche Funktionalitäten aus Ihrer Sicht sinnvoll sind, welche fehlen und was wir noch besser machen können.

Im Laufe diesen Jahres haben wir begonnen, besondere Sammlungen und Sammlungssegmente innerhalb unserer Bestände in Form von „Themenportalen“ vorzustellen und über die jeweiligen Recherchewege zu diesen bzw. die Nutzungsmöglichkeiten derselben zu informieren. Inzwischen sind bereits neun solcher Themenportale online. In den jüngsten zwei Präsentationen stellen wir das „Berlin-Kraków Projekt“ vor, dessen Ziel eine virtuelle Rekonstruktion der alte Ostasiensammlung der Preußischen Staatsbibliothek ist, sowie die „Bibliothek Otsuka“, die Sammlung des marxistisch geprägten Wirtschaftswissenschaftlers und Dichters Ōtsuka Kinnosuke (1892-1977).

In den kommenden drei Jahren – vorbehaltlich einer Zusage seitens der DFG – wird der FID sich auf ausdrücklichen Wunsch aus der Fachcommunity hin über die aktuell laufenden Entwicklungen und Aktivitäten hinaus zwei neuen Kernthemen widmen:

Erstens ist der Aufbau einer Informations- und Beratungsstruktur für asienbezogene Forschungsdaten geplant. Hierbei sollen sowohl Anwendungsfragen seitens der Wissenschaft berücksichtigt werden, als auch Aktivitäten auf nationaler Ebene, wie beispielsweise von RADAR und DARIAH-DE sowie die Empfehlungen des Rats für Informationsinfrastrukturen (RfII) zu Fragen im Bereich Forschungsdaten, Forschungsdatenmanagement und Datenkuratierung. Zweitens ist der Ausbau des ITR als Infrastruktur für digitale Objekte in allen Formaten geplant. Hier ist das Ziel, Digitalisierungs- und Erschließungsprojekten auch anderer Institutionen eine Infrastruktur beispielsweise für die Metadatenerzeugung anzubieten. Mehr dazu erfahren Sie in den kommenden Monaten hier im Blog.

Anbei finden Sie auch wieder die wichtigsten Blogbeiträge der vergangenen Monate im aktuellen CrossAsia Newsletter zum Nachlesen:

Neu lizenzierte Datenbanken

Frauenzeitschriften Fujin kôron und Fujin gahô

JapanKnowledge mit neuen Inhalten

NKScholar und 스콜라 Scholar

Diaolong 雕龍 – Portal

China Comprehensive Gazetteers 中國綜合方誌庫

Area Studies: China and Southeast Asia sowie Area Studies: Japan

China: Culture and Society

Interessantes und neue Entwicklungen aus CrossAsia

Noch mehr Volltextsuche für alle!

Wo landen eigentlich die bibliografischen Daten der elektronischen Titel?

Neue Themenportale

Berlin-Kraków Projekt

“Bibliothek Otsuka”

CrossAsia-eBooks

‚Neue Hallesche Berichte‘ online zugänglich – Kooperation zwischen den Franckeschen Stiftungen und CrossAsia-eBooks

„HerStory. Historical Scholarship between South Asia and Europe” – Festschrift zu Ehren von Professor Dr. Gita Dharampal-Frick

 

Seien Sie mit uns zusammen gespannt, wie es weitergeht und drücken Sie uns die Daumen für den FID-Antrag.

Viel Spaß beim Lesen des Newsletters wünscht Ihnen Ihr

CrossAsia-Team

Noch mehr Volltextsuche für alle!

Seit April steht bereits die erste Version der CrossAsia Volltextsuche zur Verfügung. Wir hatten damals über das CrossAsia Integrierte TextRepositorium (ITR) berichtet, und die Suche als eine Spitze dieses sonst von außen nicht sichtbaren „Eisbergs“ kurz vorgestellt. Seither ist viel passiert. Das ITR und die in die Volltextsuche eingebetteten Ressourcen sind kontinuierlich gewachsen und wir konnten jetzt auch eine zweite Variante der Volltextsuche freischalten. Zu beidem finden Sie mehr Details weiter unten. Ein wichtiger Punkt bei der Volltextsuche für uns ist, sie so anzubieten, dass sie *allen* Nutzer*innen zur Verfügung steht, also auch solchen, die keinen Zugang zu den jeweiligen Datenbanken haben bzw. deren Zugang nicht über CrossAsia ermöglicht wird. Damit fügt sich die Volltextsuche harmonisch in das Profil der eher „bibliographischen“ CrossAsia Suche ein, die ebenfalls frei zur Verfügung steht.

Schnipsel und Links

Die Treffer in der CrossAsia Volltextsuche werden als sehr kurze und fragmentierte Textschnipsel ausgegeben. Nur so ist es möglich, die Suche für alle zu öffnen und dabei die für diese Ressoucen vereinbarten Lizenzbedingungen zu wahren. Auch Nutzer*innen ohne Zugang zu den jeweiligen Datenbanken wird damit die Möglichkeit gegeben, einen Eindruck zu gewinnen, welche Quellen u.U. relevant für die eigene Fragestellung sind. Über verschiedene Links in den Treffern gelangt man zur kompletten Quelle. Für authentifizierte CrossAsia-Nutzer*innen führt das ‚rot‘ gefärbte Icon direkt zum Objekt im originalen Kontext der Datenbank; für Nutzer*innen mit anderen Zugangsmöglichkeiten – z.B. über den IP-Range ihrer Institution oder ein individuelles Login – wird parallel ein ‚graues‘ Icon angeboten. „Direkt zur Quelle“ bedeutet für die verschiedenen Ressoucen dann doch verschiedenes. In jedem Fall stellen wir möglichst treffgenaue Links zur Verfügung. D.h. wenn der Datenbankanbieter uns das ermöglicht, wird die entsprechende Seite angesteuert, in anderen Fällen gelangt man zumindest zum Buch oder Artikel und muß dort dann die im Treffer angegebene Seite (bzw. Imagenummer) aufschlagen. In einigen Fällen jedoch stehen nur Links zur jeweiligen Datenbank zur Verfügung. Hier ist der Weg dann etwas weiter bis zur Fundstelle (so aktuell z.B. der Fall für die People’s Daily und die Lokalmonographien der Erudition-Datenbank).

Noch mehr Volltexte für die Suche

Der Korpus an Texten, die in der CrossAsia Volltextsuche durchsucht werden können wächst kontinuierlich. Aktuell dominieren chinesische Texte und englische Texte mit Chinabezug, aber weitere Ressourcen, die auch für die Japan-, Korea- und weitere asienbezogene Forschung relevant sind, befinden sich bereits in der Pipeline. Aktuell können die Inhalte der folgenden, über CrossAsia lizenzierten Datenbanken recherchiert werden:

  • Adam Matthew – China, America, Pacific
  • Adam Matthew – China Trade & Politics
  • Adam Matthew – Foreign Office Files China
  • 道藏輯要
  • 中國地方誌 一集 (雕龍)
  • 中國地方誌 續集 (雕龍)
  • Missionary, Sinology, and Literary Periodicals (1817-1949)
  • Local Gazetteers (Erudition)
  • 人民日报 : People’s daily (1946-2009)
  • 清代史料
  • 四庫全書
  • 續修四庫全書

Darüberhinaus sind in die Volltextsuche einzelne lizenzierte Bände aus den Airiti und CNKI ebook-Portalen integriert, sowie ein Testsample an gedruckten Beständen, für die wir selbst mittels OCR einen Index erstellt haben. Zusammen sind das aktuell: 120 Tausend Titel (Buch- und Artikeltitel) mit über 13 Millionen Seiten. Das ist schon eine ziemlich große Eisbergspitze.

Noch mehr Suche für die Volltexte

Einigen Nutzer*innen ist die CrossAsia Volltextsuche Typ A mittlerweile schon vertraut. Jetzt haben wir ihr eine Volltextsuche Typ B zur Seite gestellt. Charakterisieren lassen sich die beiden als „geführte Suche“ (Typ A) und „explorative Suche“ (Typ B).

Typ A nimmt als Anker für die Suche Einheiten wie z.B. ein Buch oder eine Tagesausgabe der People’s Daily und verwendet die Anzahl der Seiten/Artikel mit Treffern darin als Kriterium für die Reihenfolge der Anzeige. Ein Buch mit mehr Seiten auf denen der Suchterm erscheint, wird also höher gerankt. Die „Anker“ bzw. Bücher etc. werden im Suchergebnis in der linken Spalte in diesem Ranking angezeigt; wählt man ein Objekt dort aus, erscheinen die Seiten mit Treffern aus dem ausgewählten Objekt in der mittleren Spalte. Diese sind nach Seitenzahl geordnet. Mit Hilfe der Filter in der rechten Spalte kann man die Treffermenge dann weiter reduzieren bzw. fokusieren. Es wird in Typ A  *nur* in den Inhalten der Seiten gesucht und diese Inhalte zu ihren jeweiligen Büchern o.ä. gebündelt ausgegeben.

Hier die Funktionen der drei Seitenbereiche von Typ A im Überblick:

Typ B behandelt alle Objekte gleichberechtigt. D.h. Bücher, Artikel oder Archivalien und die einzelnen Volltextseiten werden auf ihre Relevanz in Bezug auf den Suchterm vom Index bewertet und in der Reihenfolge dieser Bewertung (dem „score“) als Treffer ausgeliefert. Metadaten, Bescheibungen, Autorennamen, Volltexte – alles wird durchsucht und in bunt gemischter Reihe ausgegeben. Über Filter auf der linken Seite kann der Typ der Trefferobjekte gewählt werden (also ob nur Seiten oder nur Bücher bzw. Artikel und ihre Metadaten ausgeben werden sollen) oder auch Filter wie Jahr, subject u.ä. eingestellt werden. Dies kann wiederum nachträglich geschehen, in Typ B aber auch bevor ein Suchterm eingegeben wurde. Zu beachten hier ist, daß aktuell für Seiten keine inhaltlichen Filter zur Verfügung stehen. IE jenseits von Edge setzen die Filterfunktion nicht korrekt um.

 

Einen kurzen Überblick gibt auch die neue Einstiegsseite für die CrossAsia Volltextsuche. Mehr Informationen zu den jeweiligen Besonderheiten der beiden Such-Typen können über das „i“ hinter den Suchschlitzen aufgerufen werden.

Und was kommt dann?

Beide Suchmodi lösen Schranken zwischen verschiedenen Quellenkorpora und Texttypen auf, die durch die individuellen Datenbankzugänge geschaffen wurden, und ermöglichen damit – so hoffen wir – neue, bessere Wege, sich einen Überblick über die Quellenlage zu verschaffen und das Umfeld eines Suchterminus in einem möglichst breiten Spektrum von Texten zu ergründen. Details aus verschiedenen Datenkorpora werden gemeinsam angezeigt und werden jenseits der von der Datenbank vorgegebenen Logik ansteuerbar. Das ist ein wichtiger, aber doch auch nur ein erster Schritt. Um sich in diesen großen Mengen an Text nicht zu verlieren, wollen wir gemeinsam mit unseren Nutzern überlegen, wie innovative Rechereche- und Zugangsmodi aussehen könnten. Um zudem diese große Menge an Text für neue Forschungsfragen in den digitalen Geisteswissenschaften zu erschließen, arbeiten wir an Schnittstellen, über die Projekte (große und individuelle) mit diesen Daten in Zukunft arbeiten können, aber auch an Wegen über ein pre-processing diese Texte nicht nur über die Metadaten ihrer bibliographischen Einheit zu charakterisieren, sondern auch „aus sich selbst heraus“, d.h. mit Hilfe von automatisierter Textanreicherung und statistischen Auswertungen von Kollokationen u.ä. weitere Formen von „Metadaten“ zu generieren.

Über Hinweise, Feedback, Vorschläge, Kritik sind wir dankbar! Am besten direkt an x-asia@sbb.spk-berlin.de

(For a short English description of the CrossAsia Fulltext Search and the two types of searches please go to the entry page of CrossAsia Fulltext Search and the „i“ next to the search slot in both versions of the search)