DATENMANAGEMENT

CrossAsia und die Staatsbibliothek zu Berlin haben im Laufe der Jahre weitreichende Kompetenzen im (Forschungs-)Datenmanagement entwickelt und verwalten weltweit – außerhalb Ostasiens – die wahrscheinlich größte Sammlung asienbezogener Daten. Beginnend mit der Verwaltung bibliographischer Metadaten in verschiedensten Formaten wird heute darüber hinaus auch eine große, stetig wachsende Sammlung von Volltext-Daten lizenzierter Ressourcen verwaltet. Zukünftig wird sich CrossAsia noch aktiver im Bereich des Forschungsdatenmanagements betätigen.

Weiterführende Informationen

CrossAsia Suche
CrossAsia Volltextsuche

Zu den Tätigkeitsfeldern

METADATEN

CrossAsia verwaltet seit vielen Jahren neben den bibliographischen Daten der gedruckten Bestände der Staatsbibliothek zu Berlin aus und über Ost-, Südost- und Zentralasien große Mengen bibliographischer Metadaten lizenzierter und relevanter freier (ost-)asienbezogener Datenbanken, sowohl auf Buch- als auf Artikelebene, in den verschiedenen (ost-)asiatischen Sprachen bzw. Englisch. Die Daten werden teilweise über Schnittstellen geharvested, in der größeren Menge erhält CrossAsia diese entsprechend der Lizenzverträge von den Anbietern in verschiedensten bibliothekarischen Formaten oder aber als Bestandteil der Volltext-XML-Dateien. Ein Geschäftsgang sorgt für die Extraktion, ggf. eine Anreicherung, die Qualitätskontrolle, die Transformation der Daten und das Einspielen der Daten in den Index und Suchraum. Diese inzwischen 100 Mio. bibliographische Daten übersteigende Sammlung an Metadaten steht allen Nutzer:innen über die CrossAsia Suche frei zur Verfügung. Die Metadaten können ebenfalls über eine Schnittstelle adressiert bzw. in andere Kontexte eingebunden werden.

VOLLTEXTDATEN & NICHT-TEXTUELLE DATEN

Seit 2016 baut CrossAsia ein Integriertes Textrepositorium (CrossAsia ITR) auf. Diese technische Infrastruktur ist so konzipiert, dass sowohl Betrieb als auch der Zugriff auf asienbezogene Ressourcen unabhängig von Anbietersystemen sicher und nachhaltig gewährleistet werden kann. Dies wird insbesondere durch den Einsatz von Standard-Technologien aus den Bereichen Metadaten, Schnittstellen (z.B. OAI) oder Repository-Frameworks (z.B. Fedora) möglich. Vorgesehen ist außerdem, dass das ITR jedem digitalen Objekt eine Normnummer (z.B. DOI) zuteilt. Damit ist eine Adressierung und Versionierung der Objekte sichergestellt.

Die Volltext- und Bildtextdaten werden aus ihren ursprünglichen Datenbankumgebungen extrahiert und für den Ingest in das ITR gemäß definierter Routinen standardisiert und aufbereitet. Die Daten werden so kleinteilig wie möglich in der Struktur abgelegt, damit sie ansteuerbar und persistent referenzierbar sind. Zur Gewährleistung der Nutzungsmöglichkeiten und der Verhinderung einer missbräuchlichen Nutzung werden die Meta- und Objektdaten um Rechteinformationen erweitert. Darüber hinaus bietet sich die Möglichkeit, die Inhalte nahtlos in aktuelle und zukünftige CrossAsia Services einzubinden und im Rahmen der digitalen Wissenschaften für Analysen, Explorationen, Anreicherungen und Visualisierungen anbieten zu können.

Die Anzahl der aktuell im ITR gespeicherten und verwalteten Titel und Seiten sowie eine Liste der Kollektionen finden Sie auf der Startseite der Volltextsuche. Alle im ITR gespeicherten Inhalte sind sowohl in der Volltextsuche als auch im ITR Explorer durchsuchbar.

CrossAsia ITR Systemarchitektur

FORSCHUNGSDATEN

Die gespeicherten und archivierten Volltext- oder Bildtextdaten des ITR sind auch Forschungsdaten – insbesondere mit Blick auf die sichere und verlässliche Speicherung, die Realisierung der Zugänglichkeit und Referenzierbarkeit sowie die Ermöglichung einer Nachnutzung dieser. Das Integrierte Textrepositorium wurde so angelegt, dass im Kontext der gespeicherten Volltext- oder Bildtextdaten darüber hinaus erstellte „klassische“ Forschungsdaten (z.B. in Form von Transkriptionen, Exzerpten, Auswertungen, Annotationen usw.) im ITR mit Verknüpfung und Versionierung zu den Quellmaterialien sowie den inhaltlich verbundenen Medien gespeichert werden können.

Darüber hinaus entwickelt der FID Asien ein passgenaues Beratungs- und Informationsangebot für den gesamten Komplex asienbezogener Forschungsdaten. Zum einen werden die bislang unspezifischen Anwendungsfragen seitens der asienbezogenen Wissenschaft, die nationalen Aktivitäten im Kontext z.B. von RADAR und DARIAH-DE sowie Empfehlungen beispielsweise des Rats für Informationsinfrastrukturen (RfII) zu Fragen im Bereich Forschungsdaten, Forschungsdatenmanagement und Datenkuratierung berücksichtigt. Zum anderen werden die nationalen und internationalen Aktivitäten im Kontext Forschungsdaten für die Entwicklung asienspezifischer Lösungsansätze und Empfehlungen für Forschungsdaten beobachtet, analysiert und kommuniziert. Das Beratungs- und Informationsangebot wird u.a. folgende Themen umfassen:

Information und Beratung zum Thema Forschungsdatenmanagement mit besonderem Fokus auf asienbezogene Wissenschaften (Daten in asiatischen Sprachen etc.).
Bereitstellung von Best Practices und Qualitätskriterien für die asienbezogenen Wissenschaften.
Beratung zu rechtlichen Fragen.
Aufbau eines Kooperationsnetzwerks mit ausgewählten, für die asienbezogenen Wissenschaften relevanten Datenzentren und Diensteanbietern.
Unterstützung beim Erstellen von Forschungsdaten mit Materialien aus dem Kontext von CrossAsia, insbesondere der Meta- und Volltextdaten-Repositoriumsinfrastruktur (ITR – Integriertes Text-Repositorium).
Zentraler Zugriff auf Metadaten zu asienbezogenen Forschungsdaten über die CrossAsia Suche.

KONTAKT

Bitte beachten Sie unsere Hinweise zum Datenschutz.