Anleitung und Hinweise für Repositorienbetreiber

Zunächst soll eine Feature-Liste für wissenschaftliche Institutionen (den Repositorienbetreiber) gegeben werden. Darauf folgt eine kurze Beschreibung der Funktionsweise von DeepGreen aus der Sicht eines solchen Repositorienbetreibers.

Vorteile von DeepGreen

In Bezug auf die implementierten Lizenzmodelle (momentan: Allianz-Lizenzen) bietet die DeepGreen-Datendrehscheibe folgende Vorteile:

  • DeepGreen ermöglicht eine automatisierte Ablieferung von Metadaten und Volltexten von lizenzierten Werken an das institutionelle Repositorium.

  • Die manuelle Recherche von lizenzierten Publikationen der eigenen Institution entfällt.

  • Ist eine Institution berechtigt, eine Publikation frei verfügbar zu machen, wird dies durch eine Benachrichtigung an die Institution (über ein zugehöriges DeepGreen-Konto ; siehe unten!) signalisiert. Sofern spezielle Embargo-Fristen einzuhalten sind, sind die Repositorienbetreiber dafür verantwortlich.

  • Liegen neben den Metadaten auch der Volltext der Publikation vor, können diese (innerhalb eines bestimmten Zeitfensters ; in DeepGreen sind momentan 3 Monate eingestellt) von den berechtigten Institutionen bezogen werden oder ggf. automatisiert in die jeweiligen institutionelles Repositorien übersendet werden.

  • Sind keine Volltexte vorhanden, so werden nur die Metadaten der entsprechenden Publikationen bereitgestellt.

Bedienung eines Repositorium-Kontos

Zur Teilnahme an DeepGreen ist (aus technischen Gründen) zwingend notwendig, dass man bei der Elektronischen Zeitschriftenbibliothek (EZB) in Regensburg angemeldet ist.

Ist diese Voraussetzung erfüllt, kann ein Konto (als Repositorienbetreiber) bei DeepGreen beantragt werden. Mit der Vergabe eines neuen Repositorium-Kontos werden eine (eindeutige) 32-stellige ID und ein sogenannter API-Schlüssel erzeugt, der für den Zugriff auf die zu erwartenden Volltexte benötigt wird.

Über dieses Konto wählt man sich als Repositorienbetreiber bei DeepGreen ein, um

  • die eigene ID und den API-Schlüssel herauszufinden (bzw. nachzuschlagen),

  • die aktuellen Benachrichtigungen aufzulisten und herunterzuladen,

  • die aktuellen Einstellung der match-config-Datei einzusehen, herunterzuladen oder ggf. eine neue match-config-Datei hochzuladen,

  • die Einstellungen des DeepGreen-Kontos allgemein zu überprüfen und anzupassen (Passwort, ggf. SWORD-Einstellungen für die automatisierte Artikeldaten-Zustellung).

Bedeutung der match-config - Datei

Mit dieser besonderen Datei (einer .csv-Datei mit genau sechs Spalten: Name Variants, Domains, Grant Numbers, Dummy1, Dummy2 und Keywords) gibt eine Institution an, mit welchen (Namens-)Ansetzungen sie Publikationen zugeordnet bekommen möchte.

  • Bemerkungen:

    • Die Spalten Dummy1 und Dummy2 haben bisher keinerlei Funktion in DeepGreen und sollte daher stets leer bleiben. Diese Spalten sind für zukünftige Erweiterungen frei gelassen.

    • Pro Zeile müssen auf alle Fälle genau fünf Kommata gegeben sein.

    • Alle Spalten werden als unicode-Zeichenketten eingelesen und interpretiert. Für die interne Verarbeitung innerhalb DeepGreens wird die nfd-Normalisierung von unicode verwendet.

Beispiel einer match-config - Datei. Die erste Zeile (header) ist unveränderlich und muss stets so lauten.
Name Variants,Domains,Grant Numbers,Dummy1,Dummy2,Keywords
Academia Fridericiana Erlangensis,,,,,
Academia Friderico Alexandrina Erlangen-Nürnberg,,,,,
Academia Friderico-Alexandrina,,,,,
Academia Regia Bavarica Friderico-Alexandrina,,,,,
Academia Regia Friderico-Alexandrina,,,,,
Bayerische Friedrich-Alexanders-Universität,,,,,
F.A.U. Erlangen-Nürnberg,,,,,
FAU Erlangen-Nürnberg,,,,,
Friedrich Alexander University,,,,,
Friedrich-Alexander-Universität Erlangen,,,,,
Friedrich-Alexander-Universität Erlangen-Nürnberg,,,,,
Friedrich-Alexander-Universität zu Erlangen,,,,,
Friedrich-Alexander-University Erlangen,,,,,
Friedrich-Alexanders-Universität,,,,,
Friedrichs-Akademie,,,,,
Königlich Bayerische Friedrich-Alexanders-Universität,,,,,
Univ. Erlangen-Nürnberg,,,,,
Universidad de Erlangen-Núremberg,,,,,
Universidad de Erlangen-Nürnberg,,,,,
Universitas Literarum Regia Friderico-Alexandrina,,,,,
Università di Erlangen-Nürnberg,,,,,
Universität Erlangen,,,,,
Universität Erlangen-Nürnberg,,,,,
University Erlangen-Nuremberg,,,,,
University of Erlangen-Nuremberg,,,,,
University of Erlangen-Nürnberg,,,,,
,fau.de,,,,
,uk-erlangen.de,,,,
,uni-erlangen.de,,,,
,,,123456-563/2,,
,,,99988/365-2,,

Es ist klar, je mehr, je umfassender und je genauer die Angaben in dieser Datei sind, desto treffsicherer kann DeepGreen anhand der Verlagsmetadaten eines Artikels/Reviews/Buch herausfinden, ob die fragliche Publikationen einer Institution zuzuordnen ist oder nicht.

Abruf von Artikeldaten

Vorhandene Artikeldaten können auf mehrere Arten von DeepGreen abgerufen werden. Momentan sind drei Varianten dazu vorgesehen.

  • Variante 1: Manuelle Abfrage der Daten über eine (native) Web-API (ReSTful Interface)

    • Es besteht die Möglichkeit, die Metadaten aller zugeordneten Publikationen der letzten drei Monate abzufragen oder nur die einer einzigen Institution betreffend. Dies wird über die Betreiberkonto-ID selektiert.

    • Ein Zugriff auf eventuell vorhandene Volltexte geschieht bei Berechtigung nur in Kombination mit Konto-ID und API-Schüssel, die (natürlich) zueinander passen müssen.

    • Für alle syntaktischen und technischen Einzelheiten siehe die detaillierte Beschreibung der Web-API. (LINK einfügen!)

  • Variante 2: Abfrage von Metadaten über eine OAI-PMH-konforme Schnittstelle

    • Wie in Variante 1 besteht auch hier die Möglichkeit, eine Metadatenliste aller zugeordneten Publikationen der letzten drei Monate abzurufen oder nur die Liste für eine einzige Institution. Dazu wird hier ebenfalls die Repositorien-Konto-ID herangezogen.

    • Über die OAI-PMH-Schnittstelle werden die Publikationsmetadaten in einem (rudimentären) Dublin Core-Format ausgegeben.

    • Für die technischen Einzelheiten und die genaue Syntax der OAI-PMH-Abfragen siehe die Beschreibung der OAI-PMH-Schnittstelle von DeepGreen. (LINK einfügen!)

  • Variante 3: Automatisierte Lieferung der Daten via SWORD-Schnittstelle

    • Bei dieser Variante werden die Metadaten und die ggf. vorhandenen Volltexte über eine SWORD(v2)-Schnittstelle an berechtigte Repositorien ausgespielt. Dazu muss eine kompatible SWORD-Schnittstelle auf der Seite des Repositoriums vorliegen.

    • DeepGreen kann auch SWORD(v1)-Schnittstellen bedienen (Abwärtskompatibilität).

    • DeepGreen kann momentan über die SWORD-Schnittstelle an Repositorien liefern, die auf Basis von OPUS 4 (OPUS4-Import-XML), DSpace (METS-MODS), PubMan (ESciDoc) oder EPrints laufen.

    • Für alle technischen Einzelheit siehe die ausführliche Beschreibung der DeepGreen-SWORD-Schnittstelle. (LINK einfügen!)

    • Diese Variante ist für Repositorienbetreiber optional.